JP6059486B2 - Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method - Google Patents
Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method Download PDFInfo
- Publication number
- JP6059486B2 JP6059486B2 JP2012215984A JP2012215984A JP6059486B2 JP 6059486 B2 JP6059486 B2 JP 6059486B2 JP 2012215984 A JP2012215984 A JP 2012215984A JP 2012215984 A JP2012215984 A JP 2012215984A JP 6059486 B2 JP6059486 B2 JP 6059486B2
- Authority
- JP
- Japan
- Prior art keywords
- teacher
- category
- image
- teacher data
- categories
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000013524 data verification Methods 0.000 title claims description 30
- 238000011156 evaluation Methods 0.000 claims description 76
- 238000012545 processing Methods 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 10
- 230000007547 defect Effects 0.000 description 76
- 238000007689 inspection Methods 0.000 description 22
- 239000000758 substrate Substances 0.000 description 21
- 238000010586 diagram Methods 0.000 description 11
- 238000009826 distribution Methods 0.000 description 11
- 230000000052 comparative effect Effects 0.000 description 9
- 238000003384 imaging method Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000540 analysis of variance Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010894 electron beam technology Methods 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
- Image Processing (AREA)
Description
本発明は、画像を分類する分類器の学習に使用される教師データを検証する技術、当該技術を利用して教師データを作成する技術、および、画像を分類する技術に関する。 The present invention relates to a technique for verifying teacher data used for learning of a classifier that classifies images, a technique for creating teacher data using the technique, and a technique for classifying images.
半導体基板、ガラス基板、プリント配線基板等の製造では、異物や傷、エッチング不良等の欠陥を検査するために光学顕微鏡や走査電子顕微鏡等を用いて外観検査が行われる。また、このような検査工程において検出された欠陥に対して、詳細な解析を行うことによりその欠陥の発生原因を特定し、欠陥に対する対策が施される。近年では、基板上のパターンの複雑化および微細化に伴い、検出される欠陥の種類および数量が増加する傾向にあり、検査工程で検出された欠陥を自動的に分類する自動分類も用いられる。自動分類により欠陥の解析を迅速かつ効率的に行うことが実現される。 In the manufacture of semiconductor substrates, glass substrates, printed wiring boards, and the like, appearance inspection is performed using an optical microscope, a scanning electron microscope, or the like in order to inspect defects such as foreign matters, scratches, and etching defects. In addition, the cause of the defect is specified by performing detailed analysis on the defect detected in such an inspection process, and countermeasures against the defect are taken. In recent years, as the pattern on the substrate becomes more complex and finer, the types and quantities of detected defects tend to increase, and automatic classification that automatically classifies defects detected in the inspection process is also used. Automatic classification enables defect analysis to be performed quickly and efficiently.
自動分類では、ニューラルネットワークや決定木、判別分析等を利用した分類器が用いられる。分類器に自動分類を行わせるには、欠陥画像およびそのカテゴリ(すなわち、欠陥画像の種類)を示す信号を含む教師データを用意して分類器を学習させる必要がある。特許文献1では、欠陥画像に予め付与されたカテゴリが欠陥画像の属すべきカテゴリか否かを判定することにより、質が高い教師データを作成する手法が開示されている。具体的には、各カテゴリに属する複数の欠陥画像の各種類の特徴量の分散に基づいて、当該種類に対して特徴量の代表値を含む特徴量範囲が設定され、各欠陥画像の一の種類の特徴量を当該種類の特徴量範囲に含むカテゴリに投票を行う処理が特徴量の全ての種類について行われる。そして、複数のカテゴリのうち得票数が最も多いカテゴリと当該欠陥画像が属するカテゴリとが異なる場合にその旨が出力される。 In automatic classification, a classifier using a neural network, a decision tree, discriminant analysis, or the like is used. In order for the classifier to perform automatic classification, it is necessary to prepare the teacher data including a signal indicating the defect image and its category (that is, the type of the defect image) and to learn the classifier. Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for creating high-quality teacher data by determining whether or not a category previously assigned to a defect image is a category to which the defect image belongs. Specifically, a feature amount range including a representative value of the feature amount is set for the type based on the distribution of the feature amount of each type of the plurality of defect images belonging to each category, A process of voting for a category that includes a type of feature quantity in the type of feature quantity range is performed for all types of feature quantities. Then, when the category with the largest number of votes out of a plurality of categories is different from the category to which the defect image belongs, this is output.
なお、特許文献2では、複数の教示用欠陥画像について複数の特徴量を算出し、各教示用欠陥について特徴量に基づく特徴空間におけるカテゴリ間の判別関数で示される分類パラメータを算出して複数の教示用欠陥と欠陥の種類に対応するカテゴリとの対応関係を示す教示用データの統計的有意性を診断し、性能を低下させる可能性がある教示用欠陥画像を画面に表示して教示データを修正する手法が開示されている。
In
ところで、特許文献1における統計的な処理によるカテゴリの判定は、各カテゴリに属する複数の欠陥画像(教師画像)の各種類の特徴量の分布が正規分布に従う(または、正規分布に従うとみなすことができる)場合に特に有効であるが、特徴量の分布が多峰性を示す等、正規分布に従わない場合には、特許文献1における結果(カテゴリ)が操作者の判断と合致しない、あるいは、操作者が当該結果を合理的に解釈することができないことがある。この場合、信頼性の高い教師データの作成に支障が生じる虞がある。また、特許文献2の手法では、教師画像のカテゴリを操作者に提示する際に、煩雑な処理によりカテゴリ間の判別関数を算出する必要がある。したがって、各教師画像に対して複数種類の特徴量に基づく適切なカテゴリ候補を容易に特定することが可能な新規な手法が求められている。
By the way, the category determination by statistical processing in
本発明は上記課題に鑑みなされたものであり、各教師画像に対して複数種類の特徴量に基づく適切なカテゴリ候補を容易に特定することを目的としている。 The present invention has been made in view of the above problems, and an object thereof is to easily specify an appropriate category candidate based on a plurality of types of feature amounts for each teacher image.
請求項1に記載の発明は、画像を分類する分類器の学習に使用される教師データを検証する教師データ検証装置であって、それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、前記複数の教師画像のカテゴリを示す教師データを記憶する記憶部と、特徴量の複数種類のそれぞれに関して、各教師画像が前記複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値を取得する評価値取得部と、前記各教師画像において、前記複数のカテゴリのそれぞれに関して、特徴量の前記複数種類における評価値の代表値を求め、前記複数のカテゴリにおける複数の代表値に基づいて前記各教師画像が属すべきものと判定されるカテゴリを、カテゴリ候補として特定するカテゴリ候補特定部と、前記教師データが示すカテゴリと前記カテゴリ候補とが相違する教師画像をカテゴリ相違画像として、カテゴリ相違画像を前記カテゴリ候補と共に表示部に表示する表示制御部とを備え、前記評価値取得部が、特徴量の各種類に関して、前記複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムを生成し、前記各教師画像の特徴量を含む区間を注目区間として、前記複数のカテゴリに対する複数のヒストグラムにおける前記注目区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値を取得し、前記教師データから前記カテゴリ相違画像を取り除きつつ前記評価値取得部および前記カテゴリ候補特定部の処理が複数回繰り返され、前記カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて、前記複数の教師画像が複数のグループに分割される。
The invention according to
請求項2に記載の発明は、請求項1に記載の教師データ検証装置であって、前記評価値取得部が、前記複数のヒストグラムにおける前記注目区間および前記注目区間の両側に隣接する複数の区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値を取得する。
Invention of
請求項3に記載の発明は、請求項1または2に記載の教師データ検証装置であって、前記複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける前記注目区間の頻度が所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける前記注目区間の頻度が0である場合に、前記評価値取得部が前記評価値を取得しない。
The invention described in claim 3 is the teacher data verification apparatus according to
請求項4に記載の発明は、請求項1ないし3のいずれかに記載の教師データ検証装置であって、前記表示制御部が、前記カテゴリ相違画像を、前記教師データが示すカテゴリおよび前記カテゴリ候補と共に前記表示部に表示する。
The invention described in
請求項5に記載の発明は、画像を分類する分類器の学習に使用される教師データを作成する教師データ作成装置であって、請求項1ないし4のいずれかに記載の教師データ検証装置と、前記カテゴリ相違画像に対する最終的なカテゴリの入力を受け付ける入力部とを備える。
The invention according to
請求項6に記載の発明は、画像を分類する画像分類装置であって、請求項5に記載の教師データ作成装置と、前記教師データ作成装置により作成された教師データを用いて学習が行われるとともに、画像を分類する分類器とを備える。
The invention according to claim 6 is an image classification device for classifying images, and learning is performed using the teacher data creation device according to
請求項7に記載の発明は、画像を分類する分類器の学習に使用される教師データを検証する教師データ検証方法であって、a)それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、前記複数の教師画像のカテゴリを示す教師データを準備する工程と、b)特徴量の複数種類のそれぞれに関して、各教師画像が前記複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値を取得する工程と、c)前記各教師画像において、前記複数のカテゴリのそれぞれに関して、特徴量の前記複数種類における評価値の代表値を求める工程と、d)前記複数のカテゴリにおける複数の代表値に基づいて前記各教師画像が属すべきものと判定されるカテゴリを、カテゴリ候補として特定する工程と、e)前記教師データが示すカテゴリと前記カテゴリ候補とが相違する教師画像をカテゴリ相違画像として、カテゴリ相違画像を前記カテゴリ候補と共に表示部に表示する工程とを備え、前記b)工程において、特徴量の各種類に関して、前記複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムが生成され、前記各教師画像の特徴量を含む区間を注目区間として、前記複数のカテゴリに対する複数のヒストグラムにおける前記注目区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値が取得され、前記教師データから前記カテゴリ相違画像を取り除きつつ前記b)ないしd)工程が複数回繰り返され、前記カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて、前記複数の教師画像が複数のグループに分割される。 The invention according to claim 7 is a teacher data verification method for verifying teacher data used for learning of a classifier that classifies images, and a) a plurality of each of which is assigned to one of a plurality of categories A step of preparing teacher images and teacher data indicating the categories of the plurality of teacher images; and b) appropriateness when each teacher image belongs to each of the plurality of categories with respect to each of a plurality of types of feature values. A step of obtaining an evaluation value indicating sex; c) a step of obtaining representative values of evaluation values of the plurality of types of feature amounts for each of the plurality of categories in each of the teacher images; and d) the plurality of categories. Identifying a category to which each of the teacher images should belong as a category candidate based on a plurality of representative values in e), e) The teacher image and to categories and the category candidate is different as a category difference image, and a step of displaying a category different picture images on the display unit together with the category candidates, in the b) step, for each type of feature quantity , A histogram of the feature amount of the teacher image allocated to each of the plurality of categories is generated, and a section including the feature amount of each teacher image is set as the attention section, and the attention section of the plurality of histograms for the plurality of categories Based on the frequency, the evaluation value for each of the plurality of categories of each teacher image is acquired, and the steps b) to d) are repeated a plurality of times while removing the category difference image from the teacher data, and the category Depending on the number of times the process is repeated until the images are identified as different images, the plurality of teacher images Ru is divided into groups of a few.
請求項8に記載の発明は、請求項7に記載の教師データ検証方法であって、前記b)工程において、前記複数のヒストグラムにおける前記注目区間および前記注目区間の両側に隣接する複数の区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値が取得される。
The invention according to
請求項9に記載の発明は、請求項7または8に記載の教師データ検証方法であって、前記b)工程において、前記複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける前記注目区間の頻度が所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける前記注目区間の頻度が0である場合に、前記評価値が取得されない。
The invention according to claim 9 is the teacher data verification method according to
請求項10に記載の発明は、請求項7ないし9のいずれかに記載の教師データ検証方法であって、前記e)工程において、前記カテゴリ相違画像が、前記教師データが示すカテゴリおよび前記カテゴリ候補と共に前記表示部に表示される。 The invention described in claim 10 is the teacher data verification method according to any one of claims 7 to 9, in the step e), before hear categorical difference picture image, category indicates the teacher data and It is displayed on the display unit together with the category candidates.
請求項11に記載の発明は、画像を分類する分類器の学習に使用される教師データを作成する教師データ作成方法であって、請求項7ないし10のいずれかに記載の教師データ検証方法と、前記カテゴリ相違画像に対する最終的なカテゴリを決定する工程とを備える。 The invention described in claim 11 is a teacher data generation method for generating teacher data used for learning of a classifier that classifies images, and the teacher data verification method according to any one of claims 7 to 10 , and a step of determining the final category against before asked categorical difference images.
請求項12に記載の発明は、画像を分類する画像分類方法であって、請求項11に記載の教師データ作成方法により作成された教師データを用いて分類器を学習させる工程と、前記分類器により画像を分類する工程とを備える。 The invention according to claim 12 is an image classification method for classifying images, the step of learning a classifier using teacher data created by the teacher data creation method according to claim 11 , and the classifier And a step of classifying the images.
本発明によれば、各教師画像に対して複数種類の特徴量に基づく適切なカテゴリ候補を容易に特定することができる。また、カテゴリ相違画像をカテゴリ候補と共に表示部に表示することにより、信頼性の高い教師データを容易に作成することができる。 According to the present invention, it is possible to easily identify appropriate category candidates based on a plurality of types of feature amounts for each teacher image. Further, by displaying the category difference image together with the category candidates on the display unit, highly reliable teacher data can be easily created.
図1は本発明の一の実施の形態に係る画像分類装置1の概略構成を示す図である。画像分類装置1では、半導体基板9(以下、単に「基板9」という。)上の欠陥を示す欠陥画像が取得され、当該欠陥画像の分類が行われる。画像分類装置1は基板9上の検査対象領域を撮像する撮像装置2、撮像装置2からの画像データに基づいて欠陥検査を行って欠陥が検出された場合に欠陥が属すべきカテゴリへと欠陥を自動分類する検査・分類装置4、並びに、画像分類装置1の全体動作を制御するとともに検査・分類装置4における欠陥の分類に利用される分類器421を生成するホストコンピュータ5を有する。基板9上に存在する欠陥の種類(カテゴリ)は、例えば、欠損、突起、断線、ショート、異物である。また、撮像装置2は基板9の製造ラインに組み込まれ、画像分類装置1はいわゆるインライン型のシステムとなっている。画像分類装置1は、欠陥検査装置に自動欠陥分類の機能を付加した装置と捉えることもできる。
FIG. 1 is a diagram showing a schematic configuration of an
撮像装置2は、基板9上の検査対象領域を撮像して画像データを取得する撮像部21、基板9を保持するステージ22、および、撮像部21に対してステージ22を相対的に移動するステージ駆動部23を有する。撮像部21は、照明光を出射する照明部211、基板9に照明光を導くとともに基板9からの光が入射する光学系212、および、光学系212により結像された基板9の像を電気信号に変換する撮像デバイス213を有する。ステージ駆動部23はボールねじ、ガイドレール、モータ等により構成され、ホストコンピュータ5がステージ駆動部23および撮像部21を制御することにより、基板9上の検査対象領域が撮像される。
The
検査・分類装置4は、検査対象領域の画像データを処理しつつ欠陥を検出する欠陥検出部41、および、欠陥画像を分類する自動欠陥分類部42を有する。欠陥検出部41は検査対象領域の画像データを高速に処理する専用の電気的回路を有し、撮像された画像と欠陥が存在しない参照画像との比較や画像処理により検査対象領域の欠陥検査を行う。自動欠陥分類部42は各種演算処理を行うCPUや各種情報を記憶するメモリ等により構成され、ニューラルネットワーク、決定木、判別分析等を利用する分類器421を用いて欠陥の分類(すなわち、欠陥画像の分類)を実行する。
The inspection /
図2は画像分類装置1による欠陥画像の分類の流れを示す図である。まず、図1に示す撮像装置2が基板9を撮像することにより検査・分類装置4の欠陥検出部41が画像データを取得する(ステップS11)。次に、欠陥検出部41が検査対象領域の欠陥検査を行い、欠陥が検出されると(ステップS12)、欠陥部分の画像(すなわち、欠陥画像)のデータが自動欠陥分類部42へと送信される。自動欠陥分類部42は欠陥画像の複数種類の特徴量を算出し(ステップS13)、欠陥画像の特徴量が自動欠陥分類部42の分類器421に入力されて分類結果が出力される。すなわち、分類器421により欠陥画像が複数のカテゴリのいずれかに分類される(ステップS14)。画像分類装置1では、欠陥検出部41にて欠陥が検出される毎に特徴量の算出がリアルタイムにて行われ、多数の欠陥画像の自動分類が高速に行われる。
FIG. 2 is a diagram showing a flow of defect image classification by the
次に、ホストコンピュータ5による分類器の学習について説明する。図3はホストコンピュータ5の構成を示す図である。ホストコンピュータ5は各種演算処理を行うCPU51、基本プログラムを記憶するROM52および各種情報を記憶するRAM53をバスラインに接続した一般的なコンピュータシステムの構成となっている。バスラインにはさらに、情報記憶を行う固定ディスク54、画像等の各種情報の表示を行う表示部であるディスプレイ55、操作者からの入力を受け付けるキーボード56aおよびマウス56b(以下、「入力部56」と総称する。)、光ディスク、磁気ディスク、光磁気ディスク等のコンピュータ読み取り可能な記録媒体8から情報の読み取りを行う読取装置57、並びに、画像分類装置1の他の構成との間で信号を送受信する通信部58が、適宜、インターフェイス(I/F)を介する等して接続される。
Next, classifier learning by the
ホストコンピュータ5には、事前に読取装置57を介して記録媒体8からプログラム80が読み出されて固定ディスク54に記憶され、さらに、プログラム80はRAM53にコピーされるとともにCPU51によりRAM53内のプログラムに従って演算処理が実行される。
In the
図4はホストコンピュータ5のCPU51、ROM52、RAM53、固定ディスク54等により実現される、分類器を学習させるための機能構成を示すブロック図であり、検査・分類装置4も示している。ホストコンピュータ5は分類器の学習に使用される教師データを作成する教師データ作成部61、および、教師データを用いて分類器を学習させる学習部62を有する。
FIG. 4 is a block diagram showing a functional configuration for learning the classifier realized by the
教師データは、欠陥画像である教師画像のデータ、教師画像の特徴量、および、欠陥のカテゴリを示す情報である教示信号を含み、教師画像の特徴量として、例えば、欠陥の面積、明度平均、周囲長、扁平度、欠陥を楕円に近似した場合の長軸の傾き等が採用される。学習部62では、教師データから読み出された教師画像の特徴量がホストコンピュータ5内の分類器(図示省略)に入力され、分類器の出力が欠陥のカテゴリを示す教示信号と同じとなるように学習が行われ、学習結果、すなわち、学習後の分類器421(正確には、分類器421の構造や変数の値を示す情報)が自動欠陥分類部42へと転送される。
The teacher data includes a teacher image data that is a defect image, a feature amount of the teacher image, and a teaching signal that is information indicating the category of the defect. As the feature amount of the teacher image, for example, the defect area, the brightness average, Peripheral length, flatness, inclination of major axis when defect is approximated to ellipse, and the like are employed. In the
図5はホストコンピュータ5の教師データ作成部61の機能構成を示すブロック図であり、学習部62も示している。教師データ作成部61は、データ演算部610、ディスプレイ55および入力部56を有する。データ演算部610は、評価値取得部611、カテゴリ候補特定部612、表示制御部613、記憶部614および特徴量算出部615を有する。データ演算部610の処理の詳細については後述する。なお、データ演算部610および学習部62の機能は専用の電気回路により構築されてもよく、部分的に専用の電気回路が利用されてもよい。
FIG. 5 is a block diagram showing a functional configuration of the teacher
図6は、教師データを作成して分類器を学習させる処理の流れを示す図である。教師データ作成部61では、まず、教師データ作成用の欠陥画像である多数の教師画像(例えば、数千個の教師画像)のデータが図5に示す教師データ作成部61の記憶部614に記憶されて準備される(ステップS21)。なお、教師画像は図1に示す撮像装置2および欠陥検出部41を利用して取得されてもよいし、別途用意されてもよい。
FIG. 6 is a diagram showing a flow of processing for creating teacher data and learning a classifier. In the teacher
特徴量算出部615では、全ての教師画像の複数種類の(例えば、100〜200種類の)特徴量が算出される(ステップS22)。算出された特徴量は記憶部614に記憶される。また、ディスプレイ55では、各教師画像が表示されるとともに当該教師画像のカテゴリの入力を促す表示が行われ、入力部56において操作者によるカテゴリの入力が受け付けられる(ステップS23)。以下の説明では、ステップS23の処理において各教師画像に対して操作者により入力されたカテゴリを「初期カテゴリ」という。なお、各教師画像の初期カテゴリは、所定のアルゴリズムにより自動的に決定されてもよい。
The feature
図7は、ディスプレイ55に表示される複数の教師画像を例示する図である。各教師画像71a,71b,71c,71dの下方にはカテゴリ表示領域72が設けられており、図7の教師画像71a〜71dでは、初期カテゴリ(の名称)がそれぞれ「大欠損」、「中欠損」、「中突起」、「中突起」と記されている。このようにして、それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、当該複数の教師画像のカテゴリを示す教師データ710が準備されて記憶部614にて記憶される。本実施の形態では、各教師画像における複数の特徴量も教師データ710に含まれる。また、複数種類のカテゴリのそれぞれに対して番号が割り当てられており、各教師画像に対する初期カテゴリの決定により、当該教師画像に関連付けられたカテゴリ変数の値が初期カテゴリの番号に変更される。
FIG. 7 is a diagram illustrating a plurality of teacher images displayed on the
教師データ710が準備されると、評価値取得部611では、特徴量の各種類に関して、複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムが生成される。図8は、特徴量の一の種類における複数のカテゴリに対する複数のヒストグラムを示す図である。図8の例では、5348個の教師画像が、番号1ないし4の4種類のカテゴリのいずれかに割り振られており、番号1のカテゴリが1578個の教師画像を含み、番号2のカテゴリが2849個の教師画像を含み、番号3のカテゴリが688個の教師画像を含み、番号4のカテゴリが133個の教師画像を含む。また、図8では、各教師画像の特徴量を正規化した後に100区間に量子化し、各区間における頻度を示している。図8では、番号1ないし4のカテゴリのヒストグラムに符号H1,H2,H3,H4をそれぞれ付している。なお、評価値取得部611における特徴量のヒストグラムは度数分布を示すものであればよく、度数分布を示す表も実質的にヒストグラムと等価である。
When the
評価値取得部611では、各教師画像が複数のカテゴリのそれぞれに属するとした場合の妥当性(確率と捉えることもできる。)を示す評価値が特徴量の種類毎に取得される(ステップS24)。例えば、ある教師画像を注目教師画像とし、特徴量の一の種類に関して注目教師画像の特徴量を含む区間を注目区間として、注目区間に番号1のカテゴリの教師画像がx1個、番号2のカテゴリの教師画像がx2個、番号3のカテゴリの教師画像がx3個、番号4のカテゴリの教師画像がx4個存在するものとする(すなわち、ヒストグラムH1,H2,H3,H4における注目区間の頻度がそれぞれx1個、x2個、x3個、x4個である。)。なお、仮に注目教師画像の初期カテゴリが番号2のカテゴリである場合には、x2個のうちの1個が注目教師画像である。この場合に、注目教師画像が番号n(ここでは、nは1ないし4のいずれか)のカテゴリに属するとした場合の妥当性を示す評価値Pnは((xn/(x1+x2+x3+x4))×100)[%]として求められる。
The evaluation
具体的に、注目教師画像の特徴量が図8中にて符号Aを付す区間に含まれ、ヒストグラムH1,H2,H3における注目区間Aの頻度がそれぞれa1個、a2個、a3個である(ヒストグラムH4における頻度は0である。)場合には、注目教師画像が番号1のカテゴリに属するとした場合の妥当性を示す評価値P1は((a1/(a1+a2+a3))×100)[%]である。また、注目教師画像が番号2のカテゴリに属するとした場合の妥当性を示す評価値P2は((a2/(a1+a2+a3))×100)[%]であり、番号3のカテゴリに属するとした場合の妥当性を示す評価値P3は((a3/(a1+a2+a3))×100)[%]である。なお、注目教師画像が番号4のカテゴリに属するとした場合の妥当性を示す評価値P4は0%である。なお、図8では、黒い点に付す符号により、当該点の頻度を示している。
Specifically, the principal feature of the teacher image is included in the section denoted by a reference sign A in in FIG. 8, the histogram H1, H2, frequently each one a of the target interval A in H3, 2 pieces a, 3 pieces a (The frequency in the histogram H4 is 0), the evaluation value P 1 indicating the validity when the teacher image of interest belongs to the category of number 1 is ((a 1 / (a 1 + a 2 + A 3 )) × 100) [%]. Further, the evaluation value P 2 indicating the validity when the attention teacher image belongs to the category of
また、注目教師画像の特徴量が図8中にて符号Bを付す区間に含まれ、ヒストグラムH1,H2,H3における注目区間Bの頻度がそれぞれb1個、b2個、b3個である(ヒストグラムH4における頻度は0である。)場合には、注目教師画像が番号1のカテゴリに属するとした場合の妥当性を示す評価値P1は((b1/(b1+b2+b3))×100)[%]である。また、注目教師画像が番号2のカテゴリに属するとした場合の妥当性を示す評価値P2は((b2/(b1+b2+b3))×100)[%]であり、番号3のカテゴリに属するとした場合の妥当性を示す評価値P3は((b3/(b1+b2+b3))×100)[%]である。なお、注目教師画像が番号4のカテゴリに属するとした場合の妥当性を示す評価値P4は0%である。
Further, the feature quantity of the target teacher image is included in the section denoted by a reference sign B in in Fig. 8, the histogram H1, H2, frequently one b each section of interest B in H3, 2 pieces b, a three b (The frequency in the histogram H4 is 0.), the evaluation value P 1 indicating the validity when the teacher image of interest belongs to the category of number 1 is ((b 1 / (b 1 + b 2 + b 3 )) × 100) [%]. In addition, the evaluation value P 2 indicating the validity when the teacher image of interest belongs to the category of
さらに、注目教師画像の特徴量が図8中にて符号Cを付す区間に含まれ、ヒストグラムH3,H4における注目区間Cの頻度がそれぞれc3個、c4個である(ヒストグラムH1,H2における頻度は0である。)場合には、注目教師画像が番号3のカテゴリに属するとした場合の妥当性を示す評価値P3は((c3/(c3+c4))×100)[%]である。また、注目教師画像が番号4のカテゴリに属するとした場合の妥当性を示す評価値P4は((c4/(c3+c4))×100)[%]である。なお、注目教師画像が番号1のカテゴリに属するとした場合の妥当性を示す評価値P1、および、番号2のカテゴリに属するとした場合の妥当性を示す評価値P2は共に0%である。
Further, the feature quantity of the attention teacher image is included in the section denoted by reference character C in FIG. 8, and the frequencies of the attention section C in the histograms H3 and H4 are c 3 and c 4 respectively (in the histograms H1 and H2). The frequency is 0.) In this case, the evaluation value P 3 indicating the validity when the teacher image of interest belongs to the category of number 3 is ((c 3 / (c 3 + c 4 )) × 100) [ %]. Further, the evaluation value P 4 indicating the validity when the focused teacher image belongs to the category of
以上のように、評価値取得部611では、各教師画像の特徴量を含む区間を注目区間として、複数のカテゴリに対する複数のヒストグラムにおける注目区間の頻度に基づいて、当該教師画像の複数のカテゴリのそれぞれに対する評価値が取得される。これにより、各教師画像において、特徴量の一の種類に関して、4種類のカテゴリにおける4個の評価値の組合せ(例えば、「番号1のカテゴリが25%、番号2のカテゴリが72%、番号3のカテゴリが3%、番号4のカテゴリが0%」のような組合せ)が評価値群として取得され、特徴量の種類がN個ある場合には、原則としてN個の評価値群が取得される。上記処理は全ての教師画像に対して行われ、全ての教師画像において(原則として)N個の評価値群が取得される。上記処理では、ヒストグラムが多峰性を有している場合等であっても、当該ヒストグラムの凹凸に応じた評価値を取得することが可能となる。なお、各教師画像が複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値は上記以外の演算にて求められてもよい。
As described above, the evaluation
一方、例えば、図8の横軸において右側の領域では、番号4のカテゴリのヒストグラムH4だけが分布する。この場合、注目区間におけるヒストグラムH4の頻度が1または2のように極めて低い場合でも、番号4のカテゴリの評価値は必ず100%となり、後述の処理にて求められる番号4のカテゴリの評価値の代表値を不当に押し上げることになる。したがって、特徴量の一の種類に関する複数のカテゴリの複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける注目区間の頻度が所定数(例えば、1または2)以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける注目区間の頻度が0である場合には、特徴量の当該種類については評価値が取得されない。
On the other hand, for example, in the region on the right side of the horizontal axis in FIG. 8, only the histogram H4 of category No. 4 is distributed. In this case, even when the frequency of the histogram H4 in the attention interval is extremely low as 1 or 2, the evaluation value of the category of
続いて、カテゴリ候補特定部612では、各教師画像において、各カテゴリに関して、特徴量の複数種類(正確には、評価値が取得された全ての種類)における評価値の代表値が求められる(ステップS25)。ここで、評価値の代表値とは、当該評価値が分布する範囲の中央近傍を示す値であり、平均値や中央値等である。各教師画像における各カテゴリの評価値の代表値は、当該教師画像が当該カテゴリに属するとした場合における、複数(全て)の特徴量を考慮した妥当性を示す値となる。
Subsequently, the category
各教師画像に対して複数のカテゴリにおける複数の代表値が求められると、当該複数の代表値に基づいて当該教師画像が属すべきものと判定されるカテゴリがカテゴリ候補として特定される(ステップS26)。具体的には、各教師画像において、複数の代表値のうちの最大値が得られたカテゴリがカテゴリ候補として特定される。ただし、当該最大値が所定の閾値(例えば、50%)未満である場合には、当該教師画像に対して「分類不可」がカテゴリ候補として付与されることが好ましい。 When a plurality of representative values in a plurality of categories are obtained for each teacher image, a category determined to belong to the teacher image based on the plurality of representative values is specified as a category candidate (step S26). . Specifically, in each teacher image, a category in which the maximum value among a plurality of representative values is obtained is specified as a category candidate. However, when the maximum value is less than a predetermined threshold (for example, 50%), it is preferable that “not classified” is given as a category candidate to the teacher image.
表示制御部613では、教師データ710が示す初期カテゴリとカテゴリ候補とが相違する教師画像をカテゴリ相違画像として、複数のカテゴリ相違画像がディスプレイ55に表示される(ステップS27)。図9は、ディスプレイ55に表示される複数の教師画像を例示する図であり、本実施の形態では、カテゴリ相違画像71a,71d以外の教師画像71b,71cもディスプレイ55に表示される。図9の教師画像71a〜71dに対するカテゴリ表示領域72では、カテゴリ候補(の名称)がそれぞれ「分類不可」、「中欠損」、「中突起」、「分類不可」と記されている。また、カテゴリ表示領域72では、初期カテゴリおよびカテゴリ候補の双方が表示される。さらに、カテゴリ相違画像71a,71dに対するカテゴリ表示領域72の背景色が、カテゴリ相違画像ではない他の教師画像71b,71cに対するカテゴリ表示領域72の背景色と相違しており、カテゴリ相違画像71a,71dが強調される。
In the
続いて、操作者において、各カテゴリ相違画像に対する初期カテゴリおよびカテゴリ候補を考慮しつつ当該カテゴリ相違画像を参照することにより最終的なカテゴリが決定される(ステップS28)。そして、入力部56において操作者からの最終的なカテゴリの入力が受け付けられ、当該カテゴリ相違画像である教師画像に関連付けられるカテゴリ(カテゴリ変数の値)が変更または維持される。このようにして、教師データ710が更新される。もちろん、カテゴリ相違画像以外の教師画像に対する最終的なカテゴリの入力が行われてもよいが、初期カテゴリおよびカテゴリ候補が一致する教師画像については、現在のカテゴリ(初期カテゴリ)が維持されることが好ましい。
Subsequently, the operator determines the final category by referring to the category difference image while considering the initial category and the category candidate for each category difference image (step S28). Then, the input of the final category from the operator is accepted by the
各教師画像の最終的なカテゴリが決定されると、全ての教師画像のデータ、並びに、これらの特徴量およびカテゴリの情報を含む更新後の教師データ710が記憶部614から学習部62に転送され、学習部62にて教師データ710を用いて分類器の学習が行われる(ステップS29)。すなわち、分類器(図4参照)を構成する変数の値が決定されたり、構造が決定されて分類器421が生成される。これにより、教師データを作成して分類器を学習させる図6の処理が完了する。
When the final category of each teacher image is determined, all the teacher image data and updated
ここで、図6の処理では、各カテゴリ相違画像に対して、特徴量の全ての種類を勘案した上での妥当性が高いカテゴリ候補が提示される。したがって、最終的なカテゴリが決定された教師データは、特徴量空間において矛盾したカテゴリに関連付けられる教師画像を含みにくくなる。すなわち、教師データの信頼性が向上する。よって、このような教師データを用いた学習結果(分類器)は高い分類性能を有することが期待できる。 Here, in the process of FIG. 6, category candidates with high validity are presented for each category-difference image in consideration of all types of feature values. Therefore, the teacher data for which the final category has been determined is less likely to include teacher images associated with inconsistent categories in the feature amount space. That is, the reliability of teacher data is improved. Therefore, a learning result (classifier) using such teacher data can be expected to have high classification performance.
なお、元の教師データからカテゴリ相違画像を取り除きつつステップS24〜S26の処理を複数回繰り返す後述の処理を行うと、初期カテゴリとしてあるカテゴリに割り振られた全ての教師画像を、カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて複数のグループに分割することができる。各グループは、当該カテゴリに対する異質さの度合いがおよそ等しい教師画像の集合と捉えることができ、複数のグループでは異質さの度合いが互いに相違する。図10では、異質さの度合いが相違する複数のグループを抽象的に示しており、例えば、1回目の処理にてカテゴリ相違画像として特定される教師画像は最も外側の環状領域Z1に含まれる「異質なもの」と捉えられる。2ないし4回目の処理にてカテゴリ相違画像として特定される教師画像は、異質さの度合いが漸次低下する環状領域Z2,Z3,Z4にそれぞれ含まれる。4回目の処理でもカテゴリ相違画像として特定されない教師画像は中央の円形領域Z0に含まれ、当該カテゴリの典型的な教師画像として捉えられる。 In addition, when the process described later is repeated a plurality of times while removing the category difference image from the original teacher data, all the teacher images assigned to a certain category as the initial category are specified as the category difference image. It can be divided into a plurality of groups according to the number of times the process is repeated. Each group can be regarded as a collection of teacher images having approximately the same degree of heterogeneity for the category, and the plurality of groups have different degrees of heterogeneity. FIG. 10 abstractly shows a plurality of groups having different degrees of heterogeneity. For example, the teacher image specified as the category difference image in the first process is included in the outermost annular region Z1. It is perceived as “a heterogeneous thing”. The teacher images specified as the category difference images in the second to fourth processes are included in the annular regions Z2, Z3, and Z4 where the degree of heterogeneity gradually decreases. A teacher image that is not specified as a category-difference image in the fourth process is included in the central circular area Z0, and is captured as a typical teacher image of the category.
次に、カテゴリ候補を特定する上記処理の優位性について説明する。画像分類装置1では、図6の処理において元の教師データからカテゴリ相違画像を取り除きつつステップS24〜S26の処理を複数回繰り返すことが可能であり、ここでは、教師データからカテゴリ相違画像を取り除きつつステップS24〜S26の処理を4回繰り返した場合における結果(以下、「本処理例における結果」という。)を、比較例の処理における結果と比較する。ここで、比較例の処理は、特開2010−91401号公報(特許文献1)の手法と同様のものであり、各カテゴリに属する複数の教師画像の各種類の特徴量の分散に基づいて、当該種類に対して特徴量の代表値を含む特徴量範囲が設定され、各教師画像の一の種類の特徴量を当該種類の特徴量範囲に含むカテゴリに投票を行う処理が特徴量の全ての種類について行われる。そして、複数のカテゴリのうち得票数が最も多いカテゴリがカテゴリ候補とされる。なお、得票数が最も多いカテゴリと得票数が2番目に多いカテゴリとの得票数の差が所定値以下である場合、このような教師画像は不適切な教師画像と判定される。
Next, the superiority of the above process for specifying category candidates will be described. The
図11は本処理例における結果を示す図であり、図12は比較例における結果を示す図である。図11および図12では、同じ複数の教師画像71a〜71dをカテゴリ候補と共に示している。また、図11および図12のカテゴリ相違画像に対するカテゴリ表示領域72では、カテゴリ相違画像として特定されるまでの処理の繰り返し回数が多いほど狭い幅の平行斜線を付している(実際には、カテゴリ表示領域72の背景色が相違する。)。実際には、本処理例における結果では、図11に示す教師画像71a,71dはステップS24〜S26の1回目の処理にてカテゴリ相違画像として特定され、教師画像71cはステップS24〜S26の4回目の処理にてカテゴリ相違画像として特定され、教師画像71bは1ないし4回目のいずれの処理においてもカテゴリ相違画像として特定されていない(すなわち、初期カテゴリが正しい。)。また、比較例における結果では、図12に示す教師画像71bは1回目の比較例の処理にてカテゴリ相違画像として特定され、教師画像71cは2回目の比較例の処理にてカテゴリ相違画像として特定され、教師画像71a,71dは1ないし4回目のいずれの比較例の処理においてもカテゴリ相違画像として特定されていない。
FIG. 11 is a diagram showing a result in this processing example, and FIG. 12 is a diagram showing a result in a comparative example. 11 and 12, the same plurality of
比較例の処理では、図12に示すように、パターンの断線を示す教師画像71aに対して初期カテゴリと同様に、「大欠損」がカテゴリ候補として決定される。すなわち、特徴量空間では大きく相違すると考えられる「大欠損」および「断線」を共に「大欠損」として取り扱っている点について何も指摘されていない。これに対し、本処理例では、図11に示すように、パターンの断線を示す教師画像71aに対して初期カテゴリの「大欠損」とは相違する「分類不可」がカテゴリ候補として決定され、「大欠損」および「断線」の混在が指摘されている。また、本処理例では、教師画像71dに対して初期カテゴリの「中突起」とは相違する「分類不可」がカテゴリ候補として決定され、教師画像71dが「中突起」または「大突起」のいずれであるかが紛らわしいことが指摘されている。以上より、本処理例における結果が、比較例における結果よりも人間の感覚に沿ったものであると捉えることができる。
In the process of the comparative example, as shown in FIG. 12, “large deficit” is determined as a category candidate in the same manner as the initial category with respect to the
以上に説明したように、画像分類装置1では、複数の教師画像、および、複数の教師画像のカテゴリを示す教師データが記憶部614にて記憶され、特徴量の複数種類のそれぞれに関して、各教師画像が複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値が評価値取得部611にて取得される。そして、カテゴリ候補特定部612では、各教師画像において、特徴量の複数種類における評価値の代表値がカテゴリ毎に求められ、さらに、複数のカテゴリにおける複数の代表値に基づいて各教師画像が属すべきものと判定されるカテゴリがカテゴリ候補として特定される。これにより、各教師画像に対して複数種類(全種類)の特徴量に基づく適切なカテゴリ候補を、簡単な演算で、容易に特定することができる。
As described above, in the
また、初期カテゴリとカテゴリ候補とが相違する教師画像であるカテゴリ相違画像が、表示制御部613によりカテゴリ候補と共にディスプレイ55に表示される。そして、操作者がディスプレイ55上のカテゴリ相違画像およびカテゴリ候補を参照して、最終的なカテゴリの入力を行うことにより、信頼性の高い教師データを容易に作成することができる。その結果、画像分類装置1では、当該教師データを用いて学習が行われる分類器421を利用して、欠陥画像を精度よく分類することができる。
Also, a category difference image, which is a teacher image in which the initial category and the category candidate are different, is displayed on the
また、各カテゴリ相違画像に対して、初期カテゴリおよびカテゴリ候補の双方を並べてディスプレイ55に表示することにより、操作者がカテゴリ相違画像の解釈を容易に行うことが可能となる。さらに、画像分類装置1では、特徴量の各種類における複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける注目区間の頻度が(1以上)所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける注目区間の頻度が0である場合には、評価値取得部611において特徴量の当該種類の評価値が取得されない。これにより、分散分析(いわゆる、ANOVA(analysis of variance))等により不必要な特徴量の種類を排除する処理を行うことなく、評価値の代表値を不当に押し上げる不適切な特徴量の種類(の評価値)を排除することができる。
Further, by displaying both the initial category and the category candidate side by side on the
ところで、教師画像の個数が少ない場合には、多くの教師画像がいずれかの区間にて孤立して存在し(特徴量空間において孤立した状態となり)、図8の番号4のカテゴリのヒストグラムH4のように、大部分の区間において頻度が低く、平坦な分布を示す。このような場合には、番号nのカテゴリのヒストグラムにおいて、注目教師画像における注目区間の頻度のみならず、当該注目区間の両側に隣接する複数の区間における頻度も加えた値をxnとして、評価値Pnが((xn/(x1+x2+x3+x4))×100)[%]により求められることが好ましい。このように、評価値取得部611では、複数のヒストグラムにおける注目区間および注目区間の両側に隣接する複数の区間の頻度に基づいて、各教師画像の複数のカテゴリのそれぞれに対する評価値が取得されることにより、教師画像の個数が少ない場合等にも、カテゴリ候補を適切に決定することが可能となる。
By the way, when the number of teacher images is small, many teacher images exist in isolation in any section (become isolated in the feature space), and the histogram H4 of category No. 4 in FIG. Thus, the frequency is low in most of the sections and shows a flat distribution. In such a case, in the histogram of the category of number n, evaluation is performed by setting a value that includes not only the frequency of the target section in the target teacher image but also the frequencies of a plurality of sections adjacent to both sides of the target section as x n . The value P n is preferably determined by ((x n / (x 1 + x 2 + x 3 + x 4 )) × 100) [%]. In this way, the evaluation
上記装置では、様々な変形が可能である。
Various modifications can be made to the above apparatus .
上記実施の形態では、教師データからカテゴリ相違画像を取り除きつつ図6のステップS24〜S26の処理を複数回繰り返した結果を参照することにより、カテゴリ候補を特定する図6の処理の優位性について説明したが、教師データからカテゴリ相違画像を取り除きつつステップS24〜S26の処理を複数回繰り返すことにより、最終的な教師データが生成されてもよい。図10を参照して説明したように、このような教師データは各カテゴリの典型的な教師画像のみを含むと捉えることができる。 In the above embodiment, the superiority of the process of FIG. 6 for identifying category candidates is described by referring to the result of repeating the processes of steps S24 to S26 of FIG. 6 a plurality of times while removing the category difference image from the teacher data. However, final teacher data may be generated by repeating the processes in steps S24 to S26 a plurality of times while removing the category difference image from the teacher data. As described with reference to FIG. 10, such teacher data can be regarded as including only typical teacher images of each category.
ディスプレイ55では必ずしも複数のカテゴリ相違画像が表示される必要はなく、1つのカテゴリ相違画像のみが表示されてもよい。また、カテゴリ候補のみがカテゴリ相違画像と共に表示されてもよい。以上のように、図6のステップS27の処理では、少なくとも1つのカテゴリ相違画像のそれぞれがカテゴリ候補と共にディスプレイ55に表示される。
The
画像分類装置1において、教師データに利用される多数の教師画像の特徴量が検査・分類装置4にて算出されてもよい。また、教師データから特徴量が省略され、学習部62において教師画像のデータに基づいて特徴量が求められてもよい。
In the
上記実施の形態では、欠陥検査装置に自動欠陥分類の機能を付加した画像分類装置1について説明したが、他の欠陥検査装置にて検出された基板上の欠陥を観察する観察装置(レビュー装置とも呼ばれる。)に自動欠陥分類の機能を付加した装置(同様に、画像分類装置として捉えることができる。)において、上記教師データ作成部61が用いられてもよい。このような画像分類装置における撮像装置では、欠陥をより高度に解析するため、図1の撮像装置2に比べて高い解像度の画像が取得される。
In the above-described embodiment, the
図1の画像分類装置1では、半導体基板に代えてガラス基板(例えば、平面表示装置用のガラス基板)、プリント配線基板あるいは基板の露光に使用するマスク基板等の検査が行われてもよい。
In the
また、画像分類装置1が、血液や培養液等の所定の液中の細胞を撮像した細胞画像を分類する用途に用いられてもよい。このように、画像分類装置1は、様々な対象物を示す画像の分類に利用可能である。さらに、画像分類装置1では、可視光により撮像される画像以外に、電子線やX線等により撮像される画像が分類されてよい。
Further, the
上記実施の形態では、各教師画像に対してカテゴリ候補を特定することにより教師データを検証する教師データ検証装置が、教師データ作成部61に設けられる記憶部614、評価値取得部611、カテゴリ候補特定部612および表示制御部613により実現されるが、教師データ検証装置は、教師データ作成部61とは個別の装置として実現されてもよい。また、教師データ作成装置である教師データ作成部61が画像分類装置1とは個別の装置として実現されてもよい。
In the above embodiment, the teacher data verification device that verifies teacher data by specifying category candidates for each teacher image includes the
上記実施の形態および各変形例における構成は、相互に矛盾しない限り適宜組み合わされてよい。 The configurations in the above-described embodiments and modifications may be combined as appropriate as long as they do not contradict each other.
1 画像分類装置
55 ディスプレイ
56 入力部
61 教師データ作成部
71a〜71d 教師画像
421 分類器
611 評価値取得部
612 カテゴリ候補特定部
613 表示制御部
614 記憶部
710 教師データ
H1〜H4 ヒストグラム
S14,S21〜S29 ステップ
DESCRIPTION OF
Claims (12)
それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、前記複数の教師画像のカテゴリを示す教師データを記憶する記憶部と、
特徴量の複数種類のそれぞれに関して、各教師画像が前記複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値を取得する評価値取得部と、
前記各教師画像において、前記複数のカテゴリのそれぞれに関して、特徴量の前記複数種類における評価値の代表値を求め、前記複数のカテゴリにおける複数の代表値に基づいて前記各教師画像が属すべきものと判定されるカテゴリを、カテゴリ候補として特定するカテゴリ候補特定部と、
前記教師データが示すカテゴリと前記カテゴリ候補とが相違する教師画像をカテゴリ相違画像として、カテゴリ相違画像を前記カテゴリ候補と共に表示部に表示する表示制御部と、
を備え、
前記評価値取得部が、特徴量の各種類に関して、前記複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムを生成し、前記各教師画像の特徴量を含む区間を注目区間として、前記複数のカテゴリに対する複数のヒストグラムにおける前記注目区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値を取得し、
前記教師データから前記カテゴリ相違画像を取り除きつつ前記評価値取得部および前記カテゴリ候補特定部の処理が複数回繰り返され、前記カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて、前記複数の教師画像が複数のグループに分割されることを特徴とする教師データ検証装置。 A teacher data verification device for verifying teacher data used for learning of a classifier that classifies images,
A plurality of teacher images each assigned to one of a plurality of categories, and a storage unit that stores teacher data indicating categories of the plurality of teacher images;
An evaluation value acquisition unit that acquires an evaluation value indicating validity when each teacher image belongs to each of the plurality of categories for each of a plurality of types of feature amounts;
In each of the teacher images, for each of the plurality of categories, a representative value of the evaluation value in the plurality of types of feature quantities is obtained, and each teacher image should belong based on the plurality of representative values in the plurality of categories. A category candidate identifying unit that identifies a category to be determined as a category candidate;
The teacher image and the category showing the teacher data and the category candidate is different as a category different from the image, a display control unit for displaying the category difference picture image on the display unit together with the category candidates,
Equipped with a,
The evaluation value acquisition unit generates a histogram of the feature amount of the teacher image assigned to each of the plurality of categories for each type of feature amount, and sets a section including the feature amount of each teacher image as an attention interval. Based on the frequency of the attention interval in a plurality of histograms for the plurality of categories, the evaluation values for each of the plurality of categories of the teacher images,
The processing of the evaluation value acquisition unit and the category candidate specifying unit is repeated a plurality of times while removing the category difference image from the teacher data, and the plurality of the plurality of times are determined according to the number of times the processing is repeated until the category difference image is specified. teacher data verifying device teacher image is characterized Rukoto is divided into a plurality of groups.
前記評価値取得部が、前記複数のヒストグラムにおける前記注目区間および前記注目区間の両側に隣接する複数の区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値を取得することを特徴とする教師データ検証装置。 The teacher data verification device according to claim 1 ,
The evaluation value acquisition unit acquires the evaluation value for each of the plurality of categories of each teacher image based on the attention interval in the plurality of histograms and the frequencies of a plurality of intervals adjacent to both sides of the attention interval. A teacher data verification device characterized in that:
前記複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける前記注目区間の頻度が所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける前記注目区間の頻度が0である場合に、前記評価値取得部が前記評価値を取得しないことを特徴とする教師データ検証装置。 The teacher data verification device according to claim 1 or 2 ,
Of the plurality of histograms, when the frequency of the attention interval in the histogram for one category is a predetermined number or less and the frequency of the attention interval in the histogram for each of all other categories is 0, the evaluation value A teacher data verification apparatus, wherein an acquisition unit does not acquire the evaluation value.
前記表示制御部が、前記カテゴリ相違画像を、前記教師データが示すカテゴリおよび前記カテゴリ候補と共に前記表示部に表示することを特徴とする教師データ検証装置。 The teacher data verification device according to any one of claims 1 to 3 ,
Wherein the display control unit, pre-listen categories the difference image image, the teacher data verifying device and displaying on the display unit together with the category and the category candidate the teacher data indicates.
請求項1ないし4のいずれかに記載の教師データ検証装置と、
前記カテゴリ相違画像に対する最終的なカテゴリの入力を受け付ける入力部と、
を備えることを特徴とする教師データ作成装置。 A teacher data creation device for creating teacher data used for learning of a classifier that classifies images,
A teacher data verification device according to any one of claims 1 to 4 ,
An input unit for accepting an input of the final categories against before asked categorical difference picture image,
A teacher data creation device comprising:
請求項5に記載の教師データ作成装置と、
前記教師データ作成装置により作成された教師データを用いて学習が行われるとともに、画像を分類する分類器と、
を備えることを特徴とする画像分類装置。 An image classification device for classifying images,
A teacher data creation device according to claim 5 ;
Learning is performed using the teacher data created by the teacher data creation device, and a classifier that classifies images;
An image classification apparatus comprising:
a)それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、前記複数の教師画像のカテゴリを示す教師データを準備する工程と、
b)特徴量の複数種類のそれぞれに関して、各教師画像が前記複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値を取得する工程と、
c)前記各教師画像において、前記複数のカテゴリのそれぞれに関して、特徴量の前記複数種類における評価値の代表値を求める工程と、
d)前記複数のカテゴリにおける複数の代表値に基づいて前記各教師画像が属すべきものと判定されるカテゴリを、カテゴリ候補として特定する工程と、
e)前記教師データが示すカテゴリと前記カテゴリ候補とが相違する教師画像をカテゴリ相違画像として、カテゴリ相違画像を前記カテゴリ候補と共に表示部に表示する工程と、
を備え、
前記b)工程において、特徴量の各種類に関して、前記複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムが生成され、前記各教師画像の特徴量を含む区間を注目区間として、前記複数のカテゴリに対する複数のヒストグラムにおける前記注目区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値が取得され、
前記教師データから前記カテゴリ相違画像を取り除きつつ前記b)ないしd)工程が複数回繰り返され、前記カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて、前記複数の教師画像が複数のグループに分割されることを特徴とする教師データ検証方法。 A teacher data verification method for verifying teacher data used for learning a classifier that classifies images,
a) preparing a plurality of teacher images each assigned to any of a plurality of categories, and teacher data indicating the categories of the plurality of teacher images;
b) obtaining an evaluation value indicating validity when each teacher image belongs to each of the plurality of categories for each of the plurality of types of feature values;
c) obtaining a representative value of the evaluation value in the plurality of types of feature amounts for each of the plurality of categories in each teacher image;
d) identifying a category determined as a category candidate to which each teacher image should belong based on a plurality of representative values in the plurality of categories;
The teacher image e) and the category indicated supervisor data and the category candidate is different as a category different from the image, and displaying the category difference picture image on the display unit together with the category candidates,
Equipped with a,
In the step b), for each type of feature quantity, a histogram of the feature quantity of the teacher image allocated to each of the plurality of categories is generated, and a section including the feature quantity of each teacher image is set as an attention section. Based on the frequency of the attention interval in a plurality of histograms for a plurality of categories, the evaluation value for each of the plurality of categories of each teacher image is acquired,
While removing the category difference image from the teacher data, the steps b) to d) are repeated a plurality of times, and the plurality of teacher images are a plurality of times depending on the number of repetitions of the process until the category difference image is specified. teacher data verification method according to claim Rukoto are divided into groups.
前記b)工程において、前記複数のヒストグラムにおける前記注目区間および前記注目区間の両側に隣接する複数の区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値が取得されることを特徴とする教師データ検証方法。 The teacher data verification method according to claim 7 ,
In the step b), the evaluation value for each of the plurality of categories of each teacher image is acquired based on the attention section in the plurality of histograms and the frequencies of a plurality of sections adjacent to both sides of the attention section. The teacher data verification method characterized by the above-mentioned.
前記b)工程において、前記複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける前記注目区間の頻度が所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける前記注目区間の頻度が0である場合に、前記評価値が取得されないことを特徴とする教師データ検証方法。 The teacher data verification method according to claim 7 or 8 ,
In the step b), among the plurality of histograms, the frequency of the attention interval in the histogram for one category is not more than a predetermined number, and the frequency of the attention interval in the histogram for each of all other categories is 0. In this case, the teacher data verification method is characterized in that the evaluation value is not acquired.
前記e)工程において、前記カテゴリ相違画像が、前記教師データが示すカテゴリおよび前記カテゴリ候補と共に前記表示部に表示されることを特徴とする教師データ検証方法。 The teacher data verification method according to any one of claims 7 to 9 ,
Wherein e) in the step, prior to hear categorical difference picture image is teacher data verification method characterized in that it is displayed on the display unit together with the category and the category candidate the teacher data indicates.
請求項7ないし10のいずれかに記載の教師データ検証方法と、
前記カテゴリ相違画像に対する最終的なカテゴリを決定する工程と、
を備えることを特徴とする教師データ作成方法。 A teacher data creation method for creating teacher data used for learning a classifier that classifies images,
A teacher data verification method according to any one of claims 7 to 10 ,
Determining a final category against before asked categorical difference picture image,
A method for creating teacher data, comprising:
請求項11に記載の教師データ作成方法により作成された教師データを用いて分類器を学習させる工程と、
前記分類器により画像を分類する工程と、
を備えることを特徴とする画像分類方法。 An image classification method for classifying images,
Learning a classifier using the teacher data created by the teacher data creation method according to claim 11 ;
Classifying images by the classifier;
An image classification method comprising:
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012215984A JP6059486B2 (en) | 2012-09-28 | 2012-09-28 | Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method |
TW102124865A TWI502189B (en) | 2012-09-28 | 2013-07-11 | Training data verification apparatus, training data generation apparatus, image classification apparatus, training data verification method, training data generation method, and image classification method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012215984A JP6059486B2 (en) | 2012-09-28 | 2012-09-28 | Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014070944A JP2014070944A (en) | 2014-04-21 |
JP6059486B2 true JP6059486B2 (en) | 2017-01-11 |
Family
ID=50746292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012215984A Active JP6059486B2 (en) | 2012-09-28 | 2012-09-28 | Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6059486B2 (en) |
TW (1) | TWI502189B (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020189269A1 (en) * | 2019-03-19 | 2021-12-02 | 日本電気株式会社 | Image processing method, image processing device, program |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6472621B2 (en) * | 2014-08-12 | 2019-02-20 | 株式会社Screenホールディングス | Classifier construction method, image classification method, and image classification apparatus |
TWI737659B (en) * | 2015-12-22 | 2021-09-01 | 以色列商應用材料以色列公司 | Method of deep learning - based examination of a semiconductor specimen and system thereof |
JP6763673B2 (en) * | 2016-03-10 | 2020-09-30 | 株式会社Screenホールディングス | Teacher data creation support device, image classification device, teacher data creation support method and image classification method |
US10964013B2 (en) * | 2017-01-10 | 2021-03-30 | Kla-Tencor Corporation | System, method for training and applying defect classifiers in wafers having deeply stacked layers |
JP2018136903A (en) * | 2017-02-21 | 2018-08-30 | エンゼルプレイングカード株式会社 | System for counting number of gaming-purpose substitute currency |
JP6810505B2 (en) * | 2017-09-19 | 2021-01-06 | 富士フイルム株式会社 | Teacher data creation method and equipment and defect inspection method and equipment |
JP7050470B2 (en) * | 2017-11-21 | 2022-04-08 | 千代田化工建設株式会社 | Inspection support system, learning device, and judgment device |
JP7219190B2 (en) * | 2018-08-27 | 2023-02-07 | 株式会社Screenホールディングス | Teaching data generation method and discharge state determination method |
JP7214417B2 (en) * | 2018-09-20 | 2023-01-30 | 株式会社Screenホールディングス | Data processing method and data processing program |
JP7501166B2 (en) * | 2020-07-03 | 2024-06-18 | オムロン株式会社 | X-ray inspection equipment |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4132229B2 (en) * | 1998-06-03 | 2008-08-13 | 株式会社ルネサステクノロジ | Defect classification method |
JP2001188906A (en) * | 1999-12-28 | 2001-07-10 | Hitachi Ltd | Method and device for automatic image calssification |
KR100882484B1 (en) * | 2007-04-10 | 2009-02-09 | 삼성전자주식회사 | Semiconductor memory device having error detection function, memory system having the same, and method of outputting data of the same |
US8971230B2 (en) * | 2007-08-17 | 2015-03-03 | Ntt Docomo, Inc. | Mobile communication method, radio base station apparatus and mobile station |
CN101329736B (en) * | 2008-06-20 | 2011-04-27 | 西安电子科技大学 | Method of image segmentation based on character selection and hidden Markov model |
EP2341836B1 (en) * | 2008-09-24 | 2017-03-22 | Koninklijke Philips N.V. | Generation of standard protocols for review of 3d ultrasound image data |
CN101426150B (en) * | 2008-12-08 | 2011-05-11 | 青岛海信电子产业控股股份有限公司 | Video image quality evaluation method and system |
-
2012
- 2012-09-28 JP JP2012215984A patent/JP6059486B2/en active Active
-
2013
- 2013-07-11 TW TW102124865A patent/TWI502189B/en active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020189269A1 (en) * | 2019-03-19 | 2021-12-02 | 日本電気株式会社 | Image processing method, image processing device, program |
JP7151869B2 (en) | 2019-03-19 | 2022-10-12 | 日本電気株式会社 | IMAGE PROCESSING METHOD, IMAGE PROCESSING APPARATUS, AND PROGRAM |
Also Published As
Publication number | Publication date |
---|---|
TWI502189B (en) | 2015-10-01 |
JP2014070944A (en) | 2014-04-21 |
TW201413239A (en) | 2014-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6059486B2 (en) | Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method | |
JP6063756B2 (en) | Teacher data creation support device, teacher data creation device, image classification device, teacher data creation support method, teacher data creation method, and image classification method | |
JP6924413B2 (en) | Data generator, data generation method and data generation program | |
JP6113024B2 (en) | Classifier acquisition method, defect classification method, defect classification device, and program | |
WO2019117065A1 (en) | Data generation device, data generation method and data generation program | |
JP4155496B2 (en) | Classification support device, classification device, and program | |
JP6472621B2 (en) | Classifier construction method, image classification method, and image classification apparatus | |
JP6669453B2 (en) | Image classification device and image classification method | |
US20190139213A1 (en) | Data generation apparatus, data generation method, and data generation program | |
JP6401648B2 (en) | Defect classification apparatus and defect classification method | |
JP2011158373A (en) | Method for creation of teacher data for use in automatic defect classification, and method and apparatus for automatic defect classification | |
JP2005293264A (en) | Learning type sorting apparatus and learning type sorting method | |
JP2006098151A (en) | Pattern inspection device and pattern inspection method | |
JP2013134666A (en) | Binary image generation device, classification device, binary image generation method, and classification method | |
JP2016181098A (en) | Area detection device and area detection method | |
JP5075070B2 (en) | Teacher data creation method, image classification method, and image classification apparatus | |
JP2014137284A (en) | Teacher data creation support device, teacher data creation device, image classification device, teacher data creation support method, teacher data creation method and image classification method | |
US20190272627A1 (en) | Automatically generating image datasets for use in image recognition and detection | |
JP6530688B2 (en) | Classifier construction method, image classification method, classifier construction apparatus and image classification apparatus | |
JP2017107313A (en) | Teacher data creation support method, image classification method, teacher data creation support device and image classification device | |
Socia et al. | Detection of trachoma using machine learning approaches | |
JP6763673B2 (en) | Teacher data creation support device, image classification device, teacher data creation support method and image classification method | |
JP6871807B2 (en) | Classifier construction method, classifier and classifier construction device | |
JP6425468B2 (en) | Teacher data creation support method, image classification method, teacher data creation support device and image classification device | |
JP5075083B2 (en) | Teacher data creation support method, image classification method, and image classification apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150619 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160506 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6059486 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |