[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6059486B2 - Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method - Google Patents

Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method Download PDF

Info

Publication number
JP6059486B2
JP6059486B2 JP2012215984A JP2012215984A JP6059486B2 JP 6059486 B2 JP6059486 B2 JP 6059486B2 JP 2012215984 A JP2012215984 A JP 2012215984A JP 2012215984 A JP2012215984 A JP 2012215984A JP 6059486 B2 JP6059486 B2 JP 6059486B2
Authority
JP
Japan
Prior art keywords
teacher
category
image
teacher data
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012215984A
Other languages
Japanese (ja)
Other versions
JP2014070944A (en
Inventor
松村 明
明 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2012215984A priority Critical patent/JP6059486B2/en
Priority to TW102124865A priority patent/TWI502189B/en
Publication of JP2014070944A publication Critical patent/JP2014070944A/en
Application granted granted Critical
Publication of JP6059486B2 publication Critical patent/JP6059486B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Image Processing (AREA)

Description

本発明は、画像を分類する分類器の学習に使用される教師データを検証する技術、当該技術を利用して教師データを作成する技術、および、画像を分類する技術に関する。   The present invention relates to a technique for verifying teacher data used for learning of a classifier that classifies images, a technique for creating teacher data using the technique, and a technique for classifying images.

半導体基板、ガラス基板、プリント配線基板等の製造では、異物や傷、エッチング不良等の欠陥を検査するために光学顕微鏡や走査電子顕微鏡等を用いて外観検査が行われる。また、このような検査工程において検出された欠陥に対して、詳細な解析を行うことによりその欠陥の発生原因を特定し、欠陥に対する対策が施される。近年では、基板上のパターンの複雑化および微細化に伴い、検出される欠陥の種類および数量が増加する傾向にあり、検査工程で検出された欠陥を自動的に分類する自動分類も用いられる。自動分類により欠陥の解析を迅速かつ効率的に行うことが実現される。   In the manufacture of semiconductor substrates, glass substrates, printed wiring boards, and the like, appearance inspection is performed using an optical microscope, a scanning electron microscope, or the like in order to inspect defects such as foreign matters, scratches, and etching defects. In addition, the cause of the defect is specified by performing detailed analysis on the defect detected in such an inspection process, and countermeasures against the defect are taken. In recent years, as the pattern on the substrate becomes more complex and finer, the types and quantities of detected defects tend to increase, and automatic classification that automatically classifies defects detected in the inspection process is also used. Automatic classification enables defect analysis to be performed quickly and efficiently.

自動分類では、ニューラルネットワークや決定木、判別分析等を利用した分類器が用いられる。分類器に自動分類を行わせるには、欠陥画像およびそのカテゴリ(すなわち、欠陥画像の種類)を示す信号を含む教師データを用意して分類器を学習させる必要がある。特許文献1では、欠陥画像に予め付与されたカテゴリが欠陥画像の属すべきカテゴリか否かを判定することにより、質が高い教師データを作成する手法が開示されている。具体的には、各カテゴリに属する複数の欠陥画像の各種類の特徴量の分散に基づいて、当該種類に対して特徴量の代表値を含む特徴量範囲が設定され、各欠陥画像の一の種類の特徴量を当該種類の特徴量範囲に含むカテゴリに投票を行う処理が特徴量の全ての種類について行われる。そして、複数のカテゴリのうち得票数が最も多いカテゴリと当該欠陥画像が属するカテゴリとが異なる場合にその旨が出力される。   In automatic classification, a classifier using a neural network, a decision tree, discriminant analysis, or the like is used. In order for the classifier to perform automatic classification, it is necessary to prepare the teacher data including a signal indicating the defect image and its category (that is, the type of the defect image) and to learn the classifier. Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for creating high-quality teacher data by determining whether or not a category previously assigned to a defect image is a category to which the defect image belongs. Specifically, a feature amount range including a representative value of the feature amount is set for the type based on the distribution of the feature amount of each type of the plurality of defect images belonging to each category, A process of voting for a category that includes a type of feature quantity in the type of feature quantity range is performed for all types of feature quantities. Then, when the category with the largest number of votes out of a plurality of categories is different from the category to which the defect image belongs, this is output.

なお、特許文献2では、複数の教示用欠陥画像について複数の特徴量を算出し、各教示用欠陥について特徴量に基づく特徴空間におけるカテゴリ間の判別関数で示される分類パラメータを算出して複数の教示用欠陥と欠陥の種類に対応するカテゴリとの対応関係を示す教示用データの統計的有意性を診断し、性能を低下させる可能性がある教示用欠陥画像を画面に表示して教示データを修正する手法が開示されている。   In Patent Document 2, a plurality of feature amounts are calculated for a plurality of teaching defect images, and a classification parameter indicated by a discriminant function between categories in a feature space based on the feature amount is calculated for each teaching defect. Diagnose the statistical significance of teaching data showing the correspondence between teaching defects and the category corresponding to the type of defect, display teaching defect images on the screen that may reduce performance, and display teaching data A technique for correcting is disclosed.

特開2010−91401号公報JP 2010-91401 A 特開平11−344450号公報JP 11-344450 A

ところで、特許文献1における統計的な処理によるカテゴリの判定は、各カテゴリに属する複数の欠陥画像(教師画像)の各種類の特徴量の分布が正規分布に従う(または、正規分布に従うとみなすことができる)場合に特に有効であるが、特徴量の分布が多峰性を示す等、正規分布に従わない場合には、特許文献1における結果(カテゴリ)が操作者の判断と合致しない、あるいは、操作者が当該結果を合理的に解釈することができないことがある。この場合、信頼性の高い教師データの作成に支障が生じる虞がある。また、特許文献2の手法では、教師画像のカテゴリを操作者に提示する際に、煩雑な処理によりカテゴリ間の判別関数を算出する必要がある。したがって、各教師画像に対して複数種類の特徴量に基づく適切なカテゴリ候補を容易に特定することが可能な新規な手法が求められている。   By the way, the category determination by statistical processing in Patent Document 1 can be considered that the distribution of each type of feature amount of a plurality of defect images (teacher images) belonging to each category follows a normal distribution (or follows a normal distribution). It is particularly effective in the case where the distribution of the feature quantity shows multimodality, and the result (category) in Patent Document 1 does not agree with the operator's judgment when the distribution does not follow the normal distribution, or The operator may not be able to reasonably interpret the result. In this case, there is a possibility that the creation of highly reliable teacher data may be hindered. In the method of Patent Document 2, it is necessary to calculate a discriminant function between categories by complicated processing when the category of the teacher image is presented to the operator. Therefore, there is a need for a new technique that can easily identify appropriate category candidates based on a plurality of types of feature amounts for each teacher image.

本発明は上記課題に鑑みなされたものであり、各教師画像に対して複数種類の特徴量に基づく適切なカテゴリ候補を容易に特定することを目的としている。   The present invention has been made in view of the above problems, and an object thereof is to easily specify an appropriate category candidate based on a plurality of types of feature amounts for each teacher image.

請求項1に記載の発明は、画像を分類する分類器の学習に使用される教師データを検証する教師データ検証装置であって、それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、前記複数の教師画像のカテゴリを示す教師データを記憶する記憶部と、特徴量の複数種類のそれぞれに関して、各教師画像が前記複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値を取得する評価値取得部と、前記各教師画像において、前記複数のカテゴリのそれぞれに関して、特徴量の前記複数種類における評価値の代表値を求め、前記複数のカテゴリにおける複数の代表値に基づいて前記各教師画像が属すべきものと判定されるカテゴリを、カテゴリ候補として特定するカテゴリ候補特定部と、前記教師データが示すカテゴリと前記カテゴリ候補とが相違する教師画像をカテゴリ相違画像として、カテゴリ相違画像を前記カテゴリ候補と共に表示部に表示する表示制御部とを備え、前記評価値取得部が、特徴量の各種類に関して、前記複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムを生成し、前記各教師画像の特徴量を含む区間を注目区間として、前記複数のカテゴリに対する複数のヒストグラムにおける前記注目区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値を取得し、前記教師データから前記カテゴリ相違画像を取り除きつつ前記評価値取得部および前記カテゴリ候補特定部の処理が複数回繰り返され、前記カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて、前記複数の教師画像が複数のグループに分割される。 The invention according to claim 1 is a teacher data verification device for verifying teacher data used for learning of a classifier that classifies images, and a plurality of teacher images each assigned to one of a plurality of categories , And a storage unit for storing teacher data indicating categories of the plurality of teacher images, and a plurality of types of feature amounts, each representing a validity when each teacher image belongs to each of the plurality of categories. In each of the plurality of categories in the evaluation value acquisition unit that acquires an evaluation value, and for each of the plurality of categories, a representative value of the evaluation value in the plurality of types of feature values is obtained, and a plurality of representative values in the plurality of categories are obtained. A category candidate specifying unit for specifying a category determined to belong to each teacher image as a category candidate based on the teacher data; The teacher image with categories and the category candidate is different as a category difference image, and a display control unit for displaying the category difference picture image on the display unit together with the category candidates, the evaluation value acquiring unit, each of the feature With respect to the type, a histogram of the feature amount of the teacher image allocated to each of the plurality of categories is generated, and the attention is included in the plurality of histograms for the plurality of categories, with a section including the feature amount of each teacher image as the attention interval. Based on the frequency of the section, the evaluation value for each of the plurality of categories of each teacher image is acquired, and the evaluation value acquiring unit and the category candidate specifying unit are processed while removing the category difference image from the teacher data Depending on the number of times the process is repeated until it is identified as the category difference image The plurality of teacher images Ru is divided into a plurality of groups.

請求項に記載の発明は、請求項に記載の教師データ検証装置であって、前記評価値取得部が、前記複数のヒストグラムにおける前記注目区間および前記注目区間の両側に隣接する複数の区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値を取得する。 Invention of Claim 2 is the teacher data verification apparatus of Claim 1 , Comprising: The said evaluation value acquisition part is a some area adjacent to both sides of the said attention area and the said attention area in these histograms The evaluation value for each of the plurality of categories of each teacher image is acquired based on the frequency of the above.

請求項に記載の発明は、請求項またはに記載の教師データ検証装置であって、前記複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける前記注目区間の頻度が所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける前記注目区間の頻度が0である場合に、前記評価値取得部が前記評価値を取得しない。 The invention described in claim 3 is the teacher data verification apparatus according to claim 1 or 2, the plurality of histograms, the frequency of the section of interest in the histogram for one of the categories is equal to or less than a predetermined number, When the frequency of the attention section in the histogram for each of all other categories is 0, the evaluation value acquisition unit does not acquire the evaluation value.

請求項に記載の発明は、請求項1ないしのいずれかに記載の教師データ検証装置であって、前記表示制御部が、前記カテゴリ相違画像を、前記教師データが示すカテゴリおよび前記カテゴリ候補と共に前記表示部に表示する。 The invention described in claim 4 is the teacher data verification apparatus according to any one of claims 1 to 3, wherein the display control unit, before the hear categories difference picture image, category showing the teacher data and It is displayed on the display unit together with the category candidates.

請求項に記載の発明は、画像を分類する分類器の学習に使用される教師データを作成する教師データ作成装置であって、請求項1ないしのいずれかに記載の教師データ検証装置と、前記カテゴリ相違画像に対する最終的なカテゴリの入力を受け付ける入力部とを備える。 The invention according to claim 5 is a teacher data creation device for creating teacher data used for learning of a classifier that classifies images, and the teacher data verification device according to any one of claims 1 to 4 , and an input unit for accepting an input of the final categories against before asked categorical difference images.

請求項に記載の発明は、画像を分類する画像分類装置であって、請求項に記載の教師データ作成装置と、前記教師データ作成装置により作成された教師データを用いて学習が行われるとともに、画像を分類する分類器とを備える。 The invention according to claim 6 is an image classification device for classifying images, and learning is performed using the teacher data creation device according to claim 5 and the teacher data created by the teacher data creation device. And a classifier for classifying the images.

請求項に記載の発明は、画像を分類する分類器の学習に使用される教師データを検証する教師データ検証方法であって、a)それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、前記複数の教師画像のカテゴリを示す教師データを準備する工程と、b)特徴量の複数種類のそれぞれに関して、各教師画像が前記複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値を取得する工程と、c)前記各教師画像において、前記複数のカテゴリのそれぞれに関して、特徴量の前記複数種類における評価値の代表値を求める工程と、d)前記複数のカテゴリにおける複数の代表値に基づいて前記各教師画像が属すべきものと判定されるカテゴリを、カテゴリ候補として特定する工程と、e)前記教師データが示すカテゴリと前記カテゴリ候補とが相違する教師画像をカテゴリ相違画像として、カテゴリ相違画像を前記カテゴリ候補と共に表示部に表示する工程とを備え、前記b)工程において、特徴量の各種類に関して、前記複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムが生成され、前記各教師画像の特徴量を含む区間を注目区間として、前記複数のカテゴリに対する複数のヒストグラムにおける前記注目区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値が取得され、前記教師データから前記カテゴリ相違画像を取り除きつつ前記b)ないしd)工程が複数回繰り返され、前記カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて、前記複数の教師画像が複数のグループに分割される。 The invention according to claim 7 is a teacher data verification method for verifying teacher data used for learning of a classifier that classifies images, and a) a plurality of each of which is assigned to one of a plurality of categories A step of preparing teacher images and teacher data indicating the categories of the plurality of teacher images; and b) appropriateness when each teacher image belongs to each of the plurality of categories with respect to each of a plurality of types of feature values. A step of obtaining an evaluation value indicating sex; c) a step of obtaining representative values of evaluation values of the plurality of types of feature amounts for each of the plurality of categories in each of the teacher images; and d) the plurality of categories. Identifying a category to which each of the teacher images should belong as a category candidate based on a plurality of representative values in e), e) The teacher image and to categories and the category candidate is different as a category difference image, and a step of displaying a category different picture images on the display unit together with the category candidates, in the b) step, for each type of feature quantity , A histogram of the feature amount of the teacher image allocated to each of the plurality of categories is generated, and a section including the feature amount of each teacher image is set as the attention section, and the attention section of the plurality of histograms for the plurality of categories Based on the frequency, the evaluation value for each of the plurality of categories of each teacher image is acquired, and the steps b) to d) are repeated a plurality of times while removing the category difference image from the teacher data, and the category Depending on the number of times the process is repeated until the images are identified as different images, the plurality of teacher images Ru is divided into groups of a few.

請求項に記載の発明は、請求項に記載の教師データ検証方法であって、前記b)工程において、前記複数のヒストグラムにおける前記注目区間および前記注目区間の両側に隣接する複数の区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値が取得される。 The invention according to claim 8 is the teacher data verification method according to claim 7 , wherein in the step b), the attention section in the plurality of histograms and a plurality of sections adjacent to both sides of the attention section. Based on the frequency, the evaluation value for each of the plurality of categories of each teacher image is acquired.

請求項に記載の発明は、請求項またはに記載の教師データ検証方法であって、前記b)工程において、前記複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける前記注目区間の頻度が所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける前記注目区間の頻度が0である場合に、前記評価値が取得されない。 The invention according to claim 9 is the teacher data verification method according to claim 7 or 8 , wherein, in the step b), the frequency of the attention section in the histogram for one category among the plurality of histograms. The evaluation value is not acquired when the frequency is equal to or less than the predetermined number and the frequency of the attention section in the histogram for each of all other categories is zero.

請求項10に記載の発明は、請求項ないしのいずれかに記載の教師データ検証方法であって、前記e)工程において、前記カテゴリ相違画像が、前記教師データが示すカテゴリおよび前記カテゴリ候補と共に前記表示部に表示される。 The invention described in claim 10 is the teacher data verification method according to any one of claims 7 to 9, in the step e), before hear categorical difference picture image, category indicates the teacher data and It is displayed on the display unit together with the category candidates.

請求項11に記載の発明は、画像を分類する分類器の学習に使用される教師データを作成する教師データ作成方法であって、請求項ないし10のいずれかに記載の教師データ検証方法と、前記カテゴリ相違画像に対する最終的なカテゴリを決定する工程とを備える。 The invention described in claim 11 is a teacher data generation method for generating teacher data used for learning of a classifier that classifies images, and the teacher data verification method according to any one of claims 7 to 10 , and a step of determining the final category against before asked categorical difference images.

請求項12に記載の発明は、画像を分類する画像分類方法であって、請求項11に記載の教師データ作成方法により作成された教師データを用いて分類器を学習させる工程と、前記分類器により画像を分類する工程とを備える。 The invention according to claim 12 is an image classification method for classifying images, the step of learning a classifier using teacher data created by the teacher data creation method according to claim 11 , and the classifier And a step of classifying the images.

本発明によれば、各教師画像に対して複数種類の特徴量に基づく適切なカテゴリ候補を容易に特定することができる。また、カテゴリ相違画像をカテゴリ候補と共に表示部に表示することにより、信頼性の高い教師データを容易に作成することができる。   According to the present invention, it is possible to easily identify appropriate category candidates based on a plurality of types of feature amounts for each teacher image. Further, by displaying the category difference image together with the category candidates on the display unit, highly reliable teacher data can be easily created.

画像分類装置の構成を示す図である。It is a figure which shows the structure of an image classification device. 欠陥画像の分類の流れを示す図である。It is a figure which shows the flow of a classification | category of a defect image. ホストコンピュータの構成を示す図である。It is a figure which shows the structure of a host computer. ホストコンピュータの機能構成を示す図である。It is a figure which shows the function structure of a host computer. 教師データ作成部の機能構成を示す図である。It is a figure which shows the function structure of a teacher data creation part. 教師データを作成して分類器を学習させる処理の流れを示す図である。It is a figure which shows the flow of the process which produces teacher data and learns a classifier. ディスプレイに表示される複数の教師画像を示す図である。It is a figure which shows the some teacher image displayed on a display. 複数のカテゴリに対する複数のヒストグラムを示す図である。It is a figure which shows several histograms with respect to several categories. ディスプレイに表示される複数の教師画像を示す図である。It is a figure which shows the some teacher image displayed on a display. 異質さの度合いを説明するための図である。It is a figure for demonstrating the degree of heterogeneity. 複数の教師画像を示す図である。It is a figure which shows a some teacher image. 複数の教師画像を示す図である。It is a figure which shows a some teacher image.

図1は本発明の一の実施の形態に係る画像分類装置1の概略構成を示す図である。画像分類装置1では、半導体基板9(以下、単に「基板9」という。)上の欠陥を示す欠陥画像が取得され、当該欠陥画像の分類が行われる。画像分類装置1は基板9上の検査対象領域を撮像する撮像装置2、撮像装置2からの画像データに基づいて欠陥検査を行って欠陥が検出された場合に欠陥が属すべきカテゴリへと欠陥を自動分類する検査・分類装置4、並びに、画像分類装置1の全体動作を制御するとともに検査・分類装置4における欠陥の分類に利用される分類器421を生成するホストコンピュータ5を有する。基板9上に存在する欠陥の種類(カテゴリ)は、例えば、欠損、突起、断線、ショート、異物である。また、撮像装置2は基板9の製造ラインに組み込まれ、画像分類装置1はいわゆるインライン型のシステムとなっている。画像分類装置1は、欠陥検査装置に自動欠陥分類の機能を付加した装置と捉えることもできる。   FIG. 1 is a diagram showing a schematic configuration of an image classification apparatus 1 according to an embodiment of the present invention. In the image classification apparatus 1, a defect image indicating a defect on a semiconductor substrate 9 (hereinafter simply referred to as “substrate 9”) is acquired, and the defect image is classified. The image classification device 1 picks up a defect into a category to which the defect should belong when the defect is detected based on the image data from the image pickup device 2 and the image pickup device 2 that picks up the inspection target area on the substrate 9. It has an inspection / classification device 4 for automatic classification, and a host computer 5 that controls the overall operation of the image classification device 1 and generates a classifier 421 used for defect classification in the inspection / classification device 4. The types (categories) of defects present on the substrate 9 are, for example, defects, protrusions, disconnections, shorts, and foreign matters. In addition, the imaging device 2 is incorporated in the production line of the substrate 9, and the image classification device 1 is a so-called inline system. The image classification device 1 can also be regarded as a device in which a function of automatic defect classification is added to a defect inspection device.

撮像装置2は、基板9上の検査対象領域を撮像して画像データを取得する撮像部21、基板9を保持するステージ22、および、撮像部21に対してステージ22を相対的に移動するステージ駆動部23を有する。撮像部21は、照明光を出射する照明部211、基板9に照明光を導くとともに基板9からの光が入射する光学系212、および、光学系212により結像された基板9の像を電気信号に変換する撮像デバイス213を有する。ステージ駆動部23はボールねじ、ガイドレール、モータ等により構成され、ホストコンピュータ5がステージ駆動部23および撮像部21を制御することにより、基板9上の検査対象領域が撮像される。   The imaging device 2 captures an inspection target area on the substrate 9 to acquire image data, a stage 22 that holds the substrate 9, and a stage that moves the stage 22 relative to the imaging unit 21. A drive unit 23 is included. The imaging unit 21 electrically outputs an illumination unit 211 that emits illumination light, an optical system 212 that guides the illumination light to the substrate 9 and receives light from the substrate 9, and an image of the substrate 9 formed by the optical system 212. An imaging device 213 that converts the signal into a signal is included. The stage driving unit 23 includes a ball screw, a guide rail, a motor, and the like, and the inspection area on the substrate 9 is imaged by the host computer 5 controlling the stage driving unit 23 and the imaging unit 21.

検査・分類装置4は、検査対象領域の画像データを処理しつつ欠陥を検出する欠陥検出部41、および、欠陥画像を分類する自動欠陥分類部42を有する。欠陥検出部41は検査対象領域の画像データを高速に処理する専用の電気的回路を有し、撮像された画像と欠陥が存在しない参照画像との比較や画像処理により検査対象領域の欠陥検査を行う。自動欠陥分類部42は各種演算処理を行うCPUや各種情報を記憶するメモリ等により構成され、ニューラルネットワーク、決定木、判別分析等を利用する分類器421を用いて欠陥の分類(すなわち、欠陥画像の分類)を実行する。   The inspection / classification apparatus 4 includes a defect detection unit 41 that detects defects while processing image data of an inspection target area, and an automatic defect classification unit 42 that classifies defect images. The defect detection unit 41 has a dedicated electric circuit for processing image data of the inspection target area at high speed, and performs defect inspection of the inspection target area by comparing the captured image with a reference image having no defect or by image processing. Do. The automatic defect classification unit 42 includes a CPU that performs various arithmetic processes, a memory that stores various information, and the like, and classifies defects (that is, defect images) using a classifier 421 that uses a neural network, a decision tree, discriminant analysis, and the like. Classification).

図2は画像分類装置1による欠陥画像の分類の流れを示す図である。まず、図1に示す撮像装置2が基板9を撮像することにより検査・分類装置4の欠陥検出部41が画像データを取得する(ステップS11)。次に、欠陥検出部41が検査対象領域の欠陥検査を行い、欠陥が検出されると(ステップS12)、欠陥部分の画像(すなわち、欠陥画像)のデータが自動欠陥分類部42へと送信される。自動欠陥分類部42は欠陥画像の複数種類の特徴量を算出し(ステップS13)、欠陥画像の特徴量が自動欠陥分類部42の分類器421に入力されて分類結果が出力される。すなわち、分類器421により欠陥画像が複数のカテゴリのいずれかに分類される(ステップS14)。画像分類装置1では、欠陥検出部41にて欠陥が検出される毎に特徴量の算出がリアルタイムにて行われ、多数の欠陥画像の自動分類が高速に行われる。   FIG. 2 is a diagram showing a flow of defect image classification by the image classification apparatus 1. First, when the imaging device 2 shown in FIG. 1 images the substrate 9, the defect detection unit 41 of the inspection / classification device 4 acquires image data (step S11). Next, when the defect detection unit 41 performs the defect inspection of the inspection target region and a defect is detected (step S12), the image of the defective portion (that is, the defect image) is transmitted to the automatic defect classification unit 42. The The automatic defect classification unit 42 calculates a plurality of types of feature values of the defect image (step S13), and the feature values of the defect image are input to the classifier 421 of the automatic defect classification unit 42 and the classification result is output. That is, the defect image is classified into one of a plurality of categories by the classifier 421 (step S14). In the image classification device 1, the feature amount is calculated in real time every time a defect is detected by the defect detection unit 41, and automatic classification of a large number of defect images is performed at high speed.

次に、ホストコンピュータ5による分類器の学習について説明する。図3はホストコンピュータ5の構成を示す図である。ホストコンピュータ5は各種演算処理を行うCPU51、基本プログラムを記憶するROM52および各種情報を記憶するRAM53をバスラインに接続した一般的なコンピュータシステムの構成となっている。バスラインにはさらに、情報記憶を行う固定ディスク54、画像等の各種情報の表示を行う表示部であるディスプレイ55、操作者からの入力を受け付けるキーボード56aおよびマウス56b(以下、「入力部56」と総称する。)、光ディスク、磁気ディスク、光磁気ディスク等のコンピュータ読み取り可能な記録媒体8から情報の読み取りを行う読取装置57、並びに、画像分類装置1の他の構成との間で信号を送受信する通信部58が、適宜、インターフェイス(I/F)を介する等して接続される。   Next, classifier learning by the host computer 5 will be described. FIG. 3 is a diagram showing the configuration of the host computer 5. The host computer 5 has a general computer system configuration in which a CPU 51 that performs various arithmetic processes, a ROM 52 that stores basic programs, and a RAM 53 that stores various information are connected to a bus line. The bus line further includes a fixed disk 54 that stores information, a display 55 that is a display unit that displays various types of information such as images, a keyboard 56a and a mouse 56b that accept input from an operator (hereinafter referred to as "input unit 56"). A signal is transmitted / received between the reading device 57 for reading information from the computer-readable recording medium 8 such as an optical disk, a magnetic disk, a magneto-optical disk, and the other configuration of the image classification device 1. The communication unit 58 to be connected is appropriately connected through an interface (I / F) or the like.

ホストコンピュータ5には、事前に読取装置57を介して記録媒体8からプログラム80が読み出されて固定ディスク54に記憶され、さらに、プログラム80はRAM53にコピーされるとともにCPU51によりRAM53内のプログラムに従って演算処理が実行される。   In the host computer 5, the program 80 is read in advance from the recording medium 8 via the reading device 57 and stored in the fixed disk 54. Further, the program 80 is copied to the RAM 53 and the CPU 51 follows the program in the RAM 53. Arithmetic processing is executed.

図4はホストコンピュータ5のCPU51、ROM52、RAM53、固定ディスク54等により実現される、分類器を学習させるための機能構成を示すブロック図であり、検査・分類装置4も示している。ホストコンピュータ5は分類器の学習に使用される教師データを作成する教師データ作成部61、および、教師データを用いて分類器を学習させる学習部62を有する。   FIG. 4 is a block diagram showing a functional configuration for learning the classifier realized by the CPU 51, ROM 52, RAM 53, fixed disk 54, etc. of the host computer 5, and also shows the inspection / classification device 4. The host computer 5 includes a teacher data creating unit 61 that creates teacher data used for learning the classifier, and a learning unit 62 that learns the classifier using the teacher data.

教師データは、欠陥画像である教師画像のデータ、教師画像の特徴量、および、欠陥のカテゴリを示す情報である教示信号を含み、教師画像の特徴量として、例えば、欠陥の面積、明度平均、周囲長、扁平度、欠陥を楕円に近似した場合の長軸の傾き等が採用される。学習部62では、教師データから読み出された教師画像の特徴量がホストコンピュータ5内の分類器(図示省略)に入力され、分類器の出力が欠陥のカテゴリを示す教示信号と同じとなるように学習が行われ、学習結果、すなわち、学習後の分類器421(正確には、分類器421の構造や変数の値を示す情報)が自動欠陥分類部42へと転送される。   The teacher data includes a teacher image data that is a defect image, a feature amount of the teacher image, and a teaching signal that is information indicating the category of the defect. As the feature amount of the teacher image, for example, the defect area, the brightness average, Peripheral length, flatness, inclination of major axis when defect is approximated to ellipse, and the like are employed. In the learning unit 62, the feature amount of the teacher image read from the teacher data is input to a classifier (not shown) in the host computer 5, and the output of the classifier is the same as the teaching signal indicating the defect category. Learning is performed, and the learning result, that is, the learned classifier 421 (more precisely, information indicating the structure of the classifier 421 and the value of the variable) is transferred to the automatic defect classification unit 42.

図5はホストコンピュータ5の教師データ作成部61の機能構成を示すブロック図であり、学習部62も示している。教師データ作成部61は、データ演算部610、ディスプレイ55および入力部56を有する。データ演算部610は、評価値取得部611、カテゴリ候補特定部612、表示制御部613、記憶部614および特徴量算出部615を有する。データ演算部610の処理の詳細については後述する。なお、データ演算部610および学習部62の機能は専用の電気回路により構築されてもよく、部分的に専用の電気回路が利用されてもよい。   FIG. 5 is a block diagram showing a functional configuration of the teacher data creation unit 61 of the host computer 5, and also shows a learning unit 62. The teacher data creation unit 61 includes a data calculation unit 610, a display 55, and an input unit 56. The data calculation unit 610 includes an evaluation value acquisition unit 611, a category candidate identification unit 612, a display control unit 613, a storage unit 614, and a feature amount calculation unit 615. Details of the processing of the data calculation unit 610 will be described later. Note that the functions of the data calculation unit 610 and the learning unit 62 may be constructed by a dedicated electric circuit, or a dedicated electric circuit may be partially used.

図6は、教師データを作成して分類器を学習させる処理の流れを示す図である。教師データ作成部61では、まず、教師データ作成用の欠陥画像である多数の教師画像(例えば、数千個の教師画像)のデータが図5に示す教師データ作成部61の記憶部614に記憶されて準備される(ステップS21)。なお、教師画像は図1に示す撮像装置2および欠陥検出部41を利用して取得されてもよいし、別途用意されてもよい。   FIG. 6 is a diagram showing a flow of processing for creating teacher data and learning a classifier. In the teacher data creation unit 61, first, data of a large number of teacher images (for example, thousands of teacher images), which are defect images for teacher data creation, are stored in the storage unit 614 of the teacher data creation unit 61 shown in FIG. To be prepared (step S21). The teacher image may be acquired using the imaging device 2 and the defect detection unit 41 illustrated in FIG. 1 or may be separately prepared.

特徴量算出部615では、全ての教師画像の複数種類の(例えば、100〜200種類の)特徴量が算出される(ステップS22)。算出された特徴量は記憶部614に記憶される。また、ディスプレイ55では、各教師画像が表示されるとともに当該教師画像のカテゴリの入力を促す表示が行われ、入力部56において操作者によるカテゴリの入力が受け付けられる(ステップS23)。以下の説明では、ステップS23の処理において各教師画像に対して操作者により入力されたカテゴリを「初期カテゴリ」という。なお、各教師画像の初期カテゴリは、所定のアルゴリズムにより自動的に決定されてもよい。   The feature amount calculation unit 615 calculates a plurality of types (for example, 100 to 200 types) of feature amounts of all the teacher images (step S22). The calculated feature amount is stored in the storage unit 614. Further, each teacher image is displayed on the display 55 and a display prompting the user to input a category of the teacher image is displayed, and the input of the category by the operator is accepted by the input unit 56 (step S23). In the following description, the category input by the operator for each teacher image in the process of step S23 is referred to as “initial category”. Note that the initial category of each teacher image may be automatically determined by a predetermined algorithm.

図7は、ディスプレイ55に表示される複数の教師画像を例示する図である。各教師画像71a,71b,71c,71dの下方にはカテゴリ表示領域72が設けられており、図7の教師画像71a〜71dでは、初期カテゴリ(の名称)がそれぞれ「大欠損」、「中欠損」、「中突起」、「中突起」と記されている。このようにして、それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、当該複数の教師画像のカテゴリを示す教師データ710が準備されて記憶部614にて記憶される。本実施の形態では、各教師画像における複数の特徴量も教師データ710に含まれる。また、複数種類のカテゴリのそれぞれに対して番号が割り当てられており、各教師画像に対する初期カテゴリの決定により、当該教師画像に関連付けられたカテゴリ変数の値が初期カテゴリの番号に変更される。   FIG. 7 is a diagram illustrating a plurality of teacher images displayed on the display 55. A category display area 72 is provided below each of the teacher images 71a, 71b, 71c, and 71d. In the teacher images 71a to 71d in FIG. ”,“ Middle protrusion ”, and“ middle protrusion ”. In this way, a plurality of teacher images each assigned to one of a plurality of categories and teacher data 710 indicating the categories of the plurality of teacher images are prepared and stored in the storage unit 614. In the present embodiment, a plurality of feature amounts in each teacher image is also included in the teacher data 710. Also, a number is assigned to each of a plurality of types of categories, and the value of the categorical variable associated with the teacher image is changed to the number of the initial category by determining the initial category for each teacher image.

教師データ710が準備されると、評価値取得部611では、特徴量の各種類に関して、複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムが生成される。図8は、特徴量の一の種類における複数のカテゴリに対する複数のヒストグラムを示す図である。図8の例では、5348個の教師画像が、番号1ないし4の4種類のカテゴリのいずれかに割り振られており、番号1のカテゴリが1578個の教師画像を含み、番号2のカテゴリが2849個の教師画像を含み、番号3のカテゴリが688個の教師画像を含み、番号4のカテゴリが133個の教師画像を含む。また、図8では、各教師画像の特徴量を正規化した後に100区間に量子化し、各区間における頻度を示している。図8では、番号1ないし4のカテゴリのヒストグラムに符号H1,H2,H3,H4をそれぞれ付している。なお、評価値取得部611における特徴量のヒストグラムは度数分布を示すものであればよく、度数分布を示す表も実質的にヒストグラムと等価である。   When the teacher data 710 is prepared, the evaluation value acquisition unit 611 generates a histogram of the feature amount of the teacher image assigned to each of a plurality of categories for each type of feature amount. FIG. 8 is a diagram illustrating a plurality of histograms for a plurality of categories in one type of feature amount. In the example of FIG. 8, 5348 teacher images are assigned to any of the four types of categories 1 to 4, the number 1 category includes 1578 teacher images, and the number 2 category is 2849. The number 3 category includes 688 teacher images, and the number 4 category includes 133 teacher images. Further, in FIG. 8, the feature amount of each teacher image is normalized and then quantized into 100 sections, and the frequency in each section is shown. In FIG. 8, symbols H1, H2, H3, and H4 are attached to the histograms of categories numbered 1 to 4, respectively. It should be noted that the feature value histogram in the evaluation value acquisition unit 611 may be one that shows a frequency distribution, and the table showing the frequency distribution is substantially equivalent to the histogram.

評価値取得部611では、各教師画像が複数のカテゴリのそれぞれに属するとした場合の妥当性(確率と捉えることもできる。)を示す評価値が特徴量の種類毎に取得される(ステップS24)。例えば、ある教師画像を注目教師画像とし、特徴量の一の種類に関して注目教師画像の特徴量を含む区間を注目区間として、注目区間に番号1のカテゴリの教師画像がx個、番号2のカテゴリの教師画像がx個、番号3のカテゴリの教師画像がx個、番号4のカテゴリの教師画像がx個存在するものとする(すなわち、ヒストグラムH1,H2,H3,H4における注目区間の頻度がそれぞれx個、x個、x個、x個である。)。なお、仮に注目教師画像の初期カテゴリが番号2のカテゴリである場合には、x個のうちの1個が注目教師画像である。この場合に、注目教師画像が番号n(ここでは、nは1ないし4のいずれか)のカテゴリに属するとした場合の妥当性を示す評価値Pは((x/(x+x+x+x))×100)[%]として求められる。 The evaluation value acquisition unit 611 acquires an evaluation value indicating the validity (may be regarded as a probability) when each teacher image belongs to each of a plurality of categories for each type of feature amount (step S24). ). For example, a certain teacher image is an attention teacher image, an interval including the feature amount of the attention teacher image regarding one type of feature amount is an attention interval, and there are x 1 teacher images of category No. 1 in the attention interval and number 2. category teacher image are two x, a teacher image of the number 3 category 3 x, a teacher image of the number 4 category is to be present four x (i.e., interest in the histogram H1, H2, H3, H4 1 x frequency intervals, respectively, two x, 3 pieces x, a four x.). It should be noted that, even if in the case where the initial category of the attention the teacher image is the number 2 categories, one of the two x is the target teacher image. In this case, the evaluation value P n indicating the validity when the teacher image of interest belongs to the category of number n (here, n is any one of 1 to 4) is ((x n / (x 1 + x 2 + X 3 + x 4 )) × 100) [%].

具体的に、注目教師画像の特徴量が図8中にて符号Aを付す区間に含まれ、ヒストグラムH1,H2,H3における注目区間Aの頻度がそれぞれa個、a個、a個である(ヒストグラムH4における頻度は0である。)場合には、注目教師画像が番号1のカテゴリに属するとした場合の妥当性を示す評価値Pは((a/(a+a+a))×100)[%]である。また、注目教師画像が番号2のカテゴリに属するとした場合の妥当性を示す評価値Pは((a/(a+a+a))×100)[%]であり、番号3のカテゴリに属するとした場合の妥当性を示す評価値Pは((a/(a+a+a))×100)[%]である。なお、注目教師画像が番号4のカテゴリに属するとした場合の妥当性を示す評価値Pは0%である。なお、図8では、黒い点に付す符号により、当該点の頻度を示している。 Specifically, the principal feature of the teacher image is included in the section denoted by a reference sign A in in FIG. 8, the histogram H1, H2, frequently each one a of the target interval A in H3, 2 pieces a, 3 pieces a (The frequency in the histogram H4 is 0), the evaluation value P 1 indicating the validity when the teacher image of interest belongs to the category of number 1 is ((a 1 / (a 1 + a 2 + A 3 )) × 100) [%]. Further, the evaluation value P 2 indicating the validity when the attention teacher image belongs to the category of number 2 is ((a 2 / (a 1 + a 2 + a 3 )) × 100) [%], and the number 3 The evaluation value P 3 indicating the validity when it belongs to the category is ((a 3 / (a 1 + a 2 + a 3 )) × 100) [%]. Note that the evaluation value P4 indicating the validity when the teacher image of interest belongs to the category of number 4 is 0%. In addition, in FIG. 8, the frequency of the said point is shown with the code | symbol attached | subjected to a black point.

また、注目教師画像の特徴量が図8中にて符号Bを付す区間に含まれ、ヒストグラムH1,H2,H3における注目区間Bの頻度がそれぞれb個、b個、b個である(ヒストグラムH4における頻度は0である。)場合には、注目教師画像が番号1のカテゴリに属するとした場合の妥当性を示す評価値Pは((b/(b+b+b))×100)[%]である。また、注目教師画像が番号2のカテゴリに属するとした場合の妥当性を示す評価値Pは((b/(b+b+b))×100)[%]であり、番号3のカテゴリに属するとした場合の妥当性を示す評価値Pは((b/(b+b+b))×100)[%]である。なお、注目教師画像が番号4のカテゴリに属するとした場合の妥当性を示す評価値Pは0%である。 Further, the feature quantity of the target teacher image is included in the section denoted by a reference sign B in in Fig. 8, the histogram H1, H2, frequently one b each section of interest B in H3, 2 pieces b, a three b (The frequency in the histogram H4 is 0.), the evaluation value P 1 indicating the validity when the teacher image of interest belongs to the category of number 1 is ((b 1 / (b 1 + b 2 + b 3 )) × 100) [%]. In addition, the evaluation value P 2 indicating the validity when the teacher image of interest belongs to the category of number 2 is ((b 2 / (b 1 + b 2 + b 3 )) × 100) [%], and the number 3 The evaluation value P 3 indicating the validity in the case of belonging to the category is ((b 3 / (b 1 + b 2 + b 3 )) × 100) [%]. Note that the evaluation value P4 indicating the validity when the teacher image of interest belongs to the category of number 4 is 0%.

さらに、注目教師画像の特徴量が図8中にて符号Cを付す区間に含まれ、ヒストグラムH3,H4における注目区間Cの頻度がそれぞれc個、c個である(ヒストグラムH1,H2における頻度は0である。)場合には、注目教師画像が番号3のカテゴリに属するとした場合の妥当性を示す評価値Pは((c/(c+c))×100)[%]である。また、注目教師画像が番号4のカテゴリに属するとした場合の妥当性を示す評価値Pは((c/(c+c))×100)[%]である。なお、注目教師画像が番号1のカテゴリに属するとした場合の妥当性を示す評価値P、および、番号2のカテゴリに属するとした場合の妥当性を示す評価値Pは共に0%である。 Further, the feature quantity of the attention teacher image is included in the section denoted by reference character C in FIG. 8, and the frequencies of the attention section C in the histograms H3 and H4 are c 3 and c 4 respectively (in the histograms H1 and H2). The frequency is 0.) In this case, the evaluation value P 3 indicating the validity when the teacher image of interest belongs to the category of number 3 is ((c 3 / (c 3 + c 4 )) × 100) [ %]. Further, the evaluation value P 4 indicating the validity when the focused teacher image belongs to the category of number 4 is ((c 4 / (c 3 + c 4 )) × 100) [%]. Incidentally, the subject supervisor image evaluation value indicating the validity of the case of as belonging to the category number 1 P 1, and the evaluation value P 2 that indicates the validity in the case of as belonging to the No. 2 categories are both 0% is there.

以上のように、評価値取得部611では、各教師画像の特徴量を含む区間を注目区間として、複数のカテゴリに対する複数のヒストグラムにおける注目区間の頻度に基づいて、当該教師画像の複数のカテゴリのそれぞれに対する評価値が取得される。これにより、各教師画像において、特徴量の一の種類に関して、4種類のカテゴリにおける4個の評価値の組合せ(例えば、「番号1のカテゴリが25%、番号2のカテゴリが72%、番号3のカテゴリが3%、番号4のカテゴリが0%」のような組合せ)が評価値群として取得され、特徴量の種類がN個ある場合には、原則としてN個の評価値群が取得される。上記処理は全ての教師画像に対して行われ、全ての教師画像において(原則として)N個の評価値群が取得される。上記処理では、ヒストグラムが多峰性を有している場合等であっても、当該ヒストグラムの凹凸に応じた評価値を取得することが可能となる。なお、各教師画像が複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値は上記以外の演算にて求められてもよい。   As described above, the evaluation value acquisition unit 611 uses a section including the feature amount of each teacher image as an attention section, and based on the frequency of the attention section in a plurality of histograms for a plurality of categories, Evaluation values for each are obtained. Thus, in each teacher image, for one type of feature value, a combination of four evaluation values in four categories (for example, “number 1 category is 25%, number 2 category is 72%, number 3 is Is obtained as an evaluation value group, and in the case where there are N types of feature values, in principle, N evaluation value groups are acquired. The The above process is performed for all teacher images, and (in principle) N evaluation value groups are acquired for all teacher images. In the above processing, it is possible to acquire an evaluation value corresponding to the unevenness of the histogram even when the histogram has multimodality. Note that an evaluation value indicating validity when each teacher image belongs to each of a plurality of categories may be obtained by a calculation other than the above.

一方、例えば、図8の横軸において右側の領域では、番号4のカテゴリのヒストグラムH4だけが分布する。この場合、注目区間におけるヒストグラムH4の頻度が1または2のように極めて低い場合でも、番号4のカテゴリの評価値は必ず100%となり、後述の処理にて求められる番号4のカテゴリの評価値の代表値を不当に押し上げることになる。したがって、特徴量の一の種類に関する複数のカテゴリの複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける注目区間の頻度が所定数(例えば、1または2)以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける注目区間の頻度が0である場合には、特徴量の当該種類については評価値が取得されない。   On the other hand, for example, in the region on the right side of the horizontal axis in FIG. 8, only the histogram H4 of category No. 4 is distributed. In this case, even when the frequency of the histogram H4 in the attention interval is extremely low as 1 or 2, the evaluation value of the category of number 4 is always 100%, and the evaluation value of the category of number 4 obtained in the processing described later is This will unduly push up the representative value. Therefore, among the plurality of histograms of a plurality of categories related to one type of feature amount, the frequency of the attention section in the histogram for one category is equal to or less than a predetermined number (for example, 1 or 2), and each of all other categories When the frequency of the attention section in the histogram is 0, no evaluation value is acquired for the type of feature amount.

続いて、カテゴリ候補特定部612では、各教師画像において、各カテゴリに関して、特徴量の複数種類(正確には、評価値が取得された全ての種類)における評価値の代表値が求められる(ステップS25)。ここで、評価値の代表値とは、当該評価値が分布する範囲の中央近傍を示す値であり、平均値や中央値等である。各教師画像における各カテゴリの評価値の代表値は、当該教師画像が当該カテゴリに属するとした場合における、複数(全て)の特徴量を考慮した妥当性を示す値となる。   Subsequently, the category candidate specifying unit 612 obtains representative values of evaluation values for a plurality of types of feature values (more precisely, all types for which evaluation values have been acquired) for each category in each teacher image (steps). S25). Here, the representative value of the evaluation value is a value indicating the vicinity of the center of the range in which the evaluation value is distributed, such as an average value or a median value. The representative value of the evaluation value of each category in each teacher image is a value indicating validity in consideration of a plurality (all) of feature amounts when the teacher image belongs to the category.

各教師画像に対して複数のカテゴリにおける複数の代表値が求められると、当該複数の代表値に基づいて当該教師画像が属すべきものと判定されるカテゴリがカテゴリ候補として特定される(ステップS26)。具体的には、各教師画像において、複数の代表値のうちの最大値が得られたカテゴリがカテゴリ候補として特定される。ただし、当該最大値が所定の閾値(例えば、50%)未満である場合には、当該教師画像に対して「分類不可」がカテゴリ候補として付与されることが好ましい。   When a plurality of representative values in a plurality of categories are obtained for each teacher image, a category determined to belong to the teacher image based on the plurality of representative values is specified as a category candidate (step S26). . Specifically, in each teacher image, a category in which the maximum value among a plurality of representative values is obtained is specified as a category candidate. However, when the maximum value is less than a predetermined threshold (for example, 50%), it is preferable that “not classified” is given as a category candidate to the teacher image.

表示制御部613では、教師データ710が示す初期カテゴリとカテゴリ候補とが相違する教師画像をカテゴリ相違画像として、複数のカテゴリ相違画像がディスプレイ55に表示される(ステップS27)。図9は、ディスプレイ55に表示される複数の教師画像を例示する図であり、本実施の形態では、カテゴリ相違画像71a,71d以外の教師画像71b,71cもディスプレイ55に表示される。図9の教師画像71a〜71dに対するカテゴリ表示領域72では、カテゴリ候補(の名称)がそれぞれ「分類不可」、「中欠損」、「中突起」、「分類不可」と記されている。また、カテゴリ表示領域72では、初期カテゴリおよびカテゴリ候補の双方が表示される。さらに、カテゴリ相違画像71a,71dに対するカテゴリ表示領域72の背景色が、カテゴリ相違画像ではない他の教師画像71b,71cに対するカテゴリ表示領域72の背景色と相違しており、カテゴリ相違画像71a,71dが強調される。   In the display control unit 613, a plurality of category-difference images are displayed on the display 55 using a teacher image in which the initial category indicated by the teacher data 710 is different from the category candidate as a category-difference image (step S27). FIG. 9 is a diagram illustrating a plurality of teacher images displayed on the display 55. In the present embodiment, teacher images 71b and 71c other than the category difference images 71a and 71d are also displayed on the display 55. In the category display area 72 for the teacher images 71a to 71d in FIG. 9, the category candidates (names thereof) are written as “Classification not possible”, “Medium defect”, “Medium protrusion”, and “Classification not possible”, respectively. In the category display area 72, both initial categories and category candidates are displayed. Furthermore, the background color of the category display area 72 for the category difference images 71a and 71d is different from the background color of the category display area 72 for the other teacher images 71b and 71c that are not category difference images, and the category difference images 71a and 71d. Is emphasized.

続いて、操作者において、各カテゴリ相違画像に対する初期カテゴリおよびカテゴリ候補を考慮しつつ当該カテゴリ相違画像を参照することにより最終的なカテゴリが決定される(ステップS28)。そして、入力部56において操作者からの最終的なカテゴリの入力が受け付けられ、当該カテゴリ相違画像である教師画像に関連付けられるカテゴリ(カテゴリ変数の値)が変更または維持される。このようにして、教師データ710が更新される。もちろん、カテゴリ相違画像以外の教師画像に対する最終的なカテゴリの入力が行われてもよいが、初期カテゴリおよびカテゴリ候補が一致する教師画像については、現在のカテゴリ(初期カテゴリ)が維持されることが好ましい。   Subsequently, the operator determines the final category by referring to the category difference image while considering the initial category and the category candidate for each category difference image (step S28). Then, the input of the final category from the operator is accepted by the input unit 56, and the category (value of the categorical variable) associated with the teacher image that is the category difference image is changed or maintained. In this way, the teacher data 710 is updated. Of course, a final category may be input for a teacher image other than the category difference image, but the current category (initial category) may be maintained for a teacher image in which the initial category and the category candidate match. preferable.

各教師画像の最終的なカテゴリが決定されると、全ての教師画像のデータ、並びに、これらの特徴量およびカテゴリの情報を含む更新後の教師データ710が記憶部614から学習部62に転送され、学習部62にて教師データ710を用いて分類器の学習が行われる(ステップS29)。すなわち、分類器(図4参照)を構成する変数の値が決定されたり、構造が決定されて分類器421が生成される。これにより、教師データを作成して分類器を学習させる図6の処理が完了する。   When the final category of each teacher image is determined, all the teacher image data and updated teacher data 710 including information on the feature amount and the category are transferred from the storage unit 614 to the learning unit 62. The learning unit 62 learns the classifier using the teacher data 710 (step S29). That is, the values of variables constituting the classifier (see FIG. 4) are determined, and the structure is determined to generate the classifier 421. Thereby, the process of FIG. 6 for creating the teacher data and learning the classifier is completed.

ここで、図6の処理では、各カテゴリ相違画像に対して、特徴量の全ての種類を勘案した上での妥当性が高いカテゴリ候補が提示される。したがって、最終的なカテゴリが決定された教師データは、特徴量空間において矛盾したカテゴリに関連付けられる教師画像を含みにくくなる。すなわち、教師データの信頼性が向上する。よって、このような教師データを用いた学習結果(分類器)は高い分類性能を有することが期待できる。   Here, in the process of FIG. 6, category candidates with high validity are presented for each category-difference image in consideration of all types of feature values. Therefore, the teacher data for which the final category has been determined is less likely to include teacher images associated with inconsistent categories in the feature amount space. That is, the reliability of teacher data is improved. Therefore, a learning result (classifier) using such teacher data can be expected to have high classification performance.

なお、元の教師データからカテゴリ相違画像を取り除きつつステップS24〜S26の処理を複数回繰り返す後述の処理を行うと、初期カテゴリとしてあるカテゴリに割り振られた全ての教師画像を、カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて複数のグループに分割することができる。各グループは、当該カテゴリに対する異質さの度合いがおよそ等しい教師画像の集合と捉えることができ、複数のグループでは異質さの度合いが互いに相違する。図10では、異質さの度合いが相違する複数のグループを抽象的に示しており、例えば、1回目の処理にてカテゴリ相違画像として特定される教師画像は最も外側の環状領域Z1に含まれる「異質なもの」と捉えられる。2ないし4回目の処理にてカテゴリ相違画像として特定される教師画像は、異質さの度合いが漸次低下する環状領域Z2,Z3,Z4にそれぞれ含まれる。4回目の処理でもカテゴリ相違画像として特定されない教師画像は中央の円形領域Z0に含まれ、当該カテゴリの典型的な教師画像として捉えられる。   In addition, when the process described later is repeated a plurality of times while removing the category difference image from the original teacher data, all the teacher images assigned to a certain category as the initial category are specified as the category difference image. It can be divided into a plurality of groups according to the number of times the process is repeated. Each group can be regarded as a collection of teacher images having approximately the same degree of heterogeneity for the category, and the plurality of groups have different degrees of heterogeneity. FIG. 10 abstractly shows a plurality of groups having different degrees of heterogeneity. For example, the teacher image specified as the category difference image in the first process is included in the outermost annular region Z1. It is perceived as “a heterogeneous thing”. The teacher images specified as the category difference images in the second to fourth processes are included in the annular regions Z2, Z3, and Z4 where the degree of heterogeneity gradually decreases. A teacher image that is not specified as a category-difference image in the fourth process is included in the central circular area Z0, and is captured as a typical teacher image of the category.

次に、カテゴリ候補を特定する上記処理の優位性について説明する。画像分類装置1では、図6の処理において元の教師データからカテゴリ相違画像を取り除きつつステップS24〜S26の処理を複数回繰り返すことが可能であり、ここでは、教師データからカテゴリ相違画像を取り除きつつステップS24〜S26の処理を4回繰り返した場合における結果(以下、「本処理例における結果」という。)を、比較例の処理における結果と比較する。ここで、比較例の処理は、特開2010−91401号公報(特許文献1)の手法と同様のものであり、各カテゴリに属する複数の教師画像の各種類の特徴量の分散に基づいて、当該種類に対して特徴量の代表値を含む特徴量範囲が設定され、各教師画像の一の種類の特徴量を当該種類の特徴量範囲に含むカテゴリに投票を行う処理が特徴量の全ての種類について行われる。そして、複数のカテゴリのうち得票数が最も多いカテゴリがカテゴリ候補とされる。なお、得票数が最も多いカテゴリと得票数が2番目に多いカテゴリとの得票数の差が所定値以下である場合、このような教師画像は不適切な教師画像と判定される。   Next, the superiority of the above process for specifying category candidates will be described. The image classification apparatus 1 can repeat the processing of steps S24 to S26 a plurality of times while removing the category difference image from the original teacher data in the process of FIG. 6, and here, while removing the category difference image from the teacher data. A result obtained when the processes in steps S24 to S26 are repeated four times (hereinafter, referred to as “result in this process example”) is compared with a result in the process of the comparative example. Here, the processing of the comparative example is the same as the method of Japanese Patent Application Laid-Open No. 2010-91401 (Patent Document 1), and based on the distribution of the feature amounts of each type of a plurality of teacher images belonging to each category, A feature amount range including a representative value of the feature amount is set for the type, and the process of voting for a category including one type of feature amount of each teacher image in the feature amount range of the type Done about types. The category having the largest number of votes among a plurality of categories is set as a category candidate. When the difference in the number of votes between the category with the largest number of votes and the category with the second largest number of votes is equal to or less than a predetermined value, such a teacher image is determined to be an inappropriate teacher image.

図11は本処理例における結果を示す図であり、図12は比較例における結果を示す図である。図11および図12では、同じ複数の教師画像71a〜71dをカテゴリ候補と共に示している。また、図11および図12のカテゴリ相違画像に対するカテゴリ表示領域72では、カテゴリ相違画像として特定されるまでの処理の繰り返し回数が多いほど狭い幅の平行斜線を付している(実際には、カテゴリ表示領域72の背景色が相違する。)。実際には、本処理例における結果では、図11に示す教師画像71a,71dはステップS24〜S26の1回目の処理にてカテゴリ相違画像として特定され、教師画像71cはステップS24〜S26の4回目の処理にてカテゴリ相違画像として特定され、教師画像71bは1ないし4回目のいずれの処理においてもカテゴリ相違画像として特定されていない(すなわち、初期カテゴリが正しい。)。また、比較例における結果では、図12に示す教師画像71bは1回目の比較例の処理にてカテゴリ相違画像として特定され、教師画像71cは2回目の比較例の処理にてカテゴリ相違画像として特定され、教師画像71a,71dは1ないし4回目のいずれの比較例の処理においてもカテゴリ相違画像として特定されていない。   FIG. 11 is a diagram showing a result in this processing example, and FIG. 12 is a diagram showing a result in a comparative example. 11 and 12, the same plurality of teacher images 71a to 71d are shown together with category candidates. In addition, in the category display area 72 for the category difference image shown in FIGS. 11 and 12, a parallel oblique line with a narrower width is added as the number of repetitions of the process until the category difference image is specified (actually, the category display area 72 is displayed). The background color of the display area 72 is different.) Actually, in the result of the present processing example, the teacher images 71a and 71d shown in FIG. 11 are identified as category difference images in the first processing of steps S24 to S26, and the teacher image 71c is the fourth time of steps S24 to S26. In this process, the teacher image 71b is not specified as a category difference image in any of the first to fourth processes (that is, the initial category is correct). In the result of the comparative example, the teacher image 71b shown in FIG. 12 is specified as a category difference image in the first comparative example process, and the teacher image 71c is specified as a category difference image in the second comparative example process. The teacher images 71a and 71d are not specified as category difference images in any of the first to fourth comparative examples.

比較例の処理では、図12に示すように、パターンの断線を示す教師画像71aに対して初期カテゴリと同様に、「大欠損」がカテゴリ候補として決定される。すなわち、特徴量空間では大きく相違すると考えられる「大欠損」および「断線」を共に「大欠損」として取り扱っている点について何も指摘されていない。これに対し、本処理例では、図11に示すように、パターンの断線を示す教師画像71aに対して初期カテゴリの「大欠損」とは相違する「分類不可」がカテゴリ候補として決定され、「大欠損」および「断線」の混在が指摘されている。また、本処理例では、教師画像71dに対して初期カテゴリの「中突起」とは相違する「分類不可」がカテゴリ候補として決定され、教師画像71dが「中突起」または「大突起」のいずれであるかが紛らわしいことが指摘されている。以上より、本処理例における結果が、比較例における結果よりも人間の感覚に沿ったものであると捉えることができる。   In the process of the comparative example, as shown in FIG. 12, “large deficit” is determined as a category candidate in the same manner as the initial category with respect to the teacher image 71a indicating the pattern disconnection. That is, nothing is pointed out that both “large defect” and “disconnection”, which are considered to be greatly different in the feature space, are treated as “large defect”. In contrast, in the present processing example, as shown in FIG. 11, “not classified” that is different from the initial category “large deficit” is determined as a category candidate for the teacher image 71a indicating the disconnection of the pattern. It has been pointed out that a large defect and a disconnection are mixed. Further, in this processing example, “not classified” that is different from the initial category “medium protrusion” is determined as the category candidate for the teacher image 71d, and the teacher image 71d is either “medium protrusion” or “large protrusion”. It is pointed out that this is confusing. From the above, it can be understood that the result in this processing example is more in line with the human sense than the result in the comparative example.

以上に説明したように、画像分類装置1では、複数の教師画像、および、複数の教師画像のカテゴリを示す教師データが記憶部614にて記憶され、特徴量の複数種類のそれぞれに関して、各教師画像が複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値が評価値取得部611にて取得される。そして、カテゴリ候補特定部612では、各教師画像において、特徴量の複数種類における評価値の代表値がカテゴリ毎に求められ、さらに、複数のカテゴリにおける複数の代表値に基づいて各教師画像が属すべきものと判定されるカテゴリがカテゴリ候補として特定される。これにより、各教師画像に対して複数種類(全種類)の特徴量に基づく適切なカテゴリ候補を、簡単な演算で、容易に特定することができる。   As described above, in the image classification device 1, a plurality of teacher images and teacher data indicating categories of a plurality of teacher images are stored in the storage unit 614, and each teacher is associated with a plurality of types of feature values. The evaluation value acquisition unit 611 acquires an evaluation value indicating validity when the image belongs to each of a plurality of categories. Then, the category candidate specifying unit 612 obtains, for each teacher image, representative values of evaluation values for a plurality of types of feature amounts for each category, and further, each teacher image belongs based on a plurality of representative values in a plurality of categories. A category determined to be a power is specified as a category candidate. Thereby, it is possible to easily identify appropriate category candidates based on a plurality of types (all types) of feature amounts for each teacher image by a simple calculation.

また、初期カテゴリとカテゴリ候補とが相違する教師画像であるカテゴリ相違画像が、表示制御部613によりカテゴリ候補と共にディスプレイ55に表示される。そして、操作者がディスプレイ55上のカテゴリ相違画像およびカテゴリ候補を参照して、最終的なカテゴリの入力を行うことにより、信頼性の高い教師データを容易に作成することができる。その結果、画像分類装置1では、当該教師データを用いて学習が行われる分類器421を利用して、欠陥画像を精度よく分類することができる。   Also, a category difference image, which is a teacher image in which the initial category and the category candidate are different, is displayed on the display 55 together with the category candidate by the display control unit 613. The operator can easily create highly reliable teacher data by referring to the category difference image and the category candidate on the display 55 and inputting the final category. As a result, the image classification device 1 can classify defect images with high accuracy using the classifier 421 that performs learning using the teacher data.

また、各カテゴリ相違画像に対して、初期カテゴリおよびカテゴリ候補の双方を並べてディスプレイ55に表示することにより、操作者がカテゴリ相違画像の解釈を容易に行うことが可能となる。さらに、画像分類装置1では、特徴量の各種類における複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける注目区間の頻度が(1以上)所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける注目区間の頻度が0である場合には、評価値取得部611において特徴量の当該種類の評価値が取得されない。これにより、分散分析(いわゆる、ANOVA(analysis of variance))等により不必要な特徴量の種類を排除する処理を行うことなく、評価値の代表値を不当に押し上げる不適切な特徴量の種類(の評価値)を排除することができる。   Further, by displaying both the initial category and the category candidate side by side on the display 55 for each category difference image, the operator can easily interpret the category difference image. Furthermore, in the image classification device 1, the frequency of the attention section in the histogram for one category is (1 or more) a predetermined number or less among the plurality of histograms for each type of feature amount, and the histogram for each of all other categories. When the frequency of the section of interest in is 0, the evaluation value acquisition unit 611 does not acquire the type of evaluation value of the feature amount. As a result, the type of inappropriate feature quantity that unreasonably pushes up the representative value of the evaluation value without performing a process of eliminating the type of unnecessary feature quantity by analysis of variance (so-called ANOVA (analysis of variance)) or the like ( Evaluation value) can be eliminated.

ところで、教師画像の個数が少ない場合には、多くの教師画像がいずれかの区間にて孤立して存在し(特徴量空間において孤立した状態となり)、図8の番号4のカテゴリのヒストグラムH4のように、大部分の区間において頻度が低く、平坦な分布を示す。このような場合には、番号nのカテゴリのヒストグラムにおいて、注目教師画像における注目区間の頻度のみならず、当該注目区間の両側に隣接する複数の区間における頻度も加えた値をxとして、評価値Pが((x/(x+x+x+x))×100)[%]により求められることが好ましい。このように、評価値取得部611では、複数のヒストグラムにおける注目区間および注目区間の両側に隣接する複数の区間の頻度に基づいて、各教師画像の複数のカテゴリのそれぞれに対する評価値が取得されることにより、教師画像の個数が少ない場合等にも、カテゴリ候補を適切に決定することが可能となる。 By the way, when the number of teacher images is small, many teacher images exist in isolation in any section (become isolated in the feature space), and the histogram H4 of category No. 4 in FIG. Thus, the frequency is low in most of the sections and shows a flat distribution. In such a case, in the histogram of the category of number n, evaluation is performed by setting a value that includes not only the frequency of the target section in the target teacher image but also the frequencies of a plurality of sections adjacent to both sides of the target section as x n . The value P n is preferably determined by ((x n / (x 1 + x 2 + x 3 + x 4 )) × 100) [%]. In this way, the evaluation value acquisition unit 611 acquires evaluation values for each of the plurality of categories of each teacher image based on the attention section in the plurality of histograms and the frequencies of the plurality of sections adjacent to both sides of the attention section. This makes it possible to appropriately determine category candidates even when the number of teacher images is small.

上記装置では、様々な変形が可能である。
Various modifications can be made to the above apparatus .

上記実施の形態では、教師データからカテゴリ相違画像を取り除きつつ図6のステップS24〜S26の処理を複数回繰り返した結果を参照することにより、カテゴリ候補を特定する図6の処理の優位性について説明したが、教師データからカテゴリ相違画像を取り除きつつステップS24〜S26の処理を複数回繰り返すことにより、最終的な教師データが生成されてもよい。図10を参照して説明したように、このような教師データは各カテゴリの典型的な教師画像のみを含むと捉えることができる。   In the above embodiment, the superiority of the process of FIG. 6 for identifying category candidates is described by referring to the result of repeating the processes of steps S24 to S26 of FIG. 6 a plurality of times while removing the category difference image from the teacher data. However, final teacher data may be generated by repeating the processes in steps S24 to S26 a plurality of times while removing the category difference image from the teacher data. As described with reference to FIG. 10, such teacher data can be regarded as including only typical teacher images of each category.

ディスプレイ55では必ずしも複数のカテゴリ相違画像が表示される必要はなく、1つのカテゴリ相違画像のみが表示されてもよい。また、カテゴリ候補のみがカテゴリ相違画像と共に表示されてもよい。以上のように、図6のステップS27の処理では、少なくとも1つのカテゴリ相違画像のそれぞれがカテゴリ候補と共にディスプレイ55に表示される。   The display 55 does not necessarily display a plurality of category difference images, and only one category difference image may be displayed. In addition, only the category candidates may be displayed together with the category difference image. As described above, in the process of step S27 in FIG. 6, each of at least one category difference image is displayed on the display 55 together with the category candidate.

画像分類装置1において、教師データに利用される多数の教師画像の特徴量が検査・分類装置4にて算出されてもよい。また、教師データから特徴量が省略され、学習部62において教師画像のデータに基づいて特徴量が求められてもよい。   In the image classification device 1, the feature amounts of a large number of teacher images used for teacher data may be calculated by the inspection / classification device 4. The feature amount may be omitted from the teacher data, and the learning unit 62 may obtain the feature amount based on the teacher image data.

上記実施の形態では、欠陥検査装置に自動欠陥分類の機能を付加した画像分類装置1について説明したが、他の欠陥検査装置にて検出された基板上の欠陥を観察する観察装置(レビュー装置とも呼ばれる。)に自動欠陥分類の機能を付加した装置(同様に、画像分類装置として捉えることができる。)において、上記教師データ作成部61が用いられてもよい。このような画像分類装置における撮像装置では、欠陥をより高度に解析するため、図1の撮像装置2に比べて高い解像度の画像が取得される。   In the above-described embodiment, the image classification apparatus 1 in which the function of automatic defect classification is added to the defect inspection apparatus has been described. However, an observation apparatus that observes defects on the substrate detected by other defect inspection apparatuses (both review apparatuses) The teacher data creation unit 61 may be used in a device in which a function of automatic defect classification is added to (referred to as an image classification device). In such an image classification device, an image with a higher resolution than that of the image pickup device 2 in FIG. 1 is acquired in order to analyze defects more highly.

図1の画像分類装置1では、半導体基板に代えてガラス基板(例えば、平面表示装置用のガラス基板)、プリント配線基板あるいは基板の露光に使用するマスク基板等の検査が行われてもよい。   In the image classification apparatus 1 of FIG. 1, inspection of a glass substrate (for example, a glass substrate for a flat display device), a printed wiring board, or a mask substrate used for exposure of the substrate may be performed instead of the semiconductor substrate.

また、画像分類装置1が、血液や培養液等の所定の液中の細胞を撮像した細胞画像を分類する用途に用いられてもよい。このように、画像分類装置1は、様々な対象物を示す画像の分類に利用可能である。さらに、画像分類装置1では、可視光により撮像される画像以外に、電子線やX線等により撮像される画像が分類されてよい。   Further, the image classification device 1 may be used for the purpose of classifying a cell image obtained by imaging cells in a predetermined liquid such as blood or a culture solution. As described above, the image classification device 1 can be used to classify images showing various objects. Furthermore, in the image classification device 1, in addition to images captured with visible light, images captured with an electron beam, an X-ray, or the like may be classified.

上記実施の形態では、各教師画像に対してカテゴリ候補を特定することにより教師データを検証する教師データ検証装置が、教師データ作成部61に設けられる記憶部614、評価値取得部611、カテゴリ候補特定部612および表示制御部613により実現されるが、教師データ検証装置は、教師データ作成部61とは個別の装置として実現されてもよい。また、教師データ作成装置である教師データ作成部61が画像分類装置1とは個別の装置として実現されてもよい。   In the above embodiment, the teacher data verification device that verifies teacher data by specifying category candidates for each teacher image includes the storage unit 614 provided in the teacher data creation unit 61, the evaluation value acquisition unit 611, the category candidates. Although implemented by the specifying unit 612 and the display control unit 613, the teacher data verification device may be implemented as a separate device from the teacher data creation unit 61. In addition, the teacher data creation unit 61 which is a teacher data creation device may be realized as a separate device from the image classification device 1.

上記実施の形態および各変形例における構成は、相互に矛盾しない限り適宜組み合わされてよい。   The configurations in the above-described embodiments and modifications may be combined as appropriate as long as they do not contradict each other.

1 画像分類装置
55 ディスプレイ
56 入力部
61 教師データ作成部
71a〜71d 教師画像
421 分類器
611 評価値取得部
612 カテゴリ候補特定部
613 表示制御部
614 記憶部
710 教師データ
H1〜H4 ヒストグラム
S14,S21〜S29 ステップ
DESCRIPTION OF SYMBOLS 1 Image classification device 55 Display 56 Input part 61 Teacher data creation part 71a-71d Teacher image 421 Classifier 611 Evaluation value acquisition part 612 Category candidate specific part 613 Display control part 614 Storage part 710 Teacher data H1-H4 Histogram S14, S21- S29 step

Claims (12)

画像を分類する分類器の学習に使用される教師データを検証する教師データ検証装置であって、
それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、前記複数の教師画像のカテゴリを示す教師データを記憶する記憶部と、
特徴量の複数種類のそれぞれに関して、各教師画像が前記複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値を取得する評価値取得部と、
前記各教師画像において、前記複数のカテゴリのそれぞれに関して、特徴量の前記複数種類における評価値の代表値を求め、前記複数のカテゴリにおける複数の代表値に基づいて前記各教師画像が属すべきものと判定されるカテゴリを、カテゴリ候補として特定するカテゴリ候補特定部と、
前記教師データが示すカテゴリと前記カテゴリ候補とが相違する教師画像をカテゴリ相違画像として、カテゴリ相違画像を前記カテゴリ候補と共に表示部に表示する表示制御部と、
を備え
前記評価値取得部が、特徴量の各種類に関して、前記複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムを生成し、前記各教師画像の特徴量を含む区間を注目区間として、前記複数のカテゴリに対する複数のヒストグラムにおける前記注目区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値を取得し、
前記教師データから前記カテゴリ相違画像を取り除きつつ前記評価値取得部および前記カテゴリ候補特定部の処理が複数回繰り返され、前記カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて、前記複数の教師画像が複数のグループに分割されることを特徴とする教師データ検証装置。
A teacher data verification device for verifying teacher data used for learning of a classifier that classifies images,
A plurality of teacher images each assigned to one of a plurality of categories, and a storage unit that stores teacher data indicating categories of the plurality of teacher images;
An evaluation value acquisition unit that acquires an evaluation value indicating validity when each teacher image belongs to each of the plurality of categories for each of a plurality of types of feature amounts;
In each of the teacher images, for each of the plurality of categories, a representative value of the evaluation value in the plurality of types of feature quantities is obtained, and each teacher image should belong based on the plurality of representative values in the plurality of categories. A category candidate identifying unit that identifies a category to be determined as a category candidate;
The teacher image and the category showing the teacher data and the category candidate is different as a category different from the image, a display control unit for displaying the category difference picture image on the display unit together with the category candidates,
Equipped with a,
The evaluation value acquisition unit generates a histogram of the feature amount of the teacher image assigned to each of the plurality of categories for each type of feature amount, and sets a section including the feature amount of each teacher image as an attention interval. Based on the frequency of the attention interval in a plurality of histograms for the plurality of categories, the evaluation values for each of the plurality of categories of the teacher images,
The processing of the evaluation value acquisition unit and the category candidate specifying unit is repeated a plurality of times while removing the category difference image from the teacher data, and the plurality of the plurality of times are determined according to the number of times the processing is repeated until the category difference image is specified. teacher data verifying device teacher image is characterized Rukoto is divided into a plurality of groups.
請求項に記載の教師データ検証装置であって、
前記評価値取得部が、前記複数のヒストグラムにおける前記注目区間および前記注目区間の両側に隣接する複数の区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値を取得することを特徴とする教師データ検証装置。
The teacher data verification device according to claim 1 ,
The evaluation value acquisition unit acquires the evaluation value for each of the plurality of categories of each teacher image based on the attention interval in the plurality of histograms and the frequencies of a plurality of intervals adjacent to both sides of the attention interval. A teacher data verification device characterized in that:
請求項またはに記載の教師データ検証装置であって、
前記複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける前記注目区間の頻度が所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける前記注目区間の頻度が0である場合に、前記評価値取得部が前記評価値を取得しないことを特徴とする教師データ検証装置。
The teacher data verification device according to claim 1 or 2 ,
Of the plurality of histograms, when the frequency of the attention interval in the histogram for one category is a predetermined number or less and the frequency of the attention interval in the histogram for each of all other categories is 0, the evaluation value A teacher data verification apparatus, wherein an acquisition unit does not acquire the evaluation value.
請求項1ないしのいずれかに記載の教師データ検証装置であって、
前記表示制御部が、前記カテゴリ相違画像を、前記教師データが示すカテゴリおよび前記カテゴリ候補と共に前記表示部に表示することを特徴とする教師データ検証装置。
The teacher data verification device according to any one of claims 1 to 3 ,
Wherein the display control unit, pre-listen categories the difference image image, the teacher data verifying device and displaying on the display unit together with the category and the category candidate the teacher data indicates.
画像を分類する分類器の学習に使用される教師データを作成する教師データ作成装置であって、
請求項1ないしのいずれかに記載の教師データ検証装置と、
記カテゴリ相違画像に対する最終的なカテゴリの入力を受け付ける入力部と、
を備えることを特徴とする教師データ作成装置。
A teacher data creation device for creating teacher data used for learning of a classifier that classifies images,
A teacher data verification device according to any one of claims 1 to 4 ,
An input unit for accepting an input of the final categories against before asked categorical difference picture image,
A teacher data creation device comprising:
画像を分類する画像分類装置であって、
請求項に記載の教師データ作成装置と、
前記教師データ作成装置により作成された教師データを用いて学習が行われるとともに、画像を分類する分類器と、
を備えることを特徴とする画像分類装置。
An image classification device for classifying images,
A teacher data creation device according to claim 5 ;
Learning is performed using the teacher data created by the teacher data creation device, and a classifier that classifies images;
An image classification apparatus comprising:
画像を分類する分類器の学習に使用される教師データを検証する教師データ検証方法であって、
a)それぞれが複数のカテゴリのいずれかに割り振られた複数の教師画像、および、前記複数の教師画像のカテゴリを示す教師データを準備する工程と、
b)特徴量の複数種類のそれぞれに関して、各教師画像が前記複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値を取得する工程と、
c)前記各教師画像において、前記複数のカテゴリのそれぞれに関して、特徴量の前記複数種類における評価値の代表値を求める工程と、
d)前記複数のカテゴリにおける複数の代表値に基づいて前記各教師画像が属すべきものと判定されるカテゴリを、カテゴリ候補として特定する工程と、
e)前記教師データが示すカテゴリと前記カテゴリ候補とが相違する教師画像をカテゴリ相違画像として、カテゴリ相違画像を前記カテゴリ候補と共に表示部に表示する工程と、
を備え
前記b)工程において、特徴量の各種類に関して、前記複数のカテゴリのそれぞれに割り振られた教師画像の特徴量のヒストグラムが生成され、前記各教師画像の特徴量を含む区間を注目区間として、前記複数のカテゴリに対する複数のヒストグラムにおける前記注目区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値が取得され、
前記教師データから前記カテゴリ相違画像を取り除きつつ前記b)ないしd)工程が複数回繰り返され、前記カテゴリ相違画像として特定されるまでの処理の繰り返し回数に応じて、前記複数の教師画像が複数のグループに分割されることを特徴とする教師データ検証方法。
A teacher data verification method for verifying teacher data used for learning a classifier that classifies images,
a) preparing a plurality of teacher images each assigned to any of a plurality of categories, and teacher data indicating the categories of the plurality of teacher images;
b) obtaining an evaluation value indicating validity when each teacher image belongs to each of the plurality of categories for each of the plurality of types of feature values;
c) obtaining a representative value of the evaluation value in the plurality of types of feature amounts for each of the plurality of categories in each teacher image;
d) identifying a category determined as a category candidate to which each teacher image should belong based on a plurality of representative values in the plurality of categories;
The teacher image e) and the category indicated supervisor data and the category candidate is different as a category different from the image, and displaying the category difference picture image on the display unit together with the category candidates,
Equipped with a,
In the step b), for each type of feature quantity, a histogram of the feature quantity of the teacher image allocated to each of the plurality of categories is generated, and a section including the feature quantity of each teacher image is set as an attention section. Based on the frequency of the attention interval in a plurality of histograms for a plurality of categories, the evaluation value for each of the plurality of categories of each teacher image is acquired,
While removing the category difference image from the teacher data, the steps b) to d) are repeated a plurality of times, and the plurality of teacher images are a plurality of times depending on the number of repetitions of the process until the category difference image is specified. teacher data verification method according to claim Rukoto are divided into groups.
請求項に記載の教師データ検証方法であって、
前記b)工程において、前記複数のヒストグラムにおける前記注目区間および前記注目区間の両側に隣接する複数の区間の頻度に基づいて、前記各教師画像の前記複数のカテゴリのそれぞれに対する前記評価値が取得されることを特徴とする教師データ検証方法。
The teacher data verification method according to claim 7 ,
In the step b), the evaluation value for each of the plurality of categories of each teacher image is acquired based on the attention section in the plurality of histograms and the frequencies of a plurality of sections adjacent to both sides of the attention section. The teacher data verification method characterized by the above-mentioned.
請求項またはに記載の教師データ検証方法であって、
前記b)工程において、前記複数のヒストグラムのうち、一のカテゴリに対するヒストグラムにおける前記注目区間の頻度が所定数以下であり、他の全てのカテゴリのそれぞれに対するヒストグラムにおける前記注目区間の頻度が0である場合に、前記評価値が取得されないことを特徴とする教師データ検証方法。
The teacher data verification method according to claim 7 or 8 ,
In the step b), among the plurality of histograms, the frequency of the attention interval in the histogram for one category is not more than a predetermined number, and the frequency of the attention interval in the histogram for each of all other categories is 0. In this case, the teacher data verification method is characterized in that the evaluation value is not acquired.
請求項ないしのいずれかに記載の教師データ検証方法であって、
前記e)工程において、前記カテゴリ相違画像が、前記教師データが示すカテゴリおよび前記カテゴリ候補と共に前記表示部に表示されることを特徴とする教師データ検証方法。
The teacher data verification method according to any one of claims 7 to 9 ,
Wherein e) in the step, prior to hear categorical difference picture image is teacher data verification method characterized in that it is displayed on the display unit together with the category and the category candidate the teacher data indicates.
画像を分類する分類器の学習に使用される教師データを作成する教師データ作成方法であって、
請求項ないし10のいずれかに記載の教師データ検証方法と、
記カテゴリ相違画像に対する最終的なカテゴリを決定する工程と、
を備えることを特徴とする教師データ作成方法。
A teacher data creation method for creating teacher data used for learning a classifier that classifies images,
A teacher data verification method according to any one of claims 7 to 10 ,
Determining a final category against before asked categorical difference picture image,
A method for creating teacher data, comprising:
画像を分類する画像分類方法であって、
請求項11に記載の教師データ作成方法により作成された教師データを用いて分類器を学習させる工程と、
前記分類器により画像を分類する工程と、
を備えることを特徴とする画像分類方法。
An image classification method for classifying images,
Learning a classifier using the teacher data created by the teacher data creation method according to claim 11 ;
Classifying images by the classifier;
An image classification method comprising:
JP2012215984A 2012-09-28 2012-09-28 Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method Active JP6059486B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012215984A JP6059486B2 (en) 2012-09-28 2012-09-28 Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method
TW102124865A TWI502189B (en) 2012-09-28 2013-07-11 Training data verification apparatus, training data generation apparatus, image classification apparatus, training data verification method, training data generation method, and image classification method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012215984A JP6059486B2 (en) 2012-09-28 2012-09-28 Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method

Publications (2)

Publication Number Publication Date
JP2014070944A JP2014070944A (en) 2014-04-21
JP6059486B2 true JP6059486B2 (en) 2017-01-11

Family

ID=50746292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012215984A Active JP6059486B2 (en) 2012-09-28 2012-09-28 Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method

Country Status (2)

Country Link
JP (1) JP6059486B2 (en)
TW (1) TWI502189B (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020189269A1 (en) * 2019-03-19 2021-12-02 日本電気株式会社 Image processing method, image processing device, program

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6472621B2 (en) * 2014-08-12 2019-02-20 株式会社Screenホールディングス Classifier construction method, image classification method, and image classification apparatus
TWI737659B (en) * 2015-12-22 2021-09-01 以色列商應用材料以色列公司 Method of deep learning - based examination of a semiconductor specimen and system thereof
JP6763673B2 (en) * 2016-03-10 2020-09-30 株式会社Screenホールディングス Teacher data creation support device, image classification device, teacher data creation support method and image classification method
US10964013B2 (en) * 2017-01-10 2021-03-30 Kla-Tencor Corporation System, method for training and applying defect classifiers in wafers having deeply stacked layers
JP2018136903A (en) * 2017-02-21 2018-08-30 エンゼルプレイングカード株式会社 System for counting number of gaming-purpose substitute currency
JP6810505B2 (en) * 2017-09-19 2021-01-06 富士フイルム株式会社 Teacher data creation method and equipment and defect inspection method and equipment
JP7050470B2 (en) * 2017-11-21 2022-04-08 千代田化工建設株式会社 Inspection support system, learning device, and judgment device
JP7219190B2 (en) * 2018-08-27 2023-02-07 株式会社Screenホールディングス Teaching data generation method and discharge state determination method
JP7214417B2 (en) * 2018-09-20 2023-01-30 株式会社Screenホールディングス Data processing method and data processing program
JP7501166B2 (en) * 2020-07-03 2024-06-18 オムロン株式会社 X-ray inspection equipment

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4132229B2 (en) * 1998-06-03 2008-08-13 株式会社ルネサステクノロジ Defect classification method
JP2001188906A (en) * 1999-12-28 2001-07-10 Hitachi Ltd Method and device for automatic image calssification
KR100882484B1 (en) * 2007-04-10 2009-02-09 삼성전자주식회사 Semiconductor memory device having error detection function, memory system having the same, and method of outputting data of the same
US8971230B2 (en) * 2007-08-17 2015-03-03 Ntt Docomo, Inc. Mobile communication method, radio base station apparatus and mobile station
CN101329736B (en) * 2008-06-20 2011-04-27 西安电子科技大学 Method of image segmentation based on character selection and hidden Markov model
EP2341836B1 (en) * 2008-09-24 2017-03-22 Koninklijke Philips N.V. Generation of standard protocols for review of 3d ultrasound image data
CN101426150B (en) * 2008-12-08 2011-05-11 青岛海信电子产业控股股份有限公司 Video image quality evaluation method and system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020189269A1 (en) * 2019-03-19 2021-12-02 日本電気株式会社 Image processing method, image processing device, program
JP7151869B2 (en) 2019-03-19 2022-10-12 日本電気株式会社 IMAGE PROCESSING METHOD, IMAGE PROCESSING APPARATUS, AND PROGRAM

Also Published As

Publication number Publication date
TWI502189B (en) 2015-10-01
JP2014070944A (en) 2014-04-21
TW201413239A (en) 2014-04-01

Similar Documents

Publication Publication Date Title
JP6059486B2 (en) Teacher data verification device, teacher data creation device, image classification device, teacher data verification method, teacher data creation method, and image classification method
JP6063756B2 (en) Teacher data creation support device, teacher data creation device, image classification device, teacher data creation support method, teacher data creation method, and image classification method
JP6924413B2 (en) Data generator, data generation method and data generation program
JP6113024B2 (en) Classifier acquisition method, defect classification method, defect classification device, and program
WO2019117065A1 (en) Data generation device, data generation method and data generation program
JP4155496B2 (en) Classification support device, classification device, and program
JP6472621B2 (en) Classifier construction method, image classification method, and image classification apparatus
JP6669453B2 (en) Image classification device and image classification method
US20190139213A1 (en) Data generation apparatus, data generation method, and data generation program
JP6401648B2 (en) Defect classification apparatus and defect classification method
JP2011158373A (en) Method for creation of teacher data for use in automatic defect classification, and method and apparatus for automatic defect classification
JP2005293264A (en) Learning type sorting apparatus and learning type sorting method
JP2006098151A (en) Pattern inspection device and pattern inspection method
JP2013134666A (en) Binary image generation device, classification device, binary image generation method, and classification method
JP2016181098A (en) Area detection device and area detection method
JP5075070B2 (en) Teacher data creation method, image classification method, and image classification apparatus
JP2014137284A (en) Teacher data creation support device, teacher data creation device, image classification device, teacher data creation support method, teacher data creation method and image classification method
US20190272627A1 (en) Automatically generating image datasets for use in image recognition and detection
JP6530688B2 (en) Classifier construction method, image classification method, classifier construction apparatus and image classification apparatus
JP2017107313A (en) Teacher data creation support method, image classification method, teacher data creation support device and image classification device
Socia et al. Detection of trachoma using machine learning approaches
JP6763673B2 (en) Teacher data creation support device, image classification device, teacher data creation support method and image classification method
JP6871807B2 (en) Classifier construction method, classifier and classifier construction device
JP6425468B2 (en) Teacher data creation support method, image classification method, teacher data creation support device and image classification device
JP5075083B2 (en) Teacher data creation support method, image classification method, and image classification apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160506

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161209

R150 Certificate of patent or registration of utility model

Ref document number: 6059486

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250