JP4873138B2 - Information processing apparatus and program - Google Patents
Information processing apparatus and program Download PDFInfo
- Publication number
- JP4873138B2 JP4873138B2 JP2006170877A JP2006170877A JP4873138B2 JP 4873138 B2 JP4873138 B2 JP 4873138B2 JP 2006170877 A JP2006170877 A JP 2006170877A JP 2006170877 A JP2006170877 A JP 2006170877A JP 4873138 B2 JP4873138 B2 JP 4873138B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- information
- reliability
- unit
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 55
- 238000012545 processing Methods 0.000 claims description 431
- 238000000034 method Methods 0.000 claims description 268
- 238000000605 extraction Methods 0.000 claims description 201
- 230000008569 process Effects 0.000 claims description 165
- 238000012937 correction Methods 0.000 claims description 112
- 239000000463 material Substances 0.000 description 184
- 230000006870 function Effects 0.000 description 36
- 230000007246 mechanism Effects 0.000 description 27
- 238000000926 separation method Methods 0.000 description 22
- 239000000284 extract Substances 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 16
- 230000010354 integration Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000011218 segmentation Effects 0.000 description 10
- 230000006872 improvement Effects 0.000 description 9
- 238000012360 testing method Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000003672 processing method Methods 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 239000000470 constituent Substances 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007639 printing Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000000945 filler Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000013077 scoring method Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Character Discrimination (AREA)
Description
本発明は、入力修正方法、並びにこの入力修正方法を適用した追記情報処理方法、追記情報処理装置、およびプログラムに関する。より詳細には、たとえば、文書に手書きで追加記入された付加情報(追記情報やアノテーションとも称する)を、文書本体から分離し、文書本体と関わりを持つ様々な情報処理に使用する際に利用される、入力された付加情報に対する修正の仕組みに関する。 The present invention relates to an input correction method, a write-once information processing method, a write-once information processing apparatus, and a program to which the input correction method is applied. More specifically, for example, it is used when additional information (also referred to as additional information or annotation) additionally written in a document by handwriting is separated from the document body and used for various information processing related to the document body. This relates to a mechanism for correcting input additional information.
情報処理技術の進歩の著しい今日、文書に関する様々な処理を自動処理する仕組みがある。たとえば、予め所定の情報が記載されている文書原本にさらに別の付加情報を手書きで追記し、その付加情報の追記された追記済文書を処理対象として、手書きで追記された付加情報に基づいて所定のデータ処理を自動的に実行する仕組みがある。 In today's remarkable progress in information processing technology, there is a mechanism for automatically processing various processes related to documents. For example, additional additional information is additionally written by hand on a document original in which predetermined information is written in advance, and the additional document with the additional information added is processed, based on the additional information added by handwriting. There is a mechanism for automatically executing predetermined data processing.
たとえば、定型伝票(いわゆる帳票)に手書きで情報を記入して、その記入された情報を処理対象とする自動帳票処理の仕組み(たとえば特許文献1,2を参照)や、日付や予定記入欄が用意された主に手帳やメモなどに手書きで予定を記入し、その記入された予定を電子データ化する個人情報管理(特にスケジュール管理ともいう)の仕組み(特許文献3を参照)もある。
For example, there is an automatic form processing mechanism (see, for example,
また、学校や学習塾などの教育現場においては、生徒や受験者による解答が記入された答案用紙に採点官が採点した結果の用紙(教育用教材)を処理対象として、自動採点集計処理を行なう仕組みも考えられている(特許文献4を参照)もある。 Also, in schools, school cram schools, etc., automatic scoring and summarization processing is performed on papers (educational teaching materials) that result from scoring on answer sheets filled with answers by students and examinees. There is also a mechanism (see Patent Document 4).
たとえば、特許文献1には、表の種別および表中の各データの行方向の位置並びに列方向の位置を指定するための識別マークを付与して表データを識別マーク付きデータ表帳票として印刷するようにし、データ表帳票に付されている認識マークをマーク読取手段によって読み取らせることで、識別データから帳票を特定して該当する表データを表示手段に表示するようにし、かつ該当する箇所を修正可能な状態に表示することで、少ない作業量で効率よくデータ修正および照合を行なうことができるようにした仕組みが提案されている。
For example, in
また、特許文献2には、出力原稿をイメージデータに変換し、変換されたイメージデータを表示し、表示されたイメージ上にフォーム規定位置座標を指示し、指示されたフォーム規定位置座標に基づいてフォーム図形データを導出し、導出されたフォーム図形データに基づいてフォームを表示部に表示されているイメージデータに重ね合わせ表示する構成とすることで、所望の出力原稿に対するフォームを容易に作成できるようにした仕組みが提案されている。 Japanese Patent Application Laid-Open No. 2004-228561 converts an output document into image data, displays the converted image data, indicates form specified position coordinates on the displayed image, and based on the instructed form specified position coordinates. Form graphic data can be derived and the form can be overlaid on the image data displayed on the display unit based on the derived form graphic data so that a form for a desired output document can be created easily. A mechanism has been proposed.
また、特許文献3には、個人情報管理用の仕組みとして、書き込みの施された手帳などの紙面をスキャナより入力し、既知の方法により文字や枠線を検出し、検出した文字や枠線の配置を予め記憶された手帳の書式の知識と照合し、各記載項目の属性を表すデータを生成する仕組みが提案されている。
Further, in
手帳やメモなどに手書きで記入した情報(本例では手帳に手書きで入力した予定の記載内容)が自動的に電子データに変換され、各記載項目を生成された属性に対応付けて切り換えてデータベースに登録することができるので、利用者がある書式の出力を要求した場合には、予め記憶された出力の書式を参照することにより、データベースの内容を紙上の各内容に対応した場所に印刷するなどができ便利である。 Information handwritten in a notebook or memo (in this example, the written description of a schedule entered in the notebook in handwriting) is automatically converted to electronic data, and each written item is switched in correspondence with the generated attribute. When the user requests output of a certain format, the contents of the database are printed at a location corresponding to each content on the paper by referring to the output format stored in advance. It can be useful.
また、特許文献4には、答案用紙の手書き記入欄をタブレット上の入力域として定義するととともに、集計対象の入力域を識別可能に定義する書式データを記憶装置に記憶しておき、タブレットに答案用紙が重ね合せられた状態で、手書き記入欄に記入された情報をタブレットの入力域に入力された筆記データとして取り込んで文字認識することにより、採点などの記入作業を行なった後のキー入力などによるデータ入力を省力化する仕組みが提案されている。
Further, in
一方、手書きで入力された付加情報に基づいてデータ処理を実行するに当たっては、入力された手書き情報(文字や図形)を如何様にして認識するかや、自動認識結果が信頼できない場合に自動認識処理した認識結果に対して如何様にして効率的に修正するかが問題となり、このような手書き情報の自動認識・修正の仕組みとしては、様々なものが考えられている(たとえば特許文献5を参照)。 On the other hand, when executing data processing based on additional information input by handwriting, how to recognize the input handwritten information (characters and figures), or automatically recognize if the automatic recognition result is unreliable The problem is how to efficiently correct the processed recognition result, and various mechanisms for automatic recognition / correction of such handwritten information are considered (for example, see Patent Document 5). reference).
ここで、特許文献5に記載の仕組みでは、取得したデータに含まれる複数の項目について項目ごとに内容の確信度を計算し、計算された確信度を用いて提示の方法を動的に変化させるようにしている。入力されたデータに含まれる各項目の確信度を用いて、データの修正方法を動的に変化させることで、郵便番号から住所を修正するなど関連の高い項目の内容を修正したり、常に疑わしい、つまり確信度の低い項目の内容を優先的に修正したりすることができるようにし、データの入力方法に因らずオペレータが介在する入力修正作業を効率よく迅速かつ正確に行なうことができるようにしている。
Here, in the mechanism described in
しかしながら、特許文献5に記載の仕組みでは、各項目の認識時にパターン認識の類似度を使用して「確信度」を算出するのみであるため、認識処理よりも前段の各種の前処理などで生じ得る、認識処理に影響を与える事象を考慮することができない。そのため、たとえば、局所的なノイズの有無が「確信度」に影響を与えてしまい、「確信度」の精度が問題となる。前処理の段階で問題があると、認識処理への入力が既に変質しており、「信頼度が高いが間違い」の認識結果を出す可能性があるからである。
However, since the mechanism described in
本発明は、上記事情に鑑みてなされたものであり、自動データ処理に供される追記情報について、修正作業を効率よく迅速かつ正確に行なうことができるとともに、高精度に修正を要する追記情報を特定することのできる仕組みを提供することを目的とする。 The present invention has been made in view of the above circumstances, and it is possible to perform correction work efficiently and quickly with respect to additional information provided for automatic data processing, and to add additional information that requires correction with high accuracy. The purpose is to provide a mechanism that can be specified.
本発明に係る仕組みにおいては、注目する付加情報に関して、認識処理の信頼度に関する特徴量を取得し、各特徴量に基づいて各処理の認識処理に関わるサブ信頼度をそれぞれ算出し、この算出したサブ信頼度に基づいて注目する付加情報に関しての最終的な信頼度を特定し、この最終的な信頼度が一定水準よりも低いか否かを判定することで認識処理の信頼度が一定水準よりも低い難認識情報を特定し、この特定した難認識情報の認識性能を向上させるための認識性能情報を提示するようにした。 In the mechanism according to the present invention, for the additional information of interest, the feature amount related to the reliability of the recognition process is acquired, and the sub-reliability related to the recognition process of each process is calculated based on each feature amount. Based on the sub-reliability, the final reliability of the additional information to be noticed is identified, and the reliability of the recognition process is lower than the fixed level by determining whether or not the final reliability is lower than the fixed level. The recognition performance information for improving the recognition performance of the identified difficulty recognition information is presented.
その後には、認識性能情報の提示に対応して記入された修正後の付加情報をデータ処理に反映させる。その修正の反映方法としては、たとえば、認識後に保存されたデータを直接変更することで実現する手法を採ることができる。たとえば、修正結果は、認識後にデータベース操作などで直接データを変更することで反映するとよい。 Thereafter, the corrected additional information entered corresponding to the presentation of the recognition performance information is reflected in the data processing. As a method of reflecting the correction, for example, a technique realized by directly changing data stored after recognition can be adopted. For example, the correction result may be reflected by changing the data directly by database operation after recognition.
ここで、「認識処理の信頼度に関する特徴量」は、認識処理そのものにおける信頼度に関する特徴量だけでなく、この認識処理よりも前段の認識処理に関わる各種の処理における信頼度に関する特徴量も含むものである。 Here, the “feature value related to the reliability of the recognition process” includes not only the feature quantity related to the reliability in the recognition process itself but also the feature quantity related to the reliability in various processes related to the recognition process preceding the recognition process. It is a waste.
認識処理そのものだけでなく、認識処理よりも前段の各種の前処理などで生じ得る、認識処理に影響を与える事象を考慮して、認識処理の信頼度が一定水準よりも低い難認識情報を特定するのである。 Identify difficult-to-recognize information whose recognition process reliability is lower than a certain level, taking into account not only the recognition process itself, but also the events that affect the recognition process that can occur in the various pre-processes before the recognition process. To do.
なお、本発明に係る仕組みは、電子計算機(コンピュータ)を用いてソフトウェアで実現することもでき、このためのプログラムやこのプログラムを格納した記録媒体を発明として抽出することも可能である。プログラムは、コンピュータ読取り可能な記憶媒体に格納されて提供されてもよいし、有線あるいは無線による通信手段を介した配信により提供されてもよい。 The mechanism according to the present invention can be realized by software using an electronic computer (computer), and a program for this purpose and a recording medium storing this program can also be extracted as an invention. The program may be provided by being stored in a computer-readable storage medium, or may be provided by distribution via wired or wireless communication means.
本発明によれば、認識処理そのものにおける信頼度に関する特徴量だけでなく、この認識処理よりも前段の認識処理に関わる各種の処理における信頼度に関する特徴量も取得し、認識処理の信頼度が一定水準よりも低い難認識情報を特定するようにした。 According to the present invention, not only the feature quantity related to the reliability in the recognition process itself but also the feature quantity related to the reliability in various processes related to the recognition process preceding the recognition process is acquired, and the reliability of the recognition process is constant. The difficulty recognition information lower than the standard was specified.
これにより、認識処理よりも前段の各種の前処理などで生じ得る認識処理に影響を与える事象を考慮することができるようになるので、全ての追記情報をチェックする必要がなく、誤認識を起し得る追記情報の修正作業を効率よく迅速かつ正確に行なうことができるだけでなく、高精度に難認識情報を特定することができる。修正対象の追記情報を高精度に特定して、効率よく迅速かつ正確に修正できるようになる。 As a result, it is possible to consider events that may affect the recognition process that may occur in various pre-processes prior to the recognition process.Therefore, it is not necessary to check all additional information and cause erroneous recognition. In addition to being able to efficiently and quickly correct the postscript information that can be corrected, it is possible to identify difficult recognition information with high accuracy. It becomes possible to specify the postscript information to be corrected with high accuracy and to efficiently and quickly correct it.
以下、図面を参照して本発明の実施形態について詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
<処理対象文書の例>
図1は、本発明に係る追記情報処理装置を備えてなる情報処理システムにおいて処理対象とする文書の一例を示す図である。
<Example of processing target document>
FIG. 1 is a diagram showing an example of a document to be processed in an information processing system including an additional information processing apparatus according to the present invention.
図1に示す文書は、教育現場で紙媒体として使用される教育用教材80であって、典型例として、問題文82およびその解答欄84(本例では括弧で示された部分)を有したものであり、図1(A)はその文書原本8Aを示し、図1(B)は、追記情報記入済の状態(追記済文書8B)を模式的に示している。また、データベースへの登録情報の一例を(C)に示す。 The document shown in FIG. 1 is an educational material 80 used as a paper medium in an educational setting, and typically has a question sentence 82 and an answer column 84 (part shown in parentheses in this example). FIG. 1 (A) shows the original document 8A, and FIG. 1 (B) schematically shows a state in which additional information has been entered (added document 8B). An example of registration information in the database is shown in (C).
このような教育用教材80は、具体的には教育機関で用いられるペーパーテストや練習問題シートなどが該当する。なお、教育用教材80は、少なくとも解答欄84を有していればよく、たとえば採点官が読み上げた問題について解答欄84に解答を記入する場合などがあり、問題文82については必ずしも記載されていなくともよい。
Specifically, the educational material 80 corresponds to a paper test or a practice question sheet used in an educational institution. The educational material 80 only needs to have at least an
また、図1(A)に示すように、教育用教材80は、問題文82および第1種の付加情報の一例である解答が記入される解答欄84の他に、配点欄83(問題別の項目点欄83aや部分点欄や合計点欄でなる集計欄83b)と、第1種の付加情報の一例である教育用教材80を識別特定するための情報を記入する識別情報欄85と、第1種の付加情報の一例である解答者情報であって解答欄84への解答記入者に関する情報を記入する解答者情報欄86とを有している。解答欄84、識別情報欄85、解答者情報欄86は、何れも第1種の付加情報を記入する記入欄の一例である。
As shown in FIG. 1 (A), the educational material 80 includes not only a question sentence 82 and an
識別情報欄85には、たとえば教育用教材80の科目、タイトル、あるいは適用学年などが予め記載されるものとする。ただし、これらの記載に加えて、またはこれらの記載とは別に、教育用教材80を識別するためのコード情報が埋め込まれていてもよい。
In the
コード情報の埋込みは、公知技術を利用して実現すればよいが、その一つの具体例として、たとえば「iTone(登録商標)」と呼ばれるもののように、階調表現としての万線スクリーンまたはドットスクリーンを構成する画素の形態(位置、形状など)を変化させることで、ハーフトーン画像の中にデジタル情報を埋め込むようにする、といった技術を用いることが考えられる。一方、解答者情報欄86には、解答記入者の学級86a、出席番号86b、あるいは氏名86cなどが記入され得るようになっている。
The embedding of the code information may be realized by using a known technique. As one specific example, for example, a line screen or a dot screen as a gradation expression such as a so-called “iTone (registered trademark)” is used. It is conceivable to use a technique of embedding digital information in a halftone image by changing the form (position, shape, etc.) of the pixels constituting the image. On the other hand, in the answerer information column 86, the
配点欄83(特に項目点欄83a)には、各解答欄84についての配点情報が記入される。配点情報とは、教育用教材80における各解答欄84について、各位置の解答欄84への配点が何点であるかを特定するための情報である。なお、配点は、解答欄84ごとに異なっていてもよいし、あるいは一律であってもよい。
In the scoring field 83 (particularly, the
このような教育用教材80は、対応する原本(教材原本)の電子データに基づき印刷装置で印刷出力することで得ることができる。教材原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。 Such educational teaching material 80 can be obtained by printing out with a printing apparatus based on the electronic data of the corresponding original (teaching material original). The electronic data of the original teaching material can be generated using application software such as word processing software using an electronic computer such as a personal computer, and is stored in a predetermined database or the like in advance.
なお、教材原本の電子データは、その教育用教材80における解答欄84や識別情報欄85などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。
The electronic data of the original teaching material can specify the layout of the
教育現場では、図1(A)に示した文書原本8Aの一例である教育用教材80が生徒や受験者などに配布され、先ず、生徒などによって解答者情報欄86への氏名や解答欄84への解答などの第1種の付加情報が所定欄に記入された後に回収される。この後さらに、図1(B)に示す追記済文書8Bの一例である付加情報記入済教材81のように、教師などの採点官によって各解答欄84に記入された解答に対する採点記号(正誤判定図形)87や採点記号87と関連するその他の図形や文章で示されたコメント88などの第2種の付加情報が記入される。なお、追記情報処理装置10で自動採点処理を行なうので、この時点では、採点官による配点欄83Cへの記入はない。
At the educational site, educational teaching material 80, which is an example of the original document 8A shown in FIG. 1A, is distributed to students, examinees, etc. First, the names and
この際には、通常、生徒などによる第1種の付加情報の記入に使用されるペン色と、採点官などによる第2種の付加情報の記入に使用されるペン色とは、異なるものが使用されるし、教育用教材80として予め記入されている色とも異なるものが使用される。 In this case, the pen color usually used for the entry of the first type of additional information by the student is different from the pen color used for the entry of the second type of additional information by the grader or the like. The color used is different from the color pre-filled as the educational material 80.
また、採点記号87としては、たとえば、正解を示す「○」やその他の図形(たとえば楕円図形)、不正解を示す「×」やその他の図形(たとえば「レ点」などのチェックマーク)、あるいは一部正解を示す「△」やその他の図形がある。
In addition, as the
コメント88は、採点記号87を元にした第1のデータ処理には直接的な関係を有しない情報であるが、第1のデータ処理の結果をサポート(補強)するあるいは全く関係のない第2のデータ処理に利用されるものである。
The comment 88 is information that does not have a direct relationship with the first data processing based on the
教材自動採点システムでは、この追記済文書8Bの一例である付加情報記入済教材81を対象として所定のデータ処理を行なうことになる。この際、第2種の付加情報(本例では採点記号87とコメント88)の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第1のデータ処理として採点記号87を元にした自動採点処理を行なう。この自動採点処理結果として、たとえば、配点欄83Cへ記入する得点情報が取得されることになる。また、コメント88の追記内容を元にした自動採点処理結果とは別の第2のデータ処理を行なう。
In the learning material automatic scoring system, predetermined data processing is performed for the additional information filled learning
自動採点処理とは別の第2のデータ処理としては、たとえば、コメント88の追記内容を所定の条件に基づいて分類する処理や、分類したコメント(全ての追記内容には限らず一部の追記内容でもよい)を対応する解答欄84についての採点処理結果と関連付けて生徒指導用データベースに登録・蓄積しておく処理などを行なう。
As a second data process different from the automatic scoring process, for example, a process for classifying the additional contents of the comment 88 based on a predetermined condition, a classified comment (not only all the additional contents but also a part of the additional data) The content may be registered) and stored in the student guidance database in association with the scoring processing result for the
こうすることで、自動採点処理とは別の第2のデータ処理の利用形態としては、生徒指導用データベースから情報を取り出して、後の生徒指導に利用することができるようになる。たとえば、全ての採点結果と対応するコメントを表示するようにすれば、優秀、優、並、劣、などの評価の細分類と合わせて採点結果を確認することができる。また、結果が不正解のコメントのみを表示するようにすれば、問題の読み間違えが多い、解答の書き間違えが多い、あるいは計算ミスが多いなどの生徒の能力分析に利用することもできる。あるいは、コメント88で示されている注意文やミス修正に基づき生徒指導に利用することも考えられる。 In this way, as a use form of the second data processing different from the automatic scoring process, information can be taken out from the student guidance database and used for subsequent student guidance. For example, if all the scoring results and the corresponding comments are displayed, the scoring results can be confirmed together with the subcategories of evaluation such as excellent, excellent, average, inferior. In addition, if only comments with incorrect answers are displayed, it can be used to analyze the ability of students who have many mistakes in reading questions, many mistakes in writing answers, or many calculation errors. Alternatively, it may be used for student guidance based on a cautionary note or mistake correction indicated by the comment 88.
なお、採点記号87やコメント88を対象としたデータ処理を実行するための教育用教材80(原本画像)のデータベースへの登録に当たっては、通常であれば、採点記号87についてのデータ処理時に必要となる解答欄84の位置情報や問題番号や配点情報などを示す記入欄位置領域情報38と、コメント88についてのデータ処理時に必要となる分類基準情報とを登録しておく。なお、教育用教材80における文字部分(たとえば問題番号を含む問題文や配点)をテキスト情報として参照され得るように、教育用教材80そのものの情報は、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておくことが好ましい。
In addition, when registering the educational material 80 (original image) for executing data processing for the
たとえば、図1(C)に示すように、記入欄位置領域情報38の一例である解答欄位置領域情報を、教育用教材80上に存在する問題の番号(第1の属性情報の一例)と、その問題の解答に対する配点(第2の属性情報の一例)と、その問題の解答を記入する解答欄84として扱われる領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。
For example, as shown in FIG. 1C, the answer field position area information, which is an example of the entry field
付加情報記入済教材81に対応する元の教育用教材80が文書管理サーバに登録されていないときには、無記入の教育用教材80を文書入力装置で読み取り、問題文の位置や解答欄84の位置や配点などを特定することにより対処する。
When the original teaching material 80 corresponding to the additional information filled
なお、追記情報について自動データ処理を実行する際に、追記情報を複数種類のものに分類し、それぞれの分類ごとに個別のデータ処理を実行しようとする場合には、各追記情報を他方のものと分離して認識・特定することが必要となる。両者の分離認識が適正になされないと、それぞれのデータ処理を適正に実行することができなくなる。 In addition, when executing automatic data processing for additional information, if additional information is classified into a plurality of types and individual data processing is to be performed for each classification, each additional information is assigned to the other It is necessary to identify and identify them separately. If the separation and recognition of both are not properly performed, the respective data processing cannot be properly performed.
たとえば、図1に示した付加情報記入済教材81の場合には、採点記号87に基づく自動採点処理と、コメント88に基づく生徒指導用データベースの構築処理があり、このような個別処理を実現するには、採点記号87とコメント88とを区別して認識処理などを行なってから最終的なデータ処理を行なう必要がある。
For example, in the case of the additional information-added
一方、答案の採点においては、採点記号87以外のコメント88を、採点記号87と同じペンで記載することがあり、たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した認識と記載内容の特定ができない。採点記号87とコメント88とを適切に分離できず、自動採点処理に悪影響を及ぼす。また、追記情報としては、自動採点処理用の採点記号87の他に、生徒指導などにも利用し得るコメント88が存在するにも関わらず、付加情報記入済教材81を生徒に返却した後には、生徒がその記載内容を確認する以外には活用できない事態となる。
On the other hand, in scoring the answer, a comment 88 other than the
このような事態を避けるには、たとえば、追記済文書8B中に存在する複数の付加情報を、記載位置、画像特徴量、あるいは認識処理時の信頼度などの付加情報が持つ様々な特徴に基づいて、複数の種類に分類(分離)するようにするのがよい。この際、付加情報が持つ単一の特徴に基づくだけでなく複数の特徴を参照することで、より正確な分離認識を行なうようにするのがよい。なお、これらについては詳細な説明を割愛する。 In order to avoid such a situation, for example, a plurality of additional information existing in the additionally written document 8B is based on various features of additional information such as a description position, an image feature amount, or reliability during recognition processing. Thus, it is preferable to classify (separate) into a plurality of types. At this time, it is preferable to perform more accurate separation recognition by referring to a plurality of features as well as based on a single feature of the additional information. In addition, detailed description is omitted about these.
<システム構成>
図2は、本発明に係る追記情報処理装置を備えてなる情報処理システムの一実施形態の構成例を示す図である。なお、この情報処理システムは、答案用紙などの教育用教材80を処理対象とする教材自動採点システムへの適用例で示す。
<System configuration>
FIG. 2 is a diagram illustrating a configuration example of an embodiment of an information processing system including the postscript information processing apparatus according to the present invention. Note that this information processing system is shown as an application example to a teaching material automatic scoring system that targets teaching materials 80 such as answer sheets.
図示のように、教材自動採点システム1は、システムの中心をなす追記情報処理装置10と、追記情報処理装置10に処理対象文書である付加情報記入済教材81を電子化して入力する文書入力装置20と、処理対象文書である付加情報記入済教材81に対応するテンプレート6や教育用教材80(詳しくはその原本画像)の電子データを記憶する文書管理サーバ30と、情報処理(本例では自動採点処理など)の結果を保存しておく処理結果保存サーバ40とが、有線や無線を利用してネットワーク接続されて構成されている。
As shown in the figure, the automatic teaching
文書入力装置20は、教育用教材80における解答欄84への解答記入、解答者情報欄86への氏名などの記入および解答欄84に記入された解答に対する採点官による採点記号87(具体的には、たとえば「○」や「×」の図形)の記入がされた付加情報記入済教材81に対して、公知の光学的画像読取技術を用いた画像読取りを行ない、その付加情報記入済教材81から画像データを得るものである。
The
文書入力装置20は、処理対象文書である付加情報記入済教材81を電子データにする機能を備えたものであればよく、たとえば、画像読取装置としての機能を有した複写機、複合機、またはスキャナ装置を利用して実現することが考えられる。その場合に、自動原稿搬送装置(Automatic Document Feeder ;ADF)が付設されていると、複数の教育用教材に対する画像読取りを連続的に行なうことができ便利である。
The
なお、教育用教材80を利用した試験などは、紙媒体を用いることに限定されない。たとえばタブレット型のPCを利用して試験を行ない採点するケースでは、最初から付加情報記入済教材81を電子データの形式で入手することができ、この場合には、システム構成上、文書入力装置20が不要となる。
Note that the test using the educational material 80 is not limited to using a paper medium. For example, in the case where a test is performed using a tablet PC and the scoring is performed, the
文書管理サーバ30は、付加情報記入済教材81に対応する教育用教材80の原本画像と、この原本画像を特定するための、たとえば、科目、タイトル、適用学年などの識別情報や識別コードとを対応付けて、ハードディスク装置や光ディスク装置などの所定の記憶媒体に文書原本情報データベースDB2として登録している。
The
また、文書管理サーバ30は、付加情報記入済教材81に対応する元の教育用教材80(原本画像)を保存するとともに、採点記号87やコメント88についてのデータ処理時に必要となる問題番号や配点情報などを示す記入欄位置領域情報38を、図1(C)に示したように、テーブル形式で、所定の格納領域に文書原本情報データベースDB2として保持蓄積している。
Further, the
処理結果保存サーバ40としては、追記情報処理装置10とネットワーク接続され、付加情報記入済教材81についての自動採点集計結果を管理することができるものであればよく、たとえば、処理結果データベース装置や処理結果ファイルサーバ装置などが該当する。
The processing
教材自動採点システム1の中心部をなす追記情報処理装置10は、文書入力装置20から入力された付加情報記入済教材81の画像データに基づき所定の信号処理を行なう読取画像処理部110と、読取画像処理部110による処理に基づいて文書入力装置20から入力された読取画像の元となった文書原本8Aを識別特定する文書原本特定部120とを備えている。教材自動採点システム1においては、文書原本特定部120は、文書原本8Aの一例である教育用教材80を特定する教材特定部122として機能する。
The postscript
また、追記情報処理装置10は、読取画像処理部110による処理が施された画像データから追記情報(アノテーション)を抽出する追記情報抽出部130と、追記情報抽出部130により抽出されたデータ処理対象の追記情報に基づき記載内容や記入位置を認識し特定するデータ処理対象追記情報特定処理部150と、データ処理対象追記情報特定処理部150により特定された追記情報の記載内容に基づいてデータ処理を行なうデータ処理部170とを備えている。
Further, the additional recording
また、追記情報処理装置10は、本実施形態特有の構成要素として、手書きで記入された文字や図形などの手書き入力情報の認識性能を示す情報(具体的には認識率)に基づいて特定される認識処理の信頼度が一定水準よりも低い難認識情報について、その難認識情報の認識性能を向上させるための認識性能情報をユーザに提示する認識性能情報提示処理部190を備えている。
Further, the postscript
認識性能情報提示処理部190は、追記入力された採点記号87やコメント88の内、認識処理の信頼度が一定水準よりも低い難認識情報を特定し、この特定した難認識情報の認識性能を向上させるための認識性能情報をユーザ端末171にて提示する。データ処理部170は、認識性能情報提示処理部190による認識性能情報の提示に対応してユーザにより記入された修正後の採点記号87やコメント88を用いて自動採点処理や自動コメント分類処理などのデータ処理を実行する。
The recognition performance information
ここで、本実施形態の認識性能情報提示処理部190は、認識処理対象の追記情報の効率的な修正を可能とするべく、追記情報処理装置10の各機能部における複数の処理から、それぞれ認識率に関わる情報を収集し、記入内容を自動認識した追記情報の中で、特に信頼度の低いもの、つまり一定の度合いよりも認識の困難であった難認識情報を抽出して、この難認識情報についての認識性能情報を提示して修正を促す点に特徴を有する。全ての追記情報について、修正の要否をチェックする必要を無くすことで、誤認識の追記情報の修正作業を効率化するのである。
Here, the recognition performance information
たとえば、「全図形をチェックする必要が無い」という効果を得るためには、信頼度による警告が高精度であることが必要になる。何故なら、抜け漏れがあっては警告が信用できないからである。前処理の段階で問題があると、認識処理への入力が既に変質しており、「信頼度が高いが間違い」の認識結果を出す可能性がある。 For example, in order to obtain the effect of “no need to check all figures”, it is necessary that the warning based on the reliability be highly accurate. This is because the warning cannot be trusted if there is an omission. If there is a problem at the pre-processing stage, the input to the recognition process has already changed, and there is a possibility that a recognition result of “high reliability but wrong” will be output.
そこで、認識処理だけでなく複数の処理から情報を収集することで、高精度な信頼度を算出し、そこから高精度な警告を出すことで、はじめて「全図形をチェックする必要がない効率化」の効果が得られるようになるのである。なお、この点についての詳細は後述する。 Therefore, by collecting information not only from recognition processing but also from multiple processes, high-precision reliability is calculated, and high-precision warnings are issued from that, for the first time, “Efficiency without having to check all figures” The effect of "is to be obtained." Details of this point will be described later.
読取画像処理部110は、図示を割愛するが、文書入力装置20から入力された画像データについて、レイアウト解析、文字図形分離、文字認識、コード情報認識、図形処理、色成分認識などの公知の画像処理技術(それぞれの詳細説明は割愛する)を利用して解析処理を行なう画像データ解析部と、文書入力装置20から入力された画像データの傾きや主走査方向または副走査方向の拡縮率などの画像歪みを補正する歪み補正部とを有している。なお、歪み補正部は、文書入力装置20から入力された画像データと、比較対象となる文書管理サーバ30内の対応する原本画像とを比較照合し、その画像歪み(傾き、拡縮など)を補正してもよい。
Although not shown, the read
教材特定部122は、図示を割愛するが、たとえば、画像データ解析部によるデータ解析結果に基づいて、識別情報欄85に記入されている科目、タイトル、あるいは適用学年などの識別情報を解析する識別情報解析部と、同じく識別情報欄85に埋め込まれている教育用教材80を特定するコード情報を解析するコード情報解析部とを有している。
The teaching
教材特定部122は、画像データ解析部での解析結果に基づいて特定した、たとえば科目、タイトル、適用学年などの識別情報や識別コードと、文書管理サーバ30に保持蓄積されている教育用教材80の原本画像の情報(たとえば科目、タイトル、適用学年などの識別情報や識別コード)とを照らし合わせ、該当する原本画像が文書管理サーバ30に保持蓄積されていなければ、文書入力装置20で得られた画像データとの比較対象となる電子データを特定できないと判定して、識別特定エラー信号を出力するようになっている。
The teaching
なお、教材特定部122は、文書入力装置20から入力された画像データ(付加情報記入済教材81に相当)と対応する元の教育用教材80を識別特定できればよく、識別情報解析部とコード情報解析部とは、付加情報記入済教材81の識別情報欄85に記載もしくは埋め込まれている識別情報の形式に対応する適正な方を備えていればよく、必ずしも、両者を備えている必要はない。
Note that the learning
追記情報抽出部130は、歪み補正部にて画像歪みが補正された画像データと、教材特定部122により特定された、文書入力装置20から入力された画像データ(付加情報記入済教材81に相当)に対応する原本画像(教育用教材80に相当)とを公知の画像処理技術を利用して比較しそれぞれの間の差分を抽出する差分抽出部132を有する。
The postscript
また、追記情報抽出部130は、差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報(第1種の付加情報の一例)を抽出する解答者抽出部134と、同じく差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済教材81における採点記号87やコメント88などのデータ処理に供される第2種の付加情報を抽出するデータ処理用追記情報抽出処理部140とを有する。
Further, the additional
解答者抽出部134は、差分抽出部132による抽出結果に基づき、解答者情報欄86の学級88aや出席番号88bや氏名88cの欄に記入された解答記入者の手書きによる番号や文字の画像をそのまま文字情報として切り出す手書き情報切出部136と、差分抽出部132による抽出結果に基づき(好ましくは、手書き情報切出部136により切り出された手書き情報について)、解答者情報欄86の手書きによる記入情報を、追記情報処理装置10上で加工編集が可能な文字データに変換する文字認識処理(OCR;Optical Character Reader)部138とを有する。
Based on the extraction result by the
なお、解答者抽出部134は、文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報欄86に記入された解答者情報を抽出できればよく、手書き情報切出部136と文字認識処理部138の何れか一方を備えていればよい。また、文字認識処理部138を設けない場合や文字認識処理部138で文字認識できなかったコメント88の部分に関しては、抽出された解答者情報をそのまま画像として取り扱うことにする。
The
データ処理用追記情報抽出処理部140は、注目する追記色の情報を参照して、差分抽出部132による抽出結果に基づき、追記情報抽出部130により抽出された追記情報の内、文書入力装置20で読取り対象となった追記済文書8B(本例では付加情報記入済教材81)におけるデータ処理対象追記情報9a(本例では採点記号87やコメント88)を抽出するデータ処理対象追記情報抽出部142と、データ処理対象追記情報抽出部142で抽出されたデータ処理対象の追記情報をデータ処理に耐え得るように整形する追記情報整形部146とを有する。本実施形態においては、データ処理対象追記情報抽出部142は、採点記号87を抽出する採点記号抽出部およびコメント88を抽出するコメント抽出部の機能を備える。
The additional write information
なお、データ処理対象追記情報抽出部142は、データ処理対象追記情報9aを抽出できればよく、色を指標に追記情報をさらに分類するとよい。たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、採点官が採点記号87やコメント88の記入に使用したペン色と対応する所定色成分についてのものを抽出することで行なえばよい。たとえば、付加情報記入済教材81における採点記号87やコメント88の記入は、一般に赤色ペン(赤の筆記具)で行なわれることが多く、この場合には、赤色成分に注目した抽出を行なえばよい。
The data processing target additional
ただし、赤色ペンとはいってもピンク系からオレンジ系というように似通った色気のものがあるし、必ずしも採点記号87やコメント88の記入に赤色ペンを使用するとは限らないし、採点記号87とコメント88とを別のペン色で記入することもあるので、採点記号87やコメント88の記入に使用するペン色の情報を採点記号抽出部やコメント抽出部として機能するデータ処理対象追記情報抽出部142に設定可能に構成しておくことで、抽出性能を向上させるようにするとよい。
However, even though the red pen is used, there are similar colors such as pink to orange, and the red pen is not always used for entering the
このため、実際に使用した追記色を特定し、その特定した追記色の情報を参照して、追記色に注目した抽出を行なう。実際に使用されたペン色が特定されていれば、データ処理対象追記情報抽出部142は、抽出許容範囲を狭くすることができる。これにより、採点記号87やコメント88をその他の追記情報と高精度に区別して抽出することができる。
For this reason, the write-on color actually used is specified, and extraction with attention to the write-on color is performed with reference to the information on the specified write-on color. If the pen color actually used is specified, the data processing target additional
追記情報整形部146としては、データ処理対象追記情報抽出部142で抽出されたデータ処理対象の追記情報について、線分同士を接続してその抽出線分間の途切れを解消するように補正処理を行なう抽出線分途切れ補正部148を有する構成とするのがよい。
The additional write
一般に、追記済文書8B上での図形記入や「2重線」や「波線」や「花丸」や「矢印」などの図形記入やコメント文などは、記入済のものに対して重ねて行なわれることもある。たとえば、付加情報記入済教材81の場合には、各問題文82や各解答欄84を特定する枠や各解答欄84への解答記入内容などに重ねて「○」や「×」などの採点記号87が記入され、あるいは図形や文字でコメント88の追記が行なわれることもある。そのため、データ処理対象追記情報抽出部142による所定色成分の抽出結果は、その重なり部分が除かれる結果、図形や文字に途切れ部分が生じたものとなる虞れがある。
In general, figure entry on the added document 8B, figure entry such as "double line", "wavy line", "Hanamaru", "arrow", etc., and comment sentences, etc., are repeated on the completed entry. Sometimes. For example, in the case of the additional information filled-in
このことから、抽出線分途切れ補正部148は、「○」や「×」や「線」やその他の印(マーク)などの図形や文字であるはずの抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理(いわゆる連結処理)、あるいは線図形の直線近似などを適宜実行する。なお、このときに行なう細線化処理、端点抽出処理、あるいは端点間接続処理や線図形の直線近似などは、公知技術を利用して行なえばよいため、ここではその詳細な説明を割愛する(たとえば、「画像の処理と認識」,安居院猛著,昭晃堂発行などを参照)。
From this, the extraction line
データ処理対象追記情報特定処理部150は、差分抽出部132による差分抽出結果に基づいて、具体的には、抽出線分途切れ補正部148で補正されたデータ処理対象追記情報9aに基づいて、追記済文書8Bにおける第1のデータ処理用の追記情報の記入内容を第2のデータ処理用の追記情報と分離して認識する第1データ処理用追記情報認識部154と第2のデータ処理用の追記情報の記入内容を第1のデータ処理用の追記情報と分離して認識する第2データ処理用追記情報認識部164とを有している。
The data processing target additional information specifying
データ処理対象追記情報特定処理部150としては、第1データ処理用追記情報認識部154は、付加情報記入済教材81における採点記号87の記入内容をコメント88と分離して認識し、また、第2データ処理用追記情報認識部164は、付加情報記入済教材81におけるコメント88の記入内容を採点記号87と分離して認識する。
As the data processing target additional information specifying
各データ処理用追記情報認識部154,164は、抽出線分途切れ補正部で補正されたデータ処理用追記情報の記入内容に対して形状認識処理を行なうことでデータ処理用追記情報の記入内容を認識する図形形状認識部156,166と、抽出線分途切れ補正部で補正されたデータ処理用追記情報の記入内容に対して文字認識処理を行なうことでデータ処理用追記情報の記入内容を認識するする文字認識部157,167と、図形形状認識部156,166や文字認識処理部157,167により認識された各データ処理用追記情報の記入内容の、文書原本8A(追記済文書8B)上における記入位置を認識する記入位置認識部158,168とを有している。図形形状認識部156,166および文字認識処理部157,167により、採点記号87とコメント88とを分離して認識する分離認識処理部155が構成される。
Each of the data processing additional information recognition units 154 and 164 performs the shape recognition process on the data processing additional information that has been corrected by the extraction line segmentation correction unit, so that the data processing additional information is entered. Recognize the entry contents of the additional information for data processing by performing character recognition processing on the entry contents of the additional information for data processing corrected by the figure shape recognition sections 156 and 166 and the extraction line segmentation correction section. On the original document 8A (additional document 8B) of the entry contents of the additional information for data processing recognized by the character recognition units 157 and 167 and the figure shape recognition units 156 and 166 and the character recognition processing units 157 and 167. There are entry position recognition units 158 and 168 for recognizing the entry position. The figure shape recognition units 156 and 166 and the character recognition processing units 157 and 167 constitute a separation recognition processing unit 155 that recognizes the
文字認識処理部157,167を設けない場合や文字認識処理部157,167で文字認識できなかったデータ処理用追記情報の部分に関しては、抽出されたデータ処理用追記情報をそのまま画像として取り扱うことにする。 In the case where the character recognition processing units 157 and 167 are not provided or the data processing additional information portion that cannot be recognized by the character recognition processing units 157 and 167, the extracted additional information for data processing is handled as an image as it is. To do.
なお、図示のように、図形形状認識部156,166、文字認識処理部157,167、並びに記入位置認識部158,168とは、それぞれ1つの機能部が双方の機能を実現する構成としてもよいし、それぞれを個別の機能部として独立に設けてもよい。 As shown in the figure, each of the figure shape recognizing units 156 and 166, the character recognition processing units 157 and 167, and the entry position recognizing units 158 and 168 may be configured such that one function unit realizes both functions. However, they may be provided independently as individual functional units.
たとえば、付加情報記入済教材81を処理対象とする構成においては、第1データ処理用追記情報認識部154は、採点記号87を第1のデータ処理用の追記情報とするものであり採点記号認識部として機能する。この場合、採点記号87についての図形形状認識部156は、採点記号87の記入内容が「正解(○)」または「不正解(×)」または「一部正解(△)」であるかなどを図形の側面から認識することができればよく、たとえば「○」,「×」,「△」の図形形状とのパターンマッチングによって形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から形状を認識してもよい。特徴量としては、たとえば、穴の個数や外接矩形に占める対象図形の面積率などを使用することができる。
For example, in the configuration in which the additional information filled-in
また、採点記号87について文字認識処理部157は、採点記号87の記入内容が「正解(○)」または「不正解(×)」または「一部正解(△)」であるかなどを文字の側面から認識することができればよい。なお、採点記号87は図形のみであるとする場合には、文字認識処理部157を割愛することもできる。
The character recognition processing unit 157 for the
また、採点記号87についての記入位置認識部158は、たとえば、教育用教材80上における座標解析によって、付加情報記入済教材81上の採点記号87の記入内容の記入位置を認識すればよい。
Further, the entry position recognition unit 158 for the
ここで、本実施形態の構成においては、認識性能情報提示処理部190を設けて、追記情報処理装置10の各機能部における複数の処理から、それぞれ認識率に関わる情報を収集し、記入内容を自動認識した追記情報の中で、特に信頼度の低い難認識情報のみを提示して修正を促すようにしているので、全ての追記情報について、修正の要否をチェックする必要が無く、誤認識の追記情報の修正作業を効率的に実行することができる。もちろん、その結果として、各データ処理用追記情報認識部154,164における認識率を向上させることができる。
Here, in the configuration of the present embodiment, a recognition performance information
なお、図形形状認識部156は、採点記号87に関する形状認識の際には、「○」や「×」などの採点記号87を示す図形を構成する連続画素群を1つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入位置認識部158による位置認識の際にも、そのラベリング処理の結果を利用して、「○」や「×」などの採点記号87を示す図形を構成する連続画素群を1つの纏まりとして取り扱う。
Note that the figure shape recognizing unit 156, when recognizing the shape related to the
また、記入位置認識部158は、採点記号87の記入位置の認識処理に当たって、付加情報記入済教材81上に複数の採点記号87が記入されていることが一般的であるから、その複数の採点記号87のそれぞれについて順次予め定められた走査順で検出される採点記号87について、順にその位置を認識していく。
In addition, since the entry position recognition unit 158 generally recognizes the entry position of the
各採点記号87に関する位置認識は、たとえば「○」や「×」などの採点記号87を示す図形(あるいは文字)の外接矩形情報を算出し、さらにその外接矩形の中心座標を算出することによって行なうことが考えられる。具体的には、認識対象となる図形もしくは文字(連続画素群)に対して外接矩形を抽出するとともに、その外接矩形の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)を算出する。そして、これらの算出結果から、中心x座標=x+w/2、中心y座標=y+h/2を算出し、その算出結果を連続画素群の位置、すなわち採点記号87の記入位置の認識結果とする。
Position recognition regarding each scoring
一方、第2データ処理用追記情報認識部164は、コメント88を第2のデータ処理用の追記情報とするコメント認識部として機能する。この場合、コメント88についての図形形状認識部166は、コメント88の追記内容を図形の側面から認識することができればよく、たとえば「1重線」や「2重線」や「(1重または2重の)波線」などの線を示す図形形状とのパターンマッチングによって線に関する形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から線の形状を認識してもよい。特徴量としては、たとえば、線数や外接矩形に対する画素密度などを使用することができる。 On the other hand, the second data processing additional information recognition unit 164 functions as a comment recognition unit that uses the comment 88 as the second data processing additional information. In this case, the graphic shape recognition unit 166 for the comment 88 only needs to be able to recognize the additional content of the comment 88 from the side surface of the graphic. For example, “single line”, “double line”, “(single or double) The shape of the line may be recognized by pattern matching with a graphic shape indicating a line such as a “double wavy line”. Alternatively, the feature amount of the recognition target figure may be calculated, and the line shape may be recognized from the feature amount. As the feature amount, for example, the number of lines, the pixel density for the circumscribed rectangle, or the like can be used.
また、コメント88について文字認識処理部167は、付加情報記入済教材81におけるコメント88の記入内容を文字の側面から認識することができればよい。また、コメント88についての記入位置認識部168は、たとえば、教育用教材80上における座標解析によって、付加情報記入済教材81上のコメント88の追記内容の記入位置を認識すればよい。
In addition, the character recognition processing unit 167 only needs to be able to recognize the content of the comment 88 in the additional information filled
なお、図形形状認識部166は、コメント88に関する形状認識の際には、「2重線」や「花丸」などのコメント88を示す図形を構成する連続画素群を1つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入位置認識部168による位置認識の際にも、そのラベリング処理の結果を利用して、「2重線」や「花丸」などのコメント88を示す図形を構成する連続画素群を1つの纏まりとして取り扱う。 Note that, when the shape recognition unit 166 recognizes the shape of the comment 88, the continuous shape pixel group constituting the graphic indicating the comment 88 such as “double line” and “flower circle” is handled as one. In addition, a labeling process, which is a general image processing technique, is performed to give an identifier to the continuous pixel group. Therefore, even when the position is recognized by the entry position recognizing unit 168, a group of continuous pixels constituting a figure indicating the comment 88 such as “double line” or “flower circle” is used by using the result of the labeling process. Are treated as one group.
また、記入位置認識部168は、コメント88の記入位置の認識処理に当たって、付加情報記入済教材81上に複数のコメント88が記入されていることが一般的であるから、その複数のコメント88のそれぞれについて順次予め定められた走査順で検出されるコメント88について、順にその位置を認識していく。
The entry position recognition unit 168 generally has a plurality of comments 88 written on the additional information filled
各コメント88に関する位置認識は、たとえばコメント文や「2重線」や「花丸」などのコメント88の文字や図形の外接矩形情報を算出し、さらにその外接矩形の中心座標を算出することによって行なうことが考えられる。具体的には、認識対象となる文字や図形(連続画素群)に対して外接矩形を抽出するとともに、その外接矩形の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)を算出する。そして、これらの算出結果から、中心x座標=x+w/2、中心y座標=y+h/2を算出し、その算出結果を連続画素群の位置、すなわちコメント88の記入位置の認識結果とする。 Position recognition for each comment 88 is performed by, for example, calculating circumscribing rectangle information of a comment sentence, characters and figures of the comment 88 such as “double line” and “Hanamaru”, and further calculating the center coordinates of the circumscribing rectangle. It is possible to do it. Specifically, a circumscribed rectangle is extracted from a character or figure (continuous pixel group) to be recognized, and the xy coordinates of a predetermined point (for example, the upper left vertex) of the circumscribed rectangle, and the width of the circumscribed rectangle ( W) and height (h) are calculated. Then, from these calculation results, the center x coordinate = x + w / 2 and the center y coordinate = y + h / 2 are calculated, and the calculation result is set as the recognition result of the position of the continuous pixel group, that is, the comment 88 entry position.
また、この位置認識の際には、各コメント88は、ある位置の解答欄84への採点記号87と対応して、その近傍に記入されることが多いので、記入位置認識部158による採点記号87についての位置認識と協働して処理を行なうのがよい。こうすることで、双方の位置情報の各解答欄84との対応付け、結果としては、採点記号87とコメント88との関連付けが容易になる。
Also, in this position recognition, each comment 88 is often written in the vicinity thereof in correspondence with the
データ処理部170は、文書入力装置20から入力された追記済文書8Bの画像データについて、その追記済文書8Bに記入された第1のデータ処理対象追記情報に関する第1のデータ処理を実行する第1データ処理部170_1と、第2のデータ処理対象追記情報に関する第2のデータ処理を実行する第2データ処理部170_2を有する。
The
各データ処理部170_1,170_2は、データ処理対象の追記情報の記入位置を、当該記入欄の位置情報を保存している装置(テンプレート情報データベースDB1や文書原本情報データベースDB2として機能する文書管理サーバ30)にアクセスして、記入欄位置領域情報38、記入欄位置領域情報68、あるいはテンプレート関連付け情報69を参照して取得しつつ、追記情報の記入位置と追記情報とを対応付けながらデータ処理を実行する。
Each of the data processing units 170_1 and 170_2 sets the entry position of the additional information to be processed as data processing apparatuses (the
第1データ処理部170_1は、追記済文書8Bの一例である付加情報記入済教材81の画像データについて、その付加情報記入済教材81に記入された採点記号87を元に採点集計を行なう採点集計部172と、採点集計部172による採点集計の結果を、解答者抽出部134が抽出した解答者情報と関連付けて出力する集計結果出力部174とを備えている。採点集計結果と解答者情報とが関連付けられた状態の処理結果を特に採点認識結果と称する。
The first data processing unit 170_1 performs scoring and summarization on the image data of the additional information filled
採点集計部172は、図形形状認識部156による採点記号87の追記内容の図形の側面からの認識結果や文字認識処理部157による採点記号87の追記内容の文字情報の側面からの認識結果と、記入位置認識部158による採点記号87の記入位置の認識結果と、文書入力装置20が保持蓄積している付加情報記入済教材81に対応する教育用教材80の電子データ(原本画像)に含まれる教育用教材80(付加情報記入済教材81)の各解答欄84についての配点欄83で規定されている配点情報とに基づいて、文書入力装置20が読み取った付加情報記入済教材81について、付加情報記入済教材81に記入された採点記号87に関する採点処理および集計処理(纏めて採点集計という)を行なう。
The
集計結果出力部174は、採点集計部172により集計された採点集計結果と解答者抽出部134が抽出した解答者情報と関連付けて、処理結果保存サーバ40(処理結果データベース装置や処理結果ファイルサーバ装置など)に登録する。あるいは、採点結果の点数を付加情報記入済教材81の集計欄83bに記入し用紙上に返却答案81bとして出力して生徒などに返却できるようにする。
The counting
また、第2データ処理部170_2は、追記済文書8Bの一例である付加情報記入済教材81の画像データについて、その付加情報記入済教材81に記入されたコメント88を元に分類処理を行なうコメント分類処理部176と、コメント分類処理部176による分類結果を集計結果出力部174が出力した採点認識結果や各解答に関連付けて出力するコメント処理結果出力部178とを備えている。
In addition, the second data processing unit 170_2 performs a classification process on the image data of the additional information filled
コメント分類処理部176は、図形形状認識部166によるコメント88の追記内容の図形の側面からの認識結果や文字認識処理部167によるコメント88の追記内容の文字情報の側面からの認識結果と、記入位置認識部168によるコメント88の記入位置の認識結果と、コメント88の追記内容と対応するように予め規定されている分類情報とに基づいて、文書入力装置20が読み取った付加情報記入済教材81について、その付加情報記入済教材81に記入されたコメント88の分類処理を行なう。
The comment
コメント処理結果出力部178は、コメント分類処理部176による分類結果を各解答欄や集計結果出力部174が出力した採点認識結果と関連付けて、処理結果保存サーバ40(処理結果データベース装置や処理結果ファイルサーバ装置など)に登録する。
The comment processing result output unit 178 associates the classification result by the comment
なお、採点記号87の記入は、一般に教育用教材80上の複数の解答欄84のそれぞれに対応して行なわれ、またコメント88の記入は、採点記号87の記入に付随してその採点記号87の近傍に必要に応じて記入され、かつ採点記号87,コメント88は教師などの採点官によって手書きでされるため、各解答欄84に対する記入位置が必ずしも一義的に定まっている訳ではない。
Note that the
その一方で、採点記号87の採点集計に当たっては、各解答欄84と採点記号87の記入位置との対応を明確にする必要がある。採点記号87に関する採点集計は、各解答欄84に対応する採点記号87の記入結果を明確にした上で、採点記号87の内容(正解か不正解か一部正解かなど)および各解答欄84についての配点に基づいて行なわれるからである。同様に、コメント88についての分類処理に当たっては、各解答欄84(つまり採点記号87)とコメント88の記入位置との対応を明確にする必要がある。コメント88に関する分類処理は、各解答欄84に対応するコメント88の記入結果を明確にした上で、コメント88の内容に基づいて行なわれるからである。
On the other hand, when scoring the
このことから、採点集計部172やコメント分類処理部176は、以下に述べるような手順で、採点記号87の採点集計やコメント88の分類処理を行なう。たとえば、採点集計部172やコメント分類処理部176は、記入位置認識部158,168で特定される「○」や「×」などの採点記号87やコメント88の外接矩形が、付加情報記入済教材81上で解答欄84となる領域との重なるものがあるか否かを判定し、重なる解答欄84と採点記号87やコメント88とを互いに対応付け、その採点記号87やコメント88を解答欄84に対して記入された採点記号87やコメント88の判定結果とする第1の対応付け手法を採用することができる。
From this, the
ただし、1つの採点記号87やコメント88が複数の解答欄84の領域に重なる場合には、何れに対応させるべきかを特定することはできないので、第1の対応付け手法による対応付けについての判定が不能であると判断する。また、注目する採点記号87やコメント88の外接矩形が、何れの解答欄84の領域にも重ならない場合にも、何れに対応させるべきかを特定することはできないので、第1の対応付け手法による対応付けについての判定が不能であると判断する。
However, when one
また、採点集計部172やコメント分類処理部176は、記入位置認識部158,168で特定される採点記号87やコメント88の外接矩形と、付加情報記入済教材81上で解答欄84となる領域との重なり面積を求め、その面積(外接矩形に対する面積比でも同様)が最も大きくなる採点記号87やコメント88と解答欄84とを互いに対応付け、その採点記号87やコメント88を解答欄84に対して記入された採点記号87やコメント88の判定結果とする第2の対応付け手法を採用することができる。
In addition, the
この第2の対応付け手法を採用すると、1つの採点記号87やコメント88が複数の解答欄84の領域に重なる場合に第1の対応付け手法にては対応付けの特定ができない場合でも、重なり面積の大小に基づいて、何れに対応させるべきかを判定することができる。ただし、重なり面積の外接矩形に対する比が所定閾値未満の場合には、重なる部分が小さいことから、対応付けについての判定が不能であると判断する。
When this second association method is adopted, even if one
あるいは、採点集計部172やコメント分類処理部176は、記入位置認識部158,168で特定される各採点記号87やコメント88の中心座標位置と各解答欄84の中心座標位置の距離を求め、その距離が最も小さくなる採点記号87やコメント88と解答欄84とを互いに対応付け、その採点記号87やコメント88を解答欄84に対して記入された採点記号87やコメント88の判定結果とする第3の対応付け手法を採用することができる。
Alternatively, the
この第3の対応付け手法を採用すると、注目する採点記号87やコメント88の外接矩形が何れの解答欄84の領域にも重ならない場合に第1の対応付け手法にては対応付けの特定ができない場合や、採点記号87やコメント88が解答欄84からずれて記入されて重なる部分が小さく、重なり面積の外接矩形に対する比が所定閾値未満の場合に第2の対応付け手法にては対応付けの特定ができない場合でも、何れに対応させるべきかを判定することができる。ただし、各解答欄84との間の各距離の差が所定閾値未満の場合には、距離差が小さいことから、対応付けについての判定が不能であると判断する。
When this third matching method is adopted, the first matching method specifies the correspondence when the circumscribed rectangle of the
そして、各採点記号87の解答欄84への対応付けを行なった後は、採点記号87が「○」であれば、これに対応する解答欄84についての配点情報から特定される配点を加算し、また採点記号87が「×」であれば、これに対応する解答欄84についての配点加算を行なわず、このような採点集計を付加情報記入済教材81上の全ての解答欄84について行なう。
Then, after associating each
なお、付加情報記入済教材81上で解答欄84となる領域は、各解答欄84についての配点情報として、または当該配点情報と同様に、付加情報記入済教材81に対応する文書管理サーバ30に登録されている原本画像に含まれる記入欄位置領域情報38によって特定されるものとする。
In addition, the area that becomes the
また、各コメント88の解答欄84への対応付けを行なった後は、コメント88に対応する分類基準から特定される分類先を特定し、このようなコメント分類処理を付加情報記入済教材81上の全てのコメント88について行なう。
In addition, after associating each comment 88 with the
なお、採点集計部172での採点集計処理やコメント分類処理部176での分類処理に当たっては、完全なる自動処理にしてもよいが、ユーザ端末171のCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)などで構成された表示部に処理過程や処理結果を表示して、適宜、操作者が処理過程や処理結果をキーボードやマウスなどの指示入力部を介して訂正できるようにしてもよい。
Note that the scoring and summarizing process in the scoring and summarizing
また、本実施形態の特徴部分である 認識性能情報提示処理部190は、手書き入力情報の履歴を収集しデータベースとしての処理結果保存サーバ40に保存・蓄積しておく追記情報認識履歴保持部192と、一定の度合いよりも認識の困難であった特に信頼度の低い難認識情報を抽出する難認識追記情報抽出部194と、所定の表示態様に従って認識性能情報をユーザ端末171上で提示する認識性能情報提示部198とを有している。
The recognition performance information
追記情報認識履歴保持部192は、後述する第1〜第3の履歴収集保存手法の何れかもしくはその任意の組合せの履歴収集保存手法を採用して、手書き入力情報の履歴を収集し、この収集した手書き入力情報の履歴を処理結果保存サーバ40に保存する。
The additional information recognition
手書き入力情報の履歴を収集しデータベースに保存しておく際には、どの時点で記入されたものを履歴として残しておくかによって、様々な履歴収集保存手法を採るこができる。たとえば、通常の自動データ処理の過程で認識した手書き入力情報のデータを蓄積し保存していく第1の履歴収集保存手法を採ることが考えられる。第1の履歴収集保存手法を採る際には、手書き入力情報のみを元の文書原本8Aから分離して保存することも考えられるし、手書き入力情報を含む所定範囲の画像情報をも一緒にして、つまり周囲の画像ごとに保存することも考えられる。 When collecting the history of handwritten input information and storing it in the database, various history collection and storage techniques can be adopted depending on at what point the entry is made as a history. For example, it is conceivable to adopt a first history collection and storage method in which handwritten input information data recognized in the process of normal automatic data processing is accumulated and stored. When adopting the first history collection and storage method, it is conceivable that only handwritten input information is stored separately from the original document original 8A, or together with a predetermined range of image information including handwritten input information. In other words, it may be possible to save each surrounding image.
第1の履歴収集保存手法を採ると、通常の処理過程で履歴を取って保存していくことができるので、形状や位置や修正状況などのデータを利用することができる。また、特別な手間を掛けずに、採点法などの記入態様をチェックすることができる、しかも、認識の正誤も反映させることができる。ただし、当初は履歴が少なく、また、ユーザによる入力態様の改善も期待できないので認識率が低く、修正の手間が掛かる可能性はある。 If the first history collection and storage method is adopted, the history can be collected and stored in the normal process, so that data such as the shape, position, and correction status can be used. Moreover, it is possible to check the entry mode such as the scoring method without taking any special effort, and also to reflect the correctness of the recognition. However, there is little history at the beginning, and since the improvement of the input mode by the user cannot be expected, the recognition rate is low, and there is a possibility that it takes time for correction.
また、通常の自動データ処理の過程ではなく、その処理開始前に、練習用答案などの練習用の文書原本8Aに入力してもらい、その入力情報のデータを蓄積し保存しておく第2の履歴収集保存手法を採ることが考えられる。この第2の履歴収集保存手法を採ると、練習用の記入情報を指定することができるから、修正を考慮しなくてよい。用意された練習用答案などに追記し、通常の自動採点処理を行なう過程で、記入形状も指定されるからである。また、図形形状や文字形状と位置を判定し、認識の正誤も含めて結果を提示できる利点もある。 Also, it is not a normal automatic data processing process, but before the processing is started, the input is made to the practice document original 8A such as a practice answer, and the input information data is accumulated and stored. It is possible to adopt a history collection and storage method. If this second history collection and storage method is adopted, entry information for practice can be designated, so that correction need not be considered. This is because, in the process of adding to the prepared practice answer and performing the normal automatic scoring process, the entry form is also specified. In addition, there is an advantage that a figure shape, a character shape, and a position can be determined, and the result can be presented including correct or incorrect recognition.
加えて、事前に採点法などの記入態様を練習することができるので、正しい形と位置とを確認でき、認識性能のよい状態での記入が期待でき、その結果として、実際の自動データ処理時には修正を要しない利点が得られる。また、白紙部分に記入させることもできるので、指定された記入情報に対する手書き入力情報のみを保存すればよいので、蓄積容量を低減できる。 In addition, you can practice writing methods such as scoring methods in advance, so you can confirm the correct shape and position, you can expect entry with good recognition performance, and as a result, during actual automatic data processing The advantage is that no modification is required. Further, since it is possible to fill in a blank portion, it is only necessary to save handwritten input information for the designated entry information, so that the storage capacity can be reduced.
また、自動データ処理には使用しなかった過去の追記済文書8B(たとえば過去の採点答案)における入力情報のデータを蓄積し保存する第3の履歴収集保存手法を採ることが考えられる。なお、自動データ処理を行なっていないので、白紙の文書原本8Aを付加して読み取ることで差分を抽出して、手書き入力情報のみを抽出するようにする。また、自動データ処理の全行程は行なわずに、形状認識や文字認識のみを行ない、結果を提示するだけにすればよい。 Further, it is conceivable to adopt a third history collection and storage method for accumulating and storing input information data in a past additionally written document 8B (for example, a past scoring answer) that has not been used for automatic data processing. Since automatic data processing is not performed, the difference is extracted by adding and reading the blank document original 8A, and only the handwritten input information is extracted. In addition, it is only necessary to perform shape recognition and character recognition without presenting the entire process of automatic data processing and present the result.
この第3の履歴収集保存手法を採ると、過去の追記文書を利用できるため、はじめて自動データ処理を使用する場合でも、手書き入力情報に関して認識性能を改善させるための修正手法を提示することができ、実際の自動データ処理時には修正が少なくて済む利点が得られる。また、練習用の文書原本8Aを作成する手間を省くことができる。ただし、結果の正誤は不明のため、正誤を踏まえた判定はできない。 By adopting this third history collection and storage method, past appended documents can be used, so even when automatic data processing is used for the first time, a correction method for improving recognition performance with respect to handwritten input information can be presented. In the actual automatic data processing, there is an advantage that less correction is required. Further, it is possible to save the trouble of creating the original document 8A for practice. However, since the correctness of the result is unknown, determination based on correctness cannot be made.
難認識追記情報抽出部194は、後述する各種の手法の何れかもしくはその任意の組合せの難認識追記情報抽出手法を採用して、各種の手書き入力情報の内、信頼度が一定レベルよりも低い自動認識が困難であった難認識情報を抽出する。
The difficult recognition additional record
認識性能情報提示部198は、後述する各種の手法の何れかの認識性能情報提示手法を採用して、認識性能情報をユーザ端末171上でユーザに提示する。
The recognition performance
<全体の処理手順>
図3および図4は、情報処理システムの一実施形態である教材自動採点システム1における教材処理方法の処理動作の手順を説明する図である。ここで、図3は、その全体概要をシステム構成図と対応付けて示しており、また図4は、教材処理手順を示すフローチャートである。
<Overall procedure>
3 and 4 are diagrams for explaining the procedure of the processing operation of the teaching material processing method in the teaching material
先ず、教育用教材80を完成させ文書原本情報データベースDB2に登録する(S104)。なお、各記入欄6aに配点が設定されていない形態のテンプレート6を使用する場合には、解答欄84として設定した記入欄6aに関しては配点の情報も設定する。
First, the educational material 80 is completed and registered in the original document information database DB2 (S104). In addition, when using the
この後、試験を実行する際には、文書原本情報データベースDB2から教育用教材80を読み出して印刷し生徒や受験者に配布する(S106)。そして、試験終了後に、採点官は採点記号87やコメント88を生徒の解答に対して追記する(S108)。
Thereafter, when the test is executed, the educational material 80 is read from the original document information database DB2, printed, and distributed to students and examinees (S106). After the test, the grader adds a
追記情報処理装置10(特に教材自動採点システム1においては教材処理装置に該当する)を利用する場合には、先ず、生徒などによって解答者情報欄86への氏名などの記入および解答欄84への解答記入、つまり生徒による第1種の付加情報の記入がされ、さらに教師などによって各解答欄84に記入された解答に対する「○」や「×」などの採点記号87やコメント88などの第2種の付加情報の記入がされた付加情報記入済教材81について、文書入力装置20は、その付加情報記入済教材81を読み取り(S110)、その付加情報記入済教材81を表わす画像データを追記情報処理装置10に入力する(S112)。文書入力装置20は、この文書入力装置20による画像読取りによって得られた画像データについて、一旦ワークエリアとして用いられるメモリなどに保持しておく。
In the case of using the postscript information processing apparatus 10 (particularly corresponding to the teaching material processing apparatus in the teaching material automatic scoring system 1), first, a student enters a name in the answerer information column 86 and enters the answering
なお、このとき、文書入力装置20にてADF装置を用いれば、たとえば同一学級のような1つのグループに纏めて処理すべき複数の付加情報記入済教材81について、一括して読み取り(一括スキャン)、各付加情報記入済教材81に対応する画像データを連続的に追記情報処理装置10に入力することができる。
At this time, if the
追記情報処理装置10は、文書入力装置20から取り込んだ各付加情報記入済教材81の画像データに対して、順次、次のような付加情報抽出・分離処理、付加情報特定処理、および自動採点処理並びに自動コメント処理といった付加情報終末処理を実行する。
The additional recording
たとえば、データ処理部170における自動採点処理並びに自動コメント処理に先立って、ある1つの付加情報記入済教材81から得られた画像データについて、読取画像処理部110の画像データ解析部は解析処理を行ない(S122)、教材特定部122は、その解析処理の結果に基づいて付加情報記入済教材81に対応する元の教育用教材80の識別特定を行なう(S124)。
For example, prior to automatic scoring processing and automatic comment processing in the
この識別特定(S124)は、たとえば「理科」「5年」「1.天気と気温の変化」といった識別情報解析部によるタイトル解析または識別情報欄85に埋め込まれたコード情報についてのコード情報解析部によるコード解析を通じて行なえばよい。この識別特定を経ることで、教材特定部122では、文書入力装置20により得られた付加情報記入済教材81の画像データとの比較対象となる教育用教材80の電子データ(原本画像)を特定することができる。
This identification specification (S124) is, for example, a title analysis by an identification information analysis unit such as “science”, “5 years”, “1. change in weather and temperature” or a code information analysis unit for code information embedded in the
なお、この識別特定は、文書入力装置20が画像読取りを行なった複数の付加情報記入済教材81のそれぞれについて順次行なうことも考えられるが、一般に1つのグループに纏めて処理される付加情報記入済教材81は全て同一のものであるため、その纏めて処理される中で最初に処理される付加情報記入済教材81についてのみ行なえばよい。
This identification and identification may be performed sequentially for each of the plurality of additional information-filled
教材特定部122により各付加情報記入済教材81に対応する教育用教材80の特定が完了すると、文書管理サーバ30は、その特定結果に従いつつ、保持蓄積している中から該当する教育用教材80の原本画像(電子データ)を取り出して、これを差分抽出部132へ受け渡す(S126)。
When the teaching
また、歪み補正部は、ある1つの付加情報記入済教材81から得られた画像データの歪みを補正する(S128)。この画像歪み補正は、文書入力装置20での画像読取りの際に生じ得る画像歪みを補正するために行なうものであり、その後に差分抽出部132にて行なう原本画像との比較や差分抽出などの精度向上を図るためのものである。
Further, the distortion correction unit corrects the distortion of the image data obtained from a certain additional information-added teaching material 81 (S128). This image distortion correction is performed in order to correct image distortion that may occur when the
差分抽出部132は、文書管理サーバ30から受け渡された原本画像(教育用教材80)と、文書入力装置20から入力され、歪み補正部により画像歪みが補正された後の画像データ(付加情報記入済教材81)とを、それぞれ比較して、その差分を抽出する(S130)。差分抽出部132は、抽出した差分情報9を解答者抽出部134やデータ処理用追記情報抽出処理部140に渡す。
The
差分抽出部132による差分抽出によって、たとえば図3中の中央部分に示すように、解答者情報欄86および各解答欄84への解答者による第1種の付加情報の記入内容、並びに各解答欄84に対する採点記号87やコメント88などの採点官による第2種の付加情報の記入内容のみで表わされる差分情報9が抽出されることになる。
By the difference extraction by the
解答者抽出部134は、差分情報9に対する文字認識処理部による文字認識処理などを通じて、文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報を抽出する(S132)。これにより、ある1つの付加情報記入済教材81に解答を記入した解答記入者の学級、出席番号、氏名などを特定できる。
The
また、データ処理用追記情報抽出処理部140において、先ず追記部材特定部141は、データ処理の対象となる追記情報の記入に使用されたペン色である追記色を特定し(S141)、データ処理対象追記情報抽出部は、追記部材特定部141にて特定された追記色に基づき、差分抽出部132による差分抽出結果に対して、データ処理用の追記情報を抽出する(S142)。
In the data processing additional information
本例の場合、各解答欄84への採点記号87やコメント88の追記内容を抽出するために、その差分情報9からさらに所定色成分についてのもの、具体的にはたとえば赤色成分のものを抽出する。所定色成分の抽出は、たとえば差分抽出結果が画素データからなる場合であれば、その画素データを構成する色成分データに着目することで行なうことができる。
In the case of this example, in order to extract the additional contents of the
抽出線分途切れ補正部は、データ処理対象追記情報抽出部による抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理、あるいは線図形の直線近似などの追記情報整形処理を適宜実行する(S146)。抽出線分途切れ補正部は、途切れ補正処理済の採点記号87の抽出結果を採点記号認識部として機能する第1データ処理用追記情報認識部154に渡し、また途切れ補正処理済のコメント88の抽出結果をコメント認識部として機能する第2データ処理用追記情報認識部164に渡す。
The extracted line segmentation correction unit appropriately executes additional information shaping processing such as thinning processing, end point extraction processing, end point connection processing, or linear approximation of line figures, on the extraction result of the data processing target additional information extraction unit. (S146). The extracted line segment break correction unit passes the extraction result of the
データ処理対象追記情報特定処理部150は、先ず、分離認識処理部155を構成する図形形状認識部156,166および文字認識処理部157,167が協働して、文書管理サーバ30に保存されている解答欄84の位置情報を参照して、採点記号87とコメント88とを分離し(S162)、この後、分離した採点記号87とコメント88の別に、記入内容の特定処理や記入位置の特定処理を実行する。
The data processing target additional information specifying
図形形状認識部156や文字認識処理部157は、コメント88と分離した採点記号87について(S163−採点記号)、採点記号87の記入内容に対する形状認識あるいは文字認識により、その採点記号87の記入内容が「正解」であるかあるいは「不正解」であるかなど、採点記号87で示された採点官の採点結果を特定する(S164)。このとき、ユーザによる修正指示を受け付ける(S165)。続いて、記入位置認識部158は、採点記号87の記入内容について、その付加情報記入済教材81上における記入位置を認識する(S166)。
The graphic shape recognition unit 156 and the character recognition processing unit 157, regarding the
このようにして、記入位置認識部158が採点記号87の記入位置を認識した後は、採点集計部172は、図形形状認識部156や文字認識処理部157による採点記号87の記入内容の認識結果と、記入位置認識部158による採点記号87の記入位置の認識結果と、文書管理サーバ30が保持蓄積している付加情報記入済教材81に対応する原本画像(教育用教材80)に含まれる教育用教材80の各解答欄84についての配点情報とに基づいて、採点および集計を行なう(S168)。
After the entry position recognizing unit 158 recognizes the entry position of the
集計結果出力部174は、その採点・集計の結果を処理結果保存サーバ40に保存する(S169)。あるいは採点結果の点数が付加情報記入済教材81の集計欄83bに記入されて返却答案81bとして生徒などに返却される。
The total
各付加情報記入済教材81についての採点結果(問題別採点結果)のファイル形式としては、たとえば、図3に示すように、付加情報記入済教材81上に存在する問題の番号と、その問題の解答に対する正誤判定と、その正誤判定に基づく得点とからなる情報で、これらを互いに関連付けるテーブル形式である。また、集計結果のファイル形式としては、たとえば、図3に示すように、出席番号および解答者情報と、得点情報(集計欄83bに記入される項目点や合計点)とからなる情報で、これらを互いに関連付けるテーブル形式である。
As the file format of the scoring result (scoring result by problem) for each additional information filled
各付加情報記入済教材81上に記入される正誤判定の採点集計の結果が問題別採点結果としてファイル出力されるし、また、問題別の採点集計の結果がファイル出力されるので、処理結果保存サーバ40では、付加情報記入済教材81についての採点集計結果を、たとえば一覧形式で、管理または利用することが可能となる。
The result of scoring for correct / incorrect judgment entered on each additional information-added
図形形状認識部166や文字認識処理部167は、採点記号87と分離したコメント88について(S163−コメント)、コメント88の記入内容に対する形状認識あるいは文字認識により、採点官により追記されたコメント88の記入内容を特定する(S170)。このとき、ユーザによる修正指示を受け付ける(S171)。続いて、記入位置認識部168は、コメント88の記入内容について、その付加情報記入済教材81上における記入位置を認識する(S172)。
The graphic shape recognizing unit 166 and the character recognizing processing unit 167, regarding the comment 88 separated from the scoring symbol 87 (S163-comment), the comment 88 added by the grading officer by shape recognition or character recognition with respect to the entered content of the comment 88. The entry contents are specified (S170). At this time, a correction instruction from the user is accepted (S171). Subsequently, the entry position recognizing unit 168 recognizes the entry position on the additional information
このようにして、記入位置認識部168がコメント88の記入位置を認識した後は、コメント分類処理部176は、図形形状認識部166や文字認識処理部167によるコメント88の記入内容の認識結果と、記入位置認識部168によるコメント88の記入位置の認識結果と、文書管理サーバ30が保持蓄積している分類基準情報39とに基づいて、コメント88を分類する(S174)。
After the entry position recognizing unit 168 recognizes the entry position of the comment 88 in this way, the comment
コメント処理結果出力部178は、コメント分類処理部176で分類された各コメント88を、位置が近い採点記号87の採点結果と関連付けて(S178)、処理結果保存サーバ40に保存する(S179)。各コメント88についての分類結果のファイル形式としては、たとえば、図3に示すように、各コメントと近傍の採点記号87とからなる情報で、これらを互いに関連付けるテーブル形式である。なお、実際にテーブル形式で保存することに限らず、各コメント88と、このコメント88と対応する採点集計結果の両者を関連付ける関連付け情報とを対応付けて保存してもよい。
The comment processing result output unit 178 associates each comment 88 classified by the comment
各付加情報記入済教材81上に記入される採点記号87の採点集計結果とコメント88とが対応するようにデータ保存されるので、処理結果保存サーバ40では、付加情報記入済教材81についての採点集計結果とコメント88とを、たとえば一覧形式で、管理または利用することが可能となるし、生徒の能力分析や生徒指導にコメント88を利用できるようになる。
Since the score summation result of the
このように、情報処理システムの一実施形態として示した教材自動採点システム1では、採点記号87やコメント88の記入がされた付加情報記入済教材81から読み取った画像データと、その付加情報記入済教材81についての元の教育用教材80、すなわち解答欄84への解答記入などの生徒などによる第1種の付加情報および解答に対する採点官による採点記号87やコメント88などの第2種の付加情報の記入がされていないものについてのデータとを比較し、互いの差分から採点記号87やコメント88の記入内容を分離してその記入内容を特定し、その採点記号87についての採点集計とコメント88についての分類処理を実行するようになっている。
As described above, in the teaching material
したがって、採点記号87に関するデータ処理については、差分抽出部132で抽出される差分結果から、コメント88の記入内容を排除して採点記号87のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、自動採点に悪影響を及ぼすことがない。
Therefore, regarding the data processing related to the
また、採点結果の自動集計を実行できるので、結果として付加情報記入済教材81についての採点処理が省力化される。付加情報記入済教材81を紙媒体で入手するケースでは、付加情報記入済教材81を文書入力装置20で読み取った画像データを基にすればよく、たとえば、複写機、複合機、またはスキャナ装置などによって実現されるスキャン機能と、パーソナルコンピュータ(PC)などのコンピュータ機器が有する情報記憶処理機能、画像処理機能および演算処理機能とがあれば、システム構成を簡単に実現することができ、専用の機器を必要とすることもない。
In addition, since the scoring results can be automatically totaled, the scoring process for the additional information filled
さらには、付加情報記入済教材81の画像データを、文書管理サーバ30が保持する電子データと比較するため、その文書管理サーバ30に各種の教育用教材80についての電子データを保持蓄積しておけば、対応可能な付加情報記入済教材81についての汎用性を十分に確保し得る。さらには、文書管理サーバ30に予め電子データを保持蓄積しておくことで、文書管理サーバ30から取り込んだ画像データとの比較を行なう場合において、比較対象となる電子データの入力などを行なう手間を省くことができ、結果として迅速な採点処理を実現することができる。
Furthermore, in order to compare the image data of the additional information filled
また、コメント88に関するデータ処理については、差分抽出部132で抽出される差分結果から、採点記号87の記入内容を排除してコメント88のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、コメント88に関する分類処理に悪影響を及ぼすことがない。また、各採点記号87と対応付けて処理結果保存サーバ40に各コメント88を保存するようにしたので、コメント88を生徒などが確認する用途以外に、採点官自らが、能力分析や生徒指導に活用できるようになる。
In addition, regarding the data processing related to the comment 88, the entry content of the
<<認識性能情報提示処理>>
図5〜図16は、認識性能情報提示処理部190の処理の詳細、すなわち手書きで記入された文字や図形などの手書き入力情報の履歴を取る手法や、認識性能を向上させるための認識性能情報をユーザに提示する手法を説明する図である。
<< Recognition performance information presentation process >>
5 to 16 show details of the processing of the recognition performance information
本実施形態においては、文書原本8Aへ手書きで記入された手書き入力情報が自動認識に適しているか否かを判定し、認識性能上問題のあるものについては、どのように記入すれば認識率が向上するかをユーザ自身が判断することのできるようなサポート情報(認識性能情報)を提示する。 In this embodiment, it is determined whether or not the handwritten input information entered in the original document 8A by handwriting is suitable for automatic recognition. Support information (recognition performance information) is presented so that the user can determine whether or not to improve.
ここで、認識性能情報としては、認識性能を向上させるための修正手法をユーザ自身が具体的にまた容易に判断することのできるものであればよく、様々な提示態様を採ることができる。たとえば、何処をどう直せばいいかを示唆する情報を提示する態様を採ることができる。こうすることで、どのように記載すると認識性能がよくなるのかを簡単に判断することができる。 Here, the recognition performance information may be any information that allows the user himself / herself to specifically and easily determine a correction method for improving the recognition performance, and can take various presentation modes. For example, it is possible to adopt a mode of presenting information that suggests where and how to correct it. By doing so, it is possible to easily determine how the description improves the recognition performance.
あるいは、過去の記載の認識信頼度を提示する態様を採ることができる。こうすることで、どのように記載すると認識性能がどの程度になるかを容易に判断することができ、これを踏まえて、ユーザは、より認識性能がよくなる記載をすることができるようになる。 Or the aspect which presents the recognition reliability of the past description can be taken. By doing so, it is possible to easily determine how much the recognition performance is to be described, and based on this, the user can make a description that improves the recognition performance.
何れの提示態様を採っても、認識に適した手書き入力情報の記入を促すことができ、結果的に、認識率を向上させることができる。 Whichever presentation mode is adopted, entry of handwritten input information suitable for recognition can be promoted, and as a result, the recognition rate can be improved.
特に、本実施形態においては、難認識追記情報抽出部194は、追記情報処理装置10の各機能部における複数の処理から、それぞれ認識率に関わる情報を収集し、記入内容を自動認識した追記情報の中で、特に信頼度の低い難認識情報のみを特定し、認識性能情報提示部198は、難認識追記情報抽出部194にて特定された難認識情報について、その難認識情報の認識性能を向上させるための認識性能情報を提示して修正を促す。
In particular, in the present embodiment, the difficult-to-recognize additional write
自動認識性能との関係で、特に認識性能の劣る信頼度の低い難認識情報のみを提示することで、チェック頻度を少なくするのである。これにより、全ての追記情報について、修正の要否をチェックする必要が無く、誤認識の追記情報の修正作業を効率的に実行することができる。 In relation to automatic recognition performance, the check frequency is reduced by presenting only difficult-to-recognize information with particularly poor recognition performance and low reliability. Thereby, it is not necessary to check the necessity of correction for all the additional write information, and the correction work of the erroneous additional write information can be performed efficiently.
加えて、認識処理そのものにおける信頼度に関する特徴量だけでなく、この認識処理よりも前段の認識処理に関わる各種の処理における信頼度に関する特徴量も取得して認識情報を特定するので、修正を要する追記情報(難認識情報)を高精度に特定することができる。 In addition, not only the feature quantity related to the reliability level in the recognition process itself, but also the feature quantity related to the reliability level in various processes related to the recognition process preceding the recognition process is acquired and the recognition information is specified, so correction is required. Additional write information (difficulty recognition information) can be specified with high accuracy.
なお、手書き入力情報の認識性能情報をユーザに提示するに当たっては、先ず、手書き入力情報の履歴を取っておき、それらの認識時の信頼度を参考にして、認識性能向上のために改善要求度合いのより強いものに関して認識性能情報を提示するようにする。換言すれば、一定の度合いよりも認識の困難であった手書き入力情報(難認識情報)についてのみ、認識性能情報を提示する。こうすることで、認識性能を一定の水準以上にできるようにするのである。認識性能が一定の水準以上にできればよく、必ずしも、手書き入力情報が理想的な基準情報と完全に一致していることは必要ないのである。 In order to present the recognition performance information of handwritten input information to the user, first of all, a history of handwritten input information is saved, and the degree of improvement is requested in order to improve the recognition performance with reference to the reliability at the time of recognition. Present recognition performance information for strong ones. In other words, the recognition performance information is presented only for handwritten input information (difficult recognition information) that is more difficult to recognize than a certain degree. In this way, the recognition performance can be made higher than a certain level. The recognition performance only needs to be higher than a certain level, and it is not always necessary that the handwritten input information completely matches the ideal reference information.
手書き入力情報は、ほぼ確実に基準情報とのずれがあるから、過去に記入された全ての手書き入力情報について認識性能情報を提示していたのでは、認識性能との関係で、必要以上の情報を提示してしまう虞れがあるが、提示範囲を難認識情報の範囲に絞ることで、必要以上の情報提示を防止するのである。こうすることで、修正作業を効率的に実行することができるし、必要以上に矯正してしまう虞れを防止することもできる。 Since the handwritten input information is almost certainly different from the reference information, if the recognition performance information was presented for all handwritten input information entered in the past, the information more than necessary due to the recognition performance. However, it is possible to prevent unnecessary information presentation by narrowing the presentation range to the difficult recognition information range. By doing so, the correction work can be performed efficiently, and the possibility of correcting more than necessary can be prevented.
なお、一般的には、ユーザによって記入癖が異なるので、提示すべき改善態様もユーザごとに異なるから、手書き入力情報の履歴を取る際には、ユーザごとに履歴を取っておくのが好ましい。 In general, since the entry habits differ depending on the user, the improvement mode to be presented also differs for each user. Therefore, when taking a history of handwritten input information, it is preferable to keep a history for each user.
<信頼度情報に基づく難認識情報抽出>
また、難認識追記情報抽出部194において、一定の度合いよりも認識の困難であった難認識情報についてのみ認識性能情報を提示するに当たっては、分離認識処理部155にて通常の認識処理を行ない、難認識追記情報抽出部194は、その認識処理時の信頼度、換言すれば候補情報(基準情報)に対する類似度に基づいて難認識情報を抽出する。
<Extracting difficult recognition information based on reliability information>
In addition, in the difficult recognition additional record
また、本実施形態において、難認識追記情報抽出部194は、注目する追記情報に関して、データ処理対象追記情報特定処理部150における認識処理そのものを含む当該認識処理に関わる各種の処理(たとえば差分抽出部132からデータ処理対象追記情報特定処理部150までの各機能部の各処理)における、認識処理の信頼度に関する特徴量をそれぞれ取得し、この各特徴量に基づいて各処理の認識処理に関わるサブ信頼度をそれぞれ算出し、この算出したサブ信頼度に基づいて注目する付加情報に関しての最終的な信頼度を特定し、この最終的な信頼度が一定水準よりも低いか否かを判定することで難認識情報を特定する。
Further, in the present embodiment, the difficult recognition additional record
つまり、分離認識処理部155や記入位置認識部158,168における認識処理時の信頼度だけでなく、その前段の各機能部における各処理時の認識率や信頼度に関わる情報(特徴量)をも収集し、収集した各特徴量に基づいて各処理別のサブ信頼度を算出し、この算出した処理別のサブ信頼度に基づいて最終的な信頼度を求める。そして、この最終的な信頼度を元にして修正を要する難認識情報を特定するのである。 That is, not only the reliability at the time of recognition processing in the separation recognition processing unit 155 and the entry position recognition units 158 and 168 but also information (features) related to the recognition rate and reliability at the time of each processing in each functional unit in the preceding stage. Are also collected, sub-reliability for each process is calculated based on each collected feature amount, and final reliability is obtained based on the calculated sub-reliability for each process. And the difficult recognition information which needs correction based on this final reliability is specified.
特開2004−152115号公報に記載の仕組みでは、取得したデータに含まれる複数の項目について項目ごとに内容の確信度を計算し、計算された確信度を用いて修正提示の方法を動的に変化させるようにしているが、この場合、各項目の認識時にパターン認識の類似度を使用して「確信度」を算出するのみであるため、認識処理よりも前段の各種の前処理などで生じ得る、たとえば局所的なノイズの有無など、認識処理に影響を与える事象を考慮することができない。 In the mechanism described in Japanese Patent Application Laid-Open No. 2004-152115, a certainty factor is calculated for each item for a plurality of items included in acquired data, and a correction presentation method is dynamically used using the calculated certainty factor. However, in this case, since only the “certainty” is calculated using the similarity of pattern recognition when recognizing each item, it occurs in various pre-processing before the recognition processing. Events that affect the recognition process, such as the presence or absence of local noise, cannot be considered.
これに対して、本実施形態の難認識追記情報抽出部194では、データ処理対象追記情報特定処理部150よりも前段の各機能部における認識処理と関連する特徴量をも取得して総合的に類似度を算出することで難認識情報を特定するので、データ処理対象追記情報特定処理部150における認識の類似度やこの類似度に基づく確信度に基づいて難認識情報を特定する場合よりも、高精度に難認識情報を特定することができる。
On the other hand, in the difficult recognition additional record
すなわち、データ処理対象追記情報特定処理部150における認識処理の類似度だけでなく、データ処理対象追記情報特定処理部150よりも前段の処理をも含む各種の処理における、認識処理の信頼度に関する特徴量をそれぞれ取得し、この各特徴量に基づいて各処理の認識処理に関わるサブ信頼度をそれぞれ算出し、この算出したサブ信頼度に基づいて注目する付加情報に関しての最終的な信頼度を特定し、この最終的な信頼度が一定水準よりも低いか否かを判定することで難認識情報を特定するようにしているので、データ処理対象追記情報特定処理部150での認識処理よりも前段の各種の前処理などで生じ得る、局所的なノイズの有無などをも考慮して難認識情報を精度よく特定することができるのである。
In other words, not only the similarity of the recognition process in the data processing target additional information specifying
<履歴収集処理>
なお、各機能部における各処理別のサブ信頼度を算出する際には、分離認識処理部155における認識処理結果のデータベース登録に関わる全行程から、その前段の各機能部における各処理時の認識率や信頼度に関わる特徴量を収集する。
<History collection processing>
When calculating the sub-reliability for each process in each function unit, the recognition at the time of each process in each function unit in the previous stage is performed from all the processes related to the database registration of the recognition process result in the separation recognition process unit 155. Collect features related to rate and reliability.
また、認識率や信頼度は、追記情報そのものの種類(文字なのか図形なのか線なのか)や形状によって傾向が異なることもあり、また、処理対象の追記済文書8Bの状態とも関わりを持つこともあるので、これらの点を考慮して最終的な信頼度の取得ができるように、過去の統計情報を取っておき、サブ信頼度と過去の統計情報とに基づいて信頼度を算出する。 In addition, the tendency of the recognition rate and reliability may differ depending on the type (whether it is a character or a graphic or a line) and the shape of the postscript information itself, and is also related to the state of the postscripted document 8B to be processed. In view of these points, the past statistical information is saved so that the final reliability can be acquired, and the reliability is calculated based on the sub-reliability and the past statistical information.
たとえば、過去の自動データ処理としては、概ね、「○」の認識率(信頼度)は0.95で、「×」の認識率(信頼度)は0.9であったというように、採点記号87の別に、認識率(信頼度)が異なることがある。
For example, in the past automatic data processing, scoring is generally such that the recognition rate (reliability) of “◯” was 0.95 and the recognition rate (reliability) of “x” was 0.9. In addition to the
また、追記済文書8Bが写真や図形(クリップアート)を含むか否かで認識率(信頼度)は影響を受ける。特に、写真や図形(クリップアート)と接触する部分では間違い易く、写真や図形と接触する部分とそれ以外の部分とで認識率(信頼度)に大きな違いが生じ得る。このため、採点記号87やコメント88などの追記情報が、追記済文書8B(文書原本8A)としての付加情報記入済教材81(教育用教材80)の何処の部分に記入されるものであるかを区別できるようにする。
Further, the recognition rate (reliability) is affected by whether or not the additionally-written document 8B includes a photograph or a figure (clip art). In particular, it is easy to make an error in a part that comes into contact with a photograph or a figure (clip art), and a recognition rate (reliability) can be greatly different between a part that comes into contact with a photograph or a figure and other parts. For this reason, the additional information such as the
たとえば、図5は、各処理時の認識率や信頼度に関わる特徴量を収集する手法の一例を示す図である。この図5に示す例では、写真を用いた問題(問4)が混在しており、その解答欄84が写真部分に近接して配置されているので、たとえば、問4の採点記号87の信頼度は「0.7」で、その他の解答欄84の採点記号87の信頼度は「0.9〜0.95」であるなど、追記済文書8B(付加情報記入済教材81)の問題ごとに認識率(信頼度)の履歴を取っておく。
For example, FIG. 5 is a diagram illustrating an example of a technique for collecting feature amounts related to the recognition rate and reliability during each process. In the example shown in FIG. 5, questions (question 4) using photographs are mixed, and the
<信頼度情報収集処理と信頼度統合処理>
また、難認識追記情報抽出部194は、各処理別のサブ信頼度に基づいて最終的な信頼度を求めるに当たっては、つまり、処理別のサブ信頼度を統合するに当たっては、たとえば、注目する追記情報(採点記号87やコメント88)について、処理間で最も信頼度が悪いものを、最終的な信頼度とする第1の統合手法を採ることが考えられる。全ての追記情報についてこの第1の統合手法を繰り返すことで、サブ信頼度の値が一定水準よりも低い追記情報が抽出される。なお、各処理別のサブ信頼度を算出する手法は、後述する第3の統合手法にて説明する。
<Reliability information collection processing and reliability integration processing>
In addition, the difficulty recognition additional record
認識性能情報提示部198は、難認識追記情報抽出部194により抽出されたサブ信頼度の値が一定水準よりも低い追記情報について修正を促すように認識性能情報を記入者に提示する。認識性能が一定水準に満たない追記情報のみについて記入者に修正が促されるので、全ての追記情報について修正の要否を判断(チェック)する必要がなく、誤認識を起し得る追記情報の修正作業を効率化することができる。
The recognition performance
この第1の統合手法を採れば、1つの処理で認識結果に重大な影響を与える誤りを犯してしまう場合に、対応できる。たとえば、三角図形の下半分が写真と重なってしまい、差分抽出処理によって下半分が抽出できなかった場合、記入の仕方によってはバツ図形に見えるため、後段の処理ではバツと「確信を持って」判定してしまう可能性がある。しかし、この第1の統合手法を採れば、差分抽出処理でのサブ信頼度を利用できるため、このような誤りを回避できる効果がある。 If this 1st integration method is taken, it can respond to the case where the mistake which has a serious influence on a recognition result by one process is committed. For example, if the lower half of the triangle shape overlaps with the photo, and the lower half cannot be extracted by the difference extraction process, it will look like a cross shape depending on how you fill in. There is a possibility of judging. However, if this first integration method is adopted, the sub-reliability in the difference extraction process can be used, and thus such an error can be avoided.
また、難認識追記情報抽出部194は、注目する追記情報(採点記号87やコメント88)について、処理別のサブ信頼度(複数の処理結果)に重付けをして合計し、最終的な信頼度を算出する第2の統合手法を採ることも考えられる。全ての追記情報についてこの第2の統合手法を繰り返すことで、最終的な信頼度の値が一定水準よりも低い追記情報が抽出される。なお、各処理別のサブ信頼度を「重付け」を考慮して算出する手法は、後述する第3の統合手法にて説明する。
In addition, the difficult recognition additional record
重付けの一例としては、処理順に拘わらず所定の値をランダムに設定することもできるし、上流に行くほど重付けを重くする、あるいは逆に下流に行くほど重付けを重くするというように、処理順に応じて重付け値を漸次変化させることもできる。 As an example of weighting, a predetermined value can be set at random regardless of the processing order, weighting is increased as it goes upstream, or weighting is increased as it goes downstream. The weighting value can be gradually changed according to the processing order.
上流に行くほど重付けを重くする手法では、初期の処理を重視するため、図5のような処理の上流段階に認識に大きな影響を与えることが想定される場合に対応できる効果があり、下流に行くほど重付けを重くする手法では、歪みなどの補正後の処理を重視するため、元々の記入図形の形状が主因の場合(丸みのある三角など)に対応できる効果がある。 In the method in which weighting is increased as it goes upstream, the initial process is emphasized, and therefore, there is an effect that can cope with the case where it is assumed that the upstream stage of the process as shown in FIG. In the method of increasing the weight as it goes to, since processing after correction such as distortion is emphasized, there is an effect that it is possible to deal with the case where the shape of the original entry figure is the main cause (such as a rounded triangle).
重付けの別の例としては、特徴量と正しい認識結果のデータ群が有る場合に、重回帰分析によりそのデータ群に最適な重み付けを算出することができる。この手法では、データ群とこれから入力される追記情報が似ている場合(記入者、文書原本が同じなど)には、精度が高い利点がある。 As another example of weighting, when there is a data group of feature amounts and correct recognition results, an optimal weighting can be calculated for the data group by multiple regression analysis. This method has an advantage of high accuracy when the data group and the additional information to be input are similar (the writer and the original document are the same).
認識性能情報提示部198は、難認識追記情報抽出部194により重付けを考慮して抽出された最終的な信頼度の値が一定水準よりも低い追記情報について修正を促すように認識性能情報を記入者に提示する。認識性能が一定水準に満たない追記情報のみについて記入者に修正が促されるので、全ての追記情報について修正の要否を判断(チェック)する必要がなく、誤認識を起し得る追記情報の修正作業を効率化することができる。
The recognition performance
この第2の統合手法を採れば、重付けを自由に変更出来るため、記入者や文書原本などの特徴に合わせて精度が高くなるように調整できる効果がある。 If this second integration method is adopted, weighting can be freely changed, so that there is an effect that the accuracy can be adjusted so as to increase in accordance with the characteristics of the writer or the original document.
また、難認識追記情報抽出部194は、信頼度が低くなる誤認識のタイプ(ミスのタイプ)を予め設定しておき、データ処理時に、この設定した「誤認識のタイプ」に該当するものの内、信頼度が最も低いタイプのものを最終的な信頼度とする第3の統合手法を採ることも考えられる。この際には、誤認識のタイプごとに、判定時に使用する信頼度の組合せと重付けを設定しておく。そして、推定される誤認識のタイプを元にして、処理や特徴量の組合せを選び、重付け加算して信頼度を算出する。そして、加算処理結果に基づいて、信頼度が所定水準よりも低い、あるいは最も低い誤認識のタイプを選ぶ。これにより、難認識追記情報抽出部194は、選択した誤認識のタイプを持つ、認識処理の信頼度が一定水準よりも低い難認識情報を特定することができる。
Further, the difficult recognition additional record
ここで、「推定される誤認識のタイプを元にして、処理や特徴量の組合せを選び、重付けして信頼度を算出する」には、あるタイプに特有に現れる特徴量の組合わせ(特徴量の特徴)を予め規定しておき、それに当てはまるかどうかを調べる。単純には、各処理で、あるタイプに特有の特徴量に当てはまれば1、当てはまらなければ0として加算し、ある水準を満たすかどうかを見る。 Here, “selecting a combination of processing and feature values based on the estimated misrecognition type and calculating the reliability by weighting them” includes a combination of feature values that appear peculiar to a certain type ( (Feature of feature quantity) is defined in advance, and it is examined whether or not it is applicable. Simply, in each process, 1 is added if the characteristic amount is specific to a certain type, and 0 is added if not, to see whether a certain level is satisfied.
図6〜図10は、認識性能情報提示処理部190の処理であって、各処理と関わる誤認識のタイプを説明する図である。「誤認識のタイプ」の判定としては、たとえば、文書入力装置20と関わりを持つスキャンミス、差分抽出部132やデータ処理対象追記情報抽出部142と関わりを持つ抽出ミス、抽出線分途切れ補正部148と関わりを持つ欠損補間ミス、変形処理部156a,166a,157a,167aと関わりを持つ形状変形、記入位置認識部158,168と関わりを持つ位置ずれといった各機能部の処理そのものと密接に関係したものや、複数追記や追記訂正、ペン色・太さ・かすれといった追記情報そのものに起因するものや、紙汚れなどの追記済文書8Bそのものに起因するもの、などを判定するのがよい。
6 to 10 are diagrams illustrating the recognition performance information
たとえば、「抽出ミス」の誤認識のタイプは、形状認識や文字認識の信頼度が低く、かつ濃い背景への重複量が大きいときに起こり易い。これは、差分抽出部132での差分抽出処理時に、追記済文書8Bと文書原本8Aとの各画像の位置関係などから追記情報と原本画像との接触の有無によって影響を受け得ることがあるし、また追記情報が写真や図形などの濃い背景に重複しているときにも影響を受け得るからである。また、データ処理対象追記情報抽出部142でのデータ処理用の追記情報の抽出時に、追記に使用されたペン色(たとえば赤ペン)の成分を抽出しようとするときに、注目する色と実際のペン色との相違の影響を受け得るし、赤抽出画像と原本画像との位置関係などから原本画像との接触の有無によっても影響を受け得るからである。
For example, the misrecognition type of “extraction mistake” is likely to occur when the reliability of shape recognition or character recognition is low and the amount of overlap with a dark background is large. This may be affected by the presence / absence of contact between the postscript information and the original image due to the positional relationship between the images of the postscript added document 8B and the original document 8A during the differential extraction process in the
たとえば、図6(A)に示すように、追記情報抽出処理の対象画像が、濃い背景に重なって採点記号87が記入されていると、差分抽出部132やデータ処理対象追記情報抽出部142での追記情報の抽出結果は、図6(B)に示すように、重なり部分が欠損して抽出される。抽出線分途切れ補正部148は、その欠損部分が繋がるように補正する。
For example, as shown in FIG. 6A, when the target image of the additional information extraction process has a
すなわち、抽出線分途切れ補正部148は、データ処理対象追記情報抽出部142による所定色成分の抽出結果、すなわち「○」や「×」などの図形であるはずの抽出結果に対して、細線化処理を実行し、さらに端点抽出処理を実行する。これにより、「○」や「×」などの図形に途切れ部分が生じている場合に、その途切れ部分における端点が抽出されることになる。そして、端点を抽出したら、その抽出した全ての端点の内、所定のものを接続する。
That is, the extraction line
これにより、たとえば図6(B)に示す図形が抽出された場合には、端点Aに対して、所定距離内に端点B,Cが存在していても、その中で最近傍の端点Bを端点Aと接続することで、図6(C)に示すように、「○」の画像における途切れ部分を補正する。その結果、記入者は、本来、概ね「○」を記入しているにも拘わらず、濃い背景と重なる部分が欠落された歪んだ状態の「○」の画像が分離認識処理部155に入力されることになる。 Thereby, for example, when the figure shown in FIG. 6B is extracted, even if the end points B and C exist within a predetermined distance from the end point A, the nearest end point B is selected. By connecting with the end point A, as shown in FIG. 6C, the discontinuity portion in the “◯” image is corrected. As a result, although the writer originally wrote “O” in general, the image of “O” in a distorted state in which the portion overlapping the dark background is omitted is input to the separation recognition processing unit 155. Will be.
その結果、分離認識処理部155は、歪んだ状態の「○」の画像に基づいて図形認識処理もしくは文字認識処理によって「○」と特定すべきであるが、その際には、重なり部分の欠落によって図形の特徴が大幅に変わってしまうため、認識率(信頼度)が低下してしまい、また認識ミスが生じる可能性が高くなる。 As a result, the separation recognition processing unit 155 should identify “◯” by graphic recognition processing or character recognition processing based on the distorted “◯” image. As a result, the feature of the figure changes drastically, so that the recognition rate (reliability) decreases and the possibility of a recognition error increases.
このため、図6(D)に示すように、難認識追記情報抽出部194にて、このような「抽出ミス」の誤認識のタイプを特定することができるように、差分抽出部132での差分抽出処理やデータ処理対象追記情報抽出部142での特定色成分抽出処理においては、抽出量などから求められる抽出時の各品質情報J10,J11、あるいは、採点記号87やコメント88の濃い背景への重複量J12、赤抽出画像と原本画像との位置関係などから求められる原本画像と赤抽出画像の接触量J13などを、認識率や信頼度に関わる特徴量として求め、これらの情報を難認識追記情報抽出部194に通知する。
For this reason, as shown in FIG. 6D, in the difficult-to-recognize additional record
難認識追記情報抽出部194は、通知された品質情報J10,J11、重複量J12、接触量J13に基づいて、たとえば、それぞれ基準を満たせば1、満たさなければ0として加算することで、差分抽出処理のサブ信頼度T132や特定色成分抽出処理のサブ信頼度T142を算出する。
Based on the notified quality information J10, J11, the overlap amount J12, and the contact amount J13, the difficult recognition additional record
また、「欠損補間ミス」の誤認識のタイプは、原本画像との接触量が多く、かつ複数の対応付けがなされたときに起こり易い。抽出線分途切れ補正部148における途切れ補正処理時に、端点同士の接続処理時に、端点間の距離の影響を受け得るからである。なお、複数の対応付けがなされるケースとしては、元々1つの画像が原本画像との重なり部分によって分断されるケースと、元々2つの画像が原本画像との重なり部分を途切れ補正することによって接続されるケースとがある。
Further, the type of erroneous recognition of “missing interpolation error” is likely to occur when the amount of contact with the original image is large and a plurality of associations are made. This is because the extraction line segment
元々1つの画像が原本画像との重なり部分によって分断されるケースとしては、たとえば、図7に示す事例がある。図7(A)に示すように、追記情報抽出処理の対象画像が、線分などの比較的小さな濃い背景に重なって採点記号87が記入されていると、差分抽出部132やデータ処理対象追記情報抽出部142での追記情報の抽出結果は、図7(B)に示すように、その重なり部分が欠損して抽出される。抽出線分途切れ補正部148は、その欠損部分が繋がるように補正する。
As a case where one image is originally divided by an overlapping portion with the original image, for example, there is a case shown in FIG. As shown in FIG. 7A, when the target image of the additional information extraction process is marked with a
すなわち、抽出線分途切れ補正部148は、データ処理対象追記情報抽出部142による所定色成分の抽出結果、すなわち「○」や「×」などの図形であるはずの抽出結果に対して、細線化処理を実行し、さらに端点抽出処理を実行する。これにより、「○」や「×」などの図形に途切れ部分が生じている場合に、その途切れ部分における端点が抽出されることになる。そして、端点を抽出したら、その抽出した全ての端点の内、所定のものを接続する。
That is, the extraction line
たとえば図7(B)に示す図形が抽出された場合には、「○」の画像が、線分などの比較的小さな濃い背景の重なり部分で分断され、4つの端点A〜Dが現われる。抽出線分途切れ補正部148は、それらの端点を所定の条件に基づいて接続しようとする。この際、最近傍の端点同士を接続することを基本条件としていても、何らかの原因で、必ずしもそのように端点が接続されないことも起こり得る。この現象は、特に、文字や図形を示す1つの画像が、重なり部分によって分断されることで、複数の対応付けがなされた場合に起こり易い。元々1つの画像が分断されたものであるのか、元々別のものであったのかを切り分けることが困難であり、分断されている画像ごとに端点同士を接続しようとするからである。
For example, when the graphic shown in FIG. 7B is extracted, the image of “◯” is divided at an overlapping portion of a relatively small dark background such as a line segment, and four end points A to D appear. The extraction line segment
よって、たとえば、図7(C1)に示すように、分断された上半分の端点Aと端点Cとを接続する一方で、分断された下半分の端点Bと端点Dとは接続しない場合や、図7(C2)に示すように、分断された上半分の端点Aと端点Cとを接続する一方で、分断された下半分の端点Bと端点Dも接続する場合もある。 Therefore, for example, as shown in FIG. 7 (C1), while the divided upper half end point A and the end point C are connected, the divided lower half end point B and the end point D are not connected, As shown in FIG. 7 (C2), the divided upper half end point A and end point C are connected, while the divided lower half end point B and end point D are also connected in some cases.
その結果、何れにしても、記入者は、本来、概ね「○」を記入しているにも拘わらず、濃い背景と重なる部分が欠落された歪んだ状態の(概ね半円に近い)「○」の画像が分離認識処理部155に入力されることになる。 As a result, in any case, although the writer originally wrote “O” in general, the distorted state (substantially close to a semicircle) in which a portion overlapping with the dark background is omitted "Is input to the separation recognition processing unit 155.
その結果、分離認識処理部155は、歪んだ状態の「○」の画像に基づいて図形認識処理もしくは文字認識処理によって「○」と特定すべきであるが、その際には、原本画像との重なり部分の欠落によって図形の特徴が大幅に変わってしまうため、認識率(信頼度)が低下してしまい、また認識ミスが生じる可能性が高くなる。 As a result, the separation recognition processing unit 155 should identify “◯” by graphic recognition processing or character recognition processing based on the distorted “◯” image. Since the feature of the figure is significantly changed due to the omission of the overlapped portion, the recognition rate (reliability) is lowered, and the possibility of a recognition error increases.
また、元々2つの画像が原本画像との重なり部分を途切れ補正することによって接続されるケースとしては、たとえば、図8に示す事例がある。図8(A)に示すように、追記情報抽出処理の対象画像が、解答欄84の枠などの濃い背景に重なって複数の採点記号87が記入されていると、差分抽出部132やデータ処理対象追記情報抽出部142での追記情報の抽出結果は、図8(B)に示すように、それぞれの採点記号87は重なり部分が欠損して抽出される。抽出線分途切れ補正部148は、その欠損部分が繋がるように補正する。
Moreover, as a case where two images are originally connected by correcting the discontinuity of the overlapping portion with the original image, for example, there is a case shown in FIG. As shown in FIG. 8A, if the target image of the additional information extraction process is overlaid with a dark background such as a frame of the
すなわち、抽出線分途切れ補正部148は、データ処理対象追記情報抽出部142による所定色成分の抽出結果、すなわち「○」や「×」などの図形であるはずの抽出結果に対して、細線化処理を実行し、さらに端点抽出処理を実行する。これにより、「○」や「×」などの図形に途切れ部分が生じている場合に、その途切れ部分における端点が抽出されることになる。そして、端点を抽出したら、その抽出した全ての端点の内、所定のものを接続する。
That is, the extraction line
たとえば図8(B)に示す図形が抽出された場合には、2つの「○」の画像が、それぞれ枠線などの比較的小さな濃い背景の重なり部分で分断され、それぞれ4つの端点A1〜D1,A2〜D2が現われる。抽出線分途切れ補正部148は、それらの端点を所定の条件に基づいて接続しようとする。
For example, when the graphic shown in FIG. 8B is extracted, two “◯” images are divided by overlapping portions of relatively small dark backgrounds such as frame lines, and four end points A1 to D1 respectively. , A2 to D2 appear. The extraction line segment
ここで、複数の画像成分(分断されたものであるか否かを問わない)に発生する端点間の距離が、所定値以下であるか否かに基づいて、元々1つの画像が分断されたものであるのか、元々別のものであったのかを切り分けるようにし、かつ、最近傍の端点同士を接続することを基本条件としていると、先ず、それぞれの「○」の画像の抽出部分は、図8(C)に示すように、最近傍の端点同士を接続することで、元の「○」がほぼ再現される。 Here, one image was originally divided based on whether or not the distance between the end points generated in a plurality of image components (whether or not they are divided) is equal to or less than a predetermined value. If the basic condition is that the nearest end points are connected to each other, the extraction part of each “○” image is As shown in FIG. 8C, by connecting the nearest end points, the original “◯” is almost reproduced.
しかしながら、2つの「○」の画像成分に関しては、何らかの原因で、さらに端点同士の接続がなされることがある。この現象は、元々複数の画像が、それぞれ同じ背景によって分断されることで複数の対応付けがなされた場合に起こり易い。元々複数の画像であっても、元々1つの画像が分断されたものであるのか、元々別のものであったのかを切り分けることが困難であり、分断されている画像との間で端点同士を接続しようとすることが起こるからである。 However, for the two “◯” image components, the end points may be further connected for some reason. This phenomenon tends to occur when a plurality of images are originally associated with each other by being divided by the same background. Even if there are a plurality of images originally, it is difficult to distinguish whether one image was originally divided or originally, and it is difficult to separate the endpoints from the divided images. This is because trying to connect occurs.
よって、たとえば、図8(C)に示すように、右側と左側の2つの「○」の画像成分が、枠との重なり部分を補正しようとする線分によって接続され、全体として1つの画像になってしまう。 Thus, for example, as shown in FIG. 8C, the two “◯” image components on the right and left sides are connected by a line segment to correct the overlapping portion with the frame, so that one image as a whole is connected. turn into.
その結果、記入者は、本来、それぞれを概ね「○」で区別して記入しているにも拘わらず、濃い背景と重なる部分が線分で接続され、歪んだ状態の「○」の(2つが1つに繋がった)画像が分離認識処理部155に入力されることになる。 As a result, although the entry person originally entered each item with a distinction of “○”, the portions that overlap the dark background are connected by line segments, and the distorted “○” (two The images (connected to one) are input to the separation recognition processing unit 155.
その結果、分離認識処理部155は、歪んだ状態の「○」の画像に基づいて図形認識処理もしくは文字認識処理によってそれぞれを「○」と区別して特定すべきであるが、その際には、原本画像との重なり部分を補正する線分によって図形の特徴が大幅に変わってしまうため、認識率(信頼度)が低下してしまい、また、認識ミスが生じる可能性が高くなる。 As a result, the separation recognition processing unit 155 should identify and distinguish each from “◯” by graphic recognition processing or character recognition processing based on the distorted “◯” image. Since the feature of the figure is greatly changed by the line segment for correcting the overlapping portion with the original image, the recognition rate (reliability) is lowered, and the possibility of occurrence of a recognition error increases.
このため、図7(D),図8(D)に示すように、難認識追記情報抽出部194にて、このような「欠損補間ミス」の誤認識のタイプを特定することができるように、抽出線分途切れ補正部148での途切れ補正処理においては、途切れ補正処理時の補間長さを示す補間長情報J20や接続の候補となる端点数J21などを、認識率や信頼度に関わる特徴量として求め、補間長情報J20などを難認識追記情報抽出部194に通知する。
Therefore, as shown in FIG. 7D and FIG. 8D, the difficult recognition additional recording
難認識追記情報抽出部194は、通知された補間長情報J20などに基づいて、たとえば、それぞれ基準を満たせば1、満たさなければ0として加算することで、途切れ補正処理のサブ信頼度T148を算出する。
Based on the notified interpolation length information J20 and the like, the difficult recognition additional record
また、「複数追記」の誤認識のタイプは、形状認識や文字認識の信頼度が低く、隣接する他の記入欄との距離が近くて複数の採点記号87やコメント88の対応付けがあるときに起こり易い。これは、分離認識処理部155の図形形状認識部156,166における図形認識処理時や文字認識処理部157,167における文字認識処理時に、複数の追記情報同士の接触の有無が認識の信頼度に影響を与えることに基づくものである。
In addition, the type of misrecognition of “multiple addition” is when the reliability of shape recognition or character recognition is low, and there is a correspondence between a plurality of scoring
たとえば、図9(A)に示すように、2つの解答欄84が2行で記載され、その間の距離が十分にないときに、各解答欄84に記入された生徒解答に対してそれぞれ採点記号87が採点官によって記入されると、十分な間隔がないために、2つの採点記号87が接触してしまうことが典型例である。
For example, as shown in FIG. 9A, when two
このため、図9(B)に示すように、難認識追記情報抽出部194にて、このような「複数追記」の誤認識のタイプを特定することができるように、分離認識処理部155においては、先ず採点記号87同士の接触の有無を示す接触情報J30とコメント88同士の接触の有無を示す接触情報J31を求め、さらに、図形形状認識部156での図形認識処理においては、採点記号87やコメント88についての図形認識処理結果の認識の信頼度情報J32,J33を、採点記号87やコメント88についての図形認識率や図形の信頼度に関わる特徴量として求める。また、文字認識処理部157,167での文字認識処理においては、採点記号87やコメント88についての文字認識処理結果の認識の信頼度情報J34,J35を、採点記号87やコメント88についての文字認識率や文字の信頼度に関わる特徴量として求め、これらの情報を難認識追記情報抽出部194に通知する。
For this reason, as shown in FIG. 9B, the separation recognition processing unit 155 can identify the type of misrecognition of such “multiple addition” in the difficult recognition additional recording
難認識追記情報抽出部194は、通知された採点記号87についての接触情報J30,信頼度情報J32,信頼度情報J34に基づいて、たとえば、それぞれ基準を満たせば1、満たさなければ0として加算することで、図形認識処理のサブ信頼度T156と文字認識処理のサブ信頼度T157とを算出する。また、コメント88についての接触情報J31,信頼度情報J33,信頼度情報J35に基づいて、たとえば、それぞれ基準を満たせば1、満たさなければ0として加算することで、図形認識処理のサブ信頼度T168と文字認識処理のサブ信頼度T167とを算出する。
The difficult recognition additional record
また、「追記訂正」の誤認識のタイプは、形状認識や文字認識の信頼度は高いが、記入欄との距離が遠くて、1つの記入欄に対して複数の採点記号87やコメント88の対応付けがあるときに起こり易い。これは、データ処理部170にて、注目する追記情報について、記入位置認識部158,168により特定された記入位置の特定処理結果に基づいて、何れの記入欄に対応するものであるかを特定してデータ処理を実行していく際に、1つの追記情報が複数の記入位置に関係するか否かがデータ処理結果に影響を与えることに基づくものである。
Furthermore, the type of misrecognition of “additional correction” is highly reliable in shape recognition and character recognition, but is far from the entry column and has a plurality of scoring
たとえば、図10(A),(B)に示すように、2つの解答欄84が2行で記載され、その間の距離がある程度広くなっているときに、各解答欄84に記入された生徒解答に対してそれぞれ採点記号87が採点官によって記入されると、間隔が広いために、2つの解答欄84の間に、何れか一方用の1つの採点記号87が記入されることが典型例である。
For example, as shown in FIGS. 10A and 10B, when two
ここで、図10(A)に示すように、追記情報が大きく、上下の解答欄84に跨がって記入されるケースでは、追記情報の外接矩形とそれぞれの解答欄84となる領域との重なり面積が概ね同じであるし、各解答欄84との間の各距離差も概ね同じであるので、2つの解答欄84の間に記入された追記情報が何れの解答欄84に対応させるべきかを特定することが困難になる。換言すれば、1つの解答欄84に対して、複数の採点記号87が対応付けされる可能性が生じる。
Here, as shown in FIG. 10 (A), in the case where the additional information is large and is written across the upper and lower answer fields 84, the circumscribed rectangle of the additional information and the areas to be the respective answer fields 84 Since the overlapping area is substantially the same, and the distance differences between the
また、図10(B)に示すように、追記情報が小さく、上下の解答欄84の間に収まって記入されるケースでは、追記情報の外接矩形とそれぞれの解答欄84となる領域との重なり面積が概ねゼロであるし、各解答欄84との間の各距離差も概ね同じであるので、2つの解答欄84の間に記入された追記情報が何れの解答欄84に対応させるべきかを特定することが困難になる。換言すれば、1つの解答欄84に対して、複数の採点記号87が対応付けされる可能性が生じる。
In addition, as shown in FIG. 10B, in the case where the additional information is small and is entered between the upper and
このため、図10(C)に示すように、難認識追記情報抽出部194にて、このような「追記訂正」の誤認識のタイプを特定することができるように、記入位置認識部158,168で記入位置認識処理においては、1つの追記情報の複数の記入欄への対応付けの可能性あるいは1つの記入欄に対しての複数の追記情報が対応付けされる可能性の有無を示す複数追記情報J40,J41や、各追記情報と各記入欄との距離を示す距離情報J42,J43などを、認識率や信頼度に関わる特徴量として求め、これらの情報を難認識追記情報抽出部194に通知する。
For this reason, as shown in FIG. 10 (C), the entry recognition unit 158, 158, so as to be able to identify the type of misrecognition of such “additional correction” by the difficult recognition additional recording
難認識追記情報抽出部194は、通知された情報J40,J42に基づいて、たとえば、それぞれ基準を満たせば1、満たさなければ0として加算することで、記入位置認識部158における採点記号87についての記入位置認識処理のサブ信頼度T158を算出し、また通知された情報J41,J43に基づいて、たとえば、それぞれ基準を満たせば1、満たさなければ0として加算することで、記入位置認識部168におけるコメント88についての記入位置認識処理のサブ信頼度T168を算出する。
Based on the notified information J40 and J42, the difficult recognition additional record
難認識追記情報抽出部194は、注目する追記情報(採点記号87やコメント88)について、それぞれ求めた各処理のサブ信頼度の内で、サブ信頼度の値が一定水準よりも低い誤認識のタイプを抽出する。この際には、サブ信頼度が最も低い誤認識のタイプのみを抽出してもよい。全ての追記情報についてこの第3の統合手法を繰り返すことで、サブ信頼度の値が一定水準よりも低い誤認識のタイプを持つ追記情報が抽出される。
The difficult-to-recognize additional
認識性能情報提示部198は、難認識追記情報抽出部194により抽出されたサブ信頼度の値が一定水準よりも低い誤認識のタイプを持つ追記情報について修正を促すように認識性能情報を記入者に提示する。
The recognition performance
認識性能が一定水準に満たない誤認識のタイプを持つ追記情報のみについて記入者に修正が促されるので、全ての追記情報について修正の要否を判断(チェック)する必要がなく、誤認識を起し得る追記情報の修正作業を効率化することができる。信頼度が所定水準よりも低い誤認識のタイプが提示されると、記入者は、その誤認識のタイプの側面から現状の記入状態を改善することができる。1つの追記情報について、信頼度が所定水準よりも低い誤認識のタイプが2つ提示されたときには、記入者は、それぞれの誤認識のタイプの側面から現状の記入状態を改善することができるし、信頼度が最も低い誤認識のタイプのみが提示されたときには、記入者は、その最も信頼度の低い誤認識のタイプの側面から現状の記入状態を改善することができる。 Only the additional information with the type of misrecognition whose recognition performance is less than a certain level is prompted by the writer, so there is no need to judge (check) the necessity of correction for all the additional information and cause misrecognition. It is possible to improve the efficiency of the correction of the additional information that can be performed. When a misrecognition type having a reliability lower than a predetermined level is presented, the writer can improve the current entry state from the aspect of the misrecognition type. When two types of misrecognition with a reliability lower than a predetermined level are presented for one additional information, the writer can improve the current entry state from the aspect of each misrecognition type. When only the type of misrecognition with the lowest reliability is presented, the writer can improve the current entry state from the aspect of the type of misrecognition with the lowest reliability.
このような第3の統合手法を採れば、タイプごとに具体的な改善方法を準備しておけるので、記入者が記入方法を注意し易くなり改善効果が向上する効果がある。 By adopting such a third integration method, a specific improvement method can be prepared for each type, so that the writer can easily pay attention to the entry method and the improvement effect is improved.
<認識性能情報提示手法>
図11〜図16は、認識性能情報提示部198における、認識性能を向上させるための認識性能情報をユーザに提示する手法を説明する図である。
<Recognition performance information presentation method>
FIGS. 11-16 is a figure explaining the method in which the recognition performance
認識性能情報提示部198が認識性能情報をユーザ(記入者)に提示する際には、記入者のそれぞれに応じた認識性能情報を提示するのがよい。また、その際の提示手法としては、たとえば、図11に示すように、認識性能情報提示部198は、信頼度が一定水準以下のものについて、さらに信頼度によって認識性能情報の提示方法を変えて提示する第1の提示手法を採ることが考えられる。なお、ここでの「信頼度」は、最終的な信頼度を意味する。
When the recognition performance
ここで「信頼度よって表示方法を変える」という第1の提示手法は、最終的な信頼度のレベルや誤認識のタイプを目視で容易に区別することができるようにすることを意図したものであり、その限りにおいて、様々な提示手法による区別ができる。たとえば、最終的な信頼度や誤認識のタイプに応じて、それぞれ異なるグラディエーションを掛けて表示することができる。またたとえば、信頼度が一定水準以下のものについて枠を付ける、さらに信頼度の低いものほど枠線を太くする手法を採ることができる。 Here, the first presentation method of “changing the display method according to the reliability” is intended to make it possible to easily distinguish the final reliability level and the type of misrecognition visually. Yes, as long as it can be distinguished by various presentation methods. For example, it can be displayed with different gradients depending on the final reliability and the type of misrecognition. Further, for example, it is possible to adopt a technique in which a frame is attached to those whose reliability is below a certain level, and the frame is thicker as the reliability is lower.
表示方法の違いによって、認識特定した全ての追記情報の中で、信頼度が一定水準よりも低いものがどれであるかを閲覧者(記入者)は判断することができる。よって、この第1の提示手法を採用した場合でも、事実上、信頼度の値が一定水準よりも低い追記情報についてのみ修正を促すように認識性能情報を記入者に提示することになる。記入者は、その信頼度の値が一定水準よりも低い追記情報について記入態様を改善することができる。 Depending on the display method, the viewer (entrant) can determine which of the additional information recognized and specified is the one whose reliability is lower than a certain level. Therefore, even when this first presentation method is adopted, the recognition performance information is presented to the writer so as to urge correction only for the additional information having a reliability level lower than a certain level. The writer can improve the entry mode for additional information whose reliability value is lower than a certain level.
この第1の提示手法を採れば、修正が必要なものほど目に付き易くすることで、重大な見落としを防止できる。また、信頼度の違いを見せることで、どのような図形が認識に適さないのかを比較して学習することができるため、記入方法の改善に繋がる効果がある。 If this 1st presentation method is taken, a serious oversight can be prevented by making the thing which needs correction easy to see. In addition, by showing the difference in reliability, it is possible to compare and learn what figure is not suitable for recognition, which has the effect of improving the entry method.
また、認識性能情報提示部198は、認識処理された全ての追記情報について、信頼度が一定水準よりも低い難認識情報のみに関して認識性能を向上させるための認識性能情報を提示する第2の提示手法を採ることが考えられる。たとえば、難認識追記情報抽出部194によって第1や第2の統合手法に基づいて特定される最終的な信頼度が所定水準よりも低い追記情報や、第3の統合手法に基づいて特定される信頼度が所定水準よりも低いあるいは最も低い誤認識のタイプを持つ追記情報のみに関して認識性能情報を提示する。
In addition, the recognition performance
ここで、「信頼度が一定水準よりも低い難認識情報のみに関して認識性能を向上させるための認識性能情報を提示する」とは、要するに、認識処理された全ての付加情報について、「信頼度が低い難認識情報」と「その他の追記情報」とを区別して提示することで、「信頼度が低い難認識情報」を確実に特定できるように認識性能情報を提示することを意味する。たとえば、「信頼度が低い難認識情報」以外の情報は全て表示しないようにすることもできる。 Here, “presenting recognition performance information for improving recognition performance only with respect to difficult recognition information whose reliability is lower than a certain level” means that for all additional information subjected to recognition processing, “reliability is This means that the recognition performance information is presented so that the “difficult recognition information with low reliability” can be reliably identified by separately presenting “low difficulty recognition information” and “other additional information”. For example, information other than “difficult recognition information with low reliability” may not be displayed.
信頼度の値が一定水準よりも低い難認識情報についてのみ修正を促すように認識性能情報を記入者に提示することができ、記入者は、その信頼度の値が一定水準よりも低い難認識情報について記入態様を改善することができる。 The recognition performance information can be presented to the writer so as to prompt correction only for difficult recognition information whose reliability level is lower than a certain level, and the writer has difficulty recognition whose reliability level is lower than a certain level. It is possible to improve the information entry mode.
この第2の提示手法を採れば、信頼度が一定水準よりも低い難認識情報のみに関して認識性能を向上させるための認識性能情報を提示するため、修正の必要性が高い情報だけを素早く確認でき、効率的に修正作業ができる効果がある。 If this second presentation method is adopted, recognition performance information for improving recognition performance is presented only for difficult recognition information whose reliability is lower than a certain level, so that only information that needs to be corrected can be quickly confirmed. This has the effect of making correction work efficiently.
なお、第2の提示手法を採る場合において、認識性能が悪く修正を要するものとして認識性能情報の提示対象として抽出した追記情報に関しては、この追記情報が一目で何処の部分であるかを認識できるような状態で強調表示するのがよい。強調表示によって、信頼度が一定水準よりも低い難認識情報とその他の情報とを区別して提示することができる。 In the case of adopting the second presentation method, it is possible to recognize at a glance where the additional information is extracted as the additional information extracted as the target of the recognition performance information because the recognition performance is poor and needs to be corrected. It is better to highlight in such a state. By highlighting, it is possible to distinguish and present difficult-to-recognize information whose reliability is lower than a certain level and other information.
たとえば、図12の各図に示すように、追記情報を枠で囲む(図12(A))、追記情報に矢印(あるいはその他のマーク)を付ける(図12(B))、追記情報に電子付箋を付ける(図13)、あるいは、図示を割愛するが、信頼度によって追記情報の太さを変えて表示する、信頼度によって追記情報の色を変えて表示する、などして、信頼度が一定水準よりも低い難認識情報とその他の情報とを区別して表示するとよい。 For example, as shown in FIGS. 12A and 12B, the postscript information is surrounded by a frame (FIG. 12A), an arrow (or other mark) is attached to the postscript information (FIG. 12B), and the postscript information is electronic. The sticky note is attached (FIG. 13), or the illustration is omitted, but the thickness of the postscript information is changed depending on the reliability, and the color of the postscript information is changed depending on the reliability. It is good to distinguish and display difficult recognition information lower than a certain level and other information.
枠で囲む表示態様では範囲が特定し易いため、特に複数の図形が図8(C)のように接続してしまった場合に視認し易い効果がある。また、矢印やその他のマークを付ける表示態様では大きさを自由に設定できるため文書原本の記載などに被ってしまう可能性が低く、記入が密な場合でもあまり視認性が低下しない効果がある。電子付箋を付ける表示態様では複数文書を重ねた場合でも最上段以外の付箋を視認できるため、信頼度が低い追記情報の全体量や位置などが確認し易い効果がある。 Since the range is easy to specify in the display mode surrounded by the frame, there is an effect that it is easy to visually recognize especially when a plurality of figures are connected as shown in FIG. In addition, in the display mode in which an arrow or other mark is added, the size can be set freely, so that there is a low possibility that the document will be covered with the description of the original document. In the display mode for attaching an electronic sticky note, even when a plurality of documents are overlapped, the sticky note other than the topmost one can be visually recognized, so that there is an effect that it is easy to confirm the entire amount and position of additional information with low reliability.
あるいは、認識性能が悪く修正を要するものとして認識性能情報の提示対象として抽出した追記情報に関して、図14に示すように、リンクの一覧を作成して表示するとともに、この一覧中の何れかがクリックされたときには、付加情報記入済教材81を表示し、かつ該当箇所の追記情報を表示するよう表示してもよい。この際には、該当箇所の追記情報を図12に示した強調表示を採用して表示するとよい。
Alternatively, as shown in FIG. 14, a list of links is created and displayed for additional information extracted as a target of presentation of recognition performance information because the recognition performance is poor and needs to be corrected, and one of the lists is clicked. When it is done, the additional information filled
リンクの一覧では、信頼度が一定水準以下の採点記号87やコメント88が記入される解答欄84と対応する問題文のように、難認識情報に辿り着くことのできる情報のみが提示される。このリンクの一覧をベースとして、所要の難認識情報を表示させてから修正作業時に取り掛かることができる。
In the list of links, only information that can reach difficult recognition information is presented, such as a question sentence corresponding to an
付加情報記入済教材81上では難認識情報だけでなく全ての追記情報が提示されているが、リンクの一覧では、難認識情報に辿り着くことのできる情報のみを提示しており、このような態様も、「信頼度が一定水準よりも低い難認識情報のみに関して認識性能を向上させるための認識性能情報を提示する」に含むものとする。
On the additional information filled-in
あるいは、認識性能が悪く修正を要するものとして認識性能情報の提示対象として抽出した追記情報に関して、図15に示すように、付加情報記入済教材81を表示し、かつ、次にジャンプするボタンのクリック、「次に送る」ボタンのクリック、ダブルクリックなどの予め決められたジェスチャ、あるいは予め決められたキー操作(矢印キーなど)、などを契機とすることで、認識性能が悪く修正を要する複数の追記情報を、同一の付加情報記入済教材81内であるいは別の付加情報記入済教材81へと、次々とジャンプできるようにして表示してもよい。この際には、該当箇所(ジャンプ先)の追記情報を、図12に示した強調表示を採用して表示するとよい。
Alternatively, as shown in FIG. 15, with respect to the additional information extracted as the recognition performance information presentation target because the recognition performance is poor and needs to be corrected, the additional information filled
また、認識性能情報提示部198は、図16に示すように、信頼度が一定水準に満たない修正を要する追記情報(難認識情報)について、信頼度とともにそのように判定した判定理由を認識性能情報として提示する第3の提示手法を採ることが考えられる。
Further, as shown in FIG. 16, the recognition performance
なお、ここでの「信頼度」は、最終的な信頼度を意味する。また、「判定理由」は、たとえば、難認識追記情報抽出部194に通知される各種のサブ信頼度を利用して、サブ信頼度の悪い処理を判定理由として特定するのがよい。
Here, “reliability” means the final reliability. In addition, the “determination reason” may be, for example, to specify a process having a low sub-reliability as a determination reason by using various sub-reliabilities notified to the difficult-to-recognize additional write
この第3の提示手法を採れば、信頼度の値が一定水準よりも低い追記情報を通知するだけでなく、そのように判定した理由も認識性能情報として記入者に提示することができ、記入者は、その信頼度の値が一定水準よりも低い追記情報について、提示された理由に応じた記入態様に改善することができる。どの点に注意して記入すればよいかを具体的に把握することができるので、記入方法の習得に利用することができる。手書き入力情報の形状などの不適切な部分を確実に把握し、正確な図形や文字の形状などを確実に学習することができるのである。 By adopting this third presentation method, not only can additional information be reported with a reliability value lower than a certain level, but also the reason for such determination can be presented to the writer as recognition performance information. The person can improve the additional information according to the presented reason for the additional information whose reliability value is lower than a certain level. Since it is possible to know in detail which points should be noted, it can be used to learn how to fill in. It is possible to reliably grasp an inappropriate part such as the shape of handwritten input information and to learn an accurate figure or character shape.
なお、上述の第1〜第3の提示手法の何れにおいても、各種の処理過程における認識率に関わる情報を収集し、収集した情報に基づいて信頼度の値が一定水準よりも低い追記情報を特定し、その信頼度の値が一定水準よりも低い追記情報に関して、手書き入力情報の認識性能を向上させるための認識性能情報、つまり現状の追記情報について修正を促す認識性能情報を提示するようにしたので、全ての追記情報をチェックする必要がなく、誤認識をもたらすような追記情報の記載を修正する作業を効率的に実行することができる。 In any of the first to third presentation methods described above, information related to the recognition rate in various processing processes is collected, and additional information whose reliability value is lower than a certain level based on the collected information. Identify and present recognition performance information for improving the recognition performance of handwritten input information, that is, recognition performance information that encourages correction of the current additional information for additional information that has a reliability value lower than a certain level. Therefore, it is not necessary to check all the additional write information, and the work of correcting the description of the additional write information that causes erroneous recognition can be performed efficiently.
また、付加情報記入済教材81の表示中に、認識の信頼度が一致水準より低い現状の追記情報(難認識情報)について修正を促す認識性能情報を提示するようにしているので、特開2000−105796号公報に記載の仕組みとは異なり、訂正専用の画面を作成する必要がない利点もある。
In addition, during the display of the additional information filled-in
<信頼度情報収集提示処理;具体例>
図17および図18は、文書原本8Aの一例である教育用教材80を処理対象とする具体的な信頼度情報収集提示処理を示した図である。ここで、図17は、その全体概要をシステム構成図と対応付けて示しており、また図18は、信頼度情報収集提示処理手順を示すフローチャートである。
<Reliability information collection and presentation processing; specific example>
FIGS. 17 and 18 are diagrams showing specific reliability information collection and presentation processing for an educational material 80 which is an example of the original document 8A. Here, FIG. 17 shows the overall outline in association with the system configuration diagram, and FIG. 18 is a flowchart showing the reliability information collection and presentation processing procedure.
ここでは、教育用教材80としての答案を作成し、答案を用いた試験後に、採点記号87に基づく自動採点処理やコメント88に基づくコメント分類処理を行なう例で示す。
Here, an example is shown in which an answer as an educational material 80 is created, and an automatic scoring process based on a
試験を実行する際には、文書原本情報データベースDB2から教育用教材80を読み出してプリンタで印刷し生徒や受験者に配布する(S206)。そして、試験終了後、採点官は採点記号87やコメント88を生徒の解答に対して追記する(S208)。
When the test is executed, the educational material 80 is read from the original document information database DB2, printed by a printer, and distributed to students and examinees (S206). After the test, the grader adds a
自動データ処理時には、先ず、文書入力装置20は、採点官により採点記号87やコメント88が記入された各解答者の付加情報記入済教材81を読み取り(S210)、その付加情報記入済教材81を表わす画像データを追記情報処理装置10に入力する(S212)。文書入力装置20は、この文書入力装置20による画像読取りによって得られた画像データについて、一旦ワークエリアとして用いられるメモリなどに保持しておく。
At the time of automatic data processing, first, the
追記情報処理装置10(教材処理装置)は、付加情報記入済教材81の読取画像データを受け取り、ハーフトーン画像中に埋め込まれている文書原本特定コードを特定し(S224)、対応する教育用教材80の原本画像と記入欄位置領域情報38などの原本情報を文書原本情報データベースDB2として機能する文書管理サーバ30から入手する(S225)。
The additional recording information processing apparatus 10 (teaching material processing apparatus) receives the read image data of the additional information filled
そして、自動データ処理として、付加情報記入済教材81に記入されている採点記号87やコメント88を差分抽出部132やデータ処理用追記情報抽出処理部140にて抽出し(S242)、分離認識処理部155や記入位置認識部158,168にてその記入内容や記入位置を特定した上で(S262)、データ処理部170にて採点記号87に関する自動採点集計処理やコメント88に関する自動コメント分類処理などを実行する(S266)。
Then, as automatic data processing, the
この際、分離認識処理部155や記入位置認識部158,168あるいはデータ処理部170は、ユーザによる修正指示を受け付ける(S310)。この後、自動データ処理が完了すると(S264−YES)、データ処理部170は、採点・集計の結果やコメント分類結果を処理結果保存サーバ40に登録する(S268)。
At this time, the separation recognition processing unit 155, the entry position recognition units 158 and 168, or the
ここで、このような処理過程において、認識性能情報提示処理部190の難認識追記情報抽出部194は、各機能部から、それぞれ処理での認識率に関わる各特徴量を収集して(S300)、収集した各特徴量に基づいて、各処理についてのサブ信頼度を算出する(S302)。
Here, in such a process, the difficult recognition additional record
たとえば、差分抽出部132は、文書原本8Aの一例である教育用教材80と追記済文書8Bの一例である付加情報記入済教材81との間での差分抽出処理における品質情報J10と、採点記号87やコメント88の濃い背景への重複量J12を抽出して難認識追記情報抽出部194に通知する。また、データ処理用追記情報抽出処理部140のデータ処理対象追記情報抽出部142は、差分抽出部132で抽出された差分情報9の内データ処理対象の追記情報として採点記号87やコメント88を抽出する際の品質情報J11と、赤抽出画像と原本画像との位置関係などから求められる原本画像と赤抽出画像の接触量J13を抽出して難認識追記情報抽出部194に通知する。難認識追記情報抽出部194は、通知された品質情報J10,J11、重複量J12、接触量J13に基づいて、差分抽出処理のサブ信頼度T132と特定色成分抽出処理のサブ信頼度T142とを算出する。
For example, the
また、抽出線分途切れ補正部148は、途切れ補正処理時の補間長さを示す補間長情報J20や接続の候補となる端点数J21などを抽出し、難認識追記情報抽出部194に通知する。難認識追記情報抽出部194は、通知された補間長情報J20などに基づいて、途切れ補正処理(欠損補間)のサブ信頼度T148を算出する。
Further, the extracted line segment
また、分離認識処理部155は、先ず、採点記号87同士の接触の有無を示す接触情報J30とコメント88同士の接触の有無を示す接触情報J31を抽出し、難認識追記情報抽出部194に通知する。
The separation recognition processing unit 155 first extracts contact information J30 indicating the presence / absence of contact between the scoring
また、分離認識処理部155の図形形状認識部156は、採点記号87についての図形認識処理結果の認識の信頼度情報J32を抽出し、難認識追記情報抽出部194に通知するし、図形形状認識部166は、コメント88についての図形認識処理結果の認識の信頼度情報J33を抽出し、難認識追記情報抽出部194に通知する。
Further, the graphic shape recognition unit 156 of the separation recognition processing unit 155 extracts the reliability information J32 of the recognition of the graphic recognition processing result for the
また、分離認識処理部155の文字認識処理部157は、採点記号87についての文字認識処理結果の認識の信頼度情報J34を抽出し、難認識追記情報抽出部194に通知するし、文字認識処理部167は、コメント88についての文字認識処理結果の認識の信頼度情報J35を抽出し、難認識追記情報抽出部194に通知する。
In addition, the character recognition processing unit 157 of the separation recognition processing unit 155 extracts the recognition reliability information J34 of the character recognition processing result for the
難認識追記情報抽出部194は、通知された採点記号87についての接触情報J30,信頼度情報J32,信頼度情報J34に基づいて、図形認識処理のサブ信頼度T156と文字認識処理のサブ信頼度T157とを算出し、また、コメント88についての接触情報J31,信頼度情報J33,信頼度情報J35に基づいて、図形認識処理のサブ信頼度T168と文字認識処理のサブ信頼度T167とを算出する。
The difficult recognition additional record
また、記入位置認識部158は、採点記号87についての複数追記情報J40と距離情報J42とを抽出して難認識追記情報抽出部194に通知するし、記入位置認識部168は、コメント88についての複数追記情報J41と距離情報J43とを抽出して難認識追記情報抽出部194に通知する。
Further, the entry position recognition unit 158 extracts a plurality of additional writing information J40 and distance information J42 for the
難認識追記情報抽出部194は、通知された情報J40,J42に基づいて採点記号87についての記入位置認識処理のサブ信頼度T158を算出し、また通知された情報J41,J43に基づいてコメント88についての記入位置認識処理のサブ信頼度T168を算出する。
The difficult recognition additional record
難認識追記情報抽出部194は、さらに、前述のようにして求めた各処理のサブ信頼度と過去の統計情報とに基づいて、たとえば下記式(1)のようにして、処理ごとに重付けαを変えて、最終的な信頼度Tfinal を算出する(S304)。
The difficult-to-recognize additional recording
認識性能情報提示部198は、自動採点処理用のソフトウェアに組み込まれた自動採点結果の修正ソフト上で、信頼度Tfinal が、予め定めてある閾値以下の低信頼度の追記情報を特定し(S306)、その信頼度の値が閾値よりも低い追記情報に関して、手書き入力情報の認識性能を向上させるための認識性能情報として、特定した現状の追記情報について修正を促す認識性能情報をユーザ端末171上に提示する(S308)。この際には、前述のように、たとえば、その追記情報を強調表示する、あるいは、判定理由を示すなど、修正が必要な追記情報であることや修正方法を容易に判断することができるような状態で表示するのがよい。
The recognition performance
採点記号87やコメント88の記入者は、ユーザ端末171に提示された認識性能情報を確認しながら、信頼度の値が閾値よりも低く、誤認識をもたらすような採点記号87(を表わす文字や図形)やコメント88(を表わす文字や図形)に関してのみ、ユーザ端末171上で修正処理を実行する(S310)。
The writer of the
そして、全て修正作業が完了すると(S264−YES)、修正された追記情報をデータ処理に反映させる。たとえば、採点・集計結果の確定データやコメント分類結果の確定データを処理結果保存サーバ40に登録する(S264)。利用者による修正結果を受け付け、認識後にデータベース操作などで直接データを変更することで反映する(S268)。つまり、データベースに保存後のデータを直接に変更すればよい。 When all the correction work is completed (S264-YES), the corrected additional writing information is reflected in the data processing. For example, final data for scoring and counting results and final data for comment classification results are registered in the processing result storage server 40 (S264). The correction result by the user is received and reflected by changing the data directly by database operation after recognition (S268). In other words, the data stored in the database may be changed directly.
この事例の処理手順では、通常の自動データ処理の過程で認識の正誤を反映させて、認識した手書き入力情報の内、認識性能の劣るものについてのみ修正を促すようにしているので、修正を要するものについてのみ特別な手間を掛けずに、採点記号87やコメント88などの記入態様を随時チェックしつつ修正を行ない、修正後の追記情報を用いて自動採点処理や自動コメント分類処理の結果を適切に変更することができる。
In the processing procedure of this example, correctness of recognition is reflected in the process of normal automatic data processing, and correction is required only for recognized handwritten input information that has poor recognition performance. Make corrections while checking the entry form such as scoring
<追記情報処理装置;計算機構成>
図19は、追記情報処理装置10の他の構成例を示すブロック図である。ここでは、パーソナルコンピュータなどの電子計算機を利用して、追記情報処理をソフトウェアで実行するマイクロプロセッサなどから構築されるより現実的なハードウェア構成を示している。
<Additional information processing device; computer configuration>
FIG. 19 is a block diagram illustrating another configuration example of the additional recording
すなわち、本実施形態において、追記情報に関するデータ処理を実行する仕組みは、ハードウェア処理回路により構成することに限らず、その機能を実現するプログラムコードに基づき電子計算機(コンピュータ)を用いてソフトウェア的に実現することも可能である。 That is, in this embodiment, the mechanism for executing the data processing related to the additional information is not limited to the hardware processing circuit, and is software-based using a computer (computer) based on the program code that realizes the function. It can also be realized.
よって、本発明に係る仕組みを、電子計算機(コンピュータ)を用いてソフトウェアで実現するために好適なプログラムあるいはこのプログラムを格納したコンピュータ読取可能な記憶媒体を発明として抽出することもできる。ソフトウェアにより実行させる仕組みとすることで、ハードウェアの変更を伴うことなく、処理手順などを容易に変更できる利点を享受できるようになる。 Therefore, a program suitable for realizing the mechanism according to the present invention by software using an electronic computer (computer) or a computer-readable storage medium storing this program can be extracted as an invention. By adopting a mechanism that is executed by software, it is possible to enjoy the advantage that the processing procedure and the like can be easily changed without changing hardware.
電子計算機に、追記情報に関するデータ処理機能をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ(組込マイコンなど)、あるいは、CPU(Central Processing Unit )、論理回路、記憶装置などの機能を1つのチップ上に搭載して所望のシステムを実現するSOC(System On a Chip:システムオンチップ)、または、各種のプログラムをインストールすることで各種の機能を実行することが可能な汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。 When the data processing function related to additional information is executed by software in an electronic computer, a program (such as a built-in microcomputer) in which a program constituting the software is incorporated in dedicated hardware or a CPU (Central Processing) Unit), logic circuit, storage device, etc. on a single chip to realize the desired system SOC (System On a Chip) or various programs by installing various programs It is installed from a recording medium in a general-purpose personal computer or the like capable of executing functions.
記録媒体は、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気などのエネルギの状態変化を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。 The recording medium causes a state change of energy such as magnetism, light, electricity, etc. according to the description contents of the program to the reading device provided in the hardware resource of the computer, and in the form of a signal corresponding to the change. The program description can be transmitted to the reader.
たとえば、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクFDを含む)、光ディスク(CD−ROM(Compact Disc-Read Only Memory )、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc )を含む)、または半導体メモリなどよりなるパッケージメディア(可搬型の記憶媒体)により構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているROMやハードディスクなどで構成されてもよい。 For example, a magnetic disk (including a flexible disk FD), an optical disk (CD-ROM (Compact Disc-Read Only Memory)), a DVD on which a program is recorded, which is distributed to provide a program to a user separately from a computer. (Including Digital Versatile Disc), magneto-optical disc (including MD (Mini Disc)), or package media (portable storage media) made of semiconductor memory, etc. It may be configured by a ROM, a hard disk, or the like in which a program is recorded, which is provided to the user in a state of being recorded.
また、ソフトウェアを構成するプログラムは、記録媒体を用いずに、記録媒体を介して提供されることに限らず、有線あるいは無線などの通信網を介して提供されてもよい。 The program constituting the software is not limited to being provided via the recording medium without using the recording medium, and may be provided via a wired or wireless communication network.
たとえば、追記情報に関するデータ処理機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、ハードウェア処理回路にて構成する場合と同様の効果は達成される。この場合、記憶媒体から読み出されたプログラムコード自体が追記情報に関するデータ処理機能を実現する。 For example, a storage medium in which a program code of software that realizes a data processing function related to additional information is supplied to a system or apparatus, and a program code stored in the storage medium by a computer (or CPU or MPU) of the system or apparatus The same effect as in the case where the hardware processing circuit is used is also achieved by reading and executing. In this case, the program code itself read from the storage medium realizes a data processing function related to additional write information.
また、コンピュータが読み出したプログラムコードを実行することで、追記情報に関するデータ処理機能が実現されるだけでなく、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(Operating Systems ;基本ソフト)などが実際の処理の一部または全部を行ない、その処理により追記情報に関するデータ処理機能が実現される場合であってもよい。 In addition, by executing the program code read by the computer, not only a data processing function related to additional information is realized, but also an OS (Operating Systems; basic software) running on the computer based on an instruction of the program code Or the like may perform part or all of the actual processing, and the data processing function regarding the additional information may be realized by the processing.
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によって追記情報に関するデータ処理機能が実現される場合であってもよい。 Further, after the program code read from the storage medium is written in a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. There may be a case where a CPU or the like provided in the card or the function expansion unit performs part or all of the actual processing, and the data processing function regarding the additional information is realized by the processing.
なお、追記情報に関するデータ処理機能を実現するプログラムコードを記述したファイルとしてプログラムが提供されるが、この場合、一括のプログラムファイルとして提供されることに限らず、コンピュータで構成されるシステムのハードウェア構成に応じて、個別のプログラムモジュールとして提供されてもよい。 Note that the program is provided as a file describing a program code that realizes a data processing function related to additional information, but in this case, the program is not limited to being provided as a batch program file, and the hardware of a system configured by a computer Depending on the configuration, it may be provided as an individual program module.
たとえば、コンピュータシステム900は、コントローラ部901と、ハードディスク装置、フレキシブルディスク(FD)ドライブ、あるいはCD−ROM(Compact Disk ROM)ドライブ、半導体メモリコントローラなどの、所定の記憶媒体からデータを読み出したり記録したりするための記録・読取制御部902とを有する。
For example, the computer system 900 reads and records data from a
コントローラ部901は、CPU(Central Processing Unit )912、読出専用の記憶部であるROM(Read Only Memory)913、随時書込みおよび読出しが可能であるとともに揮発性の記憶部の一例であるRAM(Random Access Memory)915、および不揮発性の記憶部の一例であるRAM(NVRAMと記述する)916を有している。
The
なお、上記において“揮発性の記憶部”とは、装置の電源がオフされた場合には、記憶内容を消滅してしまう形態の記憶部を意味する。一方、“不揮発性の記憶部”とは、装置のメイン電源がオフされた場合でも、記憶内容を保持し続ける形態の記憶部を意味する。記憶内容を保持し続けることができるものであればよく、半導体製のメモリ素子自体が不揮発性を有するものに限らず、バックアップ電源を備えることで、揮発性のメモリ素子を“不揮発性”を呈するように構成するものであってもよい。 In the above description, the “volatile storage unit” means a storage unit in which the stored contents are lost when the power of the apparatus is turned off. On the other hand, the “nonvolatile storage unit” means a storage unit in a form that keeps stored contents even when the main power supply of the apparatus is turned off. Any memory device can be used as long as it can retain the stored contents. The semiconductor memory device itself is not limited to a nonvolatile memory device, and a backup power supply is provided to make a volatile memory device “nonvolatile”. You may comprise as follows.
また、半導体製のメモリ素子により構成することに限らず、磁気ディスクや光ディスクなどの媒体を利用して構成してもよい。たとえば、ハードディスク装置を不揮発性の記憶部として利用できる。また、CD−ROMなどの記録媒体から情報を読み出す構成を採ることでも不揮発性の記憶部として利用できる。 Further, the present invention is not limited to a semiconductor memory element, and may be configured using a medium such as a magnetic disk or an optical disk. For example, a hard disk device can be used as a nonvolatile storage unit. In addition, it is possible to use as a nonvolatile storage unit by adopting a configuration for reading information from a recording medium such as a CD-ROM.
また、コンピュータシステム900は、ユーザインタフェースをなす機能部としての指示入力部903と、操作時のガイダンス画面や処理結果などの所定の情報をユーザに提示する表示出力部904と、各機能部との間のインタフェース機能をなすインタフェース部(IF部)909とを有する。
Further, the computer system 900 includes an
なお、データ処理結果を印刷出力してユーザに提示する構成とするべく、処理結果を所定の出力媒体(たとえば印刷用紙)に出力する画像形成部906を設けることもできる。
Note that an
指示入力部903としては、たとえば、ユーザインタフェース部985の操作キー部985bを利用することができる。あるいは、キーボードやマウスなどを利用することもできる。
As the
表示出力部904は、表示制御部919と表示装置とを備える。表示装置としては、たとえば、ユーザインタフェース部985の操作パネル部985aを利用することができる。あるいは、CRT(Cathode Ray Tube;陰極線管)やLCD(Liquid Crystal Display;液晶)などでなるその他のディスプレイ部を利用することもできる。
The display output unit 904 includes a
たとえば、表示制御部919が、操作パネル部985aやディスプレイ部上に、ガイダンス情報や文書入力装置20が取り込んだ全体画像などを表示させる。また、各種の情報をユーザに通知する際の表示デバイスとしても利用される。なお、表示面上にタッチパネルを有するディスプレイ部とすることで、指先やペンなどで所定の情報を入力する指示入力部903を構成することもできる。
For example, the
インタフェース部909としては、処理データ(画像データを含む)や制御データの転送経路であるシステムバス991の他、たとえば、画像形成部906や他のプリンタとのインタフェース機能をなすプリンタIF部996、およびネットワークとの間の通信データの受け渡しを仲介する通信IF部999を有している。
The interface unit 909 includes a system bus 991 that is a transfer path for processing data (including image data) and control data, a printer IF
このような構成において、CPU912は、システムバス991を介してシステム全体の制御を行なう。ROM913は、CPU912の制御プログラムなどを格納する。RAM915は、SRAM(Static Random Access Memory )などで構成され、プログラム制御変数や各種処理のためのデータなどを格納する。また、RAM915は、所定のアプリケーションプログラムに従って演算して得たデータや外部から取得したデータなどを一時的に格納する領域を含んでいる。
In such a configuration, the
たとえば、追記情報に関するデータ処理機能をコンピュータに実行させるプログラムは、CD−ROMなどの記録媒体を通じて配布される。あるいは、このプログラムは、CD−ROMではなくFDに格納されてもよい。また、MOドライブを設け、MOに前記プログラムを格納してもよく、またフラッシュメモリなどの不揮発性の半導体メモリカードなど、その他の記録媒体にプログラムを格納してもよい。さらに、他のサーバなどからインターネットなどのネットワークを経由してプログラムをダウンロードして取得したり、あるいは更新したりしてもよい。 For example, a program that causes a computer to execute a data processing function related to additional recording information is distributed through a recording medium such as a CD-ROM. Alternatively, this program may be stored in the FD instead of the CD-ROM. In addition, an MO drive may be provided to store the program in the MO, or the program may be stored in another recording medium such as a nonvolatile semiconductor memory card such as a flash memory. Furthermore, the program may be downloaded from another server or the like via a network such as the Internet, or may be updated or updated.
なおプログラムを提供するための記録媒体としては、FDやCD−ROMなどの他にも、DVDなどの光学記録媒体、MDなどの磁気記録媒体、PDなどの光磁気記録媒体、テープ媒体、磁気記録媒体、ICカードやミニチュアカードなどの半導体メモリを用いることができる。記録媒体の一例としてのFDやCD−ROMなどには、追記情報に関するデータ処理機能を実現する際の、一部または全ての機能を格納することができる。 As a recording medium for providing the program, in addition to FD and CD-ROM, optical recording medium such as DVD, magnetic recording medium such as MD, magneto-optical recording medium such as PD, tape medium, and magnetic recording A semiconductor memory such as a medium, an IC card, or a miniature card can be used. A part or all of functions for realizing a data processing function related to additional write information can be stored in an FD or CD-ROM as an example of a recording medium.
また、ハードディスク装置は、制御プログラムによる各種処理のためのデータを格納したり、自装置で取得したデータや外部から取得したデータなどを大量に一時的に格納したりする領域を含んでいる。 Further, the hard disk device includes an area for storing data for various processes by the control program, and temporarily storing a large amount of data acquired by the device itself or data acquired from the outside.
このような構成により、操作キー部985bを介した操作者による指令にて、前述の追記情報処理方法を実行するプログラムが記憶されているCD−ROMなどの読取可能な記録媒体からRAM915に追記情報処理プログラムがインストールされ、また操作キー部985bを介した操作者による指令や自動処理にて追記情報処理プログラムが起動される。たとえば、教材自動採点システム1を実現する場合であれば、教材処理プログラムでは、所定色成分、具体的にはたとえば赤色成分の差分抽出結果を、採点記号87やコメント88の記入内容として認識し、かつ両者を分離するようにする処理ステップなどが記述されプログラムが起動される。
With such a configuration, additional information is written in the
CPU912は、この追記情報処理プログラムに従って前述の追記情報処理方法に伴う計算処理を施し、処理結果をRAM915やハードディスクなどの記憶装置に格納し、必要により操作パネル部985a、あるいはCRTやLCDなどの表示装置に出力する。追記情報処理方法を実行するプログラムが記録した記録媒体を用いることにより、既存のシステムを変えることなく、追記情報処理システムを汎用的に構築することができる。
The
なお、このようなコンピュータを用いた構成に限らず、図2を用いて示した各機能部の処理をなす専用のハードウェアの組合せにより、追記情報に関するデータ処理機能を行なう追記情報処理装置10を構成することもできる。
Not only the configuration using such a computer, but also a write-once
また、たとえば、追記情報に関するデータ処理機能のための各機能部分の全ての処理をソフトウェアで行なうのではなく、これら機能部分の一部を専用のハードウェアにて行なう処理回路908を設けてもよい。ソフトウェアで行なう仕組みは、並列処理や連続処理に柔軟に対処し得るものの、その処理が複雑になるに連れ、処理時間が長くなるため、処理速度の低下が問題となる。
In addition, for example, a
これに対して、ハードウェア処理回路で行なうことで、高速化を図ったアクセラレータシステムを構築することができるようになる。アクセラレータシステムは、処理が複雑であっても、処理速度の低下を防ぐことができ、高いスループットを得ることができる。 On the other hand, it is possible to construct an accelerator system with a higher speed by using a hardware processing circuit. Even if the processing is complicated, the accelerator system can prevent a reduction in processing speed and can obtain a high throughput.
たとえば、追記情報に関するデータ処理機能を実現する場合であれば、処理回路908としては、図2に示した読取画像処理部110に相当する読取画像処理部908a、文書原本特定部120に相当する文書原本特定部908b、追記情報抽出部130に相当する追記情報抽出部908c、データ処理対象追記情報特定処理部150に相当するデータ処理対象追記情報特定処理部908d、あるいはデータ処理部170に相当するデータ処理部908eなどをハードウェアで構成するとよい。
For example, in the case of realizing a data processing function related to additional information, the
以上、本発明について実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、そのような変更または改良を加えた形態も本発明の技術的範囲に含まれる。 As mentioned above, although this invention was demonstrated using embodiment, the technical scope of this invention is not limited to the range as described in the said embodiment. Various changes or improvements can be added to the above-described embodiment without departing from the gist of the invention, and embodiments to which such changes or improvements are added are also included in the technical scope of the present invention.
また、上記の実施形態は、クレーム(請求項)にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組合せの全てが発明の解決手段に必須であるとは限らない。前述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜の組合せにより種々の発明を抽出できる。実施形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られる限りにおいて、この幾つかの構成要件が削除された構成が発明として抽出され得る。 Further, the above embodiments do not limit the invention according to the claims (claims), and all combinations of features described in the embodiments are not necessarily essential to the solution means of the invention. Absent. The embodiments described above include inventions at various stages, and various inventions can be extracted by appropriately combining a plurality of disclosed constituent elements. Even if some constituent requirements are deleted from all the constituent requirements shown in the embodiment, as long as an effect is obtained, a configuration from which these some constituent requirements are deleted can be extracted as an invention.
たとえば、歪み補正処理や途切れ補正処理などは、必ずしも必須ではない。 For example, a distortion correction process and a break correction process are not necessarily essential.
また、処理対象の追記済文書8Bの一例として、自動採点集計処理の仕組みに利用される付加情報記入済教材81を例に説明したが、これは一例に過ぎず、データ処理対象となる手書きの追記情報が含まれているものであれば、その文書の種別は問わない。たとえば、自動帳票処理の仕組みに利用される記入済帳票(特開平5−342239号公報や平6−274156号公報を参照)や個人情報管理(特にスケジュール管理ともいう)の仕組みに利用される付加情報記入済手帳(特開平5−216932号公報を参照)などであってもよい。
In addition, as an example of the additional document 8B to be processed, the additional information filled
また、先にも述べたが、処理対象の追記済文書8Bは、紙媒体を用いることに限定されず、最初から追記済文書8Bを電子データの形式で入手する態様の場合であっても、データ処理対象となる追記情報が含まれているものであれば、上述した仕組みを同様に適用することができる。 Further, as described above, the post-recorded document 8B to be processed is not limited to using a paper medium, and even if the post-recorded document 8B is obtained in the form of electronic data from the beginning, The above-described mechanism can be similarly applied as long as additional information to be processed is included.
1…教材自動採点システム、8A…文書原本、8B…追記済文書、9…差分情報、10…追記情報処理装置、20…文書入力装置、30…文書管理サーバ、40…処理結果保存サーバ、80…教育用教材、81…付加情報記入済教材、87…採点記号、88…コメント、110…読取画像処理部、120…文書原本特定部、122…教材特定部、130…追記情報抽出部、132…差分抽出部、134…解答者抽出部、136…手書き情報切出部、138…文字認識処理部、140…データ処理用追記情報抽出処理部、142…データ処理対象追記情報抽出部、146…追記情報整形部、148…抽出線分途切れ補正部、150…データ処理対象追記情報特定処理部、154…第1データ処理用追記情報認識部、155…分離認識処理部、156…図形形状認識部、157…文字認識処理部、158…記入位置認識部、164…第2データ処理用追記情報認識部、166…図形形状認識部、167…文字認識処理部、156a,166a、157a,167a…変形処理部、168…記入位置認識部、170…データ処理部、170_1…第1データ処理部、170_2…第2データ処理部、171…ユーザ端末、172…採点集計部、174…集計結果出力部、176…コメント分類処理部、178…コメント処理結果出力、190…認識性能情報提示処理部、192…追記情報認識履歴保持部、194…難認識追記情報抽出部、198…認識性能情報提示部
DESCRIPTION OF
Claims (11)
前記差分抽出手段によって抽出された差分から、予め定められた色成分の画像データを抽出する色成分抽出手段と、
前記色成分抽出手段によって抽出された画像データに含まれる線分のうち、途切れた線分同士が接続されるよう、前記色成分抽出手段によって抽出された画像データを補正する途切れ線分補正手段と、
前記途切れ線分補正手段によって補正された画像データに含まれる図形の形状を認識する図形形状認識手段と、
前記図形形状認識手段によって認識された図形が記入された位置を認識する記入位置認識手段と、
前記図形形状認識手段によって形状が認識され、前記記入位置認識手段によって記入位置が認識された図形それぞれについて、前記差分抽出手段における抽出誤りの信頼度に関する特徴量、前記色成分抽出手段における抽出誤りの信頼度に関する特徴量、前記途切れ線補正手段における補正誤りの信頼度に関する特徴量、前記図形形状認識手段における認識誤りの信頼度に関する特徴量及び前記記入位置認識手段における認識誤りの信頼度に関する特徴量のうち少なくとも複数の特徴量が予め定められた基準を満たすか否かを示すサブ信頼度を算出し、算出されたサブ信頼度が予め定められた水準よりも低い図形を特定する難認識図形特定手段と、
前記難認識図形特定手段によって特定された図形が修正を要することを表示する表示手段と
を備える情報処理装置。 Differential extraction means for extracting the difference between the image data of the original and the image data of the completed original that has been entered for the original;
Color component extraction means for extracting image data of a predetermined color component from the difference extracted by the difference extraction means;
Of the line segments included in the image data extracted by the color component extraction means, the broken line segment correction means for correcting the image data extracted by the color component extraction means so that the broken line segments are connected to each other. ,
Figure shape recognition means for recognizing the shape of a figure contained in the image data corrected by the interrupted line segment correction means;
Entry position recognition means for recognizing the position where the figure recognized by the figure shape recognition means is entered;
For each figure whose shape is recognized by the figure shape recognizing means and whose entry position is recognized by the entry position recognizing means, the feature amount relating to the reliability of the extraction error in the difference extracting means, the extraction error in the color component extracting means Feature quantity related to reliability, feature quantity related to reliability of correction error in the broken line correction means, feature quantity related to reliability of recognition error in the figure shape recognition means, and feature quantity related to reliability of recognition error in the entry position recognition means Sub-reliability indicating whether or not at least a plurality of feature quantities satisfy a predetermined criterion, and identifying a difficult-to-recognize graphic that specifies a graphic whose calculated sub-reliability is lower than a predetermined level Means,
An information processing apparatus comprising: display means for displaying that the graphic specified by the difficult-to-recognize graphic specifying means needs to be corrected.
請求項1に記載の情報処理装置。 The difficult-to-recognize figure specifying means specifies the lowest sub-reliability among the calculated sub-reliabilities as a final reliability, and specifies a figure whose specified final reliability is lower than a predetermined level. The information processing apparatus according to claim 1 that is specified.
請求項1に記載の情報処理装置。 The difficult-to-recognize figure specifying means specifies the smallest value among the total values obtained by multiplying the calculated sub-reliability by a weighting value, and the specified final reliability is determined in advance. The information processing apparatus according to claim 1, wherein a figure lower than a standard is specified.
請求項1に記載の情報処理装置。 The difficult-to-recognize figure specifying means is a type of error relating to a feature amount that is a basis for calculating a value that is the smallest value or a value that is lower than a predetermined level by multiplying the calculated sub-reliability by a weighting value. The information processing apparatus according to claim 1.
請求項1乃至4のいずれかに記載の情報処理装置。 The information processing apparatus according to claim 1, wherein the display unit changes a display method according to a final reliability or an error type specified by the difficult-recognition graphic specifying unit.
請求項1乃至4のいずれかに記載の情報処理装置。 The display means is a figure whose shape is recognized by the figure shape recognition means, and among the figures whose entry positions are recognized by the entry position recognition means, a figure specified by the difficult recognition figure specifying means and a figure other than the figure The information processing device according to claim 1, wherein the information processing device is displayed so as to be distinguished from each other.
請求項1乃至4のいずれかに記載の情報処理装置。 The display means displays the final reliability of the figure and the reason why the figure should be corrected when displaying that the figure specified by the difficult recognition figure specifying means needs to be corrected. The information processing apparatus according to any one of the above.
をさらに有する請求項1乃至7のいずれかに記載の情報処理装置。 8. The data processing unit according to claim 1, further comprising: a data processing unit that recognizes a shape by the figure shape recognition unit and executes a scoring process based on each of the figures whose entry position is recognized by the entry position recognition unit. Information processing device.
をさらに有し、
前記データ処理手段は、前記受付手段によって受け付けられた修正後の図形に基づいて自動採点処理を実行する
請求項8に記載の情報処理装置。 Receiving means for receiving correction of the graphic specified by the difficult-to-recognize graphic specifying means;
The information processing apparatus according to claim 8, wherein the data processing unit performs an automatic scoring process based on the corrected graphic received by the receiving unit.
前記色成分抽出手段における抽出誤りの信頼度に関する特徴量は、前記色成分抽出手段による抽出結果の品質並びに前記原稿の画像データと前記色成分抽出手段によって抽出される画像データとが重複する量及び接触する量であり、
前記途切れ線補正手段における補正誤りの信頼度に関する特徴量は、前記途切れ線補正手段によって接続される途切れた線分の端点及び当該端点間の距離であり、
前記図形形状認識手段における認識誤りの信頼度に関する特徴量は、前記途切れ線分補正手段によって補正された画像データにおいて図形同士が接触するか否か及び前記図形形状認識手段による図形形状認識結果の信頼度であり、
前記記入位置認識手段における認識誤りの信頼度に関する特徴量は、前記図形形状認識手段によって認識された図形が記入された位置が複数認識される可能性及び前記原稿に設けられた記入欄と前記図形形状認識手段によって認識された図形との距離である
請求項1乃至9のいずれかに記載の情報処理装置。 The feature quantity related to the reliability of the extraction error in the difference extraction means overlaps the quality of the extraction result by the difference extraction means and the image data of the original document and the image data of the completed original document that has been entered for the original document. Amount and the amount to contact,
The feature amount relating to the reliability of the extraction error in the color component extraction unit includes the quality of the extraction result by the color component extraction unit, the amount of overlap between the original image data and the image data extracted by the color component extraction unit, and The amount of contact,
The feature amount related to the reliability of the correction error in the broken line correction unit is an end point of a broken line segment connected by the broken line correction unit and a distance between the end points,
The feature quantity related to the reliability of the recognition error in the figure shape recognition means is whether the figures are in contact with each other in the image data corrected by the discontinuous line correction means and the reliability of the figure shape recognition result by the figure shape recognition means. Degree,
The feature amount related to the reliability of the recognition error in the entry position recognition means includes the possibility of recognizing a plurality of positions where the figure recognized by the figure shape recognition means is entered, and the entry column and the figure provided in the manuscript. The information processing apparatus according to claim 1, wherein the information processing apparatus is a distance from a figure recognized by the shape recognition means.
前記差分抽出手段によって抽出された差分から、予め定められた色成分の画像データを抽出する色成分抽出手段、
前記色成分抽出手段によって抽出された画像データに含まれる線分のうち、途切れた線分同士が接続されるよう、前記色成分抽出手段によって抽出された画像データを補正する途切れ線分補正手段、
前記途切れ線分補正手段によって補正された画像データに含まれる図形の形状を認識する図形形状認識手段、
前記図形形状認識手段によって認識された図形が記入された位置を認識する記入位置認識手段、
前記図形形状認識手段によって形状が認識され、前記記入位置認識手段によって記入位置が認識された図形それぞれについて、前記差分抽出手段における抽出誤りの信頼度に関する特徴量、前記色成分抽出手段における抽出誤りの信頼度に関する特徴量、前記途切れ線補正手段における補正誤りの信頼度に関する特徴量、前記図形形状認識手段における認識誤りの信頼度に関する特徴量及び前記記入位置認識手段における認識誤りの信頼度に関する特徴量のうち少なくとも複数の特徴量が予め定められた基準を満たすか否かを示すサブ信頼度を算出し、算出されたサブ信頼度が予め定められた水準よりも低い図形を特定する難認識図形特定手段、及び、
前記難認識図形特定手段によって特定された図形が修正を要することを表示する表示手段
としてコンピュータを機能させるプログラム。 Difference extraction means for extracting the difference between the image data of the document and the image data of the completed document that has been filled in the document;
Color component extraction means for extracting image data of a predetermined color component from the difference extracted by the difference extraction means;
Of the line segments included in the image data extracted by the color component extraction unit, the broken line segment correction unit that corrects the image data extracted by the color component extraction unit so that the broken line segments are connected to each other.
Graphic shape recognition means for recognizing the shape of a graphic contained in the image data corrected by the broken line correction means;
Entry position recognition means for recognizing the position where the figure recognized by the figure shape recognition means is entered;
For each figure whose shape is recognized by the figure shape recognizing means and whose entry position is recognized by the entry position recognizing means, the feature amount relating to the reliability of the extraction error in the difference extracting means, the extraction error in the color component extracting means Feature quantity related to reliability, feature quantity related to reliability of correction error in the broken line correction means, feature quantity related to reliability of recognition error in the figure shape recognition means, and feature quantity related to reliability of recognition error in the entry position recognition means Sub-reliability indicating whether or not at least a plurality of feature quantities satisfy a predetermined criterion, and identifying a difficult-to-recognize graphic that specifies a graphic whose calculated sub-reliability is lower than a predetermined level Means and
A program that causes a computer to function as display means for displaying that a graphic specified by the difficult-recognition graphic specifying means needs to be corrected.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006170877A JP4873138B2 (en) | 2006-06-21 | 2006-06-21 | Information processing apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006170877A JP4873138B2 (en) | 2006-06-21 | 2006-06-21 | Information processing apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008003740A JP2008003740A (en) | 2008-01-10 |
JP4873138B2 true JP4873138B2 (en) | 2012-02-08 |
Family
ID=39008078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006170877A Expired - Fee Related JP4873138B2 (en) | 2006-06-21 | 2006-06-21 | Information processing apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4873138B2 (en) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1857880B1 (en) | 2003-04-09 | 2015-09-16 | Nikon Corporation | Exposure method and apparatus and device manufacturing method |
TWI511179B (en) | 2003-10-28 | 2015-12-01 | 尼康股份有限公司 | Optical illumination device, exposure device, exposure method and device manufacturing method |
TWI385414B (en) | 2003-11-20 | 2013-02-11 | 尼康股份有限公司 | Optical illuminating apparatus, illuminating method, exposure apparatus, exposure method and device fabricating method |
TWI505329B (en) | 2004-02-06 | 2015-10-21 | 尼康股份有限公司 | Optical illumination apparatus, light-exposure apparatus, light-exposure method and device manufacturing method |
WO2006121009A1 (en) | 2005-05-12 | 2006-11-16 | Nikon Corporation | Projection optical system, exposure apparatus and exposure method |
JP5267029B2 (en) | 2007-10-12 | 2013-08-21 | 株式会社ニコン | Illumination optical apparatus, exposure apparatus, and device manufacturing method |
US8379187B2 (en) | 2007-10-24 | 2013-02-19 | Nikon Corporation | Optical unit, illumination optical apparatus, exposure apparatus, and device manufacturing method |
US9116346B2 (en) | 2007-11-06 | 2015-08-25 | Nikon Corporation | Illumination apparatus, illumination method, exposure apparatus, and device manufacturing method |
JP5884552B2 (en) * | 2012-02-28 | 2016-03-15 | 村田機械株式会社 | Image processing device |
JP5395927B2 (en) | 2012-05-11 | 2014-01-22 | 株式会社東芝 | Electronic device and handwritten document search method |
JP6907565B2 (en) * | 2017-02-02 | 2021-07-21 | 富士フイルムビジネスイノベーション株式会社 | Image processing equipment and image processing program |
JP6903966B2 (en) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | Information processing equipment, information processing systems and programs |
JP2018190914A (en) | 2017-05-11 | 2018-11-29 | 株式会社オートネットワーク技術研究所 | Circuit structure and electric connection box |
JP6548181B1 (en) * | 2018-08-20 | 2019-07-24 | 日本テクトシステムズ株式会社 | Device, method and program for marking handwritten characters |
JP7342655B2 (en) * | 2019-11-26 | 2023-09-12 | 大日本印刷株式会社 | Information processing device, control method and program |
JP7524712B2 (en) | 2020-10-27 | 2024-07-30 | 大日本印刷株式会社 | Information processing device, control method, and program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3232991B2 (en) * | 1995-12-13 | 2001-11-26 | 株式会社日立製作所 | Character reading method and address reading method |
JPH1021326A (en) * | 1996-06-28 | 1998-01-23 | Ricoh Co Ltd | Recognized result displaying method, character recognizing system and information recording medium |
JP3619333B2 (en) * | 1996-08-13 | 2005-02-09 | 株式会社リコー | Pattern recognition system |
JP2004152115A (en) * | 2002-10-31 | 2004-05-27 | Toshiba Corp | Input correction method and input correction support system |
-
2006
- 2006-06-21 JP JP2006170877A patent/JP4873138B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008003740A (en) | 2008-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4873138B2 (en) | Information processing apparatus and program | |
US8768241B2 (en) | System and method for representing digital assessments | |
JP4868224B2 (en) | Additional recording information processing method, additional recording information processing apparatus, and program | |
US7227997B2 (en) | Image recognition apparatus, image recognition method, and image recognition program | |
JP2012181653A (en) | Scoring method, program of scoring method, and scoring system | |
JP2008003739A (en) | Input correction method, postscript information processing method, postscript information processor, and program | |
JP5080872B2 (en) | Scoring system and scoring program | |
JP4807489B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP2007179395A (en) | Medium processing apparatus, method and system, and computer readable recording medium for recording medium processing program | |
JP2007233888A (en) | Image processor and image processing program | |
JP2007280241A (en) | Postscript information processing method, postscript information processor and program | |
JP4710707B2 (en) | Additional recording information processing method, additional recording information processing apparatus, and program | |
JP6766987B1 (en) | Scoring support device, scoring support system, scoring support method and scoring support program | |
JP4807487B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP4807486B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP4894184B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP4736595B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP4756456B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
US20060188863A1 (en) | Material processing apparatus, material processing method, and material processing program product | |
JP4894195B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP2007304670A (en) | Additional information processing method, additional information processor, document preparation device and program | |
JP5227720B2 (en) | Information collection system and information entry sheet used therefor | |
JP4701918B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP5054284B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP4807488B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090210 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20091009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111026 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111108 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141202 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |