JP5604814B2 - Information processing apparatus, information processing method, and program - Google Patents
Information processing apparatus, information processing method, and program Download PDFInfo
- Publication number
- JP5604814B2 JP5604814B2 JP2009145081A JP2009145081A JP5604814B2 JP 5604814 B2 JP5604814 B2 JP 5604814B2 JP 2009145081 A JP2009145081 A JP 2009145081A JP 2009145081 A JP2009145081 A JP 2009145081A JP 5604814 B2 JP5604814 B2 JP 5604814B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- attribute information
- form data
- template
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 87
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000000034 method Methods 0.000 claims description 118
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Description
本発明は、情報処理装置、情報処理方法及びプログラムに関し、特に、認識処理に用いられる認識テンプレートを生成する技術に関するものである。
The present invention relates to an information processing apparatus, an information processing method, and a program, particularly to a technique for generating a recognition template that is used in the recognition process.
従来、一定の書式(テンプレート)に変数(文字や数値等のテンプレートに固定されないデータ)等のデータをオーバーレイして帳票などを作成している。また、このようにして帳票等を作成するために用いるテンプレートのデータを作成するためのソフトウェアも開発されている。 Conventionally, a form or the like is created by overlaying data such as variables (data not fixed to a template such as characters and numerical values) on a certain format (template). In addition, software for creating template data used to create a form or the like in this way has been developed.
このテンプレートのデータ(テンプレートデータ)は、具体的には、一定の書式である帳票などのフォームのデータ(フォームデータ)である。このソフトウェアを用いて、帳票のフォームを作成したり、そのフォームの一部の領域に、変数等のデータを出力する出力領域や、ユーザからの文字等の入力(記載)が可能な印字領域等を設定したりすることで、テンプレートデータを作成している。 このようにして作成されたテンプレートデータに、該変数などを重ね合わせて(オーバーレイして)、目的の帳票などを出力している。 The template data (template data) is specifically form data (form data) such as a form having a certain format. Using this software, form forms can be created, output areas that output data such as variables in some areas of the forms, and print areas that allow users to input (describe) characters, etc. Template data is created by setting. The template data created in this way is overlaid with the variables and the like, and the target form is output.
また、従来、このようにして帳票が出力された後に、帳票の出力領域に出力された変数や、ユーザにより印字領域に記載された文字などを読み取るために、帳票に対してOCR処理(文字認識処理)を実行している。 OCR処理を効率的に行うため、ユーザの指示に応じて、帳票の一部の領域(出力領域や印字領域など)をOCR処理する領域として規定されたOCRテンプレートを生成し、このOCRテンプレートに従ってOCR処理を実行している。 In addition, conventionally, after a form is output in this way, OCR processing (character recognition) is performed on the form in order to read variables output to the form output area or characters written in the print area by the user. Process). In order to efficiently perform OCR processing, an OCR template that is defined as an OCR processing area is generated for a part of the form (such as an output area or a printing area) in accordance with a user instruction, and OCR template is generated according to the OCR template. Processing is being executed.
例えば、特許文献1には、スキャナから読み取った帳票のイメージを表示し、表示されたイメージの中から、ユーザにより指示された領域のフィールド項目属性情報を作成することが開示されている。
しかしながら、上記従来技術では、帳票のテンプレートデータを作成する際に、帳票の出力領域などのオブジェクトを設定し、該オブジェクトに対して、文字のフォント(ゴシック体や明朝体などの書体)やフォントサイズ、出力されるデータが文字か数字かを示す文字/数字属性、出力される文字又は数字等の桁数などの属性情報を設定し、その後OCR処理を行う際に、OCR処理する対象領域や、OCR処理で用いる辞書などの属性情報を当該対象領域に設定しなければならない。すなわち、ユーザは、テンプレートデータを作成する際とOCR処理を行う際に、属性情報の設定を行わなくてはならず煩雑であった。 However, in the above prior art, when creating the template data of a form, an object such as a form output area is set, and a character font (typeface such as Gothic or Mincho) or font is set for the object. Set the attribute information such as the size, the character / numeric attribute indicating whether the output data is characters or numbers, the number of digits such as the output characters or numbers, and then perform the OCR processing. , Attribute information such as a dictionary used in OCR processing must be set in the target area. That is, the user has to set attribute information when creating template data and performing OCR processing, which is complicated.
本発明の目的は、帳票フォームデータを作成する際に表示される表示画面を介して、ユーザの操作により、当該帳票フォームデータに対するオブジェクトの設定を受け付け、当該帳票フォームデータに設定される当該オブジェクトごとに、当該オブジェクトの種別を含むオブジェクトに係る属性情報、及び当該オブジェクトについて認識処理を行うか否かを示す設定情報を受け付け、当該各オブジェクトのそれぞれに対して当該オブジェクトに係る属性情報が設定された帳票フォームデータを作成し、当該帳票フォームデータを作成する際に、当該帳票フォームデータに設定されたオブジェクトごとに、当該オブジェクトの設定情報が認識処理を行うことを示すか否かを判定し、認識処理を行うことを示すと判定された設定情報を受け付けた当該オブジェクトの種別に従って、当該オブジェクトの認識方法を示す当該オブジェクトの認識種別を決定し、当該設定情報が認識処理を行うことを示さないと判定された場合には、当該オブジェクトの認識属性情報を生成せず、当該設定情報が認識処理を行うことを示すと判定された場合には、当該オブジェクトに係る属性情報に従って、当該決定された当該オブジェクトの認識種別を含む当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成し、オブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報が設定される当該オブジェクトの領域を、当該オブジェクトの認識種別に示される認識方法で認識処理を行う領域として設定された認識テンプレートを生成することにより、ユーザによる当該認識属性情報の入力作業を軽減させることである。 An object of the present invention is to accept setting of an object for the form form data by a user operation via a display screen displayed when creating the form form data, and for each object set in the form form data. the attribute information relating to the object that contains the type of the object, and receives setting information indicating whether to perform recognition processing for the object, attribute information relating to the object for each of the respective object is set When creating form form data and creating the form form data, for each object set in the form form data, it is determined whether or not the setting information of the object indicates recognition processing. accepts the determined setting information to indicate that performing the processing According to a type of the object, when determining the recognition type of the object that indicates the recognition method of the object, the setting information is determined not to indicate that performs recognition processing, generates the recognition attribute information of the object without, when the setting information is determined to indicate that performs recognition processing in accordance with attribute information relating to the object, attribute information relating to the recognition processing of the object containing the recognition type of the determined the object generating a recognition attribute information indicating an area of the object recognition attribute information generated as information indicating the attribute information relating to the recognition processing of the object is set, the recognition processing by the recognition method shown in recognized type of the object by generating a set recognized template as an area to perform, the user It is to reduce typing of 識属 information.
本発明は、帳票フォームデータに設定されるオブジェクトの領域が読取対象の認識処理を行う領域として設定された、当該認識処理に用いられる認識テンプレートを生成する情報処理装置であって、当該帳票フォームデータを作成する際に表示される表示画面を介して、ユーザの操作により、当該帳票フォームデータに対するオブジェクトの設定を受け付け、当該帳票フォームデータに設定される当該オブジェクトごとに、当該オブジェクトの種別を含む当該オブジェクトに係る属性情報、及び当該オブジェクトについて認識処理を行うか否かを示す設定情報の設定を受け付ける受付手段と、前記受付手段により当該属性情報の設定を受け付けた各オブジェクトのそれぞれに対して、前記受付手段で受け付けた当該オブジェクトに係る属性情報が設定された帳票フォームデータを作成する帳票フォームデータ作成手段と、当該帳票フォームデータを作成する際に、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すか否かを判定し、当該認識処理を行うことを示すと判定された設定情報を前記受付手段で受け付けたオブジェクトに係る属性情報に含まれる当該オブジェクトの種別に従って、当該オブジェクトの認識方法を示す当該オブジェクトの認識種別を決定する決定手段と、当該帳票フォームデータを作成する際に、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトであって前記帳票フォームデータ作成手段により作成される帳票フォームデータに設定されたオブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すか否かを判定した結果、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示さないと判定された場合には、前記受付手段により受け付けた当該オブジェクトに係る属性情報に従って、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成せず、一方、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すと判定された場合には、前記受付手段により受け付けた当該オブジェクトに係る属性情報であって前記帳票フォームデータ作成手段により作成される帳票フォームデータに設定される当該オブジェクトに係る属性情報に従って、前記決定手段により決定された当該オブジェクトの認識種別を含む、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成する属性情報生成手段と、当該帳票フォームデータを作成する際に、前記属性情報生成手段によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報が設定される当該オブジェクトの領域を、当該認識属性情報を用いて、当該認識属性情報に含まれる当該オブジェクトの認識種別に示される認識方法で認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成するテンプレート生成手段と、を備え、前記テンプレート生成手段は、前記属性情報生成手段によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報に含まれる認識種別が文字認識を示す場合には、当該認識属性情報が設定される当該オブジェクトの領域を、文字認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成することを特徴とする。 The present invention relates to an information processing apparatus for generating a recognition template used in a recognition process in which an object area set in the form form data is set as an area for performing a recognition process of a reading target. via the display screen displayed when creating, by the operation of the user, accepts a setting of an object with respect to the continuous form data, for each said object to be set to the slip form data, the including the type of the object attribute information relating to the object, and a receiving means for receiving setting of setting information indicating whether to perform a recognition process for the object, and against each of the objects of accepting the setting of the attribute information by said receiving means, said Attribute information related to the object received by the receiving means A continuous form data creating means but to create a set form form data, when creating the continuous form data, for each object that has been set for the document form data by said receiving means, with respect to the object It is determined whether or not the setting information received by the receiving unit indicates that the recognition process is to be performed, and the setting information determined to indicate that the recognition process is to be performed is included in the attribute information related to the object received by the receiving unit. In accordance with the type of the object included, a determination unit that determines a recognition type of the object indicating a recognition method of the object, and when the form form data is created, the reception unit sets the form form data. created by the continuous form data creation means an object was Results setting information accepted by the accepting means for the continuous form data to the set object is determined whether indicates that performs recognition processing, is set for the document form data by said receiving means For each object, if it is determined that the setting information received by the receiving unit for the object does not indicate that recognition processing is performed, the object information is received according to the attribute information related to the object received by the receiving unit. without generating a recognition attribute information indicating attribute information relating to recognition of an object, whereas, if the setting information accepted by the accepting means with respect to the object is determined to indicate that performs recognition processing, the Attribute information related to the object received by the receiving means, the form form data Recognition indicating attribute information related to the object recognition processing including the recognition type of the object determined by the determining means according to the attribute information related to the object set in the form data created by the data creating means an attribute information generating means for generating attribute information, when creating the continuous form data, the recognition attribute information generated as information indicating the attribute information relating to the recognition processing of the object by the attribute information generation unit is set Using the recognition attribute information, generate a recognition template for the form form data, which is set as an area to be recognized by the recognition method indicated by the recognition type of the object included in the recognition attribute information. Template generating means for performing the template generation Stage, when the recognition type included in the recognition attribute information generated as information indicating the attribute information relating to the recognition processing of the object by the attribute information generating means indicating the character recognition, the in which the recognition attribute information is set A recognition template for the form form data, in which an object area is set as an area for character recognition processing, is generated.
本発明は、帳票フォームデータに設定されるオブジェクトの領域が読取対象の認識処理を行う領域として設定された、当該認識処理に用いられる認識テンプレートを生成する情報処理装置における情報処理方法であって、受付手段が、当該帳票フォームデータを作成する際に表示される表示画面を介して、ユーザの操作により、当該帳票フォームデータに対するオブジェクトの設定を受け付け、当該帳票フォームデータに設定される当該オブジェクトごとに、当該オブジェクトの種別を含む当該オブジェクトに係る属性情報、及び当該オブジェクトについて認識処理を行うか否かを示す設定情報の設定を受け付ける受付工程と、帳票フォームデータ作成手段が、前記受付工程により当該属性情報の設定を受け付けた各オブジェクトのそれぞれに対して、前記受付工程で受け付けた当該オブジェクトに係る属性情報が設定された帳票フォームデータを作成する帳票フォームデータ作成工程と、決定手段が、当該帳票フォームデータを作成する際に、前記受付工程により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付工程により受け付けた設定情報が認識処理を行うことを示すか否かを判定し、当該認識処理を行うことを示すと判定された設定情報を前記受付工程で受け付けたオブジェクトに係る属性情報に含まれる当該オブジェクトの種別に従って、当該オブジェクトの認識方法を示す当該オブジェクトの認識種別を決定する決定工程と、属性情報生成手段が、当該帳票フォームデータを作成する際に、前記受付工程により当該帳票フォームデータに対して設定されたオブジェクトであって前記帳票フォームデータ作成工程により作成される帳票フォームデータに設定されたオブジェクトに対して前記受付工程により受け付けた設定情報が認識処理を行うことを示すか否かを判定した結果、前記受付工程により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付工程により受け付けた設定情報が認識処理を行うことを示さないと判定された場合には、前記受付工程により受け付けた当該オブジェクトに係る属性情報に従って、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成せず、一方、当該オブジェクトに対して前記受付工程により受け付けた設定情報が認識処理を行うことを示すと判定された場合には、前記受付工程により受け付けた当該オブジェクトに係る属性情報であって前記帳票フォームデータ作成工程により作成される帳票フォームデータに設定される当該オブジェクトに係る属性情報に従って、前記決定工程により決定された当該オブジェクトの認識種別を含む、当該オブジェクトの認識処理に係る属性情報を示す文字認識属性情報を生成する属性情報生成工程と、テンプレート生成手段が、当該帳票フォームデータを作成する際に、前記属性情報生成工程によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報が設定される当該オブジェクトの領域を、当該認識属性情報を用いて、当該認識属性情報に含まれる当該オブジェクトの認識種別に示される認識方法で認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成するテンプレート生成工程と、を備え、前記テンプレート生成工程は、前記属性情報生成工程によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報に含まれる認識種別が文字認識を示す場合には、当該認識属性情報が設定される当該オブジェクトの領域を、文字認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成することを特徴とする The present invention is an information processing method in an information processing apparatus for generating a recognition template used in a recognition process in which an object area set in form form data is set as an area for performing recognition processing of a reading target, receiving unit, via a display screen displayed when creating the continuous form data by operating the user accepts the setting of the object with respect to the continuous form data, for each said object to be set to the slip form data , attribute information relating to the object that contains the type of the object, and a reception step of receiving a setting of setting information indicating whether to perform a recognition process for the object, the continuous form data creating means, the attribute by the receiving step each of the object, which has received a set of information In contrast, a continuous form data creating step of creating continuous form data attribute information is set according to the object that has been received in the receiving step, the determining means, when creating the continuous form data, by said receiving step For each object set for the form data, it is determined whether the setting information received by the receiving step indicates that the object is to be recognized, and indicates that the recognition process is to be performed. and according to type of the object included in the attribute information of the determined setting information to the object received by the receiving step, a determination step of determining a recognition type of the object that indicates the recognition method of the object, the attribute information generating means the but when creating the continuous form data, by said receiving step It indicates that the setting information accepted by the accepting step for the object set in a continuous form data created by an object set for vote form data by said continuous form data producing step performs recognition processing As a result of determining whether or not, for each object set for the form form data by the receiving process, the setting information received by the receiving process for the object does not indicate that recognition processing is performed. If it is determined, according to the attribute information related to the object received in the receiving step, the recognition attribute information indicating the attribute information related to the object recognition process is not generated. It was determined that the received setting information indicates that recognition processing is to be performed . In this case, it is determined by the determining step according to the attribute information related to the object received by the receiving step and set in the form form data created by the form form data creating step. The attribute information generating step for generating the character recognition attribute information indicating the attribute information related to the recognition processing of the object, including the recognition type of the object, and the template generating means, when the form form data is generated, the attribute the region of the object recognition attribute information generated as information indicating the attribute information relating to recognition of objects by the information generating step is set, by using the recognition attribute information, of the object included in the recognition attribute information An area where recognition processing is performed using the recognition method indicated in the recognition type. Set, and a template generation step of generating a recognition template for the continuous form data, the template generation process is recognized generated as information indicating the attribute information relating to the recognition processing of the object by the attribute information generation step If the recognition type included in the attribute information indicates character recognition, an area of the object to which the recognition attribute information is set, is set as an area to perform character recognition processing, generates a recognition template for the continuous form data It is characterized by
本発明は、帳票フォームデータに設定されるオブジェクトの領域が読取対象の認識処理を行う領域として設定された、当該認識処理に用いられる認識テンプレートを生成する情報処理装置が読み取り実行可能なプログラムあって、前記情報処理装置を、当該帳票フォームデータを作成する際に表示される表示画面を介して、ユーザの操作により、当該帳票フォームデータに対するオブジェクトの設定を受け付け、当該帳票フォームデータに設定される当該オブジェクトごとに、当該オブジェクトの種別を含む当該オブジェクトに係る属性情報、及び当該オブジェクトについて認識処理を行うか否かを示す設定情報の設定を受け付ける受付手段と、前記受付手段により当該属性情報の設定を受け付けた各オブジェクトのそれぞれに対して、前記受付手段で受け付けた当該オブジェクトに係る属性情報が設定された帳票フォームデータを作成する帳票フォームデータ作成手段と、当該帳票フォームデータを作成する際に、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すか否かを判定し、当該認識処理を行うことを示すと判定された設定情報を前記受付手段で受け付けたオブジェクトに係る属性情報に含まれる当該オブジェクトの種別に従って、当該オブジェクトの認識方法を示す当該オブジェクトの認識種別を決定する決定手段と、当該帳票フォームデータを作成する際に、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトであって前記帳票フォームデータ作成手段により作成される帳票フォームデータに設定されたオブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すか否かを判定した結果、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示さないと判定された場合には、前記受付手段により受け付けた当該オブジェクトに係る属性情報に従って、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成せず、一方、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すと判定された場合には、前記受付手段により受け付けた当該オブジェクトに係る属性情報であって前記帳票フォームデータ作成手段により作成される帳票フォームデータに設定される当該オブジェクトに係る属性情報に従って、前記決定手段により決定された当該オブジェクトの認識種別を含む、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成する属性情報生成手段と、当該帳票フォームデータを作成する際に、前記属性情報生成手段によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報が設定される当該オブジェクトの領域を、当該認識属性情報を用いて、当該認識属性情報に含まれる当該オブジェクトの認識種別に示される認識方法で認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成するテンプレート生成手段として機能させ、前記テンプレート生成手段は、前記属性情報生成手段によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報に含まれる認識種別が文字認識を示す場合には、当該認識属性情報が設定される当該オブジェクトの領域を、文字認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成することを特徴とする。 The present invention is a program that can be read and executed by an information processing apparatus that generates a recognition template used for recognition processing in which an object region set in form form data is set as a region for performing recognition processing of a reading target. , the information processing apparatus, the through display screen displayed when creating the continuous form data, by a user operation, which accepts a setting of an object with respect to the continuous form data, are set on the document form data for each object, attribute information relating to the object that contains the type of the object, and a receiving means for receiving setting of setting information indicating whether to perform a recognition process for the object, the setting of the attribute information by said receiving means for each of the objects accepted, the A continuous form data generating means for generating a continuous form data attribute information is set according to the object which is received by the urging means, when creating the form form data, set for the document form data by said receiving means For each object, it is determined whether or not the setting information received by the receiving unit for the object indicates that recognition processing is performed, and the setting information determined to indicate that the recognition processing is performed is In accordance with the type of the object included in the attribute information related to the object received by the receiving unit, the determining unit that determines the recognition type of the object indicating the recognition method of the object, and the reception when creating the form form data Object set for the form data by means Result of determining whether indicating the setting information accepted by the accepting means for the object set in a continuous form data to be created to perform the recognition process by the continuous form data creating means comprising at said reception For each object set for the form data by the means, if it is determined that the setting information received by the receiving means for the object does not indicate that recognition processing is to be performed, the receiving means According to the received attribute information related to the object, the recognition attribute information indicating the attribute information related to the object recognition process is not generated, while the setting information received by the receiving unit performs the recognition process for the object. If it is determined to show the the of accepted by the accepting means The object information including the recognition type of the object determined by the determining unit according to the attribute information related to the object set in the form form data generated by the form form data generating unit. Information generating means for generating recognition attribute information indicating the attribute information related to the recognition processing of the object , and when generating the form data, the attribute information generating means generates information indicating the attribute information related to the object recognition processing. the region of the object recognition attribute information is set which is, by using the recognition attribute information, is set as an area to perform the recognition process by the recognition method shown in recognized type of the object included in the recognition attribute information , A template for generating a recognition template for the form data To function as a rate generator, the template generating unit, when recognizing type included in the recognition attribute information generated as information indicating the attribute information relating to the recognition processing of the object by the attribute information generating means indicates a character recognition , an area of the object to which the recognition attribute information is set, is set as an area to perform character recognition processing, and generates a recognition template for the continuous form data.
本発明によれば、帳票フォームデータを作成する際に表示される表示画面を介して、ユーザの操作により、当該帳票フォームデータに対するオブジェクトの設定を受け付け、当該帳票フォームデータに設定される当該オブジェクトごとに、当該オブジェクトの種別を含むオブジェクトに係る属性情報、及び当該オブジェクトについて認識処理を行うか否かを示す設定情報を受け付け、当該各オブジェクトのそれぞれに対して当該オブジェクトに係る属性情報が設定された帳票フォームデータを作成し、当該帳票フォームデータを作成する際に、当該帳票フォームデータに設定されたオブジェクトごとに、当該オブジェクトの設定情報が認識処理を行うことを示すか否かを判定し、認識処理を行うことを示すと判定された設定情報を受け付けた当該オブジェクトの種別に従って、当該オブジェクトの認識方法を示す当該オブジェクトの認識種別を決定し、当該設定情報が認識処理を行うことを示さないと判定された場合には、当該オブジェクトの認識属性情報を生成せず、当該設定情報が認識処理を行うことを示すと判定された場合には、当該オブジェクトに係る属性情報に従って、当該決定された当該オブジェクトの認識種別を含む当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成し、オブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報が設定される当該オブジェクトの領域を、当該オブジェクトの認識種別に示される認識方法で認識処理を行う領域として設定された認識テンプレートを生成することにより、ユーザによる当該認識属性情報の入力作業を軽減させることができる。
According to the present invention, setting of an object for the form form data is accepted by a user operation via a display screen displayed when creating the form form data, and each object set in the form form data is received. the attribute information relating to the object that contains the type of the object, and receives setting information indicating whether to perform recognition processing for the object, attribute information relating to the object against each of the respective object is set When creating form form data and creating the form form data, for each object set in the form form data, it is determined whether or not the setting information of the object indicates recognition processing. accepts the determined setting information to indicate that performing the processing According to a type of the object, when determining the recognition type of the object that indicates the recognition method of the object, the setting information is determined not to indicate that performs recognition processing, generates the recognition attribute information of the object without, when the setting information is determined to indicate that performs recognition processing in accordance with attribute information relating to the object, attribute information relating to the recognition processing of the object containing the recognition type of the determined the object generating a recognition attribute information indicating an area of the object recognition attribute information generated as information indicating the attribute information relating to the recognition processing of the object is set, the recognition processing by the recognition method shown in recognized type of the object by generating a set recognized template as an area to perform, the user It is possible to reduce the input work of 識属 information.
以下、添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
<図1の説明>
図1は、本実施形態に係るシステムの構成例を示す図である。
図1に示すように、情報処理装置100と情報処理装置200と複合機(画像処理装置)300は、ネットワーク400を介して相互に通信可能に接続されている。
Hereinafter, the present invention will be described in detail according to preferred embodiments with reference to the accompanying drawings.
<Description of FIG. 1>
FIG. 1 is a diagram illustrating a configuration example of a system according to the present embodiment.
As illustrated in FIG. 1, the information processing apparatus 100, the information processing apparatus 200, and the multifunction peripheral (image processing apparatus) 300 are connected to each other via a
複合機300は、スキャナ機能や印刷機能等を備えたいわゆるMFP(Multifunction Peripheral)などの画像処理装置であって、情報処理装置からの要求に応じて印刷処理を実行することや、帳票(紙)などを読み取って(スキャンして)生成した電子化したデータ(電子データ)を情報処理装置に送信することが可能である。
The
情報処理装置は、ネットワーク400を介して複合機300に帳票などの印刷要求を行うことが可能である。また、情報処理装置は、帳票などのテンプレート(フォームデータ)を作成、編集する機能や、テンプレートを作成する際に入力するフォームの属性情報(フォーム定義テーブル(図7)内のデータであるフォーム定義情報)やオブジェクトの属性情報(オブジェクト定義テーブル(図8)内のデータであるオブジェクト定義情報)から、OCRするために設定するOCR定義情報(図10内のデータ)を生成する機能などを備えている。
The information processing apparatus can make a print request for a form or the like to the
また、複合機から送信される、ユーザにより記載された帳票の電子データを表示する機能も備えている。図13は、複合機300により読み取られた、ユーザにより記載された帳票のOCR処理対象の領域を示す表示画面の一例を示す図である。図13に示すように、1302、1303、1304、1305、1306、1307、1308の領域は、OCR処理対象の領域を示している。
Also, it has a function of displaying electronic data of a form described by the user transmitted from the multifunction device. FIG. 13 is a diagram illustrating an example of a display screen that shows an OCR processing target area of a form described by a user, read by the
<図2の説明> 以下、図2を用いて、図1に示した情報処理装置100及び200のハードウェア構成について説明する。 <Description of FIG. 2> Hereinafter, the hardware configuration of the information processing apparatuses 100 and 200 illustrated in FIG. 1 will be described with reference to FIG.
図2は、図1に示した情報処理装置100及び200のハードウェア構成を示すブロック図である。 FIG. 2 is a block diagram showing a hardware configuration of the information processing apparatuses 100 and 200 shown in FIG.
図2において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。また、ROM202あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PC(情報処理装置)の実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。
In FIG. 2,
203はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
A
また、205は入力コントローラで、キーボード(KB)209や不図示のマウス等のポインティングデバイス等からの入力を制御する。206はビデオコントローラで、CRTディスプレイ(CRT)210等の表示器(表示部)への表示を制御する。なお、図2では、CRT210と記載しているが、表示器はCRTだけでなく、液晶ディスプレイ等の他の表示器であってもよい。これらは必要に応じて管理者が使用するものである。
An
207はメモリコントローラで、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
A
208は通信I/Fコントローラで、ネットワーク400を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
A communication I /
なお、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、CRT210上での表示を可能としている。また、CPU201は、CRT210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
Note that the
本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM203にロードされることによりCPU201によって実行されるものである。さらに、上記プログラムの実行時に用いられるファイル及び各種テーブル等も、外部メモリ211に格納されている。
Various programs to be described later for realizing the present invention are recorded in the
<図3の説明> 図3は、図1に示した情報処理装置のソフトウェア構成の一例を示したブロック図である。 <Description of FIG. 3> FIG. 3 is a block diagram illustrating an example of a software configuration of the information processing apparatus illustrated in FIG. 1.
外部メモリ211には、フォームエディタソフトウェアプログラム301と、OCRソフトウェアプログラム318と、フォーム定義テーブル(図7)と、オブジェクト定義テーブル(図8)と、下書きとなるイメージデータ312と、フォームのOCR定義テーブル(図9)と、オブジェクトのOCR定義テーブル(図10)と、辞書テーブル(図17)と、OCR処理するために用いる各種辞書(316)と、OCRエンジンによる認識処理結果が出力された出力結果317と、出力データ(図11)とが記憶される。
The
フォームエディタソフトウェアプログラム301(以下、フォームエディタソフトとも言う)は、帳票などのフォームのテンプレートを作成又は編集するために用いられるソフトウェアである。 A form editor software program 301 (hereinafter also referred to as form editor software) is software used to create or edit a form template such as a form.
フォームエディタソフト301は、ユーザからの指示に応じて、帳票などのフォームのテンプレートのデータや、当該テンプレートの各種属性情報を入力するフォームデータ・属性入力部302と(図5)、テンプレート内に配置する各種オブジェクトのデータや当該オブジェクトの各種属性情報を入力するオブジェクトデータ入力・属性入力部303と(図6)、302や303で入力されたデータを用いてOCR定義情報(図10)を生成するOCR定義情報生成部304と、テンプレートの下書きとなるイメージデータ(テンプレートとオーバーレイするデータ)を生成するイメージデータ生成部305と、OCR定義情報生成部304で生成されたOCR定義情報をOCRエンジンに設定するためにOCRソフトウェアが読み込む所定の記憶領域に当該OCR定義情報を記憶するOCR定義情報設定部306と、OCR処理(文字認識処理)を実行した結果(認識結果)を出力する出力部307と、を備えている。なお、イメージデータ生成部305で生成されたイメージデータは、記憶部308に記憶される。
The form editor software 301 is arranged in the template with a form data / attribute input unit 302 (FIG. 5) for inputting form template data such as a form and various attribute information of the template in accordance with an instruction from the user. OCR definition information (FIG. 10) is generated using the object data input / attribute input unit 303 (FIG. 6) for inputting various object data and various attribute information of the object (FIG. 6), and the data input in 302 and 303. Set the OCR definition information generated by the OCR definition
ここで、302で入力されるテンプレート(フォーム)のデータや、当該テンプレートの各種属性情報はフォーム定義テーブル(図7)310に記憶され、303で入力される各種オブジェクトのデータや当該オブジェクトの各種属性情報は、オブジェクト定義テーブル(図8)311に記憶される。このフォーム定義テーブル310とオブジェクト定義テーブル311内のデータは、テンプレートとなるフォーム(様式)を構成(定義)するためのデータ309である。
Here, the data of the template (form) input in 302 and various attribute information of the template are stored in the form definition table (FIG. 7) 310, and the data of various objects input in 303 and the various attributes of the object. The information is stored in an object definition table (FIG. 8) 311. The data in the form definition table 310 and the object definition table 311 is
OCR定義情報生成部304は、このように記憶部308に記憶されたフォーム定義テーブル(図7)やオブジェクト定義テーブル(図8)内のデータからOCR定義情報を生成する。
The OCR definition
そして、OCR定義情報設定部306は、生成されたOCR定義情報を、記憶部308に記憶されたオブジェクトのOCR定義テーブル315に記憶する。
Then, the OCR definition
これらフォームのOCR定義テーブル314及びオブジェクトのOCR定義テーブル315は、OCR処理(文字認識処理)を実行するために用いられるデータ313である。
These form OCR definition table 314 and object OCR definition table 315 are
記憶部308は、外部メモリ211等の記憶手段であり、OCR処理で用いる各種辞書316が記憶されている。
The storage unit 308 is a storage unit such as the
OCRソフトウェアプログラム318(OCRソフトウェアとも言う)は、記憶部308に記憶されたフォームのOCR定義テーブル314とオブジェクトのOCR定義テーブル315内のOCR定義情報を読み込む読込部319と、読込部319で読み込んだデータ(OCR定義情報)を用いて文字認識処理を行う文字認識処理部320(OCRエンジン)と、文字認識処理部320で認識された結果を記憶部308に記憶させるべく出力する出力部321とを備えている。
The OCR software program 318 (also referred to as OCR software) is read by the
ここで、出力部321は、文字認識処理部320での認識結果を、CRT210などの表示部に表示するために出力することや、また、複合機300に印刷させるべく出力することが可能である。
Here, the
<図14の説明> 次に、図14のフローチャートを参照して、フォームエディタソフトウェア301が実行する処理を説明する。 <Description of FIG. 14> Next, processing executed by the form editor software 301 will be described with reference to the flowchart of FIG.
図14は、本発明のシステムにおける第1の制御処理手順の一例を示すフローチャートであり、図3に示すフォームエディタソフトウェア301による処理に対応する。すなわち、情報処理装置100のCPU201がROM202又は外部メモリ211からRAM203に読み出したプログラムを実行することにより実現される。また、図中、S1401〜S1406は各ステップを示す。
FIG. 14 is a flowchart showing an example of a first control processing procedure in the system of the present invention, and corresponds to the processing by the form editor software 301 shown in FIG. That is, it is realized by the
まず、情報処理装置100のCPU201は、フォームエディタソフトウェアプログラムを実行すると、図4に示すフォームエディター画面400を表示部210に表示する。 図4は、フォームエディター画面400の一例である。
First, when executing the form editor software program, the
次に、情報処理装置100のCPU201は、ユーザから帳票などのフォームの入力を受け付ける。具体的には、情報処理装置100のCPU201は、ユーザにより設定ボタンが押下されたことを検知すると、図5に示す帳票フォームのプロパティ画面が表示される。
Next, the
図5は、フォームの属性情報を入力するための帳票フォームのプロパティ画面500の一例である。
FIG. 5 is an example of a form
図5に示す帳票フォームのプロパティ画面500は、帳票のフォーム名(名称)を入力する部501と、出力する用紙の大きさ(サイズ)を入力する部503と、印刷の向きを入力する部507と、グリッドの間隔を入力する部509と、余白を入力する部512と、レイアウトの単位を入力する部517と、OCR処理を行うかを入力する部518とから構成される。この帳票フォームのプロパティ画面500の各部で入力される情報のそれぞれをフォーム(テンプレート)の属性情報として説明する。
A form
ここで、帳票フォームのプロパティ画面500について詳しく説明する。
Here, the form
502は、ユーザによる帳票のフォーム名(名称)の入力を受け付けるテキストボックスである。
また、504は、用紙サイズ(A4など)を選択することができるプルダウンであり、505は、用紙の幅を入力することができるテキストボックスであり、506は、用紙の高さを入力することができるテキストボックスである。 また、508は、印刷の向き(縦か横)を入力することができるプルダウンである。
また、510はグリッドの間隔(高さ)を、511はグリッドの間隔(横)を入力できるテキストボックスである。513、514、515、516は、テンプレートの余白を入力するテキストボックスであり、それぞれテンプレートの上側、下側、左側、右側の余白を入力することができる。
また、517は、レイアウトの単位を入力できるプルダウンであり、たとえば、ミリメートル(mm)などを入力することが可能である。
また、519は、図4に表示されているフォームに対してOCR処理を実行する設定を入力することができるチェックボックスであり、ここにチェックされている場合はOCR処理を実行する設定が入力されることとなる。520は、図4に表示されているフォームに対してOCR処理を実行しない設定を入力することができるチェックボックスである。ここにチェックされている場合はOCR処理を実行しない設定が入力されることとなる。
ここで説明した帳票フォームのプロパティ画面500の各部
に入力された属性情報は、グリッドの間隔や余白などの、フォームを定義するためのデータである。
The attribute information input to each part of the form
情報処理装置100のCPU201は、ユーザにより帳票フォームのプロパティ画面500の各部で属性情報が入力され、OKボタン521が押下されると、入力された属性情報はフォーム定義テーブル(図7)に記憶される(ステップS1401)。また、キャンセル522ボタンが押下されると、帳票フォームのプロパティ画面500を閉じる。 図7は、フォームを定義するためのデータが記憶されるフォーム定義テーブルの一例である。
When the user inputs attribute information in each part of the form
次に、情報処理装置100のCPU201は、フォームエディター画面400に表示されるテンプレート(フォーム)401に、ユーザの指示に応じてオブジェクトを配置して表示する。
Next, the
具体的には、表示ボタン416がユーザにより押下されると、フィールド一覧画面417を表示する。
Specifically, when the
この画面には、固定フィールド418や、可変フィールド419などのオブジェクトを配置するためのオブジェクトが表示されている。
On this screen, objects for arranging objects such as a
ここで、固定フィールドとは、固定の(変更のない)データを出力する領域であり、可変フィールドとは、可変のデータを出力する領域である。ユーザにより固定フィールド418をドラッグアンドドロップしてテンプレート401上に配置すると、たとえば、413のような出力領域をテンプレート上に設定することができる。可変フィールドの設定も固定フィールドと同様に、可変フィールド419をドラッグアンドドロップしてテンプレート401上に配置することで、可変フィールドをテンプレート上に設定することができる。
Here, the fixed field is an area for outputting fixed (no change) data, and the variable field is an area for outputting variable data. When the user drags and drops the fixed
また、フィールド一覧画面417のOLEフィールド420は、QRコードなどの二次元コードの出力を設定できるオブジェクトであり、可変フィールドと同様、OLEフィールド420をドラッグアンドドロップすることにより、テンプレート401上に配置される。たとえば、414のような出力領域をテンプレート上に設定することができる。ここで、414は、QRコードを出力するための領域として設定された例を示している。
The
また、ユーザにより、421のオブジェクトが押下され、KB209から文字が入力されることにより、テンプレート401上に文字を直接入力することもできる。 たとえば、403や404、406、407、408、409、410、411は、このようにして文字が入力されている。
In addition, the user can directly input a character on the
405は、チェックボックスのオブジェクトが入力されたものである。405は、ユーザによりオブジェクト422が押下され、テンプレート401が指定されることにより、情報処理装置100のCPU201は、テンプレート401上に405を入力する。また、412に示す「はしご枠」のオブジェクトもこれと同様に入力することが可能である。
次に、情報処理装置100のCPU201は、入力されたオブジェクトがユーザの指示により選択され、ユーザの指示に応じて、選択されたオブジェクトのプロパティ画面600(図6)を表示する。たとえば、ユーザがオブジェクトを選択し、選択された状態で右クリックすることにより表示される「プロパティ」(不図示)が選択されることで、選択されたオブジェクトのプロパティ画面600(図6)が表示される。
Next, the
そして、表示されたプロパティ画面600(図6)から、ユーザの指示により、当該オブジェクトに対して、オブジェクトの定義を示すデータを入力することが可能である。 Then, from the displayed property screen 600 (FIG. 6), data indicating the definition of the object can be input to the object in accordance with a user instruction.
図6は、オブジェクトの属性(定義)を入力するためのプロパティ画面の一例である。 FIG. 6 is an example of a property screen for inputting object attributes (definitions).
図6に示すオブジェクトのプロパティ画面600は、オブジェクトの名称とその種別(種類)を入力する部601と、OCR処理を行うかを入力する部604と、オブジェクトの配置位置とそのサイズを入力する部607,619と、線の属性を入力する部610と、文字の属性を入力する部614と、文字(列)の組み方向が横か縦か、また文字が全角か半角かを入力する出力定義部620と、文字枠が設定されている場合に、その文字枠の行数と桁数とを入力する部623とから構成される。
The
ここで、オブジェクトのプロパティ画面600について詳しく説明する。
Here, the
602は、フィールド図形名(名称)を入力するテキストボックスであり、603は、その種別を選択入力できるプルダウンである。ここで種別とは、一例として、図形(四角)、文字、図形(チェックボックス)、文字(丸囲み)、図形(はしご枠)、出力領域(文字)、出力領域(QRコード)などを選択することができる。
図形(四角)とは、たとえば、図4の402にしめすような、テンプレートを四角の図形(線)で囲まれたオブジェクトである。また、文字とは、たとえば、図4の403、404、406、408、410、411に入力されている文字のオブジェクトである。また、図形(チェックボックス)とは、たとえば、図4の405に示すような、チェックボックスとして用いるオブジェクトである。また、文字(丸囲み)とは、たとえば、図4の407や409に示すような、ユーザにより丸囲みされるオブジェクトである。また、図形(はしご枠)とは、たとえば、図4の412に示すような、ユーザにより文字などを入力(記入)されるオブジェクトである。
The figure (square) is an object in which a template is surrounded by a square figure (line) as shown by 402 in FIG. The character is, for example, a character object input in 403, 404, 406, 408, 410, 411 in FIG. The figure (check box) is an object used as a check box, for example, as indicated by
また、出力領域(文字)とは、たとえば、図4の413に示すような、文字が出力されるオブジェクトである。なお、このオブジェクトに出力される文字は、ユーザの指示により予め、例えば出力データ(図11)として記憶されている。 The output area (character) is an object to which a character is output, for example, as indicated by 413 in FIG. The characters output to this object are stored in advance as output data (FIG. 11), for example, in accordance with a user instruction.
図11は、出力データの一例を示す図である。 FIG. 11 is a diagram illustrating an example of output data.
図11には、図4の413の領域(文字エリア)に出力するデータとして「※電子クーポンはこちらからアクセスしてね」という文字データと、図4の414の領域(QRコードを出力するための領域)に出力するデータとして、QRコードのデータ「ABC・・・・jpee3dw」とを示している。
In FIG. 11, as data to be output to the area 413 (character area) in FIG. 4, the text data “* Please access the electronic coupon from here” and the
図4のテンプレートの印刷を行う際に、出力データ(図11)のデータを413、414の領域に出力して印刷を行う。そして、印刷した結果を図12に示す。
When the template of FIG. 4 is printed, the data of the output data (FIG. 11) is output to the
図12は、テンプレートのOCR領域の表示画面の一例である。 FIG. 12 is an example of a display screen of the OCR area of the template.
オブジェクトのプロパティ画面600の説明に戻る。 出力領域(QRコード)とは、たとえば、図4の414に示すような二次元コードを出力するためのオブジェクトである。
Returning to the description of the
605は、選択されたオブジェクトに対してOCR処理を実行する設定を入力することができるチェックボックスであり、ここにチェックされている場合は、選択されたオブジェクトに対してOCR処理を実行する設定が入力されることとなる。606は、選択されたオブジェクトに対してOCR処理を実行しない設定を入力することができるチェックボックスである。ここにチェックされている場合は、選択されたオブジェクトに対してOCR処理を実行しない設定が入力されることとなる。
608は、オブジェクトの配置位置の基準位置としての、テンプレートの最も左側からの距離を入力できるテキストボックスであり、609は、テンプレートの最も上側からの距離を入力できるテキストボックスである。
611は、オブジェクトの実線や点線などの線種を選択することができるプルダウンである。また、612は、オブジェクトの線の幅を選択入力することができるプルダウンである。また、613は、オブジェクトの線の色を選択入力することができるプルダウンである。
615は、オブジェクトの文字のフォント(ゴシック体や明朝体など)を入力することができるプルダウンである。また、616は、オブジェクトの文字のスタイル(細字、標準、太文字など)を入力することができるプルダウンである。また、617は、オブジェクトの文字のサイズ(ポイント)を入力することができるプルダウンである。また、618は、オブジェクトの文字の色を入力することができるプルダウンである。
619は、オブジェクトのサイズ(大きさ)を入力することができるテキストボックスである。ここでは、オブジェクトの幅と高さを入力することが可能である。
621は、オブジェクトの文字組みの方向を選択入力できるプルダウンである。また、622は、オブジェクトの文字の出力サイズ(全角、半角など)を選択入力できるプルダウンである。 624、625は、それぞれ文字枠の行数、桁数を選択入力できるプルダウンである。
プロパティ画面600(図6)を介して、オブジェクトの定義を示すデータの入力がなされ、OKボタンがユーザにより押下されると、情報処理装置100のCPU201は、入力されたオブジェクトの定義を示すデータを図8に示すオブジェクト定義テーブルに記憶する。ユーザは、各オブジェクトに対してこの操作を行う。
When data indicating the definition of the object is input via the property screen 600 (FIG. 6) and the OK button is pressed by the user, the
以上の通り、ステップS1402では、情報処理装置100のCPU201は、上述した表示されたプロパティ画面600(図6)から、ユーザの指示により、各オブジェクトに対して、オブジェクトの定義を示すデータの入力を受け付ける。そして、入力されたデータをオブジェクト定義テーブル(図8)に記憶させる。 図8は、オブジェクト(フィールド)の定義(属性)(フィールドの属性情報)するデータが記憶されるオブジェクト定義テーブルの一例である。
As described above, in step S1402, the
図8に示すオブジェクト定義テーブルは、「オブジェクト番号」、「種別」、「種別内連番」、「名称」、「OCR利用区分」、「左」、「上」、「幅」、「高さ」、「行数」、「桁数」、「線種」、「線幅」、「線色」、「フォント」、「スタイル」、「サイズ」、「色」、「組方向」、「文字出力サイズ」の項目から構成される。 The object definition table shown in FIG. 8 includes “object number”, “type”, “sequential number within type”, “name”, “OCR usage classification”, “left”, “top”, “width”, “height”. ”,“ Number of lines ”,“ Number of digits ”,“ Line type ”,“ Line width ”,“ Line color ”,“ Font ”,“ Style ”,“ Size ”,“ Color ”,“ Composition direction ”,“ Text ” It consists of the item “Output Size”.
「オブジェクト番号」はオブジェクトを識別する番号であり、図4の符号に括弧で示す番号に対応している。すなわち、オブジェクト番号<1>は、図4の402の枠を示している。また、「種別」は、オブジェクトの種別(種類)を示す情報である。また、「種別内連番」は、同一種別のオブジェクトを識別するために付与される連続した番号である。また、「名称」は、オブジェクトの名称である。また、「OCR利用区分」は、OCRを利用するか否かを示す情報が記憶される。OCRをするオブジェクトの場合は“する”が記憶され、OCRをしないオブジェクトの場合は“しない”が記憶される。また、「左」には、オブジェクトの配置位置の基準位置を特定する、テンプレートの最左からの位置を示す情報が記憶される。また、「上」には、オブジェクトの配置位置の基準位置を特定する、テンプレートの最上からの位置を示す情報が記憶される。また、「幅」には、オブジェクトの幅が記憶される。また、「高さ」には、オブジェクトの高さが記憶される。また、「行数」は、はしご枠などの文字の入力領域の行数である。また、「桁数」は、はしご枠などの文字の入力領域の桁数である。また、「線種」は、実線や点線などの情報である。また、「線幅」は、線の幅である。また、「線色」は、線の色である。また、「フォント」は、文字のフォントである。また、「スタイル」は、文字のスタイルである。また、「サイズ」は、文字のサイズである。また、「色」は、文字の色である。また、「組方向」は、文字(列)の組方向である。また、「文字出力サイズ」は、全角・半角などの文字出力サイズである。
“Object number” is a number for identifying an object, and corresponds to the number indicated in parentheses in the reference numerals of FIG. That is, the object number <1> indicates a
次に、情報処理装置100のCPU201は、ステップS1401で入力され記憶されたフォーム定義テーブル(図7)の「OCR利用」が“する”なのか否かを判定する(ステップS1403)。
Next, the
すなわち、フォームのプロパティ画面500の519がチェックされたか否かを判定する。519がチェックされた場合(フォーム定義テーブル(図7)の「OCR利用」が“する”の場合)(ステップS1403:YES)、記憶部に記憶されたオブジェクト定義テ
ーブルから、OCR処理の実行に用いるOCR定義情報を生成する(ステップS1404)。一方、519がチェックされず、520がチェックされた場合(フォーム定義テーブル(図7)の「OCR利用」が“しない”の場合)(ステップS1403:NO)は、OCR定義情報を生成することなく処理を終了する。
That is, it is determined whether or not 519 of the
ステップS1404の詳細処理については、図15を用いて後述する。 Detailed processing in step S1404 will be described later with reference to FIG.
次に、情報処理装置100のCPU201は、ステップS1404でOCR定義情報を生成すると、予め記憶されたフォームのOCR定義テーブル(図9)のスキャン時解像度(dpi)や印刷の向きなどを取得し、例えば以下の式を用いてイメージデータのサイズ(左上のX座標:0,左上のY座標:0,右下のX座標:以下の式で算出される値,右下のY座標:以下の式で算出される値)を決定し、テンプレートの下書きとなるイメージデータを生成する(ステップS1405)。ここで生成されるイメージデータをOCR定義情報の下書きとすることで、テンプレート内のどの領域を、OCR処理を行う領域とするかを特定することができる。
Next, when the
図12は、このようにして特定された、フォーム(テンプレート)のOCR処理対象の領域を示す表示画面1200の一例を示す図である。図12は、出力データ(図11)を出力領域に出力した帳票に、OCR処理対象の領域を表示した画面である。図12では、OCR処理対象の領域として、1202、1203、1204、1205、1206、1207、1208が定義されている。なお、このOCR処理対象の領域のサイズは、ユーザの指示により補正することができる。
FIG. 12 is a diagram showing an example of the
(式)・右下のX座標=サイズ(幅)(mm)×スキャン時の解像度(dpi)÷25.4(mm)・右下のY座標=サイズ(高さ)(mm)×スキャン時の解像度(dpi)÷25.4(mm) (Expression)-Lower right X coordinate = Size (width) (mm) x Scanning resolution (dpi) ÷ 25.4 (mm)-Lower right Y coordinate = Size (height) (mm) x Scanning Resolution (dpi) ÷ 25.4 (mm)
例えば、印刷の向きが縦のA4の用紙(幅が210mmで高さが297mm)のスキャン時の解像度が300dpiである場合、上記式に、これらの値を代入すると、右下のX座標は、210(mm)×300(dpi)÷25.4(mm)=2480.349・・・となり、約2480の値となる。また、右下のY座標も、これと同様に代入すると、297(mm)×300(dpi)÷25.4(mm)=3507.87・・・となり、約3507の値となる。
For example, if the printing resolution is 300 dpi when scanning a vertical A4 sheet (
このようにして、ここで生成されるイメージデータのサイズを決定し、そのサイズのイメージデータ(画像)を生成する(ステップS1405)。 In this way, the size of the image data generated here is determined, and image data (image) of that size is generated (step S1405).
次に、情報処理装置100のCPU201は、ステップS1404で生成したOCR定義情報を、OCRソフトウェアが読み込む記憶部に記憶することにより、当該OCR定義情報をOCRソフトウェアに設定する(ステップS1406)。
Next, the
ここで、図9について説明する。 図9は、フォームのOCR定義テーブルの一例を示す図である。 Here, FIG. 9 will be described. FIG. 9 is a diagram illustrating an example of an OCR definition table of a form.
フォームのOCR定義テーブルは、「帳票フォーム名」、「OCR利用」、「印刷時解像度」、「スキャン時解像度」、「イメージファイル名」、「クリアエリア初期値」とから構成されている。 The form OCR definition table includes “form form name”, “OCR use”, “printing resolution”, “scanning resolution”, “image file name”, and “clear area initial value”.
「帳票フォーム名」は、フォーム定義テーブル(図7)の「帳票フォーム名」に対応したデータであり、OCR定義情報生成部304でコピーされることにより記憶(生成)される。
The “form form name” is data corresponding to the “form form name” in the form definition table (FIG. 7), and is stored (generated) by being copied by the OCR definition
「OCR利用」は、フォーム定義テーブル(図7)の「OCR利用」に対応したデータであり、OCR定義情報生成部304でコピーされることにより記憶(生成)される。
“OCR use” is data corresponding to “OCR use” in the form definition table (FIG. 7), and is stored (generated) by being copied by the OCR definition
「印刷時解像度」は、ユーザの指示に応じて予め記憶される値であり、印刷時にどの解像度で印刷するかを規定したものである。したがって、フォームエディタソフト301で生成されたフォームデータはここで設定された解像度で印刷指示される。 “Resolution at printing” is a value stored in advance in response to a user instruction, and defines a resolution at which printing is performed at the time of printing. Accordingly, the form data generated by the form editor software 301 is instructed to be printed at the resolution set here.
「スキャン時解像度」は、ユーザの指示に応じて予め記憶される値であり、スキャン時にどの解像度で読み取るかを規定したものである。したがって、フォームエディタソフト301で生成されたフォームデータはここで設定された解像度で読み取られる。 The “scanning resolution” is a value stored in advance according to a user instruction, and defines which resolution is read at the time of scanning. Therefore, the form data generated by the form editor software 301 is read at the resolution set here.
「イメージファイル名」は、ステップS1405で生成されるイメージデータのファイル名であり、イメージデータが生成される際に、フォーム定義テーブル(図9)の帳票フォーム名をコピーすることで生成される。 “Image file name” is the file name of the image data generated in step S1405, and is generated by copying the form name of the form definition table (FIG. 9) when the image data is generated.
「クリアエリア初期値」は、ユーザの指示に応じて予め記憶される値であり、図23に示すように、オブジェクトの配置領域2301からOCR処理を行う領域2302までの幅の長さ2303である。 The “clear area initial value” is a value stored in advance in response to a user instruction, and is a length 2303 of a width from an object arrangement area 2301 to an area 2302 for performing OCR processing, as shown in FIG. .
図23は、オブジェクトの配置領域2301と、OCR処理を行う領域(OCR処理の対象領域2302)と、クリアエリア2303の関係を説明するための概念図である。 FIG. 23 is a conceptual diagram for explaining the relationship among an object placement area 2301, an OCR process area (OCR process target area 2302), and a clear area 2303.
<図15の説明> 次に、図15のフローチャートを参照して、フォームエディタソフトウェア301が実行する処理を説明する。 <Description of FIG. 15> Next, processing executed by the form editor software 301 will be described with reference to the flowchart of FIG.
図15は、図14に示すステップS1404の詳細処理の一例を示すフローチャートであり、図3に示すフォームエディタソフトウェア301による処理に対応する。すなわち、情報処理装置100のCPU201がROM202又は外部メモリ211からRAM203に読み出したプログラムを実行することにより実現される。また、図中、S1501〜S1511は各ステップを示す。
FIG. 15 is a flowchart showing an example of detailed processing in step S1404 shown in FIG. 14, and corresponds to the processing by the form editor software 301 shown in FIG. That is, it is realized by the
情報処理装置100のCPU201は、後述するステップS1502からステップS1511までの処理を、オブジェクト定義テーブル(図8)に記憶されている全てのオブジェクト定義情報に対して繰り返し実行する。ここで、オブジェクト定義情報(フォームのフィールドの属性情報)とは、図8に示すレコードの情報のデータを示す。
The
情報処理装置100のCPU201は、まず、オブジェクト定義テーブル(図8)のオブジェクト定義情報を読み込む(ステップS1502)。例えば、ここでは、オブジェクト番号が<1>のオブジェクト定義情報を読み込む。
First, the
そして、情報処理装置100のCPU201は、「OCR利用区分」が“する”と定義されているか否かを判定する(ステップS1503)。すなわち、オブジェクトのプロパティ画面(図6)の605がチェックされたのか、それとも606がチェックされたのかを判定する。
Then, the
ここで、オブジェクト定義テーブル(図8)には、605がチェックされた場合は「OCR利用区分」が“する”と記憶され、606がチェックされた場合は「OCR利用区分」が“しない”と記憶されている。 Here, in the object definition table (FIG. 8), when 605 is checked, “OCR usage category” is stored as “Yes”, and when 606 is checked, “OCR usage category” is set as “No”. It is remembered.
情報処理装置100のCPU201は、ステップS1503で「OCR利用区分」が“する”と定義されていると判定した場合は(ステップS1503:YES)、処理をステップS1504に移行し、一方、「OCR利用区分」が“しない”と定義されていると判定した場合は(ステップS1503:NO)、処理対象をオブジェクト定義テーブルの次のレコードにして、ステップS1502に戻る。またこのとき、全てのオブジェクト定義情報に対して処理を実行し、処理対象がなくなった場合は処理を終了する。
If the
次に、情報処理装置100のCPU201は、「OCR利用区分」が“する”と定義されていると判定した場合は(ステップS1503:YES)、オブジェクト定義情報に含まれるオブジェクトの種別が、「文字」又は「図形(はしご枠)」又は「出力領域(文字)」であるか否かを判定する(ステップS1504)。
Next, when the
そして、情報処理装置100のCPU201は、オブジェクトの種別が、「文字」又は「図形(はしご枠)」又は「出力領域(文字)」であると判定した場合は(ステップS1504:YES)、ステップS1508に処理を移行して文字認識設定処理(図16)を実行する。一方、オブジェクトの種別が、「文字」又は「図形(はしご枠)」又は「出力領域(文字)」ではないと判定した場合は(ステップS1504:NO)、オブジェクトの種別が「図形(チェックボックス)」であるか否かを判定する(ステップS1505)。
If the
そして、情報処理装置100のCPU201は、オブジェクトの種別が「図形(チェックボックス)」であると判定した場合は(ステップS1505:YES)、処理をステップS1509に移行してチェックボックス認識設定処理(図19)を実行する。一方、オブジェクトの種別が、「図形(チェックボックス)」ではないと判定した場合は(ステップS1505:NO)、オブジェクトの種別が「文字(丸囲み)」であるか否かを判定する(ステップS1506)。
If the
そして、情報処理装置100のCPU201は、オブジェクトの種別が「文字(丸囲み)」であると判定した場合は(ステップS1506:YES)、処理をステップS1510に移行して、丸囲み数字認識設定処理(図20)を実行する。一方、オブジェクトの種別が「文字(丸囲み)」ではないと判定した場合は(ステップS1506:NO)、オブジェクトの種別が「出力領域(QRコード)」であるか否かを判定する(ステップS1507)。
If the
そして、情報処理装置100のCPU201は、オブジェクトの種別が「出力領域(QRコード)」であると判定した場合は(ステップS1507:YES)、処理をステップS1511に移行してQRコード認識設定処理(図21)を実行する。
If the
情報処理装置100のCPU201は、ステップS1507でオブジェクトの種別が「出力領域(QRコード)」ではないと判定された場合、及び、ステップS1508、ステップS1509、ステップS1510、ステップS1511の処理を実行後は、ステップS1503でNOと判定した場合と同様に、処理対象をオブジェクト定義テーブルの次のレコードにして、ステップS1502に戻る。またこのとき、全てのオブジェクト定義情報に対して処理を実行し、処理対象がなくなった場合は処理を終了する。
When the
このようにして、オブジェクト定義テーブルに記憶されている全てのオブジェクト定義情報に対して、ステップS1502からステップS1511までの処理を実行する。 In this way, the processing from step S1502 to step S1511 is executed for all object definition information stored in the object definition table.
<図16の説明> 次に、図16のフローチャートを参照して、フォームエディタソフトウェア301が実行する処理を説明する。 <Description of FIG. 16> Next, processing executed by the form editor software 301 will be described with reference to the flowchart of FIG.
図16は、図15に示すステップS1508の詳細処理の一例を示すフローチャートであり、図3に示すフォームエディタソフトウェア301による処理に対応する。すなわち、情報処理装置100のCPU201がROM202又は外部メモリ211からRAM203に読み出したプログラムを実行することにより実現される。また、図中、S1601〜S1615は各ステップを示す。
FIG. 16 is a flowchart showing an example of detailed processing in step S1508 shown in FIG. 15, and corresponds to the processing by the form editor software 301 shown in FIG. That is, it is realized by the
情報処理装置100のCPU201は、まず、認識する種別(種類)として、文字を認識する文字認識処理を実行することを示すデータ(ここでは“OCR”)を生成する(ステップS1601)。ここで生成されたデータは、図10に示すオブジェクトのOCR定義テーブル(OCRテンプレート)に記憶される。ここで、OCRテンプレートとは、図10に示す各オブジェクトのOCR定義情報の集合である。
First, the
図10は、オブジェクトのOCR定義テーブルの一例を示す図である。OCR定義テーブルには、OCRするために用いられる各種データが記憶される。 FIG. 10 is a diagram illustrating an example of an OCR definition table of objects. Various data used for OCR is stored in the OCR definition table.
図10の示すオブジェクトのOCR定義テーブルは、「No」、「領域名(名称)」、「オブジェクト番号」、「認識種別」、オブジェクトの配置領域(認識領域)の左上座標のX座標が記憶される「X」、オブジェクトの配置領域(認識領域)の左上座標のY座標が記憶される「Y」、オブジェクトの配置領域(認識領域)の右下座標のX座標が記憶される「X」、オブジェクトの配置領域(認識領域)の右下座標のY座標が記憶される「Y」、「使用辞書」、「組方向」、「文字枠」、「桁数」、「行数」、「文字出力サイズ」などから構成される。 The object OCR definition table shown in FIG. 10 stores “No”, “area name (name)”, “object number”, “recognition type”, and the X coordinate of the upper left coordinate of the object placement area (recognition area). “X”, “Y” in which the Y coordinate of the upper left coordinate of the object arrangement area (recognition area) is stored, “X” in which the X coordinate of the lower right coordinate of the object arrangement area (recognition area) is stored, "Y", "Use dictionary", "Composition direction", "Character frame", "Number of digits", "Number of lines", "Character" where the Y coordinate of the lower right coordinate of the object placement area (recognition area) is stored "Output size" etc.
「No」は、レコードを識別するための番号であり、このレコード内の一部又は全ての情報をOCR定義情報という。また、「領域名(名称)」は、OCRを行う対象のオブジェクト(OCR対象オブジェクト)の名称(領域名)である。また、「オブジェクト番号」は、図8のオブジェクト定義テーブルのオブジェクト番号に対応した番号である。また、「認識種別」は、OCRソフト318が行う認識処理の種別(種類)である。また、「使用辞書」は、OCRソフト318が行う認識処理の際に用いる辞書を示している。また、「組方向」は、文字(列)が縦方向か横方向かを示している。また、「文字枠」は、はしご枠かなどの文字枠がどのような枠であるかを示している。また、「桁数」は、文字枠の桁数を示している。また、「行数」は、文字枠の行数を示している。また、「文字出力サイズ」は、半角か全角かを示している。 “No” is a number for identifying a record, and part or all of the information in this record is referred to as OCR definition information. The “area name (name)” is the name (area name) of an object (OCR target object) to be subjected to OCR. The “object number” is a number corresponding to the object number in the object definition table of FIG. The “recognition type” is a type (type) of recognition processing performed by the OCR software 318. The “use dictionary” indicates a dictionary used in recognition processing performed by the OCR software 318. The “set direction” indicates whether the character (row) is in the vertical direction or the horizontal direction. “Character frame” indicates what kind of frame a character frame such as a ladder frame is. “Number of digits” indicates the number of digits in the character frame. “Number of lines” indicates the number of lines in the character frame. “Character output size” indicates half-width or full-width.
次に、情報処理装置100のCPU201は、共通情報生成処理を実行することにより(ステップS1602)、オブジェクト定義情報から、オブジェクトのOCR定義情報テーブルのOCR対象オブジェクト(オブジェクトの領域名など)と認識領域(Pixel)(オブジェクトの配置位置(座標))とを生成する。そして、ここで生成されたOCR対象オブジェクト(オブジェクトの領域名など)と認識領域(Pixel)(オブジェクトの配置位置(座標))は、オブジェクトのOCR定義テーブルに記憶される。ステップS1602の詳細処理は、図18を用いて後で説明する。
Next, the
次に、情報処理装置100のCPU201は、共通情報生成処理を実行した後、オブジェクト定義情報の「フォント」にフォント名が記憶されているかを判定する(ステップS1603)。そして、フォント名が記憶されていると判定した場合は(ステップS1603:YES)、当該フォントに対応する辞書を辞書テーブル(図17)の中から検索する(ステップS1604)。
Next, after executing the common information generation process, the
図17は、辞書テーブルの一例である。図17は、文字のフォントに対して、OCRするのに好適な辞書が記憶されていることを示している。なお、辞書テーブルは、記憶部に記憶されている。 FIG. 17 is an example of a dictionary table. FIG. 17 shows that a dictionary suitable for OCR is stored for character fonts. The dictionary table is stored in the storage unit.
次に、情報処理装置100のCPU201は、ステップS1604でフォントに対応する辞書が検索されたか否かを判定する(ステップS1605)。そして、フォントに対応する辞書が検索されたと判定された場合は(ステップS1605:YES)、検索された辞書を使用する辞書と設定するために、オブジェクトのOCR定義テーブル(図10)の「使用辞書」に検索された辞書名を記憶(生成)する。一方、フォントに対応する辞書が検索されなかったと判定された場合は(ステップS1605:NO)、(予め設定された)既定の辞書を使用する辞書として設定するために、オブジェクトのOCR定義テーブル(図10)の「使用辞書」に、該既定の辞書の辞書名を記憶(生成)する(ステップS1607)。
Next, the
ステップS1603で、オブジェクト定義情報の「フォント」にフォント名が記憶されていないと判定された場合、つまり、フォントの情報が無い場合も、ステップS1607の処理を実行する。すなわち、オブジェクトのOCR定義テーブル(図10)の「使用辞書」に、既定の辞書の辞書名を記憶(生成)する。 If it is determined in step S1603 that no font name is stored in the “font” of the object definition information, that is, if there is no font information, the process of step S1607 is executed. That is, the dictionary name of the default dictionary is stored (generated) in the “use dictionary” of the object OCR definition table (FIG. 10).
次に、情報処理装置100のCPU201は、ステップS1607又は、ステップS1606の処理を実行した後、現在、処理対象のオブジェクト定義テーブル(図8)の1レコード(オブジェクト定義情報)の「組方向」と「文字出力サイズ」とをオブジェクトのOCR定義テーブル(図10)の「組方向」と「文字出力サイズ」にそれぞれ記憶(生成)させる。
Next, after executing the processing of step S1607 or step S1606, the
そして、情報処理装置100のCPU201は、現在、処理対象のオブジェクト定義情報の「枠」に数値が設定されているか否かを判定することにより、文字枠のオブジェクトであるか否かを判定する(ステップS1609)。そして、情報処理装置100のCPU201は、文字枠のオブジェクトであると判定された場合は(ステップS1609:YES)、文字枠が複数に分割されているか否かを判定する(ステップS1610)。すなわち、処理対象のオブジェクト定義情報の「枠」に設定された値(少なくとも行数、桁数のいずれか1つの値)が2以上の数値であるか否かを判定することにより、「はしご枠」であるのか、それとも「フィールド枠」であるのかを判定する(ステップS1610)。
Then, the
そして、「はしご枠」であると判定された場合(「枠」に設定された、少なくとも行数、桁数のいずれかの値が2以上の数値であると判定された場合)は(ステップS1610:YES)、オブジェクトのOCR定義テーブル(図10)の「文字枠」に、はしご枠であることを示すデータとして“はしご”を記憶(生成)する(ステップS1611)。一方、「フィールド枠」であると判定された場合(「枠」に設定された行数、桁数のいずれの値も1の数値であると判定された場合)は(ステップS1610:NO)、オブジェクトのOCR定義テーブル(図10)の「文字枠」に、フィールド枠であることを示すデータとして“フィールド”を記憶(生成)する(ステップS1613)。 Then, when it is determined that the frame is a “ladder frame” (when it is determined that at least one of the number of lines and the number of digits set in the “frame” is a numerical value of 2 or more) (step S1610). : YES), “ladder” is stored (generated) as data indicating a ladder frame in the “character frame” of the object OCR definition table (FIG. 10) (step S1611). On the other hand, when it is determined that it is a “field frame” (when it is determined that both the number of lines and the number of digits set in the “frame” are numerical values of 1) (step S1610: NO), “Field” is stored (generated) in the “character frame” of the object OCR definition table (FIG. 10) as data indicating a field frame (step S1613).
また、ステップS1609において、現在、処理対象のオブジェクト定義情報の「枠」に数値が設定されていないと判定(文字枠のオブジェクトではないと判定)された場合(ステップS1609:NO)、オブジェクトのOCR定義テーブル(図10)の「文字枠」に、枠がないことを示すデータとして“―”を記憶(生成)する(ステップS1604)。 If it is determined in step S1609 that a numerical value is not currently set in the “frame” of the object definition information to be processed (determined that the object is not a character frame object) (step S1609: NO), the object OCR “-” Is stored (generated) as data indicating that there is no frame in the “character frame” of the definition table (FIG. 10) (step S1604).
次に、情報処理装置100のCPU201は、オブジェクトの定義テーブル(図8)の「枠」の“行数”、“桁数”の値を、文字認識すべき対象の文字数の最大値として、オブジェクトのOCR定義テーブル(図10)の「行数」、「桁数」にそれぞれ記憶(生成)する(ステップS1612)。
Next, the
また、情報処理装置100のCPU201は、ステップS1604またはステップS1613の処理を実行した後、OCRソフトウェアが、文字認識すべき対象の文字数を自動的に認識させる設定情報として、“0(ゼロ)”を、オブジェクトのOCR定義テーブル(図10)の「行数」、「桁数」に記憶(生成)する(ステップS1615)。
Further, after executing the processing of step S1604 or step S1613, the
以上、ステップS1615又はステップS1612の処理を実行すると、ステップS1508に示す文字認識設定処理は終了し、ステップS1502で次の処理対象のオブジェクトの定義情報を読み込む。 As described above, when the process of step S1615 or step S1612 is executed, the character recognition setting process shown in step S1508 ends, and the definition information of the next object to be processed is read in step S1502.
<図18の説明> 次に、図18のフローチャートを参照して、フォームエディタソフトウェア301が実行する処理を説明する。 <Description of FIG. 18> Next, processing executed by the form editor software 301 will be described with reference to the flowchart of FIG.
図18は、図16のステップS1602、図19のステップS1902、図20のステップS2002、図21のステップS2102の処理の詳細処理の一例を示すフローチャートである。なお、図18は、図3に示すフォームエディタソフトウェア301による処理に対応する。 FIG. 18 is a flowchart showing an example of detailed processing of step S1602 in FIG. 16, step S1902 in FIG. 19, step S2002 in FIG. 20, and step S2102 in FIG. 18 corresponds to the processing by the form editor software 301 shown in FIG.
すなわち、情報処理装置100のCPU201がROM202又は外部メモリ211からRAM203に読み出したプログラムを実行することにより実現される。また、図中、S1801〜S1804は各ステップを示す。
That is, it is realized by the
情報処理装置100のCPU201は、OCR対象オブジェクトの名称(領域名)を生成する(ステップS1801)。
The
具体的には、オブジェクト定義テーブル(図8)の「名称」にオブジェクトの名称が入力されている場合は、その名称をOCR対象オブジェクトの名称(領域名)として、オブジェクトのOCR定義テーブル(図10)の「領域名(名称)」に記憶(生成)する。また、オブジェクト定義テーブル(図8)の「名称」にオブジェクトの名称が入力されていない場合は、オブジェクトの「種別」と「種別内連番」からOCR対象オブジェクトの名称(領域名)を生成して、オブジェクトのOCR定義テーブル(図10)の「領域名(名称)」に記憶(生成)する。 Specifically, when the name of an object is input in “Name” of the object definition table (FIG. 8), the name is used as the name of the OCR target object (area name) (FIG. 10). ) In (area name (name)). If the name of the object is not entered in “Name” of the object definition table (FIG. 8), the name (area name) of the OCR target object is generated from the “type” of the object and the “sequential number within type”. Then, it is stored (generated) in “area name (name)” of the object OCR definition table (FIG. 10).
例えば、オブジェクト番号<4>のオブジェクトは、チェックボックスなので、領域名(名称)にチェックボックスを示す「CHK」と、「種別内連番」の「001」とを繋げて「CHK001」というOCR対象オブジェクトの名称(領域名)を生成し、オブジェクトのOCR定義テーブル(図10)の「領域名(名称)」に記憶している。 For example, since the object with the object number <4> is a check box, the area name (name) is connected to “CHK” indicating a check box and “001” of “in-type serial number”, and is an OCR target “CHK001”. An object name (area name) is generated and stored in “area name (name)” of the object OCR definition table (FIG. 10).
次に、情報処理装置100のCPU201は、オブジェクト定義テーブル(図8)の「配置」の情報から、認識領域の座標を算出し、オブジェクトのOCR定義テーブルの「認識領域(pixel)」に算出結果を記憶(生成)する(ステップS1802)。 具体的には、例えば、認識領域の左上座標及び右下座標は、以下の式を用いて算出することができる。
Next, the
(式)・「認識領域の左上のX座標」=(基準位置(左)―クリアエリアの初期値)×スキャン時解像度(dpi)÷25.4(mm)・「認識領域の左上のY座標」=(基準位置(上)―クリアエリアの初期値)×スキャン時解像度(dpi)÷25.4(mm)・「認識領域の右下のX座標」=(基準位置(左)+サイズ(幅)+クリアエリアの初期値)×スキャン時解像度(dpi)÷25.4(mm)・「認識領域の右下のY座標」=(基準位置(上)+サイズ(高さ)+クリアエリアの初期値)×スキャン時解像度(dpi)÷25.4(mm) (Expression) • “X coordinate at upper left of recognition area” = (reference position (left) −initial value of clear area) × scanning resolution (dpi) ÷ 25.4 (mm) • “Y coordinate at upper left of recognition area “= (Reference position (upper) −initial value of clear area) × scanning resolution (dpi) ÷ 25.4 (mm) ·“ lower right X coordinate of recognition area ”= (reference position (left) + size ( (Width) + Clear area initial value) x Scanning resolution (dpi) ÷ 25.4 (mm) · "Y coordinate at the bottom right of the recognition area" = (Reference position (Up) + Size (Height) + Clear area Initial value) x scanning resolution (dpi) ÷ 25.4 (mm)
ここで、クリアエリアとは、図23に示すように、オブジェクトの配置領域2301からOCR処理を行う領域2302までの幅の長さ2303であり、ユーザの指示により予め設定され記憶部に記憶されている。ここでは、ユーザの指示により予め設定されたクリアエリアの値をクリアエリアの初期値として記載している。 Here, as shown in FIG. 23, the clear area is the length 2303 of the width from the object arrangement area 2301 to the area 2302 where the OCR processing is performed, and is set in advance by a user instruction and stored in the storage unit. Yes. Here, the value of the clear area set in advance by the user's instruction is described as the initial value of the clear area.
また、スキャン解像度は、ユーザの指示により予め設定され、記憶部のフォームのOCR定義テーブル(図9)に記憶されている。また、基準位置(左)、基準位置(上)、サイズ(幅)、サイズ(高さ)は、それぞれ、オブジェクト定義テーブル(図8)の項目「左」、「上」、「幅」、「高さ」に記憶されている値である。 The scan resolution is set in advance by a user instruction and stored in the OCR definition table (FIG. 9) in the form of the storage unit. The reference position (left), reference position (top), size (width), and size (height) are the items “left”, “top”, “width”, “size” of the object definition table (FIG. 8), respectively. This is the value stored in “Height”.
ステップS1802では、これらの情報を取得して上述した式に代入することにより、認識領域の座標を算出することができる。 In step S1802, the coordinates of the recognition area can be calculated by acquiring these pieces of information and substituting them into the above-described formula.
次に、情報処理装置100のCPU201は、ステップS1802で算出された座標により決定される認識領域がテンプレート(帳票)の領域内に収まるか否かを判定する(ステップS1803)。
Next, the
具体的には、ステップS1802で算出して得られた認識領域の座標が、ステップS1405でイメージデータを生成する際に決定した当該イメージデータのサイズの座標を超えているか否かを判定する。 Specifically, it is determined whether the coordinates of the recognition area obtained by calculation in step S1802 exceed the coordinates of the size of the image data determined when generating the image data in step S1405.
そして、認識領域がテンプレートの領域内に収まる(ステップS1802で算出して得られた認識領域の座標が、ステップS1405でイメージデータを生成する際に決定した当該イメージデータのサイズの座標を超えていない)と判定された場合は、図18に示す処理を終了し、一方、収まらない(ステップS1802で算出して得られた認識領域の座標が、ステップS1405でイメージデータを生成する際に決定した当該イメージデータのサイズの座標を超える)と判定された場合は、テンプレートの領域内に収まるように認識領域の各座標を補正する(ステップS1804)。 Then, the recognition area falls within the template area (the coordinates of the recognition area obtained by calculation in step S1802 do not exceed the coordinates of the size of the image data determined when generating the image data in step S1405). 18 is finished, the process shown in FIG. 18 is terminated, while the image does not fit (the recognition area coordinates obtained by calculation in step S1802 are determined when the image data is generated in step S1405). If it is determined that it exceeds the coordinates of the size of the image data), each coordinate of the recognition area is corrected so as to be within the area of the template (step S1804).
具体的には、超えていると判定された、ステップS1802で算出して得られた認識領域の座標を、ステップS1405でイメージデータを生成する際に決定した当該イメージデータのサイズの座標に設定することで補正することができる。 Specifically, the coordinates of the recognition area determined by calculating in step S1802 that is determined to be exceeded are set to the coordinates of the size of the image data determined when generating the image data in step S1405. This can be corrected.
<図19の説明> 次に、図19のフローチャートを参照して、フォームエディタソフトウェア301が実行する処理を説明する。 <Description of FIG. 19> Next, processing executed by the form editor software 301 will be described with reference to the flowchart of FIG.
図19は、図15のステップS1509の処理の詳細処理の一例を示すフローチャートである。なお、図19は、図3に示すフォームエディタソフトウェ
ア301による処理に対応する。
FIG. 19 is a flowchart showing an example of detailed processing of step S1509 in FIG. FIG. 19 corresponds to the processing by the form editor software 301 shown in FIG.
すなわち、情報処理装置100のCPU201がROM202又は外部メモリ211からRAM203に読み出したプログラムを実行することにより実現される。また、図中、S1901〜S1902は各ステップを示す。
That is, it is realized by the
情報処理装置100のCPU201は、まず、認識する種別(種類)として、チェックボックスを認識する文字認識処理を実行することを示すデータ(ここでは“チェックボックス”)を生成する(ステップS1901)。ここで生成されたデータは、図10に示すオブジェクトのOCR定義テーブルに記憶される。
First, the
次に、情報処理装置100のCPU201は、図18に示す共通情報生成処理を実行し(ステップS1902)、ステップS1509の処理を終了する。
Next, the
<図20の説明> 次に、図20のフローチャートを参照して、フォームエディタソフトウェア301が実行する処理を説明する。 <Description of FIG. 20> Next, processing executed by the form editor software 301 will be described with reference to the flowchart of FIG.
図20は、図15のステップS1510の処理の詳細処理の一例を示すフローチャートである。なお、図20は、図3に示すフォームエディタソフトウェア301による処理に対応する。 FIG. 20 is a flowchart illustrating an example of detailed processing of step S1510 of FIG. 20 corresponds to the processing by the form editor software 301 shown in FIG.
すなわち、情報処理装置100のCPU201がROM202又は外部メモリ211からRAM203に読み出したプログラムを実行することにより実現される。また、図中、S2001〜S2002は各ステップを示す。
That is, it is realized by the
情報処理装置100のCPU201は、まず、認識する種別(種類)として、丸囲み文字を認識する文字認識処理を実行することを示すデータ(ここでは“丸囲み”)を生成する(ステップS2001)。ここで生成されたデータは、図10に示すオブジェクトのOCR定義テーブルに記憶される。 次に、情報処理装置100のCPU201は、図18に示す共通情報生成処理を実行し(ステップS2002)、ステップS1510の処理を終了する。
First, the
<図21の説明> 次に、図21のフローチャートを参照して、フォームエディタソフトウェア301が実行する処理を説明する。 <Description of FIG. 21> Next, processing executed by the form editor software 301 will be described with reference to the flowchart of FIG.
図21は、図15のステップS1511の処理の詳細処理の一例を示すフローチャートである。なお、図21は、図3に示すフォームエディタソフトウェア301による処理に対応する。 FIG. 21 is a flowchart showing an example of detailed processing of the processing in step S1511 of FIG. FIG. 21 corresponds to the processing by the form editor software 301 shown in FIG.
すなわち、情報処理装置100のCPU201がROM202又は外部メモリ211からRAM203に読み出したプログラムを実行することにより実現される。また、図中、S2101〜S2102は各ステップを示す。
That is, it is realized by the
情報処理装置100のCPU201は、まず、認識する種別(種類)として、二次元コードを認識する文字認識処理を実行することを示すデータ(ここでは“QRコード”)を生成する(ステップS2101)。ここで生成されたデータは、図10に示すオブジェクトのOCR定義テーブルに記憶される。 次に、情報処理装置100のCPU201は、図18に示す共通情報生成処理を実行し(ステップS2102)、ステップS1511の処理を終了する。
First, the
<図22の説明> 次に、図22のフローチャートを参照して、OCRソフトウェア315が実行する処理を説明する。
<Description of FIG. 22> Next, processing executed by the
図21は、本発明のシステムにおける第2の制御処理手順の一例を示すフローチャートであり、図3に示すOCRソフトウェア315による処理に対応する。すなわち、情報処理装置100のCPU201がROM202又は外部メモリ211からRAM203に読み出したプログラムを実行することにより実現される。また、図中、S2201〜S2204は各ステップを示す。
FIG. 21 is a flowchart showing an example of the second control processing procedure in the system of the present invention, and corresponds to the processing by the
情報処理装置100のCPU201は、フォームのOCR定義テーブル(図9)と、オブジェクトのOCR定義テーブル(図10)とを記憶部308から読み込み(ステップS2201)、読み込んだフォームのOCR定義テーブル(図9)と、オブジェクトのOCR定義テーブル(図10)内のデータを、OCRするために設定する(ステップS2202)。
The
そして、ステップS2202で設定されたデータを用いてOCRを実行し(ステップS2203)、その認識結果を記憶部に記憶させるべく出力して(ステップS2204)処理を終了する。そして、フォームエディタソフトウェアは、記憶された認識結果を読み込み出力(表示や印刷など)する。 Then, OCR is executed using the data set in step S2202 (step S2203), the recognition result is output to be stored in the storage unit (step S2204), and the process is terminated. The form editor software reads and outputs (displays, prints, etc.) the stored recognition result.
以上説明したように、本実施の形態によれば、テンプレートデータを作成するために入力されるオブジェクトの属性情報に従って、OCR処理を実行する対象領域に対する属性情報を生成することにより、ユーザによる当該属性情報の入力作業を軽減させることができる。 As described above, according to the present embodiment, the attribute information by the user is generated by generating the attribute information for the target area for executing the OCR process according to the attribute information of the object input to create the template data. Information input work can be reduced.
以上、本発明の一実施形態を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。 Although one embodiment of the present invention has been described in detail above, the present invention can take an embodiment as, for example, a system, an apparatus, a method, a program, or a storage medium. You may apply to the system comprised from an apparatus, and may apply to the apparatus which consists of one apparatus.
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。 Another object of the present invention is to supply a storage medium storing software program codes for realizing the functions of the above-described embodiments to a system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores the storage medium. Needless to say, this can also be achieved by reading and executing the program code stored in.
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、プログラムコード自体及びそのプログラムコードを記憶した記憶媒体は本発明を構成することになる。 In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the program code itself and the storage medium storing the program code constitute the present invention.
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。 As a storage medium for supplying the program code, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(基本システム或いはオペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (basic system or operating system) running on the computer based on the instruction of the program code. Needless to say, a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, after the program code read from the storage medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function is determined based on the instruction of the program code. It goes without saying that the CPU or the like provided in the expansion board or function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
100 情報処理装置 200 情報処理装置 300 複合機 400 ネットワーク
DESCRIPTION OF SYMBOLS 100 Information processing apparatus 200
Claims (11)
当該帳票フォームデータを作成する際に表示される表示画面を介して、ユーザの操作により、当該帳票フォームデータに対するオブジェクトの設定を受け付け、当該帳票フォームデータに設定される当該オブジェクトごとに、当該オブジェクトの種別を含む当該オブジェクトに係る属性情報、及び当該オブジェクトについて認識処理を行うか否かを示す設定情報の設定を受け付ける受付手段と、
前記受付手段により当該属性情報の設定を受け付けた各オブジェクトのそれぞれに対して、前記受付手段で受け付けた当該オブジェクトに係る属性情報が設定された帳票フォームデータを作成する帳票フォームデータ作成手段と、
当該帳票フォームデータを作成する際に、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すか否かを判定し、当該認識処理を行うことを示すと判定された設定情報を前記受付手段で受け付けたオブジェクトに係る属性情報に含まれる当該オブジェクトの種別に従って、当該オブジェクトの認識方法を示す当該オブジェクトの認識種別を決定する決定手段と、
当該帳票フォームデータを作成する際に、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトであって前記帳票フォームデータ作成手段により作成される帳票フォームデータに設定されたオブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すか否かを判定した結果、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示さないと判定された場合には、前記受付手段により受け付けた当該オブジェクトに係る属性情報に従って、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成せず、一方、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すと判定された場合には、前記受付手段により受け付けた当該オブジェクトに係る属性情報であって前記帳票フォームデータ作成手段により作成される帳票フォームデータに設定される当該オブジェクトに係る属性情報に従って、前記決定手段により決定された当該オブジェクトの認識種別を含む、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成する属性情報生成手段と、
当該帳票フォームデータを作成する際に、前記属性情報生成手段によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報が設定される当該オブジェクトの領域を、当該認識属性情報を用いて、当該認識属性情報に含まれる当該オブジェクトの認識種別に示される認識方法で認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成するテンプレート生成手段と、
を備え、
前記テンプレート生成手段は、前記属性情報生成手段によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報に含まれる認識種別が文字認識を示す場合には、当該認識属性情報が設定される当該オブジェクトの領域を、文字認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成することを特徴とする情報処理装置。 An information processing apparatus for generating a recognition template used for a recognition process, in which an object area set in form form data is set as an area for performing recognition processing of a reading target,
Via the display screen displayed in creating the document form data by operating the user accepts the setting of the object with respect to the continuous form data, for each said object to be set to the slip form data of the object Accepting means for receiving attribute information relating to the object including the type, and setting information indicating whether or not to perform recognition processing on the object;
A continuous form data creating means for each of the objects of accepting the setting of the attribute information, to create a continuous form data attribute information relating to the object which is received is set by the receiving unit by the receiving unit,
Whether the setting information received by the receiving unit for the object indicates recognition processing for each object set for the form form data by the receiving unit when the form form data is created The object indicating the recognition method of the object according to the type of the object included in the attribute information related to the object received by the receiving unit with the setting information determined to indicate that the recognition process is to be performed Determining means for determining the recognition type of
When creating the continuous form data, for the receiving unit by an object set in a continuous form data created by an object set for the document form data the continuous form data creating means the As a result of determining whether or not the setting information received by the receiving unit indicates that recognition processing is to be performed, for each object set for the form form data by the receiving unit, the receiving unit for the object If it is determined that the received setting information does not indicate that the recognition process is to be performed, the recognition attribute information indicating the attribute information related to the object recognition process is set according to the attribute information related to the object received by the reception unit. without generating, while the receiving unit relative to the object If more setting information accepted is determined to indicate that performs recognition processing, the continuous form data created by said continuous form data creating means an attribute information relating to the object received by said receiving means Attribute information generating means for generating recognition attribute information indicating attribute information related to recognition processing of the object, including the recognition type of the object determined by the determining means, according to the attribute information related to the object to be set;
When creating the continuous form data, the attribute information area of the object recognition attribute information generated is set as information indicating the attribute information relating to recognition of an object by generating means, using the recognition attribute information A template generation unit configured to generate a recognition template for the form form data set as an area to be recognized by the recognition method indicated by the recognition type of the object included in the recognition attribute information;
With
The template generation unit sets the recognition attribute information when the recognition type included in the recognition attribute information generated as information indicating the attribute information related to the object recognition process by the attribute information generation unit indicates character recognition. the area of the object to be, is set as an area to perform character recognition processing, the information processing apparatus and generates a recognition template for the continuous form data.
前記判定手段により超えると判定された場合に、当該所定距離広い領域を、前記帳票フォームデータの領域を超えないように補正する補正手段と、
を更に備え、
前記テンプレート生成手段は、前記補正手段により補正された所定距離広い領域を、認識処理を行う領域として設定された認識テンプレートを生成することを特徴とする請求項3に記載の情報処理装置。 Or the attribute information generating means by said than the area of the object recognition attribute information generated as information indicating the attribute information relating to the recognition processing of the object is set a predetermined distance large area, more than an area of the continuous form data Determining means for determining
Correction means for correcting the wide area by the predetermined distance so as not to exceed the area of the form data when it is determined by the determination means to exceed
Further comprising
The information processing apparatus according to claim 3, wherein the template generation unit generates a recognition template in which a region wide by a predetermined distance corrected by the correction unit is set as a region for performing recognition processing.
前記属性情報生成手段は、前記文字枠判定手段により、前記受付手段で受け付けたオブジェクトに係る属性情報に、当該オブジェクトが文字枠であることを示す文字枠情報が含まれると判定されたことを条件に、当該属性情報に含まれている文字枠の数から文字認識処理を行う文字数が設定された当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成し、一方、前記文字枠判定手段により、前記受付手段で受け付けたオブジェクトに係る属性情報に、当該オブジェクトが文字枠であることを示す文字枠情報が含まれていないと判定されたことを条件に、認識処理を行う文字数を文字認識処理において自動的に認識させるための情報が設定された当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成することを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。 A character frame determination unit that determines whether or not the attribute information related to the object received by the reception unit includes character frame information indicating that the object is a character frame;
The attribute information generating means is provided on the condition that the character frame determining means determines that the attribute information relating to the object received by the receiving means includes character frame information indicating that the object is a character frame. Generating the recognition attribute information indicating the attribute information related to the recognition processing of the object in which the number of characters to be subjected to the character recognition processing is set from the number of character frames included in the attribute information, while the character frame determination means The number of characters to be recognized is recognized on the condition that it is determined that the attribute information related to the object received by the receiving means does not include character frame information indicating that the object is a character frame. Generating recognition attribute information indicating attribute information related to recognition processing of the object in which information for automatic recognition is set in the processing The information processing apparatus according to any one of claims 1 to 4, characterized.
前記属性情報生成手段は、文字枠数判定手段により、文字枠が文字毎の枠であると判定された場合に、当該文字枠の数から文字認識処理を行う文字数が設定された当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成することを特徴とする請求項5に記載の情報処理装置。 When the character frame determination unit determines that the attribute information related to the object received by the reception unit includes character frame information indicating that the object is a character frame, the character indicated in the character frame information A character frame number determining means for determining whether or not the frame is a frame for each character;
The attribute information generation unit recognizes the object in which the number of characters to be subjected to character recognition processing is set from the number of character frames when the character frame number determination unit determines that the character frame is a frame for each character. 6. The information processing apparatus according to claim 5, wherein recognition attribute information indicating attribute information related to processing is generated.
前記受付手段で受け付けたテンプレート設定情報に従って、前記帳票フォームデータに対する認識テンプレートを生成するかを判定するテンプレート生成判定手段を更に備え、
前記テンプレート生成手段は、前記テンプレート生成判定手段で、前記帳票フォームデータに対する認識テンプレートを生成しないと判定された場合には、前記帳票フォームデータに対する認識テンプレートを生成しないように制御することを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。 The accepting means further accepts a setting of template setting information indicating whether to generate a recognition template for the form data;
A template generation determination unit for determining whether to generate a recognition template for the form form data according to the template setting information received by the reception unit;
The template generation unit performs control so as not to generate a recognition template for the form form data when the template generation determination unit determines that a recognition template for the form form data is not generated. The information processing apparatus according to any one of claims 1 to 7.
受付手段が、当該帳票フォームデータを作成する際に表示される表示画面を介して、ユーザの操作により、当該帳票フォームデータに対するオブジェクトの設定を受け付け、当該帳票フォームデータに設定される当該オブジェクトごとに、当該オブジェクトの種別を含む当該オブジェクトに係る属性情報、及び当該オブジェクトについて認識処理を行うか否かを示す設定情報の設定を受け付ける受付工程と、
帳票フォームデータ作成手段が、前記受付工程により当該属性情報の設定を受け付けた各オブジェクトのそれぞれに対して、前記受付工程で受け付けた当該オブジェクトに係る属性情報が設定された帳票フォームデータを作成する帳票フォームデータ作成工程と、
決定手段が、当該帳票フォームデータを作成する際に、前記受付工程により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付工程により受け付けた設定情報が認識処理を行うことを示すか否かを判定し、当該認識処理を行うことを示すと判定された設定情報を前記受付工程で受け付けたオブジェクトに係る属性情報に含まれる当該オブジェクトの種別に従って、当該オブジェクトの認識方法を示す当該オブジェクトの認識種別を決定する決定工程と、
属性情報生成手段が、当該帳票フォームデータを作成する際に、前記受付工程により当該帳票フォームデータに対して設定されたオブジェクトであって前記帳票フォームデータ作成工程により作成される帳票フォームデータに設定されたオブジェクトに対して前記受付工程により受け付けた設定情報が認識処理を行うことを示すか否かを判定した結果、前記受付工程により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付工程により受け付けた設定情報が認識処理を行うことを示さないと判定された場合には、前記受付工程により受け付けた当該オブジェクトに係る属性情報に従って、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成せず、一方、当該オブジェクトに対して前記受付工程により受け付けた設定情報が認識処理を行うことを示すと判定された場合には、前記受付工程により受け付けた当該オブジェクトに係る属性情報であって前記帳票フォームデータ作成工程により作成される帳票フォームデータに設定される当該オブジェクトに係る属性情報に従って、前記決定工程により決定された当該オブジェクトの認識種別を含む、当該オブジェクトの認識処理に係る属性情報を示す文字認識属性情報を生成する属性情報生成工程と、
テンプレート生成手段が、当該帳票フォームデータを作成する際に、前記属性情報生成工程によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報が設定される当該オブジェクトの領域を、当該認識属性情報を用いて、当該認識属性情報に含まれる当該オブジェクトの認識種別に示される認識方法で認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成するテンプレート生成工程と、
を備え、
前記テンプレート生成工程は、前記属性情報生成工程によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報に含まれる認識種別が文字認識を示す場合には、当該認識属性情報が設定される当該オブジェクトの領域を、文字認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成することを特徴とする情報処理方法。 An information processing method in an information processing apparatus for generating a recognition template used for recognition processing, in which an object region set in form form data is set as a region for performing recognition processing of a reading target,
Receiving unit, via a display screen displayed when creating the continuous form data by operating the user accepts the setting of the object with respect to the continuous form data, for each said object to be set to the slip form data an accepting step of accepting attribute information relating to the object that contains the type of the object, and the setting of the setting information indicating whether to perform a recognition process for the object,
Form to be created continuous form data creating means, for each of the objects of accepting the setting of the attribute information by said receiving step, the continuous form data attribute information is set according to the object that has been received in said receiving step Form data creation process,
When the determination unit creates the form data, the setting information received by the receiving process is recognized for each object set for the form data by the receiving process. The method of recognizing the object according to the type of the object included in the attribute information related to the object received in the receiving step, the setting information determined to indicate that the recognition process is to be performed A determination step of determining the recognition type of the object indicating
When the attribute information generation unit creates the form data, the object is set to the form data that is set for the form data by the receiving process and is created by the form data creation process. results setting information accepted by the accepting step for the object is determined whether indicates that performs recognition processing for each object set for the document form data by said receiving step, to the object On the other hand, when it is determined that the setting information received by the receiving process does not indicate that the recognition process is to be performed, the attribute information related to the object recognition process according to the attribute information related to the object received by the receiving process. Recognition attribute information indicating When the setting information accepted by the accepting step for is determined to indicate that performs recognition processing is created by the continuous form data producing step a attribute information relating to the object received by the receiving step that according to the attribute information relating to the object set in the document form data, including recognition type of the object determined by the determining step, the attribute of generating character recognition attribute information indicating attribute information relating to the recognition processing of the object Information generation process;
Template generation means, when creating the continuous form data, the area of the object attribute information recognition attribute information generated as information indicating the attribute information relating to recognition of an object by generating process is set, the Using a recognition attribute information, a template generation step for generating a recognition template for the form form data set as an area for performing a recognition process by a recognition method indicated by the recognition type of the object included in the recognition attribute information;
With
The template generation step sets the recognition attribute information when the recognition type included in the recognition attribute information generated as information indicating the attribute information related to the object recognition processing by the attribute information generation step indicates character recognition. the area of the object to be, is set as an area to perform character recognition processing, the information processing method and generates a recognition template for the continuous form data.
前記情報処理装置を、
当該帳票フォームデータを作成する際に表示される表示画面を介して、ユーザの操作により、当該帳票フォームデータに対するオブジェクトの設定を受け付け、当該帳票フォームデータに設定される当該オブジェクトごとに、当該オブジェクトの種別を含む当該オブジェクトに係る属性情報、及び当該オブジェクトについて認識処理を行うか否かを示す設定情報の設定を受け付ける受付手段と、
前記受付手段により当該属性情報の設定を受け付けた各オブジェクトのそれぞれに対して、前記受付手段で受け付けた当該オブジェクトに係る属性情報が設定された帳票フォームデータを作成する帳票フォームデータ作成手段と、
当該帳票フォームデータを作成する際に、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すか否かを判定し、当該認識処理を行うことを示すと判定された設定情報を前記受付手段で受け付けたオブジェクトに係る属性情報に含まれる当該オブジェクトの種別に従って、当該オブジェクトの認識方法を示す当該オブジェクトの認識種別を決定する決定手段と、
当該帳票フォームデータを作成する際に、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトであって前記帳票フォームデータ作成手段により作成される帳票フォームデータに設定されたオブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すか否かを判定した結果、前記受付手段により当該帳票フォームデータに対して設定されたオブジェクトごとに、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示さないと判定された場合には、前記受付手段により受け付けた当該オブジェクトに係る属性情報に従って、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成せず、一方、当該オブジェクトに対して前記受付手段により受け付けた設定情報が認識処理を行うことを示すと判定された場合には、前記受付手段により受け付けた当該オブジェクトに係る属性情報であって前記帳票フォームデータ作成手段により作成される帳票フォームデータに設定される当該オブジェクトに係る属性情報に従って、前記決定手段により決定された当該オブジェクトの認識種別を含む、当該オブジェクトの認識処理に係る属性情報を示す認識属性情報を生成する属性情報生成手段と、
当該帳票フォームデータを作成する際に、前記属性情報生成手段によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報が設定される当該オブジェクトの領域を、当該認識属性情報を用いて、当該認識属性情報に含まれる当該オブジェクトの認識種別に示される認識方法で認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成するテンプレート生成手段として機能させ、
前記テンプレート生成手段は、前記属性情報生成手段によりオブジェクトの認識処理に係る属性情報を示す情報として生成された認識属性情報に含まれる認識種別が文字認識を示す場合には、当該認識属性情報が設定される当該オブジェクトの領域を、文字認識処理を行う領域として設定された、前記帳票フォームデータに対する認識テンプレートを生成することを特徴とするプログラム。 There is a program that can be read and executed by an information processing apparatus that generates a recognition template used for the recognition process, in which an object area set in the form data is set as a recognition target recognition process,
The information processing apparatus;
Via the display screen displayed in creating the document form data by operating the user accepts the setting of the object with respect to the continuous form data, for each said object to be set to the slip form data of the object Accepting means for receiving attribute information relating to the object including the type, and setting information indicating whether or not to perform recognition processing on the object;
A continuous form data creating means for each of the objects of accepting the setting of the attribute information, to create a continuous form data attribute information relating to the object which is received is set by the receiving unit by the receiving unit,
Whether the setting information received by the receiving unit for the object indicates recognition processing for each object set for the form form data by the receiving unit when the form form data is created The object indicating the recognition method of the object according to the type of the object included in the attribute information related to the object received by the receiving unit with the setting information determined to indicate that the recognition process is to be performed Determining means for determining the recognition type of
When creating the continuous form data, for the receiving unit by an object set in a continuous form data created by an object set for the document form data the continuous form data creating means the As a result of determining whether or not the setting information received by the receiving unit indicates that recognition processing is to be performed, for each object set for the form form data by the receiving unit, the receiving unit for the object If it is determined that the received setting information does not indicate that the recognition process is to be performed, the recognition attribute information indicating the attribute information related to the object recognition process is set according to the attribute information related to the object received by the reception unit. without generating, while the receiving unit relative to the object If more setting information accepted is determined to indicate that performs recognition processing, the continuous form data created by said continuous form data creating means an attribute information relating to the object received by said receiving means Attribute information generating means for generating recognition attribute information indicating attribute information related to recognition processing of the object, including the recognition type of the object determined by the determining means, according to the attribute information related to the object to be set;
When creating the continuous form data, the attribute information area of the object recognition attribute information generated is set as information indicating the attribute information relating to recognition of an object by generating means, using the recognition attribute information And functioning as a template generation means for generating a recognition template for the form form data set as an area for performing recognition processing by the recognition method indicated by the recognition type of the object included in the recognition attribute information,
The template generation unit sets the recognition attribute information when the recognition type included in the recognition attribute information generated as information indicating the attribute information related to the object recognition process by the attribute information generation unit indicates character recognition. the area of the object to be, is set as an area to perform character recognition processing, programs and generates a recognition template for the continuous form data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009145081A JP5604814B2 (en) | 2009-06-18 | 2009-06-18 | Information processing apparatus, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009145081A JP5604814B2 (en) | 2009-06-18 | 2009-06-18 | Information processing apparatus, information processing method, and program |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011002989A JP2011002989A (en) | 2011-01-06 |
JP2011002989A5 JP2011002989A5 (en) | 2012-08-02 |
JP5604814B2 true JP5604814B2 (en) | 2014-10-15 |
Family
ID=43560900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009145081A Expired - Fee Related JP5604814B2 (en) | 2009-06-18 | 2009-06-18 | Information processing apparatus, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5604814B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014049015A (en) * | 2012-09-03 | 2014-03-17 | Toshiba Tec Corp | Commodity recognition apparatus and commodity recognition program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628518A (en) * | 1992-07-10 | 1994-02-04 | Toshiba Corp | Ocr system |
JP3294995B2 (en) * | 1996-06-21 | 2002-06-24 | 三菱電機株式会社 | Form reader |
-
2009
- 2009-06-18 JP JP2009145081A patent/JP5604814B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011002989A (en) | 2011-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8243319B2 (en) | Image processing apparatus and computer program product generates and displayed processed image in a stack | |
JP4436851B2 (en) | Printer driver program and image forming apparatus | |
JP3962721B2 (en) | Document processing apparatus and document processing method | |
US8675260B2 (en) | Image processing method and apparatus, and document management server, performing character recognition on a difference image | |
US8516363B2 (en) | Image processing apparatus, computer program product, and preview image displaying method | |
US20090204888A1 (en) | Document processing apparatus, document processing method, and storage medium | |
US8018618B2 (en) | Information processing apparatus that outputs images having same size to single page of recording sheet and computer readable medium | |
JP6525641B2 (en) | INFORMATION PROCESSING SYSTEM, CONTROL METHOD, AND COMPUTER PROGRAM | |
US8878874B2 (en) | Image overlaying device and image overlaying program | |
US8780404B2 (en) | Information processing apparatus, method for controlling same, and storage medium on which computer program has been recorded | |
US8355577B2 (en) | Image processing apparatus and method | |
US20140139882A1 (en) | Image processing system, image processing method, and computer readable recording medium storing program thereof | |
JP2015167001A (en) | Information processing program, information processing device, information processing system, information processing method, image processor and image processing system | |
JP5604814B2 (en) | Information processing apparatus, information processing method, and program | |
JP5589381B2 (en) | Information processing apparatus, information processing method, and program | |
JP2012133569A (en) | Information processing device, control method and program thereof | |
US11588945B2 (en) | Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area | |
US20110279457A1 (en) | Plate check supporting method, plate check supporting apparatus, and recording medium | |
US9626606B2 (en) | Data generating apparatus, data generating method, and non-transitory storage medium | |
US20120254741A1 (en) | Proofreading apparatus, proofreading method, and recording medium | |
JP4305343B2 (en) | Image processing device | |
US12086480B2 (en) | Information processing apparatus and method, and storage medium storing program | |
JP2015089032A (en) | Information processing unit, information processing method and program | |
JP2007194713A (en) | Image processing apparatus, system, and method, and program | |
CN117950601A (en) | Print production system, print production method, signature image production method, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20120130 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120618 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120618 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130531 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130531 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130917 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131118 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140512 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140729 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140811 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5604814 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |