[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4092849B2 - Form recognition device and recording medium - Google Patents

Form recognition device and recording medium Download PDF

Info

Publication number
JP4092849B2
JP4092849B2 JP2000103009A JP2000103009A JP4092849B2 JP 4092849 B2 JP4092849 B2 JP 4092849B2 JP 2000103009 A JP2000103009 A JP 2000103009A JP 2000103009 A JP2000103009 A JP 2000103009A JP 4092849 B2 JP4092849 B2 JP 4092849B2
Authority
JP
Japan
Prior art keywords
field
definition information
recognition
format
definition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000103009A
Other languages
Japanese (ja)
Other versions
JP2001291055A (en
JP2001291055A5 (en
Inventor
幸博 新堂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2000103009A priority Critical patent/JP4092849B2/en
Publication of JP2001291055A publication Critical patent/JP2001291055A/en
Publication of JP2001291055A5 publication Critical patent/JP2001291055A5/ja
Application granted granted Critical
Publication of JP4092849B2 publication Critical patent/JP4092849B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、予め設定されている各種の帳票フォーマットを参照して帳票イメージを文字認識すると共に、その認識状態に応じて当該帳票イメージの帳票種別を確定する帳票認識装置および記録媒体に関する。
【0002】
【従来の技術】
従来、帳票イメージを読み取ってデータ処理する業務用のコンピュータ装置においては、予め設定されている各種の帳票フォーマットを参照して帳票イメージを文字認識した後、各帳票フォーマット毎に文字認識した認識率に応じて当該帳票イメージの種別を確定するようにしている。すなわち、帳票毎に設定されている帳票フォーマットを1つずつ読み出し、この帳票フォーマットに基づいて帳票イメージを文字認識する動作を設定帳票数分繰り返し行うと共に、帳票毎に文字認識した認識率を比較し、最も認識率が高い帳票を当該帳票イメージの帳票種別として確定するようにしていた。
【0003】
【発明が解決しようとする課題】
このように帳票フォーマット毎にその認識率を求めて比較する方法においては、予め設定されている帳票フォーマット情報を個別に順次読出して文字認識する必要があるため、帳票イメージを読み取ってからその種別を確定するまでに行われる一連の処理は、帳票フォーマット情報の設定数に応じた回数分必要となる。したがって、その設定数が多い程、処理回数は増え、帳票種別の確定までに時間がかかり、処理効率が悪くなって業務処理全体に悪影響を与えてしまう要因となっていた。
【0004】
この発明の課題は、帳票グループを単に指定するだけで、当該指定グループ対応の複数の帳票フォーマット定義情報を動的に合成するこができ、この合成フォーマットに基づいて帳票イメージを文字認識することにより、帳票イメージの読み取りからその種別を確定するまでの一連の処理を1回の処理で実行することができ、帳票種別の確定を効率良く実行できるようにすることである。
【0005】
【課題を解決するための手段】
本発明の帳票認識装置は、予め設定されている複数のフィールドよりなる帳票フォーマットを参照して帳票イメージを文字認識すると共に、各帳票フォーマット毎に文字認識した認識状態に応じて当該帳票イメージの種別を確定する帳票認識装置において、帳票毎に帳票の各フィールドに対応してそのフィールドの領域座標、文字種からなるフィールド定義情報を帳票フォーマットとして記憶する帳票定義記憶手段と、帳票グループと当該グループに属する各帳票との対応関係を記憶する帳票グループ記憶手段と、帳票グループが指定された際に、指定グループに対応付けられている各帳票を前記帳票グループ記憶手段から読み出すと共に、読み出した帳票毎に当該帳票に対応して定義されている前記フィールド定義情報を前記帳票定義記憶手段から読み出す読出手段と、この読出手段によって読み出された各帳票のフィールド定義情報を各々読み出し、当該フィールド定義情報を順次書込んだ複数のフィールド定義情報を合成フィールド定義情報として記憶した合成フォーマット定義情報を作成する定義合成手段と、この定義合成手段によって得られた合成フォーマット定義情報の合成フィールド定義情報に基づいて帳票イメージを文字認識する文字認識手段と、この文字認識手段によって認識された認識結果を各帳票毎のフィールドに分割すると共に、分割した認識結果の最も認識状態が良好なフィールドの帳票を当該帳票イメージの種別として確定する帳票種別確定手段とを具備し、帳票グループの指定に基づいて当該指定グループ対応の各帳票フォーマットのフィールド定義情報を合成して帳票種別を確定するようにしたことを特徴とする。
【0006】
なお、この発明は次のようなものであってもよい。
(1)前記定義合成手段は、合成フォーマット定義情報を作成する際に、各帳票毎に、そのフォーマット定義情報を区分して合成し、前記文字認識手段は、前記合成フォーマット定義情報に基づいて帳票イメージを文字認識する際に、各帳票区分毎に文字認識する。
(2)帳票毎に設定されている帳票フォーマット定義情報は、基本定義情報と、帳票を構成する各フィールドを定義するフィールド定義情報とから成り、前記定義合成手段は、合成フォーマット定義情報を作成する際に、前記基本定義情報毎、フィールド定義情報毎に分けて合成する。
(3)前記定義合成手段は、合成フォーマット定義情報を作成する際に、前記基本定義情報の内容を解析し、その解析結果に基づいて複数の合成フォーマット定義情報を作成し、前記文字認識手段は、前記基本定義情報の解析結果に基づいて作成された前記複数の合成フォーマット定義情報毎に帳票イメージを文字認識し、前記帳票種別確定手段は、合成フォーマット定義情報毎の認識結果に基づいて最も認識状態が良好な帳票を当該帳票イメージの種別として確定する。
【0008】
【発明の実施の形態】
(第1実施形態)
以下、図1〜図13を参照してこの発明の第1実施形態を説明する。
図1は、この実施形態における帳票認識機能付データ処理装置の全体構成を示したブロック図である。
この帳票認識機能付データ処理装置は、帳票イメージを読み取ると共に、読み取った帳票イメージを文字認識し、その認識率に応じて当該帳票の種別を確定するようにしたものである。すなわち、処理対象の業務が指定されると、当該業務対応の各帳票フォーマット定義情報を動的に合成し、この合成フォーマット定義情報にしたがって帳票イメージを文字認識し、その認識結果を帳票毎に分割してその認識率を比較することにより、その認識率に応じて当該帳票の種別を確定するようにしたものであり、帳票イメージの読み取りからその種別を確定するまでの一連の処理を1回の処理で実行可能とし、処理効率の大幅な向上を期待できるようにしたことを特徴としている。
なお、この実施形態の特徴部分を詳述する前に、この実施形態のハードウェア上の構成について以下、説明しておく。
【0009】
CPU1は、記憶装置2内のオペレーティングシステムや各種アプリケーションソフトにしたがって帳票認識機能付データ処理装置の全体動作を制御する中央演算処理装置である。記憶装置2は、オペレーティングシステムや各種アプリケーションソフトの他、データベース、文字フォント等が格納され、磁気的、光学的、半導体メモリ等によって構成されている記録媒体3やその駆動系を有している。この記録媒体3はハードディスク等の固定的な媒体若しくは着脱自在に装着可能なCD−ROM、フロッピィデスク、RAMカード、磁気カード等の可搬型の媒体である。また、この記録媒体3内のプログラムやデータは、必要に応じてCPU1の制御によりRAM(例えば、スタティクRAM)4にロードされたり、RAM4内のデータが記録媒体3にセーブされる。更に、記録媒体はサーバ等の外部機器側に設けられているものであってもよく、CPU1は伝送媒体を介してこの記録媒体内のプログラム/データを直接アクセスして使用することもできる。
また、CPU1は記録媒体3内に格納されるその一部あるいは全部を他の機器側から伝送媒体を介して取り込み、記録媒体3に新規登録あるいは追加登録することもできる。すなわち、コンピュータ通信システムを構成する他の機器から通信回線やケーブル等の有線伝送路あるいは電波、マイクロウエーブ、赤外線等の無線伝送路を介して送信されてきたプログラム/データを伝送制御部5によって受信して記録媒体3内にインストールすることができる。更に、プログラム/データはサーバ等の外部機器側で記憶管理されているものであってもよく、CPU1は伝送媒体を介して外部機器側のプログラム/データを直接アクセスして使用することもできる。
【0010】
一方、CPU1にはその入出力周辺デバイスである伝送制御部5、入力部6、表示部7、イメージスキャナ8がバスラインを介して接続されており、入出力プログラムにしたがってCPU1はそれらの動作を制御する。伝送制御部5は、例えば、通信モデムや赤外線モジュールあるいはアンテナ等を含む通信インターフェイスである。入力部6はキーボードやタッチパネルあるいはマウスやタッチ入力ペン等のポインティングデバイスを構成する操作部であり、文字列データや各種コマンドを入力する。なお、表示部7は、フルカラー表示を行う液晶やCRTあるいはプラズマ表示装置などであり、イメージスキャナ8は帳票イメージを読み取る定置式スキャナである。
【0011】
図2は、このデータ処理装置内に格納されている各種のファイルを示した図である。
業務情報ファイルF1は、業務内容に応じて当該業務で使用される各種の帳票を定義するもので、図7(A)、図8(B)は、業務情報ファイルF1の内容を例示している。すなわち、図7(A)は業務▲1▼で使用される帳票▲1▼、▲2▼、▲3▼を示し、図8(B)は、業務▲2▼で使用される帳票▲1▼、▲4▼を示している。このように業務情報ファイルF1は、グループ(業務)毎に、その業務で使用される各帳票との対応関係を記憶する構成となっている。
基本定義ファイルF2は、全業務分の各帳票に対応して帳票サイズ、位置合わせ用のエッジマーク有無等を定義する基本定義情報を記憶し、フィールド定義ファイルF3は、各帳票に対応して帳票を構成する各フィールドを定義する定義情報を記憶する構成となっている。
【0012】
図3〜図6において(A)は、帳票▲1▼、▲2▼、▲3▼、▲4▼のフォーマットを概念的に示した図であり、(B)は帳票▲1▼、▲2▼、▲3▼、▲4▼に対応する基本定義ファイルF2の記憶内容を示している。また、(C)は帳票▲1▼、▲2▼、▲3▼、▲4▼に対応するフィールド定義ファイルF3の記憶内容を示している。
基本定義ファイルF2には、帳票サイズとして横サイズ、縦サイズが設定されていると共に、エッジマークの有無を示す情報およびエッジマークが有る場合には、そのマークの開始位置、間隔が設定され、更に、タイミングマークの有無等が設定されている。例えば、帳票▲1▼の基本フォーマットは、帳票サイズが横200mm、縦150mm、エッジマークが有り、その開始(20mm、20mm)、間隔(150mm、110mm)、タイミングマーク無しが設定されている。フィールド定義ファイルF3には、各フィールド毎に、「文字種」、「文字数」、「領域」を示すフィールド情報が設定されている。例えば、帳票▲1▼は、3つのフィールドを有し、各フィールドの文字種として、「活字数字」が設定され、また、その文字数として「26」が設定され、更に、各領域を特定する左上始点座標、右下終点座標が設定されている。
【0013】
合成基本定義ファイルF4は、業務で使用される各帳票の基本定義を合成することによって得られた合成基本定義情報を記憶するもので、図7(B)は、業務▲1▼の合成基本定義情報、図8(B)は、業務▲2▼の合成基本定義情報を例示している。なお、業務対応の各帳票に対応付けられている基本定義ファイルF2の内容をどのように合成するの合成方法については、後述する。図7(C)は、帳票▲1▼、▲2▼、▲3▼の各フィールドを概念的に重ね合わせた状態を示した図、図8(C)は、帳票▲1▼、▲4▼の各フィールドを概念的に重ね合わせた状態を示した図である。
合成フィールド定義ファイルF5は、業務で使用される各帳票のフィールド定義を合成することによって得られた合成フィールド定義情報を記憶するもので、図7(D)は、業務▲1▼の合成フィールド定義情報、図8(D)は、業務▲2▼の合成フィールド定義情報を例示している。
ここで、業務対応の各帳票に対応付けられている基本定義ファイルF2の内容を合成する場合、一連のシリアルNo.である合成フィールドNo.に対応して、帳票毎、フィールド毎にフィールド定義情報を順次書き込むことにより複数帳票分の合成フィールド定義を生成するようにしている。なお、合成フィールド定義ファイルF5に1帳票分のフィールド定義情報を書き込む毎に、そのフィールド定義情報の書き込み範囲と帳票との対応関係を記憶管理するようにしている。
【0014】
帳票画像ファイルF6は、イメージスキャナ8によって読み取られた帳票イメージが一時記憶されるものであり、CPU1はこの帳票画像ファイルF6内の帳票イメージに基づいて文字認識する。
認識データファイルF7は、各帳票フォーマットの定義情報を参照して帳票イメージを文字認識した際に、その認識結果を帳票毎に記憶保持するもので、図9は、この認識データファイルF7のデータ構成を示している。すなわち、認識データファイルF7は、帳票毎、フィールド毎に、「フィールド番号」、「認識データ」、「認識率」、「フィールド番号」、‥‥を記憶する構成となっている。この場合、CPU1は、この認識データファイルF7の内容を帳票別に読出し、各フィールドの「認識率」を合計した値を比較することで、その値が最も大きい帳票を当該帳票の種別として確定するようにしている。
【0015】
次に、この第1実施形態における帳票認識処理を図10〜図13に示すフローチャートを参照して説明する。ここで、これらのフローチャートに記述されている各機能を実現するためのプログラムは、読み取り可能なプログラムコードの形態で記録媒体3に格納されており、CPU1はこのプログラムコードにしたがった動作を逐次実行する。また、CPU1は伝送媒体を介して伝送されてきた上述のプログラムコードにしたがった動作を逐次実行することもできる。このことは後述する他の実施形態においても同様であり、記録媒体の他、伝送媒体を介して外部供給されたプログラム/データを利用してこの実施形態特有の動作を実行することもできる。
【0016】
図10は、帳票認識処理の全体動作を示したフローチャートである。
先ず、会社組織において、帳票を処理する際に、自己の業務を指定すると、CPU1は指定業務に基づいて業務情報ファイルF1を検索し、当該業務で使用される複数の帳票が選択候補として取得する(ステップA1)。
いま、業務▲1▼が指定されたものとすると、図7(A)に示すように、当該業務対応の候補として帳票▲1▼、▲2▼、▲3▼が選択される。そして、選択された複数の帳票に基づいて基本定義ファイルF2、フィールド定義ファイルF3をアクセスし、該当する基本定義情報、フィールド定義情報を取得すると共に(ステップA2)、取得した各基本定義情報、フィールド定義情報をRAM4内のワーク域に格納しておく(ステップA3)。
この状態において、指定業務対応の複数の基本定義情報を合成する基本定義合成処理を行い、その合成結果を合成基本定義ファイルF4内に格納すると共に、指定業務対応の複数のフィールド定義情報を合成するフィールド定義合成処理を行いながらその合成結果を合成フィールド定義ファイルF5内に格納する(ステップA4〜A6)。
【0017】
図11は、基本定義合成処理を示したフローチャートである。
先ず、選択候補として取得したワーク域内の全帳票の基本定義を読み出して、それらを比較し、「帳票サイズ」が全て同一かを調べる(ステップB1)。ここで、同一であれば、その基本サイズを合成サイズとして決定するが(ステップB2)、全てが同一でなければ、各基本定義の帳票サイズを構成する縦幅・横幅毎に、その値が最も大きいサイズを抽出して、それを合成サイズとして決定する(ステップB3)。
いま、帳票▲1▼、▲2▼、▲3▼対応の基本定義は、図3(A)〜図5(A)に示すように設定されており、その中で最大サイズは横幅(200mm)、縦幅(150mm)であるため、それが帳票▲1▼、▲2▼、▲3▼の基本定義を合成した合成帳票サイズとなる。
【0018】
次に、選択候補として取得した全帳票の基本定義のうち、「エッジマークの有無」を比較し、全てが「エッジマーク有り」に設定されているかを調べ(ステップB4)、全てが「エッジマーク有り」に設定されていれば、それを基本合成定義として決定するが(ステップB5)、各基本定義の中に「エッジマーク無し」が1つでも含まれていれば、「エッジマーク無し」を基本合成定義として決定する(ステップB6)。上述の例では、基本合成定義として、「エッジマーク無し」が設定される。
最後に、全帳票の基本定義のうち、「タイミングマークの有無」を比較し、全てが「タイミングマーク有り」が設定されているかを調べ(ステップB7)、全てが「タイミングマーク有り」であれば、それを基本合成定義として決定するが(ステップB8)、「タイミングマーク無し」が1つでも含まれていれば、「タイミングマーク無し」を基本合成定義として決定する(ステップB9)。この場合、基本合成定義として、「タイミングマーク無し」が設定される。
このようにして合成された各基本合成定義情報は、合成基本定義ファイルF4内に格納される(図10のステップA5)。
【0019】
図12は、フィールド定義合成処理を示したフローチャートである。
先ず、このフィールド定義合成処理で使用する「合成フィールド番号N」と「書き込みポインタM」に初期値“1”をセットしておくと共に(ステップC1)、「読み込みポインタn」に初期値“1”をセットしておく(ステップC2)。ここで、「合成フィールド番号N」は、合成フィールド定義ファイルF5にセットされる一連番号である。また、「書き込みポインタM」は、合成フィールド定義ファイルF5の書き込みアドレスを指定するポインタであり、更に、「読み込みポインタn」は、RAM4のワーク域内に選択候補としてセットされている全帳票分のフィールド定義を1つずつアドレス指定して読み出すためのポインタである。
そして、RAM4のワーク域内に選択候補としてセットされている全帳票分のうち、「読み込みポインタn」の値に対応する1帳票分のフィールド定義を読出し対象として範囲指定しておく(ステップC3)。最初は、その先頭の帳票フィールド定義が指定される。
【0020】
この状態において、「読み込みポインタn」で示されるn番目の帳票フィールド定義を取得し(ステップC4)、このフィールド定義情報を「書き込みポインタM」で示される合成フィールド定義ファイルF5のアドレス領域に書き込む(ステップC5)。そして、「合成フィールド番号N」を「書き込みポインタM」で示される合成フィールド定義ファイルF5のアドレス領域に書き込む(ステップC6)。
そして、「合成フィールド番号N」、「書き込みポインタM」、「読み込みポインタn」の値をぞれぞれ「+1」する更新処理を行った後(ステップC7)、未書き込みのフィールド定義情報は、ワーク域内にまだ残っているかを判別し(ステップC8)、あればステップC4に戻り、「読み込みポインタn」で指定される次のフィールド定義情報を読出し、以下、上述の動作を繰り返す。これによって1帳票分のフィールド定義情報が「合成フィールド番号N」に対応して合成フィールド定義ファイルF5に順次書き込まれる。
【0021】
そして、1帳票分のフィールド定義情報の書き込みが終わると、その書き込み範囲はN1〜Nnのアドレス範囲となるので、このN1〜Nnのアドレス範囲に対応付けて、当該帳票No.を合成フィールド定義ファイルF5に書き込む(ステップC9)。
次に、他の未処理の帳票はまだあるかを調べる(ステップC10)。いま、最初の帳票を処理し終わった段階であるから、未処理帳票有りが判別されてステップC2に戻り、「読み込みポインタn」の値を“1”に初期化すると共に、次の帳票を指定したのち(ステップC3)、当該指定帳票の先頭からフィールド定義情報を読み出してゆき、「合成フィールド番号N」と共に、合成フィールド定義ファイルF5に書き込む(ステップC4〜C8)。
以下、選択候補の全ての帳票に対してフィールド定義情報を合成フィールド定義ファイルF5に順次書き込む合成処理を繰り返す(ステップC2〜C10)。
【0022】
このようにして合成基本定義ファイルF4、合成フィールド定義ファイルF5を生成した後は、図10のステップA7に移り、帳票原稿をイメージスキャナ8にセツトすることによって読み取られた帳票イメージは、帳票画像ファイルF6に格納されると共に、この帳票イメージは、合成基本定義ファイルF4、合成フィールド定義ファイルF5の内容に基づいて帳票毎、フィールド毎に文字認識される(ステップA8)。
この場合、帳票毎、フィールド毎に文字認識された認識結果は、認識データファイルF7に帳票毎、フィールド毎に順次書き込まれるが、その際、フィールド毎にその認識率が算出されて、認識データファイルF7の対応位置にセットされる(ステップA9、A10)。
そして、次のステップA11では、認識データファイルF7の内容を解析する認識結果解析処理が行われる。
【0023】
図13は、この認識結果解析処理を示したフローチャートであり、この解析処理は、認識結果を帳票毎に分割すると共に、分割した認識結果の認識率を比較検討することにより最も認識率が高い帳票を当該帳票イメージの帳票種別として確定するようにしている。
すなわち、認識データファイルF7内には、帳票毎、フィールド毎に文字認識された認識結果が書き込まれているので、先ず、帳票毎の認識データを帳票毎に分離すると共に(ステップD1)、帳票別に各フィールド対応の認識率を合計する(ステップD2)。そして、帳票毎に算出された各認識率合計を比較し、その値が一番大きい帳票を特定し、この帳票を今回読み取った帳票イメージの種別として確定する(ステップD3)。
そして、確定した帳票に対応する認識データを元の帳票の基本定義およびフィールド定義に沿ってフィールド番号を打ち直し、ワークメモリに処理対象のデータとして格納する(ステップD4)。
なお、このワークメモリに処理対象として格納されたデータに基づいてCPU1は、通常の帳票処理を実行することができる。
【0024】
以上のように、この第1実施形態おいては、処理対象の業務が指定入力された際に、指定業務に基づいて業務情報ファイルF1を参照し、当該業務対応の各帳票を特定すると共に、特定した各帳票毎に、基本定義ファイルF2、フィールド定義ファイルF3から読み出した各帳票フォーマット定義情報を合成し、この合成フォーマット定義情報にしたがって帳票イメージを文字認識すると共に、その認識結果を帳票毎に分割してその認識率を比較し、最も認識率の良い帳票を当該帳票イメージの帳票種別として確定するようにしたから、単に業務を指定するだけで、当該業務対応の各帳票フォーマット定義情報を動的に合成するこができ、帳票イメージの読み取りからその種別を確定するまでの一連の処理が1回の処理で実行可能となり、帳票種別を効率良く確定することができる。
【0025】
また、合成フォーマット定義情報を作成する際に、各帳票毎に、そのフォーマット定義情報を区分して合成し、この合成フォーマット定義情報に基づいて帳票イメージを文字認識する際に、各帳票区分毎に文字認識するようにしたから、更に、処理効率の向上を期待することができる。
また、帳票毎に予め設定されている帳票フォーマットは、基本定義情報と、フィールド定義情報とから成り、合成フォーマット定義情報を作成する際に、基本定義情報毎、フィールド定義情報毎に分けて合成するようにしたから、合成フォーマット定義情報を通常のフォーマット情報と同様に取り扱うことができる。
【0026】
(第2実施形態)
以下、この発明の第2実施形態について図14〜図16を参照して説明する。
なお、上述した第1実施形態は、指定業務に対応する複数の帳票フォーマット情報に基づいて1つの合成フォーマット定義情報を作成するようにしたが、この第2実施形態は基本定義情報の相違に基づいて複数の合成フォーマット定義情報を作成するようにしたものである。ここで、両実施形態において基本的に同一のものは、同一符号を付して示し、その説明を省略する他、以下、第2実施形態の特徴部分を中心に説明するものとする。
【0027】
図14は、この第2実施形態における帳票認識処理を示したフローチャートであり、図15、図16は、この場合の具体例を示したもので、図15(A)は、業務▲1▼に対応する業務情報ファイルF1の内容を示している。
先ず、処理対処業務が指定されると、指定業務に基づいて業務情報ファイルF1を参照し、指定業務対応の各帳票を取得すると共に(ステップE1)、取得した各帳票に基づいて基本定義ファイルF2を検索し、帳票毎の基本定義情報を取得する(ステップE2)。
そして、各帳票の基本定義情報を比較し、その「エッジマークの有無」に基づいて帳票を分類する(ステップE3)。いま、業務▲1▼が指定された場合、その指定業務対応の帳票▲1▼、帳票▲2▼、帳票▲3▼において、その基本定義情報は、図3〜図5の各(B)に示すように、帳票▲1▼のみが「エッジマークの有り」となっているので、帳票分類としては、帳票▲1▼のみの分類と、帳票▲2▼、帳票▲3▼を含む分類に分けられる。
【0028】
そして、分類別に各帳票の基本定義情報を合成する基本定義合成処理が行われる(ステップE4)。すなわち、図15(B)、図16(A)は、業務▲1▼に対応して分類別に合成された合成基本定義ファイルF4の内容を例示したもので、「エッジマークの有り」の帳票▲1▼のみから成る分類に基づいてその基本定義の合成が行われ、また、「エッジマークの無し」の帳票▲2▼、▲3▼を含む分類に基づいてその基本定義の合成が行われる。なお、基本定義の合成は、上述した第1実施形態と同様であるので、その説明は省略する。
【0029】
次に、分類別に各帳票のフィールド定義情報を合成するフィールド定義合成処理が行われるが、この場合の合成についても、上述した第1実施形態と同様である(ステップE5)。図15(C、D)、図16(B、C)は、この場合の具体例を示している。
このようにして分類別に基本定義、フィールド定義を合成する処理が終わると、分類数分の合成定義情報に基づいて帳票イメージを各分類毎にそれぞれ文字認識する認識処理が行われると共に(ステップE6)、分類数分の認識結果を解析して、帳票種別を確定する(ステップE7)。なお、この場合の文字認識および確定処理についても、上述の第1実施形態と同様である。
【0030】
以上のように、この第2実施形態おいては、指定業務対応の各帳票フォーマット定義情報を合成する際に、その基本定義情報の内容に基づいて複数の合成フォーマット定義情報を作成すると共に、複数の合成フォーマット定義情報毎に帳票イメージを文字認識し、各合成フォーマット定義毎の認識結果に基づいて帳票種別を確定するようにしたから、異種の帳票が多数混在しているような場合でも、認識率を低下させずに、効率良く帳票種別を確定することができる。
【0031】
なお、上述した各実施形態においては、業務に対応して複数の帳票を業務情報ファイルF1に設定したが、帳票グループは業務に限らず、任意であり、例えば、部署単位を帳票グループとしてもよい。
また、基本定義やフィールド定義の合成は、上述した合成手法に限らず、任意である。
また、上述した第2実施形態は、「エッジマークの有無」に基づいて帳票を分類するようにしたが、「タイミングマークの有無」に基づいて帳票を分類するようにしてもよい。
【0032】
【発明の効果】
この発明によれば、帳票グループを単に指定するだけで、当該指定グループに対応付けられている複数の帳票フォーマットの定義情報を呼び出してそれらを動的に合成するようにしたから、この合成フォーマットに基づいて帳票イメージを文字認識してその種別を確定することにより、帳票イメージの読み取りからその種別を確定するまでの一連の処理を1回の処理で実行することができ、帳票種別の確定を効率良く実行することが可能となる。
【図面の簡単な説明】
【図1】帳票認識機能付データ処理装置の全体構成を示したブロック図。
【図2】データ処理装置内に格納されている各種のファイルを示した図。
【図3】(A)は、帳票▲1▼のフォーマットを概念的に示した図、(B)は帳票▲1▼に対応する基本定義ファイルF2の記憶内容を示し、(C)は帳票▲1▼に対応するフィールド定義ファイルF3の記憶内容を示した図。
【図4】(A)は、帳票▲2▼のフォーマットを概念的に示した図、(B)は帳票▲2▼に対応する基本定義ファイルF2の記憶内容を示し、(C)は帳票▲2▼に対応するフィールド定義ファイルF3の記憶内容を示した図。
【図5】(A)は、帳票▲3▼のフォーマットを概念的に示した図、(B)は帳票▲3▼に対応する基本定義ファイルF2の記憶内容を示し、(C)は帳票▲3▼に対応するフィールド定義ファイルF3の記憶内容を示した図。
【図6】(A)は、帳票▲4▼のフォーマットを概念的に示した図、(B)は帳票▲4▼に対応する基本定義ファイルF2の記憶内容を示し、(C)は帳票▲4▼に対応するフィールド定義ファイルF3の記憶内容を示した図。
【図7】(A)は、業務情報ファイルF1の内容を例示したもので、業務▲1▼で使用される帳票▲1▼、▲2▼、▲3▼を示し、(B)は、業務▲1▼の合成基本定義ファイルF4、(C)は、帳票▲1▼、▲2▼、▲3▼の各フィールドを概念的に重ね合わせた状態を示した図、(D)は、業務▲1▼の合成フィールド定義ファイルF5の内容を例示した図。
【図8】(A)は、業務情報ファイルF1の内容を例示したもので、業務▲2▼で使用される帳票▲1▼、▲4▼を示し、(B)は、業務▲2▼の合成基本定義ファイルF4、(C)は、帳票▲1▼、▲4▼の各フィールドを概念的に重ね合わせた状態を示した図、(D)は、業務▲1▼の合成フィールド定義ファイルF5の内容を例示した図。
【図9】認識データファイルF7のデータ構成を示した図。
【図10】帳票認識処理の全体動作を示したフローチャート。
【図11】図10で示した基本定義合成処理を詳述するためのフローチャート。
【図12】図10で示したフィールド定義合成処理を詳述するためのフローチャート。
【図13】図10で示した認識結果解析処理を詳述するためのフローチャート。
【図14】第2実施形態における帳票認識処理を示したフローチャート。
【図15】(A)は、業務▲1▼に対応する業務情報ファイルF1の内容を示した図、(B)は、「エッジマークの有り」の帳票▲1▼のみから成る分類に基づいて合成された合成基本定義ファイルの内容を示し、(C)は、当該分類に対応して合成された帳票のフィールドを概念的に重ね合わせた状態を示した図、(D)は、当該分類に対応して合成された合成フィールド定義ファイルF5の内容を例示した図。
【図16】(A)は、「エッジマークの有り」の帳票▲2▼、▲4▼を含む分類に基づいて合成された合成基本定義ファイルの内容を示し、(B)は、当該分類に対応して合成された各帳票のフィールドを概念的に重ね合わせた状態を示した図、(C)は、当該分類に対応して合成された合成フィールド定義ファイルF5の内容を例示した図。
【符号の説明】
1 CPU
2 記憶装置
3 記録媒体
5 伝送制御部
6 入力部
7 表示部
8 イメージスキャナ
F1 業務情報ファイル
F2 基本定義ファイル
F3 フィールド定義ファイル
F4 合成基本定義ファイル
F5 合成フィールド定義ファイル
F6 帳票画像ファイル
F7 認識データファイル
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a form recognition device and a recording medium for recognizing a form image with reference to various form formats set in advance and determining the form type of the form image according to the recognition state.
[0002]
[Prior art]
Conventionally, in a business computer device that reads a form image and processes data, after recognizing the form image with reference to various preset form formats, the recognition rate is recognized for each form format. Accordingly, the type of the form image is determined. In other words, the form format set for each form is read one by one, and the operation of recognizing the form image based on this form format is repeated for the set number of forms, and the recognition rate for character recognition for each form is compared. The form with the highest recognition rate is determined as the form type of the form image.
[0003]
[Problems to be solved by the invention]
In this way, in the method of obtaining and comparing the recognition rate for each form format, it is necessary to read out the form format information set in advance separately and recognize characters, so the type is determined after reading the form image. A series of processes performed until confirmation is required for the number of times corresponding to the number of forms format information set. Therefore, as the number of settings increases, the number of processes increases, and it takes time to determine the form type, which causes a reduction in processing efficiency and adversely affects the entire business process.
[0004]
An object of the present invention is to simply synthesize a form group and dynamically synthesize a plurality of form format definition information corresponding to the designated group. By recognizing a form image based on this synthesized format, A series of processes from reading a form image to determining its type can be executed in a single process so that the form type can be determined efficiently.
[0005]
[Means for Solving the Problems]
The form recognition apparatus of the present invention is preset. Consists of multiple fields In the form recognition device that recognizes the form image with reference to the form format and determines the type of the form image according to the recognition state in which the form is recognized for each form format. Corresponding to each field of the form, field definition information consisting of the area coordinates and character type of the field Form format As The form definition storage means for storing, the form group storage means for storing the correspondence relationship between the form group and each form belonging to the group, and each form associated with the designated group when the form group is designated. Read from the form group storage means and for each read form The field definition information defined for the form Reading means from the form definition storage means, and each form read by the reading means Field Read each definition information , A plurality of field definition information in which the field definition information is sequentially written as synthetic field definition information Definition synthesis means for creating stored synthesis format definition information, and synthesis format definition information obtained by this definition synthesis means Synthetic field definition information Character recognition means for recognizing the form image based on the image, and the recognition result recognized by the character recognition means for each form Field And the recognition status of the divided recognition result is the best. Field Each form format corresponding to the designated group based on the designation of the form group is provided with a form type confirming means for confirming the form as the form image type. Field Definition information Synthesize The feature is that the form type is fixed.
[0006]
The present invention may be as follows.
(1) The definition combining means categorizes and synthesizes the format definition information for each form when creating the combined format definition information, and the character recognition means determines the form based on the combined format definition information. When the image is recognized as characters, the characters are recognized for each form category.
(2) The form format definition information set for each form includes basic definition information and field definition information that defines each field constituting the form, and the definition composition unit creates composition format definition information. At this time, the basic definition information and the field definition information are combined separately.
(3) The definition synthesis means analyzes the content of the basic definition information when creating the synthesis format definition information, creates a plurality of synthesis format definition information based on the analysis result, and the character recognition means The form image is recognized for each of the plurality of composite format definition information created based on the analysis result of the basic definition information, and the form type determination means recognizes the most based on the recognition result for each composite format definition information. A form having a good state is determined as the type of the form image.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
(First embodiment)
Hereinafter, a first embodiment of the present invention will be described with reference to FIGS.
FIG. 1 is a block diagram showing an overall configuration of a data processing apparatus with a form recognition function in this embodiment.
The data processing apparatus with a form recognition function reads a form image, recognizes characters in the read form image, and determines the type of the form according to the recognition rate. In other words, when a business to be processed is specified, each form format definition information corresponding to the business is dynamically synthesized, the form image is recognized according to the synthesized format definition information, and the recognition result is divided into each form. By comparing the recognition rates, the type of the form is determined according to the recognition rate, and a series of processes from reading the form image to determining the type is performed once. It is characterized by being able to be executed by processing and expecting a significant improvement in processing efficiency.
Prior to detailed description of the features of this embodiment, the hardware configuration of this embodiment will be described below.
[0009]
The CPU 1 is a central processing unit that controls the overall operation of the data processing apparatus with a form recognition function in accordance with the operating system and various application software in the storage device 2. The storage device 2 stores a database, character fonts, and the like in addition to an operating system and various application software, and includes a recording medium 3 configured by a magnetic, optical, semiconductor memory, and the drive system thereof. The recording medium 3 is a fixed medium such as a hard disk or a portable medium such as a removable CD-ROM, floppy disk, RAM card, or magnetic card. The program and data in the recording medium 3 are loaded into a RAM (for example, a static RAM) 4 as required by the control of the CPU 1, and the data in the RAM 4 is saved in the recording medium 3. Further, the recording medium may be provided on the side of an external device such as a server, and the CPU 1 can directly access and use the program / data in the recording medium via the transmission medium.
In addition, the CPU 1 can capture a part or all of the data stored in the recording medium 3 from another device via a transmission medium, and can newly register or add to the recording medium 3. That is, the transmission control unit 5 receives a program / data transmitted from another device constituting the computer communication system via a wired transmission line such as a communication line or cable or a wireless transmission line such as radio waves, microwaves, and infrared rays. And can be installed in the recording medium 3. Furthermore, the program / data may be stored and managed on the external device side such as a server, and the CPU 1 can directly access and use the program / data on the external device side via a transmission medium.
[0010]
On the other hand, the CPU 1 is connected with the input / output peripheral devices, ie, the transmission control unit 5, the input unit 6, the display unit 7, and the image scanner 8 through the bus line, and the CPU 1 performs these operations according to the input / output program. Control. The transmission control unit 5 is a communication interface including, for example, a communication modem, an infrared module, an antenna, and the like. The input unit 6 is an operation unit constituting a pointing device such as a keyboard, a touch panel, a mouse, or a touch input pen, and inputs character string data and various commands. The display unit 7 is a liquid crystal, CRT, or plasma display device that performs full color display, and the image scanner 8 is a stationary scanner that reads a form image.
[0011]
FIG. 2 is a diagram showing various files stored in the data processing apparatus.
The business information file F1 defines various forms used in the business according to the business content. FIGS. 7A and 8B illustrate the content of the business information file F1. . 7A shows forms {1}, {2}, {3} used in the business (1), and FIG. 8 (B) shows a form {1} used in the business (2). , (4) are shown. In this way, the business information file F1 is configured to store a correspondence relationship with each form used in the business for each group (business).
The basic definition file F2 stores basic definition information that defines the form size, the presence / absence of edge mark for alignment, etc. corresponding to each business form, and the field definition file F3 corresponds to each form. It is the structure which memorize | stores the definition information which defines each field which comprises.
[0012]
3 to 6, (A) is a diagram conceptually showing the formats of forms (1), (2), (3), and (4), and (B) is forms (1) and (2). The storage contents of the basic definition file F2 corresponding to ▼, (3), and (4) are shown. (C) shows the stored contents of the field definition file F3 corresponding to the forms (1), (2), (3), and (4).
In the basic definition file F2, the horizontal size and vertical size are set as the form size, and when there is information indicating the presence or absence of an edge mark and an edge mark, the start position and interval of the mark are set. The presence / absence of a timing mark is set. For example, in the basic format of the form (1), the form size is set to 200 mm in width, 150 mm in length, with edge marks, its start (20 mm, 20 mm), interval (150 mm, 110 mm), and no timing mark. In the field definition file F3, field information indicating “character type”, “number of characters”, and “area” is set for each field. For example, the form {circle over (1)} has three fields, “type number” is set as the character type of each field, “26” is set as the number of characters, and the upper left starting point for specifying each area Coordinates, lower right end point coordinates are set.
[0013]
The composite basic definition file F4 stores composite basic definition information obtained by combining the basic definitions of each form used in the business. FIG. 7B shows the composite basic definition of the business (1). Information, FIG. 8B exemplifies synthetic basic definition information of the business (2). A synthesis method for synthesizing the contents of the basic definition file F2 associated with each business-compatible form will be described later. FIG. 7C is a diagram showing a state in which the fields of the form {circle around (1)}, {circle around (2)}, and {circle around (3)} are conceptually superimposed. FIG. It is the figure which showed the state which overlap | superposed each field of no.
The synthetic field definition file F5 stores synthetic field definition information obtained by synthesizing the field definitions of each form used in the business. FIG. 7D shows the synthetic field definition of the business (1). Information, FIG. 8D exemplifies the composite field definition information of the business (2).
Here, when combining the contents of the basic definition file F2 associated with each business-supported form, field definition information for each form and each field corresponding to a composite field number that is a series of serial numbers. Are sequentially written to generate composite field definitions for a plurality of forms. Each time field definition information for one form is written in the composite field definition file F5, the correspondence between the field definition information writing range and the form is stored and managed.
[0014]
The form image file F6 temporarily stores the form image read by the image scanner 8, and the CPU 1 recognizes characters based on the form image in the form image file F6.
The recognition data file F7 stores and holds the recognition result for each form when the form image is recognized by referring to the definition information of each form format. FIG. 9 shows the data structure of the recognition data file F7. Is shown. That is, the recognition data file F7 is configured to store “field number”, “recognition data”, “recognition rate”, “field number”,... For each form and each field. In this case, the CPU 1 reads the contents of the recognition data file F7 for each form and compares the sum of the “recognition rates” of each field to determine the form having the largest value as the type of the form. I have to.
[0015]
Next, the form recognition process in the first embodiment will be described with reference to the flowcharts shown in FIGS. Here, a program for realizing each function described in these flowcharts is stored in the recording medium 3 in the form of a readable program code, and the CPU 1 sequentially executes operations according to the program code. To do. Further, the CPU 1 can sequentially execute the operation according to the above-described program code transmitted via the transmission medium. The same applies to other embodiments to be described later. In addition to a recording medium, an operation peculiar to this embodiment can be executed using a program / data supplied externally via a transmission medium.
[0016]
FIG. 10 is a flowchart showing the overall operation of the form recognition process.
First, when a company organization designates its own business when processing a form, the CPU 1 searches the business information file F1 based on the designated business, and acquires a plurality of forms used in the business as selection candidates. (Step A1).
Assuming that the business (1) is designated, forms (1), (2), (3) are selected as candidates for the business as shown in FIG. Then, the basic definition file F2 and the field definition file F3 are accessed based on the selected plurality of forms, and the corresponding basic definition information and field definition information are acquired (step A2). Definition information is stored in a work area in the RAM 4 (step A3).
In this state, a basic definition synthesis process is performed for synthesizing a plurality of basic definition information corresponding to the designated job, the synthesized result is stored in the synthesized basic definition file F4, and a plurality of field definition information corresponding to the designated job is synthesized. While performing the field definition synthesis process, the synthesis result is stored in the synthesis field definition file F5 (steps A4 to A6).
[0017]
FIG. 11 is a flowchart showing the basic definition synthesis process.
First, the basic definitions of all the forms in the work area acquired as selection candidates are read out and compared, and it is checked whether all the “form sizes” are the same (step B1). Here, if they are the same, the basic size is determined as the composite size (step B2), but if all are not the same, the value is the largest for each of the vertical and horizontal widths constituting the form size of each basic definition. A large size is extracted and determined as a combined size (step B3).
Now, the basic definitions for forms (1), (2), and (3) are set as shown in FIGS. 3A to 5A, and the maximum size is the width (200 mm). Therefore, it is the combined form size obtained by combining the basic definitions of forms (1), (2), and (3).
[0018]
Next, among the basic definitions of all the forms acquired as selection candidates, “edge mark presence / absence” is compared to check whether all are set to “edge mark present” (step B4). If it is set to “Yes”, it is determined as a basic composite definition (step B5). If any “No Edge Mark” is included in each basic definition, “No Edge Mark” is set. The basic composite definition is determined (step B6). In the above example, “no edge mark” is set as the basic composition definition.
Finally, among the basic definitions of all the forms, “presence / absence of timing mark” is compared, and it is checked whether “all with timing mark” is set (step B7). Then, it is determined as a basic composition definition (step B8). If even one “no timing mark” is included, “no timing mark” is determined as a basic composition definition (step B9). In this case, “no timing mark” is set as the basic composition definition.
The respective basic synthesis definition information synthesized in this way is stored in the synthesis basic definition file F4 (step A5 in FIG. 10).
[0019]
FIG. 12 is a flowchart showing the field definition synthesis process.
First, an initial value “1” is set in “synthesis field number N” and “write pointer M” used in this field definition synthesis process (step C1), and an initial value “1” is set in “read pointer n”. Is set (step C2). Here, “synthesis field number N” is a serial number set in the synthesis field definition file F5. The “write pointer M” is a pointer for designating the write address of the composite field definition file F5, and the “read pointer n” is a field for all the forms set as selection candidates in the work area of the RAM 4. This is a pointer for addressing and reading definitions one by one.
Then, the field definition for one form corresponding to the value of “read pointer n” out of all the forms set as selection candidates in the work area of the RAM 4 is designated as a range to be read (step C3). Initially, the first form field definition is specified.
[0020]
In this state, the nth form field definition indicated by “read pointer n” is acquired (step C4), and this field definition information is written in the address area of the composite field definition file F5 indicated by “write pointer M” ( Step C5). Then, “synthesis field number N” is written in the address area of the synthesis field definition file F5 indicated by “write pointer M” (step C6).
Then, after performing an update process of “+1” for the values of “combined field number N”, “write pointer M”, and “read pointer n” (step C7), the unwritten field definition information is Then, it is determined whether or not the work area still remains (step C8), and if there is, the process returns to step C4 to read the next field definition information designated by the “read pointer n”, and the above operation is repeated thereafter. As a result, field definition information for one form is sequentially written in the composite field definition file F5 corresponding to the “composite field number N”.
[0021]
When the writing of field definition information for one form is completed, the writing range becomes the address range of N1 to Nn. Therefore, the form number is associated with the address range of N1 to Nn, and the combined field definition file. Write to F5 (step C9).
Next, it is checked whether there are any other unprocessed forms (step C10). Now that the first form has been processed, it is determined that there is an unprocessed form, the process returns to step C2, the value of “read pointer n” is initialized to “1”, and the next form is designated. After that (step C3), the field definition information is read from the head of the designated form, and is written in the composite field definition file F5 together with the “composite field number N” (steps C4 to C8).
Thereafter, the synthesizing process for sequentially writing the field definition information to the synthetic field definition file F5 is repeated for all of the candidates for selection (steps C2 to C10).
[0022]
After the composite basic definition file F4 and the composite field definition file F5 are generated in this way, the process proceeds to step A7 in FIG. 10, and the form image read by setting the form document to the image scanner 8 is the form image file. In addition to being stored in F6, the form image is recognized for each form and for each field based on the contents of the synthetic basic definition file F4 and the synthetic field definition file F5 (step A8).
In this case, the recognition result recognized for each form and for each field is sequentially written to the recognition data file F7 for each form and for each field. At this time, the recognition rate is calculated for each field, and the recognition data file It is set at the corresponding position of F7 (steps A9, A10).
In the next step A11, recognition result analysis processing for analyzing the contents of the recognition data file F7 is performed.
[0023]
FIG. 13 is a flowchart showing the recognition result analysis process. This analysis process divides the recognition result into each form, and compares the recognition rates of the divided recognition results to obtain a form with the highest recognition rate. Is determined as the form type of the form image.
That is, since the recognition result recognized for each form and field is written in the recognition data file F7, first, the recognition data for each form is separated for each form (step D1), and for each form. The recognition rates corresponding to each field are summed (step D2). Then, the total recognition rates calculated for each form are compared, the form having the largest value is specified, and this form is determined as the type of form image read this time (step D3).
Then, the recognition data corresponding to the confirmed form is renumbered in accordance with the basic definition and field definition of the original form, and stored as processing target data in the work memory (step D4).
Note that the CPU 1 can execute normal form processing based on data stored as a processing target in the work memory.
[0024]
As described above, in the first embodiment, when a business to be processed is designated and input, the business information file F1 is referred to based on the designated business, and each form corresponding to the business is specified. For each identified form, each form format definition information read from the basic definition file F2 and the field definition file F3 is synthesized, and the form image is recognized according to the synthesized format definition information, and the recognition result for each form. The recognition rate is divided and the form with the best recognition rate is determined as the form type of the form image. By simply specifying the work, each form format definition information corresponding to the work can be moved. Can be combined, and a series of processes from reading a form image to determining its type can be executed in a single process. Type can be efficiently determined.
[0025]
Also, when creating composite format definition information, the format definition information is divided and combined for each form, and when recognizing the form image based on this composite format definition information, for each form section Since character recognition is performed, further improvement in processing efficiency can be expected.
The form format preset for each form consists of basic definition information and field definition information. When creating composite format definition information, it is synthesized separately for each basic definition information and for each field definition information. Since it did in this way, synthetic | combination format definition information can be handled like normal format information.
[0026]
(Second Embodiment)
A second embodiment of the present invention will be described below with reference to FIGS.
In the first embodiment described above, one composite format definition information is created based on a plurality of form format information corresponding to a designated job. However, the second embodiment is based on a difference in basic definition information. Thus, a plurality of composite format definition information is created. Here, components that are basically the same in both embodiments are denoted by the same reference numerals, description thereof will be omitted, and the following description will focus on the features of the second embodiment.
[0027]
FIG. 14 is a flowchart showing the form recognition processing in the second embodiment, and FIGS. 15 and 16 show specific examples in this case. FIG. The contents of the corresponding business information file F1 are shown.
First, when a processing task is designated, the business information file F1 is referenced based on the designated business, each form corresponding to the designated business is acquired (step E1), and the basic definition file F2 is obtained based on each obtained form. And basic definition information for each form is acquired (step E2).
Then, the basic definition information of each form is compared, and the forms are classified based on the “presence / absence of edge mark” (step E3). Now, when the business (1) is designated, the basic definition information in the form (1), the form (2), and the form (3) corresponding to the designated business is shown in (B) of FIGS. As shown, only the form (1) is “with edge mark”, so the form classification is divided into the classification of the form (1) only, and the classification including the form (2) and the form (3). It is done.
[0028]
Then, a basic definition synthesis process for synthesizing the basic definition information of each form for each classification is performed (step E4). That is, FIG. 15B and FIG. 16A exemplify the contents of the synthetic basic definition file F4 synthesized according to the classification corresponding to the business (1). The basic definition is synthesized based on the classification consisting only of 1 ▼, and the basic definition is synthesized based on the classification including the forms (2) and (3) of “no edge mark”. Since the synthesis of the basic definition is the same as that in the first embodiment described above, the description thereof is omitted.
[0029]
Next, a field definition synthesis process for synthesizing the field definition information of each form for each classification is performed. The synthesis in this case is also the same as that in the first embodiment described above (step E5). FIG. 15 (C, D) and FIG. 16 (B, C) show specific examples in this case.
When the process of combining the basic definition and field definition for each classification is completed in this way, a recognition process for recognizing the form image for each classification is performed based on the combined definition information for the number of classifications (step E6). The recognition results for the number of classifications are analyzed to determine the form type (step E7). Note that the character recognition and determination process in this case is the same as that in the first embodiment.
[0030]
As described above, in the second embodiment, when synthesizing each form format definition information corresponding to a designated job, a plurality of composite format definition information is created based on the contents of the basic definition information, The form image is recognized for each composite format definition information, and the form type is determined based on the recognition result for each composite format definition, so even if there are many different types of forms mixed together. The form type can be determined efficiently without reducing the rate.
[0031]
In each of the above-described embodiments, a plurality of forms corresponding to the business are set in the business information file F1, but the form group is not limited to the business, and may be arbitrary, for example, a department unit may be a form group. .
Further, the combination of the basic definition and the field definition is not limited to the above-described combining method, and is arbitrary.
In the second embodiment described above, the form is classified based on “the presence / absence of an edge mark”. However, the form may be classified based on “the presence / absence of a timing mark”.
[0032]
【The invention's effect】
According to the present invention, simply by specifying a form group, the definition information of a plurality of form formats associated with the specified group is called up and dynamically combined. By recognizing the form image based on the character and confirming the type, a series of processes from reading the form image to confirming the type can be executed in a single process, making it easy to determine the form type. It is possible to execute well.
[Brief description of the drawings]
FIG. 1 is a block diagram showing the overall configuration of a data processing apparatus with a form recognition function.
FIG. 2 is a view showing various files stored in the data processing apparatus.
3A is a diagram conceptually showing the format of a form {circle around (1)}, FIG. 3 (B) shows the storage contents of a basic definition file F2 corresponding to the form {circle around (1)}, and FIG. The figure which showed the memory content of the field definition file F3 corresponding to 1 ▼.
4A is a diagram conceptually showing the format of a form {circle around (2)}, FIG. 4 (B) shows the storage contents of the basic definition file F2 corresponding to the form {circle around (2)}, and FIG. The figure which showed the memory content of the field definition file F3 corresponding to 2 ▼.
FIG. 5A is a diagram conceptually showing the format of a form {circle around (3)}, FIG. 5 (B) shows the storage contents of the basic definition file F2 corresponding to the form {circle around (3)}, and (C) is the form {circle around (7)}. The figure which showed the memory content of the field definition file F3 corresponding to 3 ▼.
6A is a diagram conceptually showing the format of a form {circle around (4)}, FIG. 6 (B) shows the storage contents of the basic definition file F2 corresponding to the form {circle around (4)}, and (C) is the form {circle around (7)}. The figure which showed the memory content of the field definition file F3 corresponding to 4 ▼.
7A shows an example of the contents of the business information file F1 and shows the forms (1), (2), and (3) used in the business (1), and (B) shows the business The composite basic definition file F4, (C) of (1) is a diagram showing a state in which the fields of the form (1), (2), (3) are conceptually superimposed, and (D) is a work The figure which illustrated the contents of synthetic field definition file F5 of 1 ▼.
FIG. 8A shows the contents of the business information file F1 and shows the forms (1) and (4) used in the business (2), and (B) shows the business (2). The composite basic definition file F4, (C) is a diagram showing a state in which the fields of the form (1), (4) are conceptually superimposed, and (D) is the composite field definition file F5 of the business (1). The figure which illustrated the contents of.
FIG. 9 is a diagram showing a data configuration of a recognition data file F7.
FIG. 10 is a flowchart showing the overall operation of form recognition processing.
FIG. 11 is a flowchart for explaining in detail the basic definition synthesis process shown in FIG. 10;
12 is a flowchart for explaining in detail the field definition synthesis process shown in FIG. 10;
13 is a flowchart for explaining the recognition result analysis process shown in FIG. 10 in detail.
FIG. 14 is a flowchart showing form recognition processing according to the second embodiment.
FIG. 15A is a diagram showing the contents of a business information file F1 corresponding to business (1), and FIG. 15 (B) is based on a classification consisting only of a form “1” with “edge mark”. The contents of the combined basic definition file combined are shown, (C) is a diagram showing a state in which the fields of the form combined corresponding to the classification are conceptually superimposed, and (D) is the classification The figure which illustrated the contents of synthetic field definition file F5 synthesized correspondingly.
FIG. 16A shows the contents of a combined basic definition file synthesized based on a classification including forms “2” and “4” of “with edge mark”, and FIG. The figure which showed the state which overlap | superposed the field of each form combined correspondingly conceptually, (C) is the figure which illustrated the content of the synthetic | combination field definition file F5 synthesize | combined corresponding to the said classification | category.
[Explanation of symbols]
1 CPU
2 storage devices
3 recording media
5 Transmission control unit
6 Input section
7 Display section
8 Image scanner
F1 business information file
F2 basic definition file
F3 field definition file
F4 composite basic definition file
F5 composite field definition file
F6 form image file
F7 recognition data file

Claims (2)

予め設定されている複数のフィールドよりなる帳票フォーマットを参照して帳票イメージを文字認識すると共に、各帳票フォーマット毎に文字認識した認識状態に応じて当該帳票イメージの種別を確定する帳票認識装置において、
帳票毎に帳票の各フィールドに対応してそのフィールドの領域座標、文字種からなるフィールド定義情報を帳票フォーマットとして記憶する帳票定義記憶手段と、
帳票グループと当該グループに属する各帳票との対応関係を記憶する帳票グループ記憶手段と、
帳票グループが指定された際に、指定グループに対応付けられている各帳票を前記帳票グループ記憶手段から読み出すと共に、読み出した帳票毎に当該帳票に対応して定義されている前記フィールド定義情報を前記帳票定義記憶手段から読み出す読出手段と、
この読出手段によって読み出された各帳票のフィールド定義情報を各々読み出し、当該フィールド定義情報を順次書込んだ複数のフィールド定義情報を合成フィールド定義情報として記憶した合成フォーマット定義情報を作成する定義合成手段と、
この定義合成手段によって得られた合成フォーマット定義情報の合成フィールド定義情報に基づいて帳票イメージを文字認識する文字認識手段と、
この文字認識手段によって認識された認識結果を各帳票毎のフィールドに分割すると共に、分割した認識結果の最も認識状態が良好なフィールドの帳票を当該帳票イメージの種別として確定する帳票種別確定手段と
を具備し、帳票グループの指定に基づいて当該指定グループ対応の各帳票フォーマットのフィールド定義情報を合成して帳票種別を確定するようにしたことを特徴とする帳票認識装置。
In the form recognition apparatus for recognizing the form image with reference to the form format composed of a plurality of fields set in advance, and determining the type of the form image according to the recognition state of character recognition for each form format,
A form definition storage means for storing field definition information consisting of area coordinates and character types of each field corresponding to each field of the form as a form format;
A form group storage means for storing a correspondence relationship between the form group and each form belonging to the group;
When a form group is designated, each form associated with the designated group is read from the form group storage means, and the field definition information defined corresponding to the form for each read form is A reading means for reading from the form definition storage means;
Definition synthesizing means for reading out the field definition information of each form read by the reading means and creating composite format definition information in which a plurality of field definition information in which the field definition information is sequentially written is stored as synthetic field definition information When,
A character recognition means for recognizing a form image based on the combined field definition information of the combined format definition information obtained by the definition combining means;
The form recognition means for dividing the recognition result recognized by the character recognition means into fields for each form, and for confirming the form in the field with the best recognition state of the divided recognition results as the form image type. A form recognition apparatus characterized in that a form type is determined by synthesizing field definition information of each form format corresponding to the designated group based on the designation of the form group.
予め設定されている複数のフィールドよりなる帳票フォーマットを参照して帳票イメージを文字認識すると共に、各帳票フォーマット毎に文字認識した認識状態に応じて当該帳票イメージの種別を確定する帳票認識装置のコンピュータに、
帳票毎に帳票の各フィールドに対応してそのフィールドの領域座標、文字種からなるフィールド定義情報を帳票フォーマットとして記憶する帳票定義記憶手段、
帳票グループと当該グループに属する各帳票との対応関係を記憶する帳票グループ記憶手段、
帳票グループが指定された際に、指定グループに対応付けられている各帳票を前記帳票グループ記憶手段から読み出すと共に、読み出した帳票毎に当該帳票に対応して定義されている前記フィールド定義情報を前記帳票定義記憶手段から読み出す読出手段、
この読出手段によって読み出された各帳票のフィールド定義情報を各々読み出し、当該フィールド定義情報を順次書込んだ複数のフィールド定義情報を合成フィールド定義情報として記憶した合成フォーマット定義情報を作成する定義合成手段、
この定義合成手段によって得られた合成フォーマット定義情報の合成フィールド定義情報に基づいて帳票イメージを文字認識する文字認識手段、
この文字認識手段によって認識された認識結果を各帳票毎のフィールドに分割すると共に、分割した認識結果の最も認識状態が良好なフィールドの帳票を当該帳票イメージの種別として確定する帳票種別確定手段
として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
A computer of a form recognition apparatus that recognizes characters of a form image by referring to a form format composed of a plurality of fields set in advance and determines the type of the form image according to the recognition state of character recognition for each form format In addition,
A form definition storage means for storing, as a form format, field definition information consisting of field coordinates and character types corresponding to each field of the form for each form ;
Form group storage means for storing the correspondence between the form group and each form belonging to the group;
When a form group is designated, each form associated with the designated group is read from the form group storage means, and the field definition information defined corresponding to the form for each read form is Reading means for reading from the form definition storage means,
Definition synthesizing means for reading out the field definition information of each form read by the reading means and creating composite format definition information in which a plurality of field definition information in which the field definition information is sequentially written is stored as synthetic field definition information ,
Character recognition means for recognizing a form image based on the composite field definition information of the composite format definition information obtained by the definition composition means,
Functions as form type confirmation means that divides the recognition result recognized by the character recognition means into fields for each form, and confirms the form in the field with the best recognition state of the divided recognition results as the form image type. A computer-readable recording medium on which a program for causing the program to be recorded is recorded.
JP2000103009A 2000-04-05 2000-04-05 Form recognition device and recording medium Expired - Fee Related JP4092849B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000103009A JP4092849B2 (en) 2000-04-05 2000-04-05 Form recognition device and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000103009A JP4092849B2 (en) 2000-04-05 2000-04-05 Form recognition device and recording medium

Publications (3)

Publication Number Publication Date
JP2001291055A JP2001291055A (en) 2001-10-19
JP2001291055A5 JP2001291055A5 (en) 2005-02-17
JP4092849B2 true JP4092849B2 (en) 2008-05-28

Family

ID=18616781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000103009A Expired - Fee Related JP4092849B2 (en) 2000-04-05 2000-04-05 Form recognition device and recording medium

Country Status (1)

Country Link
JP (1) JP4092849B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06133019A (en) * 1992-10-15 1994-05-13 Toray Ind Inc Automatic calling equipment

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003244404A (en) * 2002-02-15 2003-08-29 Ricoh Co Ltd Original image processor, original image processing method and storage medium storing program by such method
WO2014061257A1 (en) * 2012-10-15 2014-04-24 パナソニック株式会社 Recognition device, recognition method, remote control device, recognition programme, and server
CN113643260A (en) * 2021-08-13 2021-11-12 北京百度网讯科技有限公司 Method, apparatus, device, medium and product for detecting image quality

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06133019A (en) * 1992-10-15 1994-05-13 Toray Ind Inc Automatic calling equipment

Also Published As

Publication number Publication date
JP2001291055A (en) 2001-10-19

Similar Documents

Publication Publication Date Title
JP4347677B2 (en) Form OCR program, method and apparatus
CN100365563C (en) Printing apparatus, image processing apparatus, and related control method
JP2000115476A (en) System and method for operating area of scanned image
US8078005B2 (en) Method for controlling the combining of original image data and coded image data
JP2010020468A (en) Image processing apparatus, image processing method, its program, and storage medium
US8788936B2 (en) Information processing apparatus and method
US20210227083A1 (en) Image processing system that computerizes document, control method thereof, and storage medium
US6317762B1 (en) Document creating apparatus creates free format document from handwritten data converting into normalized size
US6397233B1 (en) Document processing apparatus and computer program product therefor
JP2006065477A (en) Character recognition device
JP4092849B2 (en) Form recognition device and recording medium
JP2000322417A (en) Device and method for filing image and storage medium
JP7439435B2 (en) Information processing device and program
JP2002024761A (en) Image processing device, image processing method, and storage medium
US20030154462A1 (en) Software maintenance material generation apparatus and generation program therefor
JP2005165978A (en) Business form ocr program, method and device thereof
US7739593B2 (en) Information processing apparatus and method for handling forms
JPH10187751A (en) Recognition data processor and its program recording medium
CN113378610A (en) Information processing apparatus and computer readable medium
JP2001005911A (en) Character input device and display controlling method
JP2006165863A (en) Information processing system
WO2004081809A1 (en) Data processing apparatus, data processing method, data processing program, and recording medium having recorded therein that program
JPH11203282A (en) Data processor, method for processing contents data for data processor and storage medium stored with computer readable program
WO2023047570A1 (en) Information processing device, information processing method, and information processing program
JP2002366880A (en) Device and method for frame editing and storage medium stored with computer-readable program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040315

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040315

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060203

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071011

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071205

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120314

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140314

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees