[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4269059B2 - 帳票処理プログラム、方法及び装置 - Google Patents

帳票処理プログラム、方法及び装置 Download PDF

Info

Publication number
JP4269059B2
JP4269059B2 JP2005500223A JP2005500223A JP4269059B2 JP 4269059 B2 JP4269059 B2 JP 4269059B2 JP 2005500223 A JP2005500223 A JP 2005500223A JP 2005500223 A JP2005500223 A JP 2005500223A JP 4269059 B2 JP4269059 B2 JP 4269059B2
Authority
JP
Japan
Prior art keywords
image
character frame
recognition
character
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2005500223A
Other languages
English (en)
Other versions
JPWO2004107257A1 (ja
Inventor
淳 宮武
康裕 浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Publication of JPWO2004107257A1 publication Critical patent/JPWO2004107257A1/ja
Application granted granted Critical
Publication of JP4269059B2 publication Critical patent/JP4269059B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1429Identifying or ignoring parts by sensing at different wavelengths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、文字が手書きで記入された帳票を光学的に読み取って文字を認識する帳票処理プログラム、方法及び装置に関し、特に、帳票の認識不要な部分の色をドロップアウトして読み取った画像を処理する帳票処理プログラム、方法及び装置に関する。
文字枠に必要事項が記入された帳票をスキャナ(光学的読取装置)により読み取って読取画像の文字を認識する処理にあっては、読取画像における文字認識の精度を高めるため、スキャナで読み取る際に、帳票の記入文字以外の色をドロップアウトさせて認識対象となる記入文字のみの認識画像を取得している。
具体的には、黒を使用する記入文字以外のドロップアウトカラーで文字枠や必要事項が印刷された帳票を準備し、次の手順で帳票の文字認識を行う。
(手順1)認識対象となる記入済みの帳票を黒背景付きとしてスキャナで読み取る。このとき光源の色を帳票のドロップアウトカラーに合わせてフィールド枠等の認識に不要な部分をドロップアウトさせる。
(手順2)文字枠画像と認識対象帳票の黒背景から帳票の端を見つけだすことで、認識対象範囲を定め、その範囲内の文字認識を行う。
しかしながら、帳票上のフィールド枠等をドロップアウトして読み取った認識画像を認識結果と共に画面上に並べて表示させて確認する場合、認識画像は手書きされた文字のみのため、書かれている内容がどの項目のものであるかが分からず、内容を確認し誤りがあれば認識結果を修正する作業が困難となる。
図25は従来の帳票処理の作業画面であり、画面左側にフィールド枠等をドロップアウトして帳票を読み取った手書き文字のみからなる認識画像200を表示し、右側に認識画像200の手書文字の認識により作成された所定の書式フォーマットをもった認識結果202を表示している。しかしながら、手書文字のみからなる認識画像200は、フィールド枠等がドロップアウトしているため、手書きされた内容が認識結果202の項目に対応するかが分りにくく、内容を確認し誤りがある場合、認識結果を修正する作業を困難にしている。
この問題を解決するため、従来の帳票読み取りにあっては、特殊なOCR付スキャナを使用し、帳票の1回の読取操作でドロップアウト画像と非ドロップアウト画像を同時に取り込み、非ドロップアウト画像を認識結果と共に画面表示して確認修正が容易にできるようにしている。

特開平6−68299号公報
しかしながら、このような従来のドロップアウト画像と非ドロップアウト画像を同時に取り込む方法にあっては、特殊なOCR付スキャナを必要とする問題があり、汎用のスキャナが使用できないためにコストアップになるという問題がある。また汎用のスキャナを使用する際には、読取色を替えて同じ帳票を2回読み取る必要があり、スキャナ読取操作に手間と時間がかかる問題がある。
更に、一度読み取ったドロップアウト画像及び非ドロップアウト画像は、認識結果を確認している際に疑問点が出たような場合には、画面上に再現して認識結果に誤りがないか確認する必要があり、このためドロップアウト画像及び非ドロップ画像を保存する必要がある。
しかし、帳票一枚につき2枚分の画像データの保存が必要となり、日常処理として読み取る帳票の数は膨大であるため、全体的にみた画像データの保存量が大幅に増加するという問題がある。特に非ドロップ画像はドロップアウト部分にカラー印刷をしているためにカラー画像となり、ドロップアウト画像がモノクロ画像であるのに比べ、非ドロップアウト画像の保存量は大きく増加する。
本発明は、帳票のドロップアウト部分を予め読み取っておくことで、帳票のドロップアウト画像から記入済み帳票画像を簡単に再現できるようにした帳票処理プログラム、方法及び装置を提供することを目的とする。
本発明は、コンピュータにより実行される帳票処理プログラムを提供する。この帳票処理プログラムは、コンピュータに、
未記入の文字枠を備えた帳票の全ての色をスキャナで読み取って文字枠画像として保存する文字枠画像読取ステップと、
記入済みの帳票の認識不要部分の色をドロップアウトした認識画像をスキャナで読み取って保存する帳票読取ステップと、
認識画像の文字を認識する文字認識ステップと、
文字認識結果と共に、認識画像を文字枠画像に重ね合わせた記入済み帳票画像を表示する合成表示ステップと、
を実行させることを特徴とする。
このような本発明の帳票処理プログラムによれば、記入済みの帳票をドロップアウト読み取りで認識画像を取得して文字認識した場合、予め保存している帳票ドロップアウト部分となる文字枠画像との合成で記入済帳票画像が復元でき、認識画像の文字が帳票のどのフィールドに書かれたものか画面上で対応させることができ、認識結果の確認と修正が簡単且つ確実にできる。
また未記入帳票の非ドロップアウト画像である文字枠画像は、帳票の種類分の画像データを保存するだけで済み、従来のように非ドロップアウト画像として全帳票分のカラー画像データを保存する場合に比べ、画像データの保存量を大幅に低減できる。また帳票読取に使用する光学読取装置としてのスキャナは、読取色を設定可能な汎用のカラースキャナが使用できることから導入が容易でコストダウンになり、更に、記入済帳票の読み取りは1回で良いから作業性が高い。
ここで、合成表示ステップは、認識画像と文字枠画像を重ね合わせるための回転角度θを検出する回転角度検出ステップと、認識画像と文字枠画像の一方を回転角度θだけ回転させた状態で重ね合わせるための平行移動量(x,y)を検出する平行移動量検出ステップと、回転角θと平行移動量(x,y)に基づいて認識画像と文字枠画像との各画素毎に対応関係を求めて画素値を合成する画素合成ステップとを備え、更に、回転角度検出ステップ及び平行移動量検出ステップは、文字枠画像と認識画像で対応している複数のフィールドにおける中心座標位置の関係を利用して回転角度θ及び平行移動量(x,y)を検出することを特徴とする。
具体的に、回転角度検出ステップ及び平行移動量検出ステップは、文字枠画像と認識画像で対応している複数のフィールドにおける中心座標位置の関係を利用して検出した複数の回転角度及び平行移動量のうちの中央値を求める。これによって認識画像と文字枠画像との位置ずれを正確に検出して正しく位置合わせした画像合成ができる。
文字枠画像読取ステップは、種類の異なる複数の帳票から文字枠画像を読み取ると共に、読取画像から認識した種別識別子を付して文字枠画像を保存し、帳票読取ステップは、記入済みの帳票から認識不要部分の色をドロップアウトした認識画像を読み取ると共に、読取画像から認識した種別識別子を付して読取画像を保存し、合成表示ステップは、認識画像の識別子に一致する識別子を持つ文字枠画像を選択して重ね合わせることを特徴とする。このように本発明の帳票処理プログラムは、複数種類の帳票を処理対象とし、種類の異なる手書きによる記入済み帳票が混在した状態で連続的に読み込んでも、種別に対応した文字枠画像との重ね合わせにより記入済み帳票画像を復元できる。
合成表示ステップは、認識結果を修正した後の必要時に、保存されている認識画像を文字枠画像に重ね合わせた記入済み帳票画像を表示する。このように帳票の読取による認識結果の処理後に、認識結果の内容が問題となった場合は、いつでも記入済帳票画像を再現して内容の照合ができる。
合成表示ステップは、認識画像の画素と文字枠画像の画素が重なる場合は、認識画素の画素値を選択する。このように認識画像としての記入文字を優先させる重ね合わせにより、認識対象となる記入内容の確認が行い易い。
合成表示ステップは、認識画像の濃度と文字枠画像の濃度を予め定めた濃度に固定して合成表示させる。また合成表示ステップは、認識画像の濃度と文字枠画像の濃度を変更して合成表示させる。更に合成表示ステップは、認識画像と文字枠画像の濃度比率(コントラスト)が所定値となるよう濃度値を変更して合成表示させる。このように文字枠画像および認識画像における文字の濃度調節や色の変更を行うことで、記入された文字の視認性を向上できる。合成表示ステップは、前記認識画像を文字枠画像に重ね合わせた合成画像を、前記認識結果の表示画面上に並べて表示させる。
本発明は、帳票処理方法を提供する。この帳票処理方法は、
未記入の文字枠を備えた帳票の全ての色を読み取って文字枠画像として保存する文字枠画像読取ステップと、
記入済みの帳票の認識不要部分の色をドロップアウトした認識画像を読み取って保存する帳票読取ステップと、
認識画像の文字を認識する文字認識ステップと、
文字認識結果と共に、認識画像を文字枠画像に重ね合わせた記入済み帳票画像を表示する合成表示ステップと、
を備えたことを特徴とする。
本発明は帳票処理装置を提供する。この帳票処理装置は、未記入の文字枠を備えた帳票の全ての色を読み取って文字枠画像として保存する文字枠画像読取部と、記入済みの帳票の認識不要部分の色をドロップアウトした認識画像を読み取って保存する帳票読取部と、認識画像の文字を認識する文字認識部と、文字認識結果と共に認識画像を文字枠画像に重ね合わせた記入済み帳票画像を表示する合成表示部とを備えたことを特徴とする。
なお、本発明の帳票処理方法及び帳票処理装置の詳細は、帳票処理プログラムと基本的に同じになる。
以上説明してきたように本発明によれば、文字記入済みの帳票に対しドロップアウトスキャンを行って認識画像を取得して認識結果を得た場合、予め非ドロップアウト読み取りにより取得されて保存されている文字枠画像との合成で記入済帳票画像を復元して認識結果に並べて画面上に表示することができ、認識結果が読取帳票のどのフィールドに書かれているかの対応関係を明確に認識でき、帳票読取結果の認識と修正作業を簡単且つ確実に行うことができる。
また記入済み帳票の読み取りの際にドロップアウトされる文字枠画像については、読取対象とする帳票の種類分の文字枠画像を保存するだけでよく、ドロップアウトなしの帳票の読取画像を全て保存する場合に比べ、記入済読取帳票の復元に必要とする画像データの保存量を大幅に低減できる。即ち本発明にあっては、カラー画像データとしての保存を必要とする文字枠画像は帳票の種類分で済むことから、日常的に読み取りを行っている記入済帳票の画像データに比べると、例えば数十種類というようにごく少ないカラー画像データの保存で済む。
また文字枠画像との合成で記入済み帳票の復元に使用するドロップアウト読み取りが得られた認識画像はモノクロ画像で済むことから、帳票の数が多くなっても、保存する認識画像の画像データの保存量はカラー画像データを保存するのに比べ保存容量を大幅に節約できる。
また本発明で使用するスキャナとしては、帳票読み取りと同時に非ドロップアウト読取画像とドロップアウト読取画像が同時に得られるような特殊なスキャナを必要とせず、読取色が設定可能な汎用のカラースキャナを使用することができ、導入が容易でコストダウンが図れ、更に文字の重ね合わせに先立ち種類分の帳票の読み取りで文字枠画像を保存する必要があるが、その後は記入済帳票を1回読み取るだけで、保存している文字枠画像との合成により記入済帳票画像が復元できるため、読取作業の作業効率を高めることができる。
更に、帳票の種類ごとに読み込んで保存している文字枠画像と実際の読取処理で読み込んだ記入済帳票の認識画像との間にずれがあっても、2つの画像につき両方の画像のずれに対応した回転角度及び平行移動量を求めて、位置ずれを正確に検出して正しく位置合わせした画像合成ができ、ドロップアウトした認識画像であっても、実際にスキャナで使用した記入済みの帳票と同等の帳票画像を正確に復元することができる。
図1は、本発明による帳票処理の実施形態を示した機能構成のブロック図である。図1において、本発明の帳票処理装置10はパーソナルコンピュータなどで実現され、帳票の入力デバイスとしてスキャナ(光学的読取装置)11を接続している。また処理結果を表示するためディスプレイユニット40を接続する。更に帳票処理装置10はサーバ12に対しLANなどのネットワークを介してクライアントとして接続されており、サーバ12は帳票処理装置10の処理結果をデータベース15に保存するようにしている。
帳票処理装置10には文字枠画像読取部14、帳票読取部16、文字認識部18、合成表示部20、書式定義ファイル22、文字枠画像ファイル24、認識画像ファイル26、認識結果ファイル28、さらにワークメモリとして機能する画像メモリ38が設けられている。また合成表示部20には回転角度検出部30、平行移動量検出部32、アフィン変換部34及び濃度調整部36が設けられている。
文字枠画像読取部14は、未記入の文字枠による複数フィールドを備えたドロップアウトカラー帳票の全ての色をスキャナ11で読み取って文字枠画像として文字枠画像ファイル24に格納する。またこの実施形態にあっては、文字枠画像の読取結果について、帳票のどの部分を文字認識するかを記述している書式定義情報を作成し、書式定義ファイル22に格納する。
文字枠画像読取部14が処理する未記入のドロップアウトカラー帳票は、通常、複数種類準備されており、各帳票には予め帳票の種別を示す識別子として種別IDが印刷されている。従って文字枠画像ファイル24及び書式定義ファイル22に対する書式定義情報については、それぞれ種別IDをつけて保存している。帳票読取部16は記入済みの帳票の認識不要部分、すなわち文字枠となるフィールドなどの不要部分の色をドロップアウトした認識画像をスキャナ11により読み取って、認識画像を認識画像ファイル26に保存する。
この認識画像ファイル26への保存は、帳票に記入されている種別IDと帳票毎に設定された帳票IDを付して認識画像を保存する。文字認識部18は、帳票読取部16で取得された認識画像の種別IDによって書式定義ファイル22から読み出された書式定義情報で指定される読取対象領域について手書文字を認識し、文字認識結果により所定の書式フォーマットに従ったドキュメントを作成して、認識結果として認識結果ファイル28に保存する。
合成表示部20は、文字認識部18で生成された文字認識結果の修正時等に、種別IDにより文字枠画像ファイル24から対応する文字枠画像を読み出し認識画像と重ねあわせた記入済み帳票画像をディスプレイユニット40に認識画像と並べて表示する。この合成表示部20における認識画像と文字枠画像の重ね合わせ表示のため、2つの画像のずれを検出して修正するため、回転角度検出部30、平行移動量検出部32及びアフィン変換部34が設けられている。
回転角度検出部30は認識画像と文字枠画像を重ね合わせるための回転角度(回転ずれ角度)θを検出する。平行移動量検出部32は例えば文字枠が応に対し認識画像を検出された回転角度θだけ回転させた状態で、両者を重ね合わせるための平行移動量(x,y)を検出する。アフィン変換部34は回転角度θと平行移動量(x,y)に基づいて、認識画像と文字枠画像との各画素ごとに対応関係を求めて画素値を合成する。
さらに合成表示部20には濃度調整部36が設けられ、合成表示された記入済み調整画像において必要に応じて文字枠画像と認識画像の濃度を調整するようにしている。
図1における本発明の帳票処理装置10は、例えば図2のようなコンピュータのハードウェア資源により実現される。図2のコンピュータにおいて、CPU100のバス101にはRAM102、ハードディスクコントローラ(ソフト)104、フロッピィディスクドライバ(ソフト)110、CD−ROMドライバ(ソフト)114、マウスコントローラ118、キーボードコントローラ122、ディスプレイコントローラ126、通信用ボード130、スキャナドライバ136が接続される。
ハードディスクコントローラ104はハードディスクドライブ106を接続し、本発明の帳票処理を実行するプログラムをローディングしており、コンピュータの起動時にハードディスクドライブ106から必要なプログラムを呼び出して、RAM102上に展開し、CPU100により実行する。フロッピィディスクドライバ110にはフロッピィディスクドライブ(ハード)112が接続され、フロッピィディスク(R)に対する読み書きができる。
CD−ROMドライバ114に対しては、CDドライブ(ハード)116が接続され、CDに記憶されたデータやプログラムを読み込むことができる。マウスコントローラ118はマウス120の入力操作をCPU100に伝える。キーボードコントローラ122はキーボード124の入力操作をCPU100に伝える。ディスプレイコントローラ126は表示部128に対して表示を行う。
通信用ボード130はLANなどの通信回線132を使用し、帳票読取により作成されたドキュメントを保存するデータベースサーバを接続し、更に、インターネット等のネットワークを介して外部装置との間で通信を行う。スキャナドライバ136はCPU100によるプログラムの実行で実現されるソフトウェアとして外部接続されたスキャナ11を駆動するものであり、フルカラー対応の非ドロップアウト読取と特定のドロップアウトカラーを指定したドロップアウト読取ができる。
図3は、本発明の読取対象となるドロップアウトカラー用紙を使用した未記入の帳票の説明図である。図3において、帳票42は入力のグレースケールあるいはカラー画像をドロップアウトカラーに指定して印刷されている。以下の実施形態にあっては所定のドロップアウトカラー例えば青を使用して文字枠や必要な項目文字を図示のように示した場合を例にとっている。帳票42は文字枠として使用されるフィールド46を複数配置している。
この例ではひとつのフィールド46に1文字を記入するように帳票42が作成されている。帳票42の左上隅には帳票名が表示され、その後ろに種別ID44を印刷している。この種別ID44として所定の文字列あるいはバーコードなどが使用され、帳票42におけるドロップアウトカラー以外の色、例えばドロップアウトカラーが「青」であった場合には「黒」を使用して種別ID44を印刷している。
図4は、本発明において読取対象とする記入済み帳票45の説明図である。記入済み帳票45のフィールド46には必要に応じて文字が記入されており、文字の記入色はドロップアウトカラーである「青」とは異なる「黒」を使用して記入している。
図5は、文字枠画像読取部14の機能によりドロップアウト読取により取得された文字枠画像48の説明図である。文字枠画像48は図3の未記入の帳票42をスキャナ11にセットして全ての色をスキャンするようにして読み取っている。またドロップアウト読取により得られた文字枠画像48は黒背景付きの画像として読み取られており、文字枠画像48の黒背景から帳票の端を見つけ出すことで文字の認識対象範囲を定める書式定義情報を生成することができる。
すなわち文字枠画像48にあっては画像面の各フィールド46の座標が文字認識対象領域を定める書式定義情報として作成されて、図1の書式定義ファイル22に種別IDを付して保存される。同時に文字枠画像48そのものが種別IDを付して文字枠画像ファイル24に保存される。
図6は、図4の記入済み帳票45のドロップアウト読取により取得された認識画像50の説明図である。すなわち記入済み帳票45を読み取る際に帳票のドロップアウトカラーである例えば「青」にスキャナ11の光源の色をあわせて読み取ることでフィールド46やその項目文字を消し去ったモノクロの認識画像50を取得する。また種別IDについてはドロップアウトカラーを使用していないことから、認識画像50にそのまま読み取ることができる。
このドロップアウト読取により取得された認識画像50も黒を背景とした画像として読み取られ、黒背景から帳票の端を見つけ出すことで種別ID44で特定された書式定義情報に基づき、文字認識のためのフィールドの座標位置を特定することができる。
図7は、本発明により生成される合成画像54の説明図である。すなわち図5の文字枠画像48と図6の認識画像50を対象に両画像のずれをなくすように回転及び平行移動を行って重ね合わせることにより、手書文字が記入された帳票画像を合成画像54として復元することができる。
図8は、図3〜図7の各画像を用いた本発明における文字枠画像と読取画像の画像合成処理の説明図である。図8において、未記入の帳票42はそのままスキャナ11にセットされて、非ドロップアウト読取56により文字枠画像48として読み取られ、その種別IDを付して保存される。一方、記入済み帳票45はスキャナ11にセットされて、ドロップアウト読取58が行われ、フィールドやその項目文字がドロップアウトされた記入文字及び種別IDのみの認識画像50を得る。
そして認識結果の修正などの際に読取元となった記入済み帳票45を復元したい場合には、文字枠画像48と認識画像50の合成60により合成画像54を生成してディスプレイユニット40上に認識結果と並べて表示させる。
図9は、図1の書式定義ファイル22の説明図である。書式定義ファイル22には未記入の帳票の種別ごとに種別IDを付して、書式定義情報を保存している。書式定義情報は帳票のどの部分を文字認識するかを示す情報であり、フィールドIDごとにフィールド座標が格納され、さらに後の説明で明らかにする画像ずれを修正するための回転角度及び平行移動量の検出に使用するフィールド中心座標を保存している。
例えば種別ID「001」の文字枠画像は、フィールドIDに001〜004の4フィールドを備えており、例えばフィールドID=001についてフィールド座標「P11,P12,P13,P14」を格納し、更にフィールド中心座標「P10」を格納している。
図10は、図1の文字枠画像ファイル24の説明図である。文字枠画像ファイル24には、帳票の種別を示す種別IDを付して帳票毎に非ドロップアウトカラー読取により読み取られた文字枠画像イメージデータ、具体的には画像を構成する画素データが所定の画像コード形式にしたがって格納されている。この例では文字枠画像はカラー画像であることから、各画素データは例えばRGB画素データとなる。
図11は、図1の認識画像ファイル26の説明図である。認識画像ファイル26にはスキャナ11により非ドロップアウト読取により読み取られた認識画像イメージデータ、具体的には画像を構成する画素データが所定の画像コード形式にしたがって帳票IDと種別IDを付して保存されている。帳票IDは入力された記入済み帳票1枚ごとに付された固有の識別子であり、種別IDと同様、帳票に予め非ドロップアウトカラーにより印刷しておくか、あるいは帳票を読み取った際に装置側で順番に帳票IDを識別子として付すかのいずれかでよい。また帳票IDと種別IDを付して格納された認識画像イメージデータは認識画像がモノクロ画像であることから、白黒画素データとなっている。
図12は、図1の帳票処理装置10による本発明の帳票処理のフローチャートであり、このフローチャートの処理手順が本発明による帳票処理プログラムの処理内容を表すことになる。この本発明による帳票処理の処理手順は次のようになる。

ステップS1:複数種類の未記入の帳票を文字枠画像として読み取って種別IDを付して保存する文字枠画像読取処理を実行する。尚、この際に文字枠画像の読取対象領域を特定する書式定義情報を生成して、同時に保存する。
ステップS2:記入済みの帳票をドロップアウト読み取りして種別ID及び記入文字のみのモノクロ画像としての認識画像を取得し、帳票ID及び種別IDを付して保存する。
ステップS3:ステップS2で読み取った認識画像に対し、種別IDにより取得した書式定義情報による文字読取フィールドを対象に、文字認識処理を実行して所定のフォーマットを持ったドキュメントに読み取った文字を配置する文字認識処理を実行する。
ステップS4:認識結果の処理要求の有無をチェックし、処理要求があればステップS5に進み、処理要求がなければステップS7に進む。
ステップS5:処理要求の対象となった帳票の種別IDにより文字枠画像を読み出し、現在処理をしている認識画像と合成して重ね合わせる合成表示処理を実行する。
ステップS6:合成表示処理により得られた合成画像を認識結果と並べて表示させて認識結果の確認処理を行わせる。
ステップS7:記入済みの帳票読取による一連の処理の終了によるログオフを判別すると処理を終了し、処理未終了であればステップS2からの処理を繰り返す。
図13は、図12における文字枠画像読取処理のフローチャートである。この文字枠画
像読取処理の手順は次のようになる。

ステップS1:スキャナ11に対しフルカラー設定で未記入の帳票を読み取る。
ステップS2:読取画像から種別IDを認識する。
ステップS3:読取画像から文字枠の位置を示す書式定義情報を生成する。
ステップS4:書式定義情報に種別IDを付して書式定義ファイル22に保存する。
ステップS5:文字枠画像に種別IDを付して文字枠画像ファイル24に保存する。
ステップS6:全種類の帳票を処理したか否かチェックし、未処理であればステップS1に戻り、全種類の帳票が処理済みであれば処理を終了する。

図14は、図12における帳票読取処理のフローチャートであり、次の処理手順となる。

ステップS1:スキャナ11の光源の色を帳票のドロップアウトカラーに設定して記入済みの帳票を読み取る。
ステップS2:読取画像から種別IDを認識する。
ステップS3:認識画像に種別IDと帳票IDを付して認識画像ファイル26に保存する。
ステップS4:未処理帳票の有無をチェックし、未処理帳票があればステップS1に戻り、無ければ処理を終了する。
図15は、図12における文字認識処理のフローチャートであり、次の処理手順となる。

ステップS1:スキャナ11から読み取った認識画像を文字認識処理対象として取り込む。
ステップS2:種別IDにより書式定義ファイル22を参照して書式定義情報を取り込む。
ステップS3:書式定義情報から認識画像における認識対象のフィールドを設定する。
ステップS4:設定フィールドの文字列を認識する。
ステップS5:認識した文字列を予め用意された作成ドキュメントの指定位置に配置する。
ステップS6:帳票の全フィールドを認識したか否かチェックし、認識していなければステップS4に戻り、認識していればステップS7に進む。
ステップS7:未処理の認識画像の有無をチェックし、未処理認識画像があればステップS1に戻り、無ければ処理を終了する。
図16は、図12における画像合成処理のフローチャートであり、次の処理手順となる。

ステップS1:確認対象となる作成ドキュメントを読み込んで画面表示する。
ステップS2:帳票IDに対応する認識画像を認識画像ファイルから読み込む。
ステップS3:種別IDに対応する文字枠画像を文字枠画像ファイル24から読み込む。
ステップS4:文字枠画像と認識画像の回転角のずれを検出する回転角度検出処理を実行する。
ステップS5:ステップS4で検出した回転角度θによる回転ずれを修正した状態で文字枠画像と認識画像のX軸及びY軸方向のずれを示す平行移動量(x,y)を検出する平行移動量検出処理を実行する。
ステップS6:検出された回転角度θと平行移動量(x,y)に基づいて文字枠画像と認識画像と各画素ごとに対応関係を求めるアフィン変換処理を実行する。
ステップS7:文字枠画像と認識画像の各対応する画素を重ね合せる画像重ね合せ処理を実行する。

ここで、文字枠画像と認識画像を重ね合せる際の両画像のずれを修正するためのステップS4の回転角度検出処理とステップS5の平行移動量検出処理の詳細を説明する。図17は、文字枠画像と認識画像の回転角度のずれを検出したときの説明図である。
図17(A)は文字枠画像62であり、この例では4つのフィールド64−1,64−2,64−3,64−4が配置されており、各フィールドの中心座標はその書式定義情報から中心点O,P,Q,Rの座標が与えられている。この文字枠画像62における基準角度θ1として、例えばフィールド64−1の中心点Oと対角位置にあるフィールド64−3の中心点Qを結ぶ直線66とフィールド64−1の中心点Oを通る垂直基準線68との角度として求める。
同様に図17(B)の認識画像72についても、基準角度θ1’としてフィールド74−1の中心点oと対角位置にあるフィールド74−3の中心点qを結ぶ直線76のフィールド74−1の中心点oを通る垂直基準線78に対する角度として検出する。このような文字枠画像62及び認識画像72に対する基準角度θ1,θ1’としては読取対象とする帳票に歪みや伸縮があることを考慮し、文字枠画像62及び認識画像72につき複数の基準角度θm,θm’を求め、それぞれの差(θ'm−θm)の差の必要値をとって回転角度θを表現すると次のようになる。
Figure 0004269059
ここで文字枠画像62及び認識画像72について求める複数の基準角度について説明する。例えば図17(A)の文字枠画像62にあっては基準角度θ1としてフィールド64−1とフィールド64−3を結ぶ直線66の垂直基準線68に対する角度を求めているが、これに加えフィールド64−1とフィールド64−2の中心点O,Pを結ぶ直線の垂直基準線68に対する角度をθ2として求め、更にフィールド64−1とフィールド64−4の中心点O,Rを結ぶ直線の垂直基準線68に対する角度を基準角度θ3として求める。
また図17(B)の認識画像72についても同様にフィールド74−1とフィールド74−3の中心点o,qを結ぶ直線76の垂直基準線78に対する角度として求めた基準角度θ1’に加え、フィールド74−1とフィールド74−2の中心点o,pを結ぶ垂直基準線78に対する角度をθ2’として求め、フィールド74−1とフィールド74−4の中心点o,rを結ぶ直線の垂直基準線78に対する角度を基準角度θ3’として検出する。
そして、このような文字枠画像62及び認識画像72における3つの基準角度について次のようにして差を求める。
X1=(θ1’−θ1)
X2=(θ2’−θ2)
X3=(θ3’−θ3)
としてそして、3つの角度差の中央値を回転角度θとする。勿論、各画像毎に求める基準角度の数は、3つ以上であれば適宜の数として良い。
図18は、図17で検出した回転角度θのずれを補正した後に行う文字枠画像と認識画像の平行移動量のずれを検出処理の説明図である。図18において、例えば認識画像72を固定した状態で文字枠画像62を図17の処理で求めた回転角度θ分だけフィールド64−1の中心点Oを中心に回転させると、例えばフィールド64−4はフィールド64−4’に移動する。
そこで認識画像72のフィールド74−4の中心点rに対応する回転後の文字枠画像62におけるフィールド64−4’の中心R’とを結ぶベクトル80につきX軸方向及びY軸方向の移動距離X=(x,y)を求める。この場合についても基準角度の場合と同様に複数のフィールドについて認識画像72と回転後の文字枠画像62との間の距離を求め、その中央値を平行移動量とする。ここで認識画像72と文字枠画像62の複数フィールドについて求めた距離をbm(但し、mは1〜n)とすると<平行移動量Xmは次式で与えられる。
Figure 0004269059
このようにして文字枠画像62と認識画像72におけるずれを補正するための回転角度θ及び平行移動量X=(x,y)が検出されたならば、図16のステップS6のアフィン変換処理を行って認識画像72の任意の画素に対応する文字枠画像62の画素を求める。
この文字枠画像62の各画素について各アフィン変換を用いて認識画像72のどの画素が対応するかは次式で与えられる。
Figure 0004269059
なお、図18の平行移動量の検出にあっては、文字枠画像62を、図17で検出した回転角度θ分だけ回転させているが、逆に文字枠画像62を固定して認識画像72側を、検出した回転角θだけ回転した後に、平行移動量を検出するようにしてもよい。
図19は、図16のステップS7における画像重ね合わせ処理の詳細を示したフローチャートであり、次の処理手順からなる。

ステップS1:回転角度θと平行移動量(x,y)の検出に基づき、アフィン変換により、各画素の対応関係が取られた認識画像と文字枠画像を読み込む。
ステップS2:認識画像と文字枠画像の濃度を予め定めたデフォルトの濃度に変更する。
ステップS3:認識画像の画素を1つ抽出する。
ステップS4:認識画像の画素は黒か否かチェックし、黒であればステップS5に進み、そうでなければステップS6に進む。
ステップS5:認識画像の画素が黒の場合、認識画像の画素を合成画像の画素に配置する。
ステップS6:認識画像の画素が黒でない場合、文字枠画像の画素を合成画像の画素に配置する。
ステップS7:全画素を処理したか否かチェックし、未処理であればステップS3に戻り、処理が済めばステップS8に進む。
ステップS8:濃度変更要求の有無をチェックし、変更要求があればステップS9に進み、なければ処理を終了する。
ステップS9:文字枠画像と認識画像を、指定された濃度に変更して表示する。

このような図19の画像重ね合わせ処理にあっては、文字枠画像と認識画像の色を重ねて1つの画像として出力させる場合、単純に両者の画像の色を1対1の割合で重ねると、記入された文字が薄くなり、視認性が低下する。例えば文字枠画像が白で認識画像が黒の場合、1対1の割合で両者を重ねると合成画像の色は灰色となり、視認性が低下する。そこで本発明にあっては、認識画像の文字の記入部分については認識画像の文字の色をそのまま使い、文字の記入のない部分については文字枠画像の色を使うようにしている。
これにより、認識画像に存在する記入文字の部分の視認性を向上することができる。また重ね合わせ後の画像で、より重要な部分は記入された文字などであることから、記入された文字などを際立たせるため、背景となる文字枠部分を薄める必要がある。一方、背景が見づらいような場合には逆に文字を薄くし背景を濃くするような方法が必要である。
本発明にあっては、図19のステップS2に示すように、基本的には認識画像と文字枠画像の濃度を所定のデフォルト濃度として画像の重ね合わせを行い、重ね合わせ後に画面上で見て、例えば記入された文字が見づらい場合には認識画像を濃くし文字枠画像を薄くし、一方、背景が見づらいような場合には文字を薄くして背景を濃くするといった処理を、オペレータからの指示によりできるようにしており、これが図19のステップS8の濃度変更要求に対応するステップS9の濃度変更処理となる。ここで、図19の画像重ね合わせの際に合成画像として出力される色Coutは次式で定義することができる。
Figure 0004269059
即ち(4)式につき、パラメータとして混合比率αや調整比率βを変更することで、文字枠画像と認識画像の濃度を変更することができる。本発明にあっては、文字が記入された認識画像については、認識画像の濃度を読取画像の濃度に固定し背景となる文字枠画像濃度を必要に応じて変更させるが、基本的には次の設定方法を採用している。
(1)文字枠画像濃度のデフォルト値をそのまま利用する。
(2)重ね合わせ表示後に文字枠画像濃度の濃度値を変えて再表示させる。
(3)文字枠画像濃度に応じて認識画像とのコントラストが所定値となるように、重ね合 わせの文字枠画像濃度を自動的に設定する。
このような文字枠画像濃度の設定方法のうち、文字枠画像濃度と認識画像濃度とのコントラストを所定値になるように文字枠画像濃度を自動設定する方法が、帳票の濃度が特に濃い場合や薄い場合に非常に有効であり、ユーザによる濃度指定が不要となる点で利便性が高い。
図20は、図19の画像重ね合わせ処理において文字枠画像の濃度を変えた場合の画像説明図である。図20(A)は、記入文字となる認識画像と背景となる文字枠画像の濃度を変更せずに読み取りによるデフォルト値のまま重ね合わせた画像である。これに対し図20(B)は、文字枠画像の濃度を薄めて重ね合わせた画像であり、これによって認識画像上の記入文字の視認性が向上していることが分かる。
図21は、図19の画像重ね合わせ処理における文字枠画像のパレットカラーテーブルに黒を割り当てる処理の説明図である。図19の画像重ね合わせ処理にあっては、モノクロ画像である認識画像とパレットカラーテーブルで実現されるカラー画像となる文字枠画像を重ねて合成画像を出力している。この場合、合成画像のカラーは文字枠画像のパレットカラーテーブルを依存することになるが、このパレットカラーテーブルには黒が存在していないことが多い。したがって、合成画像における認識画像の部分となる記入文字の黒を表現するため、文字枠画像のパレットカラーテーブルに黒を割り当てなければならない。
このように黒が存在しないパレットカラーテーブルに対する黒の割当は、パレットカラーテーブルの中から最も似ている2つの色の組合わせ、例えば図21(A)のパレットカラーテーブル84におけるコード番号211のカラーデータAとコード番号212のカラーデータA’を見つけ出し、図21(B)のように一方のコード番号212につき、そのカラーデータを黒に置き換える。このようにコード番号212のカラーデータA’が黒に置き換えられると、文字枠画像におけるコード番号212につき正しいカラーデータA’による色が表現できないことから、図21(C)のように文字枠画像のカラーデータについてコード変換を行う。
図21(C)のコード変換部90は、文字枠画像データの画素データにおける入力コード88につき、コード番号「212」をコード番号「211」に変換して出力コード92として出力する。即ち、図21(B)のようにコード番号212を黒に置き換えたことにより、元のコード番号212のカラーデータA’についてはコード変換部90により最も近い色であるコード番号211のカラーデータAに変換して出力する。これによって、文字枠画像のパレットカラーテーブルの特定の色に黒に割り当てても、その割当てにより失われた色は最も近い色に変換されることとなり、文字枠画像における色の変化を最小限に抑えることができる。また合成画像にあっては、黒以外にも白を必要とするケースも存在する。
同様に、白についても文字枠画像のパレットカラーテーブルには存在しないことが多いため、黒の場合と同様、黒を割り当てたカラーデータA,A’以外に、次に最も近い色のカラーデータB,B’を見つけ、一方のカラーデータB’に白を割り当て、カラーデータB’については、そのコード番号をコード変換部90により、近い色のカラーデータBとなるようにコード変換することで対応する。
図22は、図1のデータベース15から帳票画像を復元する帳票確認処理のフローチャートである。即ち、スキャナ11で記入済みの帳票を読み取って、文字枠画像との合成画像の表示で認識結果を確認し、必要な修正などが済むと、認識結果として作成されたドキュメントはサーバ12に転送され、データベース15に保存されている。このように、データベース15に保存されている認識結果としての作成済ドキュメントについて、後の処理として帳票認識結果を確認している途中で内容的におかしな個所を発見した場合に、元となった帳票画像を復元し、認識結果に誤りがないか否かを確認する認識結果確認処理を行うことになる。
このような認識結果確認処理として図22の処理手順は次のようになる。

ステップS1:データベース15から帳票認識結果を取得して画面表示する。
ステップS2:帳票復元要求の有無をチェックしており、帳票復元要求があればステップS3に進み、なければステップS4に進む。
ステップS3:帳票復元要求に基づき、データベース15から種別IDによって文字枠画像を取得すると共に、帳票IDにより認識画像を取得し、図19の画像重ね合わせ処理の手順に従って2つの画像を合成して表示する。但し、この場合にはデータベースに画像ずれを修正するための回転角度θ及び平行移動量(x,y)が保存されていることから、図17のような回転角度の検出や図18の平行移動量の検出は不要となる。
ステップS4:ログオフの指示があれば処理を終了し、なければステップS1に戻る。

図23は、記入済帳票の読み取りによる認識結果として得られた作成ドキュメントに並べて本発明による合成画像を表示した確認修正のための作業画面の説明図である。図23において、作業画面94の右側に作成ドキュメント98が表示されており、左側に文字枠画像と認識画像の重ね合わせで得られた合成帳票画像96が表示されている。このためオペレータは、作業画面94を見て、作成ドキュメント98の中の文字認識結果として配置された認識結果を左側の合成帳票画像96の記入内容と対比し、正しい認識結果が得られているかどうかをチェックすることができる。
図24は図23の作業画面94における左側の合成帳票画像を拡大表示させた場合であり、この拡大表示により帳票記入内容の認識が、より明確にできる。
なお本発明の処理対象となる帳票は、文字記入枠としてのフィールドを指定した帳票であれば、そのサイズ、書式などにより限定されず、適宜の帳票処理にそのまま適用することができる。また本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の実施形態に示した数値による限定は受けない。
本発明の実施形態を示した機能構成のブロック図 本発明が適用されるコンピュータのハードウェア環境の説明図 ドロップアウトカラー用紙を使用した帳票の説明図 読取対象とする記入済帳票の説明図 非ドロップアウト読み取りにより取得された文字枠画像の説明図 ドロップアウト読み取りにより取得された認識画像の説明図 本発明により生成される合成画像の説明図 文字枠画像と読取画像を用いた本発明における画像合成処理の説明図 文字枠画像と読取画像を用いた本発明における画像合成処理の説明図 図1の文字枠画像ファイルの説明図 図1の認識画像ファイルの説明図 本発明による帳票処理のフローチャート 図12における文字枠画像読取処理のフローチャート 図12における帳票読取処理のフローチャート 図12における文字認識処理のフローチャート 図12における画像合成処理のフローチャート 文字枠画像と認識画像の回転角度のずれを検出する処理の説明図 回転角度のずれを補正した後に行う文字枠画像と認識画像の平行移動量のずれを検出する処理の説明図; 図16における画像重ね合わせ処理のフローチャート 文字枠画像の濃度を変えた場合の画像説明図 パレットカラーテーブルに黒を割り当てる処理の説明図 データベースから帳票画像を復元する帳票確認処理のフローチャー 図23は認識結果に並べて本発明による合成画像を並べて表示する確認修正のための作業画面の説明図 図23の合成画像側を拡大表示した作業画面の説明図 従来の認識画像と認識結果を並べて表示した作業画面の説明図
符号の説明
10:帳票処理装置
11:スキャナ(光学的読取装置)
12:サーバ
14:文字枠画像読取部
15:データベース
16:帳票読取部
18:文字認識部
20:合成表示部
22:書式定義ファイル
24:文字枠画像ファイル
26:認識画像ファイル
30:回転角度検出部
32:平行移動量検出部
34:アフィン変換部
36:濃度調整部
38:画像メモリ
40:ディスプレイユニット
42:帳票
44:種別ID
45:記入済み帳票
46:フィールド
48:文字枠画像
50:認識画像
50:認識画像
54:合成画像
56:非ドロップアウト読取
58:ドロップアウト読取
72:認識画像
94:作業画面
96:合成帳票画像
98:作成ドキュメント

Claims (9)

  1. コンピュータに、
    未記入の文字枠を備えた帳票の全ての色を読み取って文字枠画像として保存する文字枠画像読取ステップと、
    記入済みの帳票の認識不要部分の色をドロップアウトした認識画像を読み取って保存する帳票読取ステップと、
    前記認識画像の文字を認識する文字認識ステップと、
    前記文字認識結果と共に、前記認識画像を文字枠画像に重ね合わせた記入済み帳票画像を表示する合成表示ステップと、
    を実行させることを特徴とする帳票処理プログラムにおいて、
    前記文字枠画像読取ステップは、種類の異なる複数の帳票から文字枠画像を読み取り、
    文字枠読取画像から文字枠の位置を示す書式定義情報を生成して該書式定義情報を書式定義ファイルに保存すると共に、前記文字枠読取画像から認識した種別識別子を付して前記文字枠読取画像を保存し、
    前記帳票読取ステップは、記入済みの帳票から認識不要部分の色をドロップアウトして得られた記入文字からなる認識画像を前記書式定義情報に基づいて読み取ると共に、帳票読取画像から認識した種別識別子を付して前記帳票読取画像を保存し、
    前記合成表示ステップは、前記認識画像の識別子に一致する識別子を持つ文字枠画像を選択して重ね合わせることを特徴とする帳票処理プログラム。
  2. 請求の範囲1の帳票処理プログラムに於いて、前記合成表示ステップは、認識結果を保存した後の必要時に、保存されている前記認識画像を文字枠画像に重ね合わせた記入済み帳票画像を表示することを特徴とする帳票処理プログラム。
  3. 請求の範囲1の帳票処理プログラムに於いて、前記合成表示ステップは、認識画像の画素と文字枠画像の画素が重なる場合は、認識画素の画素値を選択することを特徴とする帳票処理プログラム。
  4. 請求の範囲1の帳票処理プログラムに於いて、前記合成表示ステップは、認識画像の濃度と文字枠画像の濃度を予め定めた濃度に固定して合成表示させることを特徴とする帳票処理プログラム。
  5. 請求の範囲1の帳票処理プログラムに於いて、前記合成表示ステップは、認識画像の濃度と文字枠画像の濃度を変更して合成表示させることを特徴とする帳票処理プログラム。
  6. 請求の範囲1の帳票処理プログラムに於いて、前記合成表示ステップは、認識画像と文字枠画像の濃度比率が所定値となるよう濃度値を変更して合成表示させることを特徴とする帳票処理プログラム。
  7. 請求の範囲1の帳票処理プログラムに於いて、前記合成表示ステップは、前記認識画像を文字枠画像に重ね合わせた合成画像を、前記認識結果の表示画面上に並べて表示させることを特徴とする帳票処理プログラム。
  8. 未記入の文字枠を備えた帳票の全ての色を読み取って文字枠画像として保存する文字枠画像読取ステップと、
    記入済みの帳票の認識不要部分の色をドロップアウトした認識画像を読み取って保存する帳票読取ステップと、
    前記認識画像の文字を認識する文字認識ステップと、
    前記文字認識結果と共に、前記認識画像を文字枠画像に重ね合わせた記入済み帳票画像を表示する合成表示ステップと、
    を実行させることを特徴とする帳票処理方法において、
    前記文字枠画像読取ステップは、種類の異なる複数の帳票から文字枠画像を読み取り、
    文字枠読取画像から文字枠の位置を示す書式定義情報を生成して該書式定義情報を書式定義ファイルに保存すると共に、前記文字枠読取画像から認識した種別識別子を付して前記文字枠読取画像を保存し、
    前記帳票読取ステップは、記入済みの帳票から認識不要部分の色をドロップアウトして 得られた記入文字からなる認識画像を前記書式定義情報に基づいて読み取ると共に、帳票読取画像から認識した種別識別子を付して前記帳票読取画像を保存し、
    前記合成表示ステップは、前記認識画像の識別子に一致する識別子を持つ文字枠画像を選択して重ね合わせることを特徴とする帳票処理方法。
  9. 未記入の文字枠を備えた帳票の全ての色を読み取って文字枠画像として保存する文字枠画像読取部と、
    記入済みの帳票の認識不要部分の色をドロップアウトした認識画像を読み取って保存する帳票読取部と、
    前記認識画像の文字を認識する文字認識部と、
    前記文字認識結果と共に、前記認識画像を文字枠画像に重ね合わせた記入済み帳票画像を表示する合成表示部と、
    を備えたことを特徴とする帳票処理装置において、
    前記文字枠画像読取部は、種類の異なる複数の帳票から文字枠画像を読み取り、文字枠読取画像から文字枠の位置を示す書式定義情報を生成して該書式定義情報を書式定義ファイルに保存すると共に、前記文字枠読取画像から認識した種別識別子を付して前記文字枠読取画像を保存し、
    前記帳票読取部は、記入済みの帳票から認識不要部分の色をドロップアウトして得られた記入文字からなる認識画像を前記書式定義情報に基づいて読み取ると共に、帳票読取画像から認識した種別識別子を付して前記帳票読取画像を保存し、
    前記合成表示部は、前記認識画像の識別子に一致する識別子を持つ文字枠画像を選択して重ね合わせることを特徴とする帳票処理装置
JP2005500223A 2003-05-30 2003-05-30 帳票処理プログラム、方法及び装置 Expired - Lifetime JP4269059B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2003/006828 WO2004107257A1 (ja) 2003-05-30 2003-05-30 帳票処理プログラム、方法及び装置

Publications (2)

Publication Number Publication Date
JPWO2004107257A1 JPWO2004107257A1 (ja) 2006-07-20
JP4269059B2 true JP4269059B2 (ja) 2009-05-27

Family

ID=33485795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005500223A Expired - Lifetime JP4269059B2 (ja) 2003-05-30 2003-05-30 帳票処理プログラム、方法及び装置

Country Status (3)

Country Link
US (1) US7551778B2 (ja)
JP (1) JP4269059B2 (ja)
WO (1) WO2004107257A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4133370B2 (ja) * 2003-01-28 2008-08-13 富士フイルム株式会社 電子ペーパ読取装置
JP4881722B2 (ja) * 2006-12-28 2012-02-22 日立コンピュータ機器株式会社 帳票識別装置、及び帳票識別プログラム
JP5303865B2 (ja) * 2007-05-23 2013-10-02 株式会社リコー 情報処理装置、及び、情報処理方法
JP4445982B2 (ja) * 2007-06-29 2010-04-07 ホシデン株式会社 コネクタ
JP5054472B2 (ja) * 2007-09-11 2012-10-24 日立コンピュータ機器株式会社 文字認識装置及び文字認識装置における文字認識方法
US8108764B2 (en) * 2007-10-03 2012-01-31 Esker, Inc. Document recognition using static and variable strings to create a document signature
JP2009278373A (ja) * 2008-05-14 2009-11-26 Sharp Corp 画像処理装置、画像形成装置及びコンピュータプログラム
GR1006531B (el) * 2008-08-04 2009-09-10 Διαμορφωση εντυπου πολλαπλων επιλογων αναγνωσιμου με ηλεκτρονικο μεσο και συστημα και μεθοδος για την ερμηνεια κατ' ελαχιστον μιας επιλογης του χρηστη
CN102375978A (zh) * 2010-08-17 2012-03-14 富士通株式会社 处理图像的方法和设备
EP3058515B1 (en) * 2013-10-16 2024-01-31 3M Innovative Properties Company Editing digital notes representing physical notes
JP6365845B2 (ja) * 2015-08-31 2018-08-01 京セラドキュメントソリューションズ株式会社 画像形成システムおよび印刷位置ずれ補正方法
US10270934B2 (en) * 2016-12-01 2019-04-23 Kyocera Document Solutions Inc. Image processing apparatus and image forming apparatus
US20190096040A1 (en) * 2017-09-25 2019-03-28 Kabushiki Kaisha Toshiba Image processing apparatus, image processing method and non-transitory readable storage medium
US11080545B2 (en) * 2019-04-25 2021-08-03 International Business Machines Corporation Optical character recognition support system
FR3096492B1 (fr) * 2019-05-23 2021-08-06 Fidme Procédé et système d’analyse ou d’impression d’un document à partir d’au moins une représentation numérisée du document
US11526571B2 (en) * 2019-09-12 2022-12-13 International Business Machines Corporation Requesting an IP address using a non-textual based graphical resource identifier
JP7533151B2 (ja) 2020-11-17 2024-08-14 株式会社リコー 画像形成装置、画像形成方法及びプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63217489A (ja) * 1987-03-06 1988-09-09 Mitsubishi Electric Corp 文書読取装置
JPS63308689A (ja) * 1987-06-10 1988-12-16 Fujitsu Ltd 文字の傾き角度検出修正方式
US5140650A (en) * 1989-02-02 1992-08-18 International Business Machines Corporation Computer-implemented method for automatic extraction of data from printed forms
JPH02268385A (ja) * 1989-04-11 1990-11-02 Toshiba Corp 光学的文字読取装置
US5159667A (en) * 1989-05-31 1992-10-27 Borrey Roland G Document identification by characteristics matching
JPH04343190A (ja) * 1991-05-21 1992-11-30 Hitachi Ltd 文字データ入力方式
JPH0668299A (ja) * 1992-08-19 1994-03-11 Hitachi Ltd 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置
EP0585944B1 (en) * 1992-09-04 2002-12-11 Canon Kabushiki Kaisha Method and apparatus for displaying characters
JP2979109B2 (ja) * 1992-12-03 1999-11-15 日本アイ・ビー・エム 株式会社 認識文字の情報作成方法及び装置
JPH06243290A (ja) * 1993-02-10 1994-09-02 Oki Electric Ind Co Ltd 光学式文字読取装置
DE69432114T2 (de) * 1993-11-24 2003-10-30 Canon K.K., Tokio/Tokyo System zum Identifizieren und Verarbeiten von Formularen
JP3547025B2 (ja) * 1994-08-23 2004-07-28 株式会社リコー 情報抽出方法
US6694065B2 (en) * 2000-03-10 2004-02-17 Fujitsu Limited Image collating apparatus and image collating method
JP2001256433A (ja) * 2000-03-10 2001-09-21 Mitsubishi Electric Corp Ocr認識結果修正方法
US6950553B1 (en) * 2000-03-23 2005-09-27 Cardiff Software, Inc. Method and system for searching form features for form identification
JP4337251B2 (ja) * 2000-09-04 2009-09-30 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
US6757426B2 (en) * 2001-03-21 2004-06-29 Eastman Kodak Company System and method for image processing by automatic color dropout

Also Published As

Publication number Publication date
US7551778B2 (en) 2009-06-23
US20060039606A1 (en) 2006-02-23
JPWO2004107257A1 (ja) 2006-07-20
WO2004107257A1 (ja) 2004-12-09

Similar Documents

Publication Publication Date Title
JP4269059B2 (ja) 帳票処理プログラム、方法及び装置
US6774889B1 (en) System and method for transforming an ordinary computer monitor screen into a touch screen
US6535650B1 (en) Creating high resolution images
US6714689B1 (en) Image synthesizing method
JP2002305647A (ja) 画像結合装置
US8526731B2 (en) Hough transform method for linear ribbon and circular ring detection in the gradient domain
JP5387193B2 (ja) 画像処理システム、画像処理装置およびプログラム
JP4539756B2 (ja) 画像処理装置及び画像処理プログラム
AU2008209632B2 (en) A method for aligning a modified document and an original document for comparison and difference highlighting
KR101827221B1 (ko) 좌표계 자동 보정이 가능한 혼합현실 콘텐츠 제공 장치 및 이를 이용한 좌표계 자동 보정 방법
US7738703B2 (en) Image processing apparatus, image processing method and computer readable medium storing image processing program
JP5618719B2 (ja) 画像処理装置、その方法およびプログラム
KR20040021555A (ko) 장표 처리 장치 및 장표 처리 방법
JP7206740B2 (ja) 情報処理装置及びプログラム
JP2984267B1 (ja) 対象物の画像処理方法
JP3532483B2 (ja) データエントリーシステム
JP3299066B2 (ja) パターン検査装置及び方法
JP2686479B2 (ja) 図形識別符号入力装置
JP2021034772A (ja) 画像処理装置、画像処理方法、画像処理装置用プログラム、および、書類管理システム
CN111681161B (zh) 折叠二维码图像的还原方法、设备及计算机可读存储介质
US20210390325A1 (en) System for determining alignment of a user-marked document and method thereof
JPH0363882A (ja) 画像処理装置
JP2007140703A (ja) 保険証読取方法、そのシステム及び保険証認識装置
JPH11339041A (ja) カラー画像処理方法及び装置並びに記録媒体
JP4550767B2 (ja) 画像検出方法および画像検出装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20090120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090129

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4269059

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150306

Year of fee payment: 6

EXPY Cancellation because of completion of term