JP3742358B2 - Optical character recognition apparatus and program - Google Patents
Optical character recognition apparatus and program Download PDFInfo
- Publication number
- JP3742358B2 JP3742358B2 JP2002092775A JP2002092775A JP3742358B2 JP 3742358 B2 JP3742358 B2 JP 3742358B2 JP 2002092775 A JP2002092775 A JP 2002092775A JP 2002092775 A JP2002092775 A JP 2002092775A JP 3742358 B2 JP3742358 B2 JP 3742358B2
- Authority
- JP
- Japan
- Prior art keywords
- plane
- image
- reading
- color
- full
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、フルカラーイメージの帳票読取定義体を用いて文字認識処理を行う光学的文字認識装置に関する。
【0002】
また、本発明は、フルカラーイメージの帳票読取定義体を作成する帳票定義ツール用プログラムに関する。
【0004】
【従来の技術】
帳票読取定義体を用いて文字認識処理を行うOCR(Optical Character Recognition)システムに於いて、従来では、帳票を単位に、ドロップアウトカラーを決めて認識処理をおこなっていた。即ち、従来、OCR帳票の設計に於いては、赤系、緑系、青系等の単色のドロップアウトカラーを用いて帳票を作成し、その帳票をスキャナで読取ったイメージ画像からドロップアウトカラー以外の色のイメージ画像を対象に文字認識を行っていた。
【0005】
近年、この種、帳票OCRシステムに於いて、スキャナ、文字認識用パーソナルコンピュータ等の高速化、および記憶装置の低廉化等に伴い、ある行は青色、ある行はオレンジ色のように、1行または複数行単位で色を変えて作成された帳票を対象とした文字認識が行われるようになってきた。
【0006】
被読取帳票のフルカラーイメージを用いて文字認識を行うことで、フィールド単位にドロップアウトカラーを設定できるようになり、これによって帳票設計の自由度が著しく向上する。
【0007】
しかしながら、被読取帳票のフルカラーイメージの文字認識は、帳票読取定義体のフィールド定義の際に、フィールド認識時に必要なドロップアウトカラーを指定し、読取時にそのドロップアウトカラーに対応するプレーンをフルカラーイメージから選択することにより行われていた。ここで、例えば、赤ドロップアウト、緑ドロップアウト、青ドロップアウトは、それぞれフルカラーイメージの赤プレーン、緑プレーン、青プレーンに対応する。
【0008】
この種、フルカラーイメージの帳票読取機構に於いて、各読取フィールドに於ける画面の表示機能、出力イメージの記憶機能等を実現する際、その画面、出力イメージ等をフルカラーイメージのまま扱うと、画像データが非常に大きいため処理速度が遅くなたり、メモリ容量の制限等から、実用上の問題が生じることがあった。また、読取時のプレーンを使用して二値化したイメージを画面用イメージなどに使用した場合は、フィールドの枠、文言等がドロップアウトしてしまい、全体のイメージを正しく把握できないという問題が生じていた。
【0009】
そこで、フルカラーイメージの画面の表示イメージ、出力イメージ等をそれぞれ処理速度、記憶容量等に影響を及ぼさない程度に最適化する手段が必要になるが、従来では操作性並びに経済性を満足する簡易で有効な最適化手段が存在しなかった。
【0010】
【発明が解決しようとする課題】
上述したように、従来では、読取ったフルカラーイメージの画面の表示イメージ、出力イメージ等をそれぞれ処理速度、記憶容量等に影響を及ぼさない程度に最適化する有効な手段が存在しないという問題があった。
【0011】
本発明は上記実情に鑑みなされたもので、フルカラーイメージの帳票読取時に於ける画面の表示イメージ、出力イメージ等をそれぞれ簡単な構成で、容易にかつ効率よく最適化でき、これにより経済性並びに操作性に優れたフルカラーイメージ読取時に於ける画面の表示機能並びに出力イメージの記憶機能を実現することのできる光学的文字認識装置およびプログラムを提供することを目的とする。
【0012】
【課題を解決するための手段】
本発明は、フルカラーイメージ読取の帳票読取定義の際に、フィールド認識のドロップアウトカラーに対応するプレーンだけでなく、フィールドイメージを画面に表示する際のプレーン、および出力イメージ生成する際のプレーン等を任意に色指定できる機構を有して、読取実行時に、前記指定に従い選択されたプレーンを用いて最適な画面、出力イメージを取得できるようにしたことを特徴とする。
【0013】
即ち、本発明は、被読取帳票のフルカラーイメージを取得するスキャナと、 前記スキャナで取得した前記被読取帳票のフルカラーイメージに対し、読取フィールド毎に、当該読取フィールドのドロップアウトカラーに対応したプレーンと、表示用イメージ生成用のプレーンと、出力イメージ生成用のプレーンとが設定される帳票読取定義体をグラフィックユーザインタフェースにより作成する帳票定義ツールと、前記帳票定義ツールで作成した前記帳票読取定義体を記憶する定義体記憶装置と、前記定義体記憶装置に記憶された前記帳票読取定義体を用いて、前記読取フィールドを単位に、前記フルカラーイメージから前記ドロップアウトカラーの設定に従う文字読取を実行し、前記フルカラーイメージから前記表示用イメージ生成用のプレーンに従う二値イメージの画面を生成し、前記フルカラーイメージから出力イメージ生成用のプレーンに従う二値の出力イメージを生成する制御装置と、前記制御装置で生成した二値イメージの画面を表示する表示装置と、前記制御装置で生成した二値の出力イメージを記憶する出力イメージ記憶装置とを具備した光学的文字認識装置を特徴とする。
【0014】
また、本発明は、フルカラーイメージの帳票読取定義体を読取フィールドを単位に作成する帳票定義ツールに於いて、前記帳票読取定義体に、文字読取時のドロップアウトカラーに対応するプレーン、画面表示用のプレーン、出力イメージ用のプレーンの少なくともいずれかを任意に設定するグラフィックユーザインタフェースを具備したことを特徴とする。
【0015】
また、本発明は、フルカラーイメージの帳票読取に適用される帳票読取定義体に、読取フィールドを単位に、画面表示用のプレーンを設定可能とし、その設定された画面表示用のプレーンを用いて前記フルカラーイメージから二値イメージの画面を生成し表示することを特徴とする。
【0016】
また、本発明は、フルカラーイメージの帳票読取に適用される帳票読取定義体に、読取フィールドを単位に、出力イメージ用のプレーンを設定可能とし、その設定された出力イメージ用のプレーンを用いて前記フルカラーイメージから二値イメージデータを生成し記憶することを特徴とする。
【0017】
上記した本発明の帳票読取定義体を用いた画面の表示イメージ生成機能、出力イメージ生成機能を具備することにより、フルカラーイメージの帳票読取時に於ける画面の表示イメージ、出力イメージ等をそれぞれ簡単な構成で、容易にかつ効率よく所望の二値イメージに最適化でき、これにより経済性並びに操作性に優れたフルカラーイメージ読取時に於ける画面の表示機能、並びに出力イメージの記憶機能を実現できる。更に、画面表示用のプレーン、出力イメージ用のプレーンを任意に設定するグラフィックユーザインタフェース(GUI)を具備した帳票定義ツールを適用することにより、帳票読取定義体のフォーマット定義要素をGUIにて木構造で表示して、そのフォーマット定義要素を、マウス等のポインティングデバイスのドラッグアンドドロップ等の簡単な操作で各読取フィールド毎に帳票読取定義体に定義できることから、簡単かつ容易に、所望する最適な二値イメージの画面、並びに出力イメージを取得できる。
【0018】
【発明の実施の形態】
以下、図面を参照して本発明の一実施形態を説明する。
【0019】
図1は、本発明に係る帳票OCRシステムの構成を示すブロック図であり、スキャナ10、制御装置11、制御装置11内に設けられた帳票定義ツール121およびOCR制御プログラム122、メモリ13、帳票定義体記憶装置14、出力イメージ記憶装置(HDD)15、表示装置16等を備えて構成される。
【0020】
スキャナ10は、フルカラーのスキャナであって、被読取帳票上をスキャン(読取走査)して読み取った被読取帳票のフルカラーイメージを制御装置11に送出する。
【0021】
制御装置11は、帳票OCRシステム全体の制御を司るもので、帳票定義ツール121、およびOCR制御プログラム122の各処理を実行する制御機能を持つ。
【0022】
帳票定義ツール121は、フルカラーイメージの帳票読取定義体(FC)を作成するためのGUI機能をもつソフトウェアモジュールであり、本発明の実施形態に於いては、図2に示す処理手順に従い、図4に示すプレーン選択テーブル141へのプレーン設定を含む帳票読取定義体(FC)の作成処理機能を実現する。
【0023】
OCR制御プログラム122は、帳票読取定義体(FC)を用いた文字認識処理を含むOCRシステム全体の制御を行う処理機能を有し、本発明の実施形態に於いては、図3に示す処理手順に従い、図4に示すプレーン選択テーブル141を参照して、当該プレーン選択テーブル141に設定された各プレーンを用いた、二値イメージの画面の生成並びに表示機能、二値の出力イメージの生成並びに保存機能を実現する。
【0024】
メモリ13は、制御装置11の各種処理に供されるRAM構成の記憶装置であり、本発明の実施形態に於いては、スキャナ10で読み取った被読取帳票のフルカラーイメージが展開される。
【0025】
帳票定義体記憶装置14は、制御装置11の制御の下に、上記帳票定義ツール121により作成された帳票読取定義体(FC)を記憶する。本発明の実施形態に於いては、図4に示すプレーン選択テーブル141を含んだ帳票読取定義体(FC)を記憶する。
【0026】
出力イメージ記憶装置15は、制御装置11の制御の下に、読取結果の出力イメージを保存する大容量記憶装置であり、例えばハードディスク装置(HDD)により構成される。本発明の実施形態に於いては、上記プレーン選択テーブル141を用いてRAM13に記憶されるフルカラーイメージから生成された二値の出力イメージが読取フィールドを単位に格納される。
【0027】
表示装置16は、制御装置11の制御の下に、帳票定義ツール121のGUI画面、読取結果の画面等を表示するカラーモニタであり、本発明の実施形態に於いては、上記プレーン選択テーブル141を用いてRAM13に記憶されるフルカラーイメージから生成された二値イメージの画面が読取フィールドを単位に表示される。
【0028】
図2は、本発明の一実施形態に於ける、帳票読取定義体(FC)の作成処理手順を示すフローチャートであり、制御装置11が帳票定義ツール121を起動することにより実行される。
【0029】
図3は、本発明の一実施形態に於ける、文字認識処理時の画面および出力イメージの生成並びに出力処理手順を示すフローチャートであり、プレーン選択テーブル141に定義された表示用イメージのプレーンを用いて二値イメージの画面を生成し表示装置16に表示する。また、プレーン選択テーブル141に定義された出力イメージ用のプレーンを用いて二値の出力イメージを生成し出力イメージ記憶装置15に保存する。
【0030】
図4は、本発明の一実施形態に於ける、帳票読取定義体(FC)に設けられたプレーン選択テーブル141の一構成例を示したもので、ここでは、帳票読取定義体(FC)に定義された読取フィールド(フィールド1,2,3,…)それぞれに対応して、ドロップアウトカラーに対応するプレーン、表示用イメージのプレーン、出力イメージ用のプレーンがそれぞれ定義(設定)され、フルカラーイメージ上で選択プレーンして用いられる。
【0031】
図4では、ドロップアウトカラーに対応するプレーン設定領域を「読取」、表示用イメージのプレーン設定領域を「表示」、出力イメージ用のプレーン設定領域を「出力」として示し、その各設定領域に設定されたプレーンについて、赤プレーンを「R」、緑プレーンを「G」、青プレーンを「B」で示している。ここでは、説明を簡素にするため、「R」「G」「B」3色のプレーンのみを用いた例を示しているが、これに限らず、「R」「G」「B」を組み合わせた、より多くの色のプレーンを用いることも可能である。
【0032】
ここで、上記各図を参照して本発明の一実施形態に於ける動作を説明する。
【0033】
まず、フルカラーイメージの帳票読取定義体(FC)を作成し取得する際の処理手順について、図2に示すフローチャートを参照して説明する。このフルカラーイメージの帳票読取定義体作成処理は、制御装置11が帳票定義ツール121を起動することにより実行される。
【0034】
この帳票定義ツール121による帳票読取定義体(FC)の作成処理では、まず、新規に読取を行うフルカラーの被読取帳票をスキャナ10にてスキャニングし、そのスキャナ10より取得したフルカラーイメージを制御装置11によってメモリ13上に展開して、その被読取帳票に於ける帳票読取定義体(FC)の作成を開始する(図2ステップS1,S2)。
【0035】
上記帳票読取定義体(FC)の作成処理に於いては、まず上記メモリ13上に展開されたフルカラーイメージを表示装置16に表示して、帳票定義ツール121のGUI画面上で、読取フィールドを設定する。続いて、GUI画面上の各読取フィールド毎に、文字読取時のドロップアウトカラーに対応するプレーン、表示用イメージのプレーン、出力イメージ用のプレーンを設定することにより、制御装置11の内部メモリに被読取帳票のフルカラーイメージの帳票読取定義体(FC)が作成される(図2ステップS3,S4)。
【0036】
この帳票読取定義体(FC)の作成時に於けるGUIでは、帳票読取定義体(FC)のフォーマット定義要素を木構造で表示し、この木構造で表示されたフォーマット定義要素を、ユーザがマウス等のポインティングデバイスを用いてドラッグアンドドロップ等により任意に移動し複写し必要に応じて値を入力することで、簡単かつ迅速に、帳票全体の各読取フィールドと、その各読取フィールド毎の上記各プレーンとを設定することができる。この制御装置11の内部メモリ上に作成された帳票読取定義体(FC)は、帳票定義体記憶装置14に保存される(図2ステップS5)。この際、図4に示すように、上記GUI上で指定した文字読取時のドロップアウトカラーに対応するプレーン、表示用イメージのプレーン、出力イメージ用のプレーンは、帳票読取定義体(FC)のプレーン選択テーブル141に設定される。
【0037】
次に、帳票定義体記憶装置14に記憶された帳票読取定義体(FC)のプレーン選択テーブル141を用いて、被読取帳票の文字読取後の画面表示、および出力イメージの保存処理について、図3に示すフローチャートを参照して説明する。
【0038】
被読取帳票の読取処理に於いて、制御装置11は、OCR制御プログラム122に従い、まず帳票定義体記憶装置14に記憶された帳票読取定義体(FC)を制御装置11内の内部メモリにロードする(図3ステップS11)。
【0039】
スキャナ10より被読取帳票のフルカラーイメージを取得すると、その都度、帳票読取定義体(FC)のプレーン選択テーブル141を参照し、帳票全体のフルカラーイメージについて、読取フィールドを単位に文字読取処理を実行する(図3ステップS12)。この際、制御装置11は、帳票読取定義体(FC)のプレーン選択テーブル141の設定に従い、被読取帳票の読取フィールドを単位に、フルカラーイメージからドロップアウトカラーに対応するプレーンを選択して文字読取を行う。例えば、図4の例では、読取時のフィールド1は赤プレーン「R」がドロップアウトカラーとして設定され、フィールド2は青プレーン「B」が、フィールド3は緑プレーン「G」が、フィールド4は赤プレーン「R」がドロップアウトカラーに設定されているので、その設定された色を対象にドロップアウトして文字読取を行う。その読取出力に基づき制御装置11では文字認識が実行される。
【0040】
次に、この文字認識処理した読取フィールドについて、図4に示す帳票読取定義体(FC)のプレーン選択テーブル141を参照し、当該プレーン選択テーブル141に設定された表示用イメージ生成用のプレーンを用いて、上記フルカラーイメージから二値イメージの画面を生成し、表示装置16に表示する(図3ステップS13)。例えば、図4の例では、表示時のフィールド1は青プレーン「B」が表示カラーとして設定され、フィールド2は赤プレーン「R」が、フィールド3は赤プレーン「R」が、フィールド4は青プレーン「B」が表示カラーに設定されているので、その色のプレーンを選択してフルカラーイメージが二値の表示イメージとなって表示装置16に表示される。この結果、この二値イメージの表示と認識結果とを同時に表示させることにより、表示項目と文字認識結果とが対応させて見ることが出来るため、認識が正しく実行された否かが判別でき、また認識文字の修正などにも利用することができる。
【0041】
更に、同じくプレーン選択テーブル141に設定された、出力イメージ生成用のプレーンを用いて、上記フルカラーイメージから二値の出力イメージを生成し、出力イメージ記憶装置15に保存する(図3ステップS14)。例えば、図4の例では、出力時のフィールド1は青プレーン「B」が出力カラーとして設定され、フィールド2は緑プレーン「G」が、フィールド3は赤プレーン「R」が、フィールド4は緑プレーン「G」が出力カラーに設定されているので、その色のプレーンを選択してフルカラーイメージを二値化して出力イメージ記憶装置15に保存することが出来る。
【0042】
このようにして、帳票読取定義体(FC)のプレーン選択テーブル141に任意色のプレーンを設定して、その設定したプレーンを用い、フルカラーイメージから二値の画面、および出力イメージを生成できることから、、簡単かつ容易に、所望する最適な二値イメージの画面表示、並びに出力イメージを取得することができる。
【0043】
尚、上記した実施形態では、帳票読取定義体(FC)のプレーン選択テーブル141に、ドロップアウトカラーに対応するプレーン、表示用イメージのプレーン、出力イメージ用のプレーンを設定したが、これに加えて、画像処理の種類(例えば鮮鋭2値化イメージ)等を指定して、読取時にその画像処理を実行できるようにすることにより、さらに最適な画面イメージ、出力イメージを得ることができる。
【0044】
【発明の効果】
以上詳記したように本発明によれば、フルカラーイメージの帳票読取時に於ける画面の表示イメージ、出力イメージ等をそれぞれ簡単な構成で、容易にかつ効率よく最適化でき、これにより、経済性、並びに操作性に優れた、フルカラーイメージ読取時に於ける画面の表示機能、並びに出力イメージの記憶機能を備えたフルカラーイメージ対応の帳票OCRが実現できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る帳票OCRシステムの構成を示すブロック図。
【図2】上記実施形態に於ける帳票読取定義体の作成処理手順を示すフローチャート。
【図3】上記実施形態に於ける文字認識処理時の画面および出力イメージの生成並びに出力処理手順を示すフローチャート。
【図4】本発明の一実施形態に於ける帳票読取定義体に設けられたプレーン選択テーブルの一構成例を示す図。
【符号の説明】
10…スキャナ
11…制御装置
12…帳票定義ツール
13…メモリ
14…帳票定義体記憶装置
15…出力イメージ記憶部装置(HDD)
16…表示装置
141…プレーン選択テーブル
FC…帳票定義体[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an optical character recognition apparatus that performs character recognition processing using a full-color image form reading definition body.
[0002]
The present invention also relates to a program for a form definition tool for creating a full color image form reading definition body.
[0004]
[Prior art]
In an OCR (Optical Character Recognition) system that performs character recognition processing using a form reading definition body, conventionally, recognition processing is performed by determining a dropout color for each form. In other words, conventionally, in the design of an OCR form, a form is created using a single color dropout color such as red, green or blue, and the form other than the dropout color is read from the image read by the scanner. The character recognition was performed on the image image of the color.
[0005]
In recent years, in this type of form OCR system, as a scanner, a character recognition personal computer, etc. have been speeded up and storage devices have become cheaper, one line is blue and one line is orange. Alternatively, character recognition has been performed for forms created by changing colors in units of multiple lines.
[0006]
By performing character recognition using a full-color image of the form to be read, it becomes possible to set a dropout color for each field, thereby significantly improving the degree of freedom in designing the form.
[0007]
However, the character recognition of the full-color image of the form to be read specifies the dropout color required at the time of field recognition when defining the field of the form reading definition body, and the plane corresponding to the dropout color is read from the full-color image at the time of reading. Was done by choosing. Here, for example, red dropout, green dropout, and blue dropout correspond to the red plane, green plane, and blue plane of the full-color image, respectively.
[0008]
In this type of full-color image form reading mechanism, when realizing the display function of the screen in each reading field, the storage function of the output image, etc. Since the data is very large, the processing speed may be slow, and there may be practical problems due to memory capacity limitations. In addition, when a binarized image using a plane at the time of reading is used for a screen image, etc., the field frame, wording, etc. will drop out, causing a problem that the entire image cannot be grasped correctly. It was.
[0009]
Therefore, there is a need for means to optimize the display image and output image of the full-color image to the extent that they do not affect the processing speed, storage capacity, etc., but in the past it was simple and satisfied with operability and economy. There was no effective optimization means.
[0010]
[Problems to be solved by the invention]
As described above, there has been a problem in the prior art that there is no effective means for optimizing the display image and output image of the read full-color image to the extent that they do not affect the processing speed, storage capacity, etc., respectively. .
[0011]
The present invention has been made in view of the above circumstances, and it is possible to easily and efficiently optimize the display image, output image, etc. of the screen when reading a full-color image with a simple configuration. It is an object of the present invention to provide an optical character recognition apparatus and program capable of realizing a display function of a screen and a storage function of an output image when reading a full color image excellent in performance.
[0012]
[Means for Solving the Problems]
The present invention provides not only a plane corresponding to a field recognition dropout color but also a plane for displaying a field image on a screen, a plane for generating an output image, and the like when defining a form reading for full color image reading. It is characterized in that it has a mechanism that can arbitrarily specify a color, and an optimal screen and output image can be acquired using a plane selected according to the specification at the time of reading.
[0013]
That is, the present invention provides a scanner that acquires a full color image of a read form, and a plane corresponding to a dropout color of the read field for each read field with respect to the full color image of the read form acquired by the scanner. A form definition tool for creating a form reading definition body in which a display image generation plane and an output image generation plane are set by a graphic user interface; and the form reading definition body created by the form definition tool. Using the definition storage device to be stored and the form reading definition stored in the definition storage device, the character reading according to the setting of the dropout color from the full color image is performed in units of the reading field, A pre-production for generating the display image from the full-color image. A control device that generates a binary image screen according to a screen and generates a binary output image according to an output image generation plane from the full-color image, and a display that displays the binary image screen generated by the control device. An optical character recognition device comprising: a device; and an output image storage device for storing a binary output image generated by the control device.
[0014]
Further, the present invention provides a form definition tool for creating a full-color image form reading definition body in units of reading fields, wherein the form reading definition body includes a plane corresponding to a dropout color at the time of character reading and a screen display. A graphic user interface for arbitrarily setting at least one of the plane and the output image plane.
[0015]
Further, the present invention makes it possible to set a screen display plane in units of reading fields in a form reading definition body applied to reading a full-color image form, and using the set screen display plane, It is characterized by generating and displaying a binary image screen from a full-color image.
[0016]
Further, the present invention makes it possible to set an output image plane in units of reading fields in a form reading definition body applied to reading a full-color image form, and using the set output image plane, Binary image data is generated from a full color image and stored.
[0017]
By providing a screen display image generation function and an output image generation function using the above-described form reading definition body of the present invention, the screen display image and the output image at the time of reading a full-color image form can be simply configured. Therefore, it is possible to easily and efficiently optimize a desired binary image, thereby realizing a screen display function and an output image storage function when reading a full color image having excellent economy and operability. Further, by applying a form definition tool having a graphic user interface (GUI) for arbitrarily setting a plane for screen display and an output image plane, the format definition element of the form reading definition body is a tree structure in the GUI. The format definition elements can be defined in the form reading definition body for each reading field by a simple operation such as dragging and dropping with a pointing device such as a mouse. The screen of the value image and the output image can be acquired.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[0019]
FIG. 1 is a block diagram showing the configuration of a form OCR system according to the present invention, which includes a
[0020]
The
[0021]
The
[0022]
The
[0023]
The
[0024]
The
[0025]
The form
[0026]
The output
[0027]
The
[0028]
FIG. 2 is a flowchart showing a procedure for creating a form reading definition body (FC) according to an embodiment of the present invention, which is executed when the
[0029]
FIG. 3 is a flowchart showing a screen and output image generation and output processing procedure during character recognition processing according to an embodiment of the present invention, and uses display image planes defined in the plane selection table 141. The binary image screen is generated and displayed on the
[0030]
FIG. 4 shows an example of the configuration of the plane selection table 141 provided in the form reading definition body (FC) according to the embodiment of the present invention. Here, the form reading definition body (FC) is shown in FIG. A plane corresponding to the dropout color, a display image plane, and an output image plane are defined (set) for each of the defined reading fields (fields 1, 2, 3,...), And a full color image. Used as a selection plane above.
[0031]
In FIG. 4, the plane setting area corresponding to the dropout color is indicated as “read”, the plane setting area for the display image is indicated as “display”, and the plane setting area for the output image is indicated as “output”. The red plane is indicated by “R”, the green plane is indicated by “G”, and the blue plane is indicated by “B”. Here, in order to simplify the description, an example using only three planes of “R”, “G”, and “B” is shown, but not limited to this, “R”, “G”, and “B” are combined. It is also possible to use more color planes.
[0032]
Here, the operation in one embodiment of the present invention will be described with reference to the respective drawings.
[0033]
First, a processing procedure when creating and acquiring a full color image form reading definition body (FC) will be described with reference to the flowchart shown in FIG. The full color image form reading definition body creation process is executed when the
[0034]
In the process of creating a form reading definition body (FC) by the
[0035]
In the creation process of the form reading definition body (FC), first, the full color image developed on the
[0036]
In the GUI when creating this form reading definition body (FC), the format definition elements of the form reading definition body (FC) are displayed in a tree structure, and the user can display the format definition elements displayed in this tree structure by a mouse or the like. By simply dragging and dropping using a pointing device, copy and input values as needed, each reading field of the entire form and each plane for each reading field can be easily and quickly And can be set. The form reading definition body (FC) created on the internal memory of the
[0037]
Next, screen display after reading characters of a form to be read and output image saving processing using the plane selection table 141 of the form reading definition body (FC) stored in the form definition
[0038]
In the reading process of the form to be read, the
[0039]
Each time a full-color image of a form to be read is acquired from the
[0040]
Next, for the read field subjected to the character recognition processing, the plane selection table 141 of the form reading definition body (FC) shown in FIG. 4 is referred to, and the display image generation plane set in the plane selection table 141 is used. Then, a binary image screen is generated from the full-color image and displayed on the display device 16 (step S13 in FIG. 3). For example, in the example of FIG. 4, the display plane 1 is set with the blue plane “B” as the display color, the field 2 is the red plane “R”, the field 3 is the red plane “R”, and the field 4 is blue. Since the plane “B” is set as the display color, the plane of that color is selected and the full color image is displayed on the
[0041]
Further, using the output image generation plane set in the plane selection table 141, a binary output image is generated from the full color image and stored in the output image storage device 15 (step S14 in FIG. 3). For example, in the example of FIG. 4, in the output field 1, the blue plane “B” is set as the output color, the field 2 is the green plane “G”, the field 3 is the red plane “R”, and the field 4 is green. Since the plane “G” is set as the output color, the full color image can be binarized by selecting the plane of that color and stored in the output
[0042]
In this way, a plane of arbitrary color is set in the plane selection table 141 of the form reading definition body (FC), and a binary screen and an output image can be generated from the full color image using the set plane. Therefore, it is possible to obtain a desired optimal binary image screen display and an output image easily and easily.
[0043]
In the above-described embodiment, the plane corresponding to the dropout color, the display image plane, and the output image plane are set in the plane selection table 141 of the form reading definition body (FC). By specifying the type of image processing (for example, a sharp binarized image) and the like so that the image processing can be executed at the time of reading, a further optimal screen image and output image can be obtained.
[0044]
【The invention's effect】
As described above in detail, according to the present invention, it is possible to easily and efficiently optimize the display image, output image, and the like of the screen when reading a full-color image, each with a simple configuration. In addition, it is possible to realize a full-color image-compatible form OCR having an excellent operability and a screen display function when reading a full-color image and a storage function of an output image.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a form OCR system according to an embodiment of the present invention.
FIG. 2 is a flowchart showing a procedure for creating a form reading definition body in the embodiment.
FIG. 3 is a flowchart showing a screen and output image generation and output processing procedure during character recognition processing in the embodiment.
FIG. 4 is a diagram showing a configuration example of a plane selection table provided in a form reading definition body in an embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF
16 ...
Claims (2)
前記スキャナで取得した前記被読取帳票のフルカラーイメージに対し、読取フィールド毎に、当該読取フィールドのドロップアウトカラーに対応したプレーンと、表示用イメージ生成用のプレーンと、出力イメージ生成用のプレーンとをそれぞれ定義したプレーン選択テーブルを設けた帳票読取定義体を記憶する定義体記憶装置と、
前記定義体記憶装置に記憶された前記プレーン選択テーブルを用いて、前記読取フィールドを単位に、前記フルカラーイメージから前記ドロップアウトカラーの設定に従う文字読取を実行し、前記フルカラーイメージから前記表示用イメージ生成用のプレーンに従う二値イメージの画面を生成し、前記フルカラーイメージから出力イメージ生成用のプレーンに従う二値の出力イメージを生成する制御装置と、
前記制御装置で生成した二値イメージの画面を表示する表示装置と、
前記制御装置で生成した二値の出力イメージを記憶する出力イメージ記憶装置と
を具備したことを特徴とする光学的文字認識装置。A scanner that acquires a full-color image of the form to be read;
For the full color image of the read form acquired by the scanner, for each reading field, a plane corresponding to the dropout color of the reading field, a display image generation plane, and an output image generation plane A definition storage device for storing a form reading definition body provided with a plane selection table defined respectively;
Using the plane selection table stored in the definition storage device, character reading is performed from the full color image according to the setting of the dropout color in units of the reading field, and the display image is generated from the full color image. A control device for generating a binary image screen according to a plane for generating a binary output image according to a plane for generating an output image from the full color image;
A display device for displaying a screen of a binary image generated by the control device;
An optical character recognition device comprising: an output image storage device for storing a binary output image generated by the control device.
前記光学的文字読取装置が、前記帳票読取定義体に、被読取帳票上の各読取フィールドと、その読取フィールドに対応して、文字読取時のドロップアウトカラーに対応するプレーンと、表示イメージ生成用のプレーンと、出力イメージ生成用のプレーンとをそれぞれ定義したプレーン選択テーブルを設定する機能と、
前記光学的文字読取装置が、前記帳票読取定義体に設定された前記プレーン選択テーブルを用いて、前記読取フィールドを単位に、前記帳票のカラーイメージから前記ドロップアウトカラーの設定に従う文字認識を実行し、前記帳票のカラーイメージから前記表示イメージ生成用のプレーンに従う二値イメージを生成し、前記帳票のカラーイメージから出力イメージ生成用のプレーンに従う二値のイメージを生成する機能と、
を実現させるためのプログラム。In an optical character reader that recognizes a color image of a form using a form reading definition body,
The optical character reader includes, in the form reading definition body, each reading field on the read form, a plane corresponding to a dropout color at the time of reading a character corresponding to the reading field, and a display image generation A function to set a plane selection table that defines each plane and output image generation plane,
The optical character reader performs character recognition according to the setting of the dropout color from the color image of the form for each reading field, using the plane selection table set in the form reading definition body. Generating a binary image according to the display image generation plane from the color image of the form, and generating a binary image according to the output image generation plane from the color image of the form;
A program to realize
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002092775A JP3742358B2 (en) | 2002-03-28 | 2002-03-28 | Optical character recognition apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002092775A JP3742358B2 (en) | 2002-03-28 | 2002-03-28 | Optical character recognition apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003288546A JP2003288546A (en) | 2003-10-10 |
JP3742358B2 true JP3742358B2 (en) | 2006-02-01 |
Family
ID=29237507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002092775A Expired - Lifetime JP3742358B2 (en) | 2002-03-28 | 2002-03-28 | Optical character recognition apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3742358B2 (en) |
-
2002
- 2002-03-28 JP JP2002092775A patent/JP3742358B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2003288546A (en) | 2003-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7716600B2 (en) | Interface | |
JP3836527B2 (en) | Apparatus and method for image editing of structural images | |
US9262386B2 (en) | Data editing for improving readability of a display | |
JPH0728689A (en) | Information processor | |
US20170102843A1 (en) | Color selector for desktop publishing | |
US20110264711A1 (en) | Computer based method and system for generating custom dynamic templates | |
JPH0877330A (en) | Method for processing image and device therefor | |
JP2000215322A (en) | Image processor, and recording medium with image processing program recorded therein | |
US20090037516A1 (en) | Information processing apparatus and method | |
WO2018203374A1 (en) | Line drawing automatic coloring program, line drawing automatic coloring device, and program for graphical user interface | |
JP2001084245A (en) | Device and method for processing document | |
JP2000148794A (en) | Device and method for image retrieval and computer- readable memory | |
JP3742358B2 (en) | Optical character recognition apparatus and program | |
JP3974105B2 (en) | Image processing apparatus, image processing method, and computer-readable recording medium storing program for causing computer to execute the method | |
CN101114279A (en) | Document production support device, methods thereof and storage medium | |
JP3890096B2 (en) | Image editing system | |
US8190563B2 (en) | Document management apparatus, document management method, and computer-readable encoding medium recorded with a computer program | |
JP2006085259A (en) | Image processor, image processing method, and program | |
JP2011128710A (en) | Display device, display system, display control method and display control program | |
JP3705201B2 (en) | Image forming program and image forming apparatus | |
JP5020862B2 (en) | Line drawing processing apparatus and program | |
KR100416420B1 (en) | Method and system of modifing an web page | |
US20060055984A1 (en) | Image processing apparatus, image processing method and program | |
CN115291992B (en) | Auxiliary labeling method for graphic user interface picture, electronic equipment and storage medium | |
DE102005035188A1 (en) | Interface device for coupling image processing modules |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051110 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3742358 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081118 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091118 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101118 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101118 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111118 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111118 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121118 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131118 Year of fee payment: 8 |
|
EXPY | Cancellation because of completion of term |