JPS59158482A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS59158482A JPS59158482A JP58032426A JP3242683A JPS59158482A JP S59158482 A JPS59158482 A JP S59158482A JP 58032426 A JP58032426 A JP 58032426A JP 3242683 A JP3242683 A JP 3242683A JP S59158482 A JPS59158482 A JP S59158482A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- result
- answer
- characters
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
この発明は、光学的文字読取装置に関する。
近年、光学的文字読取装置(以下OCRと称する)等に
は、英数字、仮名文字および特殊記号(総称して感文字
と称する)に加えて漢字(平仮名を含む)を含む文章を
読取ることができる漢字OCRがある。このような漢字
OCRでは、読取対象の文字がANK文字(約128字
種)および漢字(2000字種以上)であるため、認識
字種が多大となる。そのため、ANK文字のみの文字認
識方式と異なり、辞書メモリが大容量になるなど複雑で
大規模な方式となる。
は、英数字、仮名文字および特殊記号(総称して感文字
と称する)に加えて漢字(平仮名を含む)を含む文章を
読取ることができる漢字OCRがある。このような漢字
OCRでは、読取対象の文字がANK文字(約128字
種)および漢字(2000字種以上)であるため、認識
字種が多大となる。そのため、ANK文字のみの文字認
識方式と異なり、辞書メモリが大容量になるなど複雑で
大規模な方式となる。
しかしながら、従来の漢字OCRでは、読取字種が多大
となる反面、文章の中に含まれるANK文字を認識する
場合や、ANK文字用文字認識方式を用いた場合に比較
して認識精度が低下する欠点があった。これは、認識対
象の字種が広範囲で多大となるため、−文字当りの認識
精度が低下するからである。
となる反面、文章の中に含まれるANK文字を認識する
場合や、ANK文字用文字認識方式を用いた場合に比較
して認識精度が低下する欠点があった。これは、認識対
象の字種が広範囲で多大となるため、−文字当りの認識
精度が低下するからである。
この発明は上記の事情に鑑みてなされたもので、その目
的は、瓜文字および漢字からなる文章を読取る場合でも
、厘文字の認識を確実に行なうことができるようにして
、文字読取精度を高めることができる文字認識装置を提
供することにある。
的は、瓜文字および漢字からなる文章を読取る場合でも
、厘文字の認識を確実に行なうことができるようにして
、文字読取精度を高めることができる文字認識装置を提
供することにある。
この発明は、限定範囲の字種からなるANK文字を認識
するANK認識部および広範囲の字種からなる文字を認
識する漢字認識部の両者を設ける。この両認識部の各認
識結果は、認識照合判定部に与えられ、この判定部によ
り最終的答が判定されて出力される。この場合、認識照
合判定部は、予め判定テーブルとして類似度値の差によ
る認識用統計データを記憶し、この統計データに基づい
て最終的答を出力することになる。
するANK認識部および広範囲の字種からなる文字を認
識する漢字認識部の両者を設ける。この両認識部の各認
識結果は、認識照合判定部に与えられ、この判定部によ
り最終的答が判定されて出力される。この場合、認識照
合判定部は、予め判定テーブルとして類似度値の差によ
る認識用統計データを記憶し、この統計データに基づい
て最終的答を出力することになる。
これにより、ANK文字および漢字からなる文章の読取
処理において、ANK文字の認識を確実に行なうことが
できるものである。
処理において、ANK文字の認識を確実に行なうことが
できるものである。
以下図面を参照してこの発明の一実施例について説明す
る。第1図はこの発明に係る文字認識方式の構成を示す
ブロック図である。図中、1は前処理回路で、帳票を走
査して得られる文字i4ターンPが入力し、その文字パ
ターンPに対するノイズ除去等の前処理を行なう。文字
パターンPは、通常光電変換されたデジタル信号からな
る。前処理回路1から出力される文字ツクターンPは、
ANK認識認識上2び漢字認識部3の両者に与えられる
。ANK認識認識上2英数字、仮名文字および特殊記号
等の限定範囲の字種の文字(ANK文字)を認識する。
る。第1図はこの発明に係る文字認識方式の構成を示す
ブロック図である。図中、1は前処理回路で、帳票を走
査して得られる文字i4ターンPが入力し、その文字パ
ターンPに対するノイズ除去等の前処理を行なう。文字
パターンPは、通常光電変換されたデジタル信号からな
る。前処理回路1から出力される文字ツクターンPは、
ANK認識認識上2び漢字認識部3の両者に与えられる
。ANK認識認識上2英数字、仮名文字および特殊記号
等の限定範囲の字種の文字(ANK文字)を認識する。
漢字認識部3は、ANK文字および漢字(平仮名を含む
)からなる文章の文字を認識する。認識照合判定回路(
以下判定回路と称する)4は、マイクロプロセッサ等か
らなり、両認識部2,3から出力される認識結果R1,
R2に対して、予めメモリに判定テーブルとして記憶し
た認識用統計データに基づいて認識判定を行なって、最
終的答を出力する。
)からなる文章の文字を認識する。認識照合判定回路(
以下判定回路と称する)4は、マイクロプロセッサ等か
らなり、両認識部2,3から出力される認識結果R1,
R2に対して、予めメモリに判定テーブルとして記憶し
た認識用統計データに基づいて認識判定を行なって、最
終的答を出力する。
このような構成において、第2図および第3図を参照し
てその動作を説明する。いま、例えば第2図に示すよう
な帳票10に記録された文字の認識が行なわれるものと
する。最初に、帳票10のANK文字のみからなる読取
フィールド11hが走査され、通常−文字毎に文字パタ
ーンPが瓜認識部2および漢字認識部3に与えられる。
てその動作を説明する。いま、例えば第2図に示すよう
な帳票10に記録された文字の認識が行なわれるものと
する。最初に、帳票10のANK文字のみからなる読取
フィールド11hが走査され、通常−文字毎に文字パタ
ーンPが瓜認識部2および漢字認識部3に与えられる。
この場合、文字パターンPは、上記のように光電変換さ
れたデジタル信号で、前処理回路1を経て両認識部2,
3に与えられる。そして、両認識部2,3の各認識結果
R1,R2は、判定回路4に与えられる。この場合、判
定回路4は、予め用意されたフォーマットコントロール
データに基づいて、帳票1oの読取フィールドllaの
文字パターンPに対してANK認識認識上2識結果Rノ
を答として判定し出力する。このフォーマットコントロ
ールデータは、通常OCRの制御装置(図示せず)のメ
モリに格納されており、読取対象の帳票1oに対する読
取フィールド毎の行データ内容を示すデータ等である。
れたデジタル信号で、前処理回路1を経て両認識部2,
3に与えられる。そして、両認識部2,3の各認識結果
R1,R2は、判定回路4に与えられる。この場合、判
定回路4は、予め用意されたフォーマットコントロール
データに基づいて、帳票1oの読取フィールドllaの
文字パターンPに対してANK認識認識上2識結果Rノ
を答として判定し出力する。このフォーマットコントロ
ールデータは、通常OCRの制御装置(図示せず)のメ
モリに格納されており、読取対象の帳票1oに対する読
取フィールド毎の行データ内容を示すデータ等である。
次に、帳票10の読取フィールド11bでANK文字お
よび漢字等からなる文章が読取られたとする。この場合
も、上記と同様に一文字毎の文字パターンPが、ANK
認識認識上2び漢字−5= 認識部30両者に与えられる。判定回路4は、両方の認
識部2,3から各認識結果R1,R2を得る。ここで、
各認識結果R1,R2は、単に答だけではなく、各認識
結果R1,R2における第1位乃至第N位までの候補文
字、第1位の類似度値および第1位、第2位の候補文字
間の類似度差のデータ等からなる。判定回路4は、以下
のような条件を満足した場合、判定テーブルを使用する
ことなく答を出力する。即ち、認識結果R1,R2の各
答k1.A2が同一である場合には、漢字認識部3から
の答A2を最終的答として出力する。この場合、両者の
認識結果R1,R2がリジェクトのときには、判定回路
4はリジェクトと判定する。さらに、各答Al、A2が
同一でない場合において、認識結果R1がリジェクトの
ときは答A2を最終的答とする。址だ、答A1が認識結
果R2の第1位乃至第N位までの候補文字の中に存在し
ていないとき、答A2を最終的答とする。
よび漢字等からなる文章が読取られたとする。この場合
も、上記と同様に一文字毎の文字パターンPが、ANK
認識認識上2び漢字−5= 認識部30両者に与えられる。判定回路4は、両方の認
識部2,3から各認識結果R1,R2を得る。ここで、
各認識結果R1,R2は、単に答だけではなく、各認識
結果R1,R2における第1位乃至第N位までの候補文
字、第1位の類似度値および第1位、第2位の候補文字
間の類似度差のデータ等からなる。判定回路4は、以下
のような条件を満足した場合、判定テーブルを使用する
ことなく答を出力する。即ち、認識結果R1,R2の各
答k1.A2が同一である場合には、漢字認識部3から
の答A2を最終的答として出力する。この場合、両者の
認識結果R1,R2がリジェクトのときには、判定回路
4はリジェクトと判定する。さらに、各答Al、A2が
同一でない場合において、認識結果R1がリジェクトの
ときは答A2を最終的答とする。址だ、答A1が認識結
果R2の第1位乃至第N位までの候補文字の中に存在し
ていないとき、答A2を最終的答とする。
このような条件の場合に対して、判定回路46−
は、各認識部2.3が異なる答kl、12の認識結果R
1,R2をそれぞれ出力し、しかも認識結果R1の答A
1が認識結果R2(即ち漢字認識部3の認識結果)の第
1位乃至第N位の候補文字の中に存在している場合、上
記のような判定テーブル(認識用統計データ)を参照す
ることになる。この判定テーブルは、例えば第3図に示
すように構成されており、ANK認識認識部上Aノでア
ドレスが指定される。このアドレスで指定される参照デ
ータは、ANK認識認識部上られた第1位の候補文字の
類似度値と比較するための閾値8人および漢字認識部3
で得られた第1位と第2位の候補文字間の類似度差を比
較するだめの閾値SRからなる。具体的には、例えば入
カッ(ターンPが「ア」とした場合、ANK認識認識部
上識結果R1が「ア」で、漢字認識部3の認識結果R2
が1了」であるとする。
1,R2をそれぞれ出力し、しかも認識結果R1の答A
1が認識結果R2(即ち漢字認識部3の認識結果)の第
1位乃至第N位の候補文字の中に存在している場合、上
記のような判定テーブル(認識用統計データ)を参照す
ることになる。この判定テーブルは、例えば第3図に示
すように構成されており、ANK認識認識部上Aノでア
ドレスが指定される。このアドレスで指定される参照デ
ータは、ANK認識認識部上られた第1位の候補文字の
類似度値と比較するための閾値8人および漢字認識部3
で得られた第1位と第2位の候補文字間の類似度差を比
較するだめの閾値SRからなる。具体的には、例えば入
カッ(ターンPが「ア」とした場合、ANK認識認識部
上識結果R1が「ア」で、漢字認識部3の認識結果R2
が1了」であるとする。
判定回路4は、認識結果R2の第1位乃至第N位までの
候補文字の中に「ア」があれば、上記のような判定テー
ブルを参照する。即ち、判定回路4は、第3図のテーブ
ルにおいて、認識結果R1の答「ア」で指定されるアド
レスの参照データsA、 SRを胱出す。そして、参照
データs人、 SBを、それぞれ認識結果R1の類似度
値および認識結果R2の類似度差と比較することになる
。この場合、R)の類似度値が90で、R2の類似度差
が「20」であれば、判定回路4は閾値SA 、 Sm
(80、15)を越えるため、ANK認識認識部上識
結果R1の答である「ア」を最終的答として判定し出力
する。また、認識結果R1,R2の6値が参照データS
A r SBより小さい場合には、判定回路4は漢字認
識部3の認識結果R2の答である「了」を最終的答とし
て判定し出力する。
候補文字の中に「ア」があれば、上記のような判定テー
ブルを参照する。即ち、判定回路4は、第3図のテーブ
ルにおいて、認識結果R1の答「ア」で指定されるアド
レスの参照データsA、 SRを胱出す。そして、参照
データs人、 SBを、それぞれ認識結果R1の類似度
値および認識結果R2の類似度差と比較することになる
。この場合、R)の類似度値が90で、R2の類似度差
が「20」であれば、判定回路4は閾値SA 、 Sm
(80、15)を越えるため、ANK認識認識部上識
結果R1の答である「ア」を最終的答として判定し出力
する。また、認識結果R1,R2の6値が参照データS
A r SBより小さい場合には、判定回路4は漢字認
識部3の認識結果R2の答である「了」を最終的答とし
て判定し出力する。
このようにして、ANK文字および漢字等からなる文章
の文字を認識する場合、漢字認識部3の認識結果R2だ
けでなく、本来ANK文字の認識精度の高いANK認識
認識部上識結果R1を参照して、ANK文字の認識を高
い精度で行なうことができる。この場合、認識結果R1
に基づいて、判定回路4は判定テーブルの参照データに
より最終的答を判定し出力することになる。この判定テ
ーブルは、ANK認識認識部上び漢字認識部3の各認識
結果R1,R2の類似度値に基づいて最適な答を選択で
きるように予め設定される認識用統計データからなる。
の文字を認識する場合、漢字認識部3の認識結果R2だ
けでなく、本来ANK文字の認識精度の高いANK認識
認識部上識結果R1を参照して、ANK文字の認識を高
い精度で行なうことができる。この場合、認識結果R1
に基づいて、判定回路4は判定テーブルの参照データに
より最終的答を判定し出力することになる。この判定テ
ーブルは、ANK認識認識部上び漢字認識部3の各認識
結果R1,R2の類似度値に基づいて最適な答を選択で
きるように予め設定される認識用統計データからなる。
以上詳述したようにこの発明によれば、漢字OCRにお
いて、ANK文字および漢字等からなる文章の文字を認
識する場合でも、ANK文字の認識の精度を高めるよう
にして、確実な読取を行なうことができる。したがって
、結果的に帳票等に記録された文章全体の読取精度を高
めることができる効果を得ることができるものである。
いて、ANK文字および漢字等からなる文章の文字を認
識する場合でも、ANK文字の認識の精度を高めるよう
にして、確実な読取を行なうことができる。したがって
、結果的に帳票等に記録された文章全体の読取精度を高
めることができる効果を得ることができるものである。
【図面の簡単な説明】
第1図はこの発明の一実施例に係る文字認識方式の構成
を示すブロック図、第2図は第1図の動作を説明するた
めの帳票の一例を示す図、第3図は第1図の判定回路の
動作を説明するだめの判定テーブルの一例を示す図であ
る。 9− 2・・・ANK認識部、3・・・漢字認識部、4・・・
判定回路。 出願人代理人 弁理士 鈴 江 武 彦10−
を示すブロック図、第2図は第1図の動作を説明するた
めの帳票の一例を示す図、第3図は第1図の判定回路の
動作を説明するだめの判定テーブルの一例を示す図であ
る。 9− 2・・・ANK認識部、3・・・漢字認識部、4・・・
判定回路。 出願人代理人 弁理士 鈴 江 武 彦10−
Claims (1)
- 認識対象である英数字や記号等の限定範囲の字種の文字
を認識する第1の認識部と、上記限定字種および漢字等
を含む広範囲の字種の文字を認識する第2の認識部と、
上記第1および第2の認識部から出力される各g識結果
からそれぞれの類似度値により最適の答を選択するため
に予め設定される認識用統計データに基づいて最終的答
を判定して出力する認識照合判定部とを具備したことを
特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58032426A JPS59158482A (ja) | 1983-02-28 | 1983-02-28 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58032426A JPS59158482A (ja) | 1983-02-28 | 1983-02-28 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59158482A true JPS59158482A (ja) | 1984-09-07 |
Family
ID=12358622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58032426A Pending JPS59158482A (ja) | 1983-02-28 | 1983-02-28 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59158482A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63223890A (ja) * | 1987-03-12 | 1988-09-19 | Toshiba Corp | 図面読取装置 |
JPH01259475A (ja) * | 1988-04-11 | 1989-10-17 | Canon Inc | 文字認識方法 |
JPH0221383A (ja) * | 1988-01-04 | 1990-01-24 | Sumitomo Electric Ind Ltd | 光学文字読取装置 |
JPH0981730A (ja) * | 1995-09-18 | 1997-03-28 | Canon Inc | パターン認識方法及び装置及びコンピュータ制御装置 |
-
1983
- 1983-02-28 JP JP58032426A patent/JPS59158482A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63223890A (ja) * | 1987-03-12 | 1988-09-19 | Toshiba Corp | 図面読取装置 |
JPH0221383A (ja) * | 1988-01-04 | 1990-01-24 | Sumitomo Electric Ind Ltd | 光学文字読取装置 |
JPH01259475A (ja) * | 1988-04-11 | 1989-10-17 | Canon Inc | 文字認識方法 |
JPH0981730A (ja) * | 1995-09-18 | 1997-03-28 | Canon Inc | パターン認識方法及び装置及びコンピュータ制御装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4989258A (en) | Character recognition apparatus | |
JPS63216189A (ja) | 文字認識方法 | |
JPS59158482A (ja) | 文字認識装置 | |
JPH0743755B2 (ja) | 文字認識装置 | |
JPH0660224A (ja) | 光学式文字読取装置 | |
JPS6139175A (ja) | 光学的文字読取装置 | |
JPS6336389A (ja) | 文字読取装置 | |
JPH0223490A (ja) | 文字読取システム | |
JPS60110089A (ja) | 文字認識装置 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JPH01311390A (ja) | 文字置換制御方式 | |
JPS6095689A (ja) | 光学的文字読取装置 | |
JP2972443B2 (ja) | 文字認識装置 | |
JPS62177686A (ja) | 光学的文字読取装置 | |
JPS60138689A (ja) | 文字認識方法 | |
JPS6160184A (ja) | 光学的文字読取装置 | |
JPS60160481A (ja) | 文字読取装置 | |
JPS6073796A (ja) | 光学文字読取装置 | |
JPH05189604A (ja) | 光学的文字読取装置 | |
JPH0576674B2 (ja) | ||
JPS59205681A (ja) | 文字読取装置 | |
JPS63143685A (ja) | 文字認識装置における認識結果表示方法 | |
JPS61109183A (ja) | 文字認識装置 | |
JPS59188783A (ja) | 文字判定処理方式 | |
JPS62103784A (ja) | 文字読取装置 |