[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPS59158482A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS59158482A
JPS59158482A JP58032426A JP3242683A JPS59158482A JP S59158482 A JPS59158482 A JP S59158482A JP 58032426 A JP58032426 A JP 58032426A JP 3242683 A JP3242683 A JP 3242683A JP S59158482 A JPS59158482 A JP S59158482A
Authority
JP
Japan
Prior art keywords
recognition
result
answer
characters
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58032426A
Other languages
English (en)
Inventor
Toru Suzuki
透 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58032426A priority Critical patent/JPS59158482A/ja
Publication of JPS59158482A publication Critical patent/JPS59158482A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、光学的文字読取装置に関する。
〔発明の技術的背景とその問題点〕
近年、光学的文字読取装置(以下OCRと称する)等に
は、英数字、仮名文字および特殊記号(総称して感文字
と称する)に加えて漢字(平仮名を含む)を含む文章を
読取ることができる漢字OCRがある。このような漢字
OCRでは、読取対象の文字がANK文字(約128字
種)および漢字(2000字種以上)であるため、認識
字種が多大となる。そのため、ANK文字のみの文字認
識方式と異なり、辞書メモリが大容量になるなど複雑で
大規模な方式となる。
しかしながら、従来の漢字OCRでは、読取字種が多大
となる反面、文章の中に含まれるANK文字を認識する
場合や、ANK文字用文字認識方式を用いた場合に比較
して認識精度が低下する欠点があった。これは、認識対
象の字種が広範囲で多大となるため、−文字当りの認識
精度が低下するからである。
〔発明の目的〕
この発明は上記の事情に鑑みてなされたもので、その目
的は、瓜文字および漢字からなる文章を読取る場合でも
、厘文字の認識を確実に行なうことができるようにして
、文字読取精度を高めることができる文字認識装置を提
供することにある。
〔発明の概要〕
この発明は、限定範囲の字種からなるANK文字を認識
するANK認識部および広範囲の字種からなる文字を認
識する漢字認識部の両者を設ける。この両認識部の各認
識結果は、認識照合判定部に与えられ、この判定部によ
り最終的答が判定されて出力される。この場合、認識照
合判定部は、予め判定テーブルとして類似度値の差によ
る認識用統計データを記憶し、この統計データに基づい
て最終的答を出力することになる。
これにより、ANK文字および漢字からなる文章の読取
処理において、ANK文字の認識を確実に行なうことが
できるものである。
〔発明の実施例〕
以下図面を参照してこの発明の一実施例について説明す
る。第1図はこの発明に係る文字認識方式の構成を示す
ブロック図である。図中、1は前処理回路で、帳票を走
査して得られる文字i4ターンPが入力し、その文字パ
ターンPに対するノイズ除去等の前処理を行なう。文字
パターンPは、通常光電変換されたデジタル信号からな
る。前処理回路1から出力される文字ツクターンPは、
ANK認識認識上2び漢字認識部3の両者に与えられる
。ANK認識認識上2英数字、仮名文字および特殊記号
等の限定範囲の字種の文字(ANK文字)を認識する。
漢字認識部3は、ANK文字および漢字(平仮名を含む
)からなる文章の文字を認識する。認識照合判定回路(
以下判定回路と称する)4は、マイクロプロセッサ等か
らなり、両認識部2,3から出力される認識結果R1,
R2に対して、予めメモリに判定テーブルとして記憶し
た認識用統計データに基づいて認識判定を行なって、最
終的答を出力する。
このような構成において、第2図および第3図を参照し
てその動作を説明する。いま、例えば第2図に示すよう
な帳票10に記録された文字の認識が行なわれるものと
する。最初に、帳票10のANK文字のみからなる読取
フィールド11hが走査され、通常−文字毎に文字パタ
ーンPが瓜認識部2および漢字認識部3に与えられる。
この場合、文字パターンPは、上記のように光電変換さ
れたデジタル信号で、前処理回路1を経て両認識部2,
3に与えられる。そして、両認識部2,3の各認識結果
R1,R2は、判定回路4に与えられる。この場合、判
定回路4は、予め用意されたフォーマットコントロール
データに基づいて、帳票1oの読取フィールドllaの
文字パターンPに対してANK認識認識上2識結果Rノ
を答として判定し出力する。このフォーマットコントロ
ールデータは、通常OCRの制御装置(図示せず)のメ
モリに格納されており、読取対象の帳票1oに対する読
取フィールド毎の行データ内容を示すデータ等である。
次に、帳票10の読取フィールド11bでANK文字お
よび漢字等からなる文章が読取られたとする。この場合
も、上記と同様に一文字毎の文字パターンPが、ANK
認識認識上2び漢字−5= 認識部30両者に与えられる。判定回路4は、両方の認
識部2,3から各認識結果R1,R2を得る。ここで、
各認識結果R1,R2は、単に答だけではなく、各認識
結果R1,R2における第1位乃至第N位までの候補文
字、第1位の類似度値および第1位、第2位の候補文字
間の類似度差のデータ等からなる。判定回路4は、以下
のような条件を満足した場合、判定テーブルを使用する
ことなく答を出力する。即ち、認識結果R1,R2の各
答k1.A2が同一である場合には、漢字認識部3から
の答A2を最終的答として出力する。この場合、両者の
認識結果R1,R2がリジェクトのときには、判定回路
4はリジェクトと判定する。さらに、各答Al、A2が
同一でない場合において、認識結果R1がリジェクトの
ときは答A2を最終的答とする。址だ、答A1が認識結
果R2の第1位乃至第N位までの候補文字の中に存在し
ていないとき、答A2を最終的答とする。
このような条件の場合に対して、判定回路46− は、各認識部2.3が異なる答kl、12の認識結果R
1,R2をそれぞれ出力し、しかも認識結果R1の答A
1が認識結果R2(即ち漢字認識部3の認識結果)の第
1位乃至第N位の候補文字の中に存在している場合、上
記のような判定テーブル(認識用統計データ)を参照す
ることになる。この判定テーブルは、例えば第3図に示
すように構成されており、ANK認識認識部上Aノでア
ドレスが指定される。このアドレスで指定される参照デ
ータは、ANK認識認識部上られた第1位の候補文字の
類似度値と比較するための閾値8人および漢字認識部3
で得られた第1位と第2位の候補文字間の類似度差を比
較するだめの閾値SRからなる。具体的には、例えば入
カッ(ターンPが「ア」とした場合、ANK認識認識部
上識結果R1が「ア」で、漢字認識部3の認識結果R2
が1了」であるとする。
判定回路4は、認識結果R2の第1位乃至第N位までの
候補文字の中に「ア」があれば、上記のような判定テー
ブルを参照する。即ち、判定回路4は、第3図のテーブ
ルにおいて、認識結果R1の答「ア」で指定されるアド
レスの参照データsA、 SRを胱出す。そして、参照
データs人、 SBを、それぞれ認識結果R1の類似度
値および認識結果R2の類似度差と比較することになる
。この場合、R)の類似度値が90で、R2の類似度差
が「20」であれば、判定回路4は閾値SA 、 Sm
 (80、15)を越えるため、ANK認識認識部上識
結果R1の答である「ア」を最終的答として判定し出力
する。また、認識結果R1,R2の6値が参照データS
A r SBより小さい場合には、判定回路4は漢字認
識部3の認識結果R2の答である「了」を最終的答とし
て判定し出力する。
このようにして、ANK文字および漢字等からなる文章
の文字を認識する場合、漢字認識部3の認識結果R2だ
けでなく、本来ANK文字の認識精度の高いANK認識
認識部上識結果R1を参照して、ANK文字の認識を高
い精度で行なうことができる。この場合、認識結果R1
に基づいて、判定回路4は判定テーブルの参照データに
より最終的答を判定し出力することになる。この判定テ
ーブルは、ANK認識認識部上び漢字認識部3の各認識
結果R1,R2の類似度値に基づいて最適な答を選択で
きるように予め設定される認識用統計データからなる。
〔発明の効果〕
以上詳述したようにこの発明によれば、漢字OCRにお
いて、ANK文字および漢字等からなる文章の文字を認
識する場合でも、ANK文字の認識の精度を高めるよう
にして、確実な読取を行なうことができる。したがって
、結果的に帳票等に記録された文章全体の読取精度を高
めることができる効果を得ることができるものである。
【図面の簡単な説明】 第1図はこの発明の一実施例に係る文字認識方式の構成
を示すブロック図、第2図は第1図の動作を説明するた
めの帳票の一例を示す図、第3図は第1図の判定回路の
動作を説明するだめの判定テーブルの一例を示す図であ
る。 9− 2・・・ANK認識部、3・・・漢字認識部、4・・・
判定回路。 出願人代理人  弁理士 鈴 江 武 彦10−

Claims (1)

    【特許請求の範囲】
  1. 認識対象である英数字や記号等の限定範囲の字種の文字
    を認識する第1の認識部と、上記限定字種および漢字等
    を含む広範囲の字種の文字を認識する第2の認識部と、
    上記第1および第2の認識部から出力される各g識結果
    からそれぞれの類似度値により最適の答を選択するため
    に予め設定される認識用統計データに基づいて最終的答
    を判定して出力する認識照合判定部とを具備したことを
    特徴とする文字認識装置。
JP58032426A 1983-02-28 1983-02-28 文字認識装置 Pending JPS59158482A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58032426A JPS59158482A (ja) 1983-02-28 1983-02-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58032426A JPS59158482A (ja) 1983-02-28 1983-02-28 文字認識装置

Publications (1)

Publication Number Publication Date
JPS59158482A true JPS59158482A (ja) 1984-09-07

Family

ID=12358622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58032426A Pending JPS59158482A (ja) 1983-02-28 1983-02-28 文字認識装置

Country Status (1)

Country Link
JP (1) JPS59158482A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223890A (ja) * 1987-03-12 1988-09-19 Toshiba Corp 図面読取装置
JPH01259475A (ja) * 1988-04-11 1989-10-17 Canon Inc 文字認識方法
JPH0221383A (ja) * 1988-01-04 1990-01-24 Sumitomo Electric Ind Ltd 光学文字読取装置
JPH0981730A (ja) * 1995-09-18 1997-03-28 Canon Inc パターン認識方法及び装置及びコンピュータ制御装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223890A (ja) * 1987-03-12 1988-09-19 Toshiba Corp 図面読取装置
JPH0221383A (ja) * 1988-01-04 1990-01-24 Sumitomo Electric Ind Ltd 光学文字読取装置
JPH01259475A (ja) * 1988-04-11 1989-10-17 Canon Inc 文字認識方法
JPH0981730A (ja) * 1995-09-18 1997-03-28 Canon Inc パターン認識方法及び装置及びコンピュータ制御装置

Similar Documents

Publication Publication Date Title
US4989258A (en) Character recognition apparatus
JPS63216189A (ja) 文字認識方法
JPS59158482A (ja) 文字認識装置
JPH0743755B2 (ja) 文字認識装置
JPH0660224A (ja) 光学式文字読取装置
JPS6139175A (ja) 光学的文字読取装置
JPS6336389A (ja) 文字読取装置
JPH0223490A (ja) 文字読取システム
JPS60110089A (ja) 文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JPH01311390A (ja) 文字置換制御方式
JPS6095689A (ja) 光学的文字読取装置
JP2972443B2 (ja) 文字認識装置
JPS62177686A (ja) 光学的文字読取装置
JPS60138689A (ja) 文字認識方法
JPS6160184A (ja) 光学的文字読取装置
JPS60160481A (ja) 文字読取装置
JPS6073796A (ja) 光学文字読取装置
JPH05189604A (ja) 光学的文字読取装置
JPH0576674B2 (ja)
JPS59205681A (ja) 文字読取装置
JPS63143685A (ja) 文字認識装置における認識結果表示方法
JPS61109183A (ja) 文字認識装置
JPS59188783A (ja) 文字判定処理方式
JPS62103784A (ja) 文字読取装置