[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3093397B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP3093397B2
JP3093397B2 JP03334253A JP33425391A JP3093397B2 JP 3093397 B2 JP3093397 B2 JP 3093397B2 JP 03334253 A JP03334253 A JP 03334253A JP 33425391 A JP33425391 A JP 33425391A JP 3093397 B2 JP3093397 B2 JP 3093397B2
Authority
JP
Japan
Prior art keywords
character
character pattern
recognition
pattern
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03334253A
Other languages
English (en)
Other versions
JPH05143778A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP03334253A priority Critical patent/JP3093397B2/ja
Publication of JPH05143778A publication Critical patent/JPH05143778A/ja
Application granted granted Critical
Publication of JP3093397B2 publication Critical patent/JP3093397B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識に係り、特に
マルチサイズ、不定ピッチの日本語文書の文字認識に関
する。
【0002】
【従来の技術】日本語の印刷文書は、文字サイズが可変
のものや、不定ピッチのものが多く、また漢字、ひらが
な、カタカナ等、上下、左右に分離する文字が多く、文
字認識の際に文字切り出しが難しい。
【0003】このため、行画像より垂直射影をとる等に
よって文字塊を切り出し、文字塊を統合して1文字と看
做せる文字パターンを生成し、生成した全ての文字パタ
ーンについて認識を行ない、認識結果の確からしさ(例
えば認識辞書との距離等)を評価することにより、文字
パターンを選択し文字として切り出す方法が考案されて
いる(特開平1−303586号)。
【0004】
【発明が解決しようとする課題】認識結果の情報を文字
切り出しにフィードバックする前記従来方法は、マルチ
サイズ、不定ピッチの日本語文書に対する文字認識にお
いて文字切り出し精度、認識率の向上を期待できるが、
分離文字の切り出し精度に改善の余地が多い。例えば偏
と旁に分離する文字については、偏または旁に相当する
文字パターンと、それらの統合された本来の文字パター
ンが生成されるが、その偏や旁に類似した文字が存在す
る場合には単純な偏または旁に相当する文字パターンの
ほうが認識結果の確からしさの程度が高くなって、それ
が文字として選択されやすい。
【0005】よって本発明の主たる目的は、このような
分離文字の切り出し間違い等が起きにくく、マルチサイ
ズ、不定ピッチの日本語文書に好適な文字認識方法を提
供することにある。
【0006】
【課題を解決するための手段】本発明の骨子は、文書画
像から文字パターンを切り出し、文字パターン辞書と照
合し認識するが、文字パターン辞書に文字を構成するブ
ロックの個数の情報を予め登録しておき、切り出した文
字パターンを構成するブロックの個数を検出し、検出し
たブロック数と認識結果の文字に対し文字パターン辞書
に登録されているブロック数とを比較する。そして、ブ
ロック数が一致しない文字パターンについては、切り出
し方法を変更し改めて文字切り出しを行なってから文字
パターン辞書と照合し認識することである。
【0007】
【作用】例えば垂直射影に注目すると、「機」の文字パ
ターンは偏と旁に相当する2個のブロックに分割でき
る。換言すれば「機」は2個のブロックから成ってい
る。このような文字の分割可能な部分がブロックであ
り、同様のブロック分割が可能な文字は他にも極めて多
い。
【0008】なお、ここで垂直射影に注目してブロック
を定義したが、これは垂直射影を利用すると文書より切
り出した文字パターンのブロック数の検出が容易である
ことと、漢字やひらがな等では左右に分離する文字が多
いことを考慮しているからであって、例えば黒画素の連
結した塊をブロックとする等も可能である。後述の各実
施例における「文字塊」は、垂直射影によって分割され
たブロックである。
【0009】本発明によれば、入力画像より文字パター
ンを切り出し、これを文字パターン辞書と照合すること
により認識するが、認識結果の文字について文字パター
ン辞書に登録されているブロック数と、切り出された文
字パターンのブロック数とを比較する。文字パターン辞
書に登録されているブロック数に間違いがないとする
と、ブロック数が一致したということは、文字が正常に
切り出され正常に認識された可能性が十分に高いと言え
る。
【0010】このような文字切り出しとブロック数の比
較により、分離文字の切り出し間違いと、それによる誤
認が生じにくくなる。
【0011】他方、ブロック数が一致しない場合、切り
出し位置が不適当で、接触文字を1文字として切り出し
た、2個の半角文字を1文字として切り出した、といっ
た文字切り出しの誤りが生じた可能性が高い。この場
合、本発明によれば、文字パターンを分割し、分割後の
各文字パターンを改めて文字パターン辞書と照合するこ
とにより認識するため、上に述べた如き不適当な文字切
り出しを補正し、正しい認識結果を得られるようにな
る。
【0012】
【実施例】以下、図面により本発明の実施例を説明す
る。
【0013】実施例1 図1は本実施例に係る文字認識装置のブロック図であ
る。以下、処理の流れに従い処理内容を説明する。
【0014】(ステップ1)スキャナ等の2値画像入力
装置100によって、原稿(文書もしくは帳票)を2値
画像として読み込み、イメージメモリ102に格納す
る。
【0015】(ステップ2)読み込んだイメージに対し
て、行切り出し部104において、水平射影をとり、水
平射影値が所定の閾値を超える一定幅以上の区間を行画
像として切り出す。
【0016】(ステップ3)切り出された行画像に対し
て、文字塊抽出部106において、垂直射影をとり、垂
直射影値が所定の閾値を超える区間を文字塊(ブロック
に相当する)として抽出する。隣の文字塊との間の空白
が一定幅以下の文字塊は統合する。ただし、統合後の幅
が一定値を超えないようにする。
【0017】(ステップ4)標準文字サイズ算出部10
8において、1行中の文字塊の高さの最大値を求め、こ
れを行の標準文字サイズとして標準文字サイズメモリ1
10に格納する。
【0018】(ステップ5)文字切り出し部112にお
いて、行の先頭(ここでは横書き文書を考えているので
行の左端)より、標準文字サイズを超えないで最大幅と
なるように文字塊を組み合わせ、各文字塊の組を文字パ
ターンとして切り出す。1個の文字パターンに含まれる
文字塊の個数は、文字塊の幅とピッチによって当然に変
化する。文字塊の幅や隣の文字塊との余白が広い場合等
には、文字塊が単独で文字パターンとして切り出される
ことも当然あり得る。そして、切り出した文字パターン
を構成する文字塊すなわちブロックの個数を、ブロック
数メモリ114に格納する。
【0019】なお、前記特開平1−303586号公報
に述べられている方法では、同じ文字塊が複数の文字パ
ターンに重複して用いられることがある。しかし本発明
にあっては、それと異なり、1個の文字塊は必ず1個の
文字パターンの全部または一部として切り出されるもの
で、複数の文字パターン間に文字塊が重複することはな
い。
【0020】(ステップ6)認識部116において、文
字切り出し部112によって切り出された一つの文字パ
ターンと、文字パターン辞書118とを照合し、距離の
小さな候補文字を認識結果として得る。通常、複数の候
補文字を求め、これを距離の小さい順にソートする。
【0021】なお、文字パターン辞書118には、文字
パターンの特徴量に加えて、ブロック数の情報も登録さ
れている。ここでは、切り出された文字パターンより抽
出した特徴量と、文字パターン辞書118に登録された
特徴量との比較を行なう。
【0022】(ステップ7)ブロック数参照部120に
おいて、現在注目している文字パターンのブロック数を
ブロック数メモリ114より読み込み、また、この注目
文字パターンに対して認識部116で得られた第1位候
補文字のブロック数を文字パターン辞書118より読み
込み、両方のブロック数の一致を調べる。
【0023】ブロック数が一致する場合は、現在得られ
ている認識結果のデータ(候補文字コード、距離など)
を認識結果メモリ126に出力し、1文字の処理を終了
する。すなわち、ブロック数が一致した場合、注目して
いる文字パターンが文字として切り出されたことにな
る。
【0024】他方、ブロック数が一致しなかった場合、
次のステップ8以下の処理を行なう。
【0025】(ステップ8)注目している文字パターン
が2個以上の文字塊からなる場合は、文字塊(ブロッ
ク)毎に分割し、また文字パターンが単独の文字塊から
なる場合は、例えば垂直射影の谷の位置で強制的に分割
する。
【0026】(ステップ9)再認識部124において、
ステップ8で再切り出し(分割)された文字パターンを
パターン辞書118と照合して認識し、認識結果データ
を認識結果メモリ126に格納する。
【0027】実施例2 図2は本実施例に係る文字認識装置のブロック図であ
る。図1と同一の符号は同等部を示す。以下、処理の流
れに従い処理内容を説明する。
【0028】(ステップ1〜4)実施例1のステップ1
〜4と同様の処理である。
【0029】(ステップ5)実施例1のステップ5と同
様の方法によって、文字切り出し部112Aで文字パタ
ーンを切り出し、各文字パターンのブロック数をブロッ
ク数メモリ114に格納する。文字切り出し部112A
はさらに、文字パターン毎の文字塊の組み合わせの情報
を組み合わせ情報メモリ130に格納する。
【0030】(ステップ6)認識部116Aにおいて、
文字切り出し部112Aにより切り出された一つの文字
パターンと文字パターン辞書118とを照合し、認識結
果として候補文字のコード、距離、総輪郭数を認識情報
メモリ132に格納する。この距離と輪郭数は後述のよ
うに認識結果の確からしさの評価のために用いられる。
【0031】(ステップ7)実施例1のステップ7と同
様に、ブロック数の比較を行ない、一致した場合は、注
目した文字パターンを文字として切り出し、その認識結
果を認識結果メモリ126に出力し、この文字の処理を
終わる。ブロック数が一致しなかった場合、次のステッ
プ8の処理に進む。
【0032】(ステップ8)実施例1のステップ8と同
様の文字切り出しのやり直しを行なう。ただし、この再
切り出し処理を文字切り出し部112Aで実行する。ま
た、ここで切り出された文字パターンの文字塊の組み合
わせ情報を組み合わせ情報メモリ130に格納する。な
お、再切り出し前(分割前)の文字パターンについての
文字塊組み合わせ情報も保存される。
【0033】(ステップ9)認識部116Aにおいて、
ステップ8で再切り出しされた文字パターンについて文
字パターン辞書118と照合し、認識結果データを認識
情報メモリ132に格納する。なお、ステップ6で得ら
れた認識結果(再文字切り出しで分割される前の文字パ
ターンの認識結果)も認識情報メモリ132に保存され
ている。
【0034】(ステップ10)評価値算出部134にお
いて、ステップ6で得られた分割前の認識結果の第1候
補と、ステップ9で得られた分割後の認識結果の第1候
補について、それぞれの距離及び総輪郭数を用い、評価
値を算出して評価値メモリ136に格納する。ただし 評価値=距離/総輪郭数
【0035】(ステップ11)文字パターン選択部13
8において、分割後の認識結果の評価値の最大値と、分
割前の認識結果の評価値とを比較し、その値が小さいほ
うの認識結果を認識結果メモリ126に出力する。すな
わち、分割前の認識結果の評価値のほうが小さい場合
は、分割前の文字パターンを文字として切り出し、そう
でない場合は再切り出しにより分割後の文字パターンを
文字として切り出すということである。
【0036】図3に示した文字列の例により、ステップ
8〜11の内容を説明する。図3において、a〜fは行
画像の垂直射影により直接抽出される文字塊(統合前)
であり、これに統合処理を施すことによってA〜Eの文
字塊が抽出される。
【0037】この例の「機」について、ステップ5の標
準文字サイズを基準とした文字切り出しによって(2)
の文字パターンが切り出され、これがステップ6で
「機」として認識されたとする。つまり、正しく切り出
され認識された。
【0038】ところが、例えば文字パターン辞書118
に「機」に対するブロック数が間違って1として登録さ
れていたといった原因で、ステップ7でブロック数が一
致しなかったとする。
【0039】そこで、ステップ8で「機」が(1)と
(3)の二つの文字パターンに分割され、それぞれが
「木」、「幾」として認識されたとする。実施例1によ
れば、これが最終的な認識結果として誤って出力されて
しまう。しかし本実施例によれば、(1)または(3)
のいずれかの文字パターンについての評価値が(2)の
文字パターンの評価値より大きければ(通常、こうな
る)、(2)の文字パターンを選択し、その認識結果を
出力することができる。
【0040】同様にして、(5)の文字パターンが選択
される。(7)の文字パターンは再切り出しを経由する
ことなく切り出される。
【0041】以上説明したように、分割前後の文字パタ
ーンの認識結果の確からしさの評価を導入することによ
って、文字パターン辞書118に登録されたブロック数
が不適当であるため、あるいは、文字パターン辞書11
8の作成に用いられた文字画像と実際に認識しようとす
る文字画像の相違が大きいために、ブロック数が一致し
ない場合でも、分離文字の切り出し間違いをより確実に
回避できるようになる。逆に、接触した2文字の場合に
は、再切り出しで分離された後の各文字を正しく切り出
すことができるようになる。
【0042】実施例3 図4は本実施例に係る文字認識装置のブロック図であ
る。図2と同一の符号は同一部を示す。半角文字判定部
140と文字幅メモリ142は新たに設けられたもので
ある。本実施例と実施例2との処理内容の相違は以下の
通りである。
【0043】まず、標準文字サイズ算出部108Bにお
いて、標準文字サイズとは別に、1行中の文字塊の幅よ
り標準文字幅を求めて文字幅メモリ142に格納する。
標準文字幅とは、全角文字と看做し得る標準的な文字幅
であり、例えば行中の文字塊の最大幅を用いる。
【0044】再文字切り出しによる文字パターンの分割
が行なわれた場合に、半角文字判定部140において、
分割後の各文字パターンの幅を標準文字幅メモリ142
より読み込んだ標準文字幅とを比較し、標準文字幅の1
/2以下の幅の文字パターンを半角文字と判定する。そ
して、文字パターン選択部138Bにおいて、半角文字
と判定された文字パターンの認識結果が特定の文字種
(例えば漢字、ひらがな)の場合、その評価値に重みを
付けることにより(ここで用いられる評価値は、大きい
ほど確からしさが低いことを意味する)、分割後の文字
パターンを選択されにくくしてから、分割前の文字パタ
ーンとの評価値の比較を行なって最終的に切り出すべき
文字パターンを選択し、その認識結果を最終的認識結果
として出力する。
【0045】このような処理を追加することにより、分
離文字を、通常の文書で出現頻度の少ない半角漢字や半
角ひらがなと間違って切り出すことがなくなる。
【0046】実施例4 図5は本実施例に係る文字認識装置のブロック図であ
る。図2と同一の符号は同一部を示す。ピッチ情報メモ
リ146は、新たに設けられたものである。本実施例と
実施例2との処理内容の相違は以下の通りである。
【0047】文字切り出し部112Cは、標準文字サイ
ズを基準にして文字パターンを切り出すが、これとは別
に行中の各文字塊の前後の間隔を求めてピッチ情報メモ
リ146に格納する。
【0048】文字パターン選択部138Cは、再文字切
り出しにより分割後の文字パターンと分割前の文字パタ
ーンとの選択方法を、ピッチ情報によって切り替える。
すなわち、分割後の文字パターンであるところの注目し
た文字塊と次の文字塊との間隔が、注目文字塊と前の文
字塊との間隔から一定値を差し引いた値より大きい場
合、注目文字塊が単独で文字である可能性が大きいとし
て、注目文字塊のみからなる文字パターンと、注目文字
塊と次の文字塊を統合した文字パターンとのみの間で、
評価値の比較を行なって、その一方を選択し切り出す。
以上の条件を満たさない場合の文字パターン選択方法は
実施例2と同じである。
【0049】図6に示した例において、文字パターン
(4)について再文字切り出しが行なわれた場合、分割
後の文字パターンの一つである文字塊(3)に注目し、
これと次の文字塊(4)との間隔bと前の文字塊(2)
との間隔aが b>a−k (ただしkは一定値) の条件を満たす場合、評価値の比較を、注目文字塊単独
の文字パターン(3)と文字パターン(4)との間での
み行ない、一方の文字パターンを選択する。文字塊4す
なわち文字パターン(7)は対象から外される。
【0050】他方、上記条件を満たさない場合には、文
字パターン(3)と(7)の評価値の最大値と、文字パ
ターン(4)の評価値とを比較することによって、文字
パターン(3)及び(7)を選択し、あるいは文字パタ
ーン(4)を選択することになる。
【0051】なお、一定値kは固定値として与えられる
か、あるいは1行中の文字ピッチから統計的に求められ
る値である。
【0052】実施例5 図7は本実施例に係る文字認識装置のブロック図であ
る。図2と同一の符号は同一部を示す。文字サイズ算出
部150と文字サイズメモリ152は、新たに設けられ
たものである。
【0053】(ステップ1〜3)実施例2のステップ1
〜3と同じ処理で、スキャナ等の2値画像入力装置10
0によって原稿(文書もしくは帳票)をイメージメモリ
102に読み込み、行切り出し部104によって行画像
を切り出し、文字塊抽出部106によって行画像より文
字塊を抽出する。
【0054】(ステップ4)文字パターン選択部138
Dにおいて、行の方向を読み込む。行の方向は、予め指
定するか、あるいは自動的に判別する。
【0055】横書き原稿の場合、実施例2のステップ4
以下と同じ内容の横書き処理を行なうが、縦書き原稿の
場合は次のステップ5以下の縦書き処理を実行する。
【0056】(ステップ5)標準文字サイズ算出部10
8Dで、1行内の標準文字サイズを算出して標準文字サ
イズメモリ110に格納する。算出方法は、行の幅で近
似する方法でも、行中の文字塊の幅より統計的処理によ
って算出する方法でもよい。
【0057】(ステップ6)実施例1のステップ5と同
様の方法によって、文字切り出し部112Aで文字パタ
ーンを切り出し、各文字パターンのブロック数をブロッ
ク数メモリ114に格納するとともに、文字パターン毎
の文字塊の組み合わせの情報を組み合わせ情報メモリ1
30に格納する。
【0058】また、切り出した文字パターンの文字サイ
ズを求める。ここで文字サイズとは、文字パターンの幅
に次の文字パターンまでのピッチを加えた値である。そ
して、文字サイズと標準文字サイズとの差(サイズ差)
を文字サイズメモリ152に格納する。
【0059】(ステップ7)認識部116Aにおいて、
切り出された文字パターンと文字パターン辞書118と
を照合し、認識結果として候補文字のコード、距離、総
輪郭数を認識情報メモリ132に格納する。
【0060】(ステップ8)実施例1のステップ7と同
様に、ブロック数の比較を行ない、一致した場合は、注
目した文字パターンを文字として切り出し、その認識結
果を認識結果メモリ126に出力し、この文字の処理を
終わる。ブロック数が一致しなかった場合、次のステッ
プ9の処理に進む。
【0061】(ステップ9)実施例1のステップ8と同
様の文字切り出しのやり直しを文字切り出し部112A
で行ない、また切り出した文字パターンの文字塊の組み
合わせ情報を組み合わせ情報メモリ130に格納する。
再切り出し前(分割前)の文字パターンについての文字
塊組み合わせ情報も保存される。
【0062】また、文字サイズ算出部150において、
文字サイズを求め、それと標準文字サイズとの差を計算
し文字サイズメモリ152に格納する。
【0063】(ステップ10)認識部116Aにおい
て、ステップ9で再切り出しされた文字パターンについ
て文字パターン辞書118と照合し、認識結果データを
認識情報メモリ132に格納する。再文字切り出しで分
割される前の文字パターンの認識結果も保存される。
【0064】(ステップ11)評価値算出部134にお
いて、ステップ7で得られた分割前の認識結果の第1候
補と、ステップ10で得られた分割後の認識結果の第1
候補について、それぞれの距離及び総輪郭数を用い、評
価値を算出して評価値メモリ136に格納する。ただし 評価値=距離/総輪郭数
【0065】(ステップ12)文字パターン選択部13
8Dにおいて、分割前後の各文字パターンのサイズ差を
文字サイズメモリ152より読み出し、サイズ差の小さ
い順に文字パターンをソートする。図8に示した例にお
いて、Dが分割前の文字パターンで、これがCとEの文
字パターンに分割された場合、これら文字パターンは
C,D,Eの順にソートされることになる。
【0066】なお、このような目的にサイズ差を用いる
ため、文字サイズに次の文字パターンとのピッチを含め
ることによって、図8に示したAのような幅が極端に小
さい文字パターンが選択対象に含まれた場合の影響を少
なくしている。
【0067】(ステップ13)文字パターン選択部13
8Dは、分割前後の各文字パターンの評価値を評価値メ
モリ136より読み出し、評価値の小さい順に文字パタ
ーンをソートする。
【0068】(ステップ14)文字パターン選択部13
8Dにおいて、サイズ差によりソートされた第1位の文
字パターンと、評価値によりソートされた第1位の文字
パターンとが同一のものであれば、その文字パターンを
選択し(最終的に文字として切り出し)、その認識結果
のデータを認識結果メモリ126に出力する。そうでな
い場合は、次のステップ15によって文字パターンを選
択する。
【0069】(ステップ15)評価値によりソートされ
た第1位と第2位の文字パターンの評価値の差が一定値
以上であれば、第1位の文字パターンを選択し、その認
識結果を出力する。そうでない場合は次のステップ16
により文字パターンを選択する。
【0070】(ステップ16)サイズ差によりソートさ
れた第1位と第2位の文字パターンのサイズ差の差が一
定値以上であれば、第1位の文字パターンを選択し、そ
の認識結果を出力する。
【0071】(ステップ17)ステップ14〜16のい
ずれでも文字パターンを選択できなかった場合は、評価
値によりソートされた第1位の文字パターンを選択し、
その認識結果を出力する。
【0072】図8に示した例において、C,D,Eの文
字パターン選択の場合、サイズ差によりC,D,Eの順
に文字パターンがソートされる可能性が高いが、評価値
によりソートされるとDが第1位の文字パターンとなる
であろう。したがって、ステップ18,16,17のい
ずれかでDの文字パターンが正しく選択されることにな
る。
【0073】実施例6 図9は本実施例に係る文字認識装置のブロック図であ
る。図2と同一の符号は同等部を示す。本実施例と実施
例2との処理内容の相違は以下の通りである。
【0074】実施例2のステップ1〜10までの処理と
同じ内容の処理を行なう。そして、再切り出しにより分
割される前の文字パターンに含まれる文字塊(ブロッ
ク)が2個以下であれば、実施例2のステップ11以下
と同じ内容の文字パターン選択処理を行なう。
【0075】しかし、分割前の文字パターンが3個以上
の文字塊(ブロック)からなる場合には、比較対象とな
る文字パターンが多く発生し処理に時間がかかる、誤選
択の危険が増加することがある等の問題がある。そこ
で、この場合には、文字パターン選択部138Eにおい
て、比較対象を、先頭の文字塊を含む3個の文字パター
ンに限定し、その中で評価値が最小の文字パターンを文
字として選択し、その認識結果を出力する。
【0076】図10に示す「川」の例では、a〜fの6
個の文字パターンが存在することになるが、分割前の文
字パターンcのブロック数は3であるので、先頭の文字
塊を含むa,b,cの3個の文字パターンに限定して評
価値を比較し、その結果としてcの文字パターンを選択
することになる。
【0077】以上説明したように、本発明に係る文字認
識装置には、文字のブロック数の情報が登録された文字
パターン辞書が用いられる。このブロック数情報は、従
来の文字認識装置の文字パターン辞書には含まれていな
かったものである。
【0078】図11は、ブロック数情報が含まれていな
い作成済み文字パターン辞書に、ブロック数情報を人手
によって対話的に登録するためのシステムの概略ブロッ
ク図である。なお、このシステムは文字認識装置に組み
込まれるか、文字認識装置から独立したシステムとして
構築される。
【0079】文字パターン辞書にブロック数情報を登録
する場合、準備処理として、文字のブロック数の登録を
除いて既に作成済みの文字パターン辞書のデータ202
(文字のコードと特徴量等)をメモリに読み込み、また
文字パターン辞書を作成する際に用いた画像データ20
4をメモリに読み込み、さらにブロック数情報を記憶す
るための領域206をメモリ上に確保する。そして、入
力装置(キーボード、マウス等)208及びディスプレ
イ210を用い、次のような対話的処理によってブロッ
ク数の登録を行なう。
【0080】入力装置208より処理したい文字の表示
を指定すると、この指示が対話処理部212を経由して
辞書作成部212に通知され、辞書作成部212によっ
て、文字パターン辞書データ202の指定文字のレコー
ドの内容と、指定文字の画像データが対話処理部212
へ送られ、これが対話処理部212によってディスプレ
イ210に出力される。オペレータは、ディスプレイ2
10の画面上で文字画像を観察し、文字を構成するブロ
ック数を入力装置208より入力する。辞書作成部21
4は、入力されたブロック数を対話処理部212経由で
受取り、このブロック数の情報をメモリのブロック数記
憶領域208の対応位置に格納する。
【0081】このような対話処理によって、予め作成さ
れている文字パターン辞書にブロック数情報を登録し、
本発明の文字認識に必要な文字パターン辞書を作成する
ことができる。
【0082】図12は、本発明による文字認識に必要な
文字パターン辞書を、最初から作成するためのシステム
のブロック図である。辞書作成処理は次の通りである。
【0083】(ステップ1)2値画像入力装置300に
おいて、文字パターン辞書に登録する文字が印字された
原稿をスキャナによって読み込み、2値画像に変換して
イメージメモリ302に格納する。この時に用いられる
原稿は、十分に広い文字間隔で定ピッチ印字されてい
る。
【0084】(ステップ2)行切り出し部304におい
て、原稿の2値画像より垂直射影を利用して行画像を切
り出す。
【0085】(ステップ3)文字切り出し部308にお
いて、原稿の印字ピッチに基づいて行画像より文字を切
り出すとともに、垂直射影を用いて文字塊を抽出し、切
り出した各文字を構成している文字塊の個数をブロック
数としてブロック数メモリ310に格納する。
【0086】(ステップ4)辞書作成部312におい
て、切り出された文字の特徴量を抽出し、この特徴量と
ともに、ブロック数メモリ310より読み込んだブロッ
ク数と、イメージメモリ302より読み込んだ文字画像
データを文字パターン辞書314に登録する。なお、文
字画像データを文字パターン辞書314に登録するの
は、辞書修正作業等の便宜のためのである。
【0087】以上のステップ1〜4を繰り返すことによ
って、必要な文字数の文字パターン辞書314を作成す
ることができる。
【0088】図13は、このようにして作成した文字パ
ターン辞書の修正を行なうシステムのブロック図であ
る。修正処理の概略は次の通りである。
【0089】まず、図12のシステム等で作成された文
字パターン辞書400を読み込む。
【0090】入力装置(キーボード、マウス等)404
より修正したい文字の表示を指定すると、この指示が対
話処理部408を経由して辞書修正部402に通知さ
れ、辞書修正部402によって、文字パターン辞書40
0の指定文字の画像データとブロック数情報を読み出
し、これを対話処理部408経由でディスプレイ406
に出力する。オペレータは、ディスプレイ406に表示
された文字画像及びブロック数を確認し、修正が必要で
あれば、入力装置404より正しいブロック数を入力す
る。対話処理部408は、入力されたブロック数と従前
のブロック数とを比較し、一致しない場合には、入力さ
れたブロック数を辞書修正部402に渡し修正を指示す
る。指示された辞書修正部402は、文字パターン辞書
400の対応文字のブロック数情報を、渡されたブロッ
ク数によって書き換える。
【0091】
【発明の効果】以上の説明から理解されるように、請求
項1ないし請求項7の発明によれば、文字を構成するブ
ロックの個数に注目し、認識した文字パターンのブロッ
ク数と、認識結果の文字について文字パターン辞書に登
録されているブロック数とを比較し、ブロック数が不一
致の場合に文字パターンを分割し再度認識するため、マ
ルチサイズ、不定ピッチの日本語文書に対しても高い認
識率を達成でき、特に請求項3ないし請求項7の発明に
よれば、文字切り出しが困難な分離文字等に対する切り
出し精度と認識率を大幅に改善できる。
【図面の簡単な説明】
【図1】実施例1に係る文字認識装置のブロック図であ
る。
【図2】本発明の実施例2に係る文字認識装置のブロッ
ク図である。
【図3】実施例2による処理例の説明図である。
【図4】実施例3に係る文字認識装置のブロック図であ
る。
【図5】実施例4に係る文字認識装置のブロック図であ
る。
【図6】実施例4による処理例の説明図である。
【図7】実施例5に係る文字認識装置のブロック図であ
る。
【図8】実施例5による処理例の説明図である。
【図9】実施例6に係る文字認識装置のブロック図であ
る。
【図10】実施例6による処理例の説明図である。
【図11】文字パターン辞書にブロック数情報を登録す
るためのシステムのブロック図である。
【図12】辞書作成用原稿を読み取って、文字のブロッ
ク数情報を含む文字パターン辞書を自動的に作成するシ
ステムのブロック図である。
【図13】文字パターン辞書のブロック数情報を修正す
るためのシステムのブロック図である。
【符号の説明】
100 2値画像入力装置 102 イメージメモリ 104 行切り出し部 106 文字塊抽出部 108,108B,108D 標準文字サイズ算出部 110 標準文字サイズメモリ 112,112A,112C 文字切り出し部 114 ブロック数メモリ 116,116A 認識部 118 文字パターン辞書 120 ブロック数参照部 122 再文字切り出し部 124 再認識部 126 認識結果メモリ 130 組み合わせ情報メモリ 132 認識情報メモリ 134 評価値算出部 136 評価値メモリ 138,138B〜138E 文字パターン選択部 140 半角文字判定部 142 文字幅メモリ 146 ピッチ情報メモリ 150 文字サイズ算出部 152 文字サイズメモリ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/34 G06K 9/62

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力画像から文字パターンを切り出し、
    切り出した文字パターンを、文字を構成するブロックの
    個数の情報が登録された文字パターン辞書と照合するこ
    とにより認識し、認識結果の文字について文字パターン
    辞書に登録されているブロック数と、文字パターンを構
    成するブロックの個数とを比較し、この比較結果が不一
    致の場合に、文字パターンを2個以上の文字パターンに
    分割して再度、文字パターン辞書と照合し認識すること
    を特徴とする文字認識方法。
  2. 【請求項2】 請求項1記載の文字認識方法において、
    文字パターンを分割して再度認識した場合に、分割前ま
    たは分割後の認識結果を最終的な認識結果として選択す
    ることを特徴とする文字認識方法。
  3. 【請求項3】 請求項2記載の文字認識方法において、
    文字パターンを分割し再度認識した場合に、分割後の認
    識結果の確からしさと分割前の認識結果の確からしさを
    比較することによって最終的認識結果を選択することを
    特徴とする文字認識方法。
  4. 【請求項4】 請求項3記載の文字認識方法において、
    分割後と分割前の認識結果の確からしさを比較する場合
    に、分割後の文字パターンの幅が半角文字と看做し得る
    ときで、かつ分割後の認識結果が特定文字種であるとき
    は、分割後の認識結果の確からしさの程度を下げること
    を特徴とする文字認識方法。
  5. 【請求項5】 請求項3記載の文字認識方法において、
    分割後と分割前の認識結果の確からしさを比較する場合
    に、分割後の文字パターンの前後の間隔に応じて、認識
    結果の確からしさの比較方法を変更することを特徴とす
    る文字認識方法。
  6. 【請求項6】 請求項2記載の文字認識方法において、
    文字パターンを分割し再度認識した場合に、分割後と分
    割前の認識結果の確からしさ、及び文字パターンの幅に
    次の文字パターンまでのピッチを加えた値に基づいて、
    最終的認識結果を選択することを特徴とする文字認識方
    法。
  7. 【請求項7】 請求項2記載の文字認識方法において、
    文字パターンを分割して再度認識した場合に、分割前の
    文字パターンを構成するブロックの個数に応じて、最終
    的認識結果の選択方法を変更することを特徴とする文字
    認識方法。
JP03334253A 1991-11-22 1991-11-22 文字認識方法 Expired - Fee Related JP3093397B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03334253A JP3093397B2 (ja) 1991-11-22 1991-11-22 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03334253A JP3093397B2 (ja) 1991-11-22 1991-11-22 文字認識方法

Publications (2)

Publication Number Publication Date
JPH05143778A JPH05143778A (ja) 1993-06-11
JP3093397B2 true JP3093397B2 (ja) 2000-10-03

Family

ID=18275269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03334253A Expired - Fee Related JP3093397B2 (ja) 1991-11-22 1991-11-22 文字認識方法

Country Status (1)

Country Link
JP (1) JP3093397B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135429A (zh) * 2019-04-18 2019-08-16 深圳壹账通智能科技有限公司 扫描文字分段方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
JPH05143778A (ja) 1993-06-11

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
EP1312038B1 (en) Orthogonal technology for multi-line character recognition
US5539841A (en) Method for comparing image sections to determine similarity therebetween
EP0439951A2 (en) Data processing
US5191612A (en) Character recognition system
GB2208735A (en) Character recognition system
JPH05242292A (ja) 分離方法
EP0810542A2 (en) Bitmap comparison apparatus and method
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
JP2000315247A (ja) 文字認識装置
US4887301A (en) Proportional spaced text recognition apparatus and method
JP3093397B2 (ja) 文字認識方法
JP3157530B2 (ja) 文字切り出し方法
JP3173363B2 (ja) Ocrのメンテナンス方法及び装置
JP2851102B2 (ja) 文字切出し方法
JP2995818B2 (ja) 文字切り出し方法
JP2982075B2 (ja) 文字切出し方法
JP2895115B2 (ja) 文字切出し方法
JP2972443B2 (ja) 文字認識装置
JP3428504B2 (ja) 文字認識装置
JPH04130979A (ja) 文字画像切出し方法
JPH02230484A (ja) 文字認識装置
JPH0535916A (ja) 文字切り出し方法
JPH0535917A (ja) 文字切り出し方法
JPH09167206A (ja) 日英混在文書のスペース検出方法、ピッチ書式判定方法、定ピッチ英数文字列のスペース検出方法、及びプロポーショナルピッチ英数文字列のスペース検出方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees