JP3093397B2

JP3093397B2 - 文字認識方法

Info

Publication number: JP3093397B2
Application number: JP03334253A
Authority: JP
Inventors: 吾朗別所
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1991-11-22
Filing date: 1991-11-22
Publication date: 2000-10-03
Anticipated expiration: 2015-10-03
Also published as: JPH05143778A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字認識に係り、特に
マルチサイズ、不定ピッチの日本語文書の文字認識に関
する。

【０００２】

【従来の技術】日本語の印刷文書は、文字サイズが可変
のものや、不定ピッチのものが多く、また漢字、ひらが
な、カタカナ等、上下、左右に分離する文字が多く、文
字認識の際に文字切り出しが難しい。

【０００３】このため、行画像より垂直射影をとる等に
よって文字塊を切り出し、文字塊を統合して１文字と看
做せる文字パターンを生成し、生成した全ての文字パタ
ーンについて認識を行ない、認識結果の確からしさ（例
えば認識辞書との距離等）を評価することにより、文字
パターンを選択し文字として切り出す方法が考案されて
いる（特開平１−３０３５８６号）。

【０００４】

【発明が解決しようとする課題】認識結果の情報を文字
切り出しにフィードバックする前記従来方法は、マルチ
サイズ、不定ピッチの日本語文書に対する文字認識にお
いて文字切り出し精度、認識率の向上を期待できるが、
分離文字の切り出し精度に改善の余地が多い。例えば偏
と旁に分離する文字については、偏または旁に相当する
文字パターンと、それらの統合された本来の文字パター
ンが生成されるが、その偏や旁に類似した文字が存在す
る場合には単純な偏または旁に相当する文字パターンの
ほうが認識結果の確からしさの程度が高くなって、それ
が文字として選択されやすい。

【０００５】よって本発明の主たる目的は、このような
分離文字の切り出し間違い等が起きにくく、マルチサイ
ズ、不定ピッチの日本語文書に好適な文字認識方法を提
供することにある。

【０００６】

【課題を解決するための手段】本発明の骨子は、文書画
像から文字パターンを切り出し、文字パターン辞書と照
合し認識するが、文字パターン辞書に文字を構成するブ
ロックの個数の情報を予め登録しておき、切り出した文
字パターンを構成するブロックの個数を検出し、検出し
たブロック数と認識結果の文字に対し文字パターン辞書
に登録されているブロック数とを比較する。そして、ブ
ロック数が一致しない文字パターンについては、切り出
し方法を変更し改めて文字切り出しを行なってから文字
パターン辞書と照合し認識することである。

【０００７】

【作用】例えば垂直射影に注目すると、「機」の文字パ
ターンは偏と旁に相当する２個のブロックに分割でき
る。換言すれば「機」は２個のブロックから成ってい
る。このような文字の分割可能な部分がブロックであ
り、同様のブロック分割が可能な文字は他にも極めて多
い。

【０００８】なお、ここで垂直射影に注目してブロック
を定義したが、これは垂直射影を利用すると文書より切
り出した文字パターンのブロック数の検出が容易である
ことと、漢字やひらがな等では左右に分離する文字が多
いことを考慮しているからであって、例えば黒画素の連
結した塊をブロックとする等も可能である。後述の各実
施例における「文字塊」は、垂直射影によって分割され
たブロックである。

【０００９】本発明によれば、入力画像より文字パター
ンを切り出し、これを文字パターン辞書と照合すること
により認識するが、認識結果の文字について文字パター
ン辞書に登録されているブロック数と、切り出された文
字パターンのブロック数とを比較する。文字パターン辞
書に登録されているブロック数に間違いがないとする
と、ブロック数が一致したということは、文字が正常に
切り出され正常に認識された可能性が十分に高いと言え
る。

【００１０】このような文字切り出しとブロック数の比
較により、分離文字の切り出し間違いと、それによる誤
認が生じにくくなる。

【００１１】他方、ブロック数が一致しない場合、切り
出し位置が不適当で、接触文字を１文字として切り出し
た、２個の半角文字を１文字として切り出した、といっ
た文字切り出しの誤りが生じた可能性が高い。この場
合、本発明によれば、文字パターンを分割し、分割後の
各文字パターンを改めて文字パターン辞書と照合するこ
とにより認識するため、上に述べた如き不適当な文字切
り出しを補正し、正しい認識結果を得られるようにな
る。

【００１２】

【実施例】以下、図面により本発明の実施例を説明す
る。

【００１３】実施例１図１は本実施例に係る文字認識装置のブロック図であ
る。以下、処理の流れに従い処理内容を説明する。

【００１４】（ステップ１）スキャナ等の２値画像入力
装置１００によって、原稿（文書もしくは帳票）を２値
画像として読み込み、イメージメモリ１０２に格納す
る。

【００１５】（ステップ２）読み込んだイメージに対し
て、行切り出し部１０４において、水平射影をとり、水
平射影値が所定の閾値を超える一定幅以上の区間を行画
像として切り出す。

【００１６】（ステップ３）切り出された行画像に対し
て、文字塊抽出部１０６において、垂直射影をとり、垂
直射影値が所定の閾値を超える区間を文字塊（ブロック
に相当する）として抽出する。隣の文字塊との間の空白
が一定幅以下の文字塊は統合する。ただし、統合後の幅
が一定値を超えないようにする。

【００１７】（ステップ４）標準文字サイズ算出部１０
８において、１行中の文字塊の高さの最大値を求め、こ
れを行の標準文字サイズとして標準文字サイズメモリ１
１０に格納する。

【００１８】（ステップ５）文字切り出し部１１２にお
いて、行の先頭（ここでは横書き文書を考えているので
行の左端）より、標準文字サイズを超えないで最大幅と
なるように文字塊を組み合わせ、各文字塊の組を文字パ
ターンとして切り出す。１個の文字パターンに含まれる
文字塊の個数は、文字塊の幅とピッチによって当然に変
化する。文字塊の幅や隣の文字塊との余白が広い場合等
には、文字塊が単独で文字パターンとして切り出される
ことも当然あり得る。そして、切り出した文字パターン
を構成する文字塊すなわちブロックの個数を、ブロック
数メモリ１１４に格納する。

【００１９】なお、前記特開平１−３０３５８６号公報
に述べられている方法では、同じ文字塊が複数の文字パ
ターンに重複して用いられることがある。しかし本発明
にあっては、それと異なり、１個の文字塊は必ず１個の
文字パターンの全部または一部として切り出されるもの
で、複数の文字パターン間に文字塊が重複することはな
い。

【００２０】（ステップ６）認識部１１６において、文
字切り出し部１１２によって切り出された一つの文字パ
ターンと、文字パターン辞書１１８とを照合し、距離の
小さな候補文字を認識結果として得る。通常、複数の候
補文字を求め、これを距離の小さい順にソートする。

【００２１】なお、文字パターン辞書１１８には、文字
パターンの特徴量に加えて、ブロック数の情報も登録さ
れている。ここでは、切り出された文字パターンより抽
出した特徴量と、文字パターン辞書１１８に登録された
特徴量との比較を行なう。

【００２２】（ステップ７）ブロック数参照部１２０に
おいて、現在注目している文字パターンのブロック数を
ブロック数メモリ１１４より読み込み、また、この注目
文字パターンに対して認識部１１６で得られた第１位候
補文字のブロック数を文字パターン辞書１１８より読み
込み、両方のブロック数の一致を調べる。

【００２３】ブロック数が一致する場合は、現在得られ
ている認識結果のデータ（候補文字コード、距離など）
を認識結果メモリ１２６に出力し、１文字の処理を終了
する。すなわち、ブロック数が一致した場合、注目して
いる文字パターンが文字として切り出されたことにな
る。

【００２４】他方、ブロック数が一致しなかった場合、
次のステップ８以下の処理を行なう。

【００２５】（ステップ８）注目している文字パターン
が２個以上の文字塊からなる場合は、文字塊（ブロッ
ク）毎に分割し、また文字パターンが単独の文字塊から
なる場合は、例えば垂直射影の谷の位置で強制的に分割
する。

【００２６】（ステップ９）再認識部１２４において、
ステップ８で再切り出し（分割）された文字パターンを
パターン辞書１１８と照合して認識し、認識結果データ
を認識結果メモリ１２６に格納する。

【００２７】実施例２図２は本実施例に係る文字認識装置のブロック図であ
る。図１と同一の符号は同等部を示す。以下、処理の流
れに従い処理内容を説明する。

【００２８】（ステップ１〜４）実施例１のステップ１
〜４と同様の処理である。

【００２９】（ステップ５）実施例１のステップ５と同
様の方法によって、文字切り出し部１１２Ａで文字パタ
ーンを切り出し、各文字パターンのブロック数をブロッ
ク数メモリ１１４に格納する。文字切り出し部１１２Ａ
はさらに、文字パターン毎の文字塊の組み合わせの情報
を組み合わせ情報メモリ１３０に格納する。

【００３０】（ステップ６）認識部１１６Ａにおいて、
文字切り出し部１１２Ａにより切り出された一つの文字
パターンと文字パターン辞書１１８とを照合し、認識結
果として候補文字のコード、距離、総輪郭数を認識情報
メモリ１３２に格納する。この距離と輪郭数は後述のよ
うに認識結果の確からしさの評価のために用いられる。

【００３１】（ステップ７）実施例１のステップ７と同
様に、ブロック数の比較を行ない、一致した場合は、注
目した文字パターンを文字として切り出し、その認識結
果を認識結果メモリ１２６に出力し、この文字の処理を
終わる。ブロック数が一致しなかった場合、次のステッ
プ８の処理に進む。

【００３２】（ステップ８）実施例１のステップ８と同
様の文字切り出しのやり直しを行なう。ただし、この再
切り出し処理を文字切り出し部１１２Ａで実行する。ま
た、ここで切り出された文字パターンの文字塊の組み合
わせ情報を組み合わせ情報メモリ１３０に格納する。な
お、再切り出し前（分割前）の文字パターンについての
文字塊組み合わせ情報も保存される。

【００３３】（ステップ９）認識部１１６Ａにおいて、
ステップ８で再切り出しされた文字パターンについて文
字パターン辞書１１８と照合し、認識結果データを認識
情報メモリ１３２に格納する。なお、ステップ６で得ら
れた認識結果（再文字切り出しで分割される前の文字パ
ターンの認識結果）も認識情報メモリ１３２に保存され
ている。

【００３４】（ステップ１０）評価値算出部１３４にお
いて、ステップ６で得られた分割前の認識結果の第１候
補と、ステップ９で得られた分割後の認識結果の第１候
補について、それぞれの距離及び総輪郭数を用い、評価
値を算出して評価値メモリ１３６に格納する。ただし評価値＝距離／総輪郭数

【００３５】（ステップ１１）文字パターン選択部１３
８において、分割後の認識結果の評価値の最大値と、分
割前の認識結果の評価値とを比較し、その値が小さいほ
うの認識結果を認識結果メモリ１２６に出力する。すな
わち、分割前の認識結果の評価値のほうが小さい場合
は、分割前の文字パターンを文字として切り出し、そう
でない場合は再切り出しにより分割後の文字パターンを
文字として切り出すということである。

【００３６】図３に示した文字列の例により、ステップ
８〜１１の内容を説明する。図３において、ａ〜ｆは行
画像の垂直射影により直接抽出される文字塊（統合前）
であり、これに統合処理を施すことによってＡ〜Ｅの文
字塊が抽出される。

【００３７】この例の「機」について、ステップ５の標
準文字サイズを基準とした文字切り出しによって（２）
の文字パターンが切り出され、これがステップ６で
「機」として認識されたとする。つまり、正しく切り出
され認識された。

【００３８】ところが、例えば文字パターン辞書１１８
に「機」に対するブロック数が間違って１として登録さ
れていたといった原因で、ステップ７でブロック数が一
致しなかったとする。

【００３９】そこで、ステップ８で「機」が（１）と
（３）の二つの文字パターンに分割され、それぞれが
「木」、「幾」として認識されたとする。実施例１によ
れば、これが最終的な認識結果として誤って出力されて
しまう。しかし本実施例によれば、（１）または（３）
のいずれかの文字パターンについての評価値が（２）の
文字パターンの評価値より大きければ（通常、こうな
る）、（２）の文字パターンを選択し、その認識結果を
出力することができる。

【００４０】同様にして、（５）の文字パターンが選択
される。（７）の文字パターンは再切り出しを経由する
ことなく切り出される。

【００４１】以上説明したように、分割前後の文字パタ
ーンの認識結果の確からしさの評価を導入することによ
って、文字パターン辞書１１８に登録されたブロック数
が不適当であるため、あるいは、文字パターン辞書１１
８の作成に用いられた文字画像と実際に認識しようとす
る文字画像の相違が大きいために、ブロック数が一致し
ない場合でも、分離文字の切り出し間違いをより確実に
回避できるようになる。逆に、接触した２文字の場合に
は、再切り出しで分離された後の各文字を正しく切り出
すことができるようになる。

【００４２】実施例３図４は本実施例に係る文字認識装置のブロック図であ
る。図２と同一の符号は同一部を示す。半角文字判定部
１４０と文字幅メモリ１４２は新たに設けられたもので
ある。本実施例と実施例２との処理内容の相違は以下の
通りである。

【００４３】まず、標準文字サイズ算出部１０８Ｂにお
いて、標準文字サイズとは別に、１行中の文字塊の幅よ
り標準文字幅を求めて文字幅メモリ１４２に格納する。
標準文字幅とは、全角文字と看做し得る標準的な文字幅
であり、例えば行中の文字塊の最大幅を用いる。

【００４４】再文字切り出しによる文字パターンの分割
が行なわれた場合に、半角文字判定部１４０において、
分割後の各文字パターンの幅を標準文字幅メモリ１４２
より読み込んだ標準文字幅とを比較し、標準文字幅の１
／２以下の幅の文字パターンを半角文字と判定する。そ
して、文字パターン選択部１３８Ｂにおいて、半角文字
と判定された文字パターンの認識結果が特定の文字種
（例えば漢字、ひらがな）の場合、その評価値に重みを
付けることにより（ここで用いられる評価値は、大きい
ほど確からしさが低いことを意味する）、分割後の文字
パターンを選択されにくくしてから、分割前の文字パタ
ーンとの評価値の比較を行なって最終的に切り出すべき
文字パターンを選択し、その認識結果を最終的認識結果
として出力する。

【００４５】このような処理を追加することにより、分
離文字を、通常の文書で出現頻度の少ない半角漢字や半
角ひらがなと間違って切り出すことがなくなる。

【００４６】実施例４図５は本実施例に係る文字認識装置のブロック図であ
る。図２と同一の符号は同一部を示す。ピッチ情報メモ
リ１４６は、新たに設けられたものである。本実施例と
実施例２との処理内容の相違は以下の通りである。

【００４７】文字切り出し部１１２Ｃは、標準文字サイ
ズを基準にして文字パターンを切り出すが、これとは別
に行中の各文字塊の前後の間隔を求めてピッチ情報メモ
リ１４６に格納する。

【００４８】文字パターン選択部１３８Ｃは、再文字切
り出しにより分割後の文字パターンと分割前の文字パタ
ーンとの選択方法を、ピッチ情報によって切り替える。
すなわち、分割後の文字パターンであるところの注目し
た文字塊と次の文字塊との間隔が、注目文字塊と前の文
字塊との間隔から一定値を差し引いた値より大きい場
合、注目文字塊が単独で文字である可能性が大きいとし
て、注目文字塊のみからなる文字パターンと、注目文字
塊と次の文字塊を統合した文字パターンとのみの間で、
評価値の比較を行なって、その一方を選択し切り出す。
以上の条件を満たさない場合の文字パターン選択方法は
実施例２と同じである。

【００４９】図６に示した例において、文字パターン
（４）について再文字切り出しが行なわれた場合、分割
後の文字パターンの一つである文字塊（３）に注目し、
これと次の文字塊（４）との間隔ｂと前の文字塊（２）
との間隔ａがｂ＞ａ−ｋ（ただしｋは一定値）の条件を満たす場合、評価値の比較を、注目文字塊単独
の文字パターン（３）と文字パターン（４）との間での
み行ない、一方の文字パターンを選択する。文字塊４す
なわち文字パターン（７）は対象から外される。

【００５０】他方、上記条件を満たさない場合には、文
字パターン（３）と（７）の評価値の最大値と、文字パ
ターン（４）の評価値とを比較することによって、文字
パターン（３）及び（７）を選択し、あるいは文字パタ
ーン（４）を選択することになる。

【００５１】なお、一定値ｋは固定値として与えられる
か、あるいは１行中の文字ピッチから統計的に求められ
る値である。

【００５２】実施例５図７は本実施例に係る文字認識装置のブロック図であ
る。図２と同一の符号は同一部を示す。文字サイズ算出
部１５０と文字サイズメモリ１５２は、新たに設けられ
たものである。

【００５３】（ステップ１〜３）実施例２のステップ１
〜３と同じ処理で、スキャナ等の２値画像入力装置１０
０によって原稿（文書もしくは帳票）をイメージメモリ
１０２に読み込み、行切り出し部１０４によって行画像
を切り出し、文字塊抽出部１０６によって行画像より文
字塊を抽出する。

【００５４】（ステップ４）文字パターン選択部１３８
Ｄにおいて、行の方向を読み込む。行の方向は、予め指
定するか、あるいは自動的に判別する。

【００５５】横書き原稿の場合、実施例２のステップ４
以下と同じ内容の横書き処理を行なうが、縦書き原稿の
場合は次のステップ５以下の縦書き処理を実行する。

【００５６】（ステップ５）標準文字サイズ算出部１０
８Ｄで、１行内の標準文字サイズを算出して標準文字サ
イズメモリ１１０に格納する。算出方法は、行の幅で近
似する方法でも、行中の文字塊の幅より統計的処理によ
って算出する方法でもよい。

【００５７】（ステップ６）実施例１のステップ５と同
様の方法によって、文字切り出し部１１２Ａで文字パタ
ーンを切り出し、各文字パターンのブロック数をブロッ
ク数メモリ１１４に格納するとともに、文字パターン毎
の文字塊の組み合わせの情報を組み合わせ情報メモリ１
３０に格納する。

【００５８】また、切り出した文字パターンの文字サイ
ズを求める。ここで文字サイズとは、文字パターンの幅
に次の文字パターンまでのピッチを加えた値である。そ
して、文字サイズと標準文字サイズとの差（サイズ差）
を文字サイズメモリ１５２に格納する。

【００５９】（ステップ７）認識部１１６Ａにおいて、
切り出された文字パターンと文字パターン辞書１１８と
を照合し、認識結果として候補文字のコード、距離、総
輪郭数を認識情報メモリ１３２に格納する。

【００６０】（ステップ８）実施例１のステップ７と同
様に、ブロック数の比較を行ない、一致した場合は、注
目した文字パターンを文字として切り出し、その認識結
果を認識結果メモリ１２６に出力し、この文字の処理を
終わる。ブロック数が一致しなかった場合、次のステッ
プ９の処理に進む。

【００６１】（ステップ９）実施例１のステップ８と同
様の文字切り出しのやり直しを文字切り出し部１１２Ａ
で行ない、また切り出した文字パターンの文字塊の組み
合わせ情報を組み合わせ情報メモリ１３０に格納する。
再切り出し前（分割前）の文字パターンについての文字
塊組み合わせ情報も保存される。

【００６２】また、文字サイズ算出部１５０において、
文字サイズを求め、それと標準文字サイズとの差を計算
し文字サイズメモリ１５２に格納する。

【００６３】（ステップ１０）認識部１１６Ａにおい
て、ステップ９で再切り出しされた文字パターンについ
て文字パターン辞書１１８と照合し、認識結果データを
認識情報メモリ１３２に格納する。再文字切り出しで分
割される前の文字パターンの認識結果も保存される。

【００６４】（ステップ１１）評価値算出部１３４にお
いて、ステップ７で得られた分割前の認識結果の第１候
補と、ステップ１０で得られた分割後の認識結果の第１
候補について、それぞれの距離及び総輪郭数を用い、評
価値を算出して評価値メモリ１３６に格納する。ただし評価値＝距離／総輪郭数

【００６５】（ステップ１２）文字パターン選択部１３
８Ｄにおいて、分割前後の各文字パターンのサイズ差を
文字サイズメモリ１５２より読み出し、サイズ差の小さ
い順に文字パターンをソートする。図８に示した例にお
いて、Ｄが分割前の文字パターンで、これがＣとＥの文
字パターンに分割された場合、これら文字パターンは
Ｃ，Ｄ，Ｅの順にソートされることになる。

【００６６】なお、このような目的にサイズ差を用いる
ため、文字サイズに次の文字パターンとのピッチを含め
ることによって、図８に示したＡのような幅が極端に小
さい文字パターンが選択対象に含まれた場合の影響を少
なくしている。

【００６７】（ステップ１３）文字パターン選択部１３
８Ｄは、分割前後の各文字パターンの評価値を評価値メ
モリ１３６より読み出し、評価値の小さい順に文字パタ
ーンをソートする。

【００６８】（ステップ１４）文字パターン選択部１３
８Ｄにおいて、サイズ差によりソートされた第１位の文
字パターンと、評価値によりソートされた第１位の文字
パターンとが同一のものであれば、その文字パターンを
選択し（最終的に文字として切り出し）、その認識結果
のデータを認識結果メモリ１２６に出力する。そうでな
い場合は、次のステップ１５によって文字パターンを選
択する。

【００６９】（ステップ１５）評価値によりソートされ
た第１位と第２位の文字パターンの評価値の差が一定値
以上であれば、第１位の文字パターンを選択し、その認
識結果を出力する。そうでない場合は次のステップ１６
により文字パターンを選択する。

【００７０】（ステップ１６）サイズ差によりソートさ
れた第１位と第２位の文字パターンのサイズ差の差が一
定値以上であれば、第１位の文字パターンを選択し、そ
の認識結果を出力する。

【００７１】（ステップ１７）ステップ１４〜１６のい
ずれでも文字パターンを選択できなかった場合は、評価
値によりソートされた第１位の文字パターンを選択し、
その認識結果を出力する。

【００７２】図８に示した例において、Ｃ，Ｄ，Ｅの文
字パターン選択の場合、サイズ差によりＣ，Ｄ，Ｅの順
に文字パターンがソートされる可能性が高いが、評価値
によりソートされるとＤが第１位の文字パターンとなる
であろう。したがって、ステップ１８，１６，１７のい
ずれかでＤの文字パターンが正しく選択されることにな
る。

【００７３】実施例６図９は本実施例に係る文字認識装置のブロック図であ
る。図２と同一の符号は同等部を示す。本実施例と実施
例２との処理内容の相違は以下の通りである。

【００７４】実施例２のステップ１〜１０までの処理と
同じ内容の処理を行なう。そして、再切り出しにより分
割される前の文字パターンに含まれる文字塊（ブロッ
ク）が２個以下であれば、実施例２のステップ１１以下
と同じ内容の文字パターン選択処理を行なう。

【００７５】しかし、分割前の文字パターンが３個以上
の文字塊（ブロック）からなる場合には、比較対象とな
る文字パターンが多く発生し処理に時間がかかる、誤選
択の危険が増加することがある等の問題がある。そこ
で、この場合には、文字パターン選択部１３８Ｅにおい
て、比較対象を、先頭の文字塊を含む３個の文字パター
ンに限定し、その中で評価値が最小の文字パターンを文
字として選択し、その認識結果を出力する。

【００７６】図１０に示す「川」の例では、ａ〜ｆの６
個の文字パターンが存在することになるが、分割前の文
字パターンｃのブロック数は３であるので、先頭の文字
塊を含むａ，ｂ，ｃの３個の文字パターンに限定して評
価値を比較し、その結果としてｃの文字パターンを選択
することになる。

【００７７】以上説明したように、本発明に係る文字認
識装置には、文字のブロック数の情報が登録された文字
パターン辞書が用いられる。このブロック数情報は、従
来の文字認識装置の文字パターン辞書には含まれていな
かったものである。

【００７８】図１１は、ブロック数情報が含まれていな
い作成済み文字パターン辞書に、ブロック数情報を人手
によって対話的に登録するためのシステムの概略ブロッ
ク図である。なお、このシステムは文字認識装置に組み
込まれるか、文字認識装置から独立したシステムとして
構築される。

【００７９】文字パターン辞書にブロック数情報を登録
する場合、準備処理として、文字のブロック数の登録を
除いて既に作成済みの文字パターン辞書のデータ２０２
（文字のコードと特徴量等）をメモリに読み込み、また
文字パターン辞書を作成する際に用いた画像データ２０
４をメモリに読み込み、さらにブロック数情報を記憶す
るための領域２０６をメモリ上に確保する。そして、入
力装置（キーボード、マウス等）２０８及びディスプレ
イ２１０を用い、次のような対話的処理によってブロッ
ク数の登録を行なう。

【００８０】入力装置２０８より処理したい文字の表示
を指定すると、この指示が対話処理部２１２を経由して
辞書作成部２１２に通知され、辞書作成部２１２によっ
て、文字パターン辞書データ２０２の指定文字のレコー
ドの内容と、指定文字の画像データが対話処理部２１２
へ送られ、これが対話処理部２１２によってディスプレ
イ２１０に出力される。オペレータは、ディスプレイ２
１０の画面上で文字画像を観察し、文字を構成するブロ
ック数を入力装置２０８より入力する。辞書作成部２１
４は、入力されたブロック数を対話処理部２１２経由で
受取り、このブロック数の情報をメモリのブロック数記
憶領域２０８の対応位置に格納する。

【００８１】このような対話処理によって、予め作成さ
れている文字パターン辞書にブロック数情報を登録し、
本発明の文字認識に必要な文字パターン辞書を作成する
ことができる。

【００８２】図１２は、本発明による文字認識に必要な
文字パターン辞書を、最初から作成するためのシステム
のブロック図である。辞書作成処理は次の通りである。

【００８３】（ステップ１）２値画像入力装置３００に
おいて、文字パターン辞書に登録する文字が印字された
原稿をスキャナによって読み込み、２値画像に変換して
イメージメモリ３０２に格納する。この時に用いられる
原稿は、十分に広い文字間隔で定ピッチ印字されてい
る。

【００８４】（ステップ２）行切り出し部３０４におい
て、原稿の２値画像より垂直射影を利用して行画像を切
り出す。

【００８５】（ステップ３）文字切り出し部３０８にお
いて、原稿の印字ピッチに基づいて行画像より文字を切
り出すとともに、垂直射影を用いて文字塊を抽出し、切
り出した各文字を構成している文字塊の個数をブロック
数としてブロック数メモリ３１０に格納する。

【００８６】（ステップ４）辞書作成部３１２におい
て、切り出された文字の特徴量を抽出し、この特徴量と
ともに、ブロック数メモリ３１０より読み込んだブロッ
ク数と、イメージメモリ３０２より読み込んだ文字画像
データを文字パターン辞書３１４に登録する。なお、文
字画像データを文字パターン辞書３１４に登録するの
は、辞書修正作業等の便宜のためのである。

【００８７】以上のステップ１〜４を繰り返すことによ
って、必要な文字数の文字パターン辞書３１４を作成す
ることができる。

【００８８】図１３は、このようにして作成した文字パ
ターン辞書の修正を行なうシステムのブロック図であ
る。修正処理の概略は次の通りである。

【００８９】まず、図１２のシステム等で作成された文
字パターン辞書４００を読み込む。

【００９０】入力装置（キーボード、マウス等）４０４
より修正したい文字の表示を指定すると、この指示が対
話処理部４０８を経由して辞書修正部４０２に通知さ
れ、辞書修正部４０２によって、文字パターン辞書４０
０の指定文字の画像データとブロック数情報を読み出
し、これを対話処理部４０８経由でディスプレイ４０６
に出力する。オペレータは、ディスプレイ４０６に表示
された文字画像及びブロック数を確認し、修正が必要で
あれば、入力装置４０４より正しいブロック数を入力す
る。対話処理部４０８は、入力されたブロック数と従前
のブロック数とを比較し、一致しない場合には、入力さ
れたブロック数を辞書修正部４０２に渡し修正を指示す
る。指示された辞書修正部４０２は、文字パターン辞書
４００の対応文字のブロック数情報を、渡されたブロッ
ク数によって書き換える。

【００９１】

【発明の効果】以上の説明から理解されるように、請求
項１ないし請求項７の発明によれば、文字を構成するブ
ロックの個数に注目し、認識した文字パターンのブロッ
ク数と、認識結果の文字について文字パターン辞書に登
録されているブロック数とを比較し、ブロック数が不一
致の場合に文字パターンを分割し再度認識するため、マ
ルチサイズ、不定ピッチの日本語文書に対しても高い認
識率を達成でき、特に請求項３ないし請求項７の発明に
よれば、文字切り出しが困難な分離文字等に対する切り
出し精度と認識率を大幅に改善できる。

【図面の簡単な説明】

【図１】実施例１に係る文字認識装置のブロック図であ
る。

【図２】本発明の実施例２に係る文字認識装置のブロッ
ク図である。

【図３】実施例２による処理例の説明図である。

【図４】実施例３に係る文字認識装置のブロック図であ
る。

【図５】実施例４に係る文字認識装置のブロック図であ
る。

【図６】実施例４による処理例の説明図である。

【図７】実施例５に係る文字認識装置のブロック図であ
る。

【図８】実施例５による処理例の説明図である。

【図９】実施例６に係る文字認識装置のブロック図であ
る。

【図１０】実施例６による処理例の説明図である。

【図１１】文字パターン辞書にブロック数情報を登録す
るためのシステムのブロック図である。

【図１２】辞書作成用原稿を読み取って、文字のブロッ
ク数情報を含む文字パターン辞書を自動的に作成するシ
ステムのブロック図である。

【図１３】文字パターン辞書のブロック数情報を修正す
るためのシステムのブロック図である。

【符号の説明】

１００２値画像入力装置１０２イメージメモリ１０４行切り出し部１０６文字塊抽出部１０８，１０８Ｂ，１０８Ｄ標準文字サイズ算出部１１０標準文字サイズメモリ１１２，１１２Ａ，１１２Ｃ文字切り出し部１１４ブロック数メモリ１１６，１１６Ａ認識部１１８文字パターン辞書１２０ブロック数参照部１２２再文字切り出し部１２４再認識部１２６認識結果メモリ１３０組み合わせ情報メモリ１３２認識情報メモリ１３４評価値算出部１３６評価値メモリ１３８，１３８Ｂ〜１３８Ｅ文字パターン選択部１４０半角文字判定部１４２文字幅メモリ１４６ピッチ情報メモリ１５０文字サイズ算出部１５２文字サイズメモリ

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/34 G06K 9/62

Claims

(57)【特許請求の範囲】

【請求項１】入力画像から文字パターンを切り出し、
切り出した文字パターンを、文字を構成するブロックの
個数の情報が登録された文字パターン辞書と照合するこ
とにより認識し、認識結果の文字について文字パターン
辞書に登録されているブロック数と、文字パターンを構
成するブロックの個数とを比較し、この比較結果が不一
致の場合に、文字パターンを２個以上の文字パターンに
分割して再度、文字パターン辞書と照合し認識すること
を特徴とする文字認識方法。
【請求項２】請求項１記載の文字認識方法において、
文字パターンを分割して再度認識した場合に、分割前ま
たは分割後の認識結果を最終的な認識結果として選択す
ることを特徴とする文字認識方法。
【請求項３】請求項２記載の文字認識方法において、
文字パターンを分割し再度認識した場合に、分割後の認
識結果の確からしさと分割前の認識結果の確からしさを
比較することによって最終的認識結果を選択することを
特徴とする文字認識方法。
【請求項４】請求項３記載の文字認識方法において、
分割後と分割前の認識結果の確からしさを比較する場合
に、分割後の文字パターンの幅が半角文字と看做し得る
ときで、かつ分割後の認識結果が特定文字種であるとき
は、分割後の認識結果の確からしさの程度を下げること
を特徴とする文字認識方法。
【請求項５】請求項３記載の文字認識方法において、
分割後と分割前の認識結果の確からしさを比較する場合
に、分割後の文字パターンの前後の間隔に応じて、認識
結果の確からしさの比較方法を変更することを特徴とす
る文字認識方法。
【請求項６】請求項２記載の文字認識方法において、
文字パターンを分割し再度認識した場合に、分割後と分
割前の認識結果の確からしさ、及び文字パターンの幅に
次の文字パターンまでのピッチを加えた値に基づいて、
最終的認識結果を選択することを特徴とする文字認識方
法。
【請求項７】請求項２記載の文字認識方法において、
文字パターンを分割して再度認識した場合に、分割前の
文字パターンを構成するブロックの個数に応じて、最終
的認識結果の選択方法を変更することを特徴とする文字
認識方法。