JP3093397B2 - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JP3093397B2 JP3093397B2 JP03334253A JP33425391A JP3093397B2 JP 3093397 B2 JP3093397 B2 JP 3093397B2 JP 03334253 A JP03334253 A JP 03334253A JP 33425391 A JP33425391 A JP 33425391A JP 3093397 B2 JP3093397 B2 JP 3093397B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character pattern
- recognition
- pattern
- division
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
マルチサイズ、不定ピッチの日本語文書の文字認識に関
する。
のものや、不定ピッチのものが多く、また漢字、ひらが
な、カタカナ等、上下、左右に分離する文字が多く、文
字認識の際に文字切り出しが難しい。
よって文字塊を切り出し、文字塊を統合して1文字と看
做せる文字パターンを生成し、生成した全ての文字パタ
ーンについて認識を行ない、認識結果の確からしさ(例
えば認識辞書との距離等)を評価することにより、文字
パターンを選択し文字として切り出す方法が考案されて
いる(特開平1−303586号)。
切り出しにフィードバックする前記従来方法は、マルチ
サイズ、不定ピッチの日本語文書に対する文字認識にお
いて文字切り出し精度、認識率の向上を期待できるが、
分離文字の切り出し精度に改善の余地が多い。例えば偏
と旁に分離する文字については、偏または旁に相当する
文字パターンと、それらの統合された本来の文字パター
ンが生成されるが、その偏や旁に類似した文字が存在す
る場合には単純な偏または旁に相当する文字パターンの
ほうが認識結果の確からしさの程度が高くなって、それ
が文字として選択されやすい。
分離文字の切り出し間違い等が起きにくく、マルチサイ
ズ、不定ピッチの日本語文書に好適な文字認識方法を提
供することにある。
像から文字パターンを切り出し、文字パターン辞書と照
合し認識するが、文字パターン辞書に文字を構成するブ
ロックの個数の情報を予め登録しておき、切り出した文
字パターンを構成するブロックの個数を検出し、検出し
たブロック数と認識結果の文字に対し文字パターン辞書
に登録されているブロック数とを比較する。そして、ブ
ロック数が一致しない文字パターンについては、切り出
し方法を変更し改めて文字切り出しを行なってから文字
パターン辞書と照合し認識することである。
ターンは偏と旁に相当する2個のブロックに分割でき
る。換言すれば「機」は2個のブロックから成ってい
る。このような文字の分割可能な部分がブロックであ
り、同様のブロック分割が可能な文字は他にも極めて多
い。
を定義したが、これは垂直射影を利用すると文書より切
り出した文字パターンのブロック数の検出が容易である
ことと、漢字やひらがな等では左右に分離する文字が多
いことを考慮しているからであって、例えば黒画素の連
結した塊をブロックとする等も可能である。後述の各実
施例における「文字塊」は、垂直射影によって分割され
たブロックである。
ンを切り出し、これを文字パターン辞書と照合すること
により認識するが、認識結果の文字について文字パター
ン辞書に登録されているブロック数と、切り出された文
字パターンのブロック数とを比較する。文字パターン辞
書に登録されているブロック数に間違いがないとする
と、ブロック数が一致したということは、文字が正常に
切り出され正常に認識された可能性が十分に高いと言え
る。
較により、分離文字の切り出し間違いと、それによる誤
認が生じにくくなる。
出し位置が不適当で、接触文字を1文字として切り出し
た、2個の半角文字を1文字として切り出した、といっ
た文字切り出しの誤りが生じた可能性が高い。この場
合、本発明によれば、文字パターンを分割し、分割後の
各文字パターンを改めて文字パターン辞書と照合するこ
とにより認識するため、上に述べた如き不適当な文字切
り出しを補正し、正しい認識結果を得られるようにな
る。
る。
る。以下、処理の流れに従い処理内容を説明する。
装置100によって、原稿(文書もしくは帳票)を2値
画像として読み込み、イメージメモリ102に格納す
る。
て、行切り出し部104において、水平射影をとり、水
平射影値が所定の閾値を超える一定幅以上の区間を行画
像として切り出す。
て、文字塊抽出部106において、垂直射影をとり、垂
直射影値が所定の閾値を超える区間を文字塊(ブロック
に相当する)として抽出する。隣の文字塊との間の空白
が一定幅以下の文字塊は統合する。ただし、統合後の幅
が一定値を超えないようにする。
8において、1行中の文字塊の高さの最大値を求め、こ
れを行の標準文字サイズとして標準文字サイズメモリ1
10に格納する。
いて、行の先頭(ここでは横書き文書を考えているので
行の左端)より、標準文字サイズを超えないで最大幅と
なるように文字塊を組み合わせ、各文字塊の組を文字パ
ターンとして切り出す。1個の文字パターンに含まれる
文字塊の個数は、文字塊の幅とピッチによって当然に変
化する。文字塊の幅や隣の文字塊との余白が広い場合等
には、文字塊が単独で文字パターンとして切り出される
ことも当然あり得る。そして、切り出した文字パターン
を構成する文字塊すなわちブロックの個数を、ブロック
数メモリ114に格納する。
に述べられている方法では、同じ文字塊が複数の文字パ
ターンに重複して用いられることがある。しかし本発明
にあっては、それと異なり、1個の文字塊は必ず1個の
文字パターンの全部または一部として切り出されるもの
で、複数の文字パターン間に文字塊が重複することはな
い。
字切り出し部112によって切り出された一つの文字パ
ターンと、文字パターン辞書118とを照合し、距離の
小さな候補文字を認識結果として得る。通常、複数の候
補文字を求め、これを距離の小さい順にソートする。
パターンの特徴量に加えて、ブロック数の情報も登録さ
れている。ここでは、切り出された文字パターンより抽
出した特徴量と、文字パターン辞書118に登録された
特徴量との比較を行なう。
おいて、現在注目している文字パターンのブロック数を
ブロック数メモリ114より読み込み、また、この注目
文字パターンに対して認識部116で得られた第1位候
補文字のブロック数を文字パターン辞書118より読み
込み、両方のブロック数の一致を調べる。
ている認識結果のデータ(候補文字コード、距離など)
を認識結果メモリ126に出力し、1文字の処理を終了
する。すなわち、ブロック数が一致した場合、注目して
いる文字パターンが文字として切り出されたことにな
る。
次のステップ8以下の処理を行なう。
が2個以上の文字塊からなる場合は、文字塊(ブロッ
ク)毎に分割し、また文字パターンが単独の文字塊から
なる場合は、例えば垂直射影の谷の位置で強制的に分割
する。
ステップ8で再切り出し(分割)された文字パターンを
パターン辞書118と照合して認識し、認識結果データ
を認識結果メモリ126に格納する。
る。図1と同一の符号は同等部を示す。以下、処理の流
れに従い処理内容を説明する。
〜4と同様の処理である。
様の方法によって、文字切り出し部112Aで文字パタ
ーンを切り出し、各文字パターンのブロック数をブロッ
ク数メモリ114に格納する。文字切り出し部112A
はさらに、文字パターン毎の文字塊の組み合わせの情報
を組み合わせ情報メモリ130に格納する。
文字切り出し部112Aにより切り出された一つの文字
パターンと文字パターン辞書118とを照合し、認識結
果として候補文字のコード、距離、総輪郭数を認識情報
メモリ132に格納する。この距離と輪郭数は後述のよ
うに認識結果の確からしさの評価のために用いられる。
様に、ブロック数の比較を行ない、一致した場合は、注
目した文字パターンを文字として切り出し、その認識結
果を認識結果メモリ126に出力し、この文字の処理を
終わる。ブロック数が一致しなかった場合、次のステッ
プ8の処理に進む。
様の文字切り出しのやり直しを行なう。ただし、この再
切り出し処理を文字切り出し部112Aで実行する。ま
た、ここで切り出された文字パターンの文字塊の組み合
わせ情報を組み合わせ情報メモリ130に格納する。な
お、再切り出し前(分割前)の文字パターンについての
文字塊組み合わせ情報も保存される。
ステップ8で再切り出しされた文字パターンについて文
字パターン辞書118と照合し、認識結果データを認識
情報メモリ132に格納する。なお、ステップ6で得ら
れた認識結果(再文字切り出しで分割される前の文字パ
ターンの認識結果)も認識情報メモリ132に保存され
ている。
いて、ステップ6で得られた分割前の認識結果の第1候
補と、ステップ9で得られた分割後の認識結果の第1候
補について、それぞれの距離及び総輪郭数を用い、評価
値を算出して評価値メモリ136に格納する。ただし 評価値=距離/総輪郭数
8において、分割後の認識結果の評価値の最大値と、分
割前の認識結果の評価値とを比較し、その値が小さいほ
うの認識結果を認識結果メモリ126に出力する。すな
わち、分割前の認識結果の評価値のほうが小さい場合
は、分割前の文字パターンを文字として切り出し、そう
でない場合は再切り出しにより分割後の文字パターンを
文字として切り出すということである。
8〜11の内容を説明する。図3において、a〜fは行
画像の垂直射影により直接抽出される文字塊(統合前)
であり、これに統合処理を施すことによってA〜Eの文
字塊が抽出される。
準文字サイズを基準とした文字切り出しによって(2)
の文字パターンが切り出され、これがステップ6で
「機」として認識されたとする。つまり、正しく切り出
され認識された。
に「機」に対するブロック数が間違って1として登録さ
れていたといった原因で、ステップ7でブロック数が一
致しなかったとする。
(3)の二つの文字パターンに分割され、それぞれが
「木」、「幾」として認識されたとする。実施例1によ
れば、これが最終的な認識結果として誤って出力されて
しまう。しかし本実施例によれば、(1)または(3)
のいずれかの文字パターンについての評価値が(2)の
文字パターンの評価値より大きければ(通常、こうな
る)、(2)の文字パターンを選択し、その認識結果を
出力することができる。
される。(7)の文字パターンは再切り出しを経由する
ことなく切り出される。
ーンの認識結果の確からしさの評価を導入することによ
って、文字パターン辞書118に登録されたブロック数
が不適当であるため、あるいは、文字パターン辞書11
8の作成に用いられた文字画像と実際に認識しようとす
る文字画像の相違が大きいために、ブロック数が一致し
ない場合でも、分離文字の切り出し間違いをより確実に
回避できるようになる。逆に、接触した2文字の場合に
は、再切り出しで分離された後の各文字を正しく切り出
すことができるようになる。
る。図2と同一の符号は同一部を示す。半角文字判定部
140と文字幅メモリ142は新たに設けられたもので
ある。本実施例と実施例2との処理内容の相違は以下の
通りである。
いて、標準文字サイズとは別に、1行中の文字塊の幅よ
り標準文字幅を求めて文字幅メモリ142に格納する。
標準文字幅とは、全角文字と看做し得る標準的な文字幅
であり、例えば行中の文字塊の最大幅を用いる。
が行なわれた場合に、半角文字判定部140において、
分割後の各文字パターンの幅を標準文字幅メモリ142
より読み込んだ標準文字幅とを比較し、標準文字幅の1
/2以下の幅の文字パターンを半角文字と判定する。そ
して、文字パターン選択部138Bにおいて、半角文字
と判定された文字パターンの認識結果が特定の文字種
(例えば漢字、ひらがな)の場合、その評価値に重みを
付けることにより(ここで用いられる評価値は、大きい
ほど確からしさが低いことを意味する)、分割後の文字
パターンを選択されにくくしてから、分割前の文字パタ
ーンとの評価値の比較を行なって最終的に切り出すべき
文字パターンを選択し、その認識結果を最終的認識結果
として出力する。
離文字を、通常の文書で出現頻度の少ない半角漢字や半
角ひらがなと間違って切り出すことがなくなる。
る。図2と同一の符号は同一部を示す。ピッチ情報メモ
リ146は、新たに設けられたものである。本実施例と
実施例2との処理内容の相違は以下の通りである。
ズを基準にして文字パターンを切り出すが、これとは別
に行中の各文字塊の前後の間隔を求めてピッチ情報メモ
リ146に格納する。
り出しにより分割後の文字パターンと分割前の文字パタ
ーンとの選択方法を、ピッチ情報によって切り替える。
すなわち、分割後の文字パターンであるところの注目し
た文字塊と次の文字塊との間隔が、注目文字塊と前の文
字塊との間隔から一定値を差し引いた値より大きい場
合、注目文字塊が単独で文字である可能性が大きいとし
て、注目文字塊のみからなる文字パターンと、注目文字
塊と次の文字塊を統合した文字パターンとのみの間で、
評価値の比較を行なって、その一方を選択し切り出す。
以上の条件を満たさない場合の文字パターン選択方法は
実施例2と同じである。
(4)について再文字切り出しが行なわれた場合、分割
後の文字パターンの一つである文字塊(3)に注目し、
これと次の文字塊(4)との間隔bと前の文字塊(2)
との間隔aが b>a−k (ただしkは一定値) の条件を満たす場合、評価値の比較を、注目文字塊単独
の文字パターン(3)と文字パターン(4)との間での
み行ない、一方の文字パターンを選択する。文字塊4す
なわち文字パターン(7)は対象から外される。
字パターン(3)と(7)の評価値の最大値と、文字パ
ターン(4)の評価値とを比較することによって、文字
パターン(3)及び(7)を選択し、あるいは文字パタ
ーン(4)を選択することになる。
か、あるいは1行中の文字ピッチから統計的に求められ
る値である。
る。図2と同一の符号は同一部を示す。文字サイズ算出
部150と文字サイズメモリ152は、新たに設けられ
たものである。
〜3と同じ処理で、スキャナ等の2値画像入力装置10
0によって原稿(文書もしくは帳票)をイメージメモリ
102に読み込み、行切り出し部104によって行画像
を切り出し、文字塊抽出部106によって行画像より文
字塊を抽出する。
Dにおいて、行の方向を読み込む。行の方向は、予め指
定するか、あるいは自動的に判別する。
以下と同じ内容の横書き処理を行なうが、縦書き原稿の
場合は次のステップ5以下の縦書き処理を実行する。
8Dで、1行内の標準文字サイズを算出して標準文字サ
イズメモリ110に格納する。算出方法は、行の幅で近
似する方法でも、行中の文字塊の幅より統計的処理によ
って算出する方法でもよい。
様の方法によって、文字切り出し部112Aで文字パタ
ーンを切り出し、各文字パターンのブロック数をブロッ
ク数メモリ114に格納するとともに、文字パターン毎
の文字塊の組み合わせの情報を組み合わせ情報メモリ1
30に格納する。
ズを求める。ここで文字サイズとは、文字パターンの幅
に次の文字パターンまでのピッチを加えた値である。そ
して、文字サイズと標準文字サイズとの差(サイズ差)
を文字サイズメモリ152に格納する。
切り出された文字パターンと文字パターン辞書118と
を照合し、認識結果として候補文字のコード、距離、総
輪郭数を認識情報メモリ132に格納する。
様に、ブロック数の比較を行ない、一致した場合は、注
目した文字パターンを文字として切り出し、その認識結
果を認識結果メモリ126に出力し、この文字の処理を
終わる。ブロック数が一致しなかった場合、次のステッ
プ9の処理に進む。
様の文字切り出しのやり直しを文字切り出し部112A
で行ない、また切り出した文字パターンの文字塊の組み
合わせ情報を組み合わせ情報メモリ130に格納する。
再切り出し前(分割前)の文字パターンについての文字
塊組み合わせ情報も保存される。
文字サイズを求め、それと標準文字サイズとの差を計算
し文字サイズメモリ152に格納する。
て、ステップ9で再切り出しされた文字パターンについ
て文字パターン辞書118と照合し、認識結果データを
認識情報メモリ132に格納する。再文字切り出しで分
割される前の文字パターンの認識結果も保存される。
いて、ステップ7で得られた分割前の認識結果の第1候
補と、ステップ10で得られた分割後の認識結果の第1
候補について、それぞれの距離及び総輪郭数を用い、評
価値を算出して評価値メモリ136に格納する。ただし 評価値=距離/総輪郭数
8Dにおいて、分割前後の各文字パターンのサイズ差を
文字サイズメモリ152より読み出し、サイズ差の小さ
い順に文字パターンをソートする。図8に示した例にお
いて、Dが分割前の文字パターンで、これがCとEの文
字パターンに分割された場合、これら文字パターンは
C,D,Eの順にソートされることになる。
ため、文字サイズに次の文字パターンとのピッチを含め
ることによって、図8に示したAのような幅が極端に小
さい文字パターンが選択対象に含まれた場合の影響を少
なくしている。
8Dは、分割前後の各文字パターンの評価値を評価値メ
モリ136より読み出し、評価値の小さい順に文字パタ
ーンをソートする。
8Dにおいて、サイズ差によりソートされた第1位の文
字パターンと、評価値によりソートされた第1位の文字
パターンとが同一のものであれば、その文字パターンを
選択し(最終的に文字として切り出し)、その認識結果
のデータを認識結果メモリ126に出力する。そうでな
い場合は、次のステップ15によって文字パターンを選
択する。
た第1位と第2位の文字パターンの評価値の差が一定値
以上であれば、第1位の文字パターンを選択し、その認
識結果を出力する。そうでない場合は次のステップ16
により文字パターンを選択する。
れた第1位と第2位の文字パターンのサイズ差の差が一
定値以上であれば、第1位の文字パターンを選択し、そ
の認識結果を出力する。
ずれでも文字パターンを選択できなかった場合は、評価
値によりソートされた第1位の文字パターンを選択し、
その認識結果を出力する。
字パターン選択の場合、サイズ差によりC,D,Eの順
に文字パターンがソートされる可能性が高いが、評価値
によりソートされるとDが第1位の文字パターンとなる
であろう。したがって、ステップ18,16,17のい
ずれかでDの文字パターンが正しく選択されることにな
る。
る。図2と同一の符号は同等部を示す。本実施例と実施
例2との処理内容の相違は以下の通りである。
同じ内容の処理を行なう。そして、再切り出しにより分
割される前の文字パターンに含まれる文字塊(ブロッ
ク)が2個以下であれば、実施例2のステップ11以下
と同じ内容の文字パターン選択処理を行なう。
の文字塊(ブロック)からなる場合には、比較対象とな
る文字パターンが多く発生し処理に時間がかかる、誤選
択の危険が増加することがある等の問題がある。そこ
で、この場合には、文字パターン選択部138Eにおい
て、比較対象を、先頭の文字塊を含む3個の文字パター
ンに限定し、その中で評価値が最小の文字パターンを文
字として選択し、その認識結果を出力する。
個の文字パターンが存在することになるが、分割前の文
字パターンcのブロック数は3であるので、先頭の文字
塊を含むa,b,cの3個の文字パターンに限定して評
価値を比較し、その結果としてcの文字パターンを選択
することになる。
識装置には、文字のブロック数の情報が登録された文字
パターン辞書が用いられる。このブロック数情報は、従
来の文字認識装置の文字パターン辞書には含まれていな
かったものである。
い作成済み文字パターン辞書に、ブロック数情報を人手
によって対話的に登録するためのシステムの概略ブロッ
ク図である。なお、このシステムは文字認識装置に組み
込まれるか、文字認識装置から独立したシステムとして
構築される。
する場合、準備処理として、文字のブロック数の登録を
除いて既に作成済みの文字パターン辞書のデータ202
(文字のコードと特徴量等)をメモリに読み込み、また
文字パターン辞書を作成する際に用いた画像データ20
4をメモリに読み込み、さらにブロック数情報を記憶す
るための領域206をメモリ上に確保する。そして、入
力装置(キーボード、マウス等)208及びディスプレ
イ210を用い、次のような対話的処理によってブロッ
ク数の登録を行なう。
を指定すると、この指示が対話処理部212を経由して
辞書作成部212に通知され、辞書作成部212によっ
て、文字パターン辞書データ202の指定文字のレコー
ドの内容と、指定文字の画像データが対話処理部212
へ送られ、これが対話処理部212によってディスプレ
イ210に出力される。オペレータは、ディスプレイ2
10の画面上で文字画像を観察し、文字を構成するブロ
ック数を入力装置208より入力する。辞書作成部21
4は、入力されたブロック数を対話処理部212経由で
受取り、このブロック数の情報をメモリのブロック数記
憶領域208の対応位置に格納する。
れている文字パターン辞書にブロック数情報を登録し、
本発明の文字認識に必要な文字パターン辞書を作成する
ことができる。
文字パターン辞書を、最初から作成するためのシステム
のブロック図である。辞書作成処理は次の通りである。
おいて、文字パターン辞書に登録する文字が印字された
原稿をスキャナによって読み込み、2値画像に変換して
イメージメモリ302に格納する。この時に用いられる
原稿は、十分に広い文字間隔で定ピッチ印字されてい
る。
て、原稿の2値画像より垂直射影を利用して行画像を切
り出す。
いて、原稿の印字ピッチに基づいて行画像より文字を切
り出すとともに、垂直射影を用いて文字塊を抽出し、切
り出した各文字を構成している文字塊の個数をブロック
数としてブロック数メモリ310に格納する。
て、切り出された文字の特徴量を抽出し、この特徴量と
ともに、ブロック数メモリ310より読み込んだブロッ
ク数と、イメージメモリ302より読み込んだ文字画像
データを文字パターン辞書314に登録する。なお、文
字画像データを文字パターン辞書314に登録するの
は、辞書修正作業等の便宜のためのである。
って、必要な文字数の文字パターン辞書314を作成す
ることができる。
ターン辞書の修正を行なうシステムのブロック図であ
る。修正処理の概略は次の通りである。
字パターン辞書400を読み込む。
より修正したい文字の表示を指定すると、この指示が対
話処理部408を経由して辞書修正部402に通知さ
れ、辞書修正部402によって、文字パターン辞書40
0の指定文字の画像データとブロック数情報を読み出
し、これを対話処理部408経由でディスプレイ406
に出力する。オペレータは、ディスプレイ406に表示
された文字画像及びブロック数を確認し、修正が必要で
あれば、入力装置404より正しいブロック数を入力す
る。対話処理部408は、入力されたブロック数と従前
のブロック数とを比較し、一致しない場合には、入力さ
れたブロック数を辞書修正部402に渡し修正を指示す
る。指示された辞書修正部402は、文字パターン辞書
400の対応文字のブロック数情報を、渡されたブロッ
ク数によって書き換える。
項1ないし請求項7の発明によれば、文字を構成するブ
ロックの個数に注目し、認識した文字パターンのブロッ
ク数と、認識結果の文字について文字パターン辞書に登
録されているブロック数とを比較し、ブロック数が不一
致の場合に文字パターンを分割し再度認識するため、マ
ルチサイズ、不定ピッチの日本語文書に対しても高い認
識率を達成でき、特に請求項3ないし請求項7の発明に
よれば、文字切り出しが困難な分離文字等に対する切り
出し精度と認識率を大幅に改善できる。
る。
ク図である。
る。
る。
る。
る。
るためのシステムのブロック図である。
ク数情報を含む文字パターン辞書を自動的に作成するシ
ステムのブロック図である。
るためのシステムのブロック図である。
Claims (7)
- 【請求項1】 入力画像から文字パターンを切り出し、
切り出した文字パターンを、文字を構成するブロックの
個数の情報が登録された文字パターン辞書と照合するこ
とにより認識し、認識結果の文字について文字パターン
辞書に登録されているブロック数と、文字パターンを構
成するブロックの個数とを比較し、この比較結果が不一
致の場合に、文字パターンを2個以上の文字パターンに
分割して再度、文字パターン辞書と照合し認識すること
を特徴とする文字認識方法。 - 【請求項2】 請求項1記載の文字認識方法において、
文字パターンを分割して再度認識した場合に、分割前ま
たは分割後の認識結果を最終的な認識結果として選択す
ることを特徴とする文字認識方法。 - 【請求項3】 請求項2記載の文字認識方法において、
文字パターンを分割し再度認識した場合に、分割後の認
識結果の確からしさと分割前の認識結果の確からしさを
比較することによって最終的認識結果を選択することを
特徴とする文字認識方法。 - 【請求項4】 請求項3記載の文字認識方法において、
分割後と分割前の認識結果の確からしさを比較する場合
に、分割後の文字パターンの幅が半角文字と看做し得る
ときで、かつ分割後の認識結果が特定文字種であるとき
は、分割後の認識結果の確からしさの程度を下げること
を特徴とする文字認識方法。 - 【請求項5】 請求項3記載の文字認識方法において、
分割後と分割前の認識結果の確からしさを比較する場合
に、分割後の文字パターンの前後の間隔に応じて、認識
結果の確からしさの比較方法を変更することを特徴とす
る文字認識方法。 - 【請求項6】 請求項2記載の文字認識方法において、
文字パターンを分割し再度認識した場合に、分割後と分
割前の認識結果の確からしさ、及び文字パターンの幅に
次の文字パターンまでのピッチを加えた値に基づいて、
最終的認識結果を選択することを特徴とする文字認識方
法。 - 【請求項7】 請求項2記載の文字認識方法において、
文字パターンを分割して再度認識した場合に、分割前の
文字パターンを構成するブロックの個数に応じて、最終
的認識結果の選択方法を変更することを特徴とする文字
認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03334253A JP3093397B2 (ja) | 1991-11-22 | 1991-11-22 | 文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03334253A JP3093397B2 (ja) | 1991-11-22 | 1991-11-22 | 文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05143778A JPH05143778A (ja) | 1993-06-11 |
JP3093397B2 true JP3093397B2 (ja) | 2000-10-03 |
Family
ID=18275269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03334253A Expired - Fee Related JP3093397B2 (ja) | 1991-11-22 | 1991-11-22 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3093397B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110135429A (zh) * | 2019-04-18 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 扫描文字分段方法、装置、计算机设备和存储介质 |
-
1991
- 1991-11-22 JP JP03334253A patent/JP3093397B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH05143778A (ja) | 1993-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5410611A (en) | Method for identifying word bounding boxes in text | |
EP1312038B1 (en) | Orthogonal technology for multi-line character recognition | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
EP0439951A2 (en) | Data processing | |
US5191612A (en) | Character recognition system | |
GB2208735A (en) | Character recognition system | |
JPH05242292A (ja) | 分離方法 | |
EP0810542A2 (en) | Bitmap comparison apparatus and method | |
US5561720A (en) | Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch | |
JP2000315247A (ja) | 文字認識装置 | |
US4887301A (en) | Proportional spaced text recognition apparatus and method | |
JP3093397B2 (ja) | 文字認識方法 | |
JP3157530B2 (ja) | 文字切り出し方法 | |
JP3173363B2 (ja) | Ocrのメンテナンス方法及び装置 | |
JP2851102B2 (ja) | 文字切出し方法 | |
JP2995818B2 (ja) | 文字切り出し方法 | |
JP2982075B2 (ja) | 文字切出し方法 | |
JP2895115B2 (ja) | 文字切出し方法 | |
JP2972443B2 (ja) | 文字認識装置 | |
JP3428504B2 (ja) | 文字認識装置 | |
JPH04130979A (ja) | 文字画像切出し方法 | |
JPH02230484A (ja) | 文字認識装置 | |
JPH0535916A (ja) | 文字切り出し方法 | |
JPH0535917A (ja) | 文字切り出し方法 | |
JPH09167206A (ja) | 日英混在文書のスペース検出方法、ピッチ書式判定方法、定ピッチ英数文字列のスペース検出方法、及びプロポーショナルピッチ英数文字列のスペース検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070728 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080728 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090728 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090728 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100728 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110728 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |