JPH0528302A - 文字読取装置 - Google Patents
文字読取装置Info
- Publication number
- JPH0528302A JPH0528302A JP3178625A JP17862591A JPH0528302A JP H0528302 A JPH0528302 A JP H0528302A JP 3178625 A JP3178625 A JP 3178625A JP 17862591 A JP17862591 A JP 17862591A JP H0528302 A JPH0528302 A JP H0528302A
- Authority
- JP
- Japan
- Prior art keywords
- character
- dictionary
- characters
- reading
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】フォントを異にする多種のプリンタによる帳票
文字の読取りを可能とする。 【構成】走査部10は所定のフォントで印字された帳票
の文字を読み取り、そのイメージデータをイメージメモ
リ11に格納する。イメージメモリ11の格納データは
1文字ごとに文字切出し部12によって切り出され、判
定部13に供給され、辞書メモリ部14の文字辞書と照
合される。判定部13は、所定の評価尺度で識別し得た
ものは読取データとして出力する。識別は、帳票上に設
けた学習フィールド欄に印字した文字の読取りが所定の
識別精度を確保するか否かによって判定し、読取りが不
可能であった場合には、読取り不可能の文字とそのイメ
ージパタンを利用して新たな文字辞書を辞書作成部15
で作成し、辞書メモリ部14に追加する。
文字の読取りを可能とする。 【構成】走査部10は所定のフォントで印字された帳票
の文字を読み取り、そのイメージデータをイメージメモ
リ11に格納する。イメージメモリ11の格納データは
1文字ごとに文字切出し部12によって切り出され、判
定部13に供給され、辞書メモリ部14の文字辞書と照
合される。判定部13は、所定の評価尺度で識別し得た
ものは読取データとして出力する。識別は、帳票上に設
けた学習フィールド欄に印字した文字の読取りが所定の
識別精度を確保するか否かによって判定し、読取りが不
可能であった場合には、読取り不可能の文字とそのイメ
ージパタンを利用して新たな文字辞書を辞書作成部15
で作成し、辞書メモリ部14に追加する。
Description
【0001】
【産業上の利用分野】本発明は文字読取装置に関し、特
に読取対象外のフォントによる文字を読み取ることを可
能とした文字読取装置に関する。
に読取対象外のフォントによる文字を読み取ることを可
能とした文字読取装置に関する。
【0002】
【従来の技術】活字文字を読み取る方法の一例として、
入力文字とあらかじめ登録した文字辞書とのマッチング
処理を行ない、一致度の最も良いものを抽出して識別す
る方法がある。
入力文字とあらかじめ登録した文字辞書とのマッチング
処理を行ない、一致度の最も良いものを抽出して識別す
る方法がある。
【0003】しかしながら、読取対象外のフォントの文
字を読み取る場合には、そのフォントに対応した辞書を
あらかじめ作成し、装置に登録しておく必要があった。
字を読み取る場合には、そのフォントに対応した辞書を
あらかじめ作成し、装置に登録しておく必要があった。
【0004】
【発明が解決しようとする課題】近年、パーソナルコン
ピュータの普及により、それらに接続されてハードコピ
ーを出力するプリンタも多種開発されている。
ピュータの普及により、それらに接続されてハードコピ
ーを出力するプリンタも多種開発されている。
【0005】また、プリンタの多種開発に伴なって、プ
リンタの印字方式も、ドット等のインパクトプリンタ
や、レーザープリンタのようなノンインパクトプリンタ
が多種開発され、それらのプリンタに使用される文字の
フォントも多種多様に出回ってきている。
リンタの印字方式も、ドット等のインパクトプリンタ
や、レーザープリンタのようなノンインパクトプリンタ
が多種開発され、それらのプリンタに使用される文字の
フォントも多種多様に出回ってきている。
【0006】従来の文字読取装置では、読み取るべきフ
ォントはあらかじめ決まっており、従って他のフォント
を読み取る場合には、そのための辞書を作成し登録する
必要があり、多種のプリンタの文字を読み取ることが困
難であるという欠点があった。
ォントはあらかじめ決まっており、従って他のフォント
を読み取る場合には、そのための辞書を作成し登録する
必要があり、多種のプリンタの文字を読み取ることが困
難であるという欠点があった。
【0007】本発明の目的は上述した欠点を除去し、多
種のプリンタによる印字文字を読み取ることができる文
字読取装置を提供することにある。
種のプリンタによる印字文字を読み取ることができる文
字読取装置を提供することにある。
【0008】
【課題を解決するための手段】本発明の文字読取装置
は、読み取るべきデータを印字するデータフィールドの
印字文字と同一フォントかつあらかじめ設定した文字順
で所定の文字を印字する学習フィールドを帳票に備える
手段と、前記学習フィールドを備えた帳票を照合により
読み取るための第一の文字辞書を備えて前記帳票を読み
取るとともに、前記学習フィールドに対する読取り不可
能なすべての文字の文字パタンと、文字位置にもとづい
て得られる文字コードデータとを入力として前記読取り
不可能な文字を読取り可能とする第二の文字辞書を作成
して前記第一の文字辞書と合体させつつ前記帳票を読み
取る手段とを備えて構成される。
は、読み取るべきデータを印字するデータフィールドの
印字文字と同一フォントかつあらかじめ設定した文字順
で所定の文字を印字する学習フィールドを帳票に備える
手段と、前記学習フィールドを備えた帳票を照合により
読み取るための第一の文字辞書を備えて前記帳票を読み
取るとともに、前記学習フィールドに対する読取り不可
能なすべての文字の文字パタンと、文字位置にもとづい
て得られる文字コードデータとを入力として前記読取り
不可能な文字を読取り可能とする第二の文字辞書を作成
して前記第一の文字辞書と合体させつつ前記帳票を読み
取る手段とを備えて構成される。
【0009】
【実施例】次に、本発明について図面を参照して説明す
る。
る。
【0010】図1は、本発明の一実施例の構成を示すブ
ロック図である。
ロック図である。
【0011】図1において、走査部10は、読取りの対
象とする帳票などを走査して、そのイメージパターンを
出力する。
象とする帳票などを走査して、そのイメージパターンを
出力する。
【0012】イメージメモリ11は、走査部10の出力
するイメージパターンを順次ストアするメモリである。
するイメージパターンを順次ストアするメモリである。
【0013】文字切出し部12は、イメージメモリ11
からイメージパターンを帳票のフォーマット情報に基づ
いて1文字づつ切り出す。
からイメージパターンを帳票のフォーマット情報に基づ
いて1文字づつ切り出す。
【0014】判定部13は、切り出された1文字単位の
文字を識別する。
文字を識別する。
【0015】辞書メモリ部14は、切り出された文字と
のマッチング(照合)を行なう文字辞書(標準パター
ン)を記憶しておくものであるが、これらの辞書はあら
かじめ作成されて記憶している部分としての第一の文字
辞書と、辞書作成部15で新しく作成された第二の文字
辞書を記憶する部分とから構成されている。
のマッチング(照合)を行なう文字辞書(標準パター
ン)を記憶しておくものであるが、これらの辞書はあら
かじめ作成されて記憶している部分としての第一の文字
辞書と、辞書作成部15で新しく作成された第二の文字
辞書を記憶する部分とから構成されている。
【0016】辞書作成部15は、文字切出し部12によ
り出力された文字イメージから第二の文字辞書を作成す
る。
り出力された文字イメージから第二の文字辞書を作成す
る。
【0017】次に、本実施例の動作について説明する。
【0018】図2は、図1の実施例に利用する帳票の一
例を示す図である。
例を示す図である。
【0019】図2において、帳票識別コード(以下、I
Cコードと呼ぶ)20は、帳票のフォーマット、すなわ
ち、読み取る行数とそれらの位置,文字種等を指定する
ためのものである。
Cコードと呼ぶ)20は、帳票のフォーマット、すなわ
ち、読み取る行数とそれらの位置,文字種等を指定する
ためのものである。
【0020】学習フィールド21は、帳票に使用されて
いる文字,例えば数字の0から9の文字を順番に印字す
るためのフィールドである。
いる文字,例えば数字の0から9の文字を順番に印字す
るためのフィールドである。
【0021】例えば、帳票に使用されているフォントが
新JIS−Bフォントの数字であれば、学習フィールド
21には、新JIS−Bの数字0から9までが順番に印
字される。
新JIS−Bフォントの数字であれば、学習フィールド
21には、新JIS−Bの数字0から9までが順番に印
字される。
【0022】図1において、走査部10は、図2に示す
IDコード20を読み取ることによって、学習フィール
ド21と複数のデータフィールド22の位置,文字種等
の帳票フォーマットを知る。
IDコード20を読み取ることによって、学習フィール
ド21と複数のデータフィールド22の位置,文字種等
の帳票フォーマットを知る。
【0023】次に、学習フィールド21の読取りに移
る。
る。
【0024】例えば、図2に示すように、学習フィール
ド21には0から9までの数字が印字されている。
ド21には0から9までの数字が印字されている。
【0025】走査部10によって読み取られた文字は、
イメージメモリ11に記憶されたのち、文字切出し部1
2によって切り出されて判定部13に送出される。
イメージメモリ11に記憶されたのち、文字切出し部1
2によって切り出されて判定部13に送出される。
【0026】判定部13は、切り出された文字と辞書メ
モリ14に格納した標準文字パターンとの照合を行な
う。
モリ14に格納した標準文字パターンとの照合を行な
う。
【0027】学習フィールド21に印字した文字は、文
字読取りに利用するとともに、読取り対象外の文字が入
力したときに、この読取り対象外の文字読取に必要な新
たな文字辞書作成用に利用する。このことは、学習フィ
ールドに印字しておく文字が、あらかじめ設定した文字
順で配列しているので、ある文字が読取り不可能な場
合、たとえば前述した例で“2”の存在する位置情報か
ら“2”を特定する文字コードがわかり、これと読み取
れなかった文字パターンとを教師信号として新たな文字
辞書を作成することによって可能となる。
字読取りに利用するとともに、読取り対象外の文字が入
力したときに、この読取り対象外の文字読取に必要な新
たな文字辞書作成用に利用する。このことは、学習フィ
ールドに印字しておく文字が、あらかじめ設定した文字
順で配列しているので、ある文字が読取り不可能な場
合、たとえば前述した例で“2”の存在する位置情報か
ら“2”を特定する文字コードがわかり、これと読み取
れなかった文字パターンとを教師信号として新たな文字
辞書を作成することによって可能となる。
【0028】帳票の読取りを開始する時、まず帳票の学
習フィールド21に印字されている文字を識別する。
習フィールド21に印字されている文字を識別する。
【0029】この時、確度の高い正解が得られれば、そ
の文字の辞書はすでに登録されていると判断し、以降の
データフィールド22の読取りを実行する。
の文字の辞書はすでに登録されていると判断し、以降の
データフィールド22の読取りを実行する。
【0030】一方、読取り不能や誤読が発生したり、識
別されたとしても確度の低い結果であれば、その文字は
登録されていないと判断する。登録されていないと判断
した時は、学習フィールド21の印字されている文字パ
ターンから自動的に辞書を作成し、登録した後、以降の
データフィールド22の読取りを実行するように動作す
る。
別されたとしても確度の低い結果であれば、その文字は
登録されていないと判断する。登録されていないと判断
した時は、学習フィールド21の印字されている文字パ
ターンから自動的に辞書を作成し、登録した後、以降の
データフィールド22の読取りを実行するように動作す
る。
【0031】学習フィールド21に印字された文字は、
決められた文字の順序で印字されているので正解が容易
にわかり、識別結果が所定の判定しきい値を超えて確度
の高いものであれば、ただちに以後のデータフィールド
22の読取りに移る。
決められた文字の順序で印字されているので正解が容易
にわかり、識別結果が所定の判定しきい値を超えて確度
の高いものであれば、ただちに以後のデータフィールド
22の読取りに移る。
【0032】しかし、これらの文字の内識別できなかっ
たり、誤読したり、あるいは正読しても確度が低い文字
がある場合には、辞書メモリ部14にその文字辞書が登
録されていないと判断する。
たり、誤読したり、あるいは正読しても確度が低い文字
がある場合には、辞書メモリ部14にその文字辞書が登
録されていないと判断する。
【0033】この時、確度が高い正解以外の文字に対し
ては、それらの文字イメージを辞書作成部15に送り、
それらの文字辞書を作成し、辞書メモリ部14に登録、
以後のデータフィールド部22の識別に移るように動作
する。
ては、それらの文字イメージを辞書作成部15に送り、
それらの文字辞書を作成し、辞書メモリ部14に登録、
以後のデータフィールド部22の識別に移るように動作
する。
【0034】尚、辞書作成のアルゴリズムは多種多様の
ものが発表されているが、本発明とは直接関係がないの
で説明は省略する。
ものが発表されているが、本発明とは直接関係がないの
で説明は省略する。
【0035】辞書メモリ部14には、通常使用頻度の高
いフォントの辞書を常時登録させておく部分と、辞書作
成部15によって新たに作成される辞書を登録する部分
に分けてある。
いフォントの辞書を常時登録させておく部分と、辞書作
成部15によって新たに作成される辞書を登録する部分
に分けてある。
【0036】辞書メモリ部14の新しく作成される辞書
のエリアが一杯になった場合は、使用頻度の低い辞書と
置きかえる機能を有する。また、その帳票に使用されて
いる文字が辞書メモリ部14に常時登録させているフォ
ントであることがあらかじめ判明している場合は、学習
フィールドは印字なし(ブランク)にしておくことによ
って、すなわちブランクを検知することによって、辞書
作成の処理を省略するように制御することが可能であ
る。
のエリアが一杯になった場合は、使用頻度の低い辞書と
置きかえる機能を有する。また、その帳票に使用されて
いる文字が辞書メモリ部14に常時登録させているフォ
ントであることがあらかじめ判明している場合は、学習
フィールドは印字なし(ブランク)にしておくことによ
って、すなわちブランクを検知することによって、辞書
作成の処理を省略するように制御することが可能であ
る。
【0037】さらに、図3に示すように、プリンタの印
字にクセ,たとえば図3では、数字0の下部が欠けてい
る場合がある場合にも、ダミーフィールドに印字してお
くことによってこれらの文字の辞書も自動的に作成され
るので読取りが可能となる。
字にクセ,たとえば図3では、数字0の下部が欠けてい
る場合がある場合にも、ダミーフィールドに印字してお
くことによってこれらの文字の辞書も自動的に作成され
るので読取りが可能となる。
【0038】
【発明の効果】以上説明したように本発明によれば、従
来の文字読取装置ではあらかじめ決められたフォントの
文字しか読取ることができなかったが、読取対象外のフ
ォントの文字でもそれに対応する辞書を自動作成するこ
とができ、任意のフォントの読取りを可能にする効果が
ある。
来の文字読取装置ではあらかじめ決められたフォントの
文字しか読取ることができなかったが、読取対象外のフ
ォントの文字でもそれに対応する辞書を自動作成するこ
とができ、任意のフォントの読取りを可能にする効果が
ある。
【図1】本発明の一実施例の構成を示すブロック図であ
る。
る。
【図2】図1の実施例における読取り帳票の一例を示す
図である。
図である。
【図3】プリンタの印字文字のクセの一例を示す図であ
る。
る。
10 走査部 11 イメージメモリ 12 文字切出し部 13 判定部 14 辞書メモリ部 15 辞書作成部 20 帳票識別コード 21 学習フィールド 22 データフィールド
Claims (1)
- 【特許請求の範囲】 【請求項1】 読み取るべきデータを印字するデータフ
ィールドの印字文字と同一フォントかつあらかじめ設定
した文字順で所定の文字を印字する学習フィールドを帳
票に備える手段と、前記学習フィールドを備えた帳票を
照合により読み取るための第一の文字辞書を備えて前記
帳票を読み取るとともに、前記学習フィールドに対する
読取り不可能なすべての文字の文字パタンと、文字位置
にもとづいて得られる文字コードデータとを入力として
前記読取り不可能な文字を読取り可能とする第二の文字
辞書を作成して前記第一の文字辞書と合体させつつ前記
帳票を読み取る手段とを備えて成ることを特徴とする文
字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3178625A JPH0528302A (ja) | 1991-07-19 | 1991-07-19 | 文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3178625A JPH0528302A (ja) | 1991-07-19 | 1991-07-19 | 文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0528302A true JPH0528302A (ja) | 1993-02-05 |
Family
ID=16051727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3178625A Pending JPH0528302A (ja) | 1991-07-19 | 1991-07-19 | 文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0528302A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008210388A (ja) * | 2007-02-26 | 2008-09-11 | Fujitsu Ltd | コードを識別する方法、装置及びプログラム |
JP2009231871A (ja) * | 2008-03-19 | 2009-10-08 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
US8419630B2 (en) | 2009-11-06 | 2013-04-16 | Olympus Medical Systems Corp. | Endoscope system with front and lateral fields of view |
CN112219112A (zh) * | 2018-06-08 | 2021-01-12 | 麦克赛尔新领域株式会社 | 印刷检查机 |
-
1991
- 1991-07-19 JP JP3178625A patent/JPH0528302A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008210388A (ja) * | 2007-02-26 | 2008-09-11 | Fujitsu Ltd | コードを識別する方法、装置及びプログラム |
JP2009231871A (ja) * | 2008-03-19 | 2009-10-08 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
US8419630B2 (en) | 2009-11-06 | 2013-04-16 | Olympus Medical Systems Corp. | Endoscope system with front and lateral fields of view |
CN112219112A (zh) * | 2018-06-08 | 2021-01-12 | 麦克赛尔新领域株式会社 | 印刷检查机 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4610025A (en) | Cryptographic analysis system | |
JPH04195692A (ja) | 文書読取装置 | |
KR100351171B1 (ko) | 전표종별 판별방법 및 그 장치 | |
JP4280355B2 (ja) | 文字認識装置 | |
JP4807618B2 (ja) | 画像処理装置及び画像処理プログラム | |
JPH0528302A (ja) | 文字読取装置 | |
JPH1125209A (ja) | 情報入力装置、情報入力方法、記憶媒体、及び二次元バーコード印刷装置 | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
JP2006079571A (ja) | プリンタ印刷照合検査装置 | |
JP2001052110A (ja) | 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置 | |
JP3159087B2 (ja) | 文書照合装置および方法 | |
JP2570571B2 (ja) | 光学文字読取装置 | |
EP0692768A2 (en) | Full text storage and retrieval in image at OCR and code speed | |
JPH0991385A (ja) | 文字認識辞書追加方法及びこれを用いた端末ocr装置 | |
JP2924356B2 (ja) | 光学文字読取装置 | |
JPH10162103A (ja) | 文字認識装置 | |
JP2005301477A (ja) | 住所認識システム及び住所認識方法 | |
JPS62295192A (ja) | 光学文字画像読取装置 | |
JPH05266244A (ja) | 文字読取装置 | |
JP2904517B2 (ja) | 文字認識装置 | |
JP2851102B2 (ja) | 文字切出し方法 | |
JPH08221507A (ja) | 文書認識方法および装置 | |
JPH0578873B2 (ja) | ||
JPH07306911A (ja) | Ocr読取結果修正装置 | |
JPS6129976A (ja) | 文字認識方法 |