JPH0677270B2 - Character recognition device - Google Patents
Character recognition deviceInfo
- Publication number
- JPH0677270B2 JPH0677270B2 JP59004155A JP415584A JPH0677270B2 JP H0677270 B2 JPH0677270 B2 JP H0677270B2 JP 59004155 A JP59004155 A JP 59004155A JP 415584 A JP415584 A JP 415584A JP H0677270 B2 JPH0677270 B2 JP H0677270B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- character
- data
- line width
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 <発明の技術分野> 本発明は、未知文字を光学的に読み取り、これを白黒2
値化して文字パターンを求め、この文字パターンに基づ
き未知文字の特徴を抽出し標準パターンと照合して、未
知文字を認識する文字認識装置に関する。DETAILED DESCRIPTION OF THE INVENTION Technical Field of the Invention According to the present invention, an unknown character is optically read and is read in black and white.
The present invention relates to a character recognition device that digitizes a character pattern, extracts characteristics of an unknown character based on the character pattern, collates the character with a standard pattern, and recognizes the unknown character.
<発明の背景> 従来の文字認識装置は、第1図に示す如く、文字読取り
部を構成する読取りヘッド3,CCD(Charged-Coupled De
vice)4,A/D変換器5を含んでおり、帳票1上の未知文
字2を読取りヘツド3で光学的に読み取り、これをCCD4
で電気信号に変換し、更にA/D変換器5によりデジタル
信号に変換する。このデジタル信号は前処理回路6に与
えられ、データの2値化ノイズ除去、平滑化、丸め処理
等、文字認識に必要な前処理を行なつている。前処理回
路6は、第2図に示す如く、A/D変換器5の出力を白黒
2値化して文字パターンを画像メモリ7に格納する2値
化回路8と、文字パターンの線幅を測定して線幅判定信
号iを出力する線幅測定回路9と、線幅判定信号iの内
容に基づき前記2値化処理のしきい値を可変設定するし
きい値決定回路10と、文字パターンを構成する複数のメ
ッシュのデータを所定の変換条件により1メッシュのメ
ッシュ変換データに変換して被検査パターンを生成し、
これを画像メモリ11上に組み立てる丸め処理回路12とを
含む。ここでメッシュとは画素を意味する(以下、同
様)。前記被検査パターンは文字認識部13の特徴抽出回
路14に入力され、文字の特徴、例えば交点数、端点数、
分枝点数、ループ数等がコード化されて抽出され、更に
この特徴コードは辞書照合回路15において、辞書16に予
め格納してある標準パターンの特徴コードと照合され
る。その結果、両者が一致すると、その特徴コードをも
つ標準パターンのIDコードが出力され、また不一致のと
き、再処理指令jが前記前処理回路6へ送られる。この
再処理指令jがあると、前処理回路6のしきい値決定回
路10は線幅判定信号iの内容に基づき2値化処理のしき
い値を大小変更して、文字パターンの線幅を補正し、こ
の補正されたパターンに基づき特徴抽出以下の同様の文
字認識処理が再実施される。ところがこの種従来方式の
場合、文字パターンにおける白地と黒地との境界部分の
濃度差が一定レベル以上あると、しきい値を大小変更し
ても文字パターンの補正効果が顕著に現われない場合が
生ずる。例えば帳票への文字書込みに使用された筆記具
の種類によつては、前記濃度差がきわめて大きくなり、
かかる場合には文字認識処理の再実施が無意味となり、
認識処理効率を低下させるだけとなる。<Background of the Invention> As shown in FIG. 1, a conventional character recognition device has a reading head 3 and a CCD (Charged-Coupled Decoder) that constitute a character reading unit.
vice) 4 and A / D converter 5, the unknown character 2 on the form 1 is read optically by the head 3, and this is read by the CCD4.
Is converted into an electric signal and further converted into a digital signal by the A / D converter 5. This digital signal is given to the pre-processing circuit 6, and pre-processing necessary for character recognition, such as data binary noise removal, smoothing, and rounding, is performed. The pre-processing circuit 6 measures the line width of the character pattern and the binarization circuit 8 for binarizing the output of the A / D converter 5 and storing the character pattern in the image memory 7, as shown in FIG. A line width measuring circuit 9 for outputting a line width judging signal i, a threshold value deciding circuit 10 for variably setting the threshold value of the binarization processing based on the contents of the line width judging signal i, and a character pattern. Data of a plurality of constituent meshes is converted into mesh conversion data of one mesh under a predetermined conversion condition to generate an inspection pattern,
A rounding circuit 12 for assembling this on the image memory 11 is included. Here, the mesh means a pixel (hereinafter the same). The pattern to be inspected is input to the feature extraction circuit 14 of the character recognition unit 13, the features of the character, for example, the number of intersections, the number of end points,
The number of branch points, the number of loops, etc. are coded and extracted, and this characteristic code is collated by the dictionary collating circuit 15 with the characteristic code of the standard pattern stored in the dictionary 16 in advance. As a result, if the two match, the ID code of the standard pattern having the characteristic code is output, and if they do not match, the reprocessing command j is sent to the preprocessing circuit 6. When the reprocessing command j is issued, the threshold value determination circuit 10 of the preprocessing circuit 6 changes the threshold value of the binarization processing based on the content of the line width determination signal i to change the line width of the character pattern. After the correction, the same character recognition process from the feature extraction is performed again based on the corrected pattern. However, in the case of this type of conventional method, when the density difference at the boundary portion between the white background and the black background in the character pattern exceeds a certain level, the correction effect of the character pattern may not appear remarkably even if the threshold value is changed. . For example, depending on the type of writing instrument used to write characters on a form, the density difference becomes extremely large,
In such a case, re-execution of character recognition processing is meaningless,
It only reduces the recognition processing efficiency.
<発明の目的> 本発明は、文字認識処理の再実施に際し、文字パターン
の線幅補正を2値化処理以降の段階で実施する方式を採
用することによつて、文字パターンの補正効果を向上さ
せた文字認識装置を提供することを目的とする。<Object of the Invention> The present invention improves the correction effect of a character pattern by adopting a method of performing line width correction of a character pattern in a stage after the binarization process when re-executing the character recognition process. An object of the present invention is to provide a character recognition device for the above.
<発明の構成および効果> 本発明の文字認識装置は、未知文字を読み取って電気信
号に変換する文字読取り部と、前記文字読取り部の出力
を白黒2値化して文字パターンを生成する2値化処理部
と、前記2値化処理部で生成された文字パターンの線幅
を測定して線幅の大小の状態を示す線幅判定信号を出力
する線幅測定部と、前記文字パターンを所定のマスク領
域に分割して分割領域毎のパターンデータをマスク走査
により取り出すマスク走査部と、前記マスク走査部によ
り取り出された各パターンデータを被検査パターンを構
成するデータに変換するためのメモリをもつデータ変換
部と、前記データ変換部の出力データにより構成される
被検査パターンより未知文字の特徴を抽出し標準パター
ンと照合して未知文字を認識すると共に、未知文字を認
識できなかったとき、再処理指令を出力する文字認識部
とを備えたものである。そして前記データ変換部は、前
記文字認識部からの再処理指令の有無と、前記線幅測定
部より出力される線幅判定信号と、前記マスク走査部に
より取り出されたパターンデータとの組み合わせを前記
メモリのアドレスとして入力して、対応するメモリアド
レスより被検査パターンを構成するデータを出力させる
ようにしている。<Structure and Effect of the Invention> The character recognition device of the present invention is a binarization unit that reads an unknown character and converts it into an electric signal, and binarizes the output of the character reading unit into black and white to generate a character pattern. A processing unit, a line width measuring unit that measures the line width of the character pattern generated by the binarization processing unit and outputs a line width determination signal indicating the size of the line width, and the character pattern Data having a mask scanning section for dividing the mask area into pattern areas and extracting pattern data for each divided area by mask scanning, and a memory for converting each pattern data extracted by the mask scanning section into data forming a pattern to be inspected The conversion unit and the characteristic of the unknown character are extracted from the pattern to be inspected composed of the output data of the data conversion unit, and the unknown character is recognized by comparing with the standard pattern and the unknown character is recognized. When a character cannot be recognized, a character recognition unit that outputs a reprocessing command is provided. Then, the data conversion unit determines the combination of the presence or absence of a reprocessing instruction from the character recognition unit, the line width determination signal output from the line width measurement unit, and the pattern data extracted by the mask scanning unit. The data is input as a memory address, and the data forming the pattern to be inspected is output from the corresponding memory address.
本発明によれば、文字パターンにおける白地と黒地との
境界部分の濃度差が大きい場合であつても、文字パター
ンの線幅補正効果が顕著に現われる。従つて使用される
筆記具の種類等によつて補正効果が左右されることがな
く、文字認識処理の再実施が有効となり、文字認識精度
が向上する等、発明目的を達成した優れた効果を奏す
る。According to the present invention, the line width correction effect of the character pattern is remarkably exhibited even when the density difference at the boundary portion between the white background and the black background in the character pattern is large. Therefore, the correction effect does not depend on the type of writing instrument used, the re-execution of the character recognition process becomes effective, and the character recognition accuracy is improved. .
<実施例の説明> 第3図は本発明を実施した文字認識装置の部分的構成を
示す。<Description of Embodiments> FIG. 3 shows a partial structure of a character recognition device embodying the present invention.
同図中、A/D変換器5は、CCD出力を複数レベルのデジタ
ル信号に変換して前処理回路6へ送出する。前処理回路
6は、A/D変換器5の出力を一定レベルのしきい値で2
値化して文字パターンを画像メモリ7(例えば縦横64メ
ツシユ)へ格納する2値化回路8と、前記しきい値を設
定して2値化回路8へ付与するしきい値決定回路10と、
文字パターンの線幅を測定して線幅の大小の状態を示す
線幅判定信号iを出力する線幅測定回路9と、文字パタ
ーンを構成する複数のメッシュのデータを所定の変換条
件に従って1メッシュのメッシュ変換データに変換して
画像メモリ11(例えば縦横32メツシユ)へ被検査パター
ンを組み立てる丸め処理回路20とを含む。In the figure, an A / D converter 5 converts the CCD output into digital signals of a plurality of levels and sends it to the preprocessing circuit 6. The pre-processing circuit 6 outputs the output of the A / D converter 5 at a constant level threshold value of 2
A binarization circuit 8 for binarizing and storing the character pattern in the image memory 7 (for example, a vertical and horizontal 64 mesh); a threshold value determining circuit 10 for setting the threshold value and giving it to the binarization circuit 8;
A line width measuring circuit 9 that measures the line width of a character pattern and outputs a line width determination signal i indicating the size of the line width, and a mesh of data of a plurality of meshes forming the character pattern according to a predetermined conversion condition. And a rounding processing circuit 20 for assembling the pattern to be inspected into the image memory 11 (for example, 32 meshes in the vertical and horizontal directions).
本実施例における丸め処理回路20は、第5図に示す如
く、文字パターンを構成する4メツシユ(縦2メツシユ
×横2メツシユ)分の各パターンデータ群a1,a2,a3,…
…,an,……を1メツシユのメツシユ変換データb1,b2,
b3,……,bn,……にデータ変換するための回路であり、
第4図に示す如く、画像メモリ7をマスク走査して4メ
ツシユ分のパターンデータ群を順次取り出すマスク走査
回路21と、マスク走査回路21の出力をアドレスデータと
して対応するアドレスにメツシユ変換データを格納して
あるROM(Read Only Memory)22とから成る。このROM
22のアドレスは、線幅判定信号iおよび、文字認識部か
らの再処理指令jによつても規定され、前記再処理指令
jの有無と線幅判定信号iと前記マスク走査回路21より
出力された4メッシュのパターンデータ群との組み合わ
せとから成るアドレスデータ入力に基づき、ROM22より
いずれか対応するアドレスのメツシユ変換データが選択
出力され、画像メモリ11に被検査パターンが組み立てら
れる。The rounding processing circuit 20 in this embodiment, as shown in FIG. 5, has a pattern data group a 1 , a 2 , a 3 , ... For 4 meshes (2 meshes in the vertical direction × 2 meshes in the horizontal direction) which form a character pattern.
..., an, ... is the mesh conversion data of 1 mesh b 1 , b 2 ,
b 3, ..., bn, a circuit for converting data into ....,
As shown in FIG. 4, a mask scanning circuit 21 for sequentially scanning a pattern data group for four meshes by scanning the image memory 7 and an output of the mask scanning circuit 21 as address data, and storing the mesh conversion data at a corresponding address. It is composed of a read only memory (ROM) 22. This ROM
The address 22 is also defined by the line width determination signal i and the reprocessing command j from the character recognition unit. The presence or absence of the reprocessing command j, the line width determination signal i, and the mask scanning circuit 21 output the address. Based on the address data input consisting of the combination with the 4 mesh pattern data group, the mesh conversion data of any corresponding address is selectively output from the ROM 22, and the pattern to be inspected is assembled in the image memory 11.
例えば通常処理時、すなわち再処理指令jが発せられて
いない場合は、第6図(1)に示す如く、4メッシュの
パターンデータ群に2メッシュ以上の黒地データ(図中
斜線で示す)を含むとき、メッシュ変換データとして1
メッシュの黒地データ(それ以外は1メッシュの白地デ
ータ)が設定される。すなわち再処理指令jがオフであ
って、4メッシュ中、2メッシュ以上が黒地データであ
るとき、線幅判定信号iの内容を問わず、ROM22からの
出力データが黒地データとなるようにROM22のメッシュ
変換データを設定しておくのである。また再処理後、す
なわち再処理指令jが発せられた場合は、線幅判定信号
iの内容に応じて前記変換条件が変更されるもので、線
幅判定信号iが“太め”を意味する内容である場合、第
6図(2)に示すように、4メッシュのパターンデータ
群に3メッシュ以上の黒地データを含むとき、メッシュ
変換データとして1メッシュの黒地データ(それ以外は
1メッシュの白地データ)が設定され、これにより文字
パターンが細め処理される。すなわち再処理指令jがオ
ンであり、4メッシュ中、3メッシュ以上が黒地データ
であって、線幅判定信号iが“太め”を意味する内容で
あるとき、ROM22からの出力データが黒地データとなる
ようにROM22のメッシュ変換データを設定しておくので
ある。さらに再処理時、すなわち再処理指令jが発せら
れた場合において、線幅判定信号iが“細め”を意味す
る内容である場合、第6図(3)に示すように、4メッ
シュのパターンデータ群に1メッシュ以上の黒地データ
を含むとき、メッシュ変換データとして1メッシュの黒
地データ(それ以外は1メッシュの白地データ)が設定
され、これにより文字パターンが太め処理される。すな
わち再処理指令jがオンであり、4メッシュ中、1メッ
シュ以上が黒地データであって、線幅判定信号iが“細
め”を意味する内容であるとき、ROM22からの出力デー
タが黒地データとなるようにROM22のメッシュ変換デー
タを設定しておくのである。For example, during normal processing, that is, when the reprocessing command j is not issued, as shown in FIG. 6 (1), the 4-mesh pattern data group includes black background data of 2 meshes or more (indicated by diagonal lines in the drawing). When, 1 as mesh conversion data
The black background data of the mesh (other than that, the white background data of 1 mesh) is set. That is, when the reprocessing command j is off and 2 or more meshes out of 4 meshes are black background data, the output data from the ROM 22 becomes black background data regardless of the content of the line width determination signal i. The mesh conversion data is set. Further, after the reprocessing, that is, when the reprocessing command j is issued, the conversion condition is changed according to the content of the line width determination signal i, and the content indicating that the line width determination signal i is "thick" 6 (2), when the 4-mesh pattern data group includes 3 or more black background data, 1 mesh black background data (other than that, 1 mesh white background data) as mesh conversion data. ) Is set, and the character pattern is thinned by this. That is, when the reprocessing command j is ON, and 3 or more meshes out of 4 meshes are black background data and the line width determination signal i has a content that means "thick", the output data from the ROM 22 is black background data. The mesh conversion data of the ROM 22 is set so that Further, at the time of reprocessing, that is, when the reprocessing command j is issued, if the line width determination signal i has a content that means "thinning", as shown in FIG. When the group includes one or more mesh black background data, one mesh black background data (other than that, one mesh white background data) is set as the mesh conversion data, and the character pattern is thickened. That is, when the reprocessing command j is on, 1 or more of the 4 meshes are black background data, and the line width determination signal i has a content that means "narrow", the output data from the ROM 22 is black background data. The mesh conversion data of the ROM 22 is set so that
斯くて未知文字の認識が不能である場合には、文字認識
部より再処理指令jが前処理回路6へ送出され、丸め処
理回路20において、文字パターンの線幅が細いときは太
め処理が、太いときは細め処理が夫々実行されて被検査
パターンが再度組み立てられ、この被検査パターンより
文字の特徴が再抽出されて、文字認識処理が実行され
る。Thus, when the unknown character cannot be recognized, the character recognition unit sends the reprocessing command j to the preprocessing circuit 6, and the rounding processing circuit 20 performs the thickening processing when the line width of the character pattern is thin. When it is thick, the thinning process is executed to reassemble the pattern to be inspected, the feature of the character is re-extracted from the pattern to be inspected, and the character recognition process is executed.
第1図は文字認識装置の全体構成を示すブロツク図、第
2図は従来の前処理回路の構成を示すブロツク図、第3
図は本発明にかかる前処理回路の構成を示すブロツク
図、第4図は丸め処理回路の構成を示すブロツク図、第
5図はメツシユ変換処理を示す説明図、第6図はメツシ
ユ変換パターンを例示した説明図である。 6……前処理回路、9……線幅測定回路 13……文字認識部、20……丸め処理回路 22……ROMFIG. 1 is a block diagram showing the overall configuration of the character recognition device, FIG. 2 is a block diagram showing the configuration of a conventional preprocessing circuit, and FIG.
FIG. 4 is a block diagram showing a configuration of a preprocessing circuit according to the present invention, FIG. 4 is a block diagram showing a configuration of a rounding processing circuit, FIG. 5 is an explanatory diagram showing a mesh conversion process, and FIG. 6 is a mesh conversion pattern. It is the explanatory view illustrated. 6 ... Pre-processing circuit, 9 ... Line width measuring circuit 13 ... Character recognition unit, 20 ... Rounding processing circuit 22 ... ROM
Claims (1)
文字読取り部と、 前記文字読取り部の出力を白黒2値化して文字パターン
を生成する2値化処理部と、 前記2値化処理部で生成された文字パターンの線幅を測
定して線幅の大小の状態を示す線幅判定信号を出力する
線幅測定部と、 前記文字パターンを所定のマスク領域に分割して分割領
域毎のパターンデータをマスク走査により取り出すマス
ク走査部と、 前記マスク走査部により取り出された各パターンデータ
を被検査パターンを構成するデータに変換するためのメ
モリをもつデータ変換部と、 前記データ変換部の出力データにより構成される被検査
パターンより未知文字の特徴を抽出し標準パターンと照
合して未知文字を認識すると共に、未知文字を認識でき
なかったとき、再処理指令を出力する文字認識部とを備
えており、 前記データ変換部は、 前記文字認識部からの再処理指令の有無と、前記線幅測
定部より出力される線幅判定信号と、前記マスク走査部
により取り出されたパターンデータとの組み合わせを前
記メモリのアドレスとして入力して、対応するメモリア
ドレスより被検査パターンを構成するデータを出力させ
るようにした文字認識装置。1. A character reading unit for reading an unknown character and converting it into an electric signal, a binarization processing unit for binarizing an output of the character reading unit in black and white to generate a character pattern, and the binarization processing unit. A line width measurement unit that measures the line width of the character pattern generated in step S1 and outputs a line width determination signal that indicates the size of the line width, and divides the character pattern into predetermined mask areas and A mask scanning section for taking out pattern data by mask scanning, a data converting section having a memory for converting each pattern data taken out by the mask scanning section into data forming a pattern to be inspected, and an output of the data converting section The characteristics of unknown characters are extracted from the pattern to be inspected that is composed of data, and the unknown characters are recognized by matching them with the standard pattern. And a character recognition unit for outputting a command, the data conversion unit, the presence or absence of a reprocessing command from the character recognition unit, a line width determination signal output from the line width measurement unit, the mask scanning A character recognition device configured to input a combination with pattern data extracted by a unit as an address of the memory, and to output data forming a pattern to be inspected from a corresponding memory address.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59004155A JPH0677270B2 (en) | 1984-01-11 | 1984-01-11 | Character recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59004155A JPH0677270B2 (en) | 1984-01-11 | 1984-01-11 | Character recognition device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS60147892A JPS60147892A (en) | 1985-08-03 |
JPH0677270B2 true JPH0677270B2 (en) | 1994-09-28 |
Family
ID=11576860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59004155A Expired - Lifetime JPH0677270B2 (en) | 1984-01-11 | 1984-01-11 | Character recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0677270B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0721814B2 (en) * | 1985-03-30 | 1995-03-08 | 株式会社東芝 | Character / mark reader |
-
1984
- 1984-01-11 JP JP59004155A patent/JPH0677270B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS60147892A (en) | 1985-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3139521B2 (en) | Automatic language determination device | |
JPS63158678A (en) | Inter-word space detecting method | |
JPS6140684A (en) | Contour tracking device | |
US4893187A (en) | Image processing apparatus | |
US4138662A (en) | Character reader | |
JPH0677270B2 (en) | Character recognition device | |
JP2894111B2 (en) | Comprehensive judgment method of recognition result in optical type character recognition device | |
JP2859681B2 (en) | Fingerprint data binarization method | |
JP2812619B2 (en) | Image processing device | |
JPS5914078A (en) | Reader of business form | |
JP2902097B2 (en) | Information processing device and character recognition device | |
JP3160458B2 (en) | Character reading device and character reading method | |
JPS59158482A (en) | Character recognizing device | |
JPS61290581A (en) | Extracting and storing device for retrieval information | |
JPS5960690A (en) | Binary coding device | |
JPS62281094A (en) | Recognition method for pattern information | |
JPS6249482A (en) | Image preprocessing device | |
JPS60225985A (en) | Character recognizer | |
JPH0776979B2 (en) | Image processing method | |
JPS59189481A (en) | Character recognizing device | |
JPS62281095A (en) | Recognition method for pattern information | |
JPS62221082A (en) | Character re-recognizing system | |
JPH04316180A (en) | Method for discriminating attribute of document picture | |
JPS63208182A (en) | Pattern recognizing device | |
JPS5931105B2 (en) | character reading device |