JPH05290212A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH05290212A JPH05290212A JP4088552A JP8855292A JPH05290212A JP H05290212 A JPH05290212 A JP H05290212A JP 4088552 A JP4088552 A JP 4088552A JP 8855292 A JP8855292 A JP 8855292A JP H05290212 A JPH05290212 A JP H05290212A
- Authority
- JP
- Japan
- Prior art keywords
- rectangle
- complexity
- character
- integrated
- separator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 文字・表図形・写真が混在する印刷文書を認
識するために、光学的手段を用いて取り込んだ画像デー
タを基に文字ブロック・図形ブロック等の領域に分割す
る。 【構成】 スキャナにより取り込んだ二値データに対し
て縮小処理を行い、連結黒画素が外接する矩形を検出す
る。検出した外接矩形に対して、文字であれば行を非連
続セパレータであれば1つのセパレータとして抽出する
ために、矩形の統合を行なう。統合した矩形内の図柄の
複雑度を検出し、文書構成要素の図柄の複雑度はフィー
ルドセパレータ、文字、図形の順に高いという条件に基
づいて属性の判定を行なう。 【効果】 複雑度を用いた属性の判定を行うので、サイ
ズや縦横比等の外形からでは判定不可能な領域属性につ
いても認識することが可能となった。
識するために、光学的手段を用いて取り込んだ画像デー
タを基に文字ブロック・図形ブロック等の領域に分割す
る。 【構成】 スキャナにより取り込んだ二値データに対し
て縮小処理を行い、連結黒画素が外接する矩形を検出す
る。検出した外接矩形に対して、文字であれば行を非連
続セパレータであれば1つのセパレータとして抽出する
ために、矩形の統合を行なう。統合した矩形内の図柄の
複雑度を検出し、文書構成要素の図柄の複雑度はフィー
ルドセパレータ、文字、図形の順に高いという条件に基
づいて属性の判定を行なう。 【効果】 複雑度を用いた属性の判定を行うので、サイ
ズや縦横比等の外形からでは判定不可能な領域属性につ
いても認識することが可能となった。
Description
【0001】
【産業上の利用分野】本発明は、文字・表図形・写真が
混在する印刷文書を認識するために、スキャナ等の光学
的手段を用いて文書画像を取り込み、取り込んだ画像デ
ータを基に文字ブロック・図形ブロック等に領域を分割
する文字認識装置に関するものである。
混在する印刷文書を認識するために、スキャナ等の光学
的手段を用いて文書画像を取り込み、取り込んだ画像デ
ータを基に文字ブロック・図形ブロック等に領域を分割
する文字認識装置に関するものである。
【0002】
【従来の技術】従来の文字認識装置の領域分割方式につ
いて以下説明する。
いて以下説明する。
【0003】まず、スキャナによって取り込まれた二値
データから黒画素が8近傍で連結している箇所を検出
し、黒塊に外接する矩形の位置と大きさの情報を格納す
る(以下、外接矩形と呼ぶ)。検出された外接矩形の大
きさから図形とそれ以外とに分離する。図形でない矩形
については矩形の縦横比から文字とフィールドセパレー
タとに分離することにより領域の属性を決定していた。
データから黒画素が8近傍で連結している箇所を検出
し、黒塊に外接する矩形の位置と大きさの情報を格納す
る(以下、外接矩形と呼ぶ)。検出された外接矩形の大
きさから図形とそれ以外とに分離する。図形でない矩形
については矩形の縦横比から文字とフィールドセパレー
タとに分離することにより領域の属性を決定していた。
【0004】
【発明が解決しようとする課題】従来の文字認識装置の
領域分割方式では、文字が連続して接触している文書で
は、矩形の縦横比による文字とフィールドセパレータの
分離は困難である。また、点線等の非連続なセパレータ
の検出も矩形の縦横比だけでは分離不可能である。とい
った問題を有していた。
領域分割方式では、文字が連続して接触している文書で
は、矩形の縦横比による文字とフィールドセパレータの
分離は困難である。また、点線等の非連続なセパレータ
の検出も矩形の縦横比だけでは分離不可能である。とい
った問題を有していた。
【0005】
【課題を解決するための手段】本発明は、前記問題点を
解決するため、以下に示す手段を設ける。
解決するため、以下に示す手段を設ける。
【0006】まず、スキャナによって取り込まれた二値
データから黒画素が8近傍で連結している箇所を検出
し、黒塊に外接する矩形の位置と大きさの情報を格納す
る。検出された外接矩形の大きさから図形とそれ以外と
に分離する。
データから黒画素が8近傍で連結している箇所を検出
し、黒塊に外接する矩形の位置と大きさの情報を格納す
る。検出された外接矩形の大きさから図形とそれ以外と
に分離する。
【0007】図形でない矩形については、各外接矩形と
その前後左右の矩形との距離と大きさから矩形を統合す
る方向を決定し、矩形の統合処理を行なう。
その前後左右の矩形との距離と大きさから矩形を統合す
る方向を決定し、矩形の統合処理を行なう。
【0008】次に、フィールドセパレータと文字と図形
の画像特徴として、図柄の複雑度合は、 図形 > 文字 > フィールドセパレータ の順であると言えるので、矩形内の複雑度を抽出するこ
とにより矩形の属性を決定する。統合矩形に対して、矩
形の長辺方向の各ライン毎に白画素から黒画素に変化す
る回数を計数し、1行あたりの白画素から黒画素に変化
する変化点の平均を算出する。ここで得た1行あたりの
変化点の平均を矩形の複雑度とする。複雑度があらかじ
め定められたセパレータ閾値th sepa以下であれ
ばその統合矩形はセパレータと判定される。さらに、複
雑度があらかじめ定められた図形閾値th diag以
上であれば、図形矩形と判断され残りが文字矩形とな
る。
の画像特徴として、図柄の複雑度合は、 図形 > 文字 > フィールドセパレータ の順であると言えるので、矩形内の複雑度を抽出するこ
とにより矩形の属性を決定する。統合矩形に対して、矩
形の長辺方向の各ライン毎に白画素から黒画素に変化す
る回数を計数し、1行あたりの白画素から黒画素に変化
する変化点の平均を算出する。ここで得た1行あたりの
変化点の平均を矩形の複雑度とする。複雑度があらかじ
め定められたセパレータ閾値th sepa以下であれ
ばその統合矩形はセパレータと判定される。さらに、複
雑度があらかじめ定められた図形閾値th diag以
上であれば、図形矩形と判断され残りが文字矩形とな
る。
【0009】
【作用】本発明はこの構成により、連続文字接触してい
る文書や非連続フィールドセパレータを含む文書につい
ても領域の分割が可能となる。
る文書や非連続フィールドセパレータを含む文書につい
ても領域の分割が可能となる。
【0010】
【実施例】本発明の一実施例における文字認識装置につ
いて図面を参照して説明する。図1は本発明の一実施例
における領域分割を実行する装置ブロックを示したもの
である。図1において、1は領域分割プログラムが格納
されているROMである。2は領域分割を行うCPUで
あって、図2の画像データ縮小部6、外接矩形取得部
7、外接矩形の属性判定部8、矩形統合部9、矩形複雑
度検出部10、統合矩形の属性判定部11と属性判定部
8、11で決定した領域の属性に従って認識処理を行な
う認識処理部12とを有する。3はスキャナ4によって
取り込まれた二値データを格納するRAMである。5は
CPUによって分割された各領域の認識結果を表示する
表示装置である。
いて図面を参照して説明する。図1は本発明の一実施例
における領域分割を実行する装置ブロックを示したもの
である。図1において、1は領域分割プログラムが格納
されているROMである。2は領域分割を行うCPUで
あって、図2の画像データ縮小部6、外接矩形取得部
7、外接矩形の属性判定部8、矩形統合部9、矩形複雑
度検出部10、統合矩形の属性判定部11と属性判定部
8、11で決定した領域の属性に従って認識処理を行な
う認識処理部12とを有する。3はスキャナ4によって
取り込まれた二値データを格納するRAMである。5は
CPUによって分割された各領域の認識結果を表示する
表示装置である。
【0011】以下、領域分割処理について図3のフロー
チャートを基に説明する。まず、スキャナ4によって取
り込まれた二値画像データを6の画像データ縮小部にお
いて100DPI程度の大きさに縮小する(s1)。図
5は縮小されたイメージデータであり、文字と非連続の
フィールドセパレータが取り込まれている。
チャートを基に説明する。まず、スキャナ4によって取
り込まれた二値画像データを6の画像データ縮小部にお
いて100DPI程度の大きさに縮小する(s1)。図
5は縮小されたイメージデータであり、文字と非連続の
フィールドセパレータが取り込まれている。
【0012】7の外接矩形取得部では、画像データ縮小
部で縮小されたデータに対して、黒画素の連結状態を調
べ、黒画素が連結しているかたまりに外接する矩形を取
得し、その開始位置の座標と大きさをRAM2に格納す
る(s2)。図6は図5の縮小イメージデータから検出
した外接矩形である。
部で縮小されたデータに対して、黒画素の連結状態を調
べ、黒画素が連結しているかたまりに外接する矩形を取
得し、その開始位置の座標と大きさをRAM2に格納す
る(s2)。図6は図5の縮小イメージデータから検出
した外接矩形である。
【0013】7の外接矩形検出部より検出した外接矩形
情報を基に、8の外接矩形の属性判定部において、外接
矩形の短辺の長さが図形サイズ閾値char max以
上であればその外接矩形は図形矩形となり、図形属性が
セットされる(s3、s11)。図形矩形とならなかっ
た矩形について矩形の縦横比を検出する。矩形の縦横比
がセパレータ縦横比の閾値ratio sepa以上で
あればその矩形はフィールドセパレータとなり、セパレ
ータ属性がセットされる(s4、s12)。図6の22
の外接矩形は上記の2つの条件を満たさないので、s5
へ進む。残った22の矩形は文字かまたは、非連続セパ
レータの一部である。属性判定部8で残った矩形に対し
て、矩形統合部9で矩形の統合を行なう(s5)。図7
は外接矩形の統合結果であり、この例では2つの統合矩
形が抽出される。統合された統合矩形は、文字の行か、
あるいは、フィールドセパレータとなるが、統合矩形の
縦横比情報では文字行かフィールドセパレータかを判定
することは不可能である。したがって、文字かセパレー
タかを判定するために、10の矩形複雑度検出部では矩
形内の図柄の複雑度特徴を用いて、文字かフィールドセ
パレータの判定を行なう(s6)。複雑度合は、図形、
文字、フィールドセパレータの順であり、複雑度指数に
は、1ラインあたりの画素変化数を用いる。複雑度の検
出方法については図4のフローチャートに基づいて、以
下に詳細に説明する。
情報を基に、8の外接矩形の属性判定部において、外接
矩形の短辺の長さが図形サイズ閾値char max以
上であればその外接矩形は図形矩形となり、図形属性が
セットされる(s3、s11)。図形矩形とならなかっ
た矩形について矩形の縦横比を検出する。矩形の縦横比
がセパレータ縦横比の閾値ratio sepa以上で
あればその矩形はフィールドセパレータとなり、セパレ
ータ属性がセットされる(s4、s12)。図6の22
の外接矩形は上記の2つの条件を満たさないので、s5
へ進む。残った22の矩形は文字かまたは、非連続セパ
レータの一部である。属性判定部8で残った矩形に対し
て、矩形統合部9で矩形の統合を行なう(s5)。図7
は外接矩形の統合結果であり、この例では2つの統合矩
形が抽出される。統合された統合矩形は、文字の行か、
あるいは、フィールドセパレータとなるが、統合矩形の
縦横比情報では文字行かフィールドセパレータかを判定
することは不可能である。したがって、文字かセパレー
タかを判定するために、10の矩形複雑度検出部では矩
形内の図柄の複雑度特徴を用いて、文字かフィールドセ
パレータの判定を行なう(s6)。複雑度合は、図形、
文字、フィールドセパレータの順であり、複雑度指数に
は、1ラインあたりの画素変化数を用いる。複雑度の検
出方法については図4のフローチャートに基づいて、以
下に詳細に説明する。
【0014】統合矩形の長辺の長さ分以下の処理を繰り
返すので、RAM2の繰り返しループカウンタroop
に統合矩形の長辺の長さをセットする(s13)。図7
の統合矩形1のループカウンタroopは55で、統合
矩形2のroopは52がセットされる。白画素から黒
画素に変化する変化点の総数を格納するRAM2のto
talと実際に変化点が存在したライン数を格納する変
化点有りライン数lineの初期化を行なう(s1
4)。変化点検出行を1ラインにセットする(s1
5)。統合矩形の短辺方向に白画素から黒画素に変化す
る回数をカウントする(s16)。ここで、最初のドッ
トが黒画素の場合は変化点数に1プラスする。従って、
統合矩形1の1ライン目の変化点数は1となり、統合矩
形2の変化点数は2となる。変化点数が検出されたライ
ンでは変化点総数totalに検出変化点数を足し込
み、変化点有りライン数lineをインクリメントする
(s18、s19)。全ラインに対して変化点検出が終
了したら、変化点の総数を変化点の存在したライン数で
割って1ラインあたりの変化点数を検出する(s2
2)。1ラインあたりの変化点数を複雑度とし、統合矩
形1,2の複雑度の結果を(表1)に示す。
返すので、RAM2の繰り返しループカウンタroop
に統合矩形の長辺の長さをセットする(s13)。図7
の統合矩形1のループカウンタroopは55で、統合
矩形2のroopは52がセットされる。白画素から黒
画素に変化する変化点の総数を格納するRAM2のto
talと実際に変化点が存在したライン数を格納する変
化点有りライン数lineの初期化を行なう(s1
4)。変化点検出行を1ラインにセットする(s1
5)。統合矩形の短辺方向に白画素から黒画素に変化す
る回数をカウントする(s16)。ここで、最初のドッ
トが黒画素の場合は変化点数に1プラスする。従って、
統合矩形1の1ライン目の変化点数は1となり、統合矩
形2の変化点数は2となる。変化点数が検出されたライ
ンでは変化点総数totalに検出変化点数を足し込
み、変化点有りライン数lineをインクリメントする
(s18、s19)。全ラインに対して変化点検出が終
了したら、変化点の総数を変化点の存在したライン数で
割って1ラインあたりの変化点数を検出する(s2
2)。1ラインあたりの変化点数を複雑度とし、統合矩
形1,2の複雑度の結果を(表1)に示す。
【0015】
【表1】
【0016】以上の処理によって検出された統合矩形1
の複雑度は1.0で統合矩形2の複雑度は1.78とな
る。
の複雑度は1.0で統合矩形2の複雑度は1.78とな
る。
【0017】以上のようにして検出された複雑度の値が
セパレータ閾値th sepa以下であればその統合矩
形はフィールドセパレータであると判定されセパレータ
属性がセットされる(s7、s12)。また、複雑度が
図形閾値th diag以上であればその統合矩形は図
形と判定され図形属性がセットされる(s8、s1
1)。残った統合矩形は文字行となり、文字属性がセッ
トされる(s9)。図7の統合矩形1は複雑度が 統合矩形1の複雑度1.0 < th sepa であるのでフィールドセパレータとなる。統合矩形2の
複雑度は th sepa < 矩形2の複雑度1.78 < t
h diag であるので統合矩形2は文字行と判定される。
セパレータ閾値th sepa以下であればその統合矩
形はフィールドセパレータであると判定されセパレータ
属性がセットされる(s7、s12)。また、複雑度が
図形閾値th diag以上であればその統合矩形は図
形と判定され図形属性がセットされる(s8、s1
1)。残った統合矩形は文字行となり、文字属性がセッ
トされる(s9)。図7の統合矩形1は複雑度が 統合矩形1の複雑度1.0 < th sepa であるのでフィールドセパレータとなる。統合矩形2の
複雑度は th sepa < 矩形2の複雑度1.78 < t
h diag であるので統合矩形2は文字行と判定される。
【0018】以上の処理によって決定された属性に基づ
いてs10では認識処理を行なう。尚、本実施例では、
char max、ratio sepa、th se
pa、th diagの値は以下の値とした。
いてs10では認識処理を行なう。尚、本実施例では、
char max、ratio sepa、th se
pa、th diagの値は以下の値とした。
【0019】char max = 100 ratio sepa = 25 th sepa = 1.1 th diag = 5.5
【0020】
【発明の効果】今回の方式は、文書構成要素の図柄の複
雑度はフィールドセパレータ、文字、図形の順に高いと
いう条件に基づいて、各属性の判定を行うので、外形か
らでは判定不可能な文字サイズ程度の幅の非連続フィー
ルドセパレータに対しても認識することが可能となっ
た。
雑度はフィールドセパレータ、文字、図形の順に高いと
いう条件に基づいて、各属性の判定を行うので、外形か
らでは判定不可能な文字サイズ程度の幅の非連続フィー
ルドセパレータに対しても認識することが可能となっ
た。
【0021】また、外接矩形の統合を行なった統合矩形
に対して複雑度の抽出を行うので、複数文字接触してい
るような低品位の文書に対しても安定した属性の判定が
行える。
に対して複雑度の抽出を行うので、複数文字接触してい
るような低品位の文書に対しても安定した属性の判定が
行える。
【図1】本発明の一実施例における文字認識装置の構成
を示す装置ブロック図
を示す装置ブロック図
【図2】本実施例の機能ブロック図
【図3】本実施例における領域属性判定の制御手順を示
すフローチャート
すフローチャート
【図4】本実施例における統合矩形の複雑度検出の詳細
な制御手順を示すフローチャート
な制御手順を示すフローチャート
【図5】本実施例で処理するイメージデータの例を示す
図
図
【図6】図5のイメージデータから抽出した外接矩形を
示す図
示す図
【図7】図6の外接矩形を基に統合処理を行なった統合
矩形例を示す図
矩形例を示す図
1 ROM 2 CPU 3 RAM 4 スキャナ 5 表示装置 6 画像データ縮小部 7 外接矩形取得部 8 外接矩形属性判定部 9 外接矩形統合部 10 統合矩形の複雑度検出部 11 統合矩形による属性判定部 12 認識処理部
Claims (1)
- 【請求項1】二値化された文字認識対象文書に対して、
二値画像データを縮小する手段と、黒画素が連結してい
る箇所を検出し矩形情報として格納する手段と、外接矩
形の大きさと矩形間の距離から外接矩形を統合する手段
と、統合された外接矩形内で白画素から黒画素に変化す
る回数を検出して複雑度を算出する手段とを備え、矩形
の図柄の複雑度合から文字とフィールドセパレータとを
判別して領域分割することを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4088552A JPH05290212A (ja) | 1992-04-09 | 1992-04-09 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4088552A JPH05290212A (ja) | 1992-04-09 | 1992-04-09 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05290212A true JPH05290212A (ja) | 1993-11-05 |
Family
ID=13946032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4088552A Pending JPH05290212A (ja) | 1992-04-09 | 1992-04-09 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05290212A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015184691A (ja) * | 2014-03-20 | 2015-10-22 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
-
1992
- 1992-04-09 JP JP4088552A patent/JPH05290212A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015184691A (ja) * | 2014-03-20 | 2015-10-22 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940936B2 (ja) | 表領域識別方法 | |
US7054485B2 (en) | Image processing method, apparatus and system | |
EP0481979B1 (en) | Document recognition and automatic indexing for optical character recognition | |
GB2230633A (en) | Optical character recognition | |
JP3490910B2 (ja) | 顔領域検出装置 | |
US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
JPH05290212A (ja) | 文字認識装置 | |
JPH0997309A (ja) | 文字抽出装置 | |
JP3443141B2 (ja) | 画像傾き検出方法及び表処理方法 | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JPH0520593A (ja) | 走行レーン認識装置と先行車認識装置 | |
JPH08123901A (ja) | 文字抽出装置及び該装置を用いた文字認識装置 | |
EP0767941B1 (en) | Automatic determination of landscape scan in binary images | |
JPS61190679A (ja) | 文字デ−タ処理装置 | |
JPH03172983A (ja) | 表処理方法 | |
JPH05128305A (ja) | 領域分割方法 | |
JP2982221B2 (ja) | 文字読み取り装置 | |
JPH05274472A (ja) | 画像認識装置 | |
JP2003123076A (ja) | 画像処理装置及び画像処理プログラム | |
JP3734614B2 (ja) | 画像処理方法、装置および記録媒体 | |
JPH0573718A (ja) | 領域属性識別方式 | |
JP2002074265A (ja) | テロップパターン認識装置 | |
JPH04271488A (ja) | ノイズ検出方式 | |
JPH0264781A (ja) | 表領域抽出方式 |