[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2554943B2 - 文書画像の傾き検出方法および傾き検出装置 - Google Patents

文書画像の傾き検出方法および傾き検出装置

Info

Publication number
JP2554943B2
JP2554943B2 JP1330595A JP33059589A JP2554943B2 JP 2554943 B2 JP2554943 B2 JP 2554943B2 JP 1330595 A JP1330595 A JP 1330595A JP 33059589 A JP33059589 A JP 33059589A JP 2554943 B2 JP2554943 B2 JP 2554943B2
Authority
JP
Japan
Prior art keywords
image
processing
document image
inclination
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1330595A
Other languages
English (en)
Other versions
JPH03189782A (ja
Inventor
誠道 川中
哲也 滝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1330595A priority Critical patent/JP2554943B2/ja
Publication of JPH03189782A publication Critical patent/JPH03189782A/ja
Application granted granted Critical
Publication of JP2554943B2 publication Critical patent/JP2554943B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は文書画像の傾き検出方法および傾き検出装
置に関し、特に文字認識の前処理における文字列の傾き
補正のために文字列の傾きを検出する方法およびその装
置に関する。
[従来の技術] 画像処理において、画像として入力された文書を処理
するためには、予めその文書の傾きを検出する必要があ
る。
文書画像の傾きを検出する技術として、中村納,氏家
誠,岡本教佳,南敏,“ミックスモード通信のための文
字領域の抽出アルゴリズム",電子通信学界論文誌VOL.J6
7−D,No.11,pp.1277−1284(1984年11月)に示される細
線化処理による手法が提案されている。
第8A図〜第8F図は、上記の細線化処理による手法を具
体的に説明するための図である。
第8A図は原画像の文字列を示す。第8A図の文字列のス
トローク成分(文字を構成する線の部分)を膨張させる
と、第8B図に示すように文字列の文字と文字とが連結さ
れる。ただし、「D」や「O」のようにストローク成分
により囲まれた背景部分が大きい文字については、その
背景成分が残存することがある。このように、ストロー
ク成分により囲まれた背景部分をホールと呼ぶ。
第8B図の連結された文字列の成分を収縮させると、第
8C図に示すように連結された成分が細くなる。ただし、
第8B図に示すようにホールhが存在する場合には、第8C
図に示すようにそのホールhが拡大する。次に、第8D図
に示すように、第8C図の収縮された成分からホールhを
除去する。
さらに、第8E図に示すように、第8D図のホールが除去
された成分を細線化する。第8E図の細線化された成分に
は、iで示される“ヒゲ”が存在する。
最後に、第8F図に示すように、第8E図の“ヒゲ"iを除
去する。第8F図の複数の細線の傾きを求めることによ
り、文書画像の傾きを検出することができる。
なお、明細書全体を通じて、文字列の文字とは、日本
語の文字、英語の文字などの狭い意味での文字に限ら
ず、符号や記号などの広い意味での文字をも含むものと
する。
[発明が解決しようとする課題] 上記の細線化処理による手法では、たとえば「D」や
「O」などのようにストローク成分で囲まれた背景成分
を有する文字を膨張させる際に、膨張が不十分であると
ホールが残存することになる。この場合、膨張されたス
トローク成分を収縮させると、そのホールが拡大し、収
縮された成分の中にホールが残存することになる。した
がって、上記の細線化処理による手法では、細線化の前
にストローク成分の膨張処理、収縮処理およびホールの
除去の処理を行ない、細線化の後に“ヒゲ”の除去の処
理を行なう必要がある。したがって、全体的に処理の数
が多くなり、処理が複雑となり、それにより処理時間も
長くかかる。
また、上記の細線化処理による手法では、文字列と文
字列との間隔、文字と文字との間隔など、文書の違いに
より、膨張処理の回数を設定する必要がある。
この発明の目的は、短い時間で簡単な処理により文書
画像の傾きを検出することができる方法および装置を提
供することである。
[課題を解決するための手段] この発明に係る文書画像の傾き検出方法は、文字列と
文字列との間の背景成分および文字列を構成する文字と
文字との間の背景成分を細線化するステップと、細線化
された背景成分から文字列と文字列との間の背景成分の
みの細線を抽出するステップと、抽出された細線の傾き
を求めることにより文書画像の傾きを検出するステップ
とを備えて構成される。
この発明に係る文書画像の傾き検出装置は、文字列と
文字列との間の背景成分および文字列を構成する文字と
文字との間の背景成分を細線化する手段と、細線化され
た背景成分から文字列と文字列との間の背景成分のみの
細線を抽出する手段と、抽出された細線の傾きを求める
ことにより文書画像の傾きを検出する手段とを備えて構
成される。
[作用] 文書画像において文字列文字列との間および文字と文
字との間の背景成分が細線化される。この場合、たとえ
ば「D」や「O」においてストローク成分により囲まれ
た背景部分、すなわちホールは自動的に縮退する。文字
列と文字列との間すなわち行と行との間の細線は、各文
字列に含まれる文字と文字との間の細線よりも長いの
で、これを特徴として行と行との間の細線を抽出するこ
とができる。したがって、この細線の傾きを求めること
により、文字列の傾きを近似的に求めることができる。
[実施例] 以下、この発明の実施例を図面を参照しながら詳細に
説明する。
第1図は、この発明の一実施例による文書画像の傾き
検出方法を説明するためのフローチャートである。第2A
図〜第2E図は、この実施例の方法を具体的に説明するた
めの図である。
第2A図〜第2E図を参照しながら第1図に示される方法
を説明する。まず、ステップ1において、文書画像の入
力処理が行なわれる。第2A図は入力された文書画像であ
る。次に、ステップ2で、細線化処理が行なわれる。こ
の細線化処理では、文字列の背景成分が細線化される。
具体的には、第2B図に示すように、文字列と文字列との
背景成分が細線化されるとともに、文字と文字との間の
背景成分が細線化される。これにより、文字列と文字列
との間の背景成分に対応する細線および文字と文字との
間の背景成分に対応する縦線が現われる。また、それら
の細線および縦線に連結されない孤立点も現われる。
この実施例では、文字のストローク成分を黒とし、背
景成分を白としている。したがって、細線化された成分
は白となる。また、画像が、正方形格子を構成する画素
からなる場合について説明している。なお、図面におい
ては、便宜上黒の部分を斜線で表わす。
次に、ステップ3,4,5において“ヒゲ”除去の処理が
行なわれる。ステップ3では、第2C図に示すよに、縦線
除去の処理が行なわれる。この縦線除去の処理では、第
3図に示す3×3のマスク30を文書画像に対してスキャ
ンさせ、そのマスク30と重なる文書画像のパターンがそ
のマスク30のパターンと一致したときに、その文書画像
のパターンの中央にある画素を黒で塗り潰す。マスク30
と重なる文書画像のパターンがマスク30のパターンと一
致しないときには、文書画像の画素はそのままである。
ステップ4では、端点の縮退処理が行なわれる。この端
点の縮退処理では、第2D図に示すように、細線の端点部
分が除去される。この端点の縮退処理では、第4A図のマ
スク40aおよび第4B図のマスク40bをそれぞれ0゜,90゜,
180゜,270゜だけ回転させた合計8種類のパターンを用
いる。これらのマスク40a,40bを文書画像に対してスキ
ャンさせ、そのマスク40a,40bと重なる文書画像のパタ
ーンが上記の8種類のパターンと一致したときに、文書
画像のパターンの中央にある画素を黒で塗り潰す。この
処理を複数回繰返す。たとえば、20回繰返す。それによ
り、第2D図に示すように、文字列と文字列との間の背景
成分に対応する細線と孤立点のみが残る。ステップ5で
は、孤立点の除去の処理が行なわれる。この孤立点の除
去の処理により、第2E図に示すように、孤立点が除去さ
れる。この孤立点の除去の処理では、第5図に示すマス
ク50を文書画像に対してスキャンさせて、マスク50と重
なる文書画像のパターンがそのマスク50のパターンと一
致したときに、その文書画像のパターンの中央の画素を
黒で塗り潰す。
次に、ステップ6で、複数の細線を区別するためにラ
ベル付け処理が行なわれる。このラベル付け処理によ
り、たとえば第2E図に示される3本の細線のうち上の細
線にL1、中央の細線にL2、下の細線にL3というラベルが
付される。
ステップ7では、端点の抽出処理が行なわれる。この
端点の抽出処理では、たとえば第2E図に示す細線L1,L2,
L3のそれぞれの端点の座標が抽出される。次に、ステッ
プ8で、最長の2端点の抽出処理が行なわれる。この処
理では、第2E図に示す細線L1のように各端点が2つ以上
ある場合に、最長の間隔を有する2つの端点の座標(x
1,y1),(x2,y2)を抽出する。
ステップ9では、次式によりそれぞれの細線の傾きθ
を求める。
θ=tan-1(y2−y1)/(x2−x1) さらに、ステップ10で、平均値算出処理が行なわれ
る。この平均値算出処理では、複数の細線L1,L2,L3の傾
きの平均値を求める。最後に、ステップ11で、回転処理
が行なわれる。この回転処理では、ステップ10において
求められた細線の傾きの平均値を用いて文書画像の回転
を行なう。
なお、ステップ2における細線化処理は、たとえば、
Nacache N.J.and Shinghal R.“SPTA:A Proposed
Algorithm for Thinning Binary Patterns",IEEE
Trans.Systems, Man, Cybern,Vol.SMC−14,No.3,p
p.409〜418(1984)に示される細線化アルゴリズムが用
いられる。このアルゴリズムでは、3×3のパターンの
中央の画素が黒であるときに、その中央の画素の8近傍
の画素のうちいずれか1つが黒であるならばその中央の
画素が連結した成分であるとみなしている。
次に、第6図は、第1図に示す傾き検出方法を実施す
るための傾き検出装置の構成を示すブロック図である。
第6図において、入力装置21および出力装置22がI/O
インターフェイス23を介してCPU24に接続されている。
また、I/Oインターフェイス23には、画像プロセッサ25
が接続され、画像プロセッサ25には、共通バス20を介し
て複数の画像メモリ26〜29が接続されている。
CPU24は、第1図におけるステップ1〜ステップ11の
全処理を制御する。画像メモリ26は原画像を記憶する。
画像メモリ27および28は、それぞれ処理前および処理後
の画像を記憶する。画像メモリ29は中間処理画像を記憶
する。
入力装置21により入力された原画像はI/Oインターフ
ェイス23および画像プロセッサ25を通って画像メモリ26
に記憶される。この処理は、第1図のステップ1の画像
入力処理に対応する。
次に、CPU24は、ステップ2の細線化処理を行なうよ
うに画像プロセッサ25に命令する。これにより、画像プ
ロセッサ25は、画像メモリ26に記憶された原画像に細線
化処理を行ない、その処理結果を画像メモリ27に記憶さ
せる。
次に、CPU24は、ステップ3の縦線除去の処理を行な
うように画像プロセッサ25に命令する。これにより、画
像プロセッサ25は画像メモリ27に記憶された画像に縦線
除去の処理を行ない、その処理結果を画像メモリ28に記
憶させる。同様にして、CPU24は、ステップ4,5,6,7の処
理を行なうように画像プロセッサ25に命令する。ステッ
プ7の端点抽出処理の処理結果はCPU24に送られる。CPU
24は、その処理結果に基づいてステップ8,9,10の処理を
行ない、細線の傾きの平均値を算出する。
CPU24により算出された算出結果は、画像プロセッサ2
5に送られる。画像プロセッサ25は、その算出結果に基
づいて画像メモリ27および28を用いて文書画像の回転処
理を行なう。
第7図は、情報圧縮および特徴抽出というアーキテク
チャを実行可能な画像処理装置の構成を示すブロック図
である。第1図の傾き検出方法は、第7図の画像処理装
置を用いても実行することができる。
この画像処理装置は、パイプライン画像処理部31、特
徴抽出処理部32、フィードバック処理部33およびライン
メモリ34からなる。
パイプライン画像処理部31には、画像データがシリア
ルに入力される。パイプライン画像処理部31は、画像間
演算(数値演算,論理演算)やコンボリューション演算
(1次微分,2次微分,平滑化,画像補間)などの処理を
実行し、数値演算結果を出力する。また、パイプライン
画像処理部31は、処理したい画素とその近傍状態とを比
較し、近傍特徴情報を出力する。この近傍特徴情報に
は、連結数、境界画素数、オイラ数要素、一致度数など
が含まれる。
特徴抽出処理部32には、X,Y座標およびラベル番号な
どが与えられる。特徴抽出処理部32は、パイプライン画
像処理部31から出力される数値演算結果および近傍特徴
情報、X,Y座標およびラベル番号などに基づいて情報圧
縮および特徴抽出を行ない、特徴抽出結果を出力する。
この特徴抽出処理部32には、どの特徴とどの特徴とを組
合わせて圧縮・特徴抽出を行なうかの条件を設定するこ
とができる。特徴抽出結果には、オイラ数、面積、ヒス
トグラム、X,Y座標、最大・最小値などが含まれる。
フィードバック処理部33およびラインメモリ34は、近
傍特徴情報に基づいてラベリング、細線化などの処理を
行ない、ラベル番号および細線化結果などの逐次処理結
果を出力する。また、フィードバック処理部33は、ラベ
ル連接情報を特徴抽出処理部32に与える。
この画像処理装置は、カメラ、スキャナなどにより入
力された画像情報を圧縮・特徴抽出して少量の特徴情報
に変換するので、処理速度が高速になる。したがって、
第7図の画像処理装置を用いて前記実施例の傾き検出方
法を実行すると、高速処理が可能となる。
上記実施例によると、文字列と文字列との間の背景成
分が細線化されるまでステップ1(第1図)の細線化処
理を行なえばよく、従来例のように、文書の違いにより
膨張回数を設定するような操作は必要ではない。
また、背景成分を細線化することによって、ストロー
ク成分の膨張処理、収縮処理およびホールの除去の処理
が必要なくなり、それにより、処理が単純化され、処理
速度が向上する。
[発明の効果] 以上のようにこの発明によれば、文字列と文字列との
背景成分および文字と文字との背景成分を細線化した
後、文字列と文字列との背景成分のみを得て、得られた
細線の傾きを求めることにより、文書画像の傾きを簡単
な処理で高速に検出することが可能となる。
【図面の簡単な説明】
第1図はこの発明の一実施例による文書画像の傾き検出
方法を説明するためのフローチャートである。第2A図、
第2B図、第2C図、第2D図および第2E図は第1図の傾き検
出方法を具体的に説明するための図である。第3図は縦
線除去の処理に用いるマスクのパターンを示す図であ
る。第4A図および第4B図はそれぞれ端点の縮退の処理に
用いるマスクのパターンを示す図である。第5図は孤立
点の除去の処理に用いるマスクのパターンを示す図であ
る。第6図は第1図の傾き検出方法を実行するための傾
き検出装置の構成の一例を示すブロック図である。第7
図は第1図の傾き検出方法を実行するための画像処理装
置の例を示すブロック図である。第8A図、第8B図、第8C
図、第8D図、第8E図および第8F図は従来の文書画像の傾
き検出方法の一例を説明するための図である。 図において、2は細線化処理、9は傾き算出処理、21は
入力装置、22はCPU、25は画像プロセッサ、26,27,28,29
は画像メモリを示す。 なお、各図中、同一符号は同一または相当部分を示す。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文字列を含む文書画像の傾きを検出する方
    法であって、 文字列と文字列との間の背景成分および文字列を構成す
    る文字と文字との間の背景成分を細線化するステップ
    と、 細線化された背景成分から文字列と文字列との間の背景
    成分のみの細線を抽出するステップと、 抽出された細線の傾きを求めることにより前記文書画像
    の傾きを検出するステップとを備えた、文書画像の傾き
    検出方法。
  2. 【請求項2】文字列を含む文書画像の傾きを検出する装
    置であって、 文字列と文字列との間の背景成分および文字列を構成す
    る文字と文字との間の背景成分を細線化する手段と、 細線化された背景成分から文字列と文字列との間の背景
    成分のみの細線を抽出する手段と、 抽出された細線の傾きを求めることにより前記文書画像
    の傾きを検出する手段とを備えた、文書画像の傾き検出
    装置。
JP1330595A 1989-12-19 1989-12-19 文書画像の傾き検出方法および傾き検出装置 Expired - Lifetime JP2554943B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1330595A JP2554943B2 (ja) 1989-12-19 1989-12-19 文書画像の傾き検出方法および傾き検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1330595A JP2554943B2 (ja) 1989-12-19 1989-12-19 文書画像の傾き検出方法および傾き検出装置

Publications (2)

Publication Number Publication Date
JPH03189782A JPH03189782A (ja) 1991-08-19
JP2554943B2 true JP2554943B2 (ja) 1996-11-20

Family

ID=18234412

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1330595A Expired - Lifetime JP2554943B2 (ja) 1989-12-19 1989-12-19 文書画像の傾き検出方法および傾き検出装置

Country Status (1)

Country Link
JP (1) JP2554943B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2737484B2 (ja) * 1991-10-15 1998-04-08 松下電器産業株式会社 配線パターン検査装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57159384A (en) * 1981-03-27 1982-10-01 Nec Corp Optical character reader

Also Published As

Publication number Publication date
JPH03189782A (ja) 1991-08-19

Similar Documents

Publication Publication Date Title
US5065437A (en) Identification and segmentation of finely textured and solid regions of binary images
JP2002190957A (ja) 文書処理装置及び方法
CN108615058A (zh) 一种字符识别的方法、装置、设备及可读存储介质
CN110991440B (zh) 一种像素驱动的手机操作界面文本检测方法
JPH09130614A (ja) 画像処理装置
JP2554943B2 (ja) 文書画像の傾き検出方法および傾き検出装置
Saeed et al. Implementation and advanced results on the non-interrupted skeletonization algorithm
JP2003067738A (ja) 網点除去方法及びシステム
JP7138503B2 (ja) オブジェクト検出システム
US7508987B2 (en) Method, apparatus, system, and program for image processing capable of recognizing, reproducing, and enhancing an image, and a medium storing the program
KR100350854B1 (ko) 이진 영상 회전 시스템 및 그 방법
JP2001127999A (ja) 画像処理装置および画像処理方法
JP4035696B2 (ja) 線分検出装置及び画像処理装置
JP3163601B2 (ja) 画像処理装置および方法
JPH0962763A (ja) バーコードの検出方法
JP2000076378A (ja) 文字認識方法
JP2822792B2 (ja) 画像ノイズ除去装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
Ablameyko et al. Knowledge-based recognition of crosshatched areas in engineering drawings
KR940007614B1 (ko) 문자 인식시스템을 위한 세선화(Thinning) 방법 및 장치
JP3585143B2 (ja) 文字列抽出方法および装置
JPS6330980A (ja) パタ−ン認識装置
JP2859453B2 (ja) 画像の細線化方式
JPH0658689B2 (ja) 線図形分離装置
JP2789647B2 (ja) 線画像認識方法