JP3086277B2 - 文書画像処理装置 - Google Patents
文書画像処理装置Info
- Publication number
- JP3086277B2 JP3086277B2 JP03128339A JP12833991A JP3086277B2 JP 3086277 B2 JP3086277 B2 JP 3086277B2 JP 03128339 A JP03128339 A JP 03128339A JP 12833991 A JP12833991 A JP 12833991A JP 3086277 B2 JP3086277 B2 JP 3086277B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- area
- connected component
- document image
- black pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
【0001】
【産業上の利用分野】本発明は、文書画像処理装置に関
し、特に文書画像中からアンダーライン付きの文字列を
識別する文書画像処理装置に関する。
し、特に文書画像中からアンダーライン付きの文字列を
識別する文書画像処理装置に関する。
【0002】
【従来の技術】文書画像から文字列領域を抽出する従来
の方法として、画像のランレングスデータに対して、閾
値以下の白ランを黒ランに置き換えることにより、文字
列、図形等をそれぞれ一つの黒画素連結成分にするぼか
し処理によって領域を抽出する方法(Computer
Graphics and Image Proce
ssing 20,375〜390,1982)、ある
いは画像の周辺分布から領域分割を行う方法(電子通信
学会論文誌 1986/8 Vol.J69−DNo.
8 pp1187−1195)がある。
の方法として、画像のランレングスデータに対して、閾
値以下の白ランを黒ランに置き換えることにより、文字
列、図形等をそれぞれ一つの黒画素連結成分にするぼか
し処理によって領域を抽出する方法(Computer
Graphics and Image Proce
ssing 20,375〜390,1982)、ある
いは画像の周辺分布から領域分割を行う方法(電子通信
学会論文誌 1986/8 Vol.J69−DNo.
8 pp1187−1195)がある。
【0003】上記した抽出方法は、領域の外接矩形の大
きさ、縦横比、領域内の黒画素濃度等によって、文書領
域を文字列領域、図形領域、写真領域、縦横の領域分割
線(セパレータ)等に識別しているが、文字列と同じ大
きさの図形を文字列として誤識別してしまう。
きさ、縦横比、領域内の黒画素濃度等によって、文書領
域を文字列領域、図形領域、写真領域、縦横の領域分割
線(セパレータ)等に識別しているが、文字列と同じ大
きさの図形を文字列として誤識別してしまう。
【0004】
【発明が解決しようとする課題】これを解決する方法と
して、ぼかし処理によって抽出した領域に対して、長い
線分の存在を調べることによって文字列と図形を識別す
る方法(特開昭61−175875号公報)、黒画素連
結成分の大きさから文字と図形を判別する方法(電子通
信学会技報 PRU86−115,pp33−40)が
ある。しかし、これらの方法によっても、アンダーライ
ンが文字列と接触している場合には文字列を図形として
識別するという問題があった。
して、ぼかし処理によって抽出した領域に対して、長い
線分の存在を調べることによって文字列と図形を識別す
る方法(特開昭61−175875号公報)、黒画素連
結成分の大きさから文字と図形を判別する方法(電子通
信学会技報 PRU86−115,pp33−40)が
ある。しかし、これらの方法によっても、アンダーライ
ンが文字列と接触している場合には文字列を図形として
識別するという問題があった。
【0005】本発明の目的は、文書画像中からアンダー
ライン付きの文字列を識別する文書画像処理装置を提供
することにある。
ライン付きの文字列を識別する文書画像処理装置を提供
することにある。
【0006】
【課題を解決するための手段】前記目的を達成するため
に、本発明では、文書画像データから文書要素を抽出す
る文書画像処理装置において、文書画像データから抽出
された横書き文字列候補領域中に、所定の閾値よりも横
幅が大きな黒画素連結成分があるか否かを判定する手段
と、前記黒画素連結成分が前記所定の閾値よりも大きい
場合、前記文字列候補領域を上下に分割する手段と、該
分割された上部の領域内について黒画素連結成分を抽出
し、該抽出された黒画素連結成分の何れもが前記所定の
閾値よりも小さい場合、前記文字列候補領域をアンダー
ライン付き文字列領域と判定し、そうでない場合、横長
の図形またはセパレータと判定する手段とを備えたこと
を特徴としている。
に、本発明では、文書画像データから文書要素を抽出す
る文書画像処理装置において、文書画像データから抽出
された横書き文字列候補領域中に、所定の閾値よりも横
幅が大きな黒画素連結成分があるか否かを判定する手段
と、前記黒画素連結成分が前記所定の閾値よりも大きい
場合、前記文字列候補領域を上下に分割する手段と、該
分割された上部の領域内について黒画素連結成分を抽出
し、該抽出された黒画素連結成分の何れもが前記所定の
閾値よりも小さい場合、前記文字列候補領域をアンダー
ライン付き文字列領域と判定し、そうでない場合、横長
の図形またはセパレータと判定する手段とを備えたこと
を特徴としている。
【0007】
【作用】画像入力部によって入力された文書画像は、記
憶部に記憶され、記憶部の画像データから、文字列候補
領域抽出部は、文書の要素となる文字列候補領域を抽出
する。文字列候補領域について、判定処理部は、領域内
の黒画素連結成分の大きさを調べ、連結成分の横幅が予
想文字サイズより閾値以上大きい場合には、領域分割部
は、該領域を上下に分割する。判定処理部は、分割され
た上部の領域内の連結成分と先の閾値とを比較し、連結
成分が閾値以下の場合、文字列候補領域をアンダーライ
ン付きの文字列と識別する。
憶部に記憶され、記憶部の画像データから、文字列候補
領域抽出部は、文書の要素となる文字列候補領域を抽出
する。文字列候補領域について、判定処理部は、領域内
の黒画素連結成分の大きさを調べ、連結成分の横幅が予
想文字サイズより閾値以上大きい場合には、領域分割部
は、該領域を上下に分割する。判定処理部は、分割され
た上部の領域内の連結成分と先の閾値とを比較し、連結
成分が閾値以下の場合、文字列候補領域をアンダーライ
ン付きの文字列と識別する。
【0008】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。図1は、本発明のブロック構成図であ
る。101は、文書画像を取り込むスキャナ等の画像入
力部、102は、入力された画像データを記憶する記憶
部、103は、画像データから文字列候補領域を抽出す
る文字列候補領域抽出部、104は、文字列候補領域を
上下に分割する領域分割部、105は、文字列候補領域
からアンダーライン付き文字列を識別処理する判定処理
部である。
的に説明する。図1は、本発明のブロック構成図であ
る。101は、文書画像を取り込むスキャナ等の画像入
力部、102は、入力された画像データを記憶する記憶
部、103は、画像データから文字列候補領域を抽出す
る文字列候補領域抽出部、104は、文字列候補領域を
上下に分割する領域分割部、105は、文字列候補領域
からアンダーライン付き文字列を識別処理する判定処理
部である。
【0009】図2および図3は、本発明の処理フローチ
ャートを示した図である。スキャナ等の画像入力部10
1によって入力された文書画像は、記憶部102に記憶
される(ステップ201)。記憶部102に記憶された
画像データから、文字列候補領域抽出部103は、公知
の方法(例えば、前記したぼかし処理方法あるいは周辺
分布から領域分割する方法)によって文書の要素となる
文字列候補領域を抽出する(ステップ202)。
ャートを示した図である。スキャナ等の画像入力部10
1によって入力された文書画像は、記憶部102に記憶
される(ステップ201)。記憶部102に記憶された
画像データから、文字列候補領域抽出部103は、公知
の方法(例えば、前記したぼかし処理方法あるいは周辺
分布から領域分割する方法)によって文書の要素となる
文字列候補領域を抽出する(ステップ202)。
【0010】図4は、文書画像301の抽出領域を示す
図で、302から307は、抽出された領域を示し、3
02から305は、該領域の内、領域の大きさ、黒画素
の濃度から文字列候補領域と識別されたものである。従
って、このようにして識別された文字列候補領域には、
図形やセパレータ(縦横の領域分割線)が含まれている
場合がある。
図で、302から307は、抽出された領域を示し、3
02から305は、該領域の内、領域の大きさ、黒画素
の濃度から文字列候補領域と識別されたものである。従
って、このようにして識別された文字列候補領域には、
図形やセパレータ(縦横の領域分割線)が含まれている
場合がある。
【0011】そこで、本発明では、文字列として識別さ
れた領域について、判定処理部105は、領域内の黒画
素連結成分の大きさを調べる(ステップ204)。な
お、この連結成分を求める方法としては、例えば、画素
にラベリングを行う方法、あるいは前掲した文献(Com
puter Graphics and Image Processing 20,37
5〜390,1982)に記載されたLAG(Line A
djacency Graph)というグラフ構造を利用した公知の
方法によって求めることができる。
れた領域について、判定処理部105は、領域内の黒画
素連結成分の大きさを調べる(ステップ204)。な
お、この連結成分を求める方法としては、例えば、画素
にラベリングを行う方法、あるいは前掲した文献(Com
puter Graphics and Image Processing 20,37
5〜390,1982)に記載されたLAG(Line A
djacency Graph)というグラフ構造を利用した公知の
方法によって求めることができる。
【0012】図5は、図4における文字列候補領域40
1の一つを示す図であり、アンダーライン402付きの
文字列を表している。また、図6は、図5の黒画素連結
領域を表した図で、501から506は黒画素連結成分
の外接矩形である。例えば、領域401の外接矩形は5
01であり(文字とアンダーラインとが近接あるいは接
続しているために、外接矩形501が形成される)、文
字403の外接矩形は504である。図8は、本来は図
形として識別されるべき領域が、黒画素の濃度から文字
列候補領域701として識別された他の例を示す図であ
る。
1の一つを示す図であり、アンダーライン402付きの
文字列を表している。また、図6は、図5の黒画素連結
領域を表した図で、501から506は黒画素連結成分
の外接矩形である。例えば、領域401の外接矩形は5
01であり(文字とアンダーラインとが近接あるいは接
続しているために、外接矩形501が形成される)、文
字403の外接矩形は504である。図8は、本来は図
形として識別されるべき領域が、黒画素の濃度から文字
列候補領域701として識別された他の例を示す図であ
る。
【0013】黒画素連結成分の大きさが求まったら、判
定処理部105は、次いで黒画素連結成分の大きさ(横
幅)と、領域内の予想文字サイズ(すなわち領域の高
さ)から求めた閾値と比較する(ステップ205)。黒
画素連結成分の横幅が予想文字サイズより閾値以上大き
い(例えば、2倍)場合には、領域分割部104は、該
領域を上下に分割する(ステップ206)。図6の例で
は、黒画素連結成分(外接矩形501)が閾値以上大き
いので、図5のライン404で分割し、図8の例では、
黒画素連結成分(外接矩形701)が閾値以上大きいの
で、図8のライン702で分割する。なお、分割線の位
置は、分割された上下の高さの比が所定の値(例えば、
上下の比が3対2になる値)になるように設定する。
定処理部105は、次いで黒画素連結成分の大きさ(横
幅)と、領域内の予想文字サイズ(すなわち領域の高
さ)から求めた閾値と比較する(ステップ205)。黒
画素連結成分の横幅が予想文字サイズより閾値以上大き
い(例えば、2倍)場合には、領域分割部104は、該
領域を上下に分割する(ステップ206)。図6の例で
は、黒画素連結成分(外接矩形501)が閾値以上大き
いので、図5のライン404で分割し、図8の例では、
黒画素連結成分(外接矩形701)が閾値以上大きいの
で、図8のライン702で分割する。なお、分割線の位
置は、分割された上下の高さの比が所定の値(例えば、
上下の比が3対2になる値)になるように設定する。
【0014】そして、判定処理部105は、分割された
上部の領域内の黒画素について連結成分を求める(ステ
ップ207)。図7は、図5における領域401をライ
ン404で分割した上部の領域の黒画素の連結成分を抽
出した図で、612は、領域の外接矩形、613は分割
ライン、601から611は、新たに求められた上部領
域の黒画素連結成分である。同様に、図9は、図8のラ
イン702で分割された上部の領域の黒画素の連結成分
を抽出した図で、801は新たに求められた上部領域の
黒画素連結成分、802は分割ラインである。
上部の領域内の黒画素について連結成分を求める(ステ
ップ207)。図7は、図5における領域401をライ
ン404で分割した上部の領域の黒画素の連結成分を抽
出した図で、612は、領域の外接矩形、613は分割
ライン、601から611は、新たに求められた上部領
域の黒画素連結成分である。同様に、図9は、図8のラ
イン702で分割された上部の領域の黒画素の連結成分
を抽出した図で、801は新たに求められた上部領域の
黒画素連結成分、802は分割ラインである。
【0015】判定処理部105は、分割された上部の領
域内の黒画素連結成分と先の閾値とを比較する(ステッ
プ208)。図7の例では、黒画素連結成分は全て閾値
以下の大きさ、つまり文字サイズとなるので、文字列候
補領域401はアンダーライン付きの文字列と識別され
る(ステップ209)。一方、図9の例では、黒画素連
結成分801は閾値より大きいので、図形またはセパレ
ータとして識別される(ステップ210)。
域内の黒画素連結成分と先の閾値とを比較する(ステッ
プ208)。図7の例では、黒画素連結成分は全て閾値
以下の大きさ、つまり文字サイズとなるので、文字列候
補領域401はアンダーライン付きの文字列と識別され
る(ステップ209)。一方、図9の例では、黒画素連
結成分801は閾値より大きいので、図形またはセパレ
ータとして識別される(ステップ210)。
【0016】以上の処理を、領域の大きさ、黒画素の濃
度から文字列候補領域として識別された全ての領域につ
いて行うことによって、アンダーライン付きの文字列と
図形またはセパレータとの識別処理が行われる。
度から文字列候補領域として識別された全ての領域につ
いて行うことによって、アンダーライン付きの文字列と
図形またはセパレータとの識別処理が行われる。
【0017】
【発明の効果】以上、説明したように、本発明によれ
ば、領域の大きさ、黒画素の濃度から文字列候補領域と
して識別された領域中に閾値よりも大きな黒画素連結成
分があるか否かを調べ、閾値よりも大きな黒画素連結成
分がある場合には、さらに該領域を上下に分割し、その
上部の領域について閾値よりも大きな黒画素連結成分が
あるか否かを調べているので、アンダーライン付きの文
字列と、横長の図形あるいはセパレータとを正確に識別
することができる。
ば、領域の大きさ、黒画素の濃度から文字列候補領域と
して識別された領域中に閾値よりも大きな黒画素連結成
分があるか否かを調べ、閾値よりも大きな黒画素連結成
分がある場合には、さらに該領域を上下に分割し、その
上部の領域について閾値よりも大きな黒画素連結成分が
あるか否かを調べているので、アンダーライン付きの文
字列と、横長の図形あるいはセパレータとを正確に識別
することができる。
【図1】本発明のブロック構成図である。
【図2】本発明の処理フローチャートを示した図であ
る。
る。
【図3】図2と同じく本発明の処理フローチャートを示
した図である。
した図である。
【図4】文書画像の抽出領域を示す図である。
【図5】文字列候補領域の一つの例を示す図である。
【図6】図5の黒画素連結領域を表した図である。
【図7】図5における領域を分割した上部の領域の黒画
素の連結成分を抽出した図である。
素の連結成分を抽出した図である。
【図8】本来は図形として識別されるべき領域が文字列
候補領域として識別された他の例を示す図である。
候補領域として識別された他の例を示す図である。
【図9】図8における分割された上部の領域の黒画素の
連結成分を抽出した図である。
連結成分を抽出した図である。
101 画像入力部 102 記憶部 103 文字列候補領域抽出部 104 領域分割部 105 判定処理部 401 文字列候補領域 402 アンダーライン 501 黒画素連結成分の外接矩形
Claims (1)
- 【請求項1】 文書画像データから文書要素を抽出する
文書画像処理装置において、文書画像データから抽出さ
れた横書き文字列候補領域中に、所定の閾値よりも横幅
が大きな黒画素連結成分があるか否かを判定する手段
と、前記黒画素連結成分が前記所定の閾値よりも大きい
場合、前記文字列候補領域を上下に分割する手段と、該
分割された上部の領域内について黒画素連結成分を抽出
し、該抽出された黒画素連結成分の何れもが前記所定の
閾値よりも小さい場合、前記文字列候補領域をアンダー
ライン付き文字列領域と判定し、そうでない場合、横長
の図形またはセパレータと判定する手段とを備えたこと
を特徴とする文書画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03128339A JP3086277B2 (ja) | 1991-05-02 | 1991-05-02 | 文書画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03128339A JP3086277B2 (ja) | 1991-05-02 | 1991-05-02 | 文書画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04330588A JPH04330588A (ja) | 1992-11-18 |
JP3086277B2 true JP3086277B2 (ja) | 2000-09-11 |
Family
ID=14982358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03128339A Expired - Fee Related JP3086277B2 (ja) | 1991-05-02 | 1991-05-02 | 文書画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3086277B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5715430B2 (ja) | 2011-02-02 | 2015-05-07 | 本田技研工業株式会社 | スポーツタイプの鞍乗り型電動車両 |
-
1991
- 1991-05-02 JP JP03128339A patent/JP3086277B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04330588A (ja) | 1992-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5892843A (en) | Title, caption and photo extraction from scanned document images | |
JP3253356B2 (ja) | 文書画像の領域識別方法 | |
US7298900B2 (en) | Image processing method, image processing apparatus and image processing program | |
Xi et al. | A video text detection and recognition system | |
CN101453575B (zh) | 一种视频字幕信息提取方法 | |
KR20010110416A (ko) | 비디오 스트림 분류가능 심볼 고립 방법 및 시스템 | |
US7437017B2 (en) | Image processing method | |
US20080095442A1 (en) | Detection and Modification of Text in a Image | |
JP3411472B2 (ja) | パターン抽出装置 | |
JP2006067585A (ja) | デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置 | |
JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
US7630544B1 (en) | System and method for locating a character set in a digital image | |
US7130085B2 (en) | Half-tone dot elimination method and system thereof | |
JP3086277B2 (ja) | 文書画像処理装置 | |
JP3544324B2 (ja) | 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 | |
JP3187894B2 (ja) | 文書画像傾き検出方法 | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
JPH10232926A (ja) | 画像処理装置及びその方法 | |
JP4409713B2 (ja) | 文書画像認識装置及び記録媒体 | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JP4974367B2 (ja) | 領域分割方法及び装置、並びにプログラム | |
JPH0679348B2 (ja) | 行切り出し方法 | |
JP3052438B2 (ja) | 表認識装置 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 | |
JP2003030585A (ja) | 画像処理装置、方法、プログラム及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |