[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3268552B2 - 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 - Google Patents

領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置

Info

Publication number
JP3268552B2
JP3268552B2 JP28517699A JP28517699A JP3268552B2 JP 3268552 B2 JP3268552 B2 JP 3268552B2 JP 28517699 A JP28517699 A JP 28517699A JP 28517699 A JP28517699 A JP 28517699A JP 3268552 B2 JP3268552 B2 JP 3268552B2
Authority
JP
Japan
Prior art keywords
image
area
pixel group
mesh
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28517699A
Other languages
English (en)
Other versions
JP2001109887A (ja
Inventor
弘晏 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP28517699A priority Critical patent/JP3268552B2/ja
Priority to US09/638,116 priority patent/US6683967B1/en
Priority to GB0024221A priority patent/GB2355100B/en
Publication of JP2001109887A publication Critical patent/JP2001109887A/ja
Application granted granted Critical
Publication of JP3268552B2 publication Critical patent/JP3268552B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Sorting Of Articles (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば郵便物の宛
名自動読み取り機などに用いられる画像処理装置等に関
し、特に宛名領域を含む特定の領域を抽出する画像処理
装置等に関する。
【0002】
【従来の技術】例えば、郵便物の処理分野では、大量に
存在する郵便物を連日、短時間にて処理する必要があ
る。従前では、人間による目視と手作業による分類がな
されており、郵便局員の負担が非常に大きかった。その
ために、自動化読み取り装置による機械化が進められ、
例えば、我が国における郵便番号欄に記載された郵便番
号の読み取り等、送達区域毎の区分には大きな進展が見
られている。しかしながら、郵便番号欄が設けられてい
ない諸外国の郵便物では、郵便番号の位置を認識するこ
とが難しい。また、ますますの増加が予想される今後の
郵便物処理において、郵便番号以外に郵便物上の宛名情
報を即座に読み取り送達区域に区分する技術の発展は、
将来においても強く望まれている技術事項である。
【0003】このように、郵便番号欄が無い郵便物から
郵便番号を抽出することや、宛名情報の読み取りについ
て、その要望は強いものの、現状の技術では郵便物から
これらの情報を読み取ることは非常に難しい。これは、
郵便物には、宛名領域以外に差出人の領域や広告情報、
絵、写真等の様々な模様が含まれており、かつ、手書き
と印刷文字の混在や、縦書きや横書き等、バリエーショ
ンの数があまりにも多いことがその主たる理由である。
その為に、これらの混在する情報の中から郵便番号や宛
名情報を正しく抽出するためには、全ての領域をサーチ
する等、非常に複雑な処理が必要となる。
【0004】ここで、宛名情報を抽出する既存の方法と
して、まず、宛名領域を抽出した後に実際の宛名を読み
取る技術が存在する。例えば、印字宛名はラベルとして
郵便物に貼り付けられていると仮定し、その反射属性や
ラベルの有するエッジの影を検出して宛名領域を抽出す
る方法や、横方向と縦方向に関して投影を取り、濃度の
高い場所を文字行として宛名領域を推定する方法があ
る。また、特開平7-265807号公報では、近接し
ている画素連結成分を統合化して文字行を推定し、また
更にそれを統合化して宛名領域の候補とする技術が開示
されている。
【0005】
【発明が解決しようとする課題】しかしながら、印字宛
名がラベルとして貼り付けられていると仮定して領域を
抽出する方法では、ラベルが貼られておらず印字宛名が
直接、郵便物に記載されている場合には全く対応するこ
とができず、抽出できる郵便物が大きく限定される。ま
た、濃度の高い場所を文字行として推定する方法では、
背景部に多くの画像情報が存在する場合に宛名領域以外
との区別をつけることが難しく、正確な宛名領域を検出
することができない。更に、特開平7-265807号
公報に開示された技術では、全画素から固まりを拾い、
それを全部サーチする作業を固まり毎に全て繰り返す、
といった全画素内における複雑な統合化処理を施す必要
性がある。その為に、ロジックが非常に難しく、処理速
度が非常に遅くなると共に、構成があまりにも複雑とな
り、システム上からみて現実的なものとは言い得ない。
【0006】本発明はこのような課題を解決するために
なされたものであって、全画素内での複雑な統合化処理
を避け、高速に精度高く宛名領域等の特定領域を抽出す
ることを主たる目的とする。更に他の目的は、模様やノ
イズから開放された数個の宛名領域候補を抽出し、以後
の処理を大幅に簡易化することにある。
【0007】
【課題を解決するための手段】かかる目的のもと、本発
明の領域抽出方法は、入力された画像を構成する画素の
連結画素群を抽出するステップと、抽出された連結画素
群の大きさを予め定められた閾値と比較して閾値内連結
画素群を抽出するステップと、入力された画像を所定の
大きさに区分したメッシュ画像を想定し、抽出された閾
値内連結画素群に対応するメッシュ画像をONとするス
テップと、このONとされたメッシュ画像の連結状態か
ら特定領域を抽出するステップとを備えたことを特徴と
している。
【0008】ここで、この画像は、宛名領域を含む郵便
物上の画像であり、また、特定領域を抽出するステップ
は、宛名領域の候補を抽出するものであることを特徴と
すれば、様々な情報が混在する郵便物等の画像から精度
高く宛名領域を抽出することが可能となる点で好まし
い。また、この閾値内連結画素群を抽出するステップ
は、連結画素群の高さ及び/又は幅を、想定される宛名
の文字サイズが有する所定の高さ及び/又は幅と比較す
ることにより閾値内連結画素群を抽出することを特徴と
すれば、例えばノイズを取り除いた状態で連結画素群を
検出することも可能となり、更に高い精度で宛名領域を
抽出できる点で優れている。より具体的には、例えば、
連結画素群の高さ又は幅が第1の定数値(例えば4本/m
mに圧縮した解像度で30ポイント)以下であれば閾値
内連結画素群とする構成が挙げられる。また、連結画素
群の高さ又は幅を長方形領域として閾値を持つことも可
能である。このような閾値を有することで、宛名文字と
は無関係な背景印刷文字を排除することや、破線やラベ
ルのエッジ等の細線を排除することができる点で優れて
いる。更に、画像を区分するメッシュ画像の大きさは、
想定される宛名の中から大きめの文字サイズに均等する
範囲内で決定されることを特徴とすれば、郵便物におけ
る宛名の文字に着目して処理を簡易化できる点で好まし
い。この大きめの文字サイズに均等する範囲内とは、例
えば最大30ポイントを想定した場合には24ポイント
×24ポイントの正方形である矩形領域をメッシュ画像
として選定する等が挙げられる。また更に、メッシュ画
像をONとするステップは、閾値内連結画素群の中心座
標を含むメッシュ画像をONとすることを特徴とするこ
ともできる。
【0009】また、本発明の宛名領域抽出方法は、入力
された宛名領域を含む画像から所定の大きさを有する画
素群を抽出し、この画像を小エリアに分割して1ポイン
トとして簡易化した矩形領域を想定し、抽出された画素
群が想定された矩形領域のどれに属するかを判定して対
応する対応矩形領域を選定し、選定されたこの対応矩形
領域の連結状態から宛名領域候補を抽出することを特徴
としている。
【0010】この宛名領域候補の抽出は、複数の属性を
判定して宛名領域候補を抽出することを特徴とすれば、
より確実性を高めて宛名領域候補を選定できる点から好
ましい。具体的には、2行以上の文字列があるか、充分
な数の矩形領域があるか、画像の端に寄っていないか、
文字列の形がそれらしいか、等の属性を組み合わせるこ
とが挙げられる。また、宛名領域候補の抽出として、宛
名らしさを判断して優先順位をつけるように構成すれ
ば、その優先順位の高いものから実際の宛名読み取りを
実行し、読み取れた時点で処理を終了することが可能と
なり、処理速度を更に上げることができる点で好まし
い。
【0011】また、本発明の宛名領域抽出装置は、入力
された宛名領域を含む画像から所定の大きさを有する画
素群を抽出する画素群抽出手段と、画像を小エリアに分
割して1ポイントとして簡易化した矩形領域を想定する
矩形領域想定手段と、この画素群抽出手段により抽出さ
れた画素群がこの矩形領域想定手段により想定された矩
形領域のどれに属するかを判定し、属すると判定される
対応矩形領域を選定する対応矩形領域選定手段と、この
対応矩形領域選定手段により選定された対応矩形領域の
連結状態から宛名領域候補を抽出する宛名領域候補抽出
手段とを備えたことを特徴としている。
【0012】この画素群抽出手段としては、上下、左
右、斜めの8連結画素群や、上下、左右の4連結画素群
を用いて抽出し、所定の閾値に入るものを抽出すること
が挙げられる。また、矩形領域想定手段としては、予め
定められた大きさで分割するものの他、連結画素群の分
布状況等からダイナミックに大きさを決定して矩形領域
を想定する態様がある。この矩形領域は、正方形の他、
主走査方向と副走査方向で長さの異なる長方形領域を想
定しても良い。また、対応矩形領域選定手段としては、
画素群抽出手段により抽出された画素群の中心領域が存
在する矩形領域を対応矩形領域と選定する態様の他、画
素群が少しでも重なっている矩形領域を対応矩形領域と
選定する態様もある。また、宛名領域候補抽出手段は、
対応矩形領域の少なくとも上下、左右を含む4連結の固
まりを囲む矩形領域を宛名領域候補として抽出すること
を特徴とすれば、高速に精度高く宛名領域を抽出できる
点で好ましい。尚、上下、左右に斜め方向も加えた8連
結の固まりを囲む矩形領域を宛名領域候補とすることも
できる。
【0013】また、本発明を適用した画像処理装置は、
画像を入力する画像入力部と、この画像入力部により入
力された画像を2値化する2値化部と、この2値化部に
より2値化された画素の連結画素群を検出する連結画素
群検出部と、この連結画素群検出部により検出された連
結画素群の大きさを予め定められた閾値と比較する比較
部と、画像入力部により入力された画像を所定の大きさ
に区分したメッシュ画像を形成するメッシュ画像形成部
と、このメッシュ画像形成部により形成されたメッシュ
画像の中から、比較部により閾値内にあると判断される
連結画素群が対応する対応メッシュ画像を検出する対応
メッシュ画像検出部と、この対応メッシュ画像検出部に
より検出された対応メッシュ画像の連結状態から特定領
域を抽出する特定領域抽出部と、この特定領域抽出部に
より抽出された前記特定領域に位置する画像に対して画
像の認識を実行する画像認識部とを備えたことを特徴と
している。
【0014】また、この画像入力部により入力される画
像は宛名を含む郵便物であり、比較部における閾値は想
定される宛名の文字の大きさから決定されることを特徴
とすることができる。更に、このメッシュ画像形成部に
おけるメッシュ画像が区分される所定の大きさは、宛名
の大きさに基づいて決定されることを特徴とすれば、宛
名の文字の大きさを加味して宛名領域を抽出でき、郵便
物における宛名領域を、高速、且つ精度高く抽出するこ
とができる点で好ましい。また更に、このメッシュ画像
形成部における所定の大きさは、連結画素群検出部によ
り検出された連結画素群の大きさに基づいて決定される
ことを特徴とすれば、全画素内における複雑な統合化処
理を施す従来技術と比べて、ロジックが非常に簡単とな
り、処理速度の高速化を図ることが可能となる。
【0015】
【発明の実施の形態】以下、添付図面に示す実施の形態
に基づいて、この発明を詳細に説明する。図1は、本実
施の形態における画像処理装置の全体構成を示した説明
図である。同図に示すように、本実施の形態における画
像処理装置は、大きく、画像入力装置10と、領域抽出
装置11と、画像認識装置23とにより構成される。こ
の画像入力装置10は、例えば主走査方向にラインセン
サを備え、副走査方向にスキャンして画像を読み取るス
キャナーや、フォトによる画像全面の読み取り等の光学
的文字読取装置から構成され、郵便物の全体イメージを
取得できるように構成されている。また、この画像入力
装置10には、図示しない光電変換回路が備えられ、光
学的に読み取った画像を電気信号に変換するように構成
されている。
【0016】次に、本実施の形態における領域抽出装置
11について説明する。画像入力装置10により出力さ
れる電気信号は、2値化部12により白画素と黒画素の
2値信号に変換される。また、この2値化部12では、
小さいノイズを除去するノイズ除去も実行される。尚、
場合によっては、画像入力装置10に2値化手段を備
え、2値化された状態で領域抽出装置11に入力される
場合もあり得る。この場合には、領域抽出装置11には
2値化部12を有さない態様となるであろう。次に2値
化された画像データは縮小部13にて縮小される。例え
ばこの縮小部13では、8本/mmの解像度を有する画
像を4本/mmの解像度に変換するように構成されてお
り、処理スピードを上げるために行われる作業である。
この縮小方式としては、簡易な方法として例えば、連続
ラインのANDをとって出力する方法等があるが、領域
抽出精度に影響が出ることから、処理スピードに問題が
ない場合には縮小部13を設ける必要はない。また、2
値化部12と縮小部13との順序を逆にすることも可能
である。
【0017】この縮小部13から縮小された画像データ
は、連結画素群検出部14に入力される。本実施の形態
における連結画素群検出部14では、2値化された全体
イメージから、8連結画素群、即ち黒画素の8連結から
なる連結画素群(Connected Component:CC)を全て抽出
している。この8連結画素群とは、中心画素に対して左
右、上下、斜めの8画素を捉え、これらの黒画素の連結
を取り出すことで連結画素群を検出している。尚、連結
画素群の検出方法としては、左右、上下である4連結画
素群を取り出す方法もあるが、斜め方向の画素が切れて
しまうことから、斜め方向の繋がりも考慮して、経験
上、8連結画素群を採用することが好ましい。閾値格納
部15には文字サイズを決定する際に用いる閾値が格納
されており、連結画素群検出部14により検出された連
結画素群を比較部16にてこの閾値と比較し、閾値内連
結画素群である文字サイズ連結画素群(CharCC)17を
抽出している。この閾値格納部15に格納される閾値で
は、まず、連結画素群の高さ又は幅が所定量以上の値を
取らないような条件として、最大定数値として例えば3
0が格納されている。この値は、印刷等がなされた郵便
物における大きな模様や長い罫線を取り除くために設け
られ、4本/mmの解像度で30画素、即ち約8mmを
超える連結画素群は文字サイズ連結画素群(CharCC)1
7から除かれるように定められている。また、連結画素
群の長方形領域(矩形領域)が所定大きさ以下の値を取ら
ないような条件として、長方形領域の短いものが3以
上、長いものが8以上という値が格納されている。この
値は、細い線はラベルにおけるエッジ等のノイズの可能
性があることや、破線等を取り除く意味から、3画素×
8画素以下の長方形領域を文字サイズ連結画素群(Char
CC)17から取り除くように定められている。
【0018】一方、比較部16により決定された文字サ
イズ連結画素群(CharCC)17の状況は、メッシュ画像
形成部18に入力される。このメッシュ画像形成部18
では、画像を小エリアに分割して1ポイントとして簡易
化した矩形領域を想定する所謂メッシュ画像を形成して
いる。このメッシュの分割方法は、例えば入力された文
字サイズ連結画素群(CharCC)17の縦方向、横方向の
頻度分布を把握し、最適な大きさのメッシュを決定する
ように構成されている。このように構成することによ
り、郵便物に多く現われている文字サイズに基づいて簡
易化した矩形領域を想定することが可能となり、より正
確な領域抽出の実行が可能となる。尚、文字サイズ連結
画素群(CharCC)17の頻度分布等を用いてダイナミッ
クにメッシュ分割を行うのではなく、予め分割サイズを
決定するように構成することもできる。この場合には、
例えば、想定される宛名の中から大き目の文字サイズに
均等する範囲でメッシュの大きさを決定することが有効
であり、例えば、最大の文字サイズ連結画素群(CharC
C)17が30画素であれば、予め定めた大きさである
24×24の小エリアからなる矩形領域でメッシュに分
割するように構成することが可能である。
【0019】次に、対応メッシュ画像検出部19では、
抽出された閾値内連結画素群である文字サイズ連結画素
群(CharCC)17が、メッシュ画像形成部18により想
定された矩形領域であるメッシュ画像のどれに属するか
(どれに対応するか)を検出し、対応矩形領域を選定して
メッシュ画像をONとしている。この検出の方法として
は、例えば、抽出された文字サイズ連結画素群(CharC
C)17の中心座標が属するメッシュ画像をONとする
方法が挙げられる。また、メッシュ画像形成部18にて
小さ目のメッシュが想定されている場合には、文字サイ
ズ連結画素群(CharCC)17の長方形が少しでも重なっ
ているメッシュ画像をONとする方法もある。
【0020】この対応メッシュ画像検出部19からの出
力を受け、メッシュ画像連結検出部20では、ONとな
ったメッシュの連結状態を検出する。例えば、一行分離
れていても同一領域とするために縦と横に関してONと
なったメッシュに挟まれている1単位のメッシュをON
とする。また、メッシュ画像の中で、メッシュが縦、横
に繋がっている4連結や、それに斜めの繋がりを考慮し
た8連結の連結メッシュ(Connected Mesh:CM)を検出
している。
【0021】このメッシュ画像連結検出部20からの結
果を受け、属性情報格納部21からの属性情報を加味し
て特定領域抽出部22により宛名領域候補が抽出され
る。この属性情報格納部21には、宛名領域候補とし
て、そのサイズが小さすぎず大きすぎないものを選定す
るための閾値情報が格納されている。また、例えば、2
行以上の文字列があるか、十分な数の連結画素群(CC)
があるか、文字列の形がそれらしいか等の属性情報が格
納されている。また、郵便物の宛名情報は、通常、その
郵便物の中央に寄っていることが多いことから、全体イ
メージの端に寄っていないか、領域が中央に近いか等の
属性情報も格納されている。特定領域抽出部22では、
この属性情報格納部21からの属性情報に基づいて、例
えばメッシュ画像連結検出部20による連結メッシュ
(CM)に対して評価点を付けることで宛名領域候補であ
る特定領域を抽出している。この結果、宛名領域を数個
に限定することができ、実際に宛名を認識する画像認識
装置23にこの結果を出力することで、宛名の読み取り
精度を格段に向上させることができると共に、宛名読み
取りの高速化を図ることができる。領域抽出装置11の
後処理装置である画像認識装置23では、2値化部12
からの全体画像の2値化信号と、特定領域抽出部22か
らの領域情報に基づいて、例えば評価点の高い、優先順
の高い領域から順に宛名読み取りが実行され、満足な結
果が得られた段階で読み取り作業を終了させている。
【0022】このように、本実施の形態では、1画素1
ピクセルである画素単位の世界から、所定の大きさを有
するエリアであるメッシュの世界へ移し、このメッシュ
を1ポイントとして簡易化する方法を採用しているため
に、既存の方式に比べて簡単なアルゴリズムで高速に宛
名領域を抽出できる。更に、宛名の文字サイズやメッシ
ュの連結性、属性情報等を加味して抽出することで、精
度の高い領域抽出を実現している。また、評価点を付与
して優先順位の高い領域から宛名読み取りを実行するこ
とで、無駄な宛名読み取り作業を極力、少なくし、更に
効率的かつ迅速な宛名読み取りが可能となる。
【0023】次に、本実施の形態における郵便物の宛名
読み取り作業の流れを、図1〜図12を用いて説明す
る。ここで、図2は本実施の形態における郵便物の宛名
読み取りの大まかな流れを説明するためのフローチャー
トである。また、図3〜図12は第1及び第2の実用例
として、元画像(図3、図8)、文字サイズ連結画素群(C
harCC)17の抽出状態(図4、図9)、メッシュ画像を
ONした状態(図5、図10)、統合化してメッシュ画像
をONした状態(図6、図11)、抽出された宛名領域候
補(図7、図12)を示した図である。
【0024】まず、画像入力装置10により郵便物の画
像が読み取られる(ステップ101)。図3に示すような
郵便物50には、宛名情報51の他、差出人情報52や
連絡情報53等が含まれている。また、図8に示すよう
な郵便物70には、宛名情報71の他、料金別納印刷7
2、配信情報73、商標等の表示74、連絡情報75、
背景印刷情報76等、多種多様な画像情報が含まれてい
る。これらの画像情報は2値化部12により適切な方法
にて2値化され(ステップ102)、連結画素群検出部1
4により連結画素群(CC)が検出されてメモリ(図示せ
ず)に登録される(ステップ103)。この連結画素群(C
C)は、比較部16にて閾値格納部15に格納されてい
る閾値と比較され、大きすぎず小さすぎない文字サイズ
連結画素群(CharCC)17が抽出される(ステップ10
4)。図4及び図9では、文字サイズ連結画素群(CharC
C)17を黒い長方形にし、理解し易いように元画像に
重ね合わせたものである。図4では、文字サイズ連結画
素群(CharCC)17として宛名情報51、差出人情報5
2、連絡情報53のほぼ全ての文字が抽出されている。
但し、「・」(点)55や「−」(線)56は、前述の閾値
の条件を満たしていないことから抽出されていない。ま
た、図9では、多くの文字情報が抽出されているが、商
標等の表示74の文字や模様、背景印刷情報76の
「M」の文字82や「2000」の文字83は、30画
素を超える大きな文字として除外されている。また、絵
柄84におけるペンの柄の部分も省かれている。尚、宛
名情報71の「川」の文字80や「二」の文字81は抽
出されていない。
【0025】次に、文字サイズ連結画素群(CharCC)1
7の中心画素を、メッシュ画像形成部18にて想定され
た矩形領域である、簡易化したメッシュ画像のどれに属
するかを対応メッシュ画像検出部19にて計算し、その
メッシュを黒メッシュとしている(ステップ105)。図
5及び図10に示されるように、ここでは、画像を24
画素×24画素の小エリアでメッシュ58、88に分割
している。ここでは、メッシュ58、88の境界線は表
示されていない。また、図4にて説明した「・」(点)5
5等が抽出されなかった結果、図5にて行間が白になっ
ている部分が存在する。図10においても宛名情報71
の「―」文字部が白になっている。このような場合を補
間するために、次のステップ処理が実行される。即ち、
メッシュ画像連結結合部20では、1行分や1文字分の
隙間があっても統合化するために、上下か左右が黒メッ
シュである白メッシュを黒に変換する(ステップ10
6)。その結果が図6及び図11に示されている。図5
及び図10と比較して明らかなように、1行分や1文字
分の隙間があっても統合化がなされて黒に変換されてい
ることが理解できる。これにより、宛名領域の可能性の
ある部分が1つの連結メッシュ(CM)としてのブロック
として把握することが可能となる。
【0026】次に、特定領域抽出部22では、1メッシ
ュを1画素のごとく見做し、8連結を囲む長方形を宛名
領域の候補とする(ステップ107)。図7及び図12の
破線で囲まれた部分がこのステップにより抽出された部
分であり、領域60〜62、及び領域90〜94が宛名
領域の候補に該当する。図7に示されている郵便物50
では、全ての領域が宛名領域の候補となっているが、図
12に示されている郵便物70では、図11に示されて
いる料金別納印刷72、配信情報73、商標等の表示7
4、及び背景印刷情報76の一部の連結メッシュ(CM)
が選定されていないことが解る。これらは、例えば文字
列が1行であったり、充分な連結画素群(CC)が存在し
ない等の理由により、宛名領域の候補から除外されたも
のである。その後、領域内で文字行抽出等が行われ、種
々の属性で各領域が評価され、宛名候補として順位付け
がなされる(ステップ108)。この種々の属性は、前述
したように、画像の端に寄っていないか、文字列の形が
それらしいか等の内容であり、これによって、図7で
は、領域60が第1候補、領域62が第2候補、領域6
1は第3候補として順位付けがなされる。また、図12
では、上から順に、領域90が第1候補、91が第2、
92が第3、93が第4、94が第5として順位付けが
なされるであろう。次に、優先順位の高い領域順に、画
像認識装置23にて宛名の認識が行われ、満足な結果が
得られた場合には、そこで宛名認識を終了させる(ステ
ップ109)。これらの処理の流れによって、本実施の
形態における一連の郵便宛名の読み取りが終了する。
【0027】以上説明したように、本実施の形態によれ
ば、宛名領域以外に差出人の領域や様々な模様を含んだ
郵便物に対し、簡単なアルゴリズムで宛名領域を含む矩
形領域を抽出することが可能となる。即ち、各領域候補
が、全体イメージに比べて面積が非常に狭く、模様やノ
イズから開放されていること、また、領域内の文字列が
垂直方向か水平方向かが予測できることから、かかる領
域候補に対して宛名認識を実行することで検出精度の向
上と処理の簡潔化、及びそれに伴う処理速度の向上を図
ることができる。本実施の形態におけるアルゴリズムに
よれば、領域内の特にプリンタで印刷された印字の宛名
領域はかなり高い確率にて抽出することが可能となる。
また、手書きであっても、欧米の郵便のように横書きで
纏めて書かれた宛名に対して精度良く抽出することが可
能となる。
【0028】
【発明の効果】以上説明したように、本発明によれば、
全画素内での複雑な統合化処理を避け、高速に精度高く
宛名領域等の特定領域を抽出することができる。更に、
模様やノイズから開放された数個の領域候補を抽出する
ことで、以後の処理を大幅に簡易化することが可能とな
る。
【図面の簡単な説明】
【図1】 本実施の形態における画像処理装置の全体構
成を示した説明図である。
【図2】 本実施の形態における郵便物の宛名読み取り
の大まかな流れを説明するためのフローチャートであ
る。
【図3】 第1の実用例における元画像を示す図であ
る。
【図4】 第1の実用例における文字サイズ連結画素群
(CharCC)の抽出状態を示した図である。
【図5】 第1の実用例におけるメッシュ画像をONし
た状態を示した図である。
【図6】 第1の実用例における統合化してメッシュ画
像をONした状態を示した図である。
【図7】 第1の実用例における抽出された宛名領域候
補を示した図である。
【図8】 第2の実用例における元画像を示す図であ
る。
【図9】 第2の実用例における文字サイズ連結画素群
(CharCC)の抽出状態を示した図である。
【図10】 第2の実用例におけるメッシュ画像をON
した状態を示した図である。
【図11】 第2の実用例における統合化してメッシュ
画像をONした状態を示した図である。
【図12】 第2の実用例における抽出された宛名領域
候補を示した図である。
【符号の説明】
10…画像入力装置、11…領域抽出装置、12…2値
化部、13…縮小部、14…連結画素群検出部、15…
閾値格納部、16…比較部、17…文字サイズ連結画素
群(CharCC)、18…メッシュ画像形成部、19…対応
メッシュ画像検出部、20…メッシュ画像連結検出部、
21…属性情報格納部、22…特定領域抽出部、23…
画像認識装置、50…郵便物、51…宛名情報、52…
差出人情報、53…連絡情報、58…メッシュ、60〜
62…領域、70…郵便物、71…宛名情報、72…料
金別納印刷、73…配信情報、74…商標等の表示、7
5…連絡情報、76…背景印刷情報、88…メッシュ、
90〜94…領域
フロントページの続き (56)参考文献 特開 平7−265807(JP,A) 特開 平6−274685(JP,A) 特開 平4−270484(JP,A) 特開 平8−305794(JP,A) 特開2001−109844(JP,A) 特開 平9−103747(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 7/40 B07C 3/14 G06K 9/20

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された画像を構成する画素の連結画
    素群を抽出するステップと、 抽出された前記連結画素群の大きさを予め定められた閾
    値と比較して閾値内連結画素群を抽出するステップと、 前記画像を所定の大きさに区分したメッシュ画像を想定
    し、抽出された前記閾値内連結画素群に対応するメッシ
    ュ画像をONとするステップと、 ONとされたメッシュ画像の連結状態から特定領域を抽
    出するステップとを備えたことを特徴とする領域抽出方
    法。
  2. 【請求項2】 前記画像は、宛名領域を含む郵便物上の
    画像であり、 前記特定領域を抽出するステップは、前記宛名領域の候
    補を抽出するものであることを特徴とする請求項1記載
    の領域抽出方法。
  3. 【請求項3】 前記閾値内連結画素群を抽出するステッ
    プは、連結画素群の高さ及び/又は幅を、想定される宛
    名の文字サイズが有する所定の高さ及び/又は幅と比較
    することにより閾値内連結画素群を抽出することを特徴
    とする請求項2記載の領域抽出方法。
  4. 【請求項4】 前記画像を区分するメッシュ画像の大き
    さは、想定される宛名の中から大きめの文字サイズに均
    等する範囲内で決定されることを特徴とする請求項2記
    載の領域抽出方法。
  5. 【請求項5】 メッシュ画像をONとするステップは、
    前記閾値内連結画素群の中心座標を含む前記メッシュ画
    像をONとすることを特徴とする請求項1記載の領域抽
    出方法。
  6. 【請求項6】 入力された宛名領域を含む画像から所定
    の大きさを有する画素群を抽出し、 前記画像を小エリアに分割して1ポイントとして簡易化
    した矩形領域を想定し、 抽出された前記画素群が想定された前記矩形領域のどれ
    に属するかを判定して対応する対応矩形領域を選定し、 選定された前記対応矩形領域の連結状態から宛名領域候
    補を抽出することを特徴とする宛名領域抽出方法。
  7. 【請求項7】 前記宛名領域候補の抽出は、複数の属性
    を判定して当該宛名領域候補を抽出することを特徴とす
    る請求項6記載の宛名領域抽出方法。
  8. 【請求項8】 入力された宛名領域を含む画像から所定
    の大きさを有する画素群を抽出する画素群抽出手段と、 前記画像を小エリアに分割して1ポイントとして簡易化
    した矩形領域を想定する矩形領域想定手段と、 前記画素群抽出手段により抽出された前記画素群が前記
    矩形領域想定手段により想定された前記矩形領域のどれ
    に属するかを判定し、属すると判定される対応矩形領域
    を選定する対応矩形領域選定手段と、 前記対応矩形領域選定手段により選定された前記対応矩
    形領域の連結状態から宛名領域候補を抽出する宛名領域
    候補抽出手段とを備えたことを特徴とする宛名領域抽出
    装置。
  9. 【請求項9】 前記宛名領域候補抽出手段は、前記対応
    矩形領域の少なくとも上下、左右を含む4連結の固まり
    を囲む矩形領域を前記宛名領域候補として抽出すること
    を特徴とする請求項8記載の宛名領域抽出装置。
  10. 【請求項10】 画像を入力する画像入力部と、 前記画像入力部により入力された画像を2値化する2値
    化部と、 前記2値化部により2値化された画素の連結画素群を検
    出する連結画素群検出部と前記連結画素群検出部により
    検出された連結画素群の大きさを予め定められた閾値と
    比較する比較部と、 前記画像入力部により入力された画像を所定の大きさに
    区分したメッシュ画像を形成するメッシュ画像形成部
    と、 前記メッシュ画像形成部により形成されたメッシュ画像
    の中から前記比較部により前記閾値内にあると判断され
    る連結画素群が対応する対応メッシュ画像を検出する対
    応メッシュ画像検出部と、 前記対応メッシュ画像検出部により検出された対応メッ
    シュ画像の連結状態から特定領域を抽出する特定領域抽
    出部と、 前記特定領域抽出部により抽出された前記特定領域に位
    置する画像に対して画像の認識を実行する画像認識部と
    を備えたことを特徴とする画像処理装置。
  11. 【請求項11】 前記画像入力部により入力される画像
    は宛名を含む郵便物であり、前記比較部における閾値は
    想定される前記宛名の文字の大きさから決定されること
    を特徴とする請求項6記載の画像処理装置。
  12. 【請求項12】 前記メッシュ画像形成部における前記
    メッシュ画像が区分される所定の大きさは、前記宛名の
    大きさに基づいて決定されることを特徴とする請求項1
    1記載の画像処理装置。
  13. 【請求項13】 前記メッシュ画像形成部における所定
    の大きさは、前記連結画素群検出部により検出された連
    結画素群の大きさに基づいて決定されることを特徴とす
    る請求項10記載の画像処理装置。
JP28517699A 1999-10-06 1999-10-06 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 Expired - Fee Related JP3268552B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP28517699A JP3268552B2 (ja) 1999-10-06 1999-10-06 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US09/638,116 US6683967B1 (en) 1999-10-06 2000-08-14 Area extraction method, address area extraction method, address area extraction apparatus, and image processing apparatus
GB0024221A GB2355100B (en) 1999-10-06 2000-10-04 Area extraction method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28517699A JP3268552B2 (ja) 1999-10-06 1999-10-06 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置

Publications (2)

Publication Number Publication Date
JP2001109887A JP2001109887A (ja) 2001-04-20
JP3268552B2 true JP3268552B2 (ja) 2002-03-25

Family

ID=17688093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28517699A Expired - Fee Related JP3268552B2 (ja) 1999-10-06 1999-10-06 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置

Country Status (3)

Country Link
US (1) US6683967B1 (ja)
JP (1) JP3268552B2 (ja)
GB (1) GB2355100B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4189506B2 (ja) * 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
JP4095243B2 (ja) * 2000-11-28 2008-06-04 キヤノン株式会社 Url取得および処理システムおよびその方法およびその処理を実行するプログラムを記憶した記憶媒体。
US6826305B2 (en) * 2001-03-27 2004-11-30 Ncr Corporation Methods and apparatus for locating and identifying text labels in digital images
JP5600524B2 (ja) * 2010-08-27 2014-10-01 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、および記憶媒体
US8818023B2 (en) * 2011-03-25 2014-08-26 Siemens Industry, Inc. Bulk region of interest learning
US8731296B2 (en) * 2011-04-21 2014-05-20 Seiko Epson Corporation Contact text detection in scanned images
US10366299B2 (en) * 2011-10-25 2019-07-30 Bull Hn Information Systems, Inc. Sorting/scanning system camera upgrade apparatus with backwards compatibility

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57101986A (en) 1980-12-17 1982-06-24 Toshiba Corp Character detecting and cutting method
US4998010A (en) * 1988-04-08 1991-03-05 United Parcel Service Of America, Inc. Polygonal information encoding article, process and system
US5748804A (en) * 1992-05-14 1998-05-05 United Parcel Service Of America, Inc. Method and apparatus for processing images with symbols with dense edges
JPH07256214A (ja) * 1994-03-22 1995-10-09 Toshiba Corp 郵便物の宛名読取装置および郵便物の宛名領域判別装置および郵便物の宛名印刷装置
JP3388867B2 (ja) * 1994-03-31 2003-03-24 株式会社東芝 宛名領域検出装置および宛名領域検出方法
JP3206579B2 (ja) * 1999-01-13 2001-09-10 日本電気株式会社 宛名領域検出装置

Also Published As

Publication number Publication date
GB2355100A (en) 2001-04-11
US6683967B1 (en) 2004-01-27
JP2001109887A (ja) 2001-04-20
GB0024221D0 (en) 2000-11-15
GB2355100B (en) 2003-10-15

Similar Documents

Publication Publication Date Title
Shi et al. Line separation for complex document images using fuzzy runlength
US6014450A (en) Method and apparatus for address block location
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3204259B2 (ja) 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
US8306325B2 (en) Text character identification system and method thereof
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
JP3388867B2 (ja) 宛名領域検出装置および宛名領域検出方法
US5467410A (en) Identification of a blank page in an image processing system
JP4392907B2 (ja) 文字切出し方法
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
IL98293A (en) A method for distinguishing between text and graphics
JPH09311905A (ja) 行検出方法および文字認識装置
JP2861860B2 (ja) 宛名行抽出装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2005250786A (ja) 画像認識方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3957471B2 (ja) 分離文字列統合装置
JP2000357287A (ja) ナンバープレート認識方法および認識装置
JP2714012B2 (ja) 宛名領域検出装置
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP3715473B2 (ja) 宛名読取装置
JPH08305794A (ja) 宛名行抽出装置
JP2005284503A (ja) 紙葉類認識装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees