[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5178851B2 - 宛先認識装置 - Google Patents

宛先認識装置 Download PDF

Info

Publication number
JP5178851B2
JP5178851B2 JP2011003146A JP2011003146A JP5178851B2 JP 5178851 B2 JP5178851 B2 JP 5178851B2 JP 2011003146 A JP2011003146 A JP 2011003146A JP 2011003146 A JP2011003146 A JP 2011003146A JP 5178851 B2 JP5178851 B2 JP 5178851B2
Authority
JP
Japan
Prior art keywords
area
destination
candidate
address
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011003146A
Other languages
English (en)
Other versions
JP2011125860A (ja
Inventor
匡哉 前田
文平 入江
俊二 有吉
秀雄 堀内
昭彦 中尾
琢磨 赤木
泰浩 青木
倫行 浜村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011003146A priority Critical patent/JP5178851B2/ja
Publication of JP2011125860A publication Critical patent/JP2011125860A/ja
Application granted granted Critical
Publication of JP5178851B2 publication Critical patent/JP5178851B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Description

本発明は、配達物の宛先を認識する宛先認識装置に関する。
従来の宛先認識装置においては、配達物(郵便書状など)の宛先認識を行う際に、差出人領域の情報が住所データベース内の情報と一致してしまうことがあるため、当該差出人領域の情報を宛先として誤認識してしまう場合があるという問題がある。このため、こうした誤認識を防止する技術の提示が望まれている。
例えば、特許文献1には、差出人の住所及びその住所領域の座標位置の情報を予めテーブルに記憶しておき、郵便物の宛名の住所及びその記載位置の認識結果が当該テーブルの情報に一致するか否かを判断し、一致する場合に差出人領域とみなす技術が開示されている。
また、特許文献2には、住所候補がセロハン窓(もしくはシール)の中と外の両方にある場合に、セロハン窓の外の候補を差出人住所とみなす技術が開示されている。
特開平10−180192号公報(段落0037など) 特開平11−235554号公報(段落0047など)
しかしながら、特許文献1に開示されるように単に差出人領域の座標位置の情報に基づいて判断するだけでは、差出人領域の認識精度を高めることは難しく、高精度な宛先認識結果を得ることは難しい。
一方、特許文献2に開示されるようにセロハン窓等を利用した方法では、セロハン窓等がない郵便物には柔軟に対応することができず、高精度な宛先認識結果を得ることは難しい。
本発明は、差出人領域を宛先として誤認識してしまうことを効果的に防止し、高精度な宛先認識結果を得ることができる配達物の宛先認識装置を提供することを目的とする。
本発明に係る宛先認識装置は、配達物の宛先を認識する宛先認識装置であって、この宛先認識装置が運用される施設が管轄する管轄区域を記憶する記憶手段と、配達物表面の画像を読取る読取手段と、この読取手段によって読取られた画像から、宛先領域の候補を複数抽出する手段と、この抽出手段によって抽出された候補を順次認識することにより、宛先を決定する手段と、前記抽出手段によって抽出された候補に記載されている住所が、前記記憶手段に記憶されている前記管轄区域に含まれるものであるか否かを判定する手段と、この判定手段の判定結果に応じて、候補を宛先領域として認識することを禁止または許可する手段とを具備することを特徴とする。
本発明によれば、差出人領域を宛先として誤認識してしまうことを効果的に防止し、高精度な宛先認識結果を得ることができる。
この発明の一実施形態に係わる区分機を示す外観図。 上記区分機の概略構成を示す図。 図2中に示される情報処理部の構成を示すブロック図。 図2中に示されるスキャナ部により読取られた郵便物の画像に含まれる各種の領域を示す図。 図3中に示される宛先領域選択部の構成を示すブロック図。 図5中に示される各種のデータベースの詳細を示す図。 本実施形態における基本動作の一例を示すフローチャート。 スウェーデン郵便において使用されるワード構成の一例を示す図。 スウェーデン郵便において使用されるワード構成の別の例を示す図。 候補領域の記載内容に基づいてワード構成を示す情報の作成を行うためのワード作成ユニットを説明するための図。 第1の判定手法による動作の概略を示すフローチャート。 図11に示した動作の詳細を示すフローチャート。 収集便と到着便の違いを説明するための図。 収集便処理局での判定処理を説明するための図。 到着便処理局での判定処理を説明するための図。 郵便物の種類に応じたモード切り替えを実現するための構成を示す図。 第2の判定手法による動作を示すフローチャート。 第3の判定手法による動作を示すフローチャート。 複数の候補領域のうちの宛先領域内の住所記載位置に下線が記載されている様子を示す図。 第4の判定手法による動作を示すフローチャート。
この発明の実施の形態を図面に基づいて詳細に説明する。
図1は、この発明の一実施形態に係わる区分機1を示す外観図であり、図2は区分機1の概略構成を示す図である。この区分機1は、大型の箱型状の区分機本体1aを有している。この区分機1は、郵便物P上の情報を読取り、その読取内容から宛先領域などを認識し、この認識結果に基づいて該当する区分先に郵便物Pを区分するものである。
上記区分機本体1aには、供給部2と、スキャナ部(読取手段)3と、搬送部4と、区分部5と、収納部6とが設けられている。この供給部2からの郵便物Pが搬送路によって搬送されることにより、搬送部4、区分部5を順次介して収納部6に導かれる。
上記供給部2は、郵便物Pを載置する載置台7と、この載置台7から郵便物Pを一通ずつ取り出して搬送路に送る取出し部8とを有している。上記スキャナ部3は、搬送路によって搬送される1通ずつの郵便物P上の全体の画像を光学的に読取って画像情報を生成する。上記搬送部4は、スキャナ部3を通過してきた郵便物Pを区分部5へ搬送する。上記収納部6は、郵便物Pを区分収納する多数の収納ポケット6aを有している。上記区分部5は、搬送部4から送られてくる郵便物Pをスキャナ部3からの画像情報に対する後述する認識結果に基づいて収納ポケット6a、…のいずれかに振り分ける。
上記スキャナ部3は、郵便物P上を光学的に走査して光電変換することによりパターン信号として紙葉類上の情報を読取る読取手段であり、たとえば郵便物P上に光を照射する光源、およびその反射光を受けて電気信号に変換する自己走査形のCCDイメージセンサ等によって構成される。上記スキャナ部3の出力は情報処理部10へ供給される。この情報処理部10は、スキャナ部3と共に、宛先を認識するための宛先認識装置を構成している。
上記区分機1において、上記供給部2、スキャナ部3、搬送部4、区分部5、情報処理部10は、制御部11に接続されている。この制御部11は、区分機1の全体の動作を制御する。たとえば、制御部11は図示しないメモリに記憶されている区分指定テーブルを用いて、上記情報処理部10での認識結果(もしくは判定結果)に対応する区分指定データを読出し、この読出した区分指定データ(収納ポケット6a、…のアドレス)に対応する収納ポケット6a、…に上記郵便物Pを搬送せしめるものである。
さらに、上記制御部11はドライバ(図示せず)により上記搬送路等の搬送機構部(図示せず)を駆動することにより、搬送系全体の制御を行うようになっている。
図3は、図2中に示される情報処理部10の構成を示すブロック図である。また、図4は、図2中に示されるスキャナ部3により読取られた郵便物Pの画像に含まれる各種の領域を示す図である。
上記情報処理部10は、図3に示されるように、探索範囲決定部21、前処理部22、文字行抽出部23、宛先領域候補抽出部(抽出手段)24、宛先領域選択部25、住所認識部26、および答え出力部27を含んでいる。
探索範囲決定部21は、スキャナ部3により読取られた画像に対し、認識対象を含む画像の探索範囲を決定する。例えば、図4に示される取り込み画像100のうち、背景101と分離し得る、郵便物領域102を探索範囲として決定する。
前処理部22は、探索範囲決定部21により決定された探索範囲の画像を切り出し、切り出された画像を二値画像に変換し、黒画素の連結成分を1つの塊(以下、ラベルと呼ぶ)とするようなラベリング処理を行う。得られたラベルの外接矩形の両辺の長さが、ある閾値よりも小さなものは、「ノイズ」とみなして除去される。
文字行抽出部23は、住所認識対象となる文字行を抽出する。例えば、前処理部22により得られたラベルのうち、文字認識対象とすべきものとして予め定められた文字のサイズや文字数の情報をもとに、その条件に合うラベルを抽出する。
宛先領域候補抽出部24は、文字行抽出部23により抽出された複数の行から、各行の相互位置関係、各行の長さ等の情報を用いて、宛先領域の候補を抽出する。例えば、図4に示されるようにいくつかの宛先候補領域103が検出されることとなる。抽出された候補の中には、差出人領域なども含まれている可能性があるため、この段階では、抽出された候補を宛先領域と断定することはしない。
宛先領域選択部25は、宛先領域候補抽出部24により得られた宛先領域の候補に対し、郵便物Pに対する候補領域の位置等の情報を加味して、読み取りの優先順位を付け、優先順位の高い順に住所認識の対象とすべき宛先領域の候補を選択する。但し、優先順位を付ける際に、文字認識の結果を使用する場合には、後述の住所認識部26による文字認識を行った後に宛先領域選択部25による選択が行われることになる。この宛先領域選択部25の詳細については、後で説明する。
住所認識部26は、宛先領域選択部25により優先順位が例えば最も高いものとして選択された宛先領域候補の領域に記載されている各文字を認識し、各文字から構成されるワードを、事前に用意しておいた宛先住所データベースに登録されている宛先住所と照合して、郵便物Pの宛先住所を特定する。文字の認識方式は既知の方式でよい。ここで、その領域のワードに示される住所が宛先住所データベースに登録されていない場合には、例えば、優先順位が次に高い宛先領域候補に対し、認識処理を行う。勿論、この繰り返し動作は、何らかの判断基準によって、途中で制止することも可能である。
答え出力部27は、住所認識部26より得られた住所認識結果を出力する。出力された住所認識結果は、制御部11へ送られる。住所認識結果が得られなかった場合には、郵便物Pに対するリジェクト処理を行う。
なお、上記宛先領域選択部25、住所認識部26、および答え出力部27は、宛先を決定する宛先決定手段を構成している。
図5は、図3中に示される宛先領域選択部25の構成を示すブロック図である。また、図6は、図5中に示される各種のデータベースの詳細を示す図である。
図5に示されるように、宛先領域選択部25は、選択処理部31、差出人記載様式データベース(記憶手段)32、管轄区域情報データベース(記憶手段)33、顧客特徴情報データベース(記憶手段)34、線情報データベース(記憶手段)35、差出人記載判定部(判定手段)36、宛先区域判定部(判定手段)37、特定顧客判定部(判定手段)38、宛名記載判定部(判定手段)39、および禁止/許可処理部(禁止/許可手段)40を含んでいる。
選択処理部31は、前述の選択処理を行うものであり、読み取りの優先順位を付け、住所認識の対象とすべき宛先領域の候補を選択する。この選択処理部31は、禁止/許可処理部40によってその選択処理が制御される。
差出人記載様式データベース32は、郵便物Pにおける差出人領域における差出人記載様式(フォーマット)を示す情報を格納している。この情報には、郵便物Pに対する差出人領域の記載位置のほか、差出人領域の文字行数、文字行長さ、差出人領域内の各種単語の配置の順番などの情報が含まれる。なお、この差出人記載様式は、一般的な差出人領域の記載様式であってもよいし、特定の差出人(例えば大口顧客)に対応する記載様式であってもよい。
管轄区域情報データベース33は、当該宛先認識装置が運用される施設が管轄する管轄区域を示す情報を格納している。
顧客特徴情報データベース34は、特定の差出人(例えば大口顧客)の特徴を示す情報として、特定の顧客を表す単語や商標・ロゴなどの図形や過去の領域座標位置の判定結果の履歴を含む顧客特徴情報を格納している。また、配達物表面におけるその顧客に固有の差出人領域の位置を示す情報などが含まれていてもよい。
線情報データベース35は、宛先領域を特徴付ける線情報(例えば、所定の条件を満たす複数本の直線や下線を示す情報)を格納している。
差出人記載判定部36は、差出人記載様式データベース32に予め格納されている情報を参照することにより、対象となっている候補の記載様式が、差出人領域の記載様式に適合するものであるか否かを判定するものである。
宛先区域判定部37は、管轄区域情報データベース33に予め格納されている情報を参照することにより、対象となっている候補に記載されている住所が、上記管轄区域に含まれるものであるか否かを判定するものである。なお、この判定においては、住所認識部26で認識された住所認識の結果が用いられる。
特定顧客判定部38は、顧客特徴情報データベース34に予め格納されている情報を参照することにより、対象となっている候補の記載が、上記顧客特徴情報に適合するか否かを判定するものである。
宛名記載判定部39は、線情報データベース35に予め格納されている情報を参照することにより、対象となっている候補の記載に、上記線情報が含まれているか否かを判定するものである。
なお、上記4つの判定部36〜39の全てを設けるのではなく、少なくとも1つを設ける構成としてもよいし、2つ以上を設ける構成としてもよい。これと同様に、上記4つのデータベース32〜35の全てを設けるのではなく、少なくとも1つを設ける構成としてもよいし、2つ以上を設ける構成としてもよい。
禁止/許可処理部40は、判定部36〜39の少なくとも1つの判定結果に応じて、対象となっている候補を宛先領域として認識することを選択処理部31に対して禁止または許可するものである。例えば、対象となっている候補が差出人領域に該当するという判定結果が得られた場合には、その候補を宛先領域として認識することを禁止する。なお、判定部36〜39のうちのいずれを使用するか、個々の判定結果にどの程度重みを付けるか(もしくは、どのような点数付けを行うか)については、禁止/許可処理部40において事前に設定することができる。
次に、図7のフローチャートを参照して、本実施形態における基本動作の一例を説明する。
スキャナ部3に郵便物Pが送り込まれると(ステップS101)、画像の読み込みが行われる(ステップS102)。
次いで、探索範囲決定部21によって認識対象を含む画像の探索範囲が決定され、前処理部22によって前処理に相当するラベリング処理が行われる(ステップS103)。さらに、文字行抽出部23によって文字行が抽出され、宛先領域候補抽出部24によって宛先領域の候補がいくつか抽出される(ステップS104)。
そして、宛先領域選択部25によって各候補に読み取りの優先順位が付され、優先度の高い順に候補が選択される(ステップS105)。選択された候補は、その記載に対してフォーマット解析や位置解析が施され(ステップS106)、所定のデータベース(例えば、特定の差出人(顧客)の特徴を示すワードやマークなどを含む差出人登録情報のデータベース)との照合により、類似度や認識度などを示すスコアが必要に応じて算出され、当該候補が登録されたものであるか否かが判定される(ステップS107)。
ここで、候補が登録されたものであると判定された場合には(ステップS107のYES)、その候補は宛先領域に該当しないため、住所認識が禁止される。そして、次に優先度が高い候補があれば(ステップS108のYES)、その候補に対してステップS105からの処理が繰り返される。次に優先度が高い候補がなければ(ステップS108のNO)、宛先領域に該当する候補はないものとみなし、リジェクト処理すべき旨の結果が答え出力部27から出力され(ステップS109)、郵便物Pが制御部11によってリジェクト区分ポケットへ送られる(ステップS110)。そして、次の郵便物に対してステップS101以降の処理が行われることになる。
一方、候補が登録されたものでないと判定された場合には(ステップS107のNO)、その候補は、宛先領域に該当する可能性があるため、住所認識の実行が許可され、住所認識部26によって宛先住所データベースとの照合による住所認識が行われる(ステップS111)。
そして、宛名に該当する住所認識結果が得られたか否かが判定される(ステップS112)。住所認識結果が得られなかった場合には(ステップS112のNO)、ステップS108へと進み、一方、住所認識結果が得られた場合には(ステップS112のYES)、その住所認識結果が答え出力部27から出力され(ステップS113)、郵便物Pが制御部11によって該当する宛名区分ポケットへ送られる(ステップS114)。そして、次の郵便物に対してステップS101以降の処理が行われることになる。
なお、図7では、差出人登録情報のデータベースとの照合により、各候補が差出人領域に該当するか否か(もしくは、宛先領域に該当するか否か)を判定する場合を例示したが、判定の手法はこれに限定されるものではない。以下に、各種の判定手法について説明する。
<第1の判定手法>
まず、図8〜図12を参照して、第1の判定手法に関して説明する。また、他の図(図5等)も適宜参照する。当該判定を行う際には、特に、前述した図5及び図6に示される差出人記載様式データベース32及び差出人記載判定部36が用いられるものとする。
差出人記載判定部36においては、前述したように、差出人記載様式データベース32に予め格納されている情報(郵便物Pにおける差出人領域に関する差出人記載様式を示す情報)を参照することにより、対象となっている候補の記載様式が、差出人領域の記載様式に適合するものであるか否かを判定する。また、禁止/許可処理部40は、差出人領域の記載様式に適合すると判定された場合に、その候補を宛先領域として認識することを禁止する。
例えば、差出人領域の記載を構成するワードの配置と、宛先領域の記載を構成するワードの配置とは相違するものであるため、この違いを利用して上記判定を行うことができる。この場合、差出人領域の記載を構成するワードの配置の情報(文字行数、文字行長さ、単語間の相対的な位置関係、各種単語の配置の順番などの情報を含む)を差出人記載様式データベース32に格納しておき、当該情報を参照することにより、対象となっている候補の記載様式が、差出人領域の記載様式に適合するものであるか否かを判定することができる。これにより、差出人領域の記載様式に適合すると判定したものを宛先認識の対象から除外することにより、誤認識を防止し、宛先認識を効率良く行うことができる。
ここで、本装置がスウェーデンで運営されている郵便に適用される場合の例を説明する。図8及び図9には、スウェーデン郵便において使用されるワード構成の例がいくつか示されている。もし、差出人領域の記載内容と宛先領域の記載内容とが、共に、図8に示されるようなワード構成201となっている場合には、一般に、差出人領域を検出することは容易ではないが、図9のワード構成202もしくはワード構成203が検出された場合には、これらは標準的なワード構成ではないため、その領域は差出人領域であるものとみなし、宛先認識の対象から除外することができる。
図10は、候補領域の記載内容に基づいてワード構成を示す情報の作成を行うためのワード作成ユニット50を説明するための図である。なお、ワード作成ユニット50が設けられる場所は特に限定されない。
ワード作成ユニット50は、候補領域に対し、隙間検知による単語候補の切り分け、各種データベースに基づく文字認識、ワードの判定などを行うことにより、候補領域内のワードの構成や配置を示す二次元情報を作成するものである。図10の例では、図8のようなワード構成を有する宛先候補領域103から複数の行(L3、L2、L1)が検出され、L3の行から名前に該当するワード「Masa MAEDA」が得られ、L2の行からストリートに該当するワード「misogatan」が得られ、L1の行からZIPコード(郵便番号)に該当する「12345」と都市名に該当するワード「stockholm」とが別々に得られる様子が示されている。なお、このワード作成ユニット50は、候補領域上の個々のワードを切り分けて作成できるものであれば、どの方式を採用してもよい。
ここで、図11のフローチャートを参照して、第1の判定手法による動作の概略を説明する。
候補領域の情報がワード作成ユニット50に入力されると(ステップS11)、ワード作成ユニット50は、候補領域内のワード構成を認識する(ステップS12)。次に、判定部36は、候補領域に含まれるワードのうち、ZIPコードに該当するワードのスコアがある閾値よりも高いかどうかを判定する(ステップS13)。
ステップS13においてZIPコードに該当するワードのスコアが閾値よりも高い場合(ステップS13のYES)、判定部36は、ZIPコードが行の先頭にあるか否かを判定する(ステップS14)。ZIPコードが行の先頭に無ければ(ステップS14のNO)、その候補領域は差出人領域であるものとみなし、当該候補領域を宛先認識の対象から除外すべきと判定する(ステップS15)。一方、ZIPコードが行の先頭にあれば(ステップS14のYES)、その候補領域が差出人領域であるか宛先領域であるかの判断は下せないため、通常の住所認識アルゴリズムへ処理を委ねる(ステップS17)。
また、ステップS13においてZIPコードに該当するワードのスコアが閾値よりも高くない場合(ステップS13のNO)、判定部36は、ストリートが行の先頭にある行で、後方にZIPコード及び都市名があるか否かを判定する(ステップS14)。同じ行の後方にZIPコード及び都市名があれば(ステップS16のYES)、その候補領域は差出人領域であるものとみなし、当該候補領域を宛先認識の対象から除外すべきと判定する(ステップS15)。一方、同じ行の後方にZIPコード及び都市名が無ければ(ステップS16のNO)、その候補領域が差出人領域であるか宛先領域であるかの判断は下せないため、通常の住所認識アルゴリズムへ処理を委ねる(ステップS17)。
次に、図12のフローチャートを参照して、図11に示した動作の詳細を説明する。
候補領域の情報がワード作成ユニット50に入力されると(ステップS21)、ワード作成ユニット50は、隙間検知による単語候補の切り分けを行って(ステップS22)、一文字ずつ文字認識を行う(ステップS23)。続いて、ワード作成ユニット50は、住所データベース等を用いたワードの判定を行い(ステップS24)、候補領域内のワードの構成や配置を示す二次元情報を作成する。このワード作成ユニット50で生成された各ワードは、どのワードが何行目の何番目にあるかが分かるように、それぞれIDが付され、二次元配列の形で記憶媒体に格納される(ステップS25)。また、各ワードの認識結果のレベルを示すスコアも格納される。この場合のスコアは、ワード自体の認識結果だけでなく、ワードが存在する位置やワードの長さなども加味して決定される。
ステップS26においてZIPコードに該当するワードのスコアが閾値よりも高い場合(ステップS26のYES)、判定部36は、ワード作成ユニット50によって認識された各ワードの配置をIDに基づいて調べ、ZIPコードが存在する行(例えばLine A)を抽出する(ステップS27)。そして、判定部36は、抽出した行の左側から順に各ワードのIDを確認し(ステップS28)、抽出した行の先頭にあるワードがZIPコードであるか否かを判定する(ステップS29)。抽出した行の先頭にあるワードがZIPコードでなければ(ステップS29のNO)、その候補領域は差出人領域であるものとみなし、当該候補領域を宛先認識の対象から除外すべきと判定する(ステップS30)。一方、抽出した行の先頭にあるワードがZIPコードであれば(ステップS29のYES)、その候補領域が差出人領域であるか宛先領域であるかの判断は下せないため、通常の住所認識アルゴリズムへ処理を委ねる(ステップS34)。
また、ステップS26においてZIPコードに該当するワードのスコアが閾値よりも高くない場合(ステップS26のNO)、判定部36は、ストリートが行の先頭にある行(例えばLine B)を抽出する(ステップS31)。そして、判定部36は、抽出した行の左側から順に各ワードのIDを確認し(ステップS32)、ストリートの位置よりも後方にZIPコードおよび都市名があるか否かを判定する(ステップS33)。ストリートの位置よりも後方にZIPコードおよび都市名があれば(ステップS33のYES)、その候補領域は差出人領域であるものとみなし、当該候補領域を宛先認識の対象から除外すべきと判定する(ステップS30)。一方、ストリートの位置よりも後方にZIPコードおよび都市名が無ければ(ステップS33のNO)、その候補領域が差出人領域であるか宛先領域であるかの判断は下せないため、通常の住所認識アルゴリズムへ処理を委ねる(ステップS34)。
このように、第1の判定手法では、郵便物Pに対する差出人領域の記載位置のほか、差出人領域の文字行数、文字行長さ、差出人領域内の各種単語の配置の順番などの情報を利用することにより、宛先認識処理の確度を向上させることができる。
<第2の判定手法>
次に、図13〜図17を参照して、第2の判定手法に関して説明する。また、他の図(図5等)も併せて参照する。当該判定を行う際には、特に、前述した図5及び図6に示される管轄区域情報データベース33及び宛先区域判定部37が用いられる。
宛先区域判定部37においては、前述したように、管轄区域情報データベース33に予め格納されている情報を参照することにより、対象となっている候補領域に記載されている住所が上記管轄区域に含まれるものであるか否かを判定し、その判定結果から当該候補領域が宛先領域であるか、もしくは差出人領域であるかを認識する。なお、上記判定においては、住所認識部26で認識される住所認識の結果が用いられる。また、禁止/許可処理部40は、上記判定結果に応じて、候補を宛先領域として認識することを禁止または許可する。上記判定の処理は、郵便物Pが収集便であるか到着便であるかに応じて違ってくる。
ここで、図13に収集便と到着便の違いを示す。収集便とは、管轄区域内にある各地のポストから管轄局に集められた郵便のことである。一方、到着便とは、郵便を収集した収集局から宛先に近い局へと届けられる郵便のことである。この到着便は、配達員によって宛先へ配達されることになる。
この第2の判定手法では、例えば、郵便物P上の候補領域の住所認識結果のうち、一方が当該宛先認識装置の運用される施設が管轄する地区と同地区であり、他方が当該宛先認識装置の運用される施設が管轄する地区と異なる地区である場合に、郵便物Pが収集便であるか到着便であるかに応じて、差出人領域もしくは宛先領域が決定される。
郵便物Pが収集便である場合、宛先認識装置は収集便を処理する収集便モードとなる。このとき、図14のように、郵便物P上の郵便物領域102に例えば川崎市の住所が記載された領域111と仙台市の住所が記載された領域112がある状況において、宛先認識装置が川崎市の処理局に設けられているケースでは、判定部37は、川崎市に関する管轄区域情報データベース33との照合により、川崎市の住所が記載された領域111は差出人領域であると判断し、当該領域を宛先認識の対象から除外する。そして、仙台市の住所が記載された領域112が宛先領域であると判断する。
一方、郵便物Pが到着便である場合、宛先認識装置は到着便を処理する到着便モードとなる。このとき、図15のように、郵便物P上の郵便物領域102に図14と同じ領域111,112が存在している状況において、宛先認識装置が仙台市の処理局に設けられているケースでは、判定部37は、仙台市に関する管轄区域情報データベース33との照合により、仙台市の住所が記載された領域112が宛先領域であると判断し、川崎市の住所が記載された領域111を宛先認識の対象から除外する。
図16は、郵便物Pの種類に応じたモード切り替えを実現するための構成を示す図である。
収集便/到着便識別部61は、例えば郵便物P上の消印等を検出することにより、郵便物Pが収集便であるか到着便であるかを識別するものである。自動設定部62は、郵便物Pの種類に応じたモード切り替えを自動で行う際に使用されるものであり、収集便/到着便識別部61での識別結果に応じて、収集便モードと到着便モードとのいずれか一方を選択して設定するものである。手動設定部63は、郵便物Pの種類に応じたモード切り替えを手動で行う際に使用されるものであり、使用者の操作に応じて、収集便モードと到着便モードとのいずれか一方を選択して設定するものである。
次に、図17を参照して、第2の判定手法による動作を説明する。
複数の候補領域が抽出されると(ステップS41)、各領域候補内に含まれる文字行毎の住所認識スコアが計算される(ステップS42)。そして、計算された複数の領域候補のスコアが参照され、住所と判定すべき閾値を超える領域が複数あるか否かが判定される(ステップS43)。ここで、閾値を超える住所らしき領域が一つだけの場合には(ステップS43のNo)、判定部37は、その領域が差出人領域であるか(もしくは、宛先領域であるか)について判定を行って結果を出力する(ステップS46)。
一方、閾値を超える住所らしき領域が複数ある場合には(ステップS43のYes)、判定部37は、個々の領域が自地域と他地域のいずれに該当するかを、管轄区域情報データベース33との照合により、それぞれ判定する(ステップS44)。ここで、収集便モードと到着便モードとのいずれが設定されているかによって以降の処理が違ってくる。
まず、収集便モードが設定されている場合について説明する。収集便モードが設定されているときに、i)自地域に該当する領域と他地域に該当する領域の両方がある場合(ステップS44のYes)、自地域に該当する領域が差出人領域で、他地域に該当する領域が宛先領域であるものと判定して結果を出力する(ステップS46)。また、ii)個々の領域がすべて自地域に該当する領域である場合(ステップS44のNo)、自局内の郵送であると考えられるため、管轄区域情報データベース33による判定はできないものとみなし、後段のスコア比較部を通じて各領域のスコアを比較して(ステップS45)、その比較結果を用いることにより差出人領域と宛先領域を判定して結果を出力する(ステップS46)。また、iii)個々の領域がすべて他地域に該当する領域である場合(ステップS44のNo)、例えば出張先で宛名、差出人などが既に記載されているようなプリプリントの封筒等による他局間の郵送であると考えられるため、この場合も管轄区域情報データベース33による判定はできないものとみなし、スコア比較部を通じて各領域のスコアを比較して(ステップS45)、その比較結果を用いることにより差出人領域と宛先領域を判定して結果を出力する(ステップS46)。
次に、到達便モードが設定されている場合について説明する。到達便モードが設定されているときに、i)自地域に該当する領域と他地域に該当する領域の両方がある場合(ステップS44のYes)、自地域に該当する領域が宛先領域で、他地域に該当する領域が差出人領域であるものと判定して結果を出力する(ステップS46)。また、ii)個々の領域がすべて他地域に該当する領域である場合(ステップS44のNo)、他地域間の転送(中継)であると考えられるため、管轄区域情報データベース33による判定はできないものとみなし、スコア比較部を通じて各領域のスコアを比較して(ステップS45)、その比較結果を用いることにより差出人領域と宛先領域を判定して結果を出力する(ステップS46)。なお、到着便の転送元の情報は既知の場合は、転送を繰り返す恐れがあるので、リジェクトを示すコードを付加する処理を行ってもよい。また、iii)個々の領域がすべて自地域に該当する領域である場合(ステップS44のNo)、例えば出張先で宛名、差出人などが既に記載されているようなプリプリントの封筒等による他局間の郵送であることが考えられるため、この場合も管轄区域情報データベース33による判定はできないものとみなし、スコア比較部を通じて各領域のスコアを比較して(ステップS45)、その比較結果を用いることにより差出人領域と宛先領域を判定して結果を出力する(ステップS46)。
なお、海外からの到着便が自地域に送られてきたようなケースで、閾値を超える住所らしき領域が複数ある場合、送付元の国コードが既知であれば、その郵便番号のフォーマット(英数字何桁の構成か)を参照し、自地域の番号と相関がないか調べることによって対処することが考えられる。
このように、第2の判定手法では、宛先認識装置の運用される施設が管轄する地区の情報を利用することにより、宛先認識処理の確度を向上させることができる。
<第3の判定手法>
次に、図18を参照して、第3の判定手法に関して説明する。また、他の図(図5等)も併せて参照する。当該判定を行う際には、特に、前述した図5及び図6に示される顧客特徴情報データベース34及び特定顧客判定部38が用いられる。
特定顧客判定部38においては、前述したように、顧客特徴情報データベース34に予め格納されている顧客特徴情報(大口の顧客など、特定の顧客を表す単語や商標・ロゴなどの図形や過去の領域座標位置の判定結果の履歴を含む情報)を参照することにより、対象となっている候補の記載が、上記顧客特徴情報に適合するか否かを判定するものである。また、禁止/許可処理部40は、対象となっている候補の記載が顧客特徴情報に適合すると判定された場合に、その候補を宛先領域として認識することを禁止する。
ここで、図18を参照して、第3の判定手法による動作を説明する。
郵便物P上の候補領域が検出されると(ステップS51)、その領域内の各文字行の配置位置を示す位置情報(座標情報など)が取得される(ステップS52)。ここで取得される情報には、位置の情報だけでなく、文字行や記号といった情報も含まれている。更に、文字行内で認識処理が行われた際には、文字認識、単語認識、記号認識などのそれぞれの認識結果(辞書との類似度や認識度など)を示す情報がスコアとして残されている。これらはタグ情報として位置情報に付与され、記憶媒体に格納される(ステップS53)。
この後、各候補領域が差出人領域に該当するか否かについては、例えば以下の手順により判定することができる。なお、ここでは、大口顧客用の同一フォーマットの郵便物が連続的に処理される場合を想定している。
まず、判定部38は、過去数回の位置情報やスコアに関する履歴をチェックする(ステップS54)。具体的には、対象となっている郵便物P上に複数の領域候補A,Bがあり、領域候補A,BのスコアがそれぞれSa, Sbで、領域の座標に関する情報がそれぞれDa, Db であるとすると、過去の履歴との比較に使用する情報は、
ψ(A(Sa,Da),B(Sb,Db))
と表される。一方、過去の履歴(例えば最近頻出したもの)は、
ψ1(A1(Sa1,Da1),B1(Sb1,Db1))…
ψ2(A2(Sa2,Da2),B2(Sb2,Db2))…
と表される。各履歴との類似度S(ψ, ψ1), S(ψ, ψ2)…を導出すれば、差出人領域内の文字認識スコア、位置の情報はほぼ一致することとなり、過去に差出人領域と判定していたことが分かる。
次に、判定部38は、領域候補が差出人領域ではない規定外領域に該当するか否かのチェックを行う(ステップS55)。領域の座標は一般にD(x) = (sx,sy,ex,ey)のように、始点と終点の座標組で表される。ここで、顧客特徴情報データベース34に予め格納されている経験的な差出人記載位置確率分布P(x)を郵便物の全面について設定し、この確率分布P(x)と領域座標D(x)との積を導出すると、
P(x)D(x) = 1 True (差出人領域)、もしくは、
P(x)D(x) = 0 False(差出人領域ではない)
といった結果が得られ、差出人領域の位置を判定できる。
但し、これは最も単純な場合の例である。例えば複数の領域座標Da(x),Db(x),Dc(x)が得られたような場合には、
P(x)(Da(x),Db(x),Dc(x)) = (0, 1, 0)
といった結果が得られ、Db(x)に対応する領域が差出人領域であるものと明確に特定できる。ところで、
P(x)(Da(x),Db(x),Dc(x)) = (0, 0, 0)
のように、差出人領域を示す結果が得られない場合には、差出人領域を特定しかねるため、差出人領域の判定不可を示す結果、もしくは当該郵便物Pをリジェクトすべき旨の結果を出力する。また逆に、
P(x)(Da(x),Db(x),Dc(x)) = (1, 1, 1)
のように、複数の領域が差出人領域を示している場合にも、差出人領域を特定しかねるため、差出人領域の判定不可を示す結果、もしくは当該郵便物Pをリジェクトすべき旨の結果を出力する。
次に、判定部38は、候補領域のレイアウトパラメータの類似性に関する判定を行う(ステップS56)。
検出された候補領域には、差出人を特定する固有名などの単語もしくは図形(以下、キーワード等と称す)が存在する。文書領域中より既存のワード抽出方法等を用いることによって、複数のキーワード等を抽出することが可能である。具体的には、複数の領域候補A,Bがあり、領域候補A,B内のキーワード等のラベルがそれぞれLa,Lb であり、領域の座標に関する情報がDa,Db であるとすると、A(La,Da)およびB(Lb,Db)の各要素の組み合わせが、顧客特徴情報データベース34に予め格納されている情報に類似するか否かの判定を行う。この場合、顧客特徴情報データベース34に登録されている情報に基づき、例えば、
(La x Da x Db ) → True(差出人領域)
(Lc x Da'x De ) → True(差出人領域)
(La x Da'x Db ) → False(差出人領域ではない)
といった結果が得られる。
こうしてステップS54〜S56のチェックで得られた結果に基づき、差出人領域を判定して結果を出力する(ステップS57)。
このように、第3の判定手法では、特定の顧客を表す単語や商標・ロゴなどの図形や過去の領域座標位置の判定結果の履歴を含む顧客特徴情報を利用することにより、宛先認識処理の確度を向上させることができる。
<第4の判定手法>
次に、図19〜図20を参照して、第4の判定手法に関して説明する。また、他の図(図5等)も併せて参照する。当該判定を行う際には、特に、前述した図5及び図6に示される線情報データベース35及び宛名記載判定部39が用いられる。
宛名記載判定部39においては、前述したように、線情報データベース35に予め格納されている情報を参照することにより、対象となっている候補の記載に、上記線情報が含まれているか否かを判定する。また、禁止/許可処理部40は、対象となっている候補の記載に上記線情報が含まれている場合に、その候補を宛先領域として認識することを許可する。
図19は、複数の候補領域103のうちの宛先領域内の住所記載位置に下線が記載されている様子を示す図である。プレプリントされた絵葉書などには、このような下線が点線もしくは実線で予め印刷されている。また、プレプリントされた絵葉書でなくとも、宛先を強調する目的で国名や都市名が書かれた部分に手書きで下線が書かれていることも多い。第4の判定手法では、このような下線を検出することにより、宛先領域を判定する。
次に、図20を参照して、第4の判定手法による動作を説明する。
スキャナで撮像された郵便物の画像が得られると(ステップS61)、前処理部22において前処理が施される(ステップS62)。なお、郵便物Pに上記プレプリントが施されている場合は、前処理によって、文字画像と下線画像が共起された状態で残っている。
次に、文字行抽出部23において文字候補ラベルから文字行の情報が抽出され(ステップS63)、そこに下線が存在する場合には下線が検出され(ステップS64)、対応する領域が抽出される(ステップS65)。そして、その領域に対し、下線除去処理が施される(ステップS66)。ここでは、例えば、ハフ変換および輪郭追跡情報を用いて下線の検出および除去が行われるものとする。
領域候補は、下線除去処理後の文字行を用いて、複数生成されることとなる。このとき、下線除去が施されたか否かの情報は、生成された領域候補を構成する文字行の情報に付随する情報として蓄えられる。複数の文字領域が生成された後は、下線除去が施されたか否かの情報を参照して、消去された痕跡があれば、文字認識結果の如何に関わりなく、その領域は宛先領域であると判定する(ステップS67)。
なお、下線の検出および除去は、手書きの下線に対しても可能であり、領域候補に含まれる手書き下線が検出された場合には、印刷された下線と同様、その領域は宛先領域であると判定される。ここで、手書き下線に対する処理の詳細を説明する。前述したように、手書き下線は、宛先を強調する目的で、例えば国名および主要都市名の部分に書かれる場合が多い。そこでi)主要都市、国名が記載されている文字行と手書き下線が検出された行とが一致する場合には、その領域は宛先領域であると認識する。一方、ii)下線が検出された行と国名、主要都市、名前との相関がみられない、または相違がある場合には、検出された下線は、宛名を強調する目的とは異なる存在とみなし、下線情報に基づく判定の処理を棄却する。
次に、プレプリントの下線に対する処理の詳細を説明する。プレプリントの下線は、手書きとは異なり、住所記載位置を促す目的で用いられる。その為、住所フォーマットに依存せず、宛先領域内に一様に存在する場合が多い。そこで、i)領域内に一定長、一定間隔で実線および点線が複数個検出される場合には、その領域は宛先領域であると認識する。また、ii)同一行内に点線と実線が同じ傾きで存在する場合には、その領域は宛先領域であると認識する。また、iii)検出されたプレプリントの複数行について、傾きが一定でない、長さが一定でない等、規則性が見いだせない場合には、住所記載位置との相関に基づく判定の処理を棄却して、後段の住所認識のスコア比較部での比較結果に基づく判定を行う。また、iv)検出された実線が最下行および最上行、行の先頭および末尾に縦線として検出された場合には、窓枠の残りが検出されたものと認識し、その領域は宛先領域であると認識する。
このように、第4の判定手法では、宛先領域に含まれる下線の情報を利用することにより、宛先認識処理の確度を向上させることができる。
以上詳述したように、本実施形態によれば、差出人領域の認識精度を高めることができ、高精度な宛先認識結果を得ることができる。
住所認識を行う際には宛先が記載されている領域を正しく検出することが不可欠であるが、実際の郵便物には、ノイズ、広告領域、差出人領域が含まれ、従来手法では宛先領域を特定するのが困難である場合が多かったが、本宛先認識装置は多方面から宛先領域を判別する手法を備えているため、従来手法と比べて、複数の領域候補から宛先領域をより正しく選択できる。特に、差出人領域は領域内を構成するワードの要素など宛先領域とよく似た性質を持っており、宛先領域を正しく選択する上で頭を悩ませる原因であったが、上述した手法によってその二つを確実に判別できる。また、住所認識結果に直結する平行線ノイズの除去についても上述した手法を用いることで効果的に実現できる。また、宛先住所を正確に認識できなくても、宛先領域らしいと判別できるような手法を採用しているため、別の領域を読みに行って誤認識してしまうことを防ぐことができる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
1…区分機、2…供給部、3…スキャナ部、4…搬送部、5…区分部、10…情報処理部、11…制御部、21…探索範囲決定部、22…前処理部、23…文字行抽出部、24…宛先領域候補抽出部、25…宛先領域選択部、26…住所認識部、27…答え出力部、31…選択処理部、32…差出人記載様式データベース、33…管轄区域情報データベース、34…顧客特徴情報データベース、35…線情報データベース、36…差出人記載判定部、37…宛先区域判定部、38…特定顧客判定部、39…宛名記載判定部、40…禁止/許可処理部。

Claims (5)

  1. 配達物の宛先を認識する宛先認識装置であって、
    この宛先認識装置が運用される施設が管轄する管轄区域を記憶する記憶手段と、
    配達物表面の画像を読取る読取手段と、
    この読取手段によって読取られた画像から、宛先領域の候補を複数抽出する手段と、
    この抽出手段によって抽出された候補を順次認識することにより、宛先を決定する手段と、
    前記抽出手段によって抽出された候補に記載されている住所が、前記記憶手段に記憶されている前記管轄区域に含まれるものであるか否かを判定する手段と、
    この判定手段の判定結果に応じて、候補を宛先領域として認識することを禁止または許可する手段と、
    を具備することを特徴とする宛先認識装置。
  2. 前記配達物が、前記管轄区域に属するポストから収集される収集便である場合に、前記管轄区域に含まれる住所が記載された候補と、前記管轄区域に含まれない住所が記載された候補とが存在すれば、前記判定手段は、前記管轄区域に含まれない住所が記載された候補が宛先領域であると判定する第1のモードを実行することを特徴とする請求項1に記載の宛先認識装置。
  3. 前記配達物が、当該宛先認識装置が運用される施設が管轄する管轄区域以外の区域から届けられる到着便である場合に、前記管轄区域に含まれる住所が記載された候補と、前記管轄区域に含まれない住所が記載された候補とが存在すれば、前記判定手段は、前記管轄区域に含まれる住所が記載された候補が宛先領域であると判定する第2のモードを実行することを特徴とする請求項2に記載の宛先認識装置。
  4. 前記配達物が収集便であるか到着便であるかを識別する手段と、
    この識別手段の識別結果に応じて、前記第1のモードと前記第2のモードとのいずれか一方を選択して設定する手段と、
    を更に具備することを特徴とする請求項3に記載の宛先認識装置。
  5. 前記第1のモードと前記第2のモードとのいずれか一方を手動により選択して設定することを可能とする設定手段を具備することを特徴とする請求項3に記載の宛先認識装置。
JP2011003146A 2011-01-11 2011-01-11 宛先認識装置 Active JP5178851B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011003146A JP5178851B2 (ja) 2011-01-11 2011-01-11 宛先認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011003146A JP5178851B2 (ja) 2011-01-11 2011-01-11 宛先認識装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005082003A Division JP4855698B2 (ja) 2005-03-22 2005-03-22 宛先認識装置

Publications (2)

Publication Number Publication Date
JP2011125860A JP2011125860A (ja) 2011-06-30
JP5178851B2 true JP5178851B2 (ja) 2013-04-10

Family

ID=44289035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011003146A Active JP5178851B2 (ja) 2011-01-11 2011-01-11 宛先認識装置

Country Status (1)

Country Link
JP (1) JP5178851B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6239262B2 (ja) 2013-05-09 2017-11-29 株式会社東芝 区分システム及び区分方法
JP2016051211A (ja) 2014-08-28 2016-04-11 株式会社東芝 住所認識装置、区分装置、統括住所認識装置、住所認識方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3028849B2 (ja) * 1990-11-30 2000-04-04 株式会社東芝 郵便物宛名自動読取区分機および郵便物宛名自動読取方法
JP3160347B2 (ja) * 1992-02-06 2001-04-25 株式会社東芝 郵便物の宛名読取装置
JPH11235554A (ja) * 1998-02-20 1999-08-31 Toshiba Corp 郵便物宛名認識装置
JP2006095386A (ja) * 2004-09-28 2006-04-13 Toshiba Corp 配達物処理装置と配達物処理方法
JP2006142235A (ja) * 2004-11-22 2006-06-08 Toshiba Corp 紙葉類の物流管理方法
JP4855698B2 (ja) * 2005-03-22 2012-01-18 株式会社東芝 宛先認識装置

Also Published As

Publication number Publication date
JP2011125860A (ja) 2011-06-30

Similar Documents

Publication Publication Date Title
KR100323350B1 (ko) 우편물 수신처 판독장치 및 우편물 구분장치
US6360001B1 (en) Automatic location of address information on parcels sent by mass mailers
US20060291692A1 (en) Information processing apparatus having learning function for character dictionary
KR20120029351A (ko) 문자 인식 장치, 구분 장치, 구분 제어 장치 및 문자 인식 방법
JP2016159245A (ja) 配達物処理装置、および配達物処理プログラム
JP4855698B2 (ja) 宛先認識装置
JP5178851B2 (ja) 宛先認識装置
JPH0739820A (ja) 街区認識装置および宛名読取区分機
JP2000148906A (ja) 文書認識装置および郵便区分機
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JPH07271899A (ja) 文字認識装置
Madhvanath et al. Empirical design of a multi-classifier thresholding/control strategy for recognition of handwritten street names
JP3160347B2 (ja) 郵便物の宛名読取装置
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JP2000210624A (ja) 郵便宛名認識装置
JPH09192609A (ja) 宛名認識装置、郵便物区分装置及び郵便物処理システム
JPH11207265A (ja) 情報処理装置および郵便物処理装置
JP3660405B2 (ja) 区分機、宛名認識装置及び宛名認識方法
JP2015155077A (ja) 紙葉類区分装置
JPH0793474A (ja) 文字領域検出装置
JP2003141443A (ja) 認識装置、区分機、認識方法、及び区分方法
JP2005040786A (ja) 区分装置および宛名情報判定方法
WO2013108347A1 (ja) 文字認識装置、それを備えた区分装置、文字認識方法および制御プログラム
JP2007075761A (ja) 区分装置および区分処理方法
JP2001191035A (ja) 紙葉類区分機と紙葉類区分方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130108

R151 Written notification of patent or utility model registration

Ref document number: 5178851

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160118

Year of fee payment: 3