JP5500480B2 - 帳票認識装置及び帳票認識方法 - Google Patents
帳票認識装置及び帳票認識方法 Download PDFInfo
- Publication number
- JP5500480B2 JP5500480B2 JP2010143969A JP2010143969A JP5500480B2 JP 5500480 B2 JP5500480 B2 JP 5500480B2 JP 2010143969 A JP2010143969 A JP 2010143969A JP 2010143969 A JP2010143969 A JP 2010143969A JP 5500480 B2 JP5500480 B2 JP 5500480B2
- Authority
- JP
- Japan
- Prior art keywords
- stamp
- character
- image
- unit
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 108
- 238000012545 processing Methods 0.000 claims description 79
- 238000001514 detection method Methods 0.000 claims description 36
- 230000006866 deterioration Effects 0.000 claims description 32
- 238000012937 correction Methods 0.000 claims description 31
- 238000000926 separation method Methods 0.000 claims description 16
- 239000003086 colorant Substances 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 238000005520 cutting process Methods 0.000 claims description 5
- 230000015556 catabolic process Effects 0.000 claims 1
- 238000006731 degradation reaction Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 238000003860 storage Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000007639 printing Methods 0.000 description 6
- 238000005562 fading Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000000740 bleeding effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
本発明の第1の実施形態を図1〜図11を用いて説明する。
押印が存在すると判定された場合の押印検出部212の処理について説明する。
次に、本発明の第2の実施形態を図12〜図14を用いて説明する。
102 入力装置
103 表示装置
104 イメージ取得装置
105 通信装置
106 演算装置
107 外部記憶装置
201 押印認識用辞書
202 知識処理用辞書
203 認識結果DB
211 イメージ入力部
212 押印検出部
213 背景色分離部
214 傾き補正部
216 文字列探索部
217 文字切出部
218 文字認識部
219 知識処理部
220 棄却判定部
221 リトライ判定部
222 認識結果記録部
223 帳票分類部
301 押印認識用辞書
Claims (15)
- 帳票を光学的に走査することによって得られた帳票画像を取得するイメージ入力部と、
前記イメージ入力部によって取得された帳票画像から押印画像を検出する押印画像検出部と、
前記押印画像の輪郭の色を示す押印色とその他の色とを分離する背景色分離部と、
前記背景色分離部によって前記押印色が前記その他の色と分離された前記押印画像の傾きを補正する傾き補正部と、
前記傾き補正部によって傾きが補正された前記押印画像から文字列を探索し、前記探索された文字列を切り出す文字列探索部と、
前記文字列探索部によって切り出された文字列から、前記文字列を構成する各文字を切り出す文字切出部と、
前記文字切出部によって切り出された各文字を認識し、前記文字列を構成するすべての文字を認識した結果を示す文字認識結果を算出し、前記認識された各文字の信頼度を算出する文字認識部と、
前記文字認識部によって算出された文字認識結果から、予め指定された文字列形式に適合する文字認識結果を選択し、前記選択された文字認識結果に対する信頼度を前記文字認識部によって算出された各文字の信頼度に基づいて算出する知識処理部と、
前記知識処理部によって選択された文字認識結果と当該文字認識結果の信頼度とに基づいて、前記知識処理部によって選択された文字認識結果を棄却するか否かを判定する棄却判定部と、
前記棄却判定部によって前記文字認識部による文字認識結果が棄却された場合に、押印画像の文字を再度認識させるか否かを判定するリトライ判定部と、を備えることを特徴とする帳票認識装置。 - 前記文字認識部によって算出される文字認識結果及び前記イメージ入力部によって取得された帳票画像の認識結果を記録する認識結果記録部と、
前記イメージ入力部によって入力された帳票画像を、前記認識結果データベースに記録された情報に基づいて、所定の条件を満たす帳票画像ごとに分類する帳票分類部と、を備えることを特徴とする請求項1に記載の帳票認識装置。 - 前記背景色分離部は、
前記押印画像検出部によって検出された前記押印画像の外接矩形の縦の長さと横の長さとを算出し、前記算出された縦の長さ及び横の長さのうち長い方の長さをLとし、kを予め設定された1より小さい正の実数とした場合に、前記押印画像の輪郭位置から距離kL以内に存在する画素を輪郭付近の画素として抽出し、
前記抽出された輪郭付近の画素のピーク色から色空間において予め設定された所定範囲の色を押印色として抽出し、
前記抽出された押印色の画素を押印部とし、その他の色の画素を背景部とすることを特徴とする請求項1に記載の帳票認識装置。 - 前記傾き補正部は、前記背景色分離部によって前記押印色が前記その他の色と分離された前記押印画像の輪郭よりも内側に存在する線分を検出し、前記検出された線分に基づいて前記押印画像の傾きを算出し、前記算出された押印画像の傾きを補正することを特徴とする請求項1に記載の帳票認識装置。
- 前記棄却判定部は、
前記知識処理部によって選択された文字認識結果に含まれる各文字の信頼度の和を当該文字認識結果に含まれる文字の数で除算することによって、当該文字認識結果の信頼度を算出し、
前記算出された文字認識結果の信頼度が所定の値よりも小さい場合には、前記知識処理部によって選択された文字認識結果を棄却することを特徴とする請求項1に記載の帳票認識装置。 - 前記棄却判定部は、前記知識処理部によって選択された文字認識結果が年月日を示す文字列である場合には、年を示す文字の信頼度、月を示す文字の信頼度、及び日を示す文字の信頼度に重み付けをして、前記文字認識結果の信頼度を算出し、
前記年を示す文字の信頼度の重み付けが最も低くされ、次いで前記月を示す文字の信頼度の重み付けが低くされ、前記日を示す文字の信頼度の重み付けが最も高くされることを特徴とする請求項5に記載の帳票認識装置。 - 同じ種類の押印画像のテンプレート画像である押印テンプレート画像と当該押印テンプレート画像に存在する文字の位置情報とを記憶する押印認識用辞書と、
前記押印認識用辞書を用いて、前記傾き補正部によって傾きが補正された前記押印画像の種類を特定する押印種特定部と、
前記押印認識用辞書を用いて、前記押印種特定部によって種類が特定された前記押印画像に存在する文字の位置情報を取得する文字位置特定部と、
前記傾き補正部によって傾きが補正された前記押印画像と、当該押印画像と同じ種類の押印テンプレート画像とを比較することによって、前記押印画像の劣化度を判定する劣化判定部と、をさらに備えることを特徴とする請求項1に記載の帳票認識装置。 - 前記押印認識用辞書には、前記同じ種類の押印画像の押印形状、押印サイズ、前記文字列の形式、前記文字列を構成する各文字の大きさ、及び前記押印色の少なくとも一つが記録され、また、前記押印テンプレート画像に存在する文字の位置情報として、前記押印テンプレート画像に存在する文字列の位置情報、及び前記文字列を構成する各文字の位置情報の少なくとも一つが記憶されることを特徴とする請求項7に記載の帳票認識装置。
- 前記押印種特定部は、位置Xの前記押印画像の画素値をp(x)とし、位置Xの前記押印テンプレート画像の画素値をq(x)とした場合に、|p(x)−q(x)|の値に応じて広義単調増加する関数K(p,q)の値が最小となる押印テンプレート画像の種類を、前記押印画像の種類として特定することを特徴とする請求項7に記載の帳票認識装置。
- 前記押印認識用辞書は、前記押印テンプレート画像に存在する文字列の位置情報、前記文字列を構成する各文字の位置情報、及び前記文字列の形式を記録し、
前記文字列探索部は、前記押印種特定部によって前記押印画像の種類が特定されている場合に、前記押印認識用辞書に記憶された前記文字列の位置情報に基づいて、前記傾き補正部によって傾きが補正された前記押印画像から文字列を探索し、
前記文字切出部は、前記押印種特定部によって前記押印画像の種類が特定されている場合に、前記押印認識用辞書に記憶された前記各文字の位置情報に基づいて、前記文字列探索部によって切り出された文字列を構成する文字を切り出し、
前記文字認識部は、前記押印種特定部によって前記押印画像の種類が特定されている場合に、前記劣化判定部によって判定された前記押印画像の劣化度に応じて文字認識方法を切り換え、
前記知識処理部は、前記押印種特定部によって前記押印画像の種類が特定されている場合には、前記文字認識部によって算出された文字認識結果のうち、前記押印認識用辞書に記憶された前記文字列の形式に適合する文字認識結果を選択することを特徴とする請求項7に記載の帳票認識装置。 - 前記劣化判定部は、位置Xの前記押印画像の画素値をp(x)とし、位置Xの前記押印テンプレート画像の画素値をq(x)とした場合に、|p(x)−q(x)|の値に応じて広義単調増加する関数K(p,q)の値を前記劣化度とすることを特徴とする請求項7に記載の帳票認識装置。
- 前記関数K(p,q)は、前記関数K(p,q)の値と、pとqを入れ替えた関数K(q,p)との値とが異なる非対称関数であり、
前記劣化判定部は、前記関数K(p,q)及び前記関数K(q,p)によって前記押印画像の前記押印テンプレート画像に対するつぶれ度及びかすれ度を算出することを特徴とする請求項11に記載の帳票認識装置。 - 押印を含む帳票を帳票認識装置に認識させる帳票認識方法において、
帳票を光学的に走査することによって得られた帳票画像を取得するイメージ入力ステップと、
前記イメージ入力ステップによって取得された帳票画像から押印画像を検出する押印画像検出ステップと、
前記押印画像の輪郭の色を示す押印色とその他の色とを分離する背景色分離ステップと、
前記背景色分離ステップによって前記押印色が前記その他の色と分離された前記押印画像の傾きを補正する傾き補正ステップと、
前記傾き補正ステップによって傾きが補正された前記押印画像から文字列を探索し、前記探索された文字列を切り出す文字列探索ステップと、
前記文字列探索ステップによって切り出された文字列から、前記文字列を構成する各文字を切り出す文字切出ステップと、
前記文字切出ステップによって切り出された各文字を認識し、前記文字列を構成するすべての文字を認識した結果を示す文字認識結果を算出し、前記認識された各文字の信頼度を算出する文字認識ステップと、
前記文字認識ステップによって算出された文字認識結果のうち、予め指定された文字列形式に適合する文字認識結果を選択し、前記選択された各文字認識結果に対する信頼度を前記文字認識ステップによって算出された各文字の信頼度に基づいて算出する知識処理ステップと、
前記知識処理ステップによって選択された文字認識結果と当該文字認識結果の信頼度とに基づいて、前記知識処理ステップによって選択された文字認識結果を棄却するか否かを判定する棄却判定ステップと、
前記棄却判定ステップによって前記文字認識ステップによる文字認識結果が棄却された場合に、押印画像の文字を再度認識させるか否かを判定するリトライ判定ステップと、を備えることを特徴とする帳票認識方法。 - 前記帳票認識方法は、
前記文字認識ステップによって算出される文字認識結果及び前記イメージ入力ステップによって取得された帳票画像の認識結果を記録する認識結果記録ステップと、
前記イメージ入力ステップによって入力された帳票画像を、前記認識結果データベースに記録された情報に基づいて、所定の条件を満たす帳票画像ごとに分類する帳票分類ステップと、を有することを特徴とする請求項13に記載の帳票認識方法。 - 前記帳票認識装置は、同じ種類の押印画像を押印テンプレート画像と当該押印テンプレート画像に存在する文字の位置情報とを記憶する押印認識用辞書を備え、
前記帳票認識方法は、
前記押印認識用辞書を用いて、前記押印画像検出ステップによって検出された前記押印画像の種類を特定する押印種特定ステップと、
前記押印認識用辞書を用いて、前記押印種特定ステップによって種類が特定された前記押印画像に存在する文字の位置情報を取得する文字位置特定ステップと、
前記押印画像検出ステップによって検出された前記押印画像と当該押印画像と同じ種類の押印テンプレート画像とを比較することによって、前記押印画像の劣化度を判定する劣化判定ステップと、を有することを特徴とする請求項13に記載の帳票認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010143969A JP5500480B2 (ja) | 2010-06-24 | 2010-06-24 | 帳票認識装置及び帳票認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010143969A JP5500480B2 (ja) | 2010-06-24 | 2010-06-24 | 帳票認識装置及び帳票認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012008791A JP2012008791A (ja) | 2012-01-12 |
JP5500480B2 true JP5500480B2 (ja) | 2014-05-21 |
Family
ID=45539258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010143969A Active JP5500480B2 (ja) | 2010-06-24 | 2010-06-24 | 帳票認識装置及び帳票認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5500480B2 (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US9165188B2 (en) | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
JP6055297B2 (ja) * | 2012-12-07 | 2016-12-27 | 株式会社日立情報通信エンジニアリング | 文字認識装置及び方法、文字認識プログラム |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
US20140316841A1 (en) | 2013-04-23 | 2014-10-23 | Kofax, Inc. | Location-based workflows and services |
DE202014011407U1 (de) | 2013-05-03 | 2020-04-20 | Kofax, Inc. | Systeme zum Erkennen und Klassifizieren von Objekten in durch Mobilgeräte aufgenommenen Videos |
WO2015025704A1 (ja) * | 2013-08-23 | 2015-02-26 | 日本電気株式会社 | 映像処理装置、映像処理方法および映像処理プログラム |
US9386235B2 (en) | 2013-11-15 | 2016-07-05 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
JP5940615B2 (ja) * | 2014-09-09 | 2016-06-29 | 株式会社アイエスピー | 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置 |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
JP6660332B2 (ja) * | 2017-03-08 | 2020-03-11 | 富士通フロンテック株式会社 | 印鑑劣化判定プログラム、印影照合装置、印鑑劣化判定方法 |
US11062176B2 (en) | 2017-11-30 | 2021-07-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
JP7015706B2 (ja) * | 2018-02-13 | 2022-02-03 | 株式会社日立情報通信エンジニアリング | 計算機及び文書データの処理方法 |
JP6550163B1 (ja) * | 2018-03-29 | 2019-07-24 | 三井住友海上火災保険株式会社 | 文字認識装置、文字認識方法およびプログラム |
JP7209161B2 (ja) * | 2019-05-20 | 2023-01-20 | 京都電子計算株式会社 | 文字読取装置及び文字読取装置用プログラム |
JP7445364B2 (ja) * | 2019-07-04 | 2024-03-07 | 富士通フロンテック株式会社 | 画像処理プログラム、画像処理方法、及び画像処理装置 |
JP2021043500A (ja) * | 2019-09-06 | 2021-03-18 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
CN110659647B (zh) * | 2019-09-11 | 2022-03-22 | 杭州睿琪软件有限公司 | 印章图像识别方法及装置、智能发票识别设备和存储介质 |
CN111161247B (zh) * | 2019-12-30 | 2023-10-20 | 凌云光技术股份有限公司 | 用于可变码识读字符质量验证的检测方法 |
CN112037077B (zh) * | 2020-09-03 | 2024-07-09 | 平安健康保险股份有限公司 | 基于人工智能的印章识别方法、装置、设备及存储介质 |
CN112861033B (zh) * | 2021-02-04 | 2022-04-01 | 北京三快在线科技有限公司 | 一种执行业务的方法及装置 |
CN116757886B (zh) * | 2023-08-16 | 2023-11-28 | 南京尘与土信息技术有限公司 | 数据分析方法及分析装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06111066A (ja) * | 1992-09-25 | 1994-04-22 | Toshiba Corp | 印章文字読取装置 |
JPH08147466A (ja) * | 1994-11-16 | 1996-06-07 | Sanyo Electric Co Ltd | 2物体画像のずれ角度検出装置およびその方法 |
JPH08190610A (ja) * | 1995-01-12 | 1996-07-23 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
JP2000353215A (ja) * | 1999-06-11 | 2000-12-19 | Nec Corp | 文字認識装置および文字認識プログラムを記録した記録媒体 |
JP4841881B2 (ja) * | 2005-07-15 | 2011-12-21 | 富士通株式会社 | 文字認識プログラム、文字認識装置及び文字認識方法 |
JP4861845B2 (ja) * | 2007-02-05 | 2012-01-25 | 富士通株式会社 | テロップ文字抽出プログラム、記録媒体、方法及び装置 |
-
2010
- 2010-06-24 JP JP2010143969A patent/JP5500480B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012008791A (ja) | 2012-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5500480B2 (ja) | 帳票認識装置及び帳票認識方法 | |
Eskenazi et al. | A comprehensive survey of mostly textual document segmentation algorithms since 2008 | |
US7120318B2 (en) | Automatic document reading system for technical drawings | |
US8442319B2 (en) | System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking | |
KR101515256B1 (ko) | 동적 문서 식별 프레임워크를 사용한 문서 검증 | |
KR101446376B1 (ko) | 고유 이미지 프로세스에 따른 미지 문서의 식별 및 검증 | |
US8467614B2 (en) | Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images | |
Gebhardt et al. | Document authentication using printing technique features and unsupervised anomaly detection | |
CN110766014A (zh) | 票据信息定位方法、系统及计算机可读存储介质 | |
EP3258422A1 (en) | Character segmentation and recognition method | |
US8587685B2 (en) | Method and apparatus for retrieving label | |
Antonacopoulos et al. | ICDAR2015 competition on recognition of documents with complex layouts-RDCL2015 | |
Garz et al. | Layout analysis for historical manuscripts using sift features | |
Diem et al. | Text line detection for heterogeneous documents | |
JP5674615B2 (ja) | 文字認識装置及び文字認識方法 | |
Caldeira et al. | Industrial optical character recognition system in printing quality control of hot-rolled coils identification | |
US20140268250A1 (en) | Systems and methods for receipt-based mobile image capture | |
CN112989921A (zh) | 一种目标图像信息识别方法及其装置 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
Mandal et al. | Signature segmentation from machine printed documents using contextual information | |
Shi et al. | An invoice recognition system using deep learning | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
Salah et al. | Adaptive detection of missed text areas in OCR outputs: application to the automatic assessment of OCR quality in mass digitization projects | |
CN116994269A (zh) | 一种图像文档中印章相似度比对方法及对比系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120316 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130125 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20130809 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5500480 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |