JP6550163B1 - 文字認識装置、文字認識方法およびプログラム - Google Patents
文字認識装置、文字認識方法およびプログラム Download PDFInfo
- Publication number
- JP6550163B1 JP6550163B1 JP2018065339A JP2018065339A JP6550163B1 JP 6550163 B1 JP6550163 B1 JP 6550163B1 JP 2018065339 A JP2018065339 A JP 2018065339A JP 2018065339 A JP2018065339 A JP 2018065339A JP 6550163 B1 JP6550163 B1 JP 6550163B1
- Authority
- JP
- Japan
- Prior art keywords
- field
- dictionary
- fields
- character
- year
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 25
- 230000006870 function Effects 0.000 claims abstract description 21
- 230000008859 change Effects 0.000 claims description 2
- 238000007689 inspection Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 7
- 230000010365 information processing Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
特許文献1 特開2018−36998号
Claims (9)
- 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、
証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、
前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と、
前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と
を備え、前記文字推定部は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定部と、前記第1の推定部が推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部と、を含む、文字認識装置。 - 前記複数のフィールドのいずれかは住所のフィールドであり、
前記住所のフィールドに対応する前記辞書には、都道府県名、市区町村名および地域名の可能な組み合わせが階層化されて登録されており、
前記文字推定部は、都道府県名、市区町村名および地域名ごとに前記文字列を推定する請求項1に記載の文字認識装置。 - 前記住所のフィールドに対応する前記辞書には、行政上の変更があった都道府県名、市区町村名および地域名について、旧名称と現名称とが対応付けられて登録されており、
前記文字推定部は、推定した文字列が前記旧名称である場合には前記旧名称に対応付けられている前記現名称を少なくとも出力する請求項2に記載の文字認識装置。 - 前記複数のフィールドのいずれかは年を含むフィールドであり、
前記年を含むフィールドに対応する前記辞書には、西暦と元号とが対応付けられて登録されており、
前記文字推定部は、推定した文字列が前記元号である場合には前記元号に対応付けられている前記西暦による年を少なくとも出力する請求項1から3のいずれか1項に記載の文字認識装置。 - 前記複数のフィールドのいずれかは年を含むフィールドであり、他のいずれかは前記年に関連する内容を含むフィールドであり、
前記年に関連する内容を含むフィールドに対応する前記辞書には、前記年および前記内容の組み合わせが登録されており、
前記文字推定部は、前記年を含むフィールドで推定した前記年を用いて、前記年に関連する内容を含むフィールドに対応する前記辞書を参照する請求項1から4のいずれか1項に記載の文字認識装置。 - 前記年を含むフィールドは車検の初度登録の日付のフィールドであり、前記年に関連する内容を含むフィールドは車の型式のフィールドである請求項5に記載の文字認識装置。
- 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、
証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、
前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と、
前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と、を備え、
前記複数のフィールドのいずれかは年を含むフィールドであり、他のいずれかは前記年に関連する内容を含むフィールドであり、
前記年に関連する内容を含むフィールドに対応する前記辞書には、前記年および前記内容の組み合わせが登録されており、
前記文字推定部は、前記年を含むフィールドで推定した前記年を用いて、前記年に関連する内容を含むフィールドに対応する前記辞書を参照する、文字認識装置。 - 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、
前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されており、
証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定段階と、
前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定段階と
を備える、前記文字推定段階は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定段階と、前記第1の推定段階で推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定段階と、を含む、文字認識方法。 - 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、
前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されている、
コンピュータに
証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定手順、および、
前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定手順
を実行させ、前記文字推定手順は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定手順と、前記第1の推定手順が推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定手順と、を含む、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018065339A JP6550163B1 (ja) | 2018-03-29 | 2018-03-29 | 文字認識装置、文字認識方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018065339A JP6550163B1 (ja) | 2018-03-29 | 2018-03-29 | 文字認識装置、文字認識方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6550163B1 true JP6550163B1 (ja) | 2019-07-24 |
JP2019175317A JP2019175317A (ja) | 2019-10-10 |
Family
ID=67390315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018065339A Active JP6550163B1 (ja) | 2018-03-29 | 2018-03-29 | 文字認識装置、文字認識方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6550163B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021056796A (ja) * | 2019-09-30 | 2021-04-08 | トッパン・フォームズ株式会社 | 構造認識システム、構造認識装置、構造認識方法、及びプログラム |
CN116580402A (zh) * | 2023-05-26 | 2023-08-11 | 读书郎教育科技有限公司 | 一种词典笔的文本识别方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2982244B2 (ja) * | 1990-07-26 | 1999-11-22 | 株式会社エヌ・ティ・ティ・データ | 文字認識後処理方式 |
JP2887171B2 (ja) * | 1990-11-30 | 1999-04-26 | 株式会社ピーエフユー | カナ住所知識処理装置 |
JPH0546815A (ja) * | 1991-08-13 | 1993-02-26 | Oki Electric Ind Co Ltd | 光学式文字読取装置における住所単語照合方法 |
JP2002041717A (ja) * | 2000-07-25 | 2002-02-08 | Hiroshi Goto | 車輛管理記録簿の作成方法 |
JP2005039801A (ja) * | 2003-06-27 | 2005-02-10 | Canon Inc | 画像処理システム、画像処理方法、及びプログラム |
JP5204448B2 (ja) * | 2007-09-20 | 2013-06-05 | 株式会社Pfu | 証明書読取認識装置 |
JP5500480B2 (ja) * | 2010-06-24 | 2014-05-21 | 株式会社日立情報通信エンジニアリング | 帳票認識装置及び帳票認識方法 |
JP6887233B2 (ja) * | 2016-09-02 | 2021-06-16 | 株式会社アイリックコーポレーション | 保険証券画像解析システム、記載内容解析装置、携帯端末および携帯端末用のプログラム |
-
2018
- 2018-03-29 JP JP2018065339A patent/JP6550163B1/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021056796A (ja) * | 2019-09-30 | 2021-04-08 | トッパン・フォームズ株式会社 | 構造認識システム、構造認識装置、構造認識方法、及びプログラム |
JP7365835B2 (ja) | 2019-09-30 | 2023-10-20 | Toppanエッジ株式会社 | 構造認識システム、構造認識装置、構造認識方法、及びプログラム |
CN116580402A (zh) * | 2023-05-26 | 2023-08-11 | 读书郎教育科技有限公司 | 一种词典笔的文本识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2019175317A (ja) | 2019-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109766885B (zh) | 一种文字检测方法、装置、电子设备及存储介质 | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
JP2015536000A (ja) | 手書き入力の進捗状況の表示 | |
JP2009276709A (ja) | 学習支援システム、プログラムおよび学習支援方法 | |
JP6600973B2 (ja) | 文字認識装置、文字認識処理システム、およびプログラム | |
JP6550163B1 (ja) | 文字認識装置、文字認識方法およびプログラム | |
KR20090023417A (ko) | 의심스런 인식 결정을 식별하기 위한 방법 및 컴퓨터 판독가능 매체 | |
TW201544976A (zh) | 自然語言處理系統、自然語言處理方法、及自然語言處理程式 | |
JP2012094117A (ja) | アラビア語テキストに発音区別符号を付与するための方法およびシステム | |
KR101016544B1 (ko) | 단어 인식 방법 및 기록 매체 | |
JP5634972B2 (ja) | テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム | |
JP3986708B2 (ja) | 文字認識誤り修正装置および文字認識誤り修正プログラムを記録したコンピュータで読取可能な記録媒体 | |
CN112364630B (zh) | 证照内容纠错方法、装置及系统 | |
JP2008027133A (ja) | 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体 | |
CN110647785B (zh) | 一种输入文本的准确性的识别方法、装置及电子设备 | |
JP2014078168A (ja) | 文字認識装置及びプログラム | |
CN112070092A (zh) | 一种验证码参数的获取方法及装置 | |
JP2022095391A (ja) | 情報処理装置、及び情報処理プログラム | |
CN116959000B (zh) | 笔迹识别方法、装置、计算机设备及存储介质 | |
JP7315176B2 (ja) | セリフ分析プログラム、セリフ分析方法、およびセリフ分析システム | |
JP2019168935A (ja) | 入力装置、入力方法、およびプログラム | |
JP7015706B2 (ja) | 計算機及び文書データの処理方法 | |
JP7410532B2 (ja) | 文字判定装置及び文字判定プログラム | |
JP2006031099A (ja) | 文字認識をコンピュータに行なわせるためのコンピュータ実行可能なプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180329 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6550163 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R157 | Certificate of patent or utility model (correction) |
Free format text: JAPANESE INTERMEDIATE CODE: R157 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |