[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6550163B1 - 文字認識装置、文字認識方法およびプログラム - Google Patents

文字認識装置、文字認識方法およびプログラム Download PDF

Info

Publication number
JP6550163B1
JP6550163B1 JP2018065339A JP2018065339A JP6550163B1 JP 6550163 B1 JP6550163 B1 JP 6550163B1 JP 2018065339 A JP2018065339 A JP 2018065339A JP 2018065339 A JP2018065339 A JP 2018065339A JP 6550163 B1 JP6550163 B1 JP 6550163B1
Authority
JP
Japan
Prior art keywords
field
dictionary
fields
character
year
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018065339A
Other languages
English (en)
Other versions
JP2019175317A (ja
Inventor
英樹 川津
英樹 川津
伸矢 近田
伸矢 近田
哲平 岡
哲平 岡
壮平 岩藤
壮平 岩藤
祥 居合
祥 居合
大田 佳宏
佳宏 大田
昂平 安田
昂平 安田
紗弓 千葉
紗弓 千葉
公陽 衣笠
公陽 衣笠
鈴木 良尚
良尚 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arithmer Inc
Original Assignee
Arithmer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=67390315&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6550163(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Arithmer Inc filed Critical Arithmer Inc
Priority to JP2018065339A priority Critical patent/JP6550163B1/ja
Application granted granted Critical
Publication of JP6550163B1 publication Critical patent/JP6550163B1/ja
Publication of JP2019175317A publication Critical patent/JP2019175317A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】一般的なOCR技術は候補となる文字種類が多いので文字の推定に時間がかかるうえに、互いに似た文字間で正しく識別されているとはいえない。【解決手段】文字認識装置であって、証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、証券の画像データを取得し、位置格納部を参照することにより、複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書を格納する辞書格納部と、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する文字推定部とを備える。【選択図】図1

Description

本発明は、文字認識装置、文字認識方法およびプログラムに関する。
保険証券の画像を電子データとして受信し、文字情報を抽出する保険証券画像解析システムがある(特許文献1参照)。当該特許文献においては、文字情報の抽出に関して一般的なOCR技術を用いることができるとだけ記載されている。
特許文献1 特開2018−36998号
しかしながら、漢字が使われている場合など、一般的なOCR技術は候補となる文字種類が多いので文字の推定に時間がかかるうえに、互いに似た文字間で正しく識別されているとはいえない。
上記課題を解決するために、本発明の第1の態様においては、文字認識装置であって、証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、証券の画像データを取得し、位置格納部を参照することにより、複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書を格納する辞書格納部と、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する文字推定部とを備える。
本発明の第2の態様においては、文字認識方法であって、証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書が辞書格納部に格納されており、証券の画像データを取得し、位置格納部を参照することにより、複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定段階と、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する文字推定段階とを備える。
本発明の第3の態様においては、プログラムであって、証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書が辞書格納部に格納されている、コンピュータに証券の画像データを取得し、位置格納部を参照することにより、複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定手順、および、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する文字推定手順を実行させる。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本実施形態による文字認識装置10の機能ブロック図を示す。 証券20の一例を概略的に示す。 証券40の他の例を概略的に示す。 位置格納部120に格納されている位置情報122の一例を示す。 辞書格納部140に格納されている辞書の一例を示す。 住所の辞書142の一例を示す。 年月日の辞書144の一例を示す。 型式の辞書146の一例を示す。 文字認識装置10の動作フローを示す。 図9の動作フローのステップS16の一例を示す。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本実施形態による文字認識装置10の機能ブロック図を示す。文字認識装置10は、証券20に手書きまたは印字された文字を認識して文字データとして出力する。なお、ここで文字には、ひらがな、カタカナ、漢字、アラビア数字、アルファベットなどが含まれ得る。
文字認識装置10は例えばパーソナルコンピュータ(PC)などの情報処理機器である。文字認識装置10は、画像取得部110と、位置格納部120と、フィールド特定部130と、文字推定部160と、辞書格納部140とを有する。
画像取得部110は、証券20の画像データを取得する。画像取得部110がカメラ機能を有していて、証券20を直接撮像して画像データを取得する。これに代えてまたはこれに加えて、画像取得部110は、スキャナや他の情報端末と通信してそれらから証券20の画像データを取得してもよい。
位置格納部120は、証券20上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納している。
フィールド特定部130は、位置格納部120を参照することにより、画像取得部110が取得した証券20の画像データのうち、複数のフィールドのそれぞれに対応する画像データを特定する。
辞書格納部140は、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書を格納している。
文字推定部160は、第1の推定部170と第2の推定部180とを有する。文字推定部160は、第1の推定部170および第2の推定部180を用いて、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部140に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する。文字推定部160はさらに推定した文字列を顧客データベース70に格納したり、表示装置80に表示したりする。
図2は、証券20の一例を概略的に示す。証券20は、特定の保険会社「○×損害保険」の自動車保険証券である。証券20には、ロゴマークなどのマーク21が印刷されている。
証券20はさらに、文字が記載された、氏名フィールド22、住所フィールド24、保険期間フィールド26、車台番号フィールド28、登録番号フィールド30、型式フィールド32および初度登録フィールド34を有する。これらのフィールドは、文字認識装置10で文字を認識するフィールドを例示したものであって、証券20は他にも文字が記載されたフィールドを有してもよい。さらに、文字認識装置10も他のフィールドの文字を認識してもよいし、例示した上記フィールドのすべてについて文字を認識しなければならないわけではない。
図3は、証券40の他の例を概略的に示す。証券40は、証券20とは異なる保険会社「△□火災保険株式会社」の自動車保険証券である。証券40にもマーク41が印刷されている。
証券40も、証券20と同様に、文字が記載された、氏名フィールド42、住所フィールド44、保険期間フィールド46、車台番号フィールド48、登録番号フィールド50、型式フィールド52および初度登録フィールド54を有する。しかしながら、証券40における各フィールドの位置や大きさは、証券20とは異なっている場合がある。
図4は、位置格納部120に格納されている位置情報122の一例を示す。位置情報122は、証券テンプレートIDごとに、複数のフィールドの各フィールド名と当該フィールドの始点位置と終点位置とが対応付けて格納されている。さらに証券テンプレートIDごとに、当該証券のマークの画像が格納されている。ここでフィールド名は複数のフィールドのいずれであるかを特定する情報の例となっている。
図4の例では証券テンプレートID「001」について、フィールド名「氏名」の位置が始点の座標(X11,Y11)および終点の座標(X12,Y12)で表されている。これにより、フィールド名「氏名」のフィールドは、これら始点と終点とで指定される矩形の領域である。
これらの座標は、証券全体を予め定められた大きさに正規化したときの位置であることが好ましい。ただし、フィールドの位置の指定方法は図4に示す例に限られず、他の方法が用いられてもよい。
位置情報122は文字認識装置10の文字認識に先立って、位置格納部120に格納される。新たなフォーマットの証券が発行された場合には、文字認識装置10の使用者等により、当該証券についての位置情報122が位置格納部120に追加されることが好ましい。
以上の通り、位置情報122は証券テンプレートごとに複数のフィールドのそれぞれを特定する位置の情報が格納されている。よって、図2および図3に示したように、互いに異なるレイアウトの証券20、40においても、それぞれにおける氏名フィールド22、42等の各フィールドの位置が特定できる。
図5は、辞書格納部140に格納されている辞書の一例を示す。辞書格納部140には、フィールド名に対応した辞書が格納されている。これらのフィールド名は、位置格納部120に格納されているフィールド名に対応している。
各辞書には対応するフィールドに含まれ得る単語が登録されている。各辞書は文字認識装置10の文字認識に先立って、辞書格納部140に格納される。
図5の例において、フィールド名「氏名」には「氏名の辞書」が対応付けられている。ただし、フィールド名と辞書とは1対1に対応していなければならないわけではない。フィールドに含まれ得る単語が同じまたは類似する場合には共通の辞書を用いてもよい。図5の例においては、フィールド名「保険期間」と「初度登録」とは、そのフィールドに含まれる単語が年月日で共通しているので、同じ「年月日の辞書」が対応付けられている。いいかえれば、保険期間フィールド46と初度登録フィールド54に対しては辞書を共用する。
図6は、住所の辞書142の一例を示す。住所の辞書142には、都道府県名、市区町村名および地域名の可能な組み合わせが階層化されて登録されている。すなわち、各都道府県名の下位階層には、当該都道府県に属する市区町村名が含まれる。同様に、各市区町村名の下位階層には、当該市区町村に属する地域名が含まれる。
住所の辞書142にはさらに、行政上の変更があった都道府県名、市区町村名および地域名について、旧名称と現名称とが対応付けられて登録されている。図6の例において、「東京都」の「田無市」が他の市との合併で「西東京市」へ変更されたことに対応して「田無市→西東京市」が登録されている。市区町村名に記号「→」が含まれることはないから、当該辞書において記号「→」がある単語については、当該記号よりも前の文字列が旧名称であり、当該記号よりも後の文字列を新名称であるというルールでこの辞書を用いることができる。
図7は、年月日の辞書144の一例を示す。年月日の辞書144には、年、月および日が登録されている。年には元号と西暦とが含まれており、これらは対応付けられている。一方、年、月および日は様々な組み合わせが有り得るので、この例ではそれらの対応付けはされていない。ただし、特定の具体的な日を考えた場合に、当該日はある月に属しており、当該月はある年に属している。その観点から、年月日の辞書144においても、年、月および日がこの順に階層化されているともいえる。
「西暦」については自動車保険の保険期間および初度登録に関するものであるという性質上、現在からみて未来に数年分、過去に数十年分が登録されていることが好ましい。「元号」については「西暦」に登録されている年に対応する分が対応づけられて格納されていることが好ましい。図7の例では元号として「平成」と「昭和」が登録されている。
「月」として取り得る文字は数字の1から12なので、年月日の辞書144にも「1」から「12」が登録されている。同様に、「日」として取り得る文字は数字の1から31なので、年月日の辞書144にも「1」から「31」が登録されている。
図8は、型式の辞書146の一例を示す。型式の辞書146は、初度登録の年に対応付けられて型式が登録されている。図8の例では初度登録は西暦で示されており、その年に販売をしていた自動車の型式が登録されている。その観点から、型式は年に関連する内容を含む一例になっている。
図9は、文字認識装置10の動作フローを示す。まず、画像取得部110が証券20の画像データを取得する(S10)。
フィールド特定部130は、位置格納部120を参照して証券20を特定する(S12)。この場合に、フィールド特定部130は、画像取得部110が取得した画像データに含まれているマーク21を、位置格納部120に格納されているマークとテンプレートマッチングする。これにより、フィールド特定部130は当該画像データが、位置格納部120に格納されている証券テンプレートIDで特定されるいずれの証券であるかを特定する。
さらにフィールド特定部130は、位置格納部120を参照することにより、証券20の画像データのうち、複数のフィールドのそれぞれに対応する画像データを特定する(S14)。この場合に、フィールド特定部130は、ステップS12で特定した証券テンプレートの位置情報122に基づいて、氏名フィールド22、住所フィールド24、保険期間フィールド26、車台番号フィールド28、登録番号フィールド30、型式フィールド32および初度登録フィールド34の位置を特定し、当該位置に対応する画像データを、それぞれのフィールドの画像データとして特定する。
文字推定部160は、あるフィールドの画像データについて、フィールドに記載されている文字列を、学習機能と、辞書格納部140に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する(S16)。ステップS16については後述する。
ステップS16を、ステップS14で特定した全てのフィールドで実行し(S18)、当該動作フローを終了する。ここで、文字列を推定するフィールドの順序は、例えば位置情報122のフィールド名の記載順であるが、これに限られない。ただし、辞書のいずれかが他のフィールドの推定の結果を用いるものであるときは、当該他のフィールドが先に推定されていることが好ましい。例えば、型式の辞書146は初度登録に対応付けて型式が登録されているので、型式フィールド32の推定よりも前に、初度登録フィールド34の推定が実行される。
図10は、図9の動作フローのステップS16の一例を示す。ステップS16において、文字推定部160の第1の推定部170は、文字数nを1にリセットする(S101)。
第1の推定部170は、当該フィールドの画像データに記載されているn番目の文字の候補を、学習機能を用いて推定する(S103)。学習機能は、図9の動作フローの前に予め学習されていることが好ましい。この場合に、フィールドごとに当該フィールドに含まれ得る単語を教師データとして学習しておくことが好ましい。
学習機能の一例として、リカレント・ニューラル・ネットワーク(RNN)が挙げられる。RNNは(n−1)番目までの文字列の中間層をn番目の入力と併せて学習に用いることで、文字列の順番も考慮したネットワーク構造となるという観点から、有り得る単語がある程度限られる本実施形態の用途に適している。
文字推定部160の第2の推定部180は辞書格納部140に格納されている、当該フィールドに対応付けられた辞書に文字数nの単語があるか否かを判断する(S107)。この場合に、参照すべき辞書が住所の辞書142のように階層化されている場合には、デフォルトでは最上位の階層の単語について判断し、後述するステップS121で下位の階層が指定される。
当該辞書に文字数nの単語がある場合に(S107:Yes)、第2の推定部180はここまでに推定したn番目までの文字列と、当該辞書の文字数nの単語との類似度を単語ごとに計算する(S111)。辞書の中に、類似度が閾値以上となる単語があった場合に(S111:Yes)、第2の推定部180はその単語の文字データを、推定した文字列として顧客データベース70及び表示装置80の少なくとも一方に出力する(S113)。
ステップS107とS111の判断がそれぞれNoの場合に、第2の推定部180は文字数nを1カウントアップする(S115)。その結果、nがnxを超えたか否かを第2の推定部180が判断する(S117)。ここでnxは参照すべき辞書(さらに、辞書が階層化されている場合には参照すべき階層)に登録されている単語の最大の文字数である。
ステップS117の判断がNoの場合には処理をステップS103に戻す。これにより先の類似度の判断に用いた単語よりも文字数が1つ多い単語との類似度を判断することができる。
一方、ステップS117の判断がYesの場合には、それまでに推定した文字列の文字データを顧客データベース70等に出力する(S119)。同様に、ステップS105の判断がNoの場合にも、それまでに推定した文字列の文字データを顧客データベース70等に出力する(S125)。これらにより、辞書の単語とは類似度が閾値以上にならなかった場合でも、推定した文字列が出力されるので、その文字列に基づいて後から使用者等が修正をすることができる。
ステップS113、S119およびS125の後に、第2の推定部180は参照している辞書に下位階層があるか否かを判断する(S121)。下位階層がない場合には(S121:No)、処理を図10のステップS18に進める。下位階層がある場合には(S121:Yes)、処理をステップS101に戻して文字数nを1にリセットしてから当該階層での文字列を推定する。
以上のステップS16のフローを住所フィールド24、44に用いた場合には、都道府県、市区町村および地域ごとに、この順序で文字列が推定される。まず都道府県名は約50個に限られているので、ステップS109で第2の推定部180が住所の辞書142における都道府県名を単語として類似度を計算することにより、早くかつ正確に文字列を推定することができる。
さらに、都道府県、市区町村および地域が階層化されているので、市区町村名を推定する場合に、すでに推定された都道府県に属する市区町村名を単語として類似度を計算することで、早くかつ正確に文字列を推定することができる。例えば「荻」と「萩」とは視覚的に似ているが、都道府県名としてすでに「東京都」が推定されている場合には「東京都」に属する市区町村名に「荻」が含まれている「荻窪」は登録されているが「萩」を含む単語は登録されていない。よって、「荻」が出力される可能性が高まる。
また、住所の辞書142には旧名称と現名称とが対応付けて登録されている。よって、第2の推定部180が住所の辞書142を参照することにより、旧名称と現名称のどちらが住所フィールド24、44に記載されていたとしてもより正確に文字列を推定することができる。
さらに、第2の推定部180は、推定した文字列の、旧名称との類似度が閾値以上であった場合に、ステップS113において旧名称に代えてまたは旧名称に併記して現名称を出力してもよい。例えば第2の推定部180が推定した文字列と住所の辞書142の「田無市」の類似度が閾値以上であった場合に、住所の辞書142で「田無市」に対応付けて格納された「西東京市」に変換して出力してもよいし、「西東京市(旧 田無市)」または「田無市(現 西東京市)」のように併記した出力にしてもよい。
上記ステップS16のフローを保険期間フィールド26、46および初度登録フィールド34、54に用いた場合には、年、月および日ごとに、この順序で文字列が推定される。ここで、年月日の辞書144には年として元号と西暦とが登録されている。よって保険期間フィールド26、46および初度登録フィールド34、54にどちらの表記による文字列が記載されていたとしても、第2の推定部180が年月日の辞書144を参照することにより、正確に文字列を推定することができる。
さらに、第2の推定部180は、推定した文字列の、元号との類似度が閾値以上であった場合に、ステップS113において元号に代えてまたは元号に併記して西暦を出力してもよい。例えば第2の推定部180が推定した文字列と年月日の辞書144の「平成2」の類似度が閾値以上であった場合に、年月日の辞書144の「平成30」に対応付けて格納された「2018」に変換して出力してもよいし、「2018(平成30)」または「平成30(2018)」のように併記した出力にしてもよい。
また、月および日として有り得る文字は限られており、それらが年月日の辞書144に登録されている。よって、第2の推定部180が、ステップS109で年月日の辞書144で月および日として登録されている数字を単語として類似度を計算することにより、早くかつ正確に文字列を推定することができる。
上記ステップS16のフローを型式フィールド32、52に用いた場合に、それに先立って初度登録フィールド34、54で初度登録の年が推定されていれば、これを用いる。この場合にステップS109において、第2の推定部180は、第1の推定部170が推定した文字列に対して、すでに推定された初度登録の年に対応付けて型式の辞書146に登録されている型式の単語のそれぞれとの類似度を算出する。これにより、早くかつ正確に型式の文字列を推定することができる。
以上、本実施形態の文字認識装置10によれば、証券20、40の各フィールドに対応した辞書と学習機能とを組み合わせて用いることにより、早くかつ正確に各フィールドに記載されている文字列を認識することができる。また、同一の証券20の各フィールドで推定した文字列を、当該証券20を識別するIDまたは顧客を識別するIDに対応付けて顧客データベース70に出力することにより、証券20に記載された文字内容を文字データとして管理することができる。
なお、上記ステップS109の類似度の計算の一例として、文字間距離(レーベンシュタイン距離とも呼ばれる)を用いることが挙げられる。この場合にはステップS111の「類似度が閾値以上」であるか否かとは、「文字間距離が閾値より短い」か否か、ということになる。また、いずれの類似度を用いた場合であっても、ステップS111において「類似度が閾値以上」であるかどうかを判断することに代えて、類似度を計算した単語のうちで最も類似度が高かった単語を特定してもよい。
さらに、ステップS103において第1の推定部170が文字列の候補を複数推定した場合に、候補のそれぞれについて、第2の推定部180がステップS109およびS111の類似度に関する処理を実行してもよい。その場合にもステップS111において、類似度が閾値を超えかどうかを判断してもよいし、類似度を計算した単語および文字列のうちで最も類似度が高かった単語および文字列を特定してもよい。
上記実施形態では、学習機能としてRNNを例示したが学習機能はこれに限られない。他の学習機能、例えば、畳み込みニューラルネットワーク(CNN)などの他のニューラルネットワークや、ニューラルネットワーク以外の、サポートベクターマシン、遺伝的プログラミング等が用いられてもよい。
上記実施形態の住所の辞書142において、旧名称と現名称とは記号「→」で対応付けられているが、対応付けの方法はこれに限られない。他の例として、住所の辞書142に旧名称と現名称の列を設けて、それぞれの列に名称を登録してもよい。その場合には偏向のない名称に対しては現名称の列に登録をして旧名称の列には無効な値を登録しておいてもよい。
なお、文字認識装置10は、一般的な構成の情報処理装置において、文字認識装置10の各部の動作を規定したソフトウエア又はプログラムを起動することにより実現されてよい。文字認識装置10として用いられる情報処理装置は、CPU等のプロセッサ、ROM、RAM、通信インターフェースなどを有するデータ処理装置と、キーボード、タッチパネル、マイク、GPS情報取得装置、加速度センサ、ジャイロセンサなどの入力装置と、表示装置、スピーカ、振動装置などの出力装置と、メモリ、HDDなどの記憶装置とを備えてよい。データ処理装置又は記憶装置は、上記のソフトウエア又はプログラムを記憶してよい。上記のソフトウエア又はプログラムは、プロセッサによって実行されることにより、上記の情報処理装置に、当該命令又はプログラムによって規定された動作を実行させる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
10 文字認識装置、20、40 証券、21、41 マーク、22、42 氏名フィールド、24、44 住所フィールド、26、46 保険期間フィールド、28、48 車台番号フィールド、30、50 登録番号フィールド、32、52 型式フィールド、34、54 初度登録フィールド、70 顧客データベース、80 表示装置、110 画像取得部、120 位置格納部、122 位置情報、130 フィールド特定部、140 辞書格納部、142 住所の辞書、144 年月日の辞書、146 型式の辞書、160 文字推定部、170 第1の推定部、180 第2の推定部

Claims (9)

  1. 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、
    証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、
    前記複数のフィールドを特定する情報のそれぞれに対応し、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と、
    前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と
    を備え、前記文字推定部は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定部と、前記第1の推定部が推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定部と、を含む、文字認識装置。
  2. 前記複数のフィールドのいずれかは住所のフィールドであり、
    前記住所のフィールドに対応する前記辞書には、都道府県名、市区町村名および地域名の可能な組み合わせが階層化されて登録されており、
    前記文字推定部は、都道府県名、市区町村名および地域名ごとに前記文字列を推定する請求項に記載の文字認識装置。
  3. 前記住所のフィールドに対応する前記辞書には、行政上の変更があった都道府県名、市区町村名および地域名について、旧名称と現名称とが対応付けられて登録されており、
    前記文字推定部は、推定した文字列が前記旧名称である場合には前記旧名称に対応付けられている前記現名称を少なくとも出力する請求項に記載の文字認識装置。
  4. 前記複数のフィールドのいずれかは年を含むフィールドであり、
    前記年を含むフィールドに対応する前記辞書には、西暦と元号とが対応付けられて登録されており、
    前記文字推定部は、推定した文字列が前記元号である場合には前記元号に対応付けられている前記西暦による年を少なくとも出力する請求項1からのいずれか1項に記載の文字認識装置。
  5. 前記複数のフィールドのいずれかは年を含むフィールドであり、他のいずれかは前記年に関連する内容を含むフィールドであり、
    前記年に関連する内容を含むフィールドに対応する前記辞書には、前記年および前記内容の組み合わせが登録されており、
    前記文字推定部は、前記年を含むフィールドで推定した前記年を用いて、前記年に関連する内容を含むフィールドに対応する前記辞書を参照する請求項1からのいずれか1項に記載の文字認識装置。
  6. 前記年を含むフィールドは車検の初度登録の日付のフィールドであり、前記年に関連する内容を含むフィールドは車の型式のフィールドである請求項に記載の文字認識装置。
  7. 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、
    証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、
    前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と、
    前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と、を備え、
    前記複数のフィールドのいずれかは年を含むフィールドであり、他のいずれかは前記年に関連する内容を含むフィールドであり、
    前記年に関連する内容を含むフィールドに対応する前記辞書には、前記年および前記内容の組み合わせが登録されており、
    前記文字推定部は、前記年を含むフィールドで推定した前記年を用いて、前記年に関連する内容を含むフィールドに対応する前記辞書を参照する、文字認識装置。
  8. 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、
    前記複数のフィールドを特定する情報のそれぞれに対応し、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されており、
    証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定段階と、
    前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定段階と
    を備える、前記文字推定段階は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定段階と、前記第1の推定段階で推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定段階と、を含む、文字認識方法。
  9. 証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、
    前記複数のフィールドを特定する情報のそれぞれに対応し、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されている、
    コンピュータに
    証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定手順、および、
    前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定手順
    を実行させ、前記文字推定手順は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第1の推定手順と、前記第1の推定手順が推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第2の推定手順と、を含む、プログラム。
JP2018065339A 2018-03-29 2018-03-29 文字認識装置、文字認識方法およびプログラム Active JP6550163B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018065339A JP6550163B1 (ja) 2018-03-29 2018-03-29 文字認識装置、文字認識方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018065339A JP6550163B1 (ja) 2018-03-29 2018-03-29 文字認識装置、文字認識方法およびプログラム

Publications (2)

Publication Number Publication Date
JP6550163B1 true JP6550163B1 (ja) 2019-07-24
JP2019175317A JP2019175317A (ja) 2019-10-10

Family

ID=67390315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018065339A Active JP6550163B1 (ja) 2018-03-29 2018-03-29 文字認識装置、文字認識方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6550163B1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021056796A (ja) * 2019-09-30 2021-04-08 トッパン・フォームズ株式会社 構造認識システム、構造認識装置、構造認識方法、及びプログラム
CN116580402A (zh) * 2023-05-26 2023-08-11 读书郎教育科技有限公司 一种词典笔的文本识别方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2982244B2 (ja) * 1990-07-26 1999-11-22 株式会社エヌ・ティ・ティ・データ 文字認識後処理方式
JP2887171B2 (ja) * 1990-11-30 1999-04-26 株式会社ピーエフユー カナ住所知識処理装置
JPH0546815A (ja) * 1991-08-13 1993-02-26 Oki Electric Ind Co Ltd 光学式文字読取装置における住所単語照合方法
JP2002041717A (ja) * 2000-07-25 2002-02-08 Hiroshi Goto 車輛管理記録簿の作成方法
JP2005039801A (ja) * 2003-06-27 2005-02-10 Canon Inc 画像処理システム、画像処理方法、及びプログラム
JP5204448B2 (ja) * 2007-09-20 2013-06-05 株式会社Pfu 証明書読取認識装置
JP5500480B2 (ja) * 2010-06-24 2014-05-21 株式会社日立情報通信エンジニアリング 帳票認識装置及び帳票認識方法
JP6887233B2 (ja) * 2016-09-02 2021-06-16 株式会社アイリックコーポレーション 保険証券画像解析システム、記載内容解析装置、携帯端末および携帯端末用のプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021056796A (ja) * 2019-09-30 2021-04-08 トッパン・フォームズ株式会社 構造認識システム、構造認識装置、構造認識方法、及びプログラム
JP7365835B2 (ja) 2019-09-30 2023-10-20 Toppanエッジ株式会社 構造認識システム、構造認識装置、構造認識方法、及びプログラム
CN116580402A (zh) * 2023-05-26 2023-08-11 读书郎教育科技有限公司 一种词典笔的文本识别方法及装置

Also Published As

Publication number Publication date
JP2019175317A (ja) 2019-10-10

Similar Documents

Publication Publication Date Title
CN109766885B (zh) 一种文字检测方法、装置、电子设备及存储介质
US20190294912A1 (en) Image processing device, image processing method, and image processing program
US10963717B1 (en) Auto-correction of pattern defined strings
JP2015536000A (ja) 手書き入力の進捗状況の表示
JP2009276709A (ja) 学習支援システム、プログラムおよび学習支援方法
JP6600973B2 (ja) 文字認識装置、文字認識処理システム、およびプログラム
JP6550163B1 (ja) 文字認識装置、文字認識方法およびプログラム
KR20090023417A (ko) 의심스런 인식 결정을 식별하기 위한 방법 및 컴퓨터 판독가능 매체
TW201544976A (zh) 自然語言處理系統、自然語言處理方法、及自然語言處理程式
JP2012094117A (ja) アラビア語テキストに発音区別符号を付与するための方法およびシステム
KR101016544B1 (ko) 단어 인식 방법 및 기록 매체
JP5634972B2 (ja) テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム
JP3986708B2 (ja) 文字認識誤り修正装置および文字認識誤り修正プログラムを記録したコンピュータで読取可能な記録媒体
CN112364630B (zh) 证照内容纠错方法、装置及系统
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
CN110647785B (zh) 一种输入文本的准确性的识别方法、装置及电子设备
JP2014078168A (ja) 文字認識装置及びプログラム
CN112070092A (zh) 一种验证码参数的获取方法及装置
JP2022095391A (ja) 情報処理装置、及び情報処理プログラム
CN116959000B (zh) 笔迹识别方法、装置、计算机设备及存储介质
JP7315176B2 (ja) セリフ分析プログラム、セリフ分析方法、およびセリフ分析システム
JP2019168935A (ja) 入力装置、入力方法、およびプログラム
JP7015706B2 (ja) 計算機及び文書データの処理方法
JP7410532B2 (ja) 文字判定装置及び文字判定プログラム
JP2006031099A (ja) 文字認識をコンピュータに行なわせるためのコンピュータ実行可能なプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180329

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190628

R150 Certificate of patent or registration of utility model

Ref document number: 6550163

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R157 Certificate of patent or utility model (correction)

Free format text: JAPANESE INTERMEDIATE CODE: R157

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250