JP6550163B1

JP6550163B1 - 文字認識装置、文字認識方法およびプログラム

Info

Publication number: JP6550163B1
Application number: JP2018065339A
Authority: JP
Inventors: 英樹川津; 伸矢近田; 哲平岡; 壮平岩藤; 祥居合; 大田　佳宏; 佳宏大田; 昂平安田; 紗弓千葉; 公陽衣笠; 鈴木　良尚; 良尚鈴木
Original assignee: Arithmer Inc
Current assignee: Arithmer Inc
Priority date: 2018-03-29
Filing date: 2018-03-29
Publication date: 2019-07-24
Anticipated expiration: 2038-03-29
Also published as: JP2019175317A

Abstract

【課題】一般的なＯＣＲ技術は候補となる文字種類が多いので文字の推定に時間がかかるうえに、互いに似た文字間で正しく識別されているとはいえない。【解決手段】文字認識装置であって、証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、証券の画像データを取得し、位置格納部を参照することにより、複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書を格納する辞書格納部と、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する文字推定部とを備える。【選択図】図１

Description

本発明は、文字認識装置、文字認識方法およびプログラムに関する。

保険証券の画像を電子データとして受信し、文字情報を抽出する保険証券画像解析システムがある（特許文献１参照）。当該特許文献においては、文字情報の抽出に関して一般的なＯＣＲ技術を用いることができるとだけ記載されている。
特許文献１特開２０１８−３６９９８号

しかしながら、漢字が使われている場合など、一般的なＯＣＲ技術は候補となる文字種類が多いので文字の推定に時間がかかるうえに、互いに似た文字間で正しく識別されているとはいえない。

上記課題を解決するために、本発明の第１の態様においては、文字認識装置であって、証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、証券の画像データを取得し、位置格納部を参照することにより、複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書を格納する辞書格納部と、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する文字推定部とを備える。

本発明の第２の態様においては、文字認識方法であって、証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書が辞書格納部に格納されており、証券の画像データを取得し、位置格納部を参照することにより、複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定段階と、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する文字推定段階とを備える。

本発明の第３の態様においては、プログラムであって、証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書が辞書格納部に格納されている、コンピュータに証券の画像データを取得し、位置格納部を参照することにより、複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定手順、および、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する文字推定手順を実行させる。

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

本実施形態による文字認識装置１０の機能ブロック図を示す。証券２０の一例を概略的に示す。証券４０の他の例を概略的に示す。位置格納部１２０に格納されている位置情報１２２の一例を示す。辞書格納部１４０に格納されている辞書の一例を示す。住所の辞書１４２の一例を示す。年月日の辞書１４４の一例を示す。型式の辞書１４６の一例を示す。文字認識装置１０の動作フローを示す。図９の動作フローのステップＳ１６の一例を示す。

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

図１は、本実施形態による文字認識装置１０の機能ブロック図を示す。文字認識装置１０は、証券２０に手書きまたは印字された文字を認識して文字データとして出力する。なお、ここで文字には、ひらがな、カタカナ、漢字、アラビア数字、アルファベットなどが含まれ得る。

文字認識装置１０は例えばパーソナルコンピュータ（ＰＣ）などの情報処理機器である。文字認識装置１０は、画像取得部１１０と、位置格納部１２０と、フィールド特定部１３０と、文字推定部１６０と、辞書格納部１４０とを有する。

画像取得部１１０は、証券２０の画像データを取得する。画像取得部１１０がカメラ機能を有していて、証券２０を直接撮像して画像データを取得する。これに代えてまたはこれに加えて、画像取得部１１０は、スキャナや他の情報端末と通信してそれらから証券２０の画像データを取得してもよい。

位置格納部１２０は、証券２０上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納している。

フィールド特定部１３０は、位置格納部１２０を参照することにより、画像取得部１１０が取得した証券２０の画像データのうち、複数のフィールドのそれぞれに対応する画像データを特定する。

辞書格納部１４０は、複数のフィールドを特定する情報のそれぞれに対応し、対応するフィールドに含まれ得る単語が登録された辞書を格納している。

文字推定部１６０は、第１の推定部１７０と第２の推定部１８０とを有する。文字推定部１６０は、第１の推定部１７０および第２の推定部１８０を用いて、複数のフィールドの画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、辞書格納部１４０に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する。文字推定部１６０はさらに推定した文字列を顧客データベース７０に格納したり、表示装置８０に表示したりする。

図２は、証券２０の一例を概略的に示す。証券２０は、特定の保険会社「○×損害保険」の自動車保険証券である。証券２０には、ロゴマークなどのマーク２１が印刷されている。

証券２０はさらに、文字が記載された、氏名フィールド２２、住所フィールド２４、保険期間フィールド２６、車台番号フィールド２８、登録番号フィールド３０、型式フィールド３２および初度登録フィールド３４を有する。これらのフィールドは、文字認識装置１０で文字を認識するフィールドを例示したものであって、証券２０は他にも文字が記載されたフィールドを有してもよい。さらに、文字認識装置１０も他のフィールドの文字を認識してもよいし、例示した上記フィールドのすべてについて文字を認識しなければならないわけではない。

図３は、証券４０の他の例を概略的に示す。証券４０は、証券２０とは異なる保険会社「△□火災保険株式会社」の自動車保険証券である。証券４０にもマーク４１が印刷されている。

証券４０も、証券２０と同様に、文字が記載された、氏名フィールド４２、住所フィールド４４、保険期間フィールド４６、車台番号フィールド４８、登録番号フィールド５０、型式フィールド５２および初度登録フィールド５４を有する。しかしながら、証券４０における各フィールドの位置や大きさは、証券２０とは異なっている場合がある。

図４は、位置格納部１２０に格納されている位置情報１２２の一例を示す。位置情報１２２は、証券テンプレートＩＤごとに、複数のフィールドの各フィールド名と当該フィールドの始点位置と終点位置とが対応付けて格納されている。さらに証券テンプレートＩＤごとに、当該証券のマークの画像が格納されている。ここでフィールド名は複数のフィールドのいずれであるかを特定する情報の例となっている。

図４の例では証券テンプレートＩＤ「００１」について、フィールド名「氏名」の位置が始点の座標（Ｘ１１，Ｙ１１）および終点の座標（Ｘ１２，Ｙ１２）で表されている。これにより、フィールド名「氏名」のフィールドは、これら始点と終点とで指定される矩形の領域である。

これらの座標は、証券全体を予め定められた大きさに正規化したときの位置であることが好ましい。ただし、フィールドの位置の指定方法は図４に示す例に限られず、他の方法が用いられてもよい。

位置情報１２２は文字認識装置１０の文字認識に先立って、位置格納部１２０に格納される。新たなフォーマットの証券が発行された場合には、文字認識装置１０の使用者等により、当該証券についての位置情報１２２が位置格納部１２０に追加されることが好ましい。

以上の通り、位置情報１２２は証券テンプレートごとに複数のフィールドのそれぞれを特定する位置の情報が格納されている。よって、図２および図３に示したように、互いに異なるレイアウトの証券２０、４０においても、それぞれにおける氏名フィールド２２、４２等の各フィールドの位置が特定できる。

図５は、辞書格納部１４０に格納されている辞書の一例を示す。辞書格納部１４０には、フィールド名に対応した辞書が格納されている。これらのフィールド名は、位置格納部１２０に格納されているフィールド名に対応している。

各辞書には対応するフィールドに含まれ得る単語が登録されている。各辞書は文字認識装置１０の文字認識に先立って、辞書格納部１４０に格納される。

図５の例において、フィールド名「氏名」には「氏名の辞書」が対応付けられている。ただし、フィールド名と辞書とは１対１に対応していなければならないわけではない。フィールドに含まれ得る単語が同じまたは類似する場合には共通の辞書を用いてもよい。図５の例においては、フィールド名「保険期間」と「初度登録」とは、そのフィールドに含まれる単語が年月日で共通しているので、同じ「年月日の辞書」が対応付けられている。いいかえれば、保険期間フィールド４６と初度登録フィールド５４に対しては辞書を共用する。

図６は、住所の辞書１４２の一例を示す。住所の辞書１４２には、都道府県名、市区町村名および地域名の可能な組み合わせが階層化されて登録されている。すなわち、各都道府県名の下位階層には、当該都道府県に属する市区町村名が含まれる。同様に、各市区町村名の下位階層には、当該市区町村に属する地域名が含まれる。

住所の辞書１４２にはさらに、行政上の変更があった都道府県名、市区町村名および地域名について、旧名称と現名称とが対応付けられて登録されている。図６の例において、「東京都」の「田無市」が他の市との合併で「西東京市」へ変更されたことに対応して「田無市→西東京市」が登録されている。市区町村名に記号「→」が含まれることはないから、当該辞書において記号「→」がある単語については、当該記号よりも前の文字列が旧名称であり、当該記号よりも後の文字列を新名称であるというルールでこの辞書を用いることができる。

図７は、年月日の辞書１４４の一例を示す。年月日の辞書１４４には、年、月および日が登録されている。年には元号と西暦とが含まれており、これらは対応付けられている。一方、年、月および日は様々な組み合わせが有り得るので、この例ではそれらの対応付けはされていない。ただし、特定の具体的な日を考えた場合に、当該日はある月に属しており、当該月はある年に属している。その観点から、年月日の辞書１４４においても、年、月および日がこの順に階層化されているともいえる。

「西暦」については自動車保険の保険期間および初度登録に関するものであるという性質上、現在からみて未来に数年分、過去に数十年分が登録されていることが好ましい。「元号」については「西暦」に登録されている年に対応する分が対応づけられて格納されていることが好ましい。図７の例では元号として「平成」と「昭和」が登録されている。

「月」として取り得る文字は数字の１から１２なので、年月日の辞書１４４にも「１」から「１２」が登録されている。同様に、「日」として取り得る文字は数字の１から３１なので、年月日の辞書１４４にも「１」から「３１」が登録されている。

図８は、型式の辞書１４６の一例を示す。型式の辞書１４６は、初度登録の年に対応付けられて型式が登録されている。図８の例では初度登録は西暦で示されており、その年に販売をしていた自動車の型式が登録されている。その観点から、型式は年に関連する内容を含む一例になっている。

図９は、文字認識装置１０の動作フローを示す。まず、画像取得部１１０が証券２０の画像データを取得する（Ｓ１０）。

フィールド特定部１３０は、位置格納部１２０を参照して証券２０を特定する（Ｓ１２）。この場合に、フィールド特定部１３０は、画像取得部１１０が取得した画像データに含まれているマーク２１を、位置格納部１２０に格納されているマークとテンプレートマッチングする。これにより、フィールド特定部１３０は当該画像データが、位置格納部１２０に格納されている証券テンプレートＩＤで特定されるいずれの証券であるかを特定する。

さらにフィールド特定部１３０は、位置格納部１２０を参照することにより、証券２０の画像データのうち、複数のフィールドのそれぞれに対応する画像データを特定する（Ｓ１４）。この場合に、フィールド特定部１３０は、ステップＳ１２で特定した証券テンプレートの位置情報１２２に基づいて、氏名フィールド２２、住所フィールド２４、保険期間フィールド２６、車台番号フィールド２８、登録番号フィールド３０、型式フィールド３２および初度登録フィールド３４の位置を特定し、当該位置に対応する画像データを、それぞれのフィールドの画像データとして特定する。

文字推定部１６０は、あるフィールドの画像データについて、フィールドに記載されている文字列を、学習機能と、辞書格納部１４０に格納されているフィールドを特定する情報に対応する辞書とを用いて推定する（Ｓ１６）。ステップＳ１６については後述する。

ステップＳ１６を、ステップＳ１４で特定した全てのフィールドで実行し（Ｓ１８）、当該動作フローを終了する。ここで、文字列を推定するフィールドの順序は、例えば位置情報１２２のフィールド名の記載順であるが、これに限られない。ただし、辞書のいずれかが他のフィールドの推定の結果を用いるものであるときは、当該他のフィールドが先に推定されていることが好ましい。例えば、型式の辞書１４６は初度登録に対応付けて型式が登録されているので、型式フィールド３２の推定よりも前に、初度登録フィールド３４の推定が実行される。

図１０は、図９の動作フローのステップＳ１６の一例を示す。ステップＳ１６において、文字推定部１６０の第１の推定部１７０は、文字数ｎを１にリセットする（Ｓ１０１）。

第１の推定部１７０は、当該フィールドの画像データに記載されているｎ番目の文字の候補を、学習機能を用いて推定する（Ｓ１０３）。学習機能は、図９の動作フローの前に予め学習されていることが好ましい。この場合に、フィールドごとに当該フィールドに含まれ得る単語を教師データとして学習しておくことが好ましい。

学習機能の一例として、リカレント・ニューラル・ネットワーク（ＲＮＮ）が挙げられる。ＲＮＮは（ｎ−１）番目までの文字列の中間層をｎ番目の入力と併せて学習に用いることで、文字列の順番も考慮したネットワーク構造となるという観点から、有り得る単語がある程度限られる本実施形態の用途に適している。

文字推定部１６０の第２の推定部１８０は辞書格納部１４０に格納されている、当該フィールドに対応付けられた辞書に文字数ｎの単語があるか否かを判断する（Ｓ１０７）。この場合に、参照すべき辞書が住所の辞書１４２のように階層化されている場合には、デフォルトでは最上位の階層の単語について判断し、後述するステップＳ１２１で下位の階層が指定される。

当該辞書に文字数ｎの単語がある場合に（Ｓ１０７：Ｙｅｓ）、第２の推定部１８０はここまでに推定したｎ番目までの文字列と、当該辞書の文字数ｎの単語との類似度を単語ごとに計算する（Ｓ１１１）。辞書の中に、類似度が閾値以上となる単語があった場合に（Ｓ１１１：Ｙｅｓ）、第２の推定部１８０はその単語の文字データを、推定した文字列として顧客データベース７０及び表示装置８０の少なくとも一方に出力する（Ｓ１１３）。

ステップＳ１０７とＳ１１１の判断がそれぞれＮｏの場合に、第２の推定部１８０は文字数ｎを１カウントアップする（Ｓ１１５）。その結果、ｎがｎｘを超えたか否かを第２の推定部１８０が判断する（Ｓ１１７）。ここでｎｘは参照すべき辞書（さらに、辞書が階層化されている場合には参照すべき階層）に登録されている単語の最大の文字数である。

ステップＳ１１７の判断がＮｏの場合には処理をステップＳ１０３に戻す。これにより先の類似度の判断に用いた単語よりも文字数が１つ多い単語との類似度を判断することができる。

一方、ステップＳ１１７の判断がＹｅｓの場合には、それまでに推定した文字列の文字データを顧客データベース７０等に出力する（Ｓ１１９）。同様に、ステップＳ１０５の判断がＮｏの場合にも、それまでに推定した文字列の文字データを顧客データベース７０等に出力する（Ｓ１２５）。これらにより、辞書の単語とは類似度が閾値以上にならなかった場合でも、推定した文字列が出力されるので、その文字列に基づいて後から使用者等が修正をすることができる。

ステップＳ１１３、Ｓ１１９およびＳ１２５の後に、第２の推定部１８０は参照している辞書に下位階層があるか否かを判断する（Ｓ１２１）。下位階層がない場合には（Ｓ１２１：Ｎｏ）、処理を図１０のステップＳ１８に進める。下位階層がある場合には（Ｓ１２１：Ｙｅｓ）、処理をステップＳ１０１に戻して文字数ｎを１にリセットしてから当該階層での文字列を推定する。

以上のステップＳ１６のフローを住所フィールド２４、４４に用いた場合には、都道府県、市区町村および地域ごとに、この順序で文字列が推定される。まず都道府県名は約５０個に限られているので、ステップＳ１０９で第２の推定部１８０が住所の辞書１４２における都道府県名を単語として類似度を計算することにより、早くかつ正確に文字列を推定することができる。

さらに、都道府県、市区町村および地域が階層化されているので、市区町村名を推定する場合に、すでに推定された都道府県に属する市区町村名を単語として類似度を計算することで、早くかつ正確に文字列を推定することができる。例えば「荻」と「萩」とは視覚的に似ているが、都道府県名としてすでに「東京都」が推定されている場合には「東京都」に属する市区町村名に「荻」が含まれている「荻窪」は登録されているが「萩」を含む単語は登録されていない。よって、「荻」が出力される可能性が高まる。

また、住所の辞書１４２には旧名称と現名称とが対応付けて登録されている。よって、第２の推定部１８０が住所の辞書１４２を参照することにより、旧名称と現名称のどちらが住所フィールド２４、４４に記載されていたとしてもより正確に文字列を推定することができる。

さらに、第２の推定部１８０は、推定した文字列の、旧名称との類似度が閾値以上であった場合に、ステップＳ１１３において旧名称に代えてまたは旧名称に併記して現名称を出力してもよい。例えば第２の推定部１８０が推定した文字列と住所の辞書１４２の「田無市」の類似度が閾値以上であった場合に、住所の辞書１４２で「田無市」に対応付けて格納された「西東京市」に変換して出力してもよいし、「西東京市（旧田無市）」または「田無市（現西東京市）」のように併記した出力にしてもよい。

上記ステップＳ１６のフローを保険期間フィールド２６、４６および初度登録フィールド３４、５４に用いた場合には、年、月および日ごとに、この順序で文字列が推定される。ここで、年月日の辞書１４４には年として元号と西暦とが登録されている。よって保険期間フィールド２６、４６および初度登録フィールド３４、５４にどちらの表記による文字列が記載されていたとしても、第２の推定部１８０が年月日の辞書１４４を参照することにより、正確に文字列を推定することができる。

さらに、第２の推定部１８０は、推定した文字列の、元号との類似度が閾値以上であった場合に、ステップＳ１１３において元号に代えてまたは元号に併記して西暦を出力してもよい。例えば第２の推定部１８０が推定した文字列と年月日の辞書１４４の「平成２」の類似度が閾値以上であった場合に、年月日の辞書１４４の「平成３０」に対応付けて格納された「２０１８」に変換して出力してもよいし、「２０１８（平成３０）」または「平成３０（２０１８）」のように併記した出力にしてもよい。

また、月および日として有り得る文字は限られており、それらが年月日の辞書１４４に登録されている。よって、第２の推定部１８０が、ステップＳ１０９で年月日の辞書１４４で月および日として登録されている数字を単語として類似度を計算することにより、早くかつ正確に文字列を推定することができる。

上記ステップＳ１６のフローを型式フィールド３２、５２に用いた場合に、それに先立って初度登録フィールド３４、５４で初度登録の年が推定されていれば、これを用いる。この場合にステップＳ１０９において、第２の推定部１８０は、第１の推定部１７０が推定した文字列に対して、すでに推定された初度登録の年に対応付けて型式の辞書１４６に登録されている型式の単語のそれぞれとの類似度を算出する。これにより、早くかつ正確に型式の文字列を推定することができる。

以上、本実施形態の文字認識装置１０によれば、証券２０、４０の各フィールドに対応した辞書と学習機能とを組み合わせて用いることにより、早くかつ正確に各フィールドに記載されている文字列を認識することができる。また、同一の証券２０の各フィールドで推定した文字列を、当該証券２０を識別するＩＤまたは顧客を識別するＩＤに対応付けて顧客データベース７０に出力することにより、証券２０に記載された文字内容を文字データとして管理することができる。

なお、上記ステップＳ１０９の類似度の計算の一例として、文字間距離（レーベンシュタイン距離とも呼ばれる）を用いることが挙げられる。この場合にはステップＳ１１１の「類似度が閾値以上」であるか否かとは、「文字間距離が閾値より短い」か否か、ということになる。また、いずれの類似度を用いた場合であっても、ステップＳ１１１において「類似度が閾値以上」であるかどうかを判断することに代えて、類似度を計算した単語のうちで最も類似度が高かった単語を特定してもよい。

さらに、ステップＳ１０３において第１の推定部１７０が文字列の候補を複数推定した場合に、候補のそれぞれについて、第２の推定部１８０がステップＳ１０９およびＳ１１１の類似度に関する処理を実行してもよい。その場合にもステップＳ１１１において、類似度が閾値を超えかどうかを判断してもよいし、類似度を計算した単語および文字列のうちで最も類似度が高かった単語および文字列を特定してもよい。

上記実施形態では、学習機能としてＲＮＮを例示したが学習機能はこれに限られない。他の学習機能、例えば、畳み込みニューラルネットワーク（ＣＮＮ）などの他のニューラルネットワークや、ニューラルネットワーク以外の、サポートベクターマシン、遺伝的プログラミング等が用いられてもよい。

上記実施形態の住所の辞書１４２において、旧名称と現名称とは記号「→」で対応付けられているが、対応付けの方法はこれに限られない。他の例として、住所の辞書１４２に旧名称と現名称の列を設けて、それぞれの列に名称を登録してもよい。その場合には偏向のない名称に対しては現名称の列に登録をして旧名称の列には無効な値を登録しておいてもよい。

なお、文字認識装置１０は、一般的な構成の情報処理装置において、文字認識装置１０の各部の動作を規定したソフトウエア又はプログラムを起動することにより実現されてよい。文字認識装置１０として用いられる情報処理装置は、ＣＰＵ等のプロセッサ、ＲＯＭ、ＲＡＭ、通信インターフェースなどを有するデータ処理装置と、キーボード、タッチパネル、マイク、ＧＰＳ情報取得装置、加速度センサ、ジャイロセンサなどの入力装置と、表示装置、スピーカ、振動装置などの出力装置と、メモリ、ＨＤＤなどの記憶装置とを備えてよい。データ処理装置又は記憶装置は、上記のソフトウエア又はプログラムを記憶してよい。上記のソフトウエア又はプログラムは、プロセッサによって実行されることにより、上記の情報処理装置に、当該命令又はプログラムによって規定された動作を実行させる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

１０文字認識装置、２０、４０証券、２１、４１マーク、２２、４２氏名フィールド、２４、４４住所フィールド、２６、４６保険期間フィールド、２８、４８車台番号フィールド、３０、５０登録番号フィールド、３２、５２型式フィールド、３４、５４初度登録フィールド、７０顧客データベース、８０表示装置、１１０画像取得部、１２０位置格納部、１２２位置情報、１３０フィールド特定部、１４０辞書格納部、１４２住所の辞書、１４４年月日の辞書、１４６型式の辞書、１６０文字推定部、１７０第１の推定部、１８０第２の推定部

Claims

証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、
証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、
前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と、
前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と
を備え、前記文字推定部は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第１の推定部と、前記第１の推定部が推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第２の推定部と、を含む、文字認識装置。
前記複数のフィールドのいずれかは住所のフィールドであり、
前記住所のフィールドに対応する前記辞書には、都道府県名、市区町村名および地域名の可能な組み合わせが階層化されて登録されており、
前記文字推定部は、都道府県名、市区町村名および地域名ごとに前記文字列を推定する請求項１に記載の文字認識装置。
前記住所のフィールドに対応する前記辞書には、行政上の変更があった都道府県名、市区町村名および地域名について、旧名称と現名称とが対応付けられて登録されており、
前記文字推定部は、推定した文字列が前記旧名称である場合には前記旧名称に対応付けられている前記現名称を少なくとも出力する請求項２に記載の文字認識装置。
前記複数のフィールドのいずれかは年を含むフィールドであり、
前記年を含むフィールドに対応する前記辞書には、西暦と元号とが対応付けられて登録されており、
前記文字推定部は、推定した文字列が前記元号である場合には前記元号に対応付けられている前記西暦による年を少なくとも出力する請求項１から３のいずれか１項に記載の文字認識装置。
前記複数のフィールドのいずれかは年を含むフィールドであり、他のいずれかは前記年に関連する内容を含むフィールドであり、
前記年に関連する内容を含むフィールドに対応する前記辞書には、前記年および前記内容の組み合わせが登録されており、
前記文字推定部は、前記年を含むフィールドで推定した前記年を用いて、前記年に関連する内容を含むフィールドに対応する前記辞書を参照する請求項１から４のいずれか１項に記載の文字認識装置。
前記年を含むフィールドは車検の初度登録の日付のフィールドであり、前記年に関連する内容を含むフィールドは車の型式のフィールドである請求項５に記載の文字認識装置。
証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報をそれぞれ格納した位置格納部と、
証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定部と、
前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書を格納する辞書格納部と、
前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定部と、を備え、
前記複数のフィールドのいずれかは年を含むフィールドであり、他のいずれかは前記年に関連する内容を含むフィールドであり、
前記年に関連する内容を含むフィールドに対応する前記辞書には、前記年および前記内容の組み合わせが登録されており、
前記文字推定部は、前記年を含むフィールドで推定した前記年を用いて、前記年に関連する内容を含むフィールドに対応する前記辞書を参照する、文字認識装置。
証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、
前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されており、
証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定段階と、
前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定段階と
を備える、前記文字推定段階は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第１の推定段階と、前記第１の推定段階で推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第２の推定段階と、を含む、文字認識方法。
証券上の位置に対応付けて、文字が記載された複数のフィールドを特定する情報がそれぞれ位置格納部に格納されているとともに、
前記複数のフィールドを特定する情報のそれぞれに対応して、前記複数のフィールドのそれぞれに含まれ得る単語が登録された辞書が辞書格納部に格納されている、
コンピュータに
証券の画像データを取得し、前記位置格納部を参照することにより、前記複数のフィールドのそれぞれに対応する画像データを特定するフィールド特定手順、および、
前記複数のフィールドのそれぞれに対応して特定された前記画像データのそれぞれについて、フィールドに記載されている文字列を、学習機能と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書とを用いて推定する文字推定手順
を実行させ、前記文字推定手順は、前記複数のフィールドのそれぞれに対応して特定された前記画像データに記載されている文字の候補を、学習機能を用いて推定する第１の推定手順と、前記第１の推定手順が推定した文字を含む文字列と、前記辞書格納部に格納されている前記フィールドを特定する情報に対応する前記辞書に登録されている単語との類似度に基づいて前記文字列を推定する第２の推定手順と、を含む、プログラム。