[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6325407B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6325407B2
JP6325407B2 JP2014198825A JP2014198825A JP6325407B2 JP 6325407 B2 JP6325407 B2 JP 6325407B2 JP 2014198825 A JP2014198825 A JP 2014198825A JP 2014198825 A JP2014198825 A JP 2014198825A JP 6325407 B2 JP6325407 B2 JP 6325407B2
Authority
JP
Japan
Prior art keywords
information
unit
type
entry
entry information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014198825A
Other languages
English (en)
Other versions
JP2016071528A (ja
Inventor
外志正 土橋
外志正 土橋
博之 水谷
博之 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Digital Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Digital Solutions Corp filed Critical Toshiba Corp
Priority to JP2014198825A priority Critical patent/JP6325407B2/ja
Priority to US14/865,316 priority patent/US10216988B2/en
Priority to CN201510623397.4A priority patent/CN105469028B/zh
Publication of JP2016071528A publication Critical patent/JP2016071528A/ja
Application granted granted Critical
Publication of JP6325407B2 publication Critical patent/JP6325407B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明の実施形態は情報処理装置、情報処理方法及びプログラムに関する。
帳票を用いる業務を、コンピュータ等により自動化する技術が従来から知られている。このような技術の例として、帳票に含まれる文字及び図形等のパターン認識処理を利用した帳票識別技術が知られている。帳票識別技術を利用した多くの帳票識別システムでは、帳票を構成する罫線の位置等の帳票の形式を示すブランク帳票を記憶しておき、入力された帳票と、ブランク帳票とを比較することにより帳票の種類を識別する。
特開平08−255236号公報
しかしながら従来技術では、帳票の形式によって帳票の種類を識別することができない場合に、複数の帳票の種類から一の帳票の種類を特定することができなかった。
実施形態の情報処理装置は、記憶部と受付部と認識部と特定部とを備える。記憶部は、複数の種類の帳票の記入情報と、前記記入情報のカテゴリを示すカテゴリ情報とを、前記帳票の種類及び記入フィールド毎に蓄積した蓄積情報を記憶する。受付部は、前記帳票を受け付ける。認識部は、前記受付部により受け付けられた前記帳票に含まれる前記記入情報を認識する。特定部は、前記蓄積情報と、前記認識部により認識された前記記入情報とを比較することにより、前記受付部により受け付けられた前記帳票の種類を特定する。前記特定部は、前記認識部により認識された前記記入情報が前記蓄積情報に含まれているか否か、前記認識部により認識された前記記入情報が前記蓄積情報に含まれている割合、及び、前記認識部により認識された前記記入情報と同一のカテゴリの前記記入情報を前記蓄積情報に含む割合に基づいて前記帳票の種類の信頼度を算出し、前記信頼度の高い順に複数の前記帳票の種類を特定する。
図1は実施形態の情報処理装置の構成の例を示す図である。 図2は帳票の例を示す図である。 図3Aは実施形態のブランク帳票の例を示す図である。 図3Bは実施形態の記入フィールド形式情報の例を示す図である。 図4は帳票の形式情報によって帳票の種類の識別ができない場合の例を示す図である。 図5は実施形態の情報処理方法の例を示すフローチャートである。 図6は実施形態の情報処理装置のハードウェア構成の例を示す図である。
以下に添付図面を参照して、情報処理装置、情報処理方法及びプログラムの実施形態を詳細に説明する。
図1は実施形態の情報処理装置100の構成の例を示す図である。実施形態の情報処理装置100は、記憶部1、受付部2、認識部3、識別部4、特定部5、表示制御部6、表示部7及び入力部8を備える。
記憶部1は情報を記憶する。記憶部1は、例えば帳票モデル11、認識辞書12及び蓄積情報13を記憶する。帳票モデル11、認識辞書12及び蓄積情報13の説明は後述する。
受付部2は帳票を受け付ける。受付部2は帳票を認識部3に入力する。
なお受付部2が帳票を受け付ける方法は任意でよい。受付部2は、例えば帳票を示す画像を受け付ける。画像は、例えば帳票をスキャナにより読み込むことにより作成された画像ファイルでもよいし、帳票をカメラにより撮影することにより作成された画像ファイルでもよい。
図2は帳票の例を示す図である。図2は自動車販売会社の業務で用いられる帳票の例を示す。例えば品名には、セダンAが記載されている。以下、帳票に記入される情報を記入情報といい、記入情報が記入される場所を記入フィールドという。例えば図2の帳票の記入フィールドは、氏名、性別、住所、品名、単価、個数及び合計金額の欄である。
図1に戻り、認識部3は受付部2から帳票を受け付ける。認識部3は帳票の形式情報、及び、帳票に含まれる記入情報を認識する。
記入情報は、記入内容(文字列、記号及び数字等)を示す情報、及び、記入内容の帳票上の位置を示す情報を含む。
形式情報は、帳票の形式を示す情報である。形式情報は、例えば帳票を構成する罫線の位置を示す罫線情報、プレ印字文字列(入力欄の説明等)の位置と内容を示すプレ印字文字列情報、及び、記入フィールド形式情報を含む。記入フィールド情報の説明は図3Bを参照して後述する。
具体的には、認識部3は認識辞書12を利用して形式情報及び記入情報を認識する。認識辞書12は文字及び図形等のパターンを認識するための辞書であり、パターンから得られる特徴情報とそれに対応する文字種や図形パターン種を関連付けて記憶している。認識部3はパターン認識処理を行うことにより得られたパターン認識結果情報から、認識辞書12を用いて帳票の形式情報及び記入情報を認識する。
認識部3は形式情報を識別部4に入力する。また認識部3は記入情報を特定部5に入力する。
識別部4は認識部3から形式情報を受け付ける。識別部4は形式情報と帳票モデル11とを比較することにより帳票の種類を識別する。そして識別部4は形式情報と帳票モデル11とを比較することにより、帳票の種類を識別できるか否かを判定する。
ここで帳票モデル11について説明する。帳票モデル11は、帳票の種類毎に、ブランク帳票及び記入フィールド形式情報を記憶する。
図3Aはブランク帳票の例を示す図である。図3Aに示されるように、ブランク帳票は記入情報が記入されていない状態の帳票である。ブランク帳票は、帳票を構成する罫線の位置、及び、プレ印字文字列(入力欄の説明等)の位置と内容を示す。図3Aの例では、プレ印字文字列(入力欄の説明等)は、氏名、性別、男・女、住所、品名、単価、個数及び合計金額である。
図3Bは記入フィールド形式情報の例を示す図である。記入フィールド形式情報は、記入フィールド毎に、記入フィールドに記入される記入情報の入力形式を示す。図3Bの記入フィールド形式情報の例では、例えば氏名の記入フィールドの入力形式は、名前が記入される名前フィールドであることを示す。また例えば単価の記入フィールド、及び、合計金額の記入フィールドに記入される記入情報の入力形式は、金額が記入される金額フィールドであることを示す。なお数字フィールド及び金額フィールドは桁数等の情報が関連付けられていてもよい。
図1に戻り、具体的には、識別部4は形式情報に含まれる罫線情報及びプレ印字文字列情報を、帳票モデル11のブランク帳票と比較し、形式情報に含まれる記入フィールド形式情報を、帳票モデル11の記入フィールド形式情報と比較する。
識別部4は帳票の種類を識別できる場合、一の帳票の種類を示す情報を特定部5に入力する。識別部4は帳票の種類を識別できない場合、識別部4の処理により絞り込まれた複数の帳票の種類を示す情報を特定部5に入力する。
なお識別部4の具体的な識別処理には任意の方法を使用してよい。例えば特許文献1に開示されている方法を使用してもよい。
ここで識別部4が形式情報により帳票の種類を識別できない場合について説明する。
図4は形式情報による帳票の種類の識別ができない場合の例を示す図である。図4は、帳票A(九州自動車注文票)、帳票B(東北化粧品注文票)及び帳票C(関東新聞申込票)のブランク帳票の例を示す。帳票Aと帳票C、及び、帳票Bと帳票Cは形式情報により区別できるが、帳票Aと帳票Bとは形式情報では区別できない。したがって受付部2により受け付けられた帳票が帳票Aの場合、識別部4が形式情報に含まれる罫線情報及びプレ印字文字列情報と、帳票モデル11のブランク帳票とを比較すると、帳票A及び帳票Bが一致するため、帳票の種類を識別することができない。
記入フィールド形式情報が参照される場合でも、同様に、識別部4が形式情報に含まれる記入フィールド形式情報と、帳票モデル11の記入フィールド形式情報とを比較すると、帳票A及び帳票Bが一致するため、帳票の種類を識別することができない。
図1に戻り、特定部5は認識部3から記入情報を受け付け、識別部4から帳票の種類を示す情報を受け付ける。特定部5は、識別部4から受け付けた帳票の種類を示す情報が複数の場合、帳票の種類毎に、記入情報と蓄積情報13とを比較することにより帳票の種類を特定する。
ここで蓄積情報13について説明する。蓄積情報13は、複数の種類の帳票の記入情報を、帳票の種類及び記入フィールド毎に蓄積する。例えば蓄積情報13は、認識部3により過去に認識された複数の記入情報を、帳票の種類及び記入フィールド毎に示す。この場合、過去に認識された記入情報そのもの、又は認識後に人手で修正された記入情報が記憶される。記憶される記入情報は過去に認識された複数の記入情報を全て記憶したものでも、過去の一定期間の記入情報を記憶したものでもよい。
また蓄積情報13は加工又は集計した記入情報を記憶してもよい。すなわち蓄積情報13の記憶形式は任意でよい。例えば、図2に例示した帳票の品名の欄に対応する記入フィールドの場合、セダンA、セダンB、トラックC、ワゴンA、セダンB、・・・のように単純に時系列の記入履歴として蓄積情報13を記憶してもよい。また例えば、セダンA:100、セダンB:50、セダンC:70、・・・のように、名称と、名称の出現回数とを組にして蓄積情報13を記憶してもよい。
また蓄積情報13は、記入情報のカテゴリを示すカテゴリ情報を記入情報に関連付けて記憶する。カテゴリは記入情報の記入内容に応じて分類した情報である。例えば記入内容がセダンAの場合、カテゴリは自動車である。また例えば、記入内容が口紅Aの場合、カテゴリは化粧品である。
識別部4から受け付けた帳票の種類を示す情報が複数の場合、具体的には、特定部5は所定の式に基づいて帳票の種類の信頼度Pを算出し、信頼度Pの高い順に複数の帳票の種類を順序付ける。ここで信頼度Pを算出する所定の式について説明する。特定部5は、例えば下記式(1)により信頼度Pを算出する。
P=w1×A+w2×B+w3×C ・・・(1)
ここでw1、w2及びw3は所定の重みを示す定数である。またAは記入情報が蓄積情報13に含まれているか否かを示す変数である。例えば記入情報が蓄積情報13に含まれている場合、A=1とし、記入情報が蓄積情報13に含まれていない場合、A=0とする。またBは記入情報が蓄積情報に含まれている割合(%)を示す変数である。例えばBは0から1の値をとる。またCは記入情報と同一のカテゴリの記入情報を蓄積情報に含む割合(%)を示す変数である。例えばCは0から1の値をとる。
式(1)による算出結果について具体的に説明する。ここでは図4の帳票A(九州自動車注文票)及び帳票B(東北化粧品注文票)の品名の欄(品名フィールド)を使用して、信頼度Pを算出する場合について説明する。なお簡単のためw1=w2=w3=1とする。記入情報の記入内容がセダンAの場合について具体的に説明する。蓄積情報13の帳票Aの品名フィールドに、セダンAが含まれており、セダンAの割合が50%、セダンAと同じカテゴリである自動車に含まれている記入情報の割合が80%であるとする。また蓄積情報13の帳票Bの品名フィールドに、セダンAが含まれており、セダンAの割合が1%、セダンAと同じカテゴリである自動車に含まれている記入情報の割合が2%であるとする。
このとき帳票の種類が帳票Aである場合の信頼度Pは、P=1+0.5+0.8=2.3である。また帳票の種類が帳票Bである場合の信頼度Pは、P=1+0.01+0.02=1.03である。これにより特定部5は、受付部2が帳票Aを受け付けたとき、識別部3が形式情報により帳票の種類を識別できない場合でも、より信頼度Pが高い帳票は帳票Aであることを特定することができる。
なお特定部5が信頼度Pを算出するときに使用される記入フィールドは、帳票毎に任意に決定してよい。また特定部5は複数の記入フィールドの信頼度Pに基づいて帳票を特定してもよい。また特定部5が信頼度Pを算出するときに使用する所定の式は任意でよい。特定部5は、例えば記入フィールドの文字出現頻度、単語出現頻度、文字種、数値、属性(名前及び住所等)、地域及び性別等の偏り(傾向)を利用した所定の式を使用してもよい。
識別部4から受け付けた帳票の種類を示す情報が1つの場合、特定部5は帳票の種類を示す情報と、認識部3から受け付けた記入情報とに基づいて、当該帳票の種類の記入情報を、記入フィールド毎に蓄積情報13として記憶する。
また識別部4から受け付けた帳票の種類を示す情報が複数の場合、特定部5は信頼度Pに基づいて決定した複数の帳票の種別の順序を示す順序情報を表示制御部6に入力する。特定部5は表示制御部6から、ユーザーにより選択された一の帳票の種別を示す情報を受け付けると、帳票の種類を示す情報と、認識部3から受け付けた記入情報とに基づいて、当該帳票の種類の記入情報を、記入フィールド毎に蓄積情報13として記憶する。
表示制御部6は表示部7に表示する情報を制御する。表示制御部6は、例えば特定部5から順序情報を受け付けると、順序情報に基づいて、信頼度Pの高い順に複数の帳票の種類を表示し、ユーザーから帳票の選択を受け付ける選択画面を表示部7に表示する。表示制御部6は選択画面を介してユーザーから受け付けた帳票の種類を示す情報を、特定部5に入力する。
表示部7は情報を表示する。表示部7は、例えば上述の選択画面を表示する。
入力部8はユーザーからの入力を受け付ける。入力部8は、例えば帳票の種類の選択を示す入力を受け付ける。
次に実施形態の情報処理装置100の情報処理方法について説明する。
図5は実施形態の情報処理方法の例を示すフローチャートである。はじめに、受付部2が、帳票を受け付ける(ステップS1)。次に、認識部3が、帳票の形式情報、及び、帳票に含まれる記入情報を認識する(ステップS2)。認識部3は形式情報を識別部4に入力し、記入情報を特定部5に入力する。次に、識別部4が、帳票の形式情報により帳票の種類を識別できるか否かを判定する(ステップS3)。
帳票の種類を識別できる場合(ステップS3、Yes)、処理はステップS7に進む。
帳票の種類を識別できない場合(ステップS3、No)、特定部5が、帳票の種類を特定した場合の信頼度Pを算出する(ステップS4)。具体的には、特定部5が、認識部3から記入情報を受け付け、識別部4から複数の帳票の種類を示す情報を受け付ける。そして特定部5は、記入情報の記入内容、及び、上述の所定の式に基づいて帳票の種類の信頼度Pを算出する。
次に、表示制御部6が、信頼度Pの高い順に複数の帳票の種類を表示し、ユーザーから帳票の選択を受け付ける選択画面を表示部7に表示する(ステップS5)。次に、入力部8が、帳票の種類の選択を示す入力を受け付ける(ステップS6)。信頼度Pの高い順に複数の帳票の種類が表示部7に表示されるので、表示された帳票の種類が多い場合でも、正しい帳票の種類を選択するためのユーザーの手間を省くことができる。
次に、特定部5が、帳票の種類を特定する(ステップS7)。具体的には、帳票の種類を識別できる場合(ステップS3、Yes)、識別部3が、一の帳票の種類を示す情報を特定部5に入力し、特定部5が帳票の種類を特定する。また帳票の種類を識別できない場合(ステップS3、No)、ステップS6で入力部8が受け付けた帳票の種類の選択を示す入力に基づいて、特定部5が帳票の種類を特定する。
次に、特定部5が、ステップS7で特定された当該帳票の種類の蓄積情報13の記入フィールド毎に記入情報を記憶する(ステップS8)。
最後に実施形態の情報処理装置100のハードウェア構成の例について説明する。図6は実施形態の情報処理装置100のハードウェア構成の例を示す図である。
実施形態の情報処理装置100は、制御装置21、主記憶装置22、補助記憶装置23、表示装置24、入力装置25及び通信装置26を備える。制御装置21、主記憶装置22、補助記憶装置23、表示装置24、入力装置25及び通信装置26は、バス27を介して接続されている。情報処理装置100は、例えばパーソナルコンピュータ及びスマートデバイス等である。
制御装置21は補助記憶装置23から主記憶装置22に読み出されたプログラムを実行する。主記憶装置22はROM(Read Only Memory)やRAM(Random Access Memory)等のメモリである。補助記憶装置23はHDD(Hard Disk Drive)や光学ドライブ等である。図1の記憶部1は主記憶装置22及び補助記憶装置23に対応する。
表示装置24は情報処理装置100の状態等を表示する。表示装置24は、例えば、液晶ディスプレイである。入力装置25は情報処理装置100を操作するためのインタフェースである。入力装置25は、例えばキーボードやマウス等である。情報処理装置100がスマートフォン及びタブレット型端末等のスマートデバイスの場合、表示装置24及び入力装置25はタッチパネルでもよい。通信装置26はネットワークに接続するためのインタフェースである。
実施形態の情報処理装置100で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、メモリカード、CD−R及びDVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記憶媒体に記録されてコンピュータ・プログラム・プロダクトとして提供される。
また実施形態の情報処理装置100で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また実施形態の情報処理装置100で実行されるプログラムをダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。
また実施形態の情報処理装置100のプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
実施形態の情報処理装置100で実行されるプログラムは、上述した図1の各機能ブロック(受付部2、認識部3、識別部4、特定部5及び表示制御部6)を含むモジュール構成となっている。当該各機能ブロックは、実際のハードウェアとしては、制御装置21が上記記憶媒体からプログラムを読み出して実行することにより、上記各機能ブロックが主記憶装置22上にロードされる。すなわち上記各機能ブロックは主記憶装置22上に生成される。なお上述した図2の各機能ブロックの一部又は全部をソフトウェアにより実現せずに、IC(Integrated Circuit)等のハードウェアにより実現してもよい。
以上説明したように、実施形態の情報処理装置100では、記憶部1が、複数の種類の帳票の記入情報を、帳票の種類及び記入フィールド毎に蓄積した蓄積情報13を記憶する。そして特定部5が、蓄積情報13と、認識部3により認識された記入情報とを比較することにより、受付部2により受け付けられた帳票の種類を特定する。これにより形式情報によって帳票の種類を識別することができない場合でも、複数の帳票の種類から一の帳票の種類を特定することができる。
例えば実施形態の情報処理装置100によれば、認識部3が、プレ印字文字列(入力欄の説明等)の文字認識を誤読した場合、又は何らかの原因で文字列が欠落した場合等により、識別部4が帳票の種類を識別することができない場合でも、複数の帳票の種類から一の帳票の種類を特定することができる。
また例えば受付部2が、スキャナではなく、スマートフォン及びタブレット等に内蔵されたカメラの場合、帳票全体が撮影されていないことがある。帳票全体が撮影されていないことにより、識別部4が帳票の種類を識別することができない場合でも、実施形態の情報処理装置100によれば、複数の帳票の種類から一の帳票の種類を特定することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 記憶部
2 受付部
3 認識部
4 識別部
5 特定部
6 表示制御部
7 表示部
8 入力部
11 帳票モデル
12 認識辞書
13 蓄積情報
21 制御装置
22 主記憶装置
23 補助記憶装置
24 表示装置
25 入力装置
26 通信装置
27 バス
100 情報処理装置

Claims (5)

  1. 複数の種類の帳票の記入情報と、前記記入情報のカテゴリを示すカテゴリ情報とを、前記帳票の種類及び記入フィールド毎に蓄積した蓄積情報を記憶する記憶部と、
    前記帳票を受け付ける受付部と、
    前記受付部により受け付けられた前記帳票に含まれる前記記入情報を認識する認識部と、
    前記蓄積情報と、前記認識部により認識された前記記入情報とを比較することにより、前記受付部により受け付けられた前記帳票の種類を特定する特定部と、
    を備え
    前記特定部は、前記認識部により認識された前記記入情報が前記蓄積情報に含まれているか否か、前記認識部により認識された前記記入情報が前記蓄積情報に含まれている割合、及び、前記認識部により認識された前記記入情報と同一のカテゴリの前記記入情報を前記蓄積情報に含む割合に基づいて前記帳票の種類の信頼度を算出し、前記信頼度の高い順に複数の前記帳票の種類を特定する、
    情報処理装置。
  2. 前記信頼度の高い順に複数の前記帳票の種類を表示し、ユーザーから前記帳票の種類の選択を受け付ける選択画面を表示する表示制御部を更に備え、
    前記特定部は、前記ユーザーによる前記帳票の種類の選択に基づいて前記帳票の種類を特定する、
    請求項に記載の情報処理装置。
  3. 前記帳票の種類を識別する識別部を更に備え、
    前記記憶部は、前記帳票の種類毎の形式を示す帳票モデルを更に記憶し、
    前記認識部は、前記受付部により受け付けられた前記帳票の形式を示す形式情報を更に認識し、
    前記識別部は、前記形式情報と前記帳票モデルとを比較することにより、受け付けた前記帳票の種類を識別し、
    前記特定部は、前記識別部が前記帳票の種類を識別できなかった場合、前記蓄積情報と、前記認識部により認識された前記記入情報とを比較することにより、前記受付部により受け付けられた前記帳票の種類を特定する、
    請求項1又は2に記載の情報処理装置。
  4. 複数の種類の帳票の記入情報と、前記記入情報のカテゴリを示すカテゴリ情報とを、前記帳票の種類及び記入フィールド毎に蓄積した蓄積情報を記憶する記憶部を備える情報処理装置の情報処理方法であって、
    情報処理装置が、前記帳票を受け付けるステップと、
    情報処理装置が、前記受け付けるステップにより受け付けられた前記帳票に含まれる前記記入情報を認識するステップと、
    情報処理装置が、前記蓄積情報と、前記認識するステップにより認識された前記記入情報とを比較することにより、前記受け付けるステップにより受け付けられた前記帳票の種類を特定するステップと、を含み、
    前記特定するステップは、前記認識するステップにより認識された前記記入情報が前記蓄積情報に含まれているか否か、前記認識するステップにより認識された前記記入情報が前記蓄積情報に含まれている割合、及び、前記認識するステップにより認識された前記記入情報と同一のカテゴリの前記記入情報を前記蓄積情報に含む割合に基づいて前記帳票の種類の信頼度を算出するステップと、
    前記信頼度の高い順に複数の前記帳票の種類を特定するステップと、
    を含む情報処理方法。
  5. 複数の種類の帳票の記入情報と、前記記入情報のカテゴリを示すカテゴリ情報とを、前記帳票の種類及び記入フィールド毎に蓄積した蓄積情報を記憶する記憶部を備える情報処理装置を、
    前記帳票を受け付ける受付部と、
    前記受付部により受け付けられた前記帳票に含まれる前記記入情報を認識する認識部と、
    前記蓄積情報と、前記認識部により認識された前記記入情報とを比較することにより、前記受付部により受け付けられた前記帳票の種類を特定する特定部、
    として機能させ
    前記特定部は、前記認識部により認識された前記記入情報が前記蓄積情報に含まれているか否か、前記認識部により認識された前記記入情報が前記蓄積情報に含まれている割合、及び、前記認識部により認識された前記記入情報と同一のカテゴリの前記記入情報を前記蓄積情報に含む割合に基づいて前記帳票の種類の信頼度を算出し、前記信頼度の高い順に複数の前記帳票の種類を特定する、
    プログラム。
JP2014198825A 2014-09-29 2014-09-29 情報処理装置、情報処理方法及びプログラム Active JP6325407B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014198825A JP6325407B2 (ja) 2014-09-29 2014-09-29 情報処理装置、情報処理方法及びプログラム
US14/865,316 US10216988B2 (en) 2014-09-29 2015-09-25 Information processing device, information processing method, and computer program product
CN201510623397.4A CN105469028B (zh) 2014-09-29 2015-09-25 信息处理装置及信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014198825A JP6325407B2 (ja) 2014-09-29 2014-09-29 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016071528A JP2016071528A (ja) 2016-05-09
JP6325407B2 true JP6325407B2 (ja) 2018-05-16

Family

ID=55584786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014198825A Active JP6325407B2 (ja) 2014-09-29 2014-09-29 情報処理装置、情報処理方法及びプログラム

Country Status (3)

Country Link
US (1) US10216988B2 (ja)
JP (1) JP6325407B2 (ja)
CN (1) CN105469028B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018026072A (ja) * 2016-08-12 2018-02-15 株式会社小松製作所 施工管理装置、施工管理システムおよび施工管理方法
JP6729486B2 (ja) * 2017-05-15 2020-07-22 京セラドキュメントソリューションズ株式会社 情報処理装置、情報処理プログラム及び情報処理方法
US20200296232A1 (en) * 2019-03-13 2020-09-17 Toshiba Tec Kabushiki Kaisha Image processing device, image processing system, and non-transitory recording medium for performing image recognition

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3469345B2 (ja) 1995-03-16 2003-11-25 株式会社東芝 画像のファイリング装置及びファイリング方法
JPH11306171A (ja) * 1998-04-20 1999-11-05 Fujitsu Ltd 項目情報入力方法及び記録媒体
EP1052593B1 (en) * 1999-05-13 2015-07-15 Canon Kabushiki Kaisha Form search apparatus and method
US7110600B1 (en) * 1999-09-30 2006-09-19 Fujitsu Limited Document identifying device and method
US7054509B2 (en) * 2000-10-21 2006-05-30 Cardiff Software, Inc. Determining form identification through the spatial relationship of input data
US7020320B2 (en) * 2002-03-06 2006-03-28 Parascript, Llc Extracting text written on a check
AU2005201758B2 (en) * 2005-04-27 2008-12-18 Canon Kabushiki Kaisha Method of learning associations between documents and data sets
JP2007109051A (ja) * 2005-10-14 2007-04-26 Seiko Epson Corp 帳票識別装置
JP2007133593A (ja) * 2005-11-09 2007-05-31 Hitachi East Japan Solutions Ltd 識別システム及び識別プログラム
US20070217692A1 (en) * 2006-03-17 2007-09-20 Data Trace Information Services, Llc Property record document data verification systems and methods
JP4310356B2 (ja) * 2006-11-13 2009-08-05 シャープ株式会社 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及び記録媒体
US7610281B2 (en) * 2006-11-29 2009-10-27 Oracle International Corp. Efficient computation of document similarity
JP4918937B2 (ja) 2007-03-08 2012-04-18 富士通株式会社 帳票種識別プログラム、帳票種識別方法および帳票種識別装置
JP4486987B2 (ja) * 2007-09-26 2010-06-23 シャープ株式会社 画像データ出力処理装置、画像データ出力処理方法、プログラム及び記録媒体
US20090116757A1 (en) * 2007-11-06 2009-05-07 Copanion, Inc. Systems and methods for classifying electronic documents by extracting and recognizing text and image features indicative of document categories
US9298979B2 (en) * 2008-01-18 2016-03-29 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
JP2012252657A (ja) 2011-06-06 2012-12-20 Toshiba Corp 帳票識別システム、帳票識別方法、および帳票処理プログラム
US8676731B1 (en) * 2011-07-11 2014-03-18 Corelogic, Inc. Data extraction confidence attribute with transformations
US9275281B2 (en) * 2012-01-12 2016-03-01 Kofax, Inc. Mobile image capture, processing, and electronic form generation
US8885951B1 (en) * 2012-12-14 2014-11-11 Tony Cristofano System and method for data identification and extraction of forms
US9256783B2 (en) * 2013-02-28 2016-02-09 Intuit Inc. Systems and methods for tax data capture and use
US9619701B2 (en) * 2015-05-20 2017-04-11 Xerox Corporation Using motion tracking and image categorization for document indexing and validation

Also Published As

Publication number Publication date
JP2016071528A (ja) 2016-05-09
CN105469028B (zh) 2019-12-20
US20160092729A1 (en) 2016-03-31
US10216988B2 (en) 2019-02-26
CN105469028A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
US10909511B2 (en) Method for providing a graphical user interface for an electronic transaction
CN107798571B (zh) 恶意地址/恶意订单的识别系统、方法及装置
EP3211580B1 (en) Image processing apparatus, display control apparatus, image processing method and recording medium
US20140247997A1 (en) Information processing system, information processing method, and computer program product
US9898464B2 (en) Information extraction supporting apparatus and method
US10706658B2 (en) Vending machine recognition apparatus, vending machine recognition method, and recording medium
US20140239070A1 (en) Commodity information display apparatus and method for displaying commodity information in different forms
WO2018016494A1 (ja) 在庫管理サーバ、在庫管理システム、在庫管理プログラムおよび在庫管理方法
JP7259754B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6325407B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20160171581A1 (en) Apparatus and method for locating products in a retail store using a mobile device
US9355395B2 (en) POS terminal apparatus and commodity specification method
JP7448132B2 (ja) 手書きの構造分解
CN111292153A (zh) 信息推荐方法、装置、系统和存储介质
WO2019181441A1 (ja) 情報処理装置、制御方法、及びプログラム
CN115049052A (zh) 一种商品推荐模型的训练方法、装置及电子设备
US11145064B2 (en) Technologies for detecting crop marks in electronic documents
KR20180019939A (ko) 온라인으로 상품을 구매하는 방법 및 장치
JP7026386B2 (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
CN110717483B (zh) 网络图像识别处理方法,计算机可读存储介质和移动终端
CN111199439B (zh) 一种商品信息处理方法及其装置
US20170161529A1 (en) Object recognition encoder
JP7160086B2 (ja) 情報処理装置、制御方法、及びプログラム
JP2024079918A (ja) 画像処理システム、画像処理方法、及び画像処理プログラム
JP2023078859A5 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160923

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180412

R150 Certificate of patent or registration of utility model

Ref document number: 6325407

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150