JP2016133888A - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP2016133888A JP2016133888A JP2015006832A JP2015006832A JP2016133888A JP 2016133888 A JP2016133888 A JP 2016133888A JP 2015006832 A JP2015006832 A JP 2015006832A JP 2015006832 A JP2015006832 A JP 2015006832A JP 2016133888 A JP2016133888 A JP 2016133888A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- string pattern
- area
- pattern
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】情報処理装置の第1の切出手段は、文字列パタンが記入されるべき領域から認識対象となり得る文字列パタンを切り出し、第2の切出手段は、前記領域の周辺を含む領域から文字列パタンを切り出し、作成手段は、前記第2の切出手段によって切り出された文字列パタンの分割した部分を組み合わせて、認識対象となり得る文字列パタンを作成し、選択手段は、前記第1の切出手段によって切り出された文字列パタンと、前記作成手段によって作成された文字列パタンのうち、認識対象とすべき文字列パタンを選択する。
【選択図】図1
Description
本発明は、文字列が記入されるべき領域に収まっていない場合でも、認識対象とすべき文字列パタンを選択するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
請求項1の発明は、文字列パタンが記入されるべき領域から認識対象となり得る文字列パタンを切り出す第1の切出手段と、前記領域の周辺を含む領域から文字列パタンを切り出す第2の切出手段と、前記第2の切出手段によって切り出された文字列パタンの分割した部分を組み合わせて、認識対象となり得る文字列パタンを作成する作成手段と、前記第1の切出手段によって切り出された文字列パタンと、前記作成手段によって作成された文字列パタンのうち、認識対象とすべき文字列パタンを選択する選択手段を具備することを特徴とする情報処理装置である。
図2〜8は、本実施の形態に関連する技術による処理例を示す説明図である。
帳票等の文字列認識は、レイアウトに関する情報(以下、レイアウト情報ともいう)が指定する領域と書式にしたがって認識対象の文字列パタンが筆記されることを前提としている。帳票等のレイアウトは予め設計されており、そのレイアウト情報として、例えば、文字列が記入されるべき領域の位置、大きさ等がある。なお、文字列パタンは、一般的には手書きによって筆記された文字である。文字列パタンが画像である場合は、文字列認識として文字画像認識が行われ、文字列パタンがストロークである場合は、オンライン文字認識が行われる。
文字列パタンの例を図2に示す。それぞれ、「富士零太郎」が認識対象の文字列パタン220、そのフリガナである「フジゼロタロウ」が非認識対象の文字列パタン230、「富士零太郎」が記入されている領域が認識対象領域(枠210)である。認識対象の文字列パタン220が認識対象領域(枠210)に収まっており、近傍に非認識対象の文字列パタン230が筆記されているが、認識対象領域(枠210)には入り込んでいない。このようにレイアウト情報の指定にしたがって筆記された文字列パタンからは良好な認識結果が得られる。つまり、枠210の領域を切り出すと、文字列パタン220だけを過不足なく取り出すことができているからである。
まず、大きい入り込みのある文字列パタンの例を図3に示す。近傍の非認識対象の文字列パタン320、文字列パタン340が認識対象領域(枠310)に入り込んでいる。実運用において、認識対象領域(枠310)に十分なスペースがある場合、認識対象の文字列パタン330の他に、フリガナ等の近傍の非認識対象の文字列パタン320が認識対象領域(枠310)に入り込んで筆記されることが多々ある。また、認識対象領域外に十分なスペースがない場合、訂正等の非認識対象である追記等(文字列パタン340)が、十分なスペースのある認識対象領域(枠310)に入り込んで筆記されることが多々ある。
また、少ない接触のある文字列パタンの例を図5に示す。非認識対象の文字列パタン530が認識対象領域(枠510)に入り込んだ上に、認識対象の文字列パタン520に接触している。これも、大きい入り込みと同様の理由で発生することが多々ある。
特許文献1に示される先行技術は、認識対象領域から切り出された文字列パタン候補のセットのうち、認識結果の信頼性が低いものについて再度切り出しを行う。なお、信頼性には単文字識別のスコアを参照する。この仕組みにより、初回の文字列パタン切り出しで誤って統合した文字列パタンどうしが分割され、より正しい認識結果が得られる。
特許文献2に示される先行技術は、認識対象領域から切り出された文字列パタン候補のセットのうち、宛名等の所望の情報を表す文字列パタンを探索する。なお、探索においては、各文字列パタン候補の認識結果の信頼性を参照する。そして信頼性には単文字識別のスコアを参照する。また、認識においては所望の情報に関する言語情報を参照する。
特許文献3に示される先行技術は、認識対象領域から切り出された文字列パタン候補のセットから、適切な文字列パタン候補のセットを探索する。初めに切り出される文字列パタン候補のセットには過分割や過統合がありうることを想定している。探索においては位置情報、形状情報、及び、言語情報を参照する。
特許文献1、特許文献2、特許文献3に示される技術を利用することで、図3、図4、図5の例に示すような入り込み・はみ出し・接触の問題は解決され得る。
そのためには、まず、レイアウト情報が指定する認識対象領域の周辺を切り出すことが必要である。
さらに、非認識対象と認識対象の文字列パタンが複雑に入り組んでいる場合や、多い接触がある場合、特許文献1、特許文献2、特許文献3に示される技術の利用では、文字列パタン候補のセットに正しい文字列パタンが含まれず、正しい文字列認識結果が得られない、という問題がある。以下、このことを図6、図7、図8に示す例を用いて説明する。
続いて、非認識対象の文字列パタンと複雑に入り組んでいる小さいはみ出しのある例を図7に示す。図7の例は、枠710からの文字列パタン720のはみ出しは小さいが、図4の例の場合と異なり、非認識対象の文字パタン730と認識対象の文字列パタン720が互いに複雑に入り組んでいる。
最後に、多い接触のある例を図8に示す。図8の例は、枠810からの文字列パタン820のはみ出し、枠810への文字列パタン830の入り込みが小さいが、図5の例の場合と異なり、認識対象の文字列パタン820と非認識対象の文字列パタン830の接触箇所数が多い。
さらに、図6、図7、図8のような非認識対象と認識対象の文字列パタンを分割するためには、積極的な分割を行う必要があるため過分割の度合いが高くなる。このような場合、評価すべき文字列パタン候補の数が過剰となり、正しい認識結果を得られる割合が低くなる、という問題がある。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、ひとつのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、ひとつのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
文字列パタン分割モジュール130は、レイアウト指定領域周辺切り出しAモジュール120、文字列パタン候補作成モジュール140と接続されており、レイアウト指定領域周辺切り出しAモジュール120より周辺パタン125を受け取り、文字列パタン候補作成モジュール140に部分パタンのセット135を渡す。文字列パタン分割モジュール130は、周辺パタン125を文字列パタン候補の部分となるようなパタンへ分割し、これを部分パタンのセット135として出力する。また、文字列パタン分割モジュール130は、部分パタンのセット135として、行方向に境界線がある領域を分割してもよい。なお、ここで行方向とは、文字列の方向であり、横書きの領域である場合は横方向であり、縦書きの領域である場合は縦方向である。
文字列パタン候補作成モジュール140は、文字列パタン分割モジュール130、文字列パタン選択Aモジュール150と接続されており、文字列パタン分割モジュール130より部分パタンのセット135を受け取り、文字列パタン選択Aモジュール150に文字列パタン候補のセット145を渡す。文字列パタン候補作成モジュール140は、レイアウト指定領域周辺切り出しAモジュール120によって切り出された文字列パタンの分割した部分を組み合わせて、認識対象となり得る文字列パタンを作成する。具体的には、部分パタンのセット135から、組み合わせにより文字列パタン候補を作成し、これを文字列パタン候補のセット145として出力する。また、文字列パタン候補作成モジュール140は、部分パタンのセット135(文字列パタンの分割した部分)の組み合わせとして、互いに隣合っている領域を組み合わせてもよい。
図6、図7、図8の例に示す問題は、認識対象領域に十分なスペースがない場合に生じることが多い。筆記領域が狭いために相対的に文字列パタンが領域を占める割合が大きくなり、領域をはみ出すことによって、非認識対象と認識対象の文字列パタンが図6、図7の例のように複雑に入り組む、又は図8の例のように接触が多くなる。しかし同時に、十分なスペースがある場合と異なり、領域に忠実な筆記がなされることが多く、非認識対象と認識対象の文字列パタンの境界はレイアウト情報が指定する認識対象領域の境界に忠実であることが多い。このような場合は、文字列パタンの切り出し技術を利用するよりも、レイアウト情報が指定する認識対象領域によって文字列パタンを切り出す方が、より良好な文字列認識結果が得られる。
そこで、第1の実施の形態は図6、図7、図8の例に示すような入力パタンから、正しい文字列パタン候補を得るために、レイアウト指定領域切り出しモジュール110を持つ。併せて、図3、図4、図5の例に示すような入力パタンから正しい文字列パタン候補を得るためにレイアウト指定領域周辺切り出しAモジュール120、文字列パタン分割モジュール130、文字列パタン候補作成モジュール140を持つ。そして、特許文献1、特許文献2、特許文献3に示される技術と同様に、文字列パタン候補作成モジュール140が最も尤もらしい文字列パタンを選択する。
なお、レイアウト指定領域切り出しモジュール110は、単純な部分領域の切り出しであり、その実現方法は自明である。
また、レイアウト指定領域周辺切り出しAモジュール120の実現方法は、特許文献1、特許文献2、特許文献3のような先行技術の利用が考えられる。なお、周辺領域とは、レイアウト情報が指定する認識対象領域を予め定められた割合だけ広げた領域としてもよいし、予め定められた大きさだけ領域を広げたものであってもよい。また、対象としている領域の予め定めた方向(例えば、上方向)にだけ広げて周辺領域としてもよいし、方向毎に独立した大きさで広げて周辺領域としてもよい。
具体的には、まず、図9の例に示すように、認識対象領域(枠910)を含む周辺領域990を切り出す。なお、この入力パタンは図4の例であり、文字列パタン920は文字列パタン420に対応し、枠910は枠410に対応する。参考のため、図4の例からレイアウト情報の指定する認識対象領域を切り出した例(レイアウト指定領域切り出しモジュール110が切り出した文字列パタン候補115の例)は、図10の切り取り領域1020のようになる。なお、枠1010は枠410に対応し、切り取り領域1020は、文字列パタン920の一部分であって枠910(枠1010)に含まれている部分である。また、分かりやすさのため、以後、切り出した部分パタンの最外殻矩形(外接矩形)を点線で示す。図10の例に示す切り取り領域1020内は、正しい文字列パタンではない(認識には適していない文字列パタンである)。続いて、図9の例に示す周辺領域990に対して、文字列パタン候補のセットを作成する。特許文献4に示される分割技術を利用し、図11の例に示すように、分割境界1115、1125が得られたとする。これらによって、周辺領域990は、分割領域1110、1120、1130に分割される。図11の例に示す分割境界1115、1125の境界で分割される部分パタンの最小単位を図12、図13、図14の例に示す。部分パタン1210は分割領域1110に対応し、部分パタン1320は分割領域1120に対応し、部分パタン1430は分割領域1130に対応する。図12、図13、図14の例に示す部分パタン1210、部分パタン1320、部分パタン1430は、単独ではいずれも正しい文字列パタンではない。しかし、図5の例のような接触を想定した場合、この程度の過分割が必要である。そこで、文字列パタン候補には、図12、図13、図14の例に示す部分パタンに加え、これらをマージした部分パタンも含める。ここでのマージは、互いに隣合う部分パタンを組み合わせたものである。具体的には、部分パタン1210(分割領域1110)と部分パタン1320(分割領域1120)の組み合わせ、部分パタン1320(分割領域1120)と部分パタン1430(分割領域1130)の組み合わせ、部分パタン1210(分割領域1110)と部分パタン1320(分割領域1120)と部分パタン1430(分割領域1130)の組み合わせがある。この例では、図12、図13、図14に示す例の全てをマージした場合に正しい文字列パタン(認識対象とすべき文字列パタン)となる。
具体的には、文字列認識結果の単文字識別機のスコアを参照する方法がある。単文字識別機は、非特許文献1に示されるような先行技術を利用すればよい。各文字列パタン候補の文字列認識結果に含まれる全ての単文字について、単文字識別機のスコアの最小値が最大である文字列パタン認識候補を選択する方法が考えられる。つまり、文字列パタン候補に対して、エネルギー最小パス選択による文字列認識が出力するパスに含まれる単文字の単文字識別スコアの最小値が最大のものを選択すればよい。この最小値の利用には、文字列認識結果の文字数の影響や、誤って切り出された文字列パタン候補に部分的に含まれる正しい単文字パタンの影響を抑える効果がある。
また、非特許文献2に示されるような、エネルギー最小パス選択による文字列認識機が出力するパスのエネルギーが最小である文字列パタン候補を選択する方法が考えられる。具体的には、非特許文献2に示されるエネルギー関数E(X,Y,Θ)は、数式1の形式で表される。Xは入力の文字列パタン候補を表す。Yは出力の文字列を表す。また、Θはエネルギー計算のパラメータを表す。また、prev(y)はYにおける文字yの直前の文字を表す。また、E(y’,y,X,Θ)は連続する文字y’,yのエネルギーを表す。なお、非特許文献2は非特許文献3に示されるエネルギー関数を利用しているが、非特許文献4に示されるものを利用してもよい。なお、非特許文献2、非特許文献3、非特許文献4に示される技術は、数式1のE(X,Y,Θ)を最小化するようなYを認識結果として出力する。
なお、数式1を利用する場合においては、エネルギーの算出と同時に認識結果の文字列Yが得られているため、これを文字列認識機の出力とすればよい。これにより、冗長な処理がなく高速である。
図17(a)に示す例は、入力パタン105の例であり、図4に示すものと同じである。
図17(b)に示す例は、文字列パタン候補115の例であり、図10に示す切り取り領域1020と同じである。
図17(c)に示す例は、周辺パタン125の例であり、図9に示すものと同じである。
図17(d1)〜(d3)に示す例は、部分パタンのセット135の例である。図17(d1)に示す例は、部分パタンのセット135の部分例(セットの一要素)であり、図12に示すものと同じである。図17(d2)に示す例は、部分パタンのセット135の部分例であり、図13に示すものと同じである。図17(d3)に示す例は、部分パタンのセット135の部分例であり、図14に示すものと同じである。
図17(e1)〜(e6)に示す例は、文字列パタン候補のセット145の例であり、図17(d1)〜(d3)の組み合わせ例である。図17(e1)に示す例は、図17(d1)に示すものと同じである。図17(e2)に示す例は、図17(d1)と(d2)の組み合わせ例である。図17(e3)に示す例は、図17(d1)と(d2)と(d3)の組み合わせ例である。図17(e4)に示す例は、図17(d2)に示すものと同じである。図17(e5)に示す例は、図17(d2)と(d3)の組み合わせ例である。図17(e6)に示す例は、図17(d3)に示すものと同じである。
図17(f)に示す例は、文字列パタン195の例であり、文字列パタン候補115、文字列パタン候補のセット145から、最も文字列らしい文字列パタン(図17(e3)に示す例)を選択したものである。
第2の実施の形態は、レイアウト指定領域切り出しモジュール110、レイアウト指定領域周辺切り出しAモジュール120、文字列パタン分割モジュール130、文字列パタン候補作成モジュール140、文字列パタン選択Bモジュール1850を有しており、レイアウト情報117が、文字列パタン195を選択するためのパラメータを持つ例を示している。レイアウト情報117に所望の文字列に最適化されたパラメータを指定しておくことで、様々な入力パタン105に対して、文字列パタンの選択が可能となる。
レイアウト指定領域切り出しモジュール110は、文字列パタン選択Bモジュール1850と接続されており、入力パタン105を受け付け、レイアウト情報117を用いた切り出し処理を行い、文字列パタン選択Bモジュール1850に文字列パタン候補115を渡す。
文字列パタン候補作成モジュール140は、文字列パタン分割モジュール130、文字列パタン選択Bモジュール1850と接続されており、文字列パタン分割モジュール130より部分パタンのセット135を受け取り、文字列パタン選択Bモジュール1850に文字列パタン候補のセット145を渡す。
文字列パタン選択Bモジュール1850は、レイアウト指定領域切り出しモジュール110、文字列パタン候補作成モジュール140と接続されており、レイアウト指定領域切り出しモジュール110より文字列パタン候補115を受け取り、文字列パタン候補作成モジュール140より文字列パタン候補のセット145を受け取り、レイアウト情報117を用いた選択処理を行い、文字列パタン195を出力する。文字列パタン選択Bモジュール1850は、文字列パタン選択Aモジュール150と同等の処理を行うが、レイアウト情報117に記述されている選択パラメータを参照し、文字列パタン候補115又は文字列パタン候補のセット145から、前述した手法により、文字列パタン195をひとつ選択し、出力する。例えば、レイアウト情報117内には、枠内に記載される文字列パタンの意味に関する情報(例えば、氏名欄、住所欄等を示す情報、以下、選択パラメータともいう)が含まれており、文字列パタン選択Bモジュール1850は、レイアウト情報117内の枠の意味に関する情報を用いて、文字列パタンを選択する。例えば、レイアウト情報117内に住所欄であることを示す情報が含まれている場合は、予め用意している住所(県名、市町村名等)の文字列パタンに合致している文字列パタンを選択すればよい。
第3の実施の形態は、レイアウト指定領域切り出しモジュール110、レイアウト指定領域周辺切り出しAモジュール120、文字列パタン分割モジュール130、文字列パタン候補作成モジュール140、文字列パタン選択Bモジュール1850、文字列認識Aモジュール1960を有している。第2の実施の形態に、文字列認識Aモジュール1960を付加したものであり、文字列パタン195の代わりに文字列認識結果1995を出力する。
文字列パタン選択Bモジュール1850は、レイアウト指定領域切り出しモジュール110、文字列パタン候補作成モジュール140、文字列認識Aモジュール1960と接続されており、レイアウト指定領域切り出しモジュール110より文字列パタン候補115を受け取り、文字列パタン候補作成モジュール140より文字列パタン候補のセット145を受け取り、レイアウト情報117を用いた選択処理を行い、文字列認識Aモジュール1960に文字列パタン195を渡す。
文字列認識Aモジュール1960は、文字列パタン選択Bモジュール1850と接続されており、文字列パタン選択Bモジュール1850より文字列パタン195を受け取り、文字列パタン195に対して文字列認識を行い、その文字列認識結果1995を出力する。文字列認識は既存の技術を用いればよい。前述したように、文字列パタン195が画像である場合は、文字列認識として文字画像認識が行われ、文字列パタン195がストロークである場合は、オンライン文字認識が行われる。
第4の実施の形態は、レイアウト指定領域切り出しモジュール110、レイアウト指定領域周辺切り出しAモジュール120、文字列パタン分割モジュール130、文字列パタン候補作成モジュール140、文字列認識Bモジュール2050、文字列認識結果選択モジュール2060を有している。前述の通り、数式1を利用する場合においては、エネルギーの算出と文字列認識結果が得られているため、これを出力とすればよい。すなわち、まず文字列認識を行い、続いてその文字認識結果に基づいて文字パタンを選択する、という順序になる。第4の実施の形態によれば、冗長な処理がないために、高速に処理結果が得られる。
レイアウト指定領域切り出しモジュール110は、文字列認識Bモジュール2050と接続されており、入力パタン105を受け付け、レイアウト情報117を用いた切り出し処理を行い、文字列認識Bモジュール2050に文字列パタン候補115を渡す。
文字列パタン候補作成モジュール140は、文字列パタン分割モジュール130、文字列認識Bモジュール2050と接続されており、文字列パタン分割モジュール130より部分パタンのセット135を受け取り、文字列認識Bモジュール2050に文字列パタン候補のセット145を渡す。
文字列認識Bモジュール2050は、レイアウト指定領域切り出しモジュール110、文字列パタン候補作成モジュール140と接続されており、レイアウト指定領域切り出しモジュール110より文字列パタン候補115を受け取り、文字列パタン候補作成モジュール140より文字列パタン候補のセット145を受け取り、レイアウト情報117を用いた文字列認識処理を行い、文字列認識結果選択モジュール2060に文字列認識結果のセット2055を渡す。文字列認識Bモジュール2050は、レイアウト指定領域切り出しモジュール110によって切り出された文字列パタン候補115と、文字列パタン候補作成モジュール140によって作成された文字列パタン候補のセット145を文字認識し、文字列認識結果のセット2055を出力する。具体的には、レイアウト情報117に記述される選択パラメータを参照し、文字列パタン候補のセット145の各文字列パタン候補に対して文字列認識を行い、文字列認識結果のセット2055を出力する。このとき、文字列認識結果選択モジュール2060での選択のための評価値(前述の確度等)を各文字列認識結果に付与しておく。
文字列認識結果選択モジュール2060は、文字列認識Bモジュール2050と接続されており、文字列認識Bモジュール2050より文字列認識結果のセット2055を受け取り、文字列認識結果2095を出力する。文字列認識結果選択モジュール2060は、文字列認識Bモジュール2050によって文字認識された文字列認識結果のセット2055から、評価値を参照して文字列認識結果2095を選択する。また、レイアウト情報117に記述される選択パラメータを用いて選択するようにしてもよい。
第5の実施の形態は、レイアウト指定領域切り出しモジュール110、レイアウト指定領域周辺切り出しBモジュール2120、隣接フリガナレイアウト情報読み出しモジュール2130、文字列パタン分割モジュール130、文字列パタン候補作成モジュール140、文字列認識Bモジュール2050、文字列認識結果選択モジュール2060を有しており、フリガナ領域が隣接する文字列パタンを認識対象とするものである。対象としている領域に対してフリガナ領域が隣接する場合、その情報を参照して周辺領域を決定することが望ましい。例えば、フリガナ領域を周辺領域に含めるようにしてもよい。これにより、文字列切り出し技術がフリガナをフリガナとして正しく切り出す傾向が高まり、より正しい分割を得ることができる。また、隣接領域まで跨って筆記された文字列がより正確に文字列パタン候補のセットに含まれるようになる。
隣接フリガナレイアウト情報読み出しモジュール2130は、レイアウト指定領域周辺切り出しBモジュール2120と接続されており、レイアウト情報117を受け取り、レイアウト指定領域周辺切り出しBモジュール2120に隣接領域情報2125を渡す。隣接フリガナレイアウト情報読み出しモジュール2130は、認識対象である領域に隣接する領域の情報(隣接領域情報2125)をレイアウト情報117から読みだす。この隣接する領域の情報は、予めレイアウト情報117に記述されている。
レイアウト指定領域周辺切り出しBモジュール2120は、隣接フリガナレイアウト情報読み出しモジュール2130、文字列パタン分割モジュール130と接続されており、入力パタン105を受け付け、隣接フリガナレイアウト情報読み出しモジュール2130より隣接領域情報2125を受け取り、文字列パタン分割モジュール130に周辺パタン125を渡す。レイアウト指定領域周辺切り出しBモジュール2120は、文字列パタンが記入されるべき領域に隣接する領域であって、フリガナが記入されるべき領域が指定されている場合は、そのフリガナが記入されるべき領域を周辺の領域として、文字列パタンを切り出す。具体的には、隣接領域情報2125を参照し、入力パタン105から、レイアウト情報117が指定する領域の周辺の文字列パタンを切り出し、これを周辺パタン125として出力する。
文字列パタン分割モジュール130は、レイアウト指定領域周辺切り出しBモジュール2120、文字列パタン候補作成モジュール140と接続されており、レイアウト指定領域周辺切り出しBモジュール2120より周辺パタン125を受け取り、文字列パタン候補作成モジュール140に部分パタンのセット135を渡す。文字列パタン分割モジュール130は、隣接領域情報2125を参照して、フリガナ領域と対象としている領域の境界位置の周辺で、周辺パタン125の分割を行う。
第6の実施の形態は、本実施の形態2210、レイアウト読み出しモジュール2220を有しており、複数の認識対象領域を扱うものである。ひとつの入力パタン2205に対して、認識対象領域を示すレイアウト情報セット2215を指定し、文字列認識結果のセット2295を得ることができる。
レイアウト読み出しモジュール2220は、本実施の形態2210と接続されており、レイアウト情報セット2215を受け付け、本実施の形態2210にレイアウト情報2225を渡す。レイアウト読み出しモジュール2220は、認識対象領域のセットを指定するレイアウト情報セット2215から、レイアウト情報2225をひとつずつ読み出し、前述の第1の実施の形態から第5の実施の形態のいずれか1つの実施の形態2210へ入力する。
本実施の形態2210は、レイアウト読み出しモジュール2220と接続されており、入力パタン2205を受け付け、レイアウト読み出しモジュール2220よりレイアウト情報2225を受け取り、文字列認識結果のセット2295を出力する。本実施の形態2210は、第3の実施の形態(図19)、第4の実施の形態(図20)、又は、第5の実施の形態(図21)の例に示した実施の形態である。なお、文字列パタン195を出力するのであれば、第1の実施の形態(図1)又は第2の実施の形態(図18)であってもよい。レイアウト読み出しモジュール2220から受け取ったレイアウト情報2225をレイアウト情報117として用いて、前述した処理を行う。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読み出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読み出し専用メモリ(ROM)、電気的消去及び書換可能な読み出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
110…レイアウト指定領域切り出しモジュール
115…文字列パタン候補
117…レイアウト情報
120…レイアウト指定領域周辺切り出しAモジュール
125…周辺パタン
130…文字列パタン分割モジュール
135…部分パタンのセット
140…文字列パタン候補作成モジュール
145…文字列パタン候補のセット
150…文字列パタン選択Aモジュール
195…文字列パタン
1850…文字列パタン選択Bモジュール
1960…文字列認識Aモジュール
1995…文字列認識結果
2050…文字列認識Bモジュール
2055…文字列認識結果のセット
2060…文字列認識結果選択モジュール
2095…文字列認識結果
2120…レイアウト指定領域周辺切り出しBモジュール
2125…隣接領域情報
2130…隣接フリガナレイアウト情報読み出しモジュール
2205…入力パタン
2210…本実施の形態
2215…レイアウト情報セット
2220…レイアウト読み出しモジュール
2225…レイアウト情報
2295…文字列認識結果のセット
Claims (5)
- 文字列パタンが記入されるべき領域から認識対象となり得る文字列パタンを切り出す第1の切出手段と、
前記領域の周辺を含む領域から文字列パタンを切り出す第2の切出手段と、
前記第2の切出手段によって切り出された文字列パタンの分割した部分を組み合わせて、認識対象となり得る文字列パタンを作成する作成手段と、
前記第1の切出手段によって切り出された文字列パタンと、前記作成手段によって作成された文字列パタンのうち、認識対象とすべき文字列パタンを選択する選択手段
を具備することを特徴とする情報処理装置。 - 前記選択手段は、前記第1の切出手段によって切り出された文字列パタンと、前記作成手段によって作成された文字列パタンを文字認識し、該文字認識による結果に基づいて文字列パタンを選択する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記作成手段における、文字列パタンの分割した部分として、行方向に境界線がある領域であり、該文字列パタンの分割した部分の組み合わせとして、互いに隣合っている領域を組み合わせたものである
ことを特徴とする請求項1又は2に記載の情報処理装置。 - 前記第2の切出手段は、前記文字列パタンが記入されるべき領域に隣接する領域であって、フリガナが記入されるべき領域が指定されている場合は、該フリガナが記入されるべき領域を前記周辺の領域として、文字列パタンを切り出す
ことを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。 - コンピュータを、
文字列パタンが記入されるべき領域から認識対象となり得る文字列パタンを切り出す第1の切出手段と、
前記領域の周辺を含む領域から文字列パタンを切り出す第2の切出手段と、
前記第2の切出手段によって切り出された文字列パタンの分割した部分を組み合わせて、認識対象となり得る文字列パタンを作成する作成手段と、
前記第1の切出手段によって切り出された文字列パタンと、前記作成手段によって作成された文字列パタンのうち、認識対象とすべき文字列パタンを選択する選択手段
として機能させるための情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015006832A JP6547301B2 (ja) | 2015-01-16 | 2015-01-16 | 情報処理装置及び情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015006832A JP6547301B2 (ja) | 2015-01-16 | 2015-01-16 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016133888A true JP2016133888A (ja) | 2016-07-25 |
JP6547301B2 JP6547301B2 (ja) | 2019-07-24 |
Family
ID=56434518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015006832A Active JP6547301B2 (ja) | 2015-01-16 | 2015-01-16 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6547301B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020004124A (ja) * | 2018-06-28 | 2020-01-09 | 富士通株式会社 | 筆記選択プログラム、筆記選択方法および情報処理装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0954813A (ja) * | 1995-08-11 | 1997-02-25 | Fujitsu Ltd | 文字切り出し装置 |
-
2015
- 2015-01-16 JP JP2015006832A patent/JP6547301B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0954813A (ja) * | 1995-08-11 | 1997-02-25 | Fujitsu Ltd | 文字切り出し装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020004124A (ja) * | 2018-06-28 | 2020-01-09 | 富士通株式会社 | 筆記選択プログラム、筆記選択方法および情報処理装置 |
JP7035852B2 (ja) | 2018-06-28 | 2022-03-15 | 富士通株式会社 | 筆記選択プログラム、筆記選択方法および情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6547301B2 (ja) | 2019-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6119952B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5663866B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2007304864A (ja) | 文字認識処理システムおよび文字認識処理プログラム | |
US9280725B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
JP2015169978A (ja) | 画像処理装置及び画像処理プログラム | |
JP5343617B2 (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
JP7172351B2 (ja) | 文字列認識装置及び文字列認識プログラム | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6547301B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4834351B2 (ja) | 文字認識装置及び文字認識方法 | |
JP6303671B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6007720B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6260350B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5888222B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6511942B2 (ja) | 情報処理装置および情報処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2017010187A (ja) | 画像処理装置及び画像処理プログラム | |
JP6003677B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2016009235A (ja) | 情報処理装置及び情報処理プログラム | |
JP4882929B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6323009B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2010039810A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6547301 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |