JP2007317022A - 手書文字処理装置及び手書文字処理方法 - Google Patents
手書文字処理装置及び手書文字処理方法 Download PDFInfo
- Publication number
- JP2007317022A JP2007317022A JP2006147161A JP2006147161A JP2007317022A JP 2007317022 A JP2007317022 A JP 2007317022A JP 2006147161 A JP2006147161 A JP 2006147161A JP 2006147161 A JP2006147161 A JP 2006147161A JP 2007317022 A JP2007317022 A JP 2007317022A
- Authority
- JP
- Japan
- Prior art keywords
- character
- search
- handwritten
- handwritten character
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】手書文字が含まれる文書ファイル等の検索に有効な手書文字処理装置及び手書文字処理方法を提供する。
【解決手段】検索部36は、検索対象として文字又は文字列が座標入力部21に入力された場合に、当該文字又は文字列に基づいて、文書ファイル記憶部34に記憶されているテキストコード及び/又は手書軌跡記憶部35に記憶されている手書軌跡座標データの検索を実行する。そして、所望の文書ファイルを見つけ出す。この検索に当たり、検索部36は、認識結果選別部33によって認識可能文字と判断されたものについてはテキストコードに基づいてテキスト文字を検索し、認識不能文字と判断されたものについてはその軌跡に基づいて認識不能文字を検索する。
【選択図】図3
【解決手段】検索部36は、検索対象として文字又は文字列が座標入力部21に入力された場合に、当該文字又は文字列に基づいて、文書ファイル記憶部34に記憶されているテキストコード及び/又は手書軌跡記憶部35に記憶されている手書軌跡座標データの検索を実行する。そして、所望の文書ファイルを見つけ出す。この検索に当たり、検索部36は、認識結果選別部33によって認識可能文字と判断されたものについてはテキストコードに基づいてテキスト文字を検索し、認識不能文字と判断されたものについてはその軌跡に基づいて認識不能文字を検索する。
【選択図】図3
Description
本発明は、手書きで書かれた軌跡が記録される文書ファイル等の処理に好適な手書文字処理装置及び手書文字処理方法に関するものである。
従来、手書入力文字を検索する装置が特許文献1及び2等に開示されている。
特許文献1に記載された装置には、ストロークデータを入力する手段と、前記入力された複数のストロークから検索の対象となるキーストロークを判別して設定する検索ストローク設定手段と、が設けられている。更に、入力ストロークによりキーストロークを検索して該検索キーストロークにより記憶手段に記憶された複数のグループ情報から検索されたキーストロークを含むグループ情報を特定する検索手段等が設けられている。
特許文献2に記載された装置には、文書中の記号等を辞書登録されている文字パターン情報との類似度により文字認識する際に、本来ならばリジェクトされる類似度の低い記号等に対して得られる複数の文字コードを認識結果として記憶する手段が設けられている。
しかしながら、特許文献1に記載された検索装置では、検索キーとなるキーストロークを、入力されている軌跡ストロークのデータの中から検索ストローク設定手段により設定することにより決めている。このため、文書ファイル内のあるストロークをキーストロークとして設定する場合は、その都度、この設定操作を行わなければならない。また、このような設定を行っていないストロークは検索対象とならないため、事前に検索キーとして有効なストロークを設定する必要があり、ユーザにとっては使い勝手がよいとは言い難い。
また、特許文献2に記載された検索装置では、辞書データとの類似度が低いパターンに対する認識を行っているので、この結果が毎回同じものとなることは期待できない。また、辞書パターンと記号等の形状との類似性によっては、異なる記号等の間でも、結果の複数の文字コードが同一となる組み合わせも考えられる。従って、実用的な検索結果を期待できない。
更に、従来の検索装置では、手書軌跡に固有な情報(例えば、大きさ、入力時の筆圧等が)を考慮した検索を行うことができない。
そこで、本発明は、手書文字が含まれる文書ファイル等の検索に有効な手書文字処理装置及び手書文字処理方法を提供することを目的とする。
本願発明者は、前記課題を解決すべく鋭意検討を重ねた結果、以下に示す発明の諸態様に想到した。
本発明に係る第1の手書文字処理装置は、手書文字を入力する手書文字入力手段と、複数の文字について、その形状を記憶した辞書と、前記手書文字入力手段に入力された手書文字と前記辞書に記憶された文字の形状とを比較し、当該手書文字が辞書内のどの文字に対応するかを認識すると共に、当該手書文字と当該対応文字との類似度を判断する手書文字認識手段と、前記類似度が予め定められている基準値よりも低い場合、当該手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手段と、前記文字コードを、前記認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶する記憶手段と、を有することを特徴とする。
本発明に係る第2の手書文字処理装置は、文字列毎に、当該文字列を構成する文字の文字コードを、認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶した記憶手段と、検索用の手書文字を入力する検索用手書文字入力手段と、複数の文字について、その形状を記憶した辞書と、前記検索用手書文字入力手段に入力された検索用の手書文字と前記辞書に記憶された文字の形状とを比較し、当該検索用の手書文字が辞書内のどの文字に対応するかを認識すると共に、当該検索用の手書文字と当該対応文字との類似度を判断する手書文字認識手段と、前記類似度が予め定められている基準値よりも低い場合、当該検索用の手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該検索用の手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手段と、前記選別手段により付与された文字コードを用いて前記記憶手段に記憶されているデータの検索を行う検索手段と、を有し、前記検索手段は、前記選別手段により付与された前記認識不能コードを用いて検索を行う場合、当該検索用の手書文字の手書軌跡データと前記記憶手段に記憶されている手書軌跡データとの類似度を検出し、この検出結果に基づく検索を行うことを特徴とする。
本発明に係る第3の手書文字処理装置は、手書文字を入力する手書文字入力手段と、検索用の手書文字を入力する検索用手書文字入力手段と、複数の文字について、その形状を記憶した辞書と、前記手書文字入力手段又は検索用手書文字入力手段に入力された手書文字と前記辞書に記憶された文字の形状とを比較し、当該手書文字又は検索用の手書文字が辞書内のどの文字に対応するかを認識すると共に、当該手書文字又は検索用の手書文字と当該対応文字との類似度を判断する手書文字認識手段と、前記類似度が予め定められている基準値よりも低い場合、当該手書文字又は検索用の手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該手書文字又は検索用の手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手段と、前記手書文字入力手段に手書文字が入力された場合、前記文字コードを、前記認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶する記憶手段と、前記検索用手書文字入力手段に検索用の手書文字が入力された場合、前記選別手段により付与された文字コードを用いて前記記憶手段に記憶されているデータの検索を行う検索手段と、を有し、前記検索手段は、前記選別手段により付与された前記認識不能コードを用いて検索を行う場合、当該検索用の手書文字の手書軌跡データと前記記憶手段に記憶されている手書軌跡データとの類似度を検出し、この検出結果に基づく検索を行うことを特徴とする。
本発明によれば、テキストコード及び手書軌跡データを用いた検索を行うことが可能となる。このため、検索用に入力された手書文字(手書文字列)に最も類似している文書ファイル等を記憶手段の中から容易に探し出すことが可能となり、手書文字が含まれる文書ファイル等の検索に極めて有好である。また、記憶手段に記憶されている手書軌跡データの当該手書文字を含む文書内での占有面積率の評価を行い、この評価結果にも基づいて検索を行う場合には、類似度が等しい軌跡を含む2以上のデータが検出されたときにも、適切な優先度を設定することができる。例えば、大きく書かれた手書軌跡データが含まれるものを優先させれば、より重要度が高いと考えられるデータを優先的に検出することができる。
以下、本発明の実施形態について添付の図面を参照して具体的に説明する。
(第1の実施形態)
先ず、本発明の第1の実施形態について説明する。図1は、本発明の第1の実施形態に係る手書文字処理装置を示す図である。
先ず、本発明の第1の実施形態について説明する。図1は、本発明の第1の実施形態に係る手書文字処理装置を示す図である。
本実施形態に係る手書文字処理装置1は、例えば携帯情報機器であり、単独で使用することも可能であるが、図1に示すように、例えばローカルエリアネットワーク3を介してパーソナルコンピュータ5に接続して使用することも可能である。
手書文字処理装置1には、図2に示すように、座標入力部21及び画像出力部22として機能する液晶表示部2が設けられている。更に、手書文字処理装置1には、CPU6、RAM7、ROM8、ハードディスク(HD)9、LANカード10及び無線通信カード12が設けられている。更に、図示しないが、記録メディアを差し込むスロット、他の情報機器等との接続に用いられるUSB等のインタフェイス等も設けられている。この手書文字処理装置1は、座標入力部21に入力された手書文字の軌跡を、後述の処理によって表示したり、HD9内の文書ファイルの検索を行ったりする。
座標入力部21は透明抵抗膜デジタイザ等を備えており、ペン書かれた軌跡のXY座標データを読み込むことができる。また、座標入力部21は、システムバス11経由でCPU6に接続されている。画像出力部22は、液晶表示素子、液晶制御回路及び表示メモリを備えており、システムバス11経由でCPU6に接続されている。そして、画像出力部22は、CPU6からの指示に基づいて、手書軌跡の表示や文字フォントの表示を実行する。また、座標入力部21上に手書入力されると、その軌跡がそのまま画像出力部22に表示される。このように、液晶表示部2は、そこに入力された手書の軌跡、認識結果の文字フォント等を表示する表示一体型座標入力部として機能する。
CPU6は、システムバス11を介して、RAM7、ROM8、液晶表示部2等に接続されており、ROM8に記憶されているプログラムに基づいて後述の処理を行う。
RAM7は、手書きされた文字の保存等に用いられ、また、CPU6がROM8から読み出したプログラムを実行する際にワーク領域として用いられる。
ROM8は、手書文字の処理手順や、他のアプリケーション処理手順等を記憶している。また、液晶表示部の制御プログラムも記憶されている。
HD9は、例えば一般的な携帯機器にも用いられている小型ハードディスクであり、システムバス11経由でCPU6に接続されている。HD9には、入力された文書ファイル等が記憶される。
LANカード10は、一般的なローカルエリアネットワークのインタフェイスカードであり、これを介して他のパーソナルコンピュータとの通信が行われる。
システムバス11は、CPU6とRAM7、ROM8等との間でのデータ等のやり取りに用いられる。
無線通信カード12は、内部に無線LANのコントローラやアンテナを内蔵している。無線通信カード12内のコントローラに規定のコマンドを受け渡すことによって、無線ローカルエリアネットワークへ接続し、通信機能をもった他のパーソナルコンピュータと通信し、デジタル画像の送受信、制御コマンドの送受信を実行できる。つまり、手書文字処理装置1の画面に表示されている情報の共有や、検索結果表示等を外部のパーソナルコンピュータとやり取りする。送受信のプロトコルとしては、一般に用いられているものを用いることができる。
次に、第1の実施形態における機能構成について説明する。図3は、本発明の第1の実施形態に係る手書文字処理装置を示す機能構成図である。図3中の各部は、ROM8に記憶されたプログラム及びCPU6等により構成されている。
手書文字認識部31は、座標入力部21に書かれた手書文字に対し、一般的なオンラインの手書文字認識アルゴリズムに基づいてその軌跡の特徴点を抽出し、手書文字辞書32とのマッチング処理を行い、最も類似している辞書パターンを候補辞書パターンとする。手書文字辞書32は、例えばROM8に記憶されている。手書文字辞書32は、標準的な手書文字軌跡データから一般的なアルゴリズムにより特徴点を抽出し、それを予め辞書としてデータ化したものである。
認識結果選別部33は、処理対象文字と手書文字認識部31により候補辞書パターンとの類似度が低い場合に、当該処理対象文字を認識不能文字として判断する。
文書ファイル記憶部34は、手書で書かれた文字列の認識結果の文字コードをテキストデータとして記憶する。但し、文書ファイル記憶部34は、認識不能文字に対しては、認識不能であること、及びその認識不能文字が先頭から何番目のものであるかを示すコードを文字コードとして記憶する。また、文書ファイル記憶部34には、手書軌跡記憶部35が含まれている。手書軌跡記憶部35は、文書ファイル作成時に、認識結果選別部33により認識不能文字と判断された文字に対して、その文字を構成する手書軌跡の座標データを記憶する。つまり、認識結果選別部33により認識可能文字と判断されたものに対しては、文書ファイル記憶部34がそのテキストコードを記憶する。また、認識不能文字と判断されたものに対しては、文書ファイル記憶部34が、当該文字が先頭から何番目の認識不能文字であるかを示すコードを記憶すると共に、手書軌跡記憶部35がその手書軌跡の座標データを記憶する。文書ファイル記憶部34及び手書軌跡記憶部35は、例えばHD9上の特定の記憶領域に対応する。
検索部36は、検索対象として文字又は文字列が座標入力部21に入力された場合に、当該文字又は文字列に基づいて、文書ファイル記憶部34に記憶されているテキストコード及び/又は手書軌跡記憶部35に記憶されている手書軌跡座標データの検索を実行する。そして、所望の文書ファイルを見つけ出す。なお、この検索に当たり、検索部36は、認識結果選別部33によって認識可能文字と判断されたものについてはテキストコードに基づいてテキスト文字を検索し、認識不能文字と判断されたものについてはその軌跡に基づいて認識不能文字を検索する。
画像出力部22は、手書軌跡の表示や文字フォントの表示等を行う。なお、認識結果選別部33によって認識不能文字と判断された文字については、そのまま軌跡表示を継続する。
次に、上述のように構成された手書文字処理装置の動作について、文書ファイル作成処理と文書ファイル検索処理とに分けて説明する。
先ず、文書ファイルの構成について説明する。図4は、本発明の第1の実施形態において取り扱う文書ファイルの構造を示す図である。文書ファイルの先頭にはファイルヘッダ部があり、ファイル名及びその他の情報が書かれている。次に、テキストが文字コードとして存在する。その次に、第1文字目の文字コード、第2文字目の文字コード、・・・第10文字目の文字コード、・・・テキストの終端コードが存在する。認識不能文字が存在する場合には、テキストの終端コードの次に、認識不能文字の軌跡XY位置座標データが存在する。例えば、認識不能文字軌跡データ1、認識不能文字軌跡データ2、・・・認識不能文字軌跡データの終端コード等が存在する。なお、上述のように、認識可能文字については、文字コードがテキストコードで表され、認識不能文字については、文字コードが何番目の認識不能文字であるかを示すようにする。ここでは、通常の文字コード(テキストコード)と区別することができるように、例えば、そのファイル内で先頭に位置する認識不能文字の文字コードを「FF01」とし、2番目に位置する認識不能文字の文字コードを「FF02」とする。
ここで、文書ファイルを作成する処理(手書文字認識入力処理)について説明する。文書ファイルは、例えば議事録メモ等である。図5は、第1の実施形態における文書ファイルの作成処理時の動作を示す図であり、図6は、第1の実施形態における文書ファイルの作成処理を示すフローチャートである。なお、文書ファイルの作成処理に先立って、ペンアップ時間に基づく方法や文字入力枠を用いる方法等により、連続的に書かれた手書文字列の軌跡データを1文字毎に切り分ける処理が完了していることとする。
先ず、ステップS601において、手書文字認識入力処理において使用するワーク領域等を初期化し、手書文字認識入力処理を開始する。
次に、ステップS602において、手書文字認識部31が、1文字分の手書軌跡のXY座標データを読み出し、バッファ領域に記憶する。そして、入力された軌跡データの正規化及び特徴点の抽出等を一般的なアルゴリズムで行い、その結果もバッファに記憶する。
次いで、ステップS603において、手書文字認識部31が、バッファに記憶した1文字分の座標データと手書文字辞書32とのマッチング処理を行う。このマッチング処理では、手書文字辞書32に含まれている特徴点座標データと、バッファに記憶した手書入力文字の特徴点座標データとの距離計算を行う。そして、同一のXY位置座標点が多数存在すれば類似度が高いと評価し、XY位置座標点が大きく相違している場合には類似度が低いと評価する。なお、完全に一致している場合には類似度を100とする。このようなマッチング処理を手書文字辞書32に含まれている複数の辞書パターンとの間で行い、その中で最も類似度が高いものを候補辞書パターンとする。
その後、ステップS604において、認識結果選別部33が、手書入力された文字と候補辞書パターンとの類似度が50より低いか否かを判定する。そして、類似度が50未満である場合は、手書入力文字と候補辞書パターンとが類似していないとして、ステップS607に進み、類似度が50以上である場合は、手書入力文字と候補辞書パターンとが類似しているとして、ステップS605に進む。
ステップS605では、認識結果選別部33が、類似度が50以上の候補辞書パターンに相当するテキストのテキストコードを、文書ファイル記憶部34に文字コードとして記憶させる。文書ファイル記憶部34は、その内部の文字コード記憶領域(図4参照)に、当該テキストコードを、その文字の位置が座標入力部21上のどこであるかを識別できるようにしながら(例えば、何文字目であるかを識別できるようにしながら)記憶する。
次に、ステップS606において、画像出力部22が、座標入力部21に手書された手書軌跡を消去し、テキストコードが示す文字を所定のフォントで表示する。即ち、ステップS604において類似度が50以上であると判断された候補辞書パターンについては、その文字コードを信頼し、そのままテキストとして取り扱う。
一方、ステップS607では、認識結果選別部33が、文字コードとして認識不能コードを作成する。例えば、その文書ファイル内で最初に認識不能と判断された文字に対しては文字コードとして「FF01」を付与し、第2番目に認識不能と判断された文字に対しては文字コードとして「FF02」を付与する。
次に、ステップS608において、認識結果選別部33が、認識不能コードを、文書ファイル記憶部34に文字コードとして記憶させる。文書ファイル記憶部34は、その内部の文字コード記憶領域(図4参照)に、当該認識不能コードを、その文字の位置が座標入力部21上のどこであるかを識別できるようにしながら(例えば、何文字目であるかを識別できるようにしながら)記憶する。
次いで、ステップS609において、認識結果選別部33が、認識不能文字の軌跡データを、手書軌跡記憶部35に記憶させる。手書軌跡記憶部35は、その内部の軌跡データ記憶領域(図4参照)に、当該軌跡データを、その認識不能文字の位置が座標入力部21上のどこであるかを識別できるようにしながら(例えば、何番目の認識不能文字であるかを識別できるようにしながら)記憶する。なお、座標入力部21上に手書入力されると、その軌跡がそのまま画像出力部22に表示され、類似度が50以上の場合は、前述のように表示が切り替えられるが、類似度が50未満の場合は、軌跡の表示が継続される。
ステップS606又はS609の後には、ステップS610において、未処理の手書文字データがあるか否かの判断を行う。そして、未処理の手書データがあれば、ステップS602に進み、全ての入力手書データの処理が終っていれば、ステップS611に進む。
そして、ステップS611において、手書文字認識入力処理において使用したワーク領域を解放し、手書文字認識入力処理を終了する。
一例として、「アイデア会議」及び「出席者:齋藤一郎」という2行の文字列が座標入力部21に手書され、そのうちの「齋」の字のみが、辞書パターンとの類似度が50未満の場合の動作について説明する。
この場合、第1行目の「アイデア会議」については、文書ファイル内の文字コード記憶領域に、各文字のテキストコードが記憶される。一方、第2行目の「出席者:齋藤一郎」については、文書ファイル内の文字コード記憶領域に、「出席者:」の各テキストコードが順に記憶された後、1番目の認識不能コード(FF01)が記憶され、更に、「藤一郎」の各テキストコードが順に記憶される。また、「齋」の手書の軌跡のXY位置座標データが1番目の認識不能文字の軌跡データとして、軌跡データ記憶領域に記憶される。
また、液晶表示部2には、一旦「アイデア会議」の手書軌跡が表示された後、これが消去され、図7に示すように、所定のフォントで「アイデア会議」の文字列が同じ場所に表示される。更に、一旦「出席者:齋藤一郎」の手書軌跡が表示された後、このうちの「出席者:」及び「藤一郎」が消去され、図7に示すように、所定のフォントで「出席者:」及び「藤一郎」の文字列が同じ場所に表示される。一方、「齋」の字については、図7に示すように、手書軌跡がそのまま残る。
このように、文書ファイルの作成処理では、正しく認識することができた文字についてはテキストして記憶し、認識不能であった文字については認識不能コードを割り当て、その手書軌跡のXY位置座標データを記憶する。また、画像出力部22(画面)上では、正しく認識することができた文字のみ所定のフォントに書き換える。
次に、文書ファイルを検索する処理(手書文字検索処理)について説明する。図8は、第1の実施形態における文書ファイルの検索処理時の動作を示す図である。但し、ここでは、手書された検索文字列の認識処理(検索手書文字入力処理)と、認識処理が済んだ検索文字列を用いた検索処理とに分けて説明する。
先ず、手書された検索文字列の認識処理(検索手書文字入力処理)について説明する。図9は、第1の実施形態における検索文字列の認識処理を示すフローチャートである。なお、検索文字列の認識処理に先立って、ペンアップ時間に基づく方法や文字入力枠を用いる方法等により、連続的に書かれた手書の検索文字列の軌跡データを1文字毎に切り分ける処理が完了していることとする。
先ず、ステップS901において、検索手書文字入力処理において使用するワーク領域等を初期化し、検索手書文字入力処理を開始する。
次に、ステップS902において、手書文字認識部31が、1文字分の手書軌跡のXY座標データを読み出し、バッファ領域に記憶する。そして、入力された軌跡データの正規化及び特徴点の抽出等を一般的なアルゴリズムで行い、その結果もバッファに記憶する。
次いで、ステップS903において、手書文字認識部31が、バッファに記憶した1文字分の座標データと手書文字辞書32とのマッチング処理を行う。このマッチング処理では、手書文字辞書32に含まれている特徴点座標データと、バッファに記憶した手書入力文字の特徴点座標データとの距離計算を行う。そして、同一のXY位置座標点が多数存在すれば類似度が高いと評価し、XY位置座標点が大きく相違している場合には類似度が低いと評価する。なお、完全に一致している場合には類似度を100とする。このようなマッチング処理を手書文字辞書32に含まれている複数の辞書パターンとの間で行い、その中で最も類似度が高いものを候補辞書パターンとする。
その後、ステップS904において、認識結果選別部33が、手書入力された文字と候補辞書パターンとの類似度が50より低いか否かを判定する。そして、類似度が50未満である場合は、手書入力文字と候補辞書パターンとが類似していないとして、ステップS906に進み、類似度が50以上である場合は、手書入力文字と候補辞書パターンとが類似しているとして、ステップS905に進む。
ステップS905では、認識結果選別部33が、類似度が50以上の候補辞書パターンに相当するテキストのテキストコードを文字コードとして検索テキストバッファ(RAM7)に記憶させる。
一方、ステップS906では、認識結果選別部33が、文字コードとして認識不能コードを作成する。例えば、その文書ファイル内で最初に認識不能と判断された文字に対しては文字コードとして「FF01」を付与し、第2番目に認識不能と判断された文字に対しては文字コードとして「FF02」を付与する。そして、この認識不能コードを文字コードとして検索テキストバッファ(RAM7)に記憶させる。
次に、ステップS907において、認識結果選別部33が、認識不能文字の軌跡データを検索軌跡バッファ(RAM7)に記憶させる。
ステップS905又はS907の後には、ステップS908において、未処理の手書文字データがあるか否かの判断を行う。そして、未処理の手書データがあれば、ステップS902に進み、全ての入力手書データの処理が終っていれば、ステップS909に進む。
そして、ステップS909において、検索手書文字入力処理において使用したワーク領域を解放し、検索手書文字入力処理を終了する。
例えば、図10に示すように、検索文字列入力ウィンドウ1001内に「齋藤一郎」という文字列1002が手書入力され、そのうちの「齋」の字のみが、辞書パターンとの類似度が50未満の場合の動作について説明する。
この場合、検索テキストバッファには、1番目の認識不能コード(FF01)が記憶された後、「藤一郎」の各テキストコードが順に記憶される。また、「齋」の手書の軌跡のXY位置座標データが1番目の認識不能文字の軌跡データとして、検索軌跡バッファに記憶される。つまり、図11に示すデータが検索テキストバッファ及び検索軌跡バッファに記憶される。
次に、認識処理が済んだ検索文字列を用いた検索処理について説明する。図12は、第1の実施形態における認識処理が済んだ検索文字列を用いた検索処理を示すフローチャートである。
先ず、ステップS1201において、検索処理において使用するワーク領域等を初期化し、検索処理を開始する。
次に、ステップS1202において、検索部36は、検索テキストバッファに記憶されている文字列と、同一の文字列を含む文書ファイルを文書ファイル記憶部34に記憶されている全ての文書ファイルの中から検索する。
次いで、ステップS1203において、文字コードが一致する文書ファイルが存在する場合、検索部36は、検索テキストバッファに記憶されている文字コード及び当該文書ファイルの名前を検索候補バッファ(RAM7)に記憶させる。なお、ここでは、テキストコードが一致し、認識不能コードを含む場合はその位置が一致する文書ファイルを探し出して記憶させる。例えば、図11に示す認識結果が得られている場合には、検索テキストバッファに、認識不能コード「FF01」並びに「藤」、「一」及び「郎」のテキストコードが記憶されている。従って、認識不能コード(例えば「FF02」)並びに「藤」、「一」及び「郎」のテキストコードを含む文書ファイルのファイル名を検索候補バッファに記憶させる。
その後、ステップS1204において、検索部36は、検索テキストバッファに記憶されている文字コード内に認識不能コードが含まれているか否かを判断する。そして、この文字コード内に認識不能コードが含まれていない場合には、ステップS1205に進み、認識不能コードが含まれている場合には、ステップS1206に進む。
ステップS1205では、検索結果を表示する。即ち、ステップS1203において検索候補バッファに記憶された文書ファイルの名前等を画像出力部22が表示する。認識不能コードが含まれていない場合の処理(ステップS1201〜S1205)は従来の処理と同様である。
一方、認識不能コードが含まれている場合、ステップS1206では、検索部36が検索軌跡バッファ内の軌跡データを読み込む。例えば、図11に示す認識結果が得られている場合には、認識不能コードに対応する「齋」の字の軌跡データを読み込む。なお、1文字列内に2個以上の認識不能文字が含まれている場合には、各認識不能文字について軌跡データを読み込む。
次に、ステップS1207において、検索部36は、読み込んだ軌跡データの特徴点を抽出する。特徴点抽出のアルゴリズムは、例えば、一般的なオンライン認識処理で行われているアルゴリズムである。例えば、軌跡の始点、終点、中間点、1/4点及び3/4点を特徴点とする。
次いで、ステップS1208において、検索部36が、検索候補バッファに記憶されている文書ファイルの1つについて、当該文書ファイルに含まれている認識不能文字の軌跡データを候補軌跡データとして読み込む。即ち、検索候補バッファに記憶されている認識不能コードを用いて、その文字列が含まれる文書ファイル内の認識不能文字に対応する手書軌跡データを読み込む。例えば、文字コードに、2個の認識不能コード「FF01」及び「FF02」が含まれている場合には、「FF01」については、文書ファイル内の1番目の軌跡データを読み込み、「FF02」については、2番目の軌跡データを読み込む(図4参照)。
その後、ステップS1209において、検索部36がステップS1208において読み込んだ候補軌跡データの特徴点を抽出する。特徴点の抽出は、例えばステップS1207と同様にして行う。
そして、ステップS1210において、検索部36は、ステップS1207において抽出した特徴点と、ステップS1209において抽出した候補軌跡データの特徴点との類似度の評価を行う。例えば、同一のXY位置座標点が多数存在すれば類似度が高いと評価し、XY位置座標点が大きく相違している場合には類似度が低いと評価する。つまり、特徴点同士の距離が短いほど類似度を高く評価し、距離が長いほど類似度を低く評価する。
例えば、検索文字列に含まれている認識不能文字が複数のストロークで構成されている場合には、先ず、候補軌跡データとの間で、1ストロークずつ特徴点同士の距離を計算し、最も類似しているストローク同士の類似度をそのストロークの類似度として決定する。そして、この処理を各ストロークについて行い、加算した結果をその文字の類似度とする。検索用文字列の入力者と検索対称の文書ファイルの作成者が同一であれば、これらの筆跡は極めて類似するため、同じ文字又は図形等が入力されて入れば、類似度が高く評価される。
次に、ステップS1211において、検索部36が、検索候補バッファに記憶されている認識不能文字を含む全ての検索候補について、軌跡データのマッチング処理が終了したか否かを判断する。終了していれば、ステップS1212に進み、終了していなければ、ステップS1208に進む。
ステップS1212では、検索部36が軌跡の類似度が高い順に検索候補をソートし、この結果を画像出力部22が表示する。
例えば、文書ファイル記憶部34に少なくとも、「議事録1」及び「議事録2」というフィル名の2個の文書ファイルが記憶されているとする。また、「議事録1」には「齋藤一郎」という文字が含まれ、このうち「齋」の字のみが認識不能文字として記憶され、「議事録2」には「齊藤一郎」という文字が含まれ、このうち「齊」の字のみが認識不能文字として記憶されているとする。そして、図10に示す検索文字列が入力されたとする。この場合には、検索文字列を構成する「齋」の字の軌跡データと、2個の文書ファイル内に含まれる「齋」及び「齊」の字の軌跡データとが比較され、これらの類似度がステップS1212において比較される。そして、「議事録1」に含まれる「齋」の字の類似度が、「議事録2」に含まれる「齊」の字の類似度よりも高いため、図13に示すように、第1候補として「議事録1」が表示され、第2候補として「議事録2」が表示される。
このような第1の実施形態によれば、手書認識辞書32に登録されていない文字、サイン、図等の手書軌跡を含む文書ファイルの検索を容易に行うことができる。
また、特徴点の抽出を単純化して、複数ユーザで同一の手書サインを使うようにしてもよい。更に、筆圧等も認識可能な座標入力機器を用いれば、記憶する手書筆跡データに筆圧情報も付加できるので、検索対象を特定ユーザの筆跡パターンのみに絞り込んでノイズの少ない検索結果を得ることも可能である。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。第2の実施形態では、第1の実施形態における検索に加えて、認識不能な手書軌跡に対して、文書ファイル間で相対的な大きさの評価を行い、この評価結果をも考慮して検索結果の表示順序を決定する。第2の実施形態では、認識不能な手書文字の検索を行うこととしているが、手書入力には、ユーザが望む自由な大きさで文字等を書き、この大きさに情報を持たせることができるという利点がある。本実施形態は、この利点を活用する。即ち、第2の実施形態では、文書内に書かれた認識不能な手書文字(手書のマーク等)の大きさも用いて検索を行う。図14は、本発明の第2の実施形態に係る手書文字処理装置を示す機能構成図である。
次に、本発明の第2の実施形態について説明する。第2の実施形態では、第1の実施形態における検索に加えて、認識不能な手書軌跡に対して、文書ファイル間で相対的な大きさの評価を行い、この評価結果をも考慮して検索結果の表示順序を決定する。第2の実施形態では、認識不能な手書文字の検索を行うこととしているが、手書入力には、ユーザが望む自由な大きさで文字等を書き、この大きさに情報を持たせることができるという利点がある。本実施形態は、この利点を活用する。即ち、第2の実施形態では、文書内に書かれた認識不能な手書文字(手書のマーク等)の大きさも用いて検索を行う。図14は、本発明の第2の実施形態に係る手書文字処理装置を示す機能構成図である。
第2の実施形態には、大きさ評価部37が設けられている。この大きさ評価部37は、その文書の全画面の大きさに対する手書軌跡の相対的な大きさを評価する。他の構成は第1の実施形態と同様である。
次に、第2の実施形態の動作について説明する。第2の実施形態においても、文書ファイル作成処理及び文書ファイル検索処理が行われる。このうち、文書ファイル作成処理は、第1の実施形態と同様である。文書ファイル検索処理は、第1の実施形態と同様に、手書された検索文字列の認識処理と認識処理が済んだ検索文字列を用いた検索処理とに分けられ、認識処理は第1の実施形態と同様であるが、検索処理の内容が第1の実施形態と相違している。第2の実施形態における検索処理では、第1の実施形態におけるステップS1211の後に、手書マーク等の相対的な大きさの評価を行う。以下、相対的な大きさの評価処理について説明する。図15は、第2の実施形態における相対的な大きさの評価処理を示すフローチャートである。
先ず、ステップS1501において、大きさ評価部37は、相対的大きさ処理において使用するワーク領域等を初期化し、相対的大きさ処理を開始する。
次に、ステップS1502において、大きさ評価部37が、図12に示す検索処理において検索候補バッファに記憶された各文書ファイルに含まれる軌跡データの相対的な大きさを求める。例えば、「議事録3」というファイル名の文書ファイル及び「議事録4」というファイル名の文書ファイルが検索候補バッファに記憶されていれば、これらに含まれている軌跡データの相対的な大きさを求める。ここで、「相対的な大きさ」とは、手書文字等を記載可能な矩形領域の面積を基準とした、手書マーク等が書かれた領域の面積の割合(占有面積率)である。例えば、「議事録3」の内容が図16−1に示すものであった場合、「相対的な大きさ」は、矩形領域(手書文字等を記載可能な領域)1601の面積を基準とした、手書の「重要」マーク1602の外接矩形の面積の割合である。これを式で表すと、「(手書の「重要」マーク1602の外接矩形の面積)/(矩形領域1601の面積)×100(%)」となる。同様に、「議事録4」の内容が図16−2に示すものであった場合、相対的な大きさは、「(手書の「重要」マーク1604の外接矩形の面積)/(矩形領域1603の面積)×100(%)」となる。
次いで、ステップS1503において、大きさ評価部37が、軌跡データの類似度に相対的大きさ(%)を加算する。そして、「軌跡データの類似度+相対的大きさ」を軌跡の新たな評価値とする。
例えば、あるパターンAの類似度(ステップS1210)が80であり、かつ相対的大きさが30%であるならば、新たな評価値を100とする。また、あるパターンBの類似度(ステップS1210)が80であり、かつ相対的大きさが10%であるならば、新たな評価値を90とする。
その後、ステップS1504において、大きさ評価部37が、検索候補バッファに記憶されている全ての検索候補について新たな評価値を求めたか否かを判断する。そして、全ての文書ファイルについての処理が終了していれば、ステップS1505に進み、まだ未処理の文書ファイルがあれば、ステップS1502に進む。
ステップS1505では、検索部36が、ステップS1503において求めた新たな評価値に基づいて検索候補をソートする。例えば、新たな評価値が高い順にソートする。この場合、手書マークの類似度が同一であれば、相対的大きさが大きい文書ファイルが上位とされる。
そして、ステップS1506において、画像出力部22が、ステップS1505のソート結果に基づいて、検索結果を表示する。
例えば、図16−1及び図16−2に示す内容の文書ファイルが文書ファイル記憶部34に記憶されている場合には、図17に示すように、大きな「重要」マークを含む「議事録3」の文書ファイルが上位に表示される。即ち、「重要」マークの大きさが大きい文書ファイルが重用度も大きいという判断に基づいて優先的に表示される。
このような第2の実施形態によれば、手書軌跡の画面内の相対的な大きさを評価するので、文書内に書かれたマークが大きいものほど、検索結果の表示順位を優先させることができる。
なお、筆圧等も認識可能な座標入力機器を用いれば、記憶する手書筆跡データに筆圧情報も付加できるので、筆圧情報を検索に利用することも可能である。即ち、筆圧情報も評価値として加算するようにすれば、同じ類似度で同じ大きさで書かれた2種類のパターンがある場合には、強い筆圧で書かれているパターンの重要度がより高いという基準を用いて、これを優先的に検索するようにすればよい。
また、検索選別情報として、積極的に使う構成も考えられる。その場合であれば、検索用に書かれた手書軌跡の形状、大きさ、筆圧のいずれもが類似している検索結果を表示する構成である。これにより、検索対象を特定ユーザの筆跡パターンのみに絞り込んでノイズの少ない検索結果を得ることも可能である。
その場合、検索用に書かれた手書軌跡が小さくて、筆圧が弱いばあいは、形状が類似する手書軌跡が含まれる候補の中で、同じように小さくて筆圧が弱い手書軌跡が含まれる文書が検索結果として優先されて表示される手書軌跡検索装置を実現できる。
なお、本発明の実施形態は、例えばコンピュータがプログラムを実行することによって実現することができる。また、プログラムをコンピュータに供給するための手段、例えばかかるプログラムを記録したCD−ROM等のコンピュータ読み取り可能な記録媒体又はかかるプログラムを伝送するインターネット等の伝送媒体も本発明の実施形態として適用することができる。また、上記のプログラムも本発明の実施形態として適用することができる。上記のプログラム、記録媒体、伝送媒体及びプログラムプロダクトは、本発明の範疇に含まれる。
1:手書文字処理装置
2:液晶表示部
3:ローカルエリアネットワーク
5:パーソナルコンピュータ
6:CPU
7:RAM
8:ROM
9:HD
10:LANカード
11:システムバス
12:無線通信カード
21:座標入力部
22:画像出力部
31:手書文字認識部
32:手書文字辞書
33:識別結果認識部
34:文書ファイル記憶部
35:手書軌跡記憶部
36:検索部
37:大きさ評価部
2:液晶表示部
3:ローカルエリアネットワーク
5:パーソナルコンピュータ
6:CPU
7:RAM
8:ROM
9:HD
10:LANカード
11:システムバス
12:無線通信カード
21:座標入力部
22:画像出力部
31:手書文字認識部
32:手書文字辞書
33:識別結果認識部
34:文書ファイル記憶部
35:手書軌跡記憶部
36:検索部
37:大きさ評価部
Claims (12)
- 手書文字を入力する手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
前記手書文字入力手段に入力された手書文字と前記辞書に記憶された文字の形状とを比較し、当該手書文字が辞書内のどの文字に対応するかを認識すると共に、当該手書文字と当該対応文字との類似度を判断する手書文字認識手段と、
前記類似度が予め定められている基準値よりも低い場合、当該手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手段と、
前記文字コードを、前記認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶する記憶手段と、
を有することを特徴とする手書文字処理装置。 - 文字列毎に、当該文字列を構成する文字の文字コードを、認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶した記憶手段と、
検索用の手書文字を入力する検索用手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
前記検索用手書文字入力手段に入力された検索用の手書文字と前記辞書に記憶された文字の形状とを比較し、当該検索用の手書文字が辞書内のどの文字に対応するかを認識すると共に、当該検索用の手書文字と当該対応文字との類似度を判断する手書文字認識手段と、
前記類似度が予め定められている基準値よりも低い場合、当該検索用の手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該検索用の手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手段と、
前記選別手段により付与された文字コードを用いて前記記憶手段に記憶されているデータの検索を行う検索手段と、
を有し、
前記検索手段は、前記選別手段により付与された前記認識不能コードを用いて検索を行う場合、当該検索用の手書文字の手書軌跡データと前記記憶手段に記憶されている手書軌跡データとの類似度を検出し、この検出結果に基づく検索を行うことを特徴とする手書文字処理装置。 - 手書文字を入力する手書文字入力手段と、
検索用の手書文字を入力する検索用手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
前記手書文字入力手段又は検索用手書文字入力手段に入力された手書文字と前記辞書に記憶された文字の形状とを比較し、当該手書文字又は検索用の手書文字が辞書内のどの文字に対応するかを認識すると共に、当該手書文字又は検索用の手書文字と当該対応文字との類似度を判断する手書文字認識手段と、
前記類似度が予め定められている基準値よりも低い場合、当該手書文字又は検索用の手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該手書文字又は検索用の手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手段と、
前記手書文字入力手段に手書文字が入力された場合、前記文字コードを、前記認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶する記憶手段と、
前記検索用手書文字入力手段に検索用の手書文字が入力された場合、前記選別手段により付与された文字コードを用いて前記記憶手段に記憶されているデータの検索を行う検索手段と、
を有し、
前記検索手段は、前記選別手段により付与された前記認識不能コードを用いて検索を行う場合、当該検索用の手書文字の手書軌跡データと前記記憶手段に記憶されている手書軌跡データとの類似度を検出し、この検出結果に基づく検索を行うことを特徴とする手書文字処理装置。 - 前記検索手段は、前記選別手段により付与された前記認識不能コードを用いて検索を行う場合、前記記憶手段に記憶されている手書軌跡データの当該手書文字を含む文書内での占有面積率の評価を行い、前記類似度の検出結果に加えて、この評価結果に基づいて検索を行うことを特徴とする請求項2又は3に記載の手書文字処理装置。
- 手書文字を入力する手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
を有する手書文字処理装置を用いた手書文字処理方法であって、
前記手書文字入力手段に入力された手書文字と前記辞書に記憶された文字の形状とを比較し、当該手書文字が辞書内のどの文字に対応するかを認識すると共に、当該手書文字と当該対応文字との類似度を判断する手書文字認識ステップと、
前記類似度が予め定められている基準値よりも低い場合、当該手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該手書文字に当該対応文字のテキストコードを文字コードとして付与する選別ステップと、
前記文字コードを、前記認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶手段に記憶させる記憶ステップと、
を有することを特徴とする手書文字処理方法。 - 文字列毎に、当該文字列を構成する文字の文字コードを、認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶した記憶手段と、
検索用の手書文字を入力する検索用手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
を有する手書文字処理装置を用いた手書文字処理方法であって、
前記検索用手書文字入力手段に入力された検索用の手書文字と前記辞書に記憶された文字の形状とを比較し、当該検索用の手書文字が辞書内のどの文字に対応するかを認識すると共に、当該検索用の手書文字と当該対応文字との類似度を判断する手書文字認識ステップと、
前記類似度が予め定められている基準値よりも低い場合、当該検索用の手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該検索用の手書文字に当該対応文字のテキストコードを文字コードとして付与する選別ステップと、
前記選別ステップにおいて付与した文字コードを用いて前記記憶手段に記憶されているデータの検索を行う検索ステップと、
を有し、
前記検索ステップにおいて、前記選別ステップにおいて付与した前記認識不能コードを用いて検索を行う場合、当該検索用の手書文字の手書軌跡データと前記記憶手段に記憶されている手書軌跡データとの類似度を検出し、この検出結果に基づく検索を行うことを特徴とする手書文字処理方法。 - 手書文字を入力する手書文字入力手段と、
検索用の手書文字を入力する検索用手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
を有する手書文字処理装置を用いた手書文字処理方法であって、
前記手書文字入力手段又は検索用手書文字入力手段に入力された手書文字と前記辞書に記憶された文字の形状とを比較し、当該手書文字又は検索用の手書文字が辞書内のどの文字に対応するかを認識すると共に、当該手書文字又は検索用の手書文字と当該対応文字との類似度を判断する手書文字認識ステップと、
前記類似度が予め定められている基準値よりも低い場合、当該手書文字又は検索用の手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該手書文字又は検索用の手書文字に当該対応文字のテキストコードを文字コードとして付与する選別ステップと、
前記手書文字入力手段に手書文字が入力された場合、前記文字コードを、前記認識不能コードが存在するときには当該手書文字の手書軌跡データを含めて、記憶手段に記憶させる記憶ステップと、
前記検索用手書文字入力手段に検索用の手書文字が入力された場合、前記選別ステップにおいて付与した文字コードを用いて前記記憶手段に記憶されているデータの検索を行う検索ステップと、
を有し、
前記検索ステップにおいて、前記選別ステップにおいて付与した前記認識不能コードを用いて検索を行う場合、当該検索用の手書文字の手書軌跡データと前記記憶手段に記憶されている手書軌跡データとの類似度を検出し、この検出結果に基づく検索を行うことを特徴とする手書文字処理方法。 - 前記検索ステップにおいて、前記選別ステップにおいて付与した前記認識不能コードを用いて検索を行う場合、前記記憶手段に記憶されている手書軌跡データの当該手書文字を含む文書内での占有面積率の評価を行い、前記類似度の検出結果に加えて、この評価結果に基づいて検索を行うことを特徴とする請求項6又は7に記載の手書文字処理方法。
- 手書文字を入力する手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
を有する手書文字処理装置用のプログラムであって、
コンピュータに、
前記手書文字入力手段に入力された手書文字と前記辞書に記憶された文字の形状とを比較し、当該手書文字が辞書内のどの文字に対応するかを認識すると共に、当該手書文字と当該対応文字との類似度を判断する手書文字認識手順と、
前記類似度が予め定められている基準値よりも低い場合、当該手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手順と、
前記文字コードを、前記認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶手段に記憶させる記憶手順と、
を実行させることを特徴とするプログラム。 - 文字列毎に、当該文字列を構成する文字の文字コードを、認識不能コードが存在する場合には当該手書文字の手書軌跡データを含めて、記憶した記憶手段と、
検索用の手書文字を入力する検索用手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
を有する手書文字処理装置用のプログラムであって、
前記検索用手書文字入力手段に入力された検索用の手書文字と前記辞書に記憶された文字の形状とを比較し、当該検索用の手書文字が辞書内のどの文字に対応するかを認識すると共に、当該検索用の手書文字と当該対応文字との類似度を判断する手書文字認識手順と、
前記類似度が予め定められている基準値よりも低い場合、当該検索用の手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該検索用の手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手順と、
前記選別手順において付与した文字コードを用いて前記記憶手段に記憶されているデータの検索を行う検索手順と、
を有し、
前記検索手順において、前記選別手順において付与した前記認識不能コードを用いて検索を行う場合、当該検索用の手書文字の手書軌跡データと前記記憶手段に記憶されている手書軌跡データとの類似度を検出し、この検出結果に基づく検索を行うことを特徴とするプログラム。 - 手書文字を入力する手書文字入力手段と、
検索用の手書文字を入力する検索用手書文字入力手段と、
複数の文字について、その形状を記憶した辞書と、
を有する手書文字処理装置を用いた手書文字処理方法であって、
前記手書文字入力手段又は検索用手書文字入力手段に入力された手書文字と前記辞書に記憶された文字の形状とを比較し、当該手書文字又は検索用の手書文字が辞書内のどの文字に対応するかを認識すると共に、当該手書文字又は検索用の手書文字と当該対応文字との類似度を判断する手書文字認識手順と、
前記類似度が予め定められている基準値よりも低い場合、当該手書文字又は検索用の手書文字に対して認識不能コードを文字コードとして付与し、前記類似度が前記基準値以上である場合、当該手書文字又は検索用の手書文字に当該対応文字のテキストコードを文字コードとして付与する選別手順と、
前記手書文字入力手段に手書文字が入力された場合、前記文字コードを、前記認識不能コードが存在するときには当該手書文字の手書軌跡データを含めて、記憶手段に記憶させる記憶手順と、
前記検索用手書文字入力手段に検索用の手書文字が入力された場合、前記選別手順において付与した文字コードを用いて前記記憶手段に記憶されているデータの検索を行う検索手順と、
を有し、
前記検索手順において、前記選別手順において付与した前記認識不能コードを用いて検索を行う場合、当該検索用の手書文字の手書軌跡データと前記記憶手段に記憶されている手書軌跡データとの類似度を検出し、この検出結果に基づく検索を行うことを特徴とするプログラム。 - 前記検索手順において、前記選別手順において付与した前記認識不能コードを用いて検索を行う場合、前記記憶手段に記憶されている手書軌跡データの当該手書文字を含む文書内での占有面積率の評価を行い、前記類似度の検出結果に加えて、この評価結果に基づいて検索を行うことを特徴とする請求項10又は11に記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006147161A JP2007317022A (ja) | 2006-05-26 | 2006-05-26 | 手書文字処理装置及び手書文字処理方法 |
US11/751,726 US7929770B2 (en) | 2006-05-26 | 2007-05-22 | Handwriting processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006147161A JP2007317022A (ja) | 2006-05-26 | 2006-05-26 | 手書文字処理装置及び手書文字処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007317022A true JP2007317022A (ja) | 2007-12-06 |
Family
ID=38749577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006147161A Pending JP2007317022A (ja) | 2006-05-26 | 2006-05-26 | 手書文字処理装置及び手書文字処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7929770B2 (ja) |
JP (1) | JP2007317022A (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009181465A (ja) * | 2008-01-31 | 2009-08-13 | Canon Inc | 画像処理装置とその制御方法及び画像処理システム |
JP2013246733A (ja) * | 2012-05-28 | 2013-12-09 | Toshiba Corp | 文書検索装置、方法およびプログラム |
JP2014089645A (ja) * | 2012-10-31 | 2014-05-15 | Toshiba Corp | システムおよび情報提供方法並びに電子機器 |
WO2014119012A1 (ja) * | 2013-02-04 | 2014-08-07 | 株式会社 東芝 | 電子機器および手書き文書検索方法 |
JP2014170544A (ja) * | 2013-02-28 | 2014-09-18 | Ricoh Co Ltd | 処理方法、処理システム及びコンピュータプログラム |
WO2014147719A1 (ja) * | 2013-03-18 | 2014-09-25 | 株式会社 東芝 | 電子機器および手書き文書処理方法 |
US8938123B2 (en) | 2012-05-11 | 2015-01-20 | Kabushiki Kaisha Toshiba | Electronic device and handwritten document search method |
JP2015079544A (ja) * | 2015-01-28 | 2015-04-23 | 株式会社東芝 | 文書検索装置、方法およびプログラム |
JP2015179329A (ja) * | 2014-03-18 | 2015-10-08 | 株式会社東芝 | 電子機器および方法 |
US9183276B2 (en) | 2013-02-04 | 2015-11-10 | Kabushiki Kaisha Toshiba | Electronic device and method for searching handwritten document |
CN107657241A (zh) * | 2017-10-09 | 2018-02-02 | 河海大学常州校区 | 一种面向签字笔的签名真伪性鉴别系统 |
US10049114B2 (en) | 2015-03-18 | 2018-08-14 | Kabushiki Kaisha Toshiba | Electronic device, method and storage medium |
JP2019204295A (ja) * | 2018-05-23 | 2019-11-28 | トヨタ車体株式会社 | 車体情報管理システムおよび車体情報管理方法 |
JP2021174122A (ja) * | 2020-04-21 | 2021-11-01 | 富士通クライアントコンピューティング株式会社 | 情報処理装置、情報処理システム、および情報処理プログラム |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101937477B (zh) * | 2009-06-29 | 2013-03-20 | 鸿富锦精密工业(深圳)有限公司 | 实现图档拟合的数据处理设备、系统及方法 |
WO2013152417A1 (en) * | 2012-04-11 | 2013-10-17 | Research In Motion Limited | Systems and methods for searching for analog notations and annotations |
JP5694234B2 (ja) * | 2012-05-11 | 2015-04-01 | 株式会社東芝 | 電子機器、手書き文書表示方法、及び表示プログラム |
KR20130128681A (ko) * | 2012-05-17 | 2013-11-27 | 삼성전자주식회사 | 서체 보정을 수행하도록 하기 위한 방법 및 그 전자 장치 |
KR20130141107A (ko) * | 2012-06-15 | 2013-12-26 | 삼성전자주식회사 | 메모 검색 방법 및 그 단말 |
US20140105503A1 (en) * | 2012-10-15 | 2014-04-17 | Kabushiki Kaisha Toshiba | Electronic apparatus and handwritten document processing method |
JP5701839B2 (ja) * | 2012-10-26 | 2015-04-15 | 株式会社東芝 | 電子機器および方法 |
KR101997447B1 (ko) * | 2012-12-10 | 2019-07-08 | 엘지전자 주식회사 | 이동단말기 및 그 제어 방법 |
JP5807699B1 (ja) * | 2014-05-15 | 2015-11-10 | 合同会社Uxイノベーションズ | 情報処理装置及びプログラム |
US10528249B2 (en) * | 2014-05-23 | 2020-01-07 | Samsung Electronics Co., Ltd. | Method and device for reproducing partial handwritten content |
US9652678B2 (en) | 2014-05-23 | 2017-05-16 | Samsung Electronics Co., Ltd. | Method and device for reproducing content |
CN109472234B (zh) * | 2018-11-01 | 2021-07-20 | 北京爱知之星科技股份有限公司 | 一种手写输入智能识别的方法 |
JP7224856B2 (ja) * | 2018-11-02 | 2023-02-20 | キヤノン株式会社 | 画像生成装置、画像生成方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5428692A (en) * | 1991-11-18 | 1995-06-27 | Kuehl; Eberhard | Character recognition system |
JPH0869455A (ja) | 1994-08-30 | 1996-03-12 | Toshiba Corp | 文書検索方法,文書検索装置及び文書記憶装置 |
JP3535624B2 (ja) | 1995-09-21 | 2004-06-07 | キヤノン株式会社 | 検索装置及び方法 |
US6785417B1 (en) * | 2000-08-22 | 2004-08-31 | Microsoft Corp | Method and system for searching for words in ink word documents |
US7583825B2 (en) * | 2004-12-27 | 2009-09-01 | Nokia Corporation | Mobile communications terminal and method |
-
2006
- 2006-05-26 JP JP2006147161A patent/JP2007317022A/ja active Pending
-
2007
- 2007-05-22 US US11/751,726 patent/US7929770B2/en not_active Expired - Fee Related
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009181465A (ja) * | 2008-01-31 | 2009-08-13 | Canon Inc | 画像処理装置とその制御方法及び画像処理システム |
US8938123B2 (en) | 2012-05-11 | 2015-01-20 | Kabushiki Kaisha Toshiba | Electronic device and handwritten document search method |
JP2013246733A (ja) * | 2012-05-28 | 2013-12-09 | Toshiba Corp | 文書検索装置、方法およびプログラム |
US9384304B2 (en) | 2012-05-28 | 2016-07-05 | Kabushiki Kaisha Toshiba | Document search apparatus, document search method, and program product |
JP2014089645A (ja) * | 2012-10-31 | 2014-05-15 | Toshiba Corp | システムおよび情報提供方法並びに電子機器 |
JP2014149769A (ja) * | 2013-02-04 | 2014-08-21 | Toshiba Corp | 電子機器および手書き文書検索方法 |
WO2014119012A1 (ja) * | 2013-02-04 | 2014-08-07 | 株式会社 東芝 | 電子機器および手書き文書検索方法 |
US9183276B2 (en) | 2013-02-04 | 2015-11-10 | Kabushiki Kaisha Toshiba | Electronic device and method for searching handwritten document |
JP2014170544A (ja) * | 2013-02-28 | 2014-09-18 | Ricoh Co Ltd | 処理方法、処理システム及びコンピュータプログラム |
JP5869179B2 (ja) * | 2013-03-18 | 2016-02-24 | 株式会社東芝 | 電子機器および手書き文書処理方法 |
WO2014147719A1 (ja) * | 2013-03-18 | 2014-09-25 | 株式会社 東芝 | 電子機器および手書き文書処理方法 |
JP2015179329A (ja) * | 2014-03-18 | 2015-10-08 | 株式会社東芝 | 電子機器および方法 |
JP2015079544A (ja) * | 2015-01-28 | 2015-04-23 | 株式会社東芝 | 文書検索装置、方法およびプログラム |
US10049114B2 (en) | 2015-03-18 | 2018-08-14 | Kabushiki Kaisha Toshiba | Electronic device, method and storage medium |
CN107657241A (zh) * | 2017-10-09 | 2018-02-02 | 河海大学常州校区 | 一种面向签字笔的签名真伪性鉴别系统 |
CN107657241B (zh) * | 2017-10-09 | 2021-03-26 | 河海大学常州校区 | 一种面向签字笔的签名真伪性鉴别系统 |
JP2019204295A (ja) * | 2018-05-23 | 2019-11-28 | トヨタ車体株式会社 | 車体情報管理システムおよび車体情報管理方法 |
JP7024604B2 (ja) | 2018-05-23 | 2022-02-24 | トヨタ車体株式会社 | 車体情報管理システムおよび車体情報管理方法 |
JP2021174122A (ja) * | 2020-04-21 | 2021-11-01 | 富士通クライアントコンピューティング株式会社 | 情報処理装置、情報処理システム、および情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20070274590A1 (en) | 2007-11-29 |
US7929770B2 (en) | 2011-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007317022A (ja) | 手書文字処理装置及び手書文字処理方法 | |
TWI321294B (en) | Method and device for determining at least one recognition candidate for a handwritten pattern | |
EP1971957B1 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
JP6229303B2 (ja) | プログラム、情報処理装置および文字認識方法 | |
EP1564675B1 (en) | Apparatus and method for searching for digital ink query | |
JPH09190505A (ja) | 文字認識装置及びその方法 | |
JP5294818B2 (ja) | 情報処理装置及び情報処理方法 | |
CN102073884A (zh) | 一种手写识别方法、系统及手写识别终端 | |
CN101281449B (zh) | 手写字识别方法和系统 | |
CN100416593C (zh) | 用于手写识别的装置和方法 | |
US9384304B2 (en) | Document search apparatus, document search method, and program product | |
JP2007213416A (ja) | 手書き文字列検索装置、手書き文字列検索方法及びプログラム | |
US6035062A (en) | Character recognition method and apparatus | |
JPH07146918A (ja) | 手書き文字認識装置 | |
JP6655331B2 (ja) | 電子機器及び方法 | |
JP2010026718A (ja) | 文字入力装置および方法 | |
JP4148867B2 (ja) | 筆跡処理装置 | |
KR20010073976A (ko) | 정보기기용 필기체 인식장치 및 그 방법 | |
JP2012108893A (ja) | 手描き入力方法 | |
JP4128325B2 (ja) | 文字認識装置及び文字認識方法 | |
JPH07302306A (ja) | 文字入力装置 | |
JP2020047031A (ja) | 文書検索装置、文書検索システム及びプログラム | |
JP2006163830A (ja) | 文字認識装置、文字認識方法、および文字認識プログラム | |
JP7268316B2 (ja) | 情報処理装置及びプログラム | |
WO2015189941A1 (ja) | 情報処理装置、情報処理方法、および、プログラム |