[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6492894B2 - 認識プログラム、認識方法及び認識装置 - Google Patents

認識プログラム、認識方法及び認識装置 Download PDF

Info

Publication number
JP6492894B2
JP6492894B2 JP2015074990A JP2015074990A JP6492894B2 JP 6492894 B2 JP6492894 B2 JP 6492894B2 JP 2015074990 A JP2015074990 A JP 2015074990A JP 2015074990 A JP2015074990 A JP 2015074990A JP 6492894 B2 JP6492894 B2 JP 6492894B2
Authority
JP
Japan
Prior art keywords
character
space
characters
recognition
vertical stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015074990A
Other languages
English (en)
Other versions
JP2016194851A (ja
Inventor
東 秀人
秀人 東
悠吾 松田
悠吾 松田
康弘 露木
康弘 露木
片岡 正弘
正弘 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015074990A priority Critical patent/JP6492894B2/ja
Priority to EP16161596.8A priority patent/EP3076335B1/en
Priority to US15/083,736 priority patent/US9934429B2/en
Publication of JP2016194851A publication Critical patent/JP2016194851A/ja
Application granted granted Critical
Publication of JP6492894B2 publication Critical patent/JP6492894B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Description

本発明は、手書きデータの認識を行う認識プログラム、認識方法及び認識装置に関する。
近年では、タッチパネルを有する端末装置等の普及により、タッチパネル等に手書きで入力された個々の文字を判別し、認識された文字列から単語や文章を認識する技術が知られている。この技術では、単語や文章を認識するために、文字と文字との境界と、文字間に設けられたスペースと、を判別することが重要となる。
従来技術として、例えば、個別の文字を認識した後の認識文字枠同士の距離に基づいて、文字と文字との間の設けられたスペースを判別する技術がある。
特開平9−500473号公報 特開平6−266899号公報
ところで、文字の中には、認識文字枠の境界と、文字の書き手が認識する文字の重心位置とが離れている文字が存在する。また、書き手が文字間にスペースを設ける際は、文字の境界同士を離すことよりも、文字の重心位置同士を離すものである。
したがって、たとえば、従来技術では、認識文字枠の境界と重心位置とが離れている文字については、文字間のスペースの有無の判別が困難となる。
1つの側面では、スペースの認識の精度を向上させることが可能な認識プログラム、認識方法及び認識装置を提供することを目的としている。
一様態によれば、入力された手書きデータから、個別の文字を認識し、認識された前記文字の認識結果に応じて、複数の前記文字それぞれについて、文字間のスペースを判別する際の基準位置を設定し、前記基準位置に基づき、前記複数の前記文字間のスペースの有無に関する情報を生成する、処理をコンピュータに実行させる。
上記各処理は、上記各処理を実現する機能部、上記各処理を手順としてコンピュータにより実行させる方法、プログラムを記憶したコンピュータ読み取り可能な記憶媒体とすることもできる。
スペースの認識の精度を向上させる。
文字間のスペースの判別を説明する図である。 第一の実施形態の認識システムのシステム構成の一例を示す図である。 第一の実施形態の認識装置のハードウェア構成の一例を示す図である。 第一の実施形態の特定文字データベースを説明する図である。 第一の実施形態の認識装置の機能構成を説明する図である。 第一の実施形態の認識装置の動作を説明するフローチャートである。 第一の実施形態のスペース検出処理部によるスペース検出処理を説明するフローチャートである。 認識装置に入力される手書きデータの一例を示す図である。 認識文字枠と文字情報を説明する図である。 認識された文字に含まれる特定文字と、特定文字と隣り合う文字を示す図である。 縦ストローク要素の抽出について説明する第一の図である。 縦ストローク要素の抽出について説明する第二の図である。 不要な縦ストローク要素がある場合と、縦ストローク要素がない場合について説明する図である。 縦ストローク要素間の距離の算出について説明する図である。 スペースの挿入位置を説明する図である。 第二の実施形態の認識システムのシステム構成の一例を示す図である。 第二の実施形態の認識装置の機能構成を説明する図である。 第二の実施形態のスペース検出処理部によるスペース検出処理を説明するフローチャートである。 認識システムのシステム構成の変形例を示す図である。 端末装置の変形例を示す図である。
以下に図面を参照して実施形態について説明する。本実施形態における文字認識では、認識文字枠の境界と、文字の書き手が認識する文字の重心位置とが離れている特定の文字(たとえば、J、L、Tなど)について、認識された文字に応じてスペース有無の判別に用いる基準位置を設定することにより、文字間のスペースの認識精度を向上させる。
図1は、文字間のスペースの判別を説明する図である。図1(A−1)、(A−2)は、認識された文字に、特定の文字(以下、特定文字)として「y」が含まれる場合を示しており、図1(B−1)、(B−2)は、認識された文字に、特定文字として「J」が含まれる場合を示している。
図1(A−1)、(A−2)では、手書き入力で「they live」という文字列が入力された例を示している。この場合、認識結果としては、文字列「they」と文字列「live」がそれぞれ1つの単語であるため、両者の間、つまり、文字「y」と文字「L」との間にスペースが挿入されることが望ましい。
ここで、文字「y」は、図1(A−1)に示すように、認識文字枠A1におけるスペース側の境界K1と、文字の書き手が認識する文字の重心軸G1とが離れている。尚、重心軸G1とは、文字「y」の重心と重なる縦方向(XY座標のY軸方向)の軸である。
このような特定文字において、書き手は、文字「y」の重心軸G1と、文字「l」の認識文字枠A2におけるスペース側の境界K2との距離L1を離すことで、2つの文字の間にスペースを設けようとする傾向がある。
したがって、文字「y」の認識文字枠A1の境界K1と、文字「l」の認識文字枠A2の境界K2との間の距離L2は、認識文字枠同士の距離によりスペースの有無を判別しようとした場合、スペースが有ると判別されるほど十分な距離とならない場合が多い。
そこで、本実施形態では、ある文字と、ある文字と隣り合う文字との間のスペースの有無を判別する際に、ある文字が、上述した特定文字であるか否かを判定する。
そして、本実施形態では、ある文字が特定文字と判別された場合、この特定文字と、特定文字と隣り合う文字のそれぞれに、スペースの有無を判別するための基準位置を設定し、基準位置同士の距離に基づきスペースの有無を判別する。
図1(A−2)の例では、文字「y」の基準位置を重心軸G1とし、文字「l」の基準位置を文字「l」のストロークにおける縦方向の成分の位置を示す軸G2とした。よって、図1(A−2)の例では、文字「y」と文字「l」との間のスペースの有無は、重心軸G1と軸G2との距離L1に基づき判別される。
本実施形態の特定文字は、他の文字と隣り合ったときに「ふところ」が広くなるとされる文字である。本実施形態の特定文字は、予め決められており、データベースに格納されている。本実施形態の「ふところ」とは、文字における画と画により形成される、画と画の内側の領域を示す。
図1(A−2)では、文字「y」における画S1と、文字「l」における画S2の内側の領域R1がふところとなる。つまり、本実施形態では、ふところとなる領域R1の幅を含む距離L1に基づき、スペースの有無の判別が行われる。
図1(B−1)、(B−2)では、「I am Japanese」という文字列が手書きで入力された例を示している。この場合、認識結果としては、文字「I」と文字列「am」の間、つまり、文字「I」と文字「a」との間にスペースが挿入されることが望ましい。
同様に、文字列「am」と文字列「Japanese」の間、つまり、文字「m」と文字「J」との間にスペースが挿入されることが望ましい。ここでは文字「m」と文字「J」との間のスペースについて説明する。
文字「J」は、予め決められた特定の文字であり、文字「m」の認識文字枠A3のスペース側の境界K3と、文字「J」の認識文字枠A4のスペース側の境界K4との距離L3は、スペースと判別するために十分な距離とならない。
そこで、本実施形態では、図1(B−2)に示すように、文字「m」と文字「J」のそれぞれに、基準位置を設定する。ここでは、図1(B−2)に示すように、文字「m」の基準位置をG3とし、文字「J」の基準位置をG4とした。
本実施形態の基準位置G3は、文字「m」から得られる複数の縦方向のストロークのうち、最もスペース側にある成分であり、基準位置G4は、文字「J」から得られる縦方向のストロークである。本実施形態では、基準位置G3と基準位置G4の距離L4に基づき、文字「m」と文字「J」との間のスペースの有無を判別する。
また、図1(B−2)では、文字「m」における画S3と、文字「J」における画S4の内側の領域R2ふところとなる。したがって、図1(B−2)では、ふところとなる領域R2の幅を含む距離L4に基づき、スペースの有無の判別が行われる。
以上のように、本実施形態では、文字間のスペースの有無を判別する際に、2つの文字の画により形成される、ふところとなる領域を考慮して、スペースの有無を判別することができる。
したがって、本実施形態によれば、隣り合う文字間のスペースの認識の精度を向上させることができる。
(第一の実施形態)
図2は、第一の実施形態の認識システムのシステム構成の一例を示す図である。本実施形態の認識システム100は、認識装置200と、端末装置300とを有する。本実施形態では、認識装置200と端末装置300とは、ネットワークNを介して接続される。
本実施形態の認識装置200は、特定文字データベース210と、認識処理部220と、を有する。
本実施形態の認識システム100において、端末装置300は、手書きデータの入力を受け付けると、入力された手書きデータを認識装置200へ送信する。認識装置200は、端末装置300から手書きデータを受信すると、認識処理部220により、特定文字データベース210を参照して手書きデータの認識を行い、認識結果を端末装置300へ出力する。端末装置300は、認識装置200から受信した認識結果を表示させる。
尚、本実施形態の端末装置300には、手書きデータの入力を受け付ける入力画面と、手書きデータの認識結果を示す結果表示画面とを表示させる表示処理部を有していても良い。本実施形態の手書きデータとは、認識装置200に対して認識させるデータであり、人の指やポインタ等により描かれるストロークを示す。本実施形態の手書きデータには、例えば文字、数字、文字列等が含まれる。また、本実施形態の手書きデータには、図形や記号等が含まれても良い。
図3は、第一の実施形態の認識装置のハードウェア構成の一例を示す図である。
本実施形態の認識装置200は、それぞれバスBで相互に接続されている入力装置21、出力装置22、ドライブ装置23、補助記憶装置24、メモリ装置25、演算処理装置26及びインターフェース装置27を有する。
入力装置21は、例えばマウスやキーボードであり、各種の情報を入力するために用いられる。出力装置22は、例えばディスプレイ等であり、各種信号の表示(出力)に用いられる。インターフェース装置27は、モデム,LANカード等を含み、ネットワークに接続する為に用いられる。
認識プログラムは、認識装置200を制御する各種プログラムの少なくとも一部である。認識プログラムは例えば記録媒体28の配布やネットワークからのダウンロードなどによって提供される。認識プログラムを記録した記録媒体28は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
また、認識プログラムを記録した記録媒体28がドライブ装置23にセットされると、認識プログラムは記録媒体28からドライブ装置23を介して補助記憶装置24にインストールされる。ネットワークからダウンロードされた認識プログラムは、インターフェース装置27を介して補助記憶装置24にインストールされる。
補助記憶装置24は、インストールされた認識プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置25は、コンピュータの起動時に補助記憶装置24から認識プログラムを読み出して格納する。そして、演算処理装置26はメモリ装置25に格納された各プログラムに従って、後述するような各種処理を実現している。
尚、本実施形態の認識装置200がタブレット型のコンピュータやスマートフォン等である場合には、入力装置21及び出力装置22を兼ねた表示操作装置を有しても良い。表示操作装置は、例えば表示機能を有するタッチパネル等により実現される。
また、本実施形態の端末装置300は、例えば上述した手書きデータの入力を受け付けるタッチパネル等を有するタブレット型のコンピュータやスマートフォン等である。
次に、図4を参照して本実施形態の特定文字データベース210について説明する。図4は、第一の実施形態の特定文字データベースを説明する図である。図4(A)は、特定文字を説明する図であり、図4(B)は、特定文字データベースの一例を示す図である。
本実施形態では、隣り合う文字との間にふところが形成されたとき、ふところが広くなる可能性がある文字を特定文字としている。図4(A)では、隣り合う文字との間に形成されるふところを黒丸で示し、黒丸が記されている文字を特定文字とした。特定文字は、例えば過去の手書きデータの文字認識において、隣り合う文字との間に形成されるふところが広く、文字間にあるスペースが認識されなかった文字を集計した結果等として、予め与えられている。
具体的には、特定文字は、例えばアルファベットの「f」、「g」、「I」、「7」等である。尚、本実施形態の特定文字は、アルファベットや数字以外の文字を含んでいて良い。例えば特定文字には、ひらがなやハングル文字等、各国の言語の文字が含まれていても良い。
本実施形態の特定文字データベース210には、図4(A)に示す各種の特定文字が格納されている。
本実施形態では、特定文字に対してのみ、後述するスペースの有無の判定を行うことで、例えば「b」や「d」等の小さい縦の要素を除外した場合に、スペースの有無の判定を誤ることを抑制できる。
次に、図5を参照して本実施形態の認識装置200の機能について説明する。図5は、第一の実施形態の認識装置の機能構成を説明する図である。
本実施形態の認識装置200は、認識処理部220を有する。本実施形態の認識処理部220は、認識装置200の演算処理装置26により、メモリ装置25に格納された認識プログラムが実行されることにより実現される。
本実施形態の認識処理部220は、入力受付部230、文字認識部240、スペース検出処理部250、文字列決定部260、認識結果出力部270を有する。
入力受付部230は、端末装置300から送信される手書きデータの入力を受け付ける。文字認識部240は、入力された手書きデータに含まれる文字を認識する文字認識処理を行う。
本実施形態のスペース検出処理部250は、文字間のスペースを検出する。スペース検出処理部250の詳細は後述する。
文字列決定部260は、文字認識部240による文字認識の結果と、スペース検出処理部250によるスペースの検出の結果と、に応じた文字列を決定する。認識結果出力部270は、文字列決定部260により決定された文字列を、本実施形態の認識装置200による認識結果として、端末装置300に出力する。
本実施形態のスペース検出処理部250は、文字情報算出部251、特定文字照合部252、間隔判定部253、縦ストローク抽出部254、不要要素除去部255、基準位置設定部256、基準位置間隔算出部257、位置情報生成部258を有する。
本実施形態の文字情報算出部251は、文字認識部240による文字認識の結果から、認識された文字の高さ・幅等を含む文字情報を算出する。具体的には、本実施形態の文字情報は、平均文字間隔、平均文字幅である。
特定文字照合部252は、文字認識部240により認識された各文字と、特定文字データベース210とを照合する。
間隔判定部253は、文字認識部240により認識された各文字間の間隔が、スペースとみなされる距離であるか否かを判定する。
縦ストローク抽出部254は、文字認識部240により認識された文字に含まれるストロークにおける縦方向の成分を抽出する。以下の説明では、文字に含まれるストロークにおける縦方向の成分を縦ストローク要素と呼ぶ。
不要要素除去部255は、縦ストローク抽出部254により抽出さたれ縦ストローク要素から、スペースの検出において不要となる縦ストローク要素を除去し、スペースの検出において用いられる縦ストローク要素を残す。
基準位置設定部256は、スペースの検出において用いられる縦ストローク要素の位置を示す値を取得し、この値を、縦ストローク要素を抽出した文字の基準位置に設定する。
基準位置間隔算出部257は、隣り合う文字同士からそれぞれ抽出された縦ストローク要素の距離を算出する。言い換えれば隣り合う文字それぞれの基準位置の間の距離を算出する。位置情報生成部258は、スペース有りと判定された位置を示す情報を生成する。
本実施形態のスペース検出処理部250の有する各部の処理の詳細は後述する。
次に、図6を参照して、本実施形態の認識装置200の動作について説明する。図6は、第一の実施形態の認識装置の動作を説明するフローチャートである。
本実施形態の認識装置200は、入力受付部230により、端末装置300から受信した手書きデータの入力を受け付ける(ステップS61)。続いて認識装置200は、文字認識部240により、手書きデータに対する文字認識を行う(ステップS62)。
続いて、認識装置200は、スペース検出処理部250は、認識結果の各文字を取得する(ステップS63)。次に認識装置200は、スペース検出処理部250により、文字間毎にスペース検出処理を行う(ステップS64)。
続いて認識装置200は、文字列決定部260により、文字認識部240による文字認識結果と、スペース検出処理部250によるスペース検出結果とを反映させた文字列を決定し、決定した文字列を端末装置300に出力する(ステップS65)。端末装置300は、認識装置200から出力された文字列を表示させる。
次に、図7を参照し、本実施形態のスペース検出処理部250によるスペース検出処理について説明する。図7は、第一の実施形態のスペース検出処理部によるスペース検出処理を説明するフローチャートである。
本実施形態のスペース検出処理部250は、文字情報算出部251により、認識された各文字を囲う認識文字枠に関する情報から、平均文字間隔α、平均文字幅βを含む文字情報を算出する(ステップS701)。
続いてスペース検出処理部250は、認識された文字列における文字の位置を示す変数を変数iとし(ステップS702)、i=0〜mまで、ステップS703以降の処理を行う。尚、mは文字間隔数であり、認識された文字数をnとした場合、m=n−1である。
本実施形態のスペース検出処理部250は、間隔判定部253は、文字間隔Siの距離が平均文字間隔α±標準偏差以上の間隔であり、且つ文字間隔Siが平均文字幅β±標準偏差以上の間隔であるか否かを判定する(ステップS703)。尚、ここで文字間隔Siは、文字列のi番目の文字とi+1番目の文字との文字間隔である。
ステップS703において、文字間隔Siが条件を満たす場合、間隔判定部253は、文字間隔Siをスペースと判定し、該当文字間がスペース挿入位置であることを示す位置情報を生成し、文字列決定部260へ出力する(ステップS704)。すなわち、本実施形態では、i番目の文字とi+1番目の文字との文字間隔が、平均文字間隔α以上であり、且つ平均文字幅β以上である場合に、この文字間にスペースが有ると検出する。
ステップS703において、文字間隔Siが条件を満さない場合、スペース検出処理部250は、特定文字照合部252により、特定文字データベース210を参照し、i番目の文字が特定文字であるか否かを判定する(ステップS705)。ステップS705において、i番目の文字が特定文字でない場合、スペース検出処理部250は、i番目とi+1番目の文字の間にスペースは無いものと判定し、後述するステップS713へ進む。
ステップS705において、i番目の文字が特定文字であった場合、スペース検出処理部250は、縦ストローク抽出部254は、スペースが入る可能性がある文字と、その前後の文字を1つのグループとし、グループ内の各文字から縦ストローク要素を抽出する(ステップS706)。すなわち、縦ストローク抽出部254は、i−1番目の文字と、i番目の文字と、i+1番目の文字から、それぞれ縦ストローク要素を抽出する。
続いて、スペース検出処理部250は、縦ストローク抽出部254により、各文字に縦ストローク要素が存在するか否かを判定する(ステップS707)。ステップS707において、各文字に縦ストローク要素が存在する場合、スペース検出処理部250は、不要要素除去部255により、各文字の無効な縦ストローク要素を除去し(ステップS708)、後述するステップS710へ進む。
ステップS707において、各文字に縦ストローク要素が存在しない場合、スペース検出処理部250は、縦ストローク抽出部254により、縦ストローク要素が存在しない文字の文字幅の中心値を縦ストローク要素の値とする(ステップS709)。
続いて、スペース検出処理部250は、基準位置設定部256により、各文字の縦ストローク要素の位置を示す値を取得して基準位置に設定し、基準位置間隔算出部257により、基準位置同士の間隔(距離)を算出する(ステップS710)。
尚、本実施形態では、i−1番目の文字において最もi番目の文字に近い位置の縦ストローク要素と、i番目の文字において最もi−1番目の文字に近い位置の縦ストローク要素との距離を算出する。同様に、本実施形態では、i1番目の文字において最もi+1番目の文字に近い位置の縦ストローク要素と、i+1番目の文字において最もi番目の文字に近い位置の縦ストローク要素との距離を算出する。また、本実施形態では、各縦ストローク要素の幅の中心の座標を縦ストローク要素の値とし、この値を用いて縦ストローク要素間の距離を算出する。
続いてスペース検出処理部250は、間隔判定部253により、縦ストローク要素間の距離が平均文字間隔α±標準偏差以上の間隔であり、且つ縦ストローク要素間の距離が平均文字幅β±標準偏差以上の間隔であるか否かを判定する(ステップS711)。
ステップS711において、縦ストローク要素の距離が条件を満たさない場合、スペース検出処理部250は、後述するステップS713へ進む。
ステップS711において、縦ストローク要素の距離が条件を満たす場合、間隔判定部253は、縦ストローク要素間の距離をスペースによるもの判定し、該当文字間がスペース挿入位置であることを示す位置情報を生成し、文字列決定部260へ出力する(ステップS712)。
尚、スペース挿入位置であることを示す位置情報とは、すなわち文字間のスペースの有無に関する情報である。尚、本実施形態では、縦ストローク要素間の間隔がスペースと判定されたとき、スペースの挿入位置を示す位置情報を生成するものとしたが、これに限定されない。本実施形態では、例えば縦ストローク要素間の間隔がスペースでないと判定されたとき、スペースの有無に関する情報として、スペースの挿入位置ではないことを示す情報を生成し、文字列決定部260に出力しても良い。
本実施形態のスペース検出処理部250は、ステップS703からS712までの処理を変数i=mとなるまで繰り返し(ステップS713)、処理を終了する。
次に、図8乃至図16を参照し、スペース検出処理部250の処理を具体的に説明する。
図8は、認識装置に入力される手書きデータの一例を示す図である。図8に示す画面81は、端末装置300に表示された手書きデータの入力画面の一例である。
画面81では、「IamJapanese」という文字列が入力されている。この文字列が手書きデータとして認識装置200に送信される。
本実施形態の認識装置200は、文字認識部240により、手書きデータに含まれる各文字が認識されると、各文字を囲う認識文字枠に関する情報を取得する。認識文字枠に関する情報は、文字の高さや幅の情報を含む。
図9は、認識文字枠と文字情報を説明する図である。図9(A)は、認識文字枠を説明する図であり、図9(B)は文字情報を説明する図である。
本実施形態では、文字認識部240が手書きデータに含まれる各文字を認識した際に、各文字を囲う認識文字枠に関する情報(以下、認識文字枠情報)が得られる。以下の説明では、認識文字枠情報は、文字を囲う認識文字枠の高さを示す値と、文字を囲う認識文字枠の幅を示す値とを含む。本実施形態では、認識文字枠の高さを文字の高さとし、認識文字枠の幅を文字の幅として用いる。
図9(A)では、文字「m」を囲う認識文字枠Aを示している。文字「m」は、ドットの集合として表されており、認識文字枠Aは、ドットの集合を囲っている。
この認識文字枠Aの高さを示す値Hと、幅を示す値Wが、認識文字枠Aの認識文字枠情報であり、文字「m」の高さと幅となる。
尚、認識文字枠Aの高さを示す値Hと、幅を示す値Wとは、認識文字枠Aの4点の座標から得られる。本実施形態では、例えば手書きデータの入力画面に設けられた基準点を起点に、認識文字枠Aの4点の座標を取得しても良い。図9(A)の例では、入力画面の左上の点を基準点P(0,0)として、認識文字枠Aの高さHと幅Wが求められる。
本実施形態の文字情報算出部251は、以上のようにして文字認識部240により認識された各文字の認識文字枠情報を取得する。そして、文字情報算出部251は、取得した認識文字枠情報から図9(B)に示すように文字情報を算出する。
本実施形態の文字情報は、手書きデータから認識された文字列に含まれる文字の平均文字間隔αと、平均文字幅βである。
本実施形態では、認識された文字列において、i番目の文字の文字幅をWiとし、i番目の文字とi+1番目の文字との文字間隔をSiとし、文字列に含まれる文字の数をnとし、文字間隔数をm(=n−1)としたきと、平均文字間隔αと、平均文字幅βは、それぞれ以下の図9(B)に示す式1、式2で求められる。
よって、本実施形態の文字情報算出部251は、認識文字枠情報及び式1、式2により、平均文字間隔α及び平均文字幅βを算出する。
図10は、認識された文字に含まれる特定文字と、特定文字と隣り合う文字を示す図である。図10の例では、手書きデータから認識された文字のうち、特定文字データベース210に含まれる文字は、「I」、「J」、「p」である。
よって、図10では、文字「I」、「J」、「p」のそれぞれについて、各文字と、各文字と隣り合う文字とに基準位置を設定し、基準位置に基づくスペースの有無を判別する。
文字「I」と隣り合う文字は、文字「a」である。よって、文字「I」と文字「a」間のスペースの有無の判別は、グループGr1内の文字「I」と文字「a」のそれぞれに基準位置を設けて行われる。基準位置は、グループGr1内の各文字から抽出された縦ストローク要素により設定される。
尚、文字「I」は文字列の先頭の文字であるため、文字「I」の前の文字は存在しない。よって、文字「I」についてのスペースの有無の判別は、文字「I」と、文字「I」の後の文字「a」との間についてのみ行われる。
同様に、文字「J」と隣り合う文字は、文字「m」と文字「a」である。よって、文字「J」と、文字「J」と隣り合う文字との間のスペースの有無の判別は、グループGr2内の文字「J」と文字「m」と文字「a」のそれぞれに基準位置を設けて行われる。基準位置は、グループGr2内の各文字から抽出された縦ストローク要素により設定される。
また、文字「p」と隣り合う文字は、文字「a」と文字「a」である。よって、文字「p」と、文字「p」と隣り合う文字との間のスペースの有無の判別は、グループGr3内の文字「p」と、文字「p」の前の文字「a」と、文字「p」の後の文字「a」のそれぞれに基準位置を設けて行われる。基準位置は、グループGr3内の各文字から抽出された縦ストローク要素により設定される。
図11は、縦ストローク要素の抽出について説明する第一の図である。本実施形態では、特定文字と、特定文字と隣り合う文字とが抽出されると、縦ストローク抽出部254により、各文字から縦ストローク要素を抽出する。
本実施形態の縦ストローク抽出部254は、基準となる基準ドットDを決め、この基準ドットDを通る縦方向の軸に対し、所定の角度±θ以内の範囲に入るドットにより表されるストロークを縦ストローク要素とする。尚、基準ドットDを通る縦方向の軸とは、紙面上に示すXY座標におけるy軸方向である。
本実施形態では、基準ドットDから所定の角度の範囲に入るストロークを縦ストローク要素と見なすことで、手書きの際の手先のゆれが反映されたストロークでも、縦ストローク要素として抽出することができる。
図11の例では、ストロークStaとストロークStbは、基準ドットDを通る縦方向の軸から所定の角度±θ以内の範囲に入るドットにより表されるストロークであるため、縦ストローク要素として抽出される。
また、ストロークStcは、ストロークStcを示すドットが、基準ドットDを通る縦方向の軸から所定の角度±θ以内の範囲に入っていないため、縦ストローク要素として抽出されない。
図12は、縦ストローク要素の抽出について説明する第二の図である。図12では、グループGr1、Gr2、Gr3のそれぞれの各文字から抽出された縦ストローク要素を示している。
グループGr1においては、文字「I」と文字「a」の縦ストローク要素が抽出される。文字「I」からは、縦ストローク要素St1が抽出される。文字「a」からは、縦ストローク要素St2、St3、St4が抽出される。
また、グループGr2においては、文字「m」と文字「J」と文字「a」の縦ストローク要素が抽出される。文字「m」からは、縦ストローク要素St5、St6、St7、St8が抽出される。文字「J」からは、縦ストローク要素St9、St10が抽出される。文字「a」からは、縦ストローク要素St11、St12、St13が抽出される。
グループGr3においては、文字「a」と文字「p」と文字「a」の縦ストローク要素が抽出される。文字「a」からは、縦ストローク要素St11、St12、St13が抽出される。文字「p」からは、縦ストローク要素St14、St15が抽出される。文字「a」からは、縦ストローク要素St16、St17、St18が抽出される。
次に、図13を参照し、縦ストローク要素の抽出において、不要な縦ストローク要素がある場合と、縦ストローク要素がない場合について説明する。図13は、不要な縦ストローク要素がある場合と、縦ストローク要素がない場合について説明する図である。
始めに、図13(A)を参照し、不要な縦ストローク要素がある場合について説明する。図13(A)は、不要な縦ストローク要素がある場合を示している。
本実施形態では、1つの文字から複数の縦ストローク要素が抽出された場合、ある縦ストローク要素を示す領域の面積が、他の縦ストローク要素を示す領域の面積より所定値以上小さい場合に、その縦ストローク要素を無効とし、除去する。
図13(A)では、文字「J」について示している。文字「J」からは、縦ストローク要素St9、St10が抽出される。そこで、不要要素除去部255は、2つの縦ストローク要素St9、St10それぞれの領域の面積を比較し、その差分が所定値より大きいか否かを判定する。つまり、不要要素除去部255は、縦ストローク要素St9の領域の面積が、縦ストローク要素St10の領域の面積よりも所定値以上小さいか否かを判定している。
ここでは、縦ストローク要素St9の領域の面積は、縦ストローク要素St10の領域の面積より所定値以上小さいため、縦ストローク要素St9は無効と判断される。無効と判断された縦ストローク要素は、スペースの有無の判定に用いる基準位置に設定されることはない。
尚、ここでは、不要要素除去部255は、縦ストローク要素の領域の面積の差分により縦ストローク要素が無効か否かを判定しているが、判定の仕方はこれに限定されない。例えば、文字毎に縦ストローク要素の位置と、スペースの有無の判別に用いられる確率とを対応付けておき、抽出された縦ストローク要素の位置と対応する確率が所定の閾値以下であった場合にもこの縦ストローク要素を無効としても良い。
次に、図13(B)を参照し、縦ストローク要素が存在しない場合について説明する。図13(B)は、縦ストローク要素がない場合を示している。
本実施形態では、縦ストローク要素が存在しない場合、認識文字枠の幅の中心値をスペースの有無の判別に用いる基準位置とする。
図13(B)では、文字「y」について示している。文字「y」には、縦ストローク要素が存在しない。したがって、縦ストローク抽出部254は、文字「y」の認識文字枠y1の幅Wyの中心のx座標を通る軸St20を文字「y」の基準位置となる縦ストローク要素の値とする。
次に、図14を参照し、縦ストローク要素間の距離の算出について説明する。図14は、縦ストローク要素間の距離の算出について説明する図である。
図14(A)は、文字列「IamJapanese」における縦ストローク要素間の距離の算出を説明する図である。
本実施形態の基準位置間隔算出部257は、縦ストローク要素間の距離を算出する際に、左の文字の最も右側にある縦ストローク要素と、右の文字の最も左側にある縦ストローク要素と、の間隔を算出する。つまり、本実施形態の基準位置間隔算出部257は、ある文字の基準位置となる縦ストローク要素と、ある文字と隣り合っている文字から抽出された、ある文字の基準位置と最も近い位置にある縦ストローク要素との距離を算出する。
また、本実施形態の基準位置間隔算出部257は、縦ストローク要素の幅の中心の座標値を、縦ストローク要素の位置を示す値とし、縦ストローク要素間の距離を算出する。
図14(A)では、文字列に含まれる全ての特定文字に縦ストローク要素が存在した場合を示している。
図14(A)において、グループGr1では、文字「I」から縦ストローク要素St1が抽出される。文字「I」から抽出された縦ストローク要素は、縦ストローク要素St1のみであるため、この縦ストローク要素St1が基準位置となる。具体的には、縦ストローク要素St1の幅の中心の座標値が、縦ストローク要素St1の位置を示す値であり、文字「I」のスペース有無の判別に用いられる基準位置である。
文字「a」からは、縦ストローク要素St2、St3、St4が抽出される。よって、文字「a」では、最も文字「I」と近い縦ストローク要素St2が、文字「I」と文字「m」との間のスペースの有無の判定に用いられる。
ここで、本実施形態の基準位置間隔算出部257は、縦ストローク要素St1の幅の中心の座標値と、縦ストローク要素St2の幅の中心の座標値とから、縦ストローク要素St1と縦ストローク要素St2との間の距離L1を算出する。
そして、本実施形態では、間隔判定部253は、距離L11の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「I」と文字「m」の間にスペースが有ると判定する。
グループGr2では、文字「j」から縦ストローク要素St10が抽出される。文字「j」から抽出された縦ストローク要素は、縦ストローク要素St10のみであるため、この縦ストローク要素St10が基準位置となる。具体的には、縦ストローク要素St10の幅の中心の座標値が、縦ストローク要素St10の位置を示す値であり、文字「J」のスペース有無の判別に用いられる基準位置である。
文字「J」の前の文字である文字「m」からは、縦ストローク要素St8を含む複数の縦ストローク要素が抽出される。よって、文字「m」では、最も文字「J」と近い縦ストローク要素St8が、文字「m」と文字「J」との間のスペースの有無の判定に用いられる。
よって、本実施形態の基準位置間隔算出部257は、縦ストローク要素St8の幅の中心の座標値と、縦ストローク要素St10の幅の中心の座標値とから、縦ストローク要素St8と縦ストローク要素St10との間の距離L12を算出する。
グループGr2において、文字「J」の後の文字である文字「a」からは、縦ストローク要素St11を含む複数の縦ストローク要素が抽出される。よって、文字「a」では、最も文字「J」と近い縦ストローク要素St11が、文字「J」と文字「a」との間のスペースの有無の判定に用いられる。
よって、本実施形態の基準位置間隔算出部257は、縦ストローク要素St10の幅の中心の座標値と、縦ストローク要素St11の幅の中心の座標値とから、縦ストローク要素St10と縦ストローク要素St10との間の距離L13を算出する。
本実施形態の間隔判定部253は、距離L12の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「m」と文字「J」の間にスペースが有ると判定する。また、間隔判定部253は、距離L13の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「J」と文字「a」の間にスペースが有ると判定する。
グループGr3でも、グループGr1,Gr2と同様に、縦ストローク要素間の間隔を算出する。つまり、グループGr3では、文字「p」から抽出された縦ストローク要素St14の幅の中心の座標値と、文字「p」の前の文字「a」から抽出された縦ストローク要素St13の幅の中心の座標値とから、縦ストローク要素St13と縦ストローク要素St14との間の距離L14を算出する。また、グループGr3では、文字「p」から抽出された縦ストローク要素St15の幅の中心の座標値と、文字「p」の後の文字「a」から抽出された縦ストローク要素St16の幅の中心の座標値とから、縦ストローク要素St15と縦ストローク要素St16との間の距離L15を算出する。
そして、間隔判定部253は、距離L14の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「a」と文字「p」の間にスペースが有ると判定する。また、間隔判定部253は、距離L15の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「p」と文字「a」の間にスペースが有ると判定する。
図14(A)の例では、文字「I」と文字「a」の間と、文字「m」と文字「J」の間にスペースが有ると判定される。
図14(B)では、文字列に含まれる特定文字に縦ストローク要素が存在しない場合を示している。図14(B)では、手書きデータから「myspease」という文字列が認識された場合を示している。
この場合、文字列に含まれる特定文字は、文字「y」と文字「p」である。よって、図14(B)の文字列からは、文字「y」と、文字「y」の前後の文字「m」、「s」とがグループGr11とされ、文字「p」と、文字「p」の前後の文字「s」、「a」とがグループGr12とされる。
グループGr11において、文字「m」から抽出された縦ストローク要素は、縦ストローク要素St20、St21、St22である。よって、文字「m」では、最も文字「y」に近い縦ストローク要素St22の幅の中心の座標値が、文字「m」と文字「y」との間のスペースの有無の判別に用いられる基準位置となる。
また、文字「y」から抽出された縦ストローク要素は、文字「y」の認識文字枠の幅の中心値を通る軸St23である。文字「y」では、この中心値が、文字「m」と文字「y」との間のスペースの有無の判別に用いられる基準位置となる。
よって、間隔判定部253は、縦ストローク要素St22と軸St23との間の距離L21の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「m」と文字「y」の間にスペースが有ると判定する。
また、グループGr11において、文字「s」から抽出された縦ストローク要素は、縦ストローク要素St24、St25である。よって、文字「s」では、最も文字「y」に近い縦ストローク要素St24の幅の中心の座標値が、文字「y」と文字「s」との間のスペースの有無の判別に用いられる基準位置となる。
よって、間隔判定部253は、軸St23と縦ストローク要素St24との間の距離L22の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「y」と文字「s」の間にスペースが有ると判定する。
グループGr12でも、グループGr11と同様に、縦ストローク要素間の間隔を算出する。つまり、グループGr12では、文字「s」から抽出された縦ストローク要素St25の幅の中心の座標値と、文字「p」から抽出された縦ストローク要素St26の幅の中心の座標値とから、縦ストローク要素St25と縦ストローク要素St26との間の距離L23を算出する。また、グループGr12では、文字「p」から抽出された縦ストローク要素St27の幅の中心の座標値と、文字「a」から抽出された縦ストローク要素St28の幅の中心の座標値とから、縦ストローク要素St27と縦ストローク要素St28との間の距離L24を算出する。
そして、間隔判定部253は、距離L23の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「s」と文字「p」の間にスペースが有ると判定する。また、間隔判定部253は、距離L24の値が、平均文字間隔α以上であり、且つ、平均文字幅β以上であった場合に、文字「p」と文字「a」の間にスペースが有ると判定する。
図14(B)の例では、文字「y」と文字「s」の間にスペースが有ると判定される。
図15は、スペースの挿入位置を説明する図である。図15の例では、図14(A)で説明した処理の結果、検出されたスペースの挿入位置を示している。
図15では、文字「I」と文字「a」の間と、文字「m」と文字「J」の間が、それぞれスペースの挿入位置である。したがって、位置情報生成部258は、スペースの挿入位置を示す位置情報として、認識された文字列「IamJapanese」のうち、「1文字目と2文字目の間」と「3文字目と4文字目の間」という情報を生成し、文字列決定部260へ渡す。
図15において、スペースの挿入位置(スペースが有ると判別された位置)である文字「I」と文字「a」の間には、文字「I」と文字「a」の画により形成されるふところである領域R21が含まれる。また、スペースの挿入位置である文字「m」と文字「J」の間には、文字「m」と文字「J」の画により形成されるふところである領域R22が含まれる。
このように、本実施形態では、文字間のスペースの有無の判別において、隣り合う文字の画により形成されるふところが考慮されていることがわかる。
このように、本実施形態では、認識された文字列に、文字の書き手が認識する文字の重心位置と、認識文字枠の境界とが離れる特定文字が含まれている場合において、スペースの認識の精度を向上させることができる。
(第二の実施形態)
以下に図面を参照して、第二の実施形態について説明する。第二の実施形態は、単語辞書データベースと認識後の文字列を参照する点が第一の実施形態と相違する。よって、以下の第二の実施形態の説明では、第一の実施形態との相違点についてのみ説明し、第一の実施形態と同様の機能構成を有するものには第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
図16は、第二の実施形態の認識システムのシステム構成の一例を示す図である。本実施形態の認識システム100Aは、認識装置200Aと、端末装置300とを有する。
本実施形態の認識装置200Aは、特定文字データベース210と、認識処理部220Aと、単語辞書データベース280と、を有する。
本実施形態の単語辞書データベース280は、例えば単語群が格納された辞書データベースであり、予め認識装置200Aに与えられていても良い。尚、本実施形態では、単語辞書データベース280は、認識装置200Aに設けられるものとしたが、これに限定されない。単語辞書データベース280は、ネットワークN上の認識装置200A以外の装置に設けられていても良い。この場合、認識装置200Aは、ネットワークNを介して単語辞書データベース280を参照すれば良い。
図17は、第二の実施形態の認識装置の機能構成を説明する図である。本実施形態の認識装置200Aの有する認識処理部220Aは、入力受付部230、文字認識部240、スペース検出処理部250A、文字列決定部260、認識結果出力部270を有する。
本実施形態のスペース検出処理部250Aは、第一の実施形態のスペース検出処理部250の有する各部に加え、辞書照合部259を有する。
本実施形態の辞書照合部259は、スペースの間にあると判別された文字列と、単語辞書データベース280とを照合する。
以下に、図18を参照して第二の実施形態のスペース検出処理部250Aの処理について説明する。
図18は、第二の実施形態のスペース検出処理部によるスペース検出処理を説明するフローチャートである。
図18のステップS1801からステップS1812までの処理は、ステップS1804とステップS1812において、スペース挿入位置であることを示す位置情報を生成するに留まり、文字列決定部260に位置情報を出力しない点以外は、図7のステップS701からステップS712までの処理と同様であるから、説明を省略する。
ステップS1804及びステップS1812に続いて、スペース検出処理部250Aは、辞書照合部259により、前のスペース挿入位置から、次のスペース挿入位置までの文字列と、単語辞書データベース280とを照合する(ステップS1813)。続いて辞書照合部259は、単語辞書データベース280に文字列と一致する単語が存在するか否かを判定する(ステップS1814)。
ステップS1814において、該当する単語が存在する場合、ステップS1804又はステップS1812において取得した、スペース挿入位置であることを示す位置情報を文字列決定部260に出力する(ステップS1815)。ステップS1814において、該当する単語が存在しない場合、ステップS1816へ進む。すなわち、本実施形態では、スペースとスペースとの間の文字列が単語辞書データベース280に存在しない場合、スペース検出処理部250Aは、該当箇所にスペースがないものとし、スペースの挿入位置を示す位置情報を文字列決定部260に出力しない。
以上のように、本実施形態では、スペースとスペースとの間の文字列と一致する単語が単語辞書データベース280内に存在するか否かを判定してから、スペースの挿入位置を示す位置情報を文字列決定部260に出力する。
したがって、本実施形態によれば、手書きデータから認識された文字列に含まれる単語の認識精度を向上させる。
尚、本実施形態では、スペースとスペースとの間の文字列が単語辞書データベース280内に存在しない場合は、該当箇所にスペースが無いと判断するものとしたが、これに限定されない。本実施形態では、例えばスペースとスペースとの間の文字列が単語辞書データベース280内に存在しない場合、この文字列を単語辞書データベース280に登録し、スペースの挿入位置を示す位置情報を文字列決定部260に出力しても良い。本実施形態では、このように、認識された文字列を単語辞書データベース280に登録していくことで、単語辞書データベース280を更新していくことができる。
次に、図19及び図20を参照し、認識システム100と端末装置300の変形例について説明する。
図19は、認識システムのシステム構成の変形例を示す図である。図19に示す認識システム100Bは、認識装置200Bと端末装置300Aと、を有する。
認識システム100Bでは、認識装置200Bは、特定文字データベース210のみを有し、端末装置300Aが認識処理部220を有する。
端末装置300Aは、認識処理部220のスペース検出処理部250の処理において、認識装置200Bの特定文字データベース210を参照しても良い。尚、認識装置200Bは、単語辞書データベース280を有していても良い。
図20は、端末装置の変形例を示す図である。図20に示す端末装置300Bは、特定文字データベース210と、認識処理部220とを有し、端末装置300B自身が認識装置200と同様の機能を果たす。尚、端末装置300Bは、単語辞書データベース280を有していても良い。
開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
入力された手書きデータから、個別の文字を認識し、
認識された前記文字の認識結果に応じて、複数の前記文字それぞれについて、文字間のスペースを判別する際の基準位置を設定し、
前記基準位置に基づき、前記複数の前記文字間のスペースの有無に関する情報を生成する、処理をコンピュータに実行させる認識プログラム。
(付記2)
前記スペースの有無に関する情報に基づき、前記文字間のスペースの有無を判別する、処理を前記コンピュータに実行させる付記1記載の認識プログラム。
(付記3)
第一の文字と第二の文字との間のスペースの有無に関する情報と、
前記第一の文字の前に有ると判別されたスペースの次の文字から、前記第一の文字までの文字列と、単語群が格納された辞書データベースとを照合した結果と、
に基づき、前記第一の文字と前記第二の文字との間のスペースの有無を判別する処理を、前記コンピュータに実行させる付記1又は2記載の認識プログラム。
(付記4)
前記複数の文字毎に、前記文字の認識による前記文字を囲う枠の幅を示す値を取得し、
前記複数の文字のそれぞれを囲う前記枠の幅の平均値と、枠と枠との間の距離の平均値とを算出し、
前記複数の文字のそれぞれの前記基準位置の間の距離が、前記枠の幅の平均値以上であり、且つ前記枠と枠との間の距離の平均値以上であるとき、
前記文字間のスペースの有無に関する情報を生成する、処理を前記コンピュータに実行させる付記1乃至3の何れか一項に記載の認識プログラム。
(付記5)
前記基準位置は、
前記文字の重心軸の位置と、前記文字を囲う枠における文字と文字との境界の位置と、を含む付記1乃至4の何れか一項に記載の認識プログラム。
(付記6)
前記基準位置は、
前記認識された文字から抽出された縦方向のストロークが示す位置である付記5記載の認識プログラム。
(付記7)
前記第一の文字から抽出された縦方向のストロークのうち、前記第一の文字の次の文字である第二の文字に最も近い縦方向のストロークが示す位置を、第一の文字の基準位置とし、
前記第二の文字から抽出された縦方向のストロークのうち、前記第一の文字に最も近い位置にある縦方向のストロークが示す位置を、第二の文字の基準位置とする、付記6記載の認識プログラム。
(付記8)
前記縦方向のストロークが存在しない文字の場合、
前記文字を囲う前記枠の幅の中心の位置を、前記文字の基準位置とする、付記5乃至7の何れか一項に記載の認識プログラム。
(付記9)
コンピュータによる認識方法であって、該コンピュータが、
入力された手書きデータから、個別の文字を認識し、
認識された前記文字の認識結果に応じて、複数の前記文字それぞれについて、文字間のスペースを判別する際の基準位置を設定し、
前記基準位置に基づき、前記複数の前記文字間のスペースの有無に関する情報を生成する、認識方法。
(付記10)
入力された手書きデータから、個別の文字を認識する文字認識部と、
認識された前記文字の認識結果に応じて、複数の前記文字それぞれについて、文字間のスペースを判別する際の基準位置を設定する基準位置設定部と、
前記基準位置に基づき、前記複数の前記文字間のスペースの有無に関する情報を生成する位置情報生成部と、を有する認識装置。
本発明は、具体的に開示された実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
100、100A 認識システム
200、200A、200B 認識装置
210 特定文字データベース
220 認識処理部
240 文字認識部
250 スペース検出処理部
251 文字情報算出部
252 特定文字照合部
253 間隔判定部
254 縦ストローク抽出部
257 基準位置間隔算出部
258 位置情報生成部
259 辞書照合部
260 文字列決定部
270 認識結果出力部
280 単語辞書データベース
300、300A、300B 端末装置

Claims (7)

  1. 入力された手書きデータから、個別の文字を認識し、
    認識された前記文字の認識結果に応じて、複数の前記文字それぞれについて、文字間のスペースを判別する際の基準位置を設定し、
    前記基準位置に基づき、前記複数の前記文字間のスペースの有無に関する情報を生成する、処理をコンピュータに実行させる認識プログラム。
  2. 前記スペースの有無に関する情報に基づき、前記文字間のスペースの有無を判別する、処理を前記コンピュータに実行させる請求項1記載の認識プログラム。
  3. 第一の文字と第二の文字との間のスペースの有無に関する情報と、
    前記第一の文字の前に有ると判別されたスペースの次の文字から、前記第一の文字までの文字列と、単語群が格納された辞書データベースとを照合した結果と、
    に基づき、前記第一の文字と前記第二の文字との間のスペースの有無を判別する処理を、前記コンピュータに実行させる請求項1又は2記載の認識プログラム。
  4. 前記複数の文字毎に、前記文字の認識による前記文字を囲う枠の幅を示す値を取得し、
    前記複数の文字のそれぞれを囲う前記枠の幅の平均値と、枠と枠との間の距離の平均値とを算出し、
    前記複数の文字のそれぞれの前記基準位置の間の距離が、前記枠の幅の平均値以上であり、且つ前記枠と枠との間の距離の平均値以上であるとき、
    前記文字間のスペースの有無に関する情報を生成する、処理を前記コンピュータに実行させる請求項1乃至3の何れか一項に記載の認識プログラム。
  5. 前記基準位置は、
    前記文字の重心軸の位置と、前記文字を囲う枠における文字と文字との境界の位置と、を含む請求項1乃至4の何れか一項に記載の認識プログラム。
  6. コンピュータによる認識方法であって、該コンピュータが、
    入力された手書きデータから、個別の文字を認識し、
    認識された前記文字の認識結果に応じて、複数の前記文字それぞれについて、文字間のスペースを判別する際の基準位置を設定し、
    前記基準位置に基づき、前記複数の前記文字間のスペースの有無に関する情報を生成する、認識方法。
  7. 入力された手書きデータから、個別の文字を認識する文字認識部と、
    認識された前記文字の認識結果に応じて、複数の前記文字それぞれについて、文字間のスペースを判別する際の基準位置を設定する基準位置設定部と、
    前記基準位置に基づき、前記複数の前記文字間のスペースの有無に関する情報を生成する位置情報生成部と、を有する認識装置。
JP2015074990A 2015-04-01 2015-04-01 認識プログラム、認識方法及び認識装置 Expired - Fee Related JP6492894B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015074990A JP6492894B2 (ja) 2015-04-01 2015-04-01 認識プログラム、認識方法及び認識装置
EP16161596.8A EP3076335B1 (en) 2015-04-01 2016-03-22 Recognition program, recognition method, and recognition apparatus
US15/083,736 US9934429B2 (en) 2015-04-01 2016-03-29 Storage medium, recognition method, and recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015074990A JP6492894B2 (ja) 2015-04-01 2015-04-01 認識プログラム、認識方法及び認識装置

Publications (2)

Publication Number Publication Date
JP2016194851A JP2016194851A (ja) 2016-11-17
JP6492894B2 true JP6492894B2 (ja) 2019-04-03

Family

ID=55745548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015074990A Expired - Fee Related JP6492894B2 (ja) 2015-04-01 2015-04-01 認識プログラム、認識方法及び認識装置

Country Status (3)

Country Link
US (1) US9934429B2 (ja)
EP (1) EP3076335B1 (ja)
JP (1) JP6492894B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6451316B2 (ja) * 2014-12-26 2019-01-16 富士通株式会社 文字認識プログラム、文字認識方法及び文字認識装置
US10410316B2 (en) * 2015-12-08 2019-09-10 Myscript System and method for beautifying digital ink
JP6717141B2 (ja) * 2016-09-20 2020-07-01 コニカミノルタ株式会社 文書閲覧装置及びプログラム
US10296788B1 (en) * 2016-12-19 2019-05-21 Matrox Electronic Systems Ltd. Method and system for processing candidate strings detected in an image to identify a match of a model string in the image
GB2572386B (en) * 2018-03-28 2021-05-19 Canon Europa Nv An image processing system and an image processing method
CN110969165B (zh) * 2019-11-28 2024-04-09 中国科学院半导体研究所 手写字符识别方法、装置、电子设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4635290A (en) * 1983-12-20 1987-01-06 Nec Corporation Sectioning apparatus and method for optical character reader systems
JPS6226587A (ja) * 1985-07-29 1987-02-04 Toshiba Corp 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式
JPS63158678A (ja) * 1986-12-23 1988-07-01 Sharp Corp 単語間スペ−ス検出方法
JPH01296394A (ja) * 1988-05-25 1989-11-29 Baazu Joho Kagaku Kenkyusho:Kk 文字認識方式
JPH06266899A (ja) 1993-03-11 1994-09-22 Hitachi Ltd 手書き入力システム
US6651221B1 (en) * 1993-05-20 2003-11-18 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings
US5600735A (en) 1994-05-10 1997-02-04 Motorola, Inc. Method of recognizing handwritten input
DE69523567T2 (de) * 1994-11-14 2002-06-27 Motorola, Inc. Verfahren zur handschrift-eingangsaufteilung
WO2011074067A1 (ja) * 2009-12-15 2011-06-23 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
TWI511030B (zh) * 2014-04-15 2015-12-01 Acer Inc 使用者介面顯示方法及其電子裝置
US10055659B2 (en) * 2015-05-04 2018-08-21 King Fahd University Of Petroleum And Minerals Systems and associated methods for arabic handwriting using synthetic extension concatenation and synthesis
US10643067B2 (en) * 2015-10-19 2020-05-05 Myscript System and method of handwriting recognition in diagrams

Also Published As

Publication number Publication date
EP3076335A1 (en) 2016-10-05
EP3076335B1 (en) 2019-09-25
JP2016194851A (ja) 2016-11-17
US9934429B2 (en) 2018-04-03
US20160292501A1 (en) 2016-10-06

Similar Documents

Publication Publication Date Title
JP6492894B2 (ja) 認識プログラム、認識方法及び認識装置
JP3176023B2 (ja) 手書き入力照合方法および装置
JP5071914B2 (ja) 認識グラフ
US7596272B2 (en) Handling of diacritic points
US5768417A (en) Method and system for velocity-based handwriting recognition
EP1564675B1 (en) Apparatus and method for searching for digital ink query
CN111488732B (zh) 一种变形关键词检测方法、系统及相关设备
Roy et al. Stroke-database design for online handwriting recognition in Bangla
Kumar et al. Recognition of multi-stroke based online handwritten Gurmukhi aksharas
CN111914825A (zh) 文字识别方法、装置及电子设备
Jayaraman et al. Modular approach to recognition of strokes in Telugu script
JP6081606B2 (ja) 電子機器および方法
Hakro et al. A Study of Sindhi Related and Arabic Script Adapted languages Recognition
EP1815395B1 (en) Method and device for recognition of handwritten patterns
Urala et al. Recognition of open vocabulary, online handwritten pages in Tamil script
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
JPH09319828A (ja) オンライン文字認識装置
KR101667910B1 (ko) 디지털 인공 필기 데이터를 생성하는 방법, 장치 및 컴퓨터 판독 가능 매체에 저장된 컴퓨터 프로그램
JP3817281B2 (ja) 情報処理装置及び方法
Mandal An Innovative Approach of Dehooking for Online Handwritten Bengali Characters and Words
JP7095450B2 (ja) 情報処理装置、文字認識方法、および文字認識プログラム
Govindaraju Emergency medicine, disease surveillance, and informatics
JP2018063597A (ja) 文字認識装置、文字認識方法、文字認識プログラム、および帳票
KR20220112368A (ko) 필기 데이터 문자 인식 방법 및 그 장치
Mandal et al. A Novel Approach of Normalization for Online Handwritten Characters using Geometrical Parameters on a 2D Plane

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190218

R150 Certificate of patent or registration of utility model

Ref document number: 6492894

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees