[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4697718B2 - 画像識別装置及び画像識別方法 - Google Patents

画像識別装置及び画像識別方法 Download PDF

Info

Publication number
JP4697718B2
JP4697718B2 JP2000274130A JP2000274130A JP4697718B2 JP 4697718 B2 JP4697718 B2 JP 4697718B2 JP 2000274130 A JP2000274130 A JP 2000274130A JP 2000274130 A JP2000274130 A JP 2000274130A JP 4697718 B2 JP4697718 B2 JP 4697718B2
Authority
JP
Japan
Prior art keywords
image
handwritten
image identification
stroke
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000274130A
Other languages
English (en)
Other versions
JP2001134766A (ja
Inventor
バートン、マーク
ソープ、ジョナサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Europe BV United Kingdom Branch
Original Assignee
Sony United Kingdom Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony United Kingdom Ltd filed Critical Sony United Kingdom Ltd
Publication of JP2001134766A publication Critical patent/JP2001134766A/ja
Application granted granted Critical
Publication of JP4697718B2 publication Critical patent/JP4697718B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像識別装置及び画像識別方法に関し、特に、手書き入力された画像を識別する画像識別装置及び画像識別方法に関する。
【0002】
【従来の技術】
画像を作成する手法は様々である。古くから、画像の作者又は画家は、例えば鉛筆やペン、その他の描画用具を用いて画像を描いてきた。また、コンピュータにより実行される描画アプリケーションを用いて、例えば、矩形、直線、円等のこのアプリケーションにおいて予め定義された要素を選択し、これらを位置決めし、サイズ及び形状を変更するなどして画像を作成する作者もいる。さらに、画像作成に要する時間を短縮するために、アプリケーションには、予め作成された画像が用意されていることがある。これら画像は、選択され、コピーされて所望のシーンの作成に使用される。予め作成された画像は、シーンの全体であっても一部であってもよく、所定の物品をデザインしたものであってもよく、劇、テレビ番組、映画等の1シーンを表すものであってもよい。
【0003】
文字認識の分野においては、例えばアルファベット文字を表す画像が認識され、認識されたアルファベットに対応するアルファベットデータが生成される。このような処理の一例は、インターネットウェブサイトhttp://www-cgi.cs.cmu.edu、カーネギーメロン大学(Carnegie Mellon University)、ロボティクス学会(Robotics Institute)、画像システムラボ(Imaging Systems Lab.)のアール・ロメオ(R.Romeo)、アール・バーガー(R.Berger)、アール・シバドー(R.Thibadeau)、ディー・トゥレツスキー(D.Touretsky)らによる「光学的漢字認識のためのニューラルネットワーク分類法(Neural Network Classifiers for Optical Chinese Character)」に開示されている。また、入力される画像は手書きの画像であってもよい。この場合、画像認識を補助するために、認識する画像を描画した際のペンの複数の異なるストロークに対応して画像をセグメント化するようになっている。この手法は、1996年4月1日にインターネットウェブサイトhttp://hwr.nici.kun.nl/recog/hwr-tutor/velocity.htmlにて発表された、ランバート・シューメイカー(Lambart Schomaker)が著作権を有する「手書きにおけるペン先の速度(Pen-tip velocity in Handwriting)」に開示されている。
【0004】
【発明が解決しようとする課題】
手書き入力された画像から、所望の画像を効率的に生成する装置の実現が望まれている。このような装置は、例えば、創造的なアイデアが手書きにより表現される、ピクチャ、デザイン、シーンのアイデア又は原案(initial thought)を作成する初期段階において必要とされる。
【0005】
そこで本発明は、所望の画像を効率的に作成することができる画像識別装置及び画像識別方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
上述の目的を達成するために、本発明に係る画像識別装置は、画像を表す手書き図形により生成される空間的サンプルのシーケンスから画像を識別する画像識別装置において、空間的サンプルに基づいて、手書き図形を描画するために実行されたストロークを表すストロークデータを判定するセグメント処理手段と、空間的サンプルのシーケンスと、判定されたストロークデータとに基づいて、パラメータデータを生成するストローク前処理手段と、ストローク前処理手段に接続され、パラメータデータに基づいて、画像を識別する画像識別手段とを備える。
【0007】
例えば描画手段を用いて、画像の手書き図形に対応する空間的サンプルを生成できることが知られている。しかしながら、空間的サンプルから画像を認識するための従来の画像識別装置には技術的問題が存在する。空間的サンプルが供給され、空間的サンプルに基づいて、手書き図形を描画するために実行されたストロークを表すストロークデータを判定するセグメント処理手段を設け、ストロークデータと空間的サンプルを組み合わせることにより生成されたデータのセットを用いて画像を識別することにより、空間的サンプルのみを用いる場合に比べてデータ量を低減することができる。すなわち、ストロークデータと空間的サンプルを組み合わせて生成されたより少ないデータセットにより、従来より容易に画像を識別できる。ストロークデータに含まれる、手書き図形を生成するために用いられたストロークの回数を示す情報により画像が示唆される。例えば、三角形は3回のストロークにより生成され、正方形は4回のストロークにより生成される。
【0008】
ストローク前処理手段は、パラメータデータを生成し、このパラメータデータが示すデータセットから画像を識別することができる。ストローク前処理手段は、判定されたストロークに空間的サンプルを組み合わせ、これにより生成されたデータセットにより画像識別手段は、より容易に対応する画像を識別することができる。
【0009】
手書き図形を生成し、この画像を表す手書き図形から空間サンプルを生成する手法としては様々な手法がある。空間サンプルは、所定の空間座標に関連する描画手段の位置のサンプルである。画像識別装置には、他の装置から空間的サンプルのシーケンスを供給するようにしてもよいが、本発明に係る画像識別装置は、好ましくは、手書き図形を作成するための描画手段を備え、空間的サンプルのシーケンスは、描画手段の移動により生成される。
【0010】
描画手段は、手書き画像から空間サンプルを生成するものであればいかなるものであってもよい。描画手段は、画像の手書き図形に対応する空間サンプルを生成するが、この空間サンプルに基づいて、画像の手書き図形を描画する際に実行されたストロークを正確に判定する要求が残されている。本発明に係る画像識別装置において、好ましくは、セグメント処理手段は、空間的サンプルから描画手段の相対的移動方向に基づく相対方向情報を生成し、相対方向情報から描画手段が移動方向を変化させた回数を判定し、描画手段が移動方向を変化させた回数に基づいて、手書き図形のストロークデータを判定する。描画手段の移動方向の変化の回数を容易に検出できるようにするために、セグメント処理手段は、例えば、相対方向情報から描画手段の移動方向の変化率を示す情報を生成し、描画手段が移動方向を変化させた回数を示す描画手段の移動方向の変化率におけるピークの数を判定する。手書き図形を描画する際に用いられたストロークの検出の確実性を高めるために、セグメント処理手段は、好ましくは、相対方向情報が通過されるフィルタを備え、描画手段の移動方向の変化の回数をフィルタリングされた相対方向情報に基づいて判定する。
【0011】
空間的サンプルは、所定の空間座標に関連付けられた描画手段の位置のサンプルであってもよい。また、空間サンプルにサンプルが生成された相対的時間を示す時間的参照データを添付してもよい。このような場合、好ましい実施の形態においては、セグメント処理手段は、複数個の空間的サンプルの時間的参照情報から空間的サンプルに対応する描画手段の描画時の相対移動速度を示す相対速度情報を生成し、相対速度情報から描画手段が速度を変化させた回数を判定し、速度の変化の回数に基づいて、手書き図形のストロークデータを判定する。画像の手書き図形を描画するために使用されたストロークの数の判定を改善するために、セグメント処理手段は、相対速度情報から描画手段の移動速度の変化率を示す情報を生成し、移動速度の変化率がゼロになった時点を識別して、描画手段が速度を変化させた回数は、最小速度に対応する、移動速度の変化率がゼロになった時点から判定される。手書き図形を描画する際に用いられたストロークの検出の確実性を高めるために、セグメント処理手段は、好ましくは、相対速度情報が通過される相対速度情報が通過されるフィルタを備え、描画手段が移動速度を変化させた回数は、フィルタによりフィルタリングされた相対速度情報に基づいて判定される。
【0012】
さらに、手書き図形を描画する際に用いたストロークを正しく検出する可能性を高めるために、相対方向情報と相対速度情報とを組み合わせて手書き図形のストロークデータを判定するとよい。すなわち、移動方向の変化と速度の低下を相関させることにより手書き図形を描画する際に用いられたストロークをより正確に検出することができる。
【0013】
手書き図形から画像を識別する処理をさらに向上させるために、ストローク前処理手段に識別された手書き図形のストロークと空間サンプルとを組み合わせて処理させることにより、ストローク前処理手段を設けない場合に画像を定義するために必要なデータ量に比べて、手書き図形を定義するデータセットのデータ量を実質的に低減できる。本発明の好適な実施の形態において、ストローク前処理手段は、各ストロークの開始点及び終了点を判定し、ストロークの開始点及び終了点から手書き図形の外側の境界を定義し、外側の境界から、空間的サンプルをそれぞれ比例させて所定の参照単位に適応化することにより手書き図形を正規化し、正規化された手書き図形からパラメータデータを生成する。所定の参照単位に対して手書き図形を正規化することにより、ユーザが描画した図形の大きさから独立して画像を認識することができる。これにより、画像識別装置は、任意の画像に対する異なる図形からその画像を同様に認識することができる。これは、特に、異なるユーザが同一の図形を異なる大きさで描画するような状況で有効であり、さらに、ユーザが特定の単位となる範囲内で図形を描画するように制約されていない状況において有効である。
【0014】
好適な実施の形態において、パラメータデータは、ストロークの回数、手書き図形の重心、手書き図形の平均ベクトル、手書き図形の正規化されたベクトル、手書き図形の長さ、手書き図形のバランスのうちの少なくとも1つを含む。
【0015】
さらに、好適な実施の形態において、画像識別手段は、複数の画像を保存する画像保存装置にアクセスし、パラメータデータに基づいて、複数の画像のうちどの画像が手書き図形に対応するかを判定する。画像識別手段により画像を示す参照識別データを提供してもよいが、画像識別装置に画像保存装置を設け、画像保存装置に複数の画像を保存し、これら保存された画像から手書き図形に対応する画像を識別するような構成とすることによりさらなる利益が得られる。
【0016】
本発明の好適な実施の形態において、画像識別手段は、予め保存された複数の画像に対応するパラメータデータによりトレーニングされ、予め保存された複数の画像のどれがパラメータデータに対応するかを示す参照識別データを生成するニューラルネットワークである。このニューラルネットワークは、例えば、複数層のパーセプトロンからなり、入力層の入力端子の数はパラメータデータの項数に対応し、パラメータデータの各項は、それぞれ対応する入力端子に供給される。
【0017】
選択された画像をユーザに示すために、画像識別手段は、識別された画像を表すデータを表示装置に供給し、画像を表示させてもよい。
【0018】
本発明に係る画像識別装置は、様々な分野に適用することができる。以下に説明する実施の形態では、本発明をストーリーボード作成装置の一部に適用した具体例を説明する。予め記憶された画像を用いることにより、オーディオビジュアル作品のストーリーボードを効率的に作成することができる。
【0019】
また、本発明に係る画像識別方法は、画像を表す手書き図形により生成される空間的サンプルのシーケンスから画像を識別する画像識別方法において、空間的サンプルから、手書き図形を描画するために実行されたストロークを分解するステップと、空間的サンプルのシーケンスを、分解されたストロークデータに関連付けてパラメータデータを生成するステップと、パラメータデータに基づいて、画像を識別するステップとを有する。
【0020】
【発明の実施の形態】
以下、本発明に係る画像識別装置及び画像識別方法について図面を参照して詳細に説明する。
【0021】
手書き図形の識別処理は、画像認識や手書き文字認識等のいくつかの分野で必要とされる処理である。例えば、手書き図形から画像を生成することにより、普遍的な意思伝達が実現され、すなわち、ある者が、ある国の言語を知らない場合でも、その者が所望の物の画像を描くことにより、この画像からその言語においてその物を示す単語を検索することができる。この他の応用例としては、手書きされた文字を認識する手書き文字認識がある。同様に、手書き図形を予め記憶されているより複雑な画像と対応させて画像を生成することにより、絵画又はイラストレーションにおける複雑なシーンを効率的に描画することができる。本発明の理解を容易にする適用例として、ストーリーボード(俗に、絵コンテとも呼ばれる。)作成装置(story board generation station)がある。このストーリーボード作成装置により、ユーザは映画、コマーシャルフィルム、ドキュメンタリー等のストーリーボードを作成することができる。本発明を適用したストーリーボード作成装置によれば、特別な才能及び技能を有さない者であっても、その才能や技能に関わらず、正確で複雑な視覚的描写を含むストーリーボードを作成することができる。本発明を適用したストーリーボード作成装置の具体的構成例を図1に示す。
【0022】
本発明を適用したストーリーボード作成装置は、図1に示すように、データ処理装置(data processor)1と、表示装置2と、データ保存装置4と、ペン5及びタブレットからなる描画装置6とを備える。表示装置2は、接続チャンネル10を介して、データ処理装置1内の表示装置(visual display unit:以下、VDUという。)駆動プロセッサ8に接続されている。描画装置6は、接続チャンネル14を介してデータ処理装置1内のインターフェイスプロセッサ12に接続されている。インターフェイスプロセッサ12には、キーボード7及びコンピュータマウス92も接続されている。データ保存装置4は、接続チャンネル16を介して、データ処理装置1内のデータ保存アクセスプロセッサ18に接続されている。VDU駆動プロセッサ8、インターフェイスプロセッサ12及びデータ保存アクセスプロセッサ18は、データ処理装置1内の制御プロセッサ20に接続されている。制御プロセッサ20は、データ保存装置4、表示装置2を制御し、描画装置6から入力される情報を処理することにより、このストーリーボード作成装置内における処理を制御する。図1に示すストーリーボード作成装置の動作の詳細については、制御プロセッサ20を詳細に示す図2を用いて、以下に説明する。
【0023】
制御プロセッサ20は、図2に示すように、セグメント処理回路(segment processor)22と、ストローク前処理回路(stroke pre-processor)24と、画像識別回路(image identifier)26と、インターフェイス回路(interface controller)28とを備える。この具体例では、ストーリーボード作成装置のユーザは、図1に示すように、描画装置6のペン5を用いて正方形21を描画している。このユーザの描画に基づいて、空間的サンプル(spatial sample)が生成され、この空間的サンプルに時間的参照データ(temporal reference)が添付される。空間的サンプルは、描画装置6のタブレット上に形成されるxy平面における、ペンの座標位置の離散的サンプルである。セグメント処理回路22には、入力チャンネル30を介して、描画装置6から時間的参照データが添付された空間的サンプルが入力される。後に詳細に説明するように、セグメント処理回路22は、時間的参照データが添付された空間的サンプルを処理して、ユーザが手書きにより描画した際の複数のペン先の動き(stroke:以下、ストロークという。)を表すサンプルデータを生成する。このようなサンプルデータを本明細書ではストロークデータと呼ぶ。これらのストロークデータは、接続線34を介してストローク前処理回路24に供給される。また、接続チャンネル31を介してセグメント処理回路22に供給された、手書き図形を表すデータ、すなわち時間的参照データが添付された空間的サンプルも、接続線32を介して、ストローク前処理回路24に供給される。ストローク前処理回路24は、ストロークデータと、時間的参照データが添付された空間的サンプルとを組み合わせて、ユーザが手書き図形を描画した際に用いたストロークを表し、記述する所定のパラメータ(以下、ストロークパラメータという。)の組を生成する。図2に示す具体例では、12個のストロークパラメータが生成されるが、ここで生成されるストロークパラメータの数はいくつでもよい。12個のストロークパラメータを示すデータは、ストロークパラメータデータと呼ばれ、これらのストロークパラメータデータは、12本のそれぞれ独立した平行接続線36のうちのいずれかを介して、画像識別回路26に供給される。
【0024】
画像識別回路26には、このストーリーボード作成装置のユーザが描画装置6を使用して描画した手書き図形に関するストロークパラメータデータが複数の平行接続線36を介して供給される。画像識別回路26は、これらのストロークパラメータデータを処理し、例えば、ストロークパラメータに最も類似する複数の画像を示す一連のデジットである参照指示データ(reference indication)を生成する。画像識別回路26は、この参照指示データを接続線38を介してインターフェイス回路28に供給する。インターフェイス回路28は、第1の双方向接続チャンネル40を介して、データ保存アクセスプロセッサ18に接続されており、また第2の接続チャンネル42を介して、VDU駆動プロセッサ8に接続されている。データ保存アクセスプロセッサ18は、データ保存装置4にアクセスし、このデータ保存装置4に格納されている複数の画像から、1つの画像を検索する。データ保存アクセスプロセッサ18によって選択される画像は、画像識別回路26により生成された参照指示データに対応する予め格納されている画像データである。ここで選択された画像データは、接続チャンネル40を介してインターフェイス回路28に供給される。インターフェイス回路28は、この画像データを接続チャンネル42を介してVDU駆動プロセッサ8に供給する。VDU駆動プロセッサ8は、この画像データを表示装置2を駆動するための信号に変換する。変換された信号は、接続チャンネル10を介して表示装置2に供給され、表示装置2は、データ保存装置4から選択された画像をこのストーリーボード作成装置のユーザに対して表示する。
【0025】
制御プロセッサ20の機能及び動作については、後述するセグメント処理回路22、ストローク前処理回路24、画像識別回路26のそれぞれに関する詳細な説明によりさらに明らかとなる。上述したように、描画装置6は、手書き図形を描画するためのペン5の移動及び位置に基づいて、時間的に参照された空間的サンプルを生成する。これら時間的に参照された空間的サンプルは、いかなる手法で作成してもよく、例えばコンピュータマウス9、キーボード7、あるいは作者が所望の画像を描画し、その画像から空間的サンプルが生成できる装置であればいかなる装置を用いてもよい。本発明の具体例においては、ペン5及びタブレットからなる描画装置6を用い、描画装置6は、ペン5の動きにより時間的に参照された空間的サンプルを生成する。このような描画装置6としては、例えば、ワコム社(Wacom)により製造されている描画装置を用いることができる。このような製品の詳細な情報については、インターネットウェブサイトwww.wacom.comから入手できる。
【0026】
図1に示す描画装置6を用いて、ユーザはストーリーボードのシーンを作成するために必要な画像を手書きで入力する。このような画像の例を図3に示す。図3に示す手書き図形は、男性50、女性52、ネコ54、ネズミ56、車58、家60、テーブル62、いす64である。ストーリーボードの作成において有用なこれら手書き図形のうちのいくつかは一筆書き(single stroke)可能なものである。しかしながら、多くの手書き図形は、その画像を作成するために複数回ペンを移動させる必要があり、すなわち、「マルチストローク(multi-stroke)」が必要である。このような手書き図形、又は手書き図形の一部を以下の説明ではジェスチャと呼ぶ。
【0027】
制御プロセッサ20の動作の一例を、図1に示す正方形21を例に説明する。手書き図形から特定の画像を識別するために、制御プロセッサ20は、ユーザが図形を描画するために行ったペンストロークの組を識別する。ペンストロークの識別は、周知のストローク捕捉(stroke capture)処理及びストロークデータが生成された手書き図形をセグメント化する処理により実現できる。空間的サンプルは、ストロークデータに基づいて前処理され、手書き図形を分析することによりパラメータデータが生成される。続いて、手書き図形は、このパラメータデータに基づいて識別される。これら3つの処理は、それぞれセグメント処理回路22、ストローク前処理回路24、画像識別回路26によって個々に実行される。
【0028】
図4は、手書きされた正方形21をストロークマーカ66とともに示す図である。これらのストロークマーカ66は、ストローク捕捉処理及びセグメント化の処理ステップにおいて、セグメント処理回路22により生成される。詳しくは、セグメント処理回路22は、時間的に参照された空間的サンプルを分析してペン5のストロークの開始点及び終了点を識別することによりストロークマーカ66を生成する。ストローク捕捉処理及びセグメント化処理を実行するために、本発明の具体例におけるセグメント処理回路22は、2つの分析処理のうちの1つ又は両方を使用する。セグメント処理回路22の詳細な構成は図5に示されている。
【0029】
セグメント処理回路22は、図5に示すように、キャッシュメモリ100を備え、キャッシュメモリ100には、描画装置6において生成された空間的サンプルがインターフェイスプロセッサ12から接続チャンネル30を介して供給される。キャッシュメモリ100の第1の出力用接続線102には、方向処理回路106が接続されており、第2の出力用接続線104には、速度処理回路108が接続されている。方向処理回路106の出力端子は第1の低域通過フィルタ110に接続され、速度処理回路108出力端子は、第2の低域通過フィルタ112に接続されている。第1の低域通過フィルタ110の出力端子は、第1のセグメント推定回路(segment estimator)114に接続されており、第2の低域通過フィルタ112の出力端子は、第2のセグメント推定回路116に接続されている。第1のセグメント推定回路114の出力端子及び第2のセグメント推定回路116の出力端子は、セグメント化回路(segmenter)118に接続されており、このセグメント化回路118は、手書き図形の描画に用いられたストロークを識別するために用いられるストロークデータを接続線34から出力する。また、セグメント処理回路22は、キャッシュメモリ100とセグメント化回路118に接続された制御回路120を備えており、制御回路120は、このセグメント処理回路22の動作を制御する。
【0030】
セグメント処理回路22は、手書き図形の描画時に用いられたストロークを識別し、そのストロークの開始点及び終了点を含み、そのストロークを識別するためのストロークデータを生成する。セグメント処理回路22は、手書き図形におけるストロークを識別するために、ペン5の相対的方向を分析する処理及びペン5の相対的速度を分析する処理を行う。制御回路120は、トリガ信号が入力されると、キャッシュメモリ100に格納された空間的サンプルの読出処理を開始する。制御回路120にトリガ信号を供給する手法としては、様々な手法が考えられる。例えば、描画装置6により、ペン5が描画装置6から離れたことを示す信号を生成させてもよい。この信号は、インターフェイスプロセッサ12により検出され、トリガ信号として制御チャンネル31に出力される。この他の手法としては、ユーザが所定のキーをキーボード7から入力するか、コンピュータマウス9からコマンド信号を生成させてもよい。これらの入力信号又はコマンド信号もインターフェイスプロセッサ12により検出され、トリガ信号として制御チャンネル31に出力される。さらにこの他の手法として、セグメント処理回路22内の制御回路120によりトリガ信号を発生させてもよい。この場合、例えば、キャッシュメモリ100において、直前の空間的サンプルが供給されてから所定の時間が経過した後にトリガ信号を発生するようにできる。この時間の経過を計測するために、セグメント処理回路22は、制御回路120に接続されたクロック121を備え、制御回路120は、このクロック121を参照して、上述した所定の時間の経過を計測する。
【0031】
セグメント処理回路22にトリガ信号入力されると、又はトリガ信号が発生されると、制御回路120は、キャッシュメモリ100から方向処理回路106及び速度処理回路108に空間的サンプルを供給させる。方向処理回路106は、空間的サンプルを分析して、手書き図形作成時のストロークを識別する。この分析により、時間に関連してペン5が相対的に移動した方向を示す移動路(plot)を表すデータが生成される。この例として、手書きの正方形21の分析結果を図6に示す。図6は、正方形21を描画した際の、ペン5の移動方向を時間軸に沿って示すグラフである。図6において、分析結果は破線で示されている。
【0032】
ユーザは、1つのジェスチャを一回のペン動作で(一筆書きで)描画することもでき、複数回の動作で描画することもできる。例えば、ユーザは、4回のストロークで正方形21を描画することができる。正方形21は、4つの直線からなり、4つの直線を4回の独立したペン動作で描画してもよく、又は連続したペン動作で描画してもよい。ストロークキャプチャ処理及びセグメント化処理は、特定の数のストロークからなる特定のジェスチャを描画するために必要な動作の回数に関わらず一様に行われる。ストロークキャプチャ処理及びセグメント化処理は、相対的なペンの移動方向の分析に基づいて実行してもよく、ペンの速度分析に基づいて実行してもよく、図2に示す具体例のように、相対的な移動方向と速度の両方を分析して実行してもよい。
【0033】
キャッシュメモリ100に格納された、手書き図形に基づく空間的サンプルが読み出され、例えば正方形21におけるコーナのような、コーナ部において、ペンの移動方向が変更されたことが推定される。ジェスチャから入手可能なデータの量に応じて、現在の画素の前後n個の画素を用いて、ペンの移動が算出される。前後n個の画素を用いて、ペンの移動を算出することにより、ジェスチャの中に存在する雑音の影響を低減することができる。図6では、雑音が低減されたデータを破線70で示している。この相対的移動方向を表すデータ(以下、相対方向データ(relative direction data)と呼ぶ。)は、第1の低域通過フィルタ110を通過し、これにより雑音成分が除去される。図6では、フィルタリングされた相対方向データを実線72で示している。フィルタリングされた相対方向データは、第1のセグメント推定回路114に供給され、第1のセグメント推定回路114は、ペン5の相対的移動方向の変化率(rate-of-change)を判定する。図6では、ここで判定された変化率を一点鎖線74で示している。ペン5の移動方向は、コーナ部において急激に変化するため、変化率は、コーナ部に相当する位置でスパイク(spike)を示す。図6に示す例では、一点鎖線74は、3つのスパイク75を有している。第1のセグメント推定回路114は、これらスパイク75を検出する。正方形21の例では、3つのスパイク75は、4つのストロークにおける3回の方向の変化に対応するものである。
【0034】
一方、速度処理回路108は、ペン5の速度の相対的変化から、ストロークの回数と、開始点及び終了点に関する推定値(estimation)を生成する。すなわち、速度処理回路108は、キャッシュメモリ100から供給された空間的サンプルを分析し、ペン5の相対速度を表すデータを生成する。図7は、この相対速度を表すデータの一例を示すものであり、この図7においては、正方形21を描画するためにペン5が移動した際のペン5の速度の変化を破線76で表している。手書き図形を描画するためのストロークを検出するために、例えば正方形21のようなジェスチャをユーザが描画する際、ペンの移動速度は、4つのコーナ部において急速に低下すると仮定され、これによりコーナ部、すなわちストロークの終了点を検出することができる。速度処理回路108により生成された、破線76で示す速度データは、第2の低域通過フィルタ112によりフィルタリングされ、これにより雑音成分が除去される。図7では、フィルタリングされた速度データを実線78で示している。フィルタリングされた速度データは、第2のセグメント推定回路116に供給され、第2のセグメント推定回路116は、速度の変化率(rate-of-change of speed)、すなわち加速度を示すデータを生成する。そして、このデータのゼロ交叉点(zero crossing point)を検出する。すなわち、位置の2階微分係数(second differential)を算出し、この2階微分係数のゼロ交差点が速度データの最小値又は最大値に対応するかを判定して、2階微分係数の正の範囲における速度データの最小値に対応するゼロ交差点を検出する。そして、ゼロ交叉点が最小値である場合、ストロークが検出される。図7では、変化率は一点鎖線80で示されており、ゼロ交叉点82は、正方形21のコーナ部でペン5の移動速度が減速した点に対応している。
【0035】
以上のようにして求められた、手書き図形を構成するストロークの推定値は、第1及び第2のセグメント推定回路114,116からセグメント化回路118に供給される。セグメント化回路118は、相対方向分析の結果と速度分析の結果とを比較し、組み合わせ、ジェスチャを独立した複数のストロークにセグメント化するための位置(location)のリストを生成する。続いて、セグメント化回路118は、セグメント化された複数のストロークからストロークデータを生成し、接続線34を介して、このストロークデータをストローク前処理回路24に供給する。ストローク前処理回路24には、キャッシュメモリ100から接続線32を介して、手書き図形に対応する空間的サンプルを表すデータも供給されている。
【0036】
図2に示すように、以上の処理により、ストローク前処理回路24には、時間的に参照された空間的サンプルとストロークデータが供給される。ストローク前処理回路24は、12個の所定のパラメータの各値を算出する。これらパラメータの値を算出するために、ストローク前処理回路24は、ジェスチャに基づいて生成された手書き図形を所定の境界(boundary)を用いて正規化する。所定の境界は、この具体例では単位正方形(unit square)である。ジェスチャは、単位正方形境界ボックス(unit square bounding box)の内部に収まるように、座標をスケーリングすることにより正規化される。この正規化の処理を図8に示す。図8では、破線86により単位正方形境界ボックスを示し、この単位正方形境界ボックス内に手書き図形である正方形21が納められる。
【0037】
ストローク前処理回路24は、この正規化したジェスチャを用いて、所定のパラメータの値を算出する。この具体例において使用するパラメータは、以下のとおりである。
(1)ストロークの回数(単一のパラメータ)
(2)xy座標で表されるジェスチャの重心(2つのパラメータ)
(3)xy座標で表されるジェスチャの平均ベクトル(2つのパラメータ)
(4)xy座標で表されるジェスチャの正規化ベクトル(2つのパラメータ)
(5)ジェスチャの長さ(単一のパラメータ)
(6)ジェスチャのバランス(4つのパラメータ)
【0038】
図9は、これパラメータを示す図である。ストロークの回数は、自明であり、実際には、セグメント処理回路22により判定される。ジェスチャの重心(center of gravity)は、各画素の座標の総和を求め、これを画素数で除算することにより算出される。図9(a)に示す具体例では、単位正方形境界ボックス86内の正方形21内のマーク88が正方形21の重心を示している。ジェスチャの平均ベクトル(mean vector)は、各ストロークの開始点から終了点までのベクトルを加算し、これをストロークの総数で除算することにより求められる。図9(b)に示す具体例では、マーク90は、正方形21を定義するジェスチャの平均ベクトルを示している。正規化ベクトルのパラメータは、平均ベクトルのパラメータに類似したものであるが、各ベクトルが重心を巡って時計回りの方向に判定されるように、各ベクトルを重心に対して正規化した後に、正規化ベクトルを算出する点が平均ベクトルと異なっている。図9(c)に示す具体例では、マーク92は、正規化ベクトルを示している。ジェスチャの長さは、正規化されたジェスチャにおける画素点間の距離をすべて加算することにより求められる。ジェスチャのバランスは、正規化されたジェスチャの境界を定義する単位正方形を4つの象限に分割して求められる。そして、各ストロークについて、開始点及び終了点がどの象限に存在するかを調べる。続いて、各象限内のストローク終了点の数を示すカウント値を求める。図10(a)は、破線94により4つの象限に分割された単位正方形境界ボックス86を示す。図10(b)は、分割された4つの象限に基づいて求められたジェスチャのバランスを示す表である。
【0039】
以上説明した12個のパラメータに対応する値は、図2に示すように、平行接続線36を介して画像識別回路26に供給され、画像識別回路26は、12個のパラメータの値に最も類似する参照指示データ(reference indication)に基づいて、参照指示データを生成する。図11は、画像識別回路26の内部構成を詳細に示す図である。この図11に示すように、画像識別回路26は、それぞれ一列に示された3層のニューロン(neurone)を備え、この3層のニューロンによりニューラルネットワーク(neural network)が形成されている。ニューラルネットワークは、当業者にとって周知の分野であるが、その詳細については、1988年、マサチューセッツ州ケンブリッジ、MITプレス社(MIT Press)により発行され、アンダーソン・アンド・ローゼンフェルド(Anderson and Rosenfeld)により再版された、D・E・ルメルハルト(D.E.Rumelhart)、J・L・マクレランド(J.L.McClelland)及びPDP開発グループ(PDP Reserch Group (Eds))による「並列分散処理:認知の微構造の探求、第1巻基礎編(Paralle Distributed Processing: Explorations in the Microstructure of Cognition, Volume 1: foundations)」に詳細に記述されている。
【0040】
この具体例におけるニューラルネットワークは、複層パーセプトロンネットワーク(multi layer perceptron network)であり、12個のストロークパラメータに対応する12個のニューロンを入力層130に有し、隠れ層(hidden layer)132に10個のニューロンを有している。12個のパラメータは、平行接続線36を介して、入力層130の12個のニューロンにそれぞれ入力される。これらのニューロンは、相互に接続されたニューラルネットワークを形成しており、出力層134は、手書き図形に対応する画像の参照指示データを生成する。この具体例では、3つのニューロンからなるニューラルネットワークの出力層134からの出力により、最大8個の異なる手書き図形を区別(classify)できる。なお、出力層134におけるニューロンの数を変更することにより、区別できる手書き図形の数を任意に変更することができる。ネットワークのトレーニングは、オフラインで行う。このトレーニングは、この具体例では、15人のユーザが各ジェスチャについて、それぞれ20個の例(example)を入力することにより、およそ15分で行われる。すなわち、このトレーニングにより、2400個の個別のジェスチャが入力される。この程度のトレーニングデータの量により、いかなるユーザに対しても、良好な認識率を得ることができる。ネットワークをトレーニングするにあたり、広範囲の多様なユーザに十分な量のトレーニングデータを入力させることが好ましい。なお、この具体例に示す画像識別回路26は、ストロークの方向については関知しない。例えば、水平な直線をジェスチャとして入力する場合、画像識別回路26は、その直線が右から左に描かれたか、左から右に描かれたかについては区別しない。このように方向を区別しない性質(directional invariance)は、同一のジェスチャが異なるストロークの順序で描画される場合に有効であるが、方向情報を含むジェスチャについては、その方向情報を除外することとなる。
【0041】
以上の説明により、図1に示すストーリーボード作成装置の動作が明らかになった。ストーリーボードを作成する際、ユーザは、所望の画像を表す図形を描画装置6を用いて描画する。データ処理装置1は、手書き図形を処理し、この手書き図形に最も類似する画像を表示装置2に表示する。ユーザは、キーボード7又はコンピュータマウス9を用いて適切なコマンドを入力することにより、データ処理装置1は、画像を保存し、この画像を表示部2に表示されているスクリーン上の所望の位置に移動させることができる。さらに、ユーザは、必要に応じて、描画装置6を用いて別の図形を手書き入力し、これにより対応する画像がデータ保存装置4から検索され、表示装置2のスクリーン上に表示される。ユーザは、この画像を所望の位置に移動し、保存する。このような作業によりストーリーボードが作成される。
【0042】
本発明の具体例において、ペン5が描画装置6のタブレットから離れたことを検出することにより、更なる利益が得られる。既に説明したように、ペン5がタブレットから離れた際に、トリガ信号を生成し、このトリガ信号により、手書き図形に対する画像識別回路26の処理を開始させる。すなわち、ペン5がタブレットから離れると、データ処理装置1は、その時点に描画されているジェスチャを直ちに処理し、このジェスチャに対応する画像をデータ保存装置4から検索し、表示装置2に表示する。表示装置2に画像が表示されると、ユーザは、キーボード7又はコンピュータマウス9を用いてこの画像が正しいものであることを確認(confirm)し、これによりインターフェイスプロセッサ12は、接続チャンネル31に制御信号を出力してキャッシュメモリ100に記憶されているデータを消去(clear)する。なお、ユーザが描画装置6のペン5を用いてさらに継続して図形を描画した場合、制御プロセッサ20は、既にキャッシュメモリ100に格納されている以前のジェスチャ又は手書き図形のジェスチャを表すデータに新たなジェスチャの空間的サンプルを追加する。トリガ信号が生成されると、セグメント処理回路22内の制御回路120は、再びストロークデータと空間的サンプルを生成し、これにより制御プロセッサ20は、手書き図形により表されている画像の更なる推定処理を実行する。このようにして、正しい画像が検索され、表示装置2に表示されると、ユーザは、直ちにこの画像を確認し、この時点で、手書き図形を完成することなく、対応する画像を使用することができる。したがって、このようなストーリーボード作成装置により、ストーリーボードを合理的且つ効率的に作成することができる。
【0043】
以上、本発明をストーリーボード作成装置の具体例に基づいて説明してきたが、本発明は、例えば汎用対話装置(universal communicator)等の他の分野にも適用できることは、当業者にとって明らかである。すなわち、相手の言語を知らないユーザが、相手に伝えたい物の手書き図形を入力することにより、その物を画像として相手に伝えることができる。これにより、買い物や手書き図形に対応する画像を用いた対話が実現できる。
【0044】
なお、実施の形態において、ハードウェアとして実現されている画像識別装置の各部分は、ソフトウェアプログラム又は適切なプロセッサにより実行されるコンピュータプログラムとしても同等に実現できることは明らかである。同様に、コンピュータプログラムとして実現されている部分をハードウェアとして同等に実現することもできる。したがって、コンピュータに読み込まれて画像識別装置として機能するコンピュータプログラムも本発明の範囲内にある。同様に、上述した画像識別の手法を実現する命令を表すコンピュータプログラムも本発明の範囲内にある。
【0045】
【発明の効果】
以上のように、本発明に係る画像識別装置は、空間的サンプルに基づいて、手書き図形を描画するために実行されたストロークを表すストロークデータを判定するセグメント処理手段と、空間的サンプルのシーケンスと、判定されたストロークデータとに基づいて、パラメータデータを生成するストローク前処理手段と、ストローク前処理手段に接続され、パラメータデータに基づいて、画像を識別する画像識別手段とを備える。ストロークデータと空間的サンプルを組み合わせることにより生成されたデータのセットを用いて画像を識別することにより、空間的サンプルのみを用いる場合に比べてデータ量を低減することができる。これにより、従来より少ないデータ量で効率的な画像の識別処理を実現することができる。
【0046】
また、本発明に係る画像識別方法は、空間的サンプルから、手書き図形を描画するために実行されたストロークを分解するステップと、空間的サンプルのシーケンスを、分解されたストロークデータに関連付けてパラメータデータを生成するステップと、パラメータデータに基づいて、画像を識別するステップとを有する。ストロークデータと空間的サンプルを組み合わせることにより生成されたデータのセットを用いて画像を識別することにより、空間的サンプルのみを用いる場合に比べてデータ量を低減することができる。これにより、従来より少ないデータ量で効率的な画像の識別処理を実現することができる。
【図面の簡単な説明】
【図1】本発明を適用したストーリーボード作成装置の構成を示すブロック図である。
【図2】図1に示すストーリーボード作成装置の制御部の内部構成を示すブロック図である。
【図3】手書き図形の8つの例を示す図である。
【図4】手書きされた正方形を示す図である。
【図5】図2に示すセグメント処理回路の内部構成を示す図である。
【図6】時間に対するペンの移動方向の変化を表すグラフを示す図である。
【図7】時間に対するペンの移動速度の変化を表すグラフを示す図である。
【図8】手書きされた正方形を単位正方形内で示す図である。
【図9】手書きされた正方形のストロークパラメータを示す図であり、(a)は重心を示し、(b)は平均ベクトルを示し、(c)は正規化されたベクトルを示す。
【図10】(a)は手書きされた正方形のバランスを示す図であり、(b)は正方形のバランスを表すために、各象限における各ストロークの開始点及び終了点の数を示す図である。
【図11】画像識別回路の内部構成を示す図である。
【符号の説明】
20 制御プロセッサ、22 セグメント処理回路、24 ストローク前処理回路、26 画像識別回路、28 インターフェイス回路

Claims (26)

  1. 画像を表す手書き図形により生成される空間的サンプルのシーケンスから該画像を識別する画像識別装置であって、
    上記手書き図形を描画するための描画ツールを有し、上記描画ツールの移動により、上記画像を表す手書き図形の描画に応じて時間的に参照された空間的サンプルを生成する描画手段と、
    上記描画手段に接続され、上記時間的に参照された空間的サンプルに基づいて、上記手書き図形を描画するために実行された複数のストロークを表すストロークデータを判定するセグメント処理手段と、
    上記空間的サンプルのシーケンスと、上記判定されたストロークデータとに基づいて、上記描画された手書き図形を表すパラメータに相当するパラメータデータを生成するストローク前処理手段と、
    上記ストローク前処理手段に接続され、上記パラメータデータに基づいて、上記画像を識別する画像識別手段とを備え、
    上記セグメント処理手段は、
    上記空間的サンプルから上記描画ツールの相対的移動方向に基づく相対方向情報を生成し、上記相対方向情報から上記描画ツールが移動方向を変化させた回数を判定し、上記描画ツールが移動方向を変化させた回数に基づいて、上記手書き図形のストロークデータを判定するとともに、
    複数個の空間的サンプルに添付された時間的参照情報から、該空間的サンプルに対応する上記描画ツールの描画時の相対移動速度を示す相対速度情報を生成し、上記相対速度情報から上記描画ツールが速度を変化させた回数を判定し、上記速度の変化の回数に基づいて、上記手書き図形のストロークデータを判定する
    画像識別装置。
  2. 上記セグメント処理手段は、
    上記相対方向情報から上記描画ツールの移動方向の変化率を示す情報を生成し、
    上記描画ツールが移動方向を変化させた回数を示す上記描画ツールの移動方向の変化率におけるピークの数を判定することを特徴とする請求項1記載の画像識別装置。
  3. 上記セグメント処理手段は、上記相対方向情報が通過されるフィルタを備え、
    上記描画ツールの移動方向の変化の回数は、上記フィルタによりフィルタリングされた相対方向情報に基づいて判定されることを特徴とする請求項1又は2記載の画像識別装置。
  4. 上記セグメント処理手段は、
    上記相対速度情報から上記描画ツールの移動速度の変化率を示す情報を生成し、
    上記移動速度の変化率がゼロになった時点を識別し、
    上記描画ツールが速度を変化させた回数は、最小速度に対応する、移動速度の変化率がゼロになった時点から判定されることを特徴とする請求項1記載の画像識別装置。
  5. 上記セグメント処理手段は、上記相対速度情報が通過されるフィルタを備え、
    上記描画ツールが移動速度を変化させた回数は、上記フィルタによりフィルタリングされた相対速度情報に基づいて判定されることを特徴とする請求項1又は4記載の画像識別装置。
  6. 上記セグメント処理手段は、上記相対方向情報と上記相対速度情報とを組み合わせて上記手書き図形のストロークデータを判定することを特徴とする請求項1乃至5いずれか1項記載の画像識別装置。
  7. 上記ストローク前処理手段は、
    各ストロークの開始点及び終了点を判定し、
    上記ストロークの開始点及び終了点から上記手書き図形の外側の境界を定義し、
    上記外側の境界から、上記空間的サンプルをそれぞれ比例させて所定の参照単位に適応化することにより該手書き図形を正規化し、
    上記正規化された手書き図形からパラメータデータを生成することを特徴とする請求項1乃至6いずれか1項記載の画像識別装置。
  8. 上記パラメータデータは、上記ストロークの回数、上記手書き図形の重心、上記手書き図形の平均ベクトル、上記手書き図形の正規化されたベクトル、上記手書き図形の長さ、上記手書き図形のバランスのうちの少なくとも1つを含むことを特徴とする請求項7記載の画像識別装置。
  9. 上記画像識別手段は、複数の画像を保存する画像保存装置にアクセスし、上記パラメータデータに基づいて、該複数の画像のうちどの画像が上記手書き図形に対応するかを判定することを特徴とする請求項1乃至8いずれか1項記載の画像識別装置。
  10. 上記画像識別手段は、上記予め保存された複数の画像に対応するパラメータデータによりトレーニングされ、該予め保存された複数の画像のどれがパラメータデータに対応するかを示す参照識別データを生成するニューラルネットワークであることを特徴とする請求項9記載の画像識別装置。
  11. 上記ニューラルネットワークは、複数層のパーセプトロンからなり、入力層の入力端子の数は上記パラメータデータの項数に対応し、該パラメータデータの各項は、それぞれ対応する入力端子に供給されることを特徴とする請求項10記載の画像識別装置。
  12. 上記画像識別手段は、上記識別された画像を表すデータを表示装置に供給し、該画像を表示させることを特徴とする請求項1乃至11いずれか1項記載の画像識別装置。
  13. 画像を表す手書き図形により生成される空間的サンプルのシーケンスから該画像を識別する画像識別方法であって、
    描画ツールによる上記画像を表す手書き図形の描画に応じて時間的に参照された空間的サンプルを生成するステップと、
    上記時間的に参照された空間的サンプルから、上記手書き図形を描画するために実行された複数のストロークを分解するステップと、
    上記空間的サンプルのシーケンスを、上記分解された複数のストロークに関連付けて、上記描画された手書き図形を表すパラメータに相当するパラメータデータを生成するステップと、
    上記パラメータデータに基づいて、上記画像を識別するステップとを有し、
    上記複数のストロークを分解するステップは、
    上記空間的サンプルから、上記手書き図形の描画に使用されるツールの相対的移動方向に基づく相対方向情報を生成し、上記相対方向情報から上記ツールが移動速度を変化させた回数を判定し、上記ツールが移動方向を変化させた回数に基づいて、上記手書き図形のストロークデータを判定するステップと、
    複数個の空間的サンプルに添付された時間的参照情報から該空間的サンプルに対応する上記ツールの描画時の相対移動速度を示す相対速度情報を生成し、上記相対速度情報から上記ツールが速度を変化させた回数を判定し、上記速度の変化の回数に基づいて、上記手書き図形のストロークデータを判定するステップとを有する
    画像識別方法。
  14. 上記相対方向情報から上記ツールが移動方向を変化させた回数を判定するステップは、
    上記相対方向情報から上記ツールの移動方向の変化率を示す情報を生成するステップと、
    上記ツールが移動方向を変化させた回数を示す上記ツールの移動方向の変化率におけるピークの数を判定するステップとを有することを特徴とする請求項13記載の画像識別方法。
  15. 上記複数のストロークを分解するステップは、上記相対方向情報をフィルタリングするステップを有することを特徴とする請求項13又は14記載の画像識別方法。
  16. 上記相対速度情報から上記ツールが速度を変化させた回数を判定するステップは、
    上記相対速度情報から上記ツールの移動速度の変化率を示す情報を生成するステップと、
    上記移動速度の変化率がゼロになった時点を識別するステップと、
    移動速度の変化率がゼロになった時点のどれが最小速度に対応するかを判定するステップとを有することを特徴とする請求項13記載の画像識別方法。
  17. 上記複数のストロークを分解するステップは、上記ツールが速度を変化させた回数を判定するステップの前に、上記相対速度情報をフィルタリングするステップを有することを特徴とする請求項13又は16記載の画像識別方法。
  18. 上記複数のストロークを分解するステップは、上記ツールの速度の変化と方向の変化を組み合わせるステップを有することを特徴とする請求項13乃至17いずれか1項記載の画像識別方法。
  19. 上記パラメータデータを生成するステップは、
    各ストロークの開始点及び終了点を判定するステップと、
    上記ストロークの開始点及び終了点から上記手書き図形の外側の境界を定義するステップと、
    上記外側の境界から、上記空間的サンプルをそれぞれ比例させて所定の参照単位に適応化することにより該手書き図形を正規化するステップと、
    上記正規化された手書き図形からパラメータデータを生成するステップとを有することを特徴とする請求項13乃至18いずれか1項記載の画像識別方法。
  20. 上記パラメータデータは、上記ストロークの回数、上記手書き図形の重心、上記手書き図形の平均ベクトル、上記手書き図形の正規化されたベクトル、上記手書き図形の長さ、上記手書き図形のバランスのうちの少なくとも1つを含むことを特徴とする請求項19記載の画像識別方法。
  21. 上記パラメータデータに基づいて、上記画像を識別するステップは、
    上記パラメータデータに基づいて参照指示データを生成するステップと、
    上記参照指示データに基づいて、複数の画像から1つの画像を選択するステップとを有することを特徴とする請求項13乃至20いずれか1項記載の画像識別方法。
  22. 上記パラメータデータに基づいて、上記画像を識別するステップは、上記予め保存された複数の画像に対応するパラメータデータによりトレーニングされ、該予め保存された複数の画像のどれがパラメータデータに対応するかを示す参照識別データを生成するニューラルネットワークに上記パラメータデータを適用するステップを有することを特徴とする請求項13乃至21いずれか1項記載の画像識別方法。
  23. 上記ニューラルネットワークは、複数層のパーセプトロンからなり、入力層の入力端子の数は上記パラメータデータの項数に対応し、該パラメータデータの各項は、それぞれ対応する入力端子に供給されることを特徴とする請求項22記載の画像識別方法。
  24. 上記識別された画像を表すデータを表示装置に供給し、該画像を表示させるステップを有することを特徴とする請求項13乃至23いずれか1項記載の画像識別方法。
  25. 上記予め記憶された画像は所定の作品に必要な画像であり、上記請求項13乃至24いずれか1項記載の画像識別方法を実行することにより上記所定の作品を表すストーリーボードを作成するストーリーボード作成方法。
  26. コンピュータに、請求項13乃至25いずれか1項記載の画像識別方法における各ステップを実行させるコンピュータプログラムを記録した記録媒体。
JP2000274130A 1999-09-09 2000-09-08 画像識別装置及び画像識別方法 Expired - Fee Related JP4697718B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9921329.0 1999-09-09
GB9921329A GB2354100B (en) 1999-09-09 1999-09-09 Image identification apparatus and method of identifying images

Publications (2)

Publication Number Publication Date
JP2001134766A JP2001134766A (ja) 2001-05-18
JP4697718B2 true JP4697718B2 (ja) 2011-06-08

Family

ID=10860642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000274130A Expired - Fee Related JP4697718B2 (ja) 1999-09-09 2000-09-08 画像識別装置及び画像識別方法

Country Status (3)

Country Link
US (1) US6744915B1 (ja)
JP (1) JP4697718B2 (ja)
GB (1) GB2354100B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7305011B2 (en) * 2001-06-14 2007-12-04 International Business Machines Corporation Periodic broadcast and location of evolving media content with application to seminar and stroke media
US20040037463A1 (en) * 2002-01-28 2004-02-26 Calhoun Christopher L. Recognizing multi-stroke symbols
US20050281467A1 (en) * 2003-01-24 2005-12-22 Stahovich Thomas F Recognizing multi-stroke symbols
US7324691B2 (en) * 2003-09-24 2008-01-29 Microsoft Corporation System and method for shape recognition of hand-drawn objects
JP2008516638A (ja) * 2004-05-14 2008-05-22 カーディマ・インコーポレイテッド 補強部材を備えた除去プローブ
KR100856894B1 (ko) 2007-01-23 2008-09-05 경희대학교 산학협력단 스트로크 기반 온라인서명 확인 시스템 및 그 동작 방법
US20090245646A1 (en) * 2008-03-28 2009-10-01 Microsoft Corporation Online Handwriting Expression Recognition
US20100104189A1 (en) * 2008-10-23 2010-04-29 Aravamudhan Bharath Handwriting Identification Method, Program And Electronic Device
US20100166314A1 (en) * 2008-12-30 2010-07-01 Microsoft Corporation Segment Sequence-Based Handwritten Expression Recognition
US10521700B2 (en) 2017-12-14 2019-12-31 Honda Motor Co., Ltd. Methods and systems for converting a line drawing to a rendered image
CN117824663B (zh) * 2024-03-05 2024-05-10 南京思伽智能科技有限公司 一种基于手绘场景图理解的机器人导航方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5191622A (en) * 1987-07-17 1993-03-02 Hitachi, Ltd. Hand-written character recognition apparatus with a personal dictionary preparation function
US5121441A (en) * 1990-09-21 1992-06-09 International Business Machines Corporation Robust prototype establishment in an on-line handwriting recognition system
JP2673871B2 (ja) * 1993-08-26 1997-11-05 日本アイ・ビー・エム株式会社 ニューラル・ネットワークによるパターン認識方法及び装置
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers
US5710916A (en) * 1994-05-24 1998-01-20 Panasonic Technologies, Inc. Method and apparatus for similarity matching of handwritten data objects
US5812698A (en) * 1995-05-12 1998-09-22 Synaptics, Inc. Handwriting recognition system and method
JPH11238131A (ja) * 1998-02-23 1999-08-31 Mitsubishi Electric Corp 筆跡照合装置

Also Published As

Publication number Publication date
GB9921329D0 (en) 1999-11-10
US6744915B1 (en) 2004-06-01
GB2354100A (en) 2001-03-14
JP2001134766A (ja) 2001-05-18
GB2354100B (en) 2003-12-24

Similar Documents

Publication Publication Date Title
US11783496B2 (en) Scalable real-time hand tracking
Oka et al. Real-time fingertip tracking and gesture recognition
Hasan et al. RETRACTED ARTICLE: Static hand gesture recognition using neural networks
US7308112B2 (en) Sign based human-machine interaction
US10242255B2 (en) Gesture recognition system using depth perceptive sensors
JPH10214346A6 (ja) ハンドジェスチャ認識システムおよび方法
Badi et al. Hand posture and gesture recognition technology
JP4697718B2 (ja) 画像識別装置及び画像識別方法
US6785418B1 (en) Image identification apparatus and method of identifying images
KR100862349B1 (ko) 제스처 인식 기능을 이용한 반투과 거울 기반 사용자인터페이스 시스템
Rahim et al. Hand gesture recognition-based non-touch character writing system on a virtual keyboard
CN114792443A (zh) 一种基于图像识别的智能设备手势识别控制方法
Al Ayubi et al. The prototype of hand gesture recognition for elderly people to control connected home devices
Nayakwadi et al. Natural hand gestures recognition system for intelligent hci: A survey
Ghotkar et al. Vision based real time hand gesture recognition techniques for human computer interaction
Lahiani et al. Real Time Static Hand Gesture Recognition System for Mobile Devices.
Obukhov et al. Organization of three-dimensional gesture control based on machine vision and learning technologies
Dias et al. OGRE-open gestures recognition engine
Maleki et al. Intelligent visual mouse system based on hand pose trajectory recognition in video sequences
Ramya et al. Real time palm and finger detection for gesture recognition using convolution neural network
KR102107182B1 (ko) 손 제스처 인식 시스템 및 방법
Grzejszczak et al. Tracking of dynamic gesture fingertips position in video sequence
Verma et al. 7 Machine vision for human–machine interaction using hand gesture recognition
Thakur Robust hand gesture recognition for human machine interaction system
Min et al. Gesture-based editing system for graphic primitives and alphanumeric characters

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070813

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080411

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100820

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110112

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110223

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees