JP2009520305A

JP2009520305A - 手書きキャラクタ認識のための異書体に基づく筆者適応

Info

Publication number: JP2009520305A
Application number: JP2008547437A
Authority: JP
Inventors: エー．アブドゥルカデルアハマッド; エイチ．シェラピラクマー; ワイ．シマードパトリス
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 2005-12-19
Filing date: 2006-12-18
Publication date: 2009-05-21
Anticipated expiration: 2026-12-18
Also published as: US7646913B2; JP5255450B2; EP1969487A4; EP1969487B1; KR20080086449A; EP1969487A1; US20070140561A1; WO2007075669A1; KR101411241B1; CN101331476A; CN101331476B

Abstract

特許請求の対象は、手書きキャラクタの分析および／または認識を円滑にするシステムおよび／または方法を提供する。インターフェースコンポーネントは、少なくとも１つの手書きキャラクタを受け取ることができる。パーソナライズ化コンポーネントは、筆跡スタイルに関連した異書体に基づく分類手段を、少なくとも１つの手書きキャラクタの手書き文字認識を実現するようにトレーニングすることができる。さらに、パーソナライズ化コンポーネントは、最適化された認識を実現するために、適切などの組合せ手段も利用することができる。

Description

本発明は、手書きキャラクタ認識のための異書体に基づく筆者適応に関する。

コンピュータのハードウェア、ソフトウェア、およびネットワーク化における技術的進歩が、原則的に世界中のどこからでも互いに通信することができる、効率的な、費用効果が高いコンピューティングシステム（例えば、デスクトップコンピュータ、ラップトップ、ハンドヘルド、セル電話、サーバなど）をもたらしている。このようなシステムは、より信頼性が高く、堅牢かつユーザフレンドリーなシステムに発展し続けている。その結果、ますます多くの業界および消費者が、コンピュータを購入し、情報を交換する伝統的な紙および言語媒体に代わる実行可能な電子的代替物として使用している。多くの業界および消費者が、効率を向上させ、コストを低下させるために、コンピューティング技術を活用している。例えば、消費者は、ドキュメントをスキャンして記憶し、テキストオーバーレイを有するデジタル画像のアルバムを作成し、特定の情報（例えば、様々なタイプのデータを有するウェブページ）を検索して取得し、デジタルカメラからピクチャをアップロードし、財務諸表を閲覧し、デジタルファクシミリを送信し、かつ／または受け取り、通信文（例えば、ｅメール、チャットルーム、ＶｏＩＰなど）をやり取りすることなどができる。

その結果、このようなコンピューティングシステムおよび／またはデバイスは、情報を入力する様々な技法および／または方法を組み込んでいる。コンピューティングシステムおよび／またはデバイスは、例えば、これらに限定されないが、キーボード、キーパッド、タッチパッド、タッチスクリーン、スピーカ、スタイラス（例えばワンド（wands））、ライティングパッドなどのデバイスを使用して情報の入力を円滑にする。しかし、ユーザの手書き（handwriting）を活用する入力デバイスは、各ユーザがデータエントリ技法（例えば、ライティング（writing））を同じように使用できないという、ユーザパーソナライゼーションの欠陥（user personalization deficiencies）を生じる。

ユーザの筆跡は、ユーザと同じく一意でよく、このような一意性は、識別目的のために利用される。様々なコンピューティングシステムおよび／またはデバイスに実装される商用の手書き文字認識システムは、複数の多様なユーザからのデータを含む大きなトレーニングデータセットの使用を通して、筆者の変動による影響力の削減を試みる。１５００人ものユーザからの筆跡サンプルが利用可能な場合でも、ユーザそれぞれを一意に識別するのに十分な変動が筆跡にはある。

機械の学習の観点からは、このような変動は、コンピュータにとって手書き文字認識を困難にする。ユーザ内キャラクタ（intra-user characters）（例えば、同じユーザからのキャラクタ）は変動が小さいが、ユーザ間キャラクタ（inter-user characters）（例えば、異なるユーザからのキャラクタ）は変動が大きく、認識エラーの要因となる。その結果、１組のユーザ（数百人ものユーザ）から取得されたトレーニングデータからの学習は、未知の筆跡スタイルに十分に一般化されるモデルを必ずしも生じるわけではない。一般的な（例えば、筆者非依存の）認識器（recognizer）を使用したコンピュータの認識経験は、希少な書き方をするユーザに関して特に乏しい場合がある。貧弱な性能に関する説明としては、トレーニングされた一般的な認識器が、未知のユーザの書き方（群）を認識することを学習していないので、不完全であるということが挙げられよう。

未知の書き方に対する認識器の性能を向上する実用的な手法は、筆者適応（writer adaptation）（またはパーソナライズ化）である。パーソナライズ化は、ユーザからの追加データサンプルから収集を行い、学習することによって、認識器が、ある特定のユーザの筆跡に適応することを可能にする。明らかに、ユーザから必要とされるトレーニング用サンプルの数と、達成されるエラーレートの削減と、ユーザに対する認識される不都合との間には、トレードオフが存在する。トレーニングデータの量が多くなると、パーソナライズ化認識器が改良されるが、サンプルの入力、および／またはこのようなサンプルを使用するトレーニングに基づくユーザにとっての不都合はより大きくなる。

以下では、本明細書に記述するいくつかの態様の基本的な理解を提供するために、本革新事項（イノベーション）の簡略な要約を提示する。この要約は、特許請求の対象の包括的な概要ではない。特許請求の対象の主要または重大な要素を明らかにすることも、対象となる革新事項の範囲を詳述することも意図していない。後で提示するより詳細な説明の前置きとして、特許請求の対象のいくつかの概念を簡略な形で提示することだけを目的としている。

対象となる革新事項は、異書体（allograph）（例えば、キャラクタの形状および／またはスタイル）トレーニング分類手段（classifier）を使用して、筆跡に関連づけられたキャラクタの認識を円滑にするシステムおよび／または方法に関する。パーソナライズ化コンポーネントは、インターフェースを介して、手書きキャラクタに関連したデータを受け取ることができ、パーソナライズ化コンポーネントは、異書体データでトレーニングされた分類手段を利用することによって、手書きキャラクタの最適化された認識を実現することができる。異書体データは、例えば、自動的に生成および／または手作業で生成された、筆跡スタイルに関連したデータでよい。パーソナライズ化コンポーネントは、筆者適応を実現することができ、筆者適応は、一般的な（例えば、筆者非依存の）手書き認識手段を、特定の任意のユーザに対する正確さが向上したパーソナライズ化（例えば、筆者依存の）認識手段にコンバートするプロセスでよい。

さらに、パーソナライズ化コンポーネントは、異書体データでトレーニングされた第１の分類手段および非異書体データでトレーニングされた第２の分類手段を利用することによって、最適化された手書き文字認識を実現し、第１の分類手段および第２の分類手段の出力は組み合わせることができる。出力の組合せは、例えば、線形組合せ手段（combiner）、組合せ手段分類手段、サポートベクターマシン、線形分類手段、一連の規則などによって実装することができる。出力の組合せは、筆跡の認識および／または分析の強化を実現する。さらに、出力の組合せの利用は、ユーザの筆跡サンプルを使用することによって、最適化することができる。

特許請求の対象の一態様によると、パーソナライズ化コンポーネントは、最適化された手書き文字認識を実現するように少なくとも１つの分類手段をトレーニングするための異書体データを生成する異書体コンポーネントをさらに使用することができる。異書体コンポーネントは、自動的に、手作業で、および／またはそのどの組合せでも、異書体データを生成することができる。例えば、クラスタリングは、手書きキャラクタから異書体（例えば、キャラクタの形状および／またはスタイル）および／または異書体データを自動的に識別するように実装することができる。別の例では、異書体データは、筆跡に関連づけられたタイプおよび／またはスタイルを提供するための筆跡エキスパートを使用して、手作業で提供することができる。さらに、異書体コンポーネントは、例えば、距離尺度として動的時間伸縮（ＤＴＷ：ｄｙｎａｍｉｃｔｉｍｅｗａｒｐｉｎｇ）を利用する階層集積クラスタリング手法を用いて、キャラクタの書き方（例えば、異書体および／または異書体データ）を識別することができる。

特許請求の対象の別の態様によると、パーソナライズ化コンポーネントは、対象となる革新事項による少なくとも１つの分類器を利用するための分類器コンポーネントをさらに使用することができる。分類器コンポーネントは、異書体データでトレーニングすることができる第１の分類器を利用することができる。例えば、第１の分類器は、ニューラルネットワークでよい。分類器コンポーネントは、非異書体データでトレーニングすることができる第２の分類器をさらに利用することができる。第１および第２の分類器両方を利用することによって、組合せコンポーネントを使用して異質の出力を組み合わせることができる。組合せコンポーネントは、例えば線形組合せ器、組合せ器分類器、線形分類器、サポートベクターマシンなど、様々な組合せ技術を使用することができる。特許請求の対象の他の態様では、特定のユーザに関連づけられた手書きキャラクタの分析を円滑にする方法が提供される。

以下の説明および添付の図面では、特許請求の対象の特定の例示的な態様を詳細に説明する。ただし、こうした態様は、本革新事項の原理を利用することができる様々な方法のごくわずかを示すにすぎず、特許請求の対象は、このような態様およびその等価物すべてを含むことを意図している。特許請求の対象の他の目的、利点および新規の特徴は、本革新事項の以下の詳細な説明を図面と併せ読むことにより、明らかになるであろう。

図面を参照して特許請求の対象を説明するが、同じ参照番号は、全体を通して同じ要素を指すのに使用している。以下の記述では、説明の目的で、具体的な多くの詳細を、対象となる革新事項の完全な理解をもたらすために述べる。ただし、こうした具体的な詳細なしでも特許請求の対象を実施できることが明らかであろう。他の例では、対象となる革新事項を説明しやすくするために、公知の構造およびデバイスをブロック図の形で示す。

本明細書において使用する「コンポーネント」、「システム」、「インターフェース」などの用語は、コンピュータ関連のエンティティ、すなわちハードウェア、（例えば実行中の）ソフトウェア、および／またはファームウェアのいずれかを指すことを意図している。例えば、コンポーネントは、プロセッサ上で実行中のプロセス、プロセッサ、オブジェクト、実行ファイル、プログラム、および／またはコンピュータでよい。例として、サーバ上で実行されているアプリケーションおよびそのサーバが両方とも、コンポーネントとなり得る。１つのプロセス中に１つまたは複数のコンポーネントが存在してよく、コンポーネントは、１台のコンピュータに常駐することも、かつ／または２台以上のコンピュータの間に分散することもできる。

さらに、特許請求の対象は、開示する対象を実装するようにコンピュータを制御するためのソフトウェア、ファームウェア、ハードウェア、またはそのどの組合せも製作するための標準プログラミングおよび／またはエンジニアリング技法を用いる方法、機器、または製造品として実装することができる。本明細書で使用する「製造品」という用語は、どのコンピュータ可読デバイス、搬送波、または媒体からもアクセス可能なコンピュータプログラムを包含することを意図している。例えば、コンピュータ可読媒体は、磁気記憶デバイス（例えば、ハードディスク、フロッピー（登録商標）ディスク、磁気帯など）、光ディスク（例えば、コンパクトディスク（ＣＤ）、デジタル多用途ディスク（ＤＶＤ）など）、スマートカード、およびフラッシュメモリデバイス（例えば、カード、スティック、キードライブなど）を含み得るが、それに限定されない。さらに、搬送波は、電子メールを送信し受信する際、またはインターネットやローカルエリアネットワーク（ＬＡＮ）などのネットワークにアクセスする際に使われるような、コンピュータ可読な電子データを搬送するのに利用することができることを理解されたい。当然ながら、特許請求の対象の範囲からも精神からも逸脱することなく、この構成に対して多くの変更を加え得ることが当業者には理解されよう。さらに、「例示的」という言葉は、本明細書において、一例、事例、または例示となることを意味するために使われる。「例示的」として本明細書に記載するどの態様も設計も、必ずしも他の態様または設計よりも好まれ、または有利であることを企図するわけではない。

ここで図面に移ると、図１は、異書体トレーニング分類器を使用して、筆跡に関連づけられたキャラクタの認識を円滑にする例示的なシステム１００を示す。システム１００は、異書体データで分類器（図示せず）をトレーニングすることができるパーソナライズ化コンポーネント１０２を含むことができ、このようなトレーニングは、手書きキャラクタの認識を円滑にする。異書体データは、例えば、筆跡のスタイルに関連した、自動的に生成され、かつ／または手作業で生成されたデータでよい。パーソナライズ化コンポーネント１０２は、インターフェースコンポーネント１０４（本明細書において「インターフェース１０４」と呼ばれる）を介して、筆跡サンプルに関連した手書きキャラクタおよび／またはデータを受け取り、分類器のトレーニングにおける異書体データの利用に少なくとも部分的に基づいて、最適化された手書き文字認識を実現することができる。例えば、受け取ったデータは、手書きされたどのキャラクタおよび／またはユーザからの入力でもよい。例えば、様々なコンピューティングデバイスおよび／またはシステムは、タブレット、携帯情報端末（ＰＤＡ）、移動通信デバイス、スタイラスペン、ワンド、タッチスクリーン能力などを有する対話型表示デバイスなどだが、それに限定されない手書き入力を使用する。

パーソナライズ化コンポーネント１０２は、筆者適応を実現することができ、筆者適応は、一般的な（例えば、筆者非依存の）手書き認識器を、特定の任意のユーザ向けに正確さを向上させたパーソナライズ化（例えば、筆者依存の）認識器にコンバートするプロセスになることができる。パーソナライズ化コンポーネント１０２は、ある特定のユーザからのいくつかのサンプルを用いて適応技法を実装することができ、一方で、従来技術では、数人の筆者および／またはユーザからの大量のデータを利用して、一般的な認識器をトレーニングする。

異書体データは、手作業で、自動的に、および／またはそのどの組合せでも生成することができる。例えば、異書体データは、適切などのクラスタリング技法（後で論じる）を利用しても、自動的に生成することができる。言い換えると、クラスタリングを通じた手書きキャラクタからの異書体（例えば、キャラクタの形状および／またはスタイル）を識別する自動的な手法を実装することができる。別の例では、異書体データは、筆跡に関連づけられたタイプおよび／またはスタイルを提供するための筆跡エキスパートを使用して手作業で提供することができる。

さらに、パーソナライズ化コンポーネント１０２は、異書体データで分類器をトレーニングし、このような結果を、非異書体に基づく分類器と共同で実施して、最適化された手書き文字認識を実現することができる。言い換えると、パーソナライズ化コンポーネント１０２は、既存の認識器（例えば、手書きキャラクタ認識器）とシームレスに統合し、ある個人からの新しいサンプルを利用して、それに等辺的（ｅｑｕｉｌａｔｅｒａｌｌｙ）に改良を加えることができる。例えば、単に文字を突き合わせるのではなく、パーソナライズ化コンポーネント１０２は、文字および／またはキャラクタを特定のスタイルおよび／または異書体と突き合わせることができる。したがって、パーソナライズ化コンポーネント１０２は、ユーザの所与の書き方サンプルおよび／または例を学習可能であり得るマッピング技法および／または機能を使用することができる。パーソナライズ化コンポーネント１０２は、従来のおよび／または伝統的な分類器からの出力を使用して、手書き文字認識を最適化するために、各文字および／またはキャラクタの確率を与えるのにマップ関数および／または技法を適用することができる。

さらに、システム１００は、適切な任意の、および／または必要なインターフェースコンポーネント１０４も含むことができ、このコンポーネントは、パーソナライズ化コンポーネント１０２をほぼどのオペレーティングおよび／またはデータベースシステム（群）にも統合するための様々なアダプタ、コネクタ、チャネル、通信経路などを提供する。さらに、インターフェースコンポーネント１０４は、パーソナライズ化コンポーネント１０２との対話、データ、手書きデータ、最適化された手書き文字認識に関連づけられたデータ、および最適化された手書き文字認識を提供する様々なアダプタ、コネクタ、チャネル、通信経路などを提供することができる。

図２は、手書きキャラクタ認識を利用するために異書体データの使用を円滑にする例示的なシステム２００を示す。システム２００は、異書体データを使用して分類器をトレーニングすることによって最適化された手書き文字認識を実現することができるパーソナライズ化コンポーネント２０２を含み得る。パーソナライズ化コンポーネント２０２は、インターフェース１０４を介して、手書きキャラクタおよび／または記号に関連したデータを受け取ることができ、パーソナライズ化コンポーネント２０２は、異書体でトレーニングされた分類器を利用することによって、キャラクタおよび／または記号を推測し、かつ／または認識することができる。さらに、パーソナライズ化コンポーネント２０２は、非異書体でトレーニングされた分類器に関連して、異書体でトレーニングされた分類器をさらに使用することができる。パーソナライズ化コンポーネント２０２は、図１に記載したパーソナライズ化コンポーネント１０２と実質的に同様でよいことを理解されたい。

パーソナライズ化コンポーネント２０２は、自動的に、手作業で、および／またはそのどの組合せでも異書体および／または異書体データを生成することができる異書体コンポーネント２０４を含み得る。クラスタリングを通じて手書きキャラクタから異書体（例えば、キャラクタの形状および／またはスタイル）を識別する自動的な手法を実装することができる。別の例では、異書体データは、筆跡に関連づけられたタイプおよび／またはスタイルを提供するための筆跡エキスパートを使用して手作業で提供することができる。

さらに、異書体コンポーネント２０４は、例えば、距離尺度として動的時間伸縮（ＤＴＷ：ＤｙｎａｍｉｃＴｉｍｅＷａｒｐｉｎｇ）を利用する階層集積クラスタリング手法を用いて、キャラクタの書き方（例えば、異書体）を識別することができる。異書体コンポーネント２０４は、対象となる革新事項（ｉｎｎｏｖａｔｉｏｎ）に従って利用される適切などの異書体データおよび／または書き方も識別し、かつ／または見つけることができる。欧米式、ラテン式に基づく手書きの領域において、書き方における大きな変動が存在する。しかし、ユーザが漠然と支持し得る「異書体」と呼ぶことができる手書きキャラクタのスタイルが存在し得る。欧米式手書きスタイルのカタログを構築することが、何度か試みられてきたが、今日に至るまでカタログは存在していない。このことは、例えば、フォントおよびスタイルの擬似標準分類法が存在し得るマシン印刷フォントとは逆であるかもしれない。それにも関わらず、特定の任意の国の学校システムにおいては、一握りの筆跡スタイルが教えられており、ある特定のスタイルが所定のどの学区においても採用されている。

文字の筆跡スタイルをデータから学習するのに、階層クラスタリング技法を用いることができる。主に２つの手法が存在する。すなわち、１）大雑把なサブスタイルを検出するトップダウン手法、および２）ボトムアップクラスタリング手法である。異書体コンポーネント２０４は、例えば、システム２００（例えば認識器）内で直接用いることができる、得られたスタイルの知識に少なくとも部分的に基づくボトムアップ手法を採用することができる。

手書き文字Ｘ＝｛ｘ¹，ｘ²，．．．，ｘ^M｝のクラスタリングＣは、

となるように、Ｋ個の互いに素のセットからなるセット｛ｃ¹，ｃ²，．．．，ｃ^K｝へのデータの分割を定義することができる。クラスタリングＣは、すべての文字および／または記号に対してそれぞれ独立に計算される。階層クラスタリングアルゴリズムは、Ｃ_m-1がＣ_mのサブセットとなるようなネストされたクラスタ［Ｃ₁，Ｃ₂，．．．，Ｃ_M］からなる階層を生じる。この階層は、Ｍ個のステップで構築することができ、ステップｍでのクラスタリングは、ステップｍ−１で生じたクラスタリングから生じることができる。ステップ１で、サンプルセットＸ中のすべてのメンバおよび／またはメンバの一部分は、それ自体のクラスタを表し得る。２つのクラスタの非類似度関数Ｄ（ｃ^k，ｃ^k'）を使って、異書体コンポーネント２０４によって以下のアルゴリズムを適用することができる。すなわち、ａ）Ｃ₁＝｛｛ｘ¹｝，｛ｘ²｝，．．．，｛ｘ^M｝｝のように初期化し、ここで各サンプルは、単独でクラスタとなる。ｂ）ｍ＝２，．．．，Ｍに関して、Ｃ_m-1の２つの最も類似したクラスタｃ^kminおよびｃ^k'minをマージすることによって、新規クラスタリングＣ_mを取得する。最も近いクラスタは、（ｋｍｉｎ，ｋ’ｍｉｎ）＝ａｒｇｍｉｎ_{(k,k'),k≠k'}Ｄ（ｃ^k，ｃ^k'）によって定義することができる。

クラスタ非類似度関数Ｄ（ｃ^k，ｃ^k’）は、インクサンプル非類似度関数Ｄ（ｘ^k，ｘ^k'）に従って定義することができる。各インクサンプルは、最初に、固定サイズの矩形内で等方的に正規化し、集中させることができる。インクサンプルｋ（例えば、画数Ｓを含む）、およびｋ’（例えば、画数Ｓ’を含む）に対して、

となり、上式で、ＰおよびＰ’は、サンプルｋ、ｋ’の対応する再サンプリングされた座標ベクトルであり、Ｎはサンプリング地点の数である。ベクトルＰ中の要素ｐは３つの座標（ｘ，ｙ，θ）を有し、ここでｘ、ｙは地点ｐの直交座標であり、θは同じ地点での傾斜の推定値である。

この定義を利用すると、異なる字画数を有するインクサンプルは、同じクラスタ中では一番最後までマージすることができない。その地点では、マージは実際にはストップしていることになる。

∞まで異なる数の字画をもつ２つのインクサンプルの間の距離を定義するのに、平均値や最小値ではなく、最大値を使用することは、小型クラスタに好都合であることを理解されたい。

視覚化の目的のため、クラスタの代表となるインクサンプルを選択することができる。すべてのクラスタに対して選ばれる代表は、クラスタの中間地点でよい。クラスタｃ^kに対する中間地点ｘ^-kは、残りのクラスタメンバインクサンプルに関して、最小の中央値距離をもつインクサンプルとして定義することができる。

図３を簡単に参照すると、図３は、キャラクタのクラスタリングに関連づけられた結果の可視化を円滑にする２分木３００のブロック図を示す。各文字および／または記号に対するクラスタリングに関連し得る、異書体コンポーネント２０４からの結果は、非類似度デンドログラム（ｔｅｎｄｏｇｒａｍ）と呼ばれる２分木３００によって可視化することができる。２分木３００は、文字「Ｋ」の、結果として生じたデンドログラムの例となり得る。２分木３００は、字画ならびに／あるいは字画のトーンに関連づけられた暗さおよび／または明るさが起こる順序を組み込むことができることを理解されたい。

異書体コンポーネント２０４はさらに、異書体に関連したクラスタを自動的に生成し、利用されるクラスタの数を判定することができる。例えば、すべての文字および／または記号に対するクラスタの数は、クラスタのそれ以上のマージがそれを超えては起こり得ない閾値Ｄ_maxを定義することによって判定することができる。言い換えると、マージがストップする時点でのアクティブなクラスタは、対応する文字のスタイルを表す。したがって、結果として生じるスタイルの数は、文字および／または記号の形状の多様性に応じて、ある文字とそれ以外の文字とでは異なり得る。

手短に図４に移ると、第１のテーブル４００および第２のテーブル４０２は、特許請求の対象に従って使用することができる様々な筆跡スタイルに関連づけられている。第１のテーブル４００は、大きな１組のインクサンプルに適用されるとき、異書体コンポーネント２０４によって使用される階層クラスタリングアルゴリズムの結果となり得る。第１のテーブル４００は、文字ｑ、ｔ、Ｘに対する、結果として生じたスタイルおよび米国（ＵＳ）の筆者における相対頻度を示す。第１のテーブル４００は例であり、対象となる革新事項はそのように限定されないことを理解されたい。言い換えると、パーソナライズ化コンポーネント２０２は、こうしたスタイルを、米国の学校で教えられるスタイルにマップすることができる。

さらに、公知の学校の筆跡スタイル標準は、どのように文字が書かれるかを考慮せずに、最終的な形での文字の見え方を記述することを理解されたい。しかし、字画順序および字画方向（軌跡）は、異書体コンポーネント２０４による、上述したクラスタリングフェーズにおいて考慮することができる価値のある情報を提供し得る。

第２のテーブル４０２は、文字ｑ、ｔ、Ｘに対するスタイルの例および英国（ＵＫ）の筆者におけるその相対頻度を示す。ＵＳおよびＵＫスタイル（例えば、それぞれ第１のテーブル４００および第２のテーブル４０２）を比較することによって、以下の主観的観察を行うことができる。すなわち、１）両方のセットにおける顕著なスタイルが、異なる頻度（例えば、文字ｑに対して示したＵＳおよびＵＫスタイルは、反例を示し得る。）ではあるが、文字のほとんどに対して同じであるように見える。２）一部の主流でない（fringe）（例えば、低頻度）スタイルが一方のセットには存在する場合があるが、他方には存在し得ない。３）主流でないスタイルが両方のセットに現れる場合でも、その頻度は大幅に異なり得ると思われる。

階層クラスタに適用されるときのＤＴＷ距離閾値の各選択は、図２の異書体コンポーネント２０４に、１組の互いに素のクラスタを生じさせることができる。距離閾値が大きいほど、得られるクラスタの数が少なくなる。例えば、１００個のキャラクタ（例えば、ユーロおよびポンド符号を含む印刷可能なアスキー文字）に対して２００２個の一意のクラスタを得るために、７９２という閾値を選ぶことができる。２００２個のクラスタおよび１００個のキャラクタがあると、１キャラクタにつき、キャラクタの様々な書式を表すおよそ２０個の異書体があり得る。

図２に戻ると、パーソナライズ化コンポーネント２０２は、異書体コンポーネント２０４から生成された異書体データを使用してトレーニングされる少なくとも１つの分類器を利用することができる分類器コンポーネント２０６を含み得る。さらに、分類器コンポーネント２０６は、異書体データでトレーニングすることができる第１のニューラルネットワーク分類器と、非異書体データでトレーニングすることができる第２のニューラルネットワーク分類器とを使用することができ、第１および第２のニューラルネットワーク分類器の両方の出力は、組合せコンポーネント２０８（後で論じる）を利用することによって組み合わせることができる。分類器コンポーネント２０６は、非異書体データ、異書体データ、および／またはそのどの組合せも使用する、分類器のトレーニングに関連した適切などのコンポーネントおよび／またはデータも含み得ることを理解されたい。

さらに、分類器コンポーネント２０６は、特徴ベクトルを、少なくとも１つの分類器に対する入力として利用することができる。各手書きキャラクタは、連続した字画を表す一連の（ｘ，ｙ，ｔ）セグメントとして見なすことができる。続けて書かれる１つまたは複数の字画は、キャラクタを構成し得る。例えば、各手書きキャラクタは、６５個の多項特徴（polynomial features）を取得するように処理することができる。特許請求の対象に関連して、適切などの、および／または代替的な「特徴付け（ｆｅａｔｕｒｉｚｉｎｇ）」も適用し、使用することができることを理解されたい。

キャラクタ用のインクは、キャラクタの底部にあるインクをカットすることによって、最初に様々なセグメントに分裂することができる。したがって、ｙ座標が最小値に達し、他の方向に移動し始める所で、分裂が起こる。すると、セグメントはそれぞれ、チェビシェフ多項式の形で表すことができる。各キャラクタから、６５個の特徴を含む特徴ベクトルを得ることができる。こうした特徴ベクトルは次いで、分類器コンポーネント２０６に関連づけられたニューラルネットワークそれぞれに入力として供給される。

分類器コンポーネント２０６は、異書体データおよび特徴ベクトルの少なくとも一方を使用して、少なくとも１つの分類器をさらにトレーニングすることができる。分類器コンポーネント２０６は、第１の認識器および第２の認識器を利用することができ、第１および第２の認識器は、特徴ベクトルを使用してトレーニングすることができることを理解されたい。ただし、対象となる革新事項は、以下の例によってそのように限定されないことも理解されたい。言い換えると、分類器コンポーネント２０６は、最適化された手書き文字認識を実現するように、異書体データを使用してトレーニングされた少なくとも１つの分類器を利用することができる。

図５に移ると、ニューラルネットワークおよび線形分類器をカスケード形式で含む第１の認識器５００（例えば、ニューラルネットワーク異書体ニューラルネットワーク（ＮＮ））を示してある。ニューラルネットワーク５００は、２００２個の出力を有し、キャラクタ特徴ベクトル５０４をキャラクタの異書体にマップするようにトレーニングすることができる。線形組合せ器（異書体フォルダ）５０６は、再度２００２個の異書体を１００個のキャラクタクラスに折りたたむように、傾斜降下を用いてトレーニングすることができる。線形フォルダ５０６は、異書体ＮＮの一部であると見なすことができる。第２の認識器５０２は、異書体情報を使わないニューラルネットワーク（例えば、基本ＮＮ）でよく、特徴ベクトル５０４を出力クラスに直接マップするようにトレーニングすることができる。両方のニューラルネットワークは、それぞれ２つの層を有する多層パーセプトロン（ＭＬＰ）でよい。異書体ＮＮ５００は１０２４個の隠れノードをもつことができ、基本ＮＮ５０２は、６００個の隠れノードをもつことができる。エラー関数としての交差エントロピーでニューラルネットワークをトレーニングするのに、誤差逆伝搬を用いることができることを理解されたい。

図２を再度参照すると、パーソナライズ化コンポーネント２０２は、分類器コンポーネント２０６によって使用される少なくとも１つの分類器に関連づけられた出力を組み合わせるための組合せコンポーネント２０８を含み得る。２つのニューラルネットワーク（例えば、図５の異書体ＮＮ５００および基本ＮＮ５０２）は、異質のアーキテクチャを有することに留意されたい。さらに、異書体ＮＮ５００は、異書体データを用いてトレーニングすることができ、後者はそれができない。こうした違いにより、こうした２つの分類器によって生じるエラーは、大幅に異なることが予期できる。したがって、こうした２つの分類器を使う組合せコンポーネント２０８によって構築され、かつ／または利用されるどの組合せ器も、おそらく、いずれの分類器よりもエラーレートが低くなるであろう。

一例では、組合せコンポーネント２０８は、少なくとも２組の出力を組み合わせるのに、線形技法２１０を利用することができる。単純な線形分類器（例えば、線形技法２１０でよい線形組合せ器）は、異書体ＮＮおよび筆者非依存の（非パーソナライズ化）認識器を含む基本ＮＮの出力を組み合わせることができる。正確さをさらに向上するために、異書体分類器の出力は、組合せコンポーネント２０８に直接供給することもできる。

別の例では、組合せコンポーネント２０８は、少なくとも２つの分類器に関連づけられた出力を組み合わせるのに、パーソナライザ技法２１２を使用することができる。パーソナライザ技法２１２は、筆者非依存の認識器を、新しいトレーニング用サンプルを提供する現在のユーザに適応させることができる。言い換えると、パーソナライザ技法２１２は、２つのニューラルネットワーク（上で論じた）とのカスケード形式でよく、ニューラルネットワークからの出力がパーソナライザ技法２１２によって受け取られ、使用されるように、線形組合せ器（例えば、線形技法２１０によって具体例を示した）は、パーソナライザ技法２１２で置き換えることができる。

パーソナライザ技法２１２は、線形技法２１０と置き換わることができるが、データからトレーニングを行うことができる適切などの組合せ器分類器および／または技法も、線形組合せ器と置き換わるのに使用することができることを理解されたい。適切などの組合せ器分類器も、組合せコンポーネント２０８によって利用することができ、このような組合せ器分類器は、データからトレーニングを行うことができる（例えば、線形技法２１０と置き換わるとき）。少なくとも以下の理由から、パーソナライザ技法２１２用に、サポートベクターマシン（ＳＶＭ）を選ぶことができることを理解されたい。すなわち、１）一般化：ＳＶＭは、一般化プロパティで知られている。ユーザから集められたサンプルの数（１クラス当たり）は非常に小さい（例えば、通常、例として、１０または１５より少ない）場合があるので、このようなわずかなサンプルで一般化を達成できることが重要である。ＳＶＭとは対照的に、非常に限られたトレーニングデータで十分に一般化するようにニューラルネットワークをトレーニングすることは、難しい場合がある。２）正則化：小さいデータセットで優れた一般化を達成する最も一般的な手法は、正則化であり得る。ＳＶＭは、自然な正則化法を実現する。容量を効果的に制御し、過剰適応の機会を削減するのに、モデル選択プロセスを用いることができる。３）マルチクラス：現時点で、マルチクラスＳＶＭは、いくつかの２クラスＳＶＭを用いて構築することができる。このことは、１クラス単位での正確さに対するより細かい微調整を可能にする。線形組合せ器のみをパーソナライズ化することができるので、全部の２クラスＳＶＭが必要でなくてもよい。混同が最も高いクラスのペアに含めることに単に焦点を当てればよい。４）複雑さ：１対１の手法が用いられるとき、２クラス分類器の数は、Ｃ（ｎ，２）に比例して増える（例えば、Ｏ（ｎ²））。ＳＶＭ内のサポートベクターは、ユーザが提供したサンプルのサブセットでよい。したがって、可能なクラスおよび分類器の数が急速に増えたとしても、サポートベクターの総数は、小さくてよいユーザサンプル数によって押さえることができる。さらに、組合せ器はパーソナライズ化することができるので、Ｃ（ｎ，２）分類器の小さいサブセットを構築することができる。落とされる分類器はそれぞれ、非パーソナライズ認識器の出力が代わりに用いられるべきであることを示す単一ビットで表すことができる（例えば、落ちるペアに対して、ＳＶＭ投票の間、票を取得するために非パーソナライズ組合せ器の出力の対応するペアを比較することができる）。

手短に図６を参照すると、対象となる革新事項による、パーソナライザサポートベクターマシンの利用を円滑にする例示的なシステム６００のブロック図である。したがって、パーソナライザ（ＳＶＭ）は、上述したように線形技法と置き換わることができる。

システム２００は、様々なデータセットを使用して、実験に基づく結果を提供することができる。例えば、最適化された手書き文字認識（例えば、パーソナライズ化実験）を実現する際、以下のデータセットを使用することができる。１）第１のセット（例えば、非パーソナライズ化セット）は、２１５人のユーザからの２００，０００個の手書きキャラクタを含んでいた。非パーソナライズ認識器を構築するために、非パーソナライズ化データを用いることができる。２）第２のセット（例えば、パーソナライズ化セット）は、２１人のユーザ（例えば、第１のセットにいる２１５人のユーザには含まれない）からの８４，０００個のサンプルを含んでいた。パーソナライズ化技法を評価するために、パーソナライズ化セットを設計することができる。

両方のセット中のデータは、以下によって与えられる１００個の可能な欧米式手書きキャラクタクラスに渡って均一に分布させることができる。

データセット両方の中のインクサンプルは、異書体コンポーネント２０４によって利用されるようなキャラクタを記述する特徴ベクトルを得るように特徴づけることができる（特徴ベクトルとともに上で論じた）。特徴ベクトルは、上で説明した認識器を構築するのに用いることができる。

非パーソナライズ化セットにある２００，０００個のインクサンプルは、上述したように、異書体コンポーネント２０４で階層状にクラスタリングすることができる。２００２個の異書体を取得するために、例えば７９２という閾値を実装することができる。こうしたクラスタは、２００，０００個のサンプルそれぞれに対して異書体ラベルを割り当てるのに用いることができる。

一般的な認識器は、２つの分類器を含み得る。すなわち、ａ）異書体ＮＮ（異書体フォルダも含む）、およびｂ）基本ＮＮである。非パーソナライズ化セットは、３つの部分にシャッフルし、分裂することができる。すなわち、トレーニング用に使われる１６０，０００個のサンプル、認証用に使われる２０，０００個のサンプル（例えば、トレーニングをいつストップするか判定するため）、およびテスト用に使われる、残りの２０，０００個のサンプルである。非パーソナライズ化データセットに対する一般的な認識器の、報告された正確さは、２０，０００個のテストセットからのものである。図面それぞれにおいて、分類器の上に示される第１のパーセント値は、テストセットに対するエラーレートである。

異書体ＮＮ（例として、図５の５００を参照）は、隠れた層の中の１０２４個のノードおよび２００２個の出力ノード（例えば、１つの異書体につき１つ）を有する２階層の多階層パーセプトロン（例えば、双曲正接の非線形性）でよい。異書体フォルダは、異書体ＮＮ出力を１００個の出力クラスにマップする単純な線形組合せ器でよい。基本ＮＮ（例として、図５の５０２を参照）も、６００個の隠れノードおよび１００個の出力（例えば、１つの出力クラスにつき１つ）を有する２階層の多階層パーセプトロン（例えば、双曲正接の非線形性）でよい。

分類器（例えば、異書体ＮＮ、異書体フォルダ、および基本ＮＮ）は、例えば、エラー測定として逆伝搬および交差エントロピーを用いて、非パーソナライズ化セットでそれぞれ独立にトレーニングすることができる。すべての重みは、例えば、［−０．０５，０．０５］で均一に、ランダムに初期化することができ、例えば０．００１というトレーニングレートが、以下の実験において使われた。

一般的な組合せ器は、２２０２個の入力および１００個の出力を有する単純な線形分類器でよい。一般的な組合せ器は、異書体ＮＮ（２００２）、異書体フォルダ（１００）および基本ＮＮ（１００）の出力を含んで入力する。

パーソナライザは、最大でＣ（１００，２）＝４９５０個の２クラスＳＶＭを用いる１００クラスＳＶＭでよい。一意のパーソナライザは、２１人のユーザそれぞれ向けにトレーニングすることができる。パーソナライズ化データセット中の８４，０００個のサンプルは、２１人のユーザそれぞれ向けの１キャラクタ当たり４０個のサンプルを生じ得る。パーソナライザをトレーニングするのに、１キャラクタ当たり最大１５個のサンプルを用いることができる。１キャラクタ当たりの残りの２５個のサンプルは、純粋にテスト目的のために用いることができる。一般的なユーザは、パーソナライザのトレーニング用に、１キャラクタ当たり１５個より多くのサンプルを提供することができないことを理解されたい。ただし、大きなテストセット（例えば、１キャラ当たり３０個のサンプル）があると、パーソナライズ化認識器の性能の信頼できる評価法を実現することができる。

ｋ＝５、１０、および１５個のユーザサンプル（１クラス当たり）を使用して、各ユーザに３通りのパーソナライズザを構築することができる。こうしたｋ個のサンプルセットは、増加的に選択することができる（例えば、ｋ＝５セットに５個の新しいサンプルを追加することによって、例としてｋ＝１０個のセットを得ることができる）。ｋ個のサンプルは、認識器をトレーニングするためだけでなく、それを正則化するのにも使うことができる。ｃｅｉｌ（ｋ／２）個のサンプルは、トレーニング用に使うことがで、ｆｌｏｏｒ（ｋ／２）個のサンプルは、モデル選択用に使うことができる。ＲＢＦカーネルが、図６に示すように実装された。ＳＶＭモデル選択は、例えば、｛２^-5，２^-4，．．．，２¹⁴，２¹⁵｝のＣおよび｛２^-10，２^-9，．．．，２⁵，２⁴｝のγを用いた単純なグリッド検索を利用して実施することができる。ｆｌｏｏｒ（ｋ／２）個のサンプルに対する最良のエラーレートをもたらしたモデルからの（Ｃ，γ）パラメータ（例えば、ＳＶＭのトレーニング用には使われない）を、パーソナライザ用に選ぶことができる。このエラーレートは、パーソナライズ化認識器（後で論じる）のエラーレートとして報告される。

基本ＮＮ（図５の５０２に見える）は、非パーソナライズ化データセット（例えば、２１５人のユーザを含む）に対してトレーニングし、７．８％のテストエラーレートを達成することができる。パーソナライズ化データセット（２１５人のユーザには含まれない）中の２１人のユーザからのデータに対してテストされると、エラーレートは、９．３６％に増大した。これは、エラーレートにおける２０％の相対的増大である。エラーレートにおけるこのような大幅な増大は、明らかに、ユーザ間変動が筆跡スタイルにおいてユーザ内変動よりもはるかに小さいことを示す。

異書体分類器は、キャラクタラベルだけでなく、キャラクタの書き方の予想も試みることができる。非パーソナライズ化データセットに対して、異書体分類器は、２４．６５％のエラーレートを達成することができ、これは非常に大きなエラーレートと解釈してよい。

ただし、２００２個のキャラクタスタイルが、それに関連づけられた１００個のキャラクタクラス（例えば、カスケード形式のシンプルフォルダを実装する）に折りたたまれると、エラーレートは、８．２５％に低下する。所与のどのキャラクタに関しても、シンプルフォルダは、そのキャラクタに対応する異書体出力の和を返すことができる。

より優れたフォルダが、異なるクラスに渡る混同しやすい異書体を占め得ることを理解されたい。単純な線形フォルダ（例えば、全２００２個の出力に渡る学習された重み付けされた和）が利用される（図５の５００に見られる）と、非パーソナライズテストエラーレートは、５．９％に低下する。ただし、パーソナライズ化テストセットに対するエラーレートは、１１．４０％に劇的に増大する。エラーレートにおけるこの増大（９３％）は、基本認識器に対して観察されたもの（２０％）より大きく、異書体の分布が、非パーソナライズ化データセット中の２１５人のユーザと、パーソナライズ化データセット中の２１人のユーザとの間で大幅に変化することを示す。ただし、異書体の分布が変化しても、どの新規ユーザに対しても、分類器の出力に渡る確率分布は、いくつかのサンプルに渡って実質的に同様でよい。言い換えると、エラーレートは増大するが、新規ユーザエラーは予想可能であり得る。したがって、パーソナライザは、こうしたエラーを削減するようにトレーニングすることができる。

図７は、線形組合せ器を利用する非パーソナライズ認識器の実装を円滑にする例示的なシステム７００のブロック図を示す。このシステムは、手書きキャラクタおよび／または記号７０２、特徴７０４、基本ＮＮ７０６、異書体分類器７０８、異書体フォルダ７１０（「ａｌｌｏｇフォルダ７１０」とも呼ばれる）、および線形組合せ器７１２を含み得る。キャラクタおよび／または手書き記号７０２は、特徴７０４とともに使用することができ、特徴ベクトルを適用することができる（上述したように）。非パーソナライズ組合せ器は、異書体分類器７０８の２００２個の出力、異書体フォルダ７１０の１００個の出力、および基本分類器７０６からの１００個の出力を入力としてとる線形分類器でよい。こうした入力は、１００個の出力クラスにマップすることができる。非パーソナライズ組合せ器は、非パーソナライズ化データセットに対して５．８％のテストエラーレート、およびパーソナライズ化データセットに対して対応する９．５１％のテストエラーレートを達成し得る。性能がわずかに向上した。

図８は、パーソナライザサポートベクターマシンを利用して手書きキャラクタの認識を円滑にする例示的なシステム８００のブロック図を示す。システム８００は、上で、具体的には図６で説明したパーソナライザ（ＳＶＭ）と実質的に同様でよいパーソナライザ（ＳＶＭ）を利用することができるパーソナライズ化認識器を示す。パーソナライズ化データセット中の２１人のユーザそれぞれに対して、一意のパーソナライズ化認識器を構築することができる。パーソナライザは、平均エラーレートを９．５１％から５．６４％に削減することができる。４０．６％を超える、エラーレートにおけるこの相対的削減は、個々のユーザそれぞれに合わせた認識器の調整において、パーソナライザが効果的であることを示す。

図９に移ると、対象となる革新事項による、グラフ化された結果である。グラフ９０２およびグラフ９０４は、１５個のサンプルを用いたパーソナライズ化前後の、ユーザそれぞれに対するエラーレートを示す。図８のパーソナライザは、２１人のユーザのうち２０人に関して、エラーレートを削減することができる。ただし、１人のユーザ（例えば、グラフ９０２に関連づけられたユーザ１２）に対しては、エラーの数が３．７％だけわずかに増大した（例えば、相対的増大）。

各パーソナライザのためのトレーニング時間は、３００秒（例えば、５分）未満でよい。各ペアワイズＳＶＭ分類器（例えば、第１のクラスに対して８個のサンプル、および第２のクラスに対して８個のサンプルをとる）は、３．０ＧＨｚのプロセッサマシンをトレーニングするのに、約０．２７ミリ秒かかり得る。４９５０個のペアワイズ分類器のトレーニングには、１．３３秒かかり得る。ただし、これは、グリッド検索を用いるモデル選択用の２５５（Ｃ，γ）通りの設定それぞれに対して繰り返すことができる。より進化したモデル選択方法を用いると、１または２桁だけ削減することができる。トレーニング時間のそれ以上の削減は、混同行列中の最も大きい値に対応するペアワイズ分類器のみを構築することによって達成することができる。混同のないクラスペアは、パーソナライザから落とされ得る。使用される１００個のクラス問題に対して、すべての非パーソナライズエラーレートが１５％未満であると、単純な手法は、６倍を超える速度の向上を生じ得る。さらに、このような手法は、クラスの数が非常に大きいときに実装することができる。例えば、東アジア言語（例えば、日本語、中国語、韓国語など）は通常、数千のキャラクタを有する。ユーザは、最も誤認識されるキャラクタに対してのみ、わずかなサンプルを提供するものと期待することができる。さらに、ほとんどのユーザが、こうしたキャラクタのごく一部のみを使用し得る。

パーソナライズ化の間、ユーザに対して要求されるサンプルの数が大きくなると、パーソナライズ化エラーレートは低くなるが、ユーザは不快に感じるようになる。さらに、サンプル数の増加とともに、向上率が減少する。パーソナライズ化の実験は、各ユーザからの５、１０、および１５個のサンプル（例えば、１キャラクタ当たり）で繰り返すことができる。グラフ９０６は、ユーザサンプルの数に応じたパーソナライズ化エラーレートを示し得る。

パーソナライズ化エラーレートは、ユーザからの５、１０、１５個のサンプルで７．３７％、６．０６％、５．６４％であった。こうした値は、それぞれ、２３％、３６％、４１％の相対的削減に対応し得る。エラーレートの低下は、第１の５個のサンプルにおいて最も高くなり得る。エラーレートは、１５個のサンプルの後、減少し続ける。ただし、向上率を考えると、ユーザから１０または１５個を超えるサンプルを集めると、エラーレートの後に続く削減を保証できなくなるように見えるが、このことは、ある特定のユーザの好みによって判定することができ、対象となる革新事項に関して限定されない。

別の例では、トレーニング用サンプルの数は、インクに基づく歪みを慎重に使用して拡大することができる。既存のインクサンプルから（非パーソナライズ化セットから）、単純な歪みモデルを仮定し、または構築することができる。次いで、このモデルを使うと、ユーザサンプルの１０〜２０倍の増大を生じ得る。歪みの使用は、画像に基づく分類器を設計する際に効果的であり得る。

図１０は、異書体トレーニング分類器を使用して、筆跡に関連づけられたキャラクタの認識を円滑にするためにインテリジェンスを利用する例示的なシステム１０００のブロック図を示す。システム１０００は、以前の図面において記載したそれぞれのコンポーネント、データ、および認識とすべてが実質的に同様でよいパーソナライズ化コンポーネント１００２、インターフェース１０４、データ、および最適化された手書き文字認識を含み得る。システム１０００は、インテリジェントコンポーネント１００４をさらに含む。インテリジェントコンポーネント１００４は、パーソナライズ化コンポーネント１００２によって、異書体分類器および非異書体分類器を使用して、最適化された手書きキャラクタ認識を実現するのに使用することができる。例えば、インテリジェントコンポーネント１００４は、手書きキャラクタ、手書きキャラクタの変質、領域固有パッケージ、異書体との関連づけなどを推測することができる。

インテリジェントコンポーネント１００４は、イベントおよび／またはデータを介して取り込まれた１組の観察結果から、システム、環境、および／またはユーザの状態についての推論を実現、すなわち推測できることを理解されたい。推測は、例えば、具体的なコンテクストまたはアクションを識別するのに利用することもでき、複数の状態に及ぶ確率分布を生成することもできる。推測は、確率的でよく、つまり、データおよびイベントの考慮に基づく、対象となっている複数の状態に及ぶ確率分布の計算でよい。推測は、１組のイベントおよび／またはデータからの上位レベルのイベントの構築に利用される技術も指し得る。このような推測の結果、イベントが近時間近接で相関付けられていてもいなくても、かつイベントおよびデータが１つのイベントおよびデータソースに由来するのか、それともいくつかのイベントおよびデータソースに由来するのかに関わらず、観察された１組のイベントおよび／または格納されたイベントデータから、新しいイベントまたはアクションが構成される。様々な分類（明示的にかつ／または暗黙的にトレーニングされた）方式および／またはシステム（例えば、サポートベクターマシン、ニューラルネットワーク、エキスパートシステム、ベイズの確信ネットワーク（Ｂａｙｅｓｉａｎｂｅｌｉｅｆｎｅｔｗｏｒｋ）、ファジー論理、データ融合エンジンなど）を、特許請求の対象に関連して、自動および／または推測によるアクション実施と関連して利用することができる。

分類器とは、入力属性ベクトル、すなわちｘ＝（ｘ１、ｘ２、ｘ３、ｘ４、ｘｎ）を、入力があるクラスに属す確信度にマップする関数、つまりｆ（ｘ）＝ｃｏｎｆｉｄｅｎｃｅ（ｃｌａｓｓ）である。このような分類は、確率および／または統計に基づく分析（例えば、分析ユーティリティおよびコストへの因数分解）を利用して、ユーザが自動的に実施させたいと望むアクションを予知し、または推測することができる。サポートベクターマシン（ＳＶＭ）は、利用可能な分類器の例である。ＳＶＭは、超曲面が非トリガイベントからトリガ基準を分裂させようと試みる、入力が起こり得るスペース中の超曲面を発見することによって動作する。直観的に、こうすることによって、トレーニングデータと近似しているが同一ではないテスト用データを分類によって補正する。相異なるパターンの独立を実現する、例えば単純ベイズ、ベイズのネットワーク、決定木、ニューラルネットワーク、ファジー論理モデル、および確率的分類モデルを含む他の有向および無向モデル分類手法も利用することができる。本明細書で使用する分類も、優先度のモデルを開発するのに使用される統計的回帰を含む。

表示コンポーネント１００６は、ユーザと、パーソナライズ化コンポーネント１００２に結合されたどのコンポーネントとの間の対話も円滑にするための様々なタイプのユーザインターフェースを提供することができる。図に示すように、表示コンポーネント１００６は、パーソナライズ化コンポーネント１００２とともに使うことができる別個のエンティティである。ただし、表示コンポーネント１００６および／または同様のビューコンポーネントは、パーソナライズ化コンポーネント１００２に組み込むこともでき、かつ／またはスタンドアロンユニットでもよいことを理解されたい。表示コンポーネント１００６は、１つまたは複数のグラフィカルユーザインターフェース（ＧＵＩ）、コマンドラインインターフェースなどを提供することができる。例えば、データをロードし、インポートし、読み込むなどするための領域または手段をユーザに提供するＧＵＩをレンダリングすることができ、ＧＵＩは、このような操作の結果を提示するための領域を含み得る。こうした領域は、編集コントロール、コンボボックス、ラジオボタン、チェックボックス、プッシュボタン、および画像ボックスとして、ダイアログボックス、静的コントロール、ドロップダウンメニュー、リストボックス、ポップアップメニューを備える公知のテキストおよび／または画像領域を備え得る。さらに、ナビゲーション用の垂直および／または水平スクロールバー、ならびに領域が閲覧可能になるかどうか決定するためのツールバーボタンなどの提示を円滑にするためのユーティリティを利用することができる。例えば、ユーザは、パーソナライズ化コンポーネント１００２に結合されたコンポーネントの１つまたは複数と対話することができる。

ユーザは、例えば、マウス、ローラーボール、キーパッド、キーボード、ペンおよび／またはボイスアクティベーションなど、様々なデバイスを介して情報を選択し提供するために、領域と対話することもできる。通常、プッシュボタンやキーボード上のエンターキーなどの機構を、検索を開始するために、その後の情報入力に利用することができる。ただし、特許請求の対象は、そのように限定されないことを理解されたい。例えば、チェックボックスを単に強調表示するだけで、情報の伝達を開始することができる。別の例では、コマンドラインインターフェースを利用することができる。例えば、コマンドラインインターフェースは、ユーザに、テキストメッセージを与えることにより、情報の入力を促す（例えば、ディスプレイ上のテキストメッセージおよび音声トーンを介して）ことができる。ユーザは次いで、インターフェースの入力要求や、入力要求において持ち出された質問への回答に対して提供される選択肢に対応する文字数字入力など、適切な情報を提供することができる。コマンドラインインターフェースは、ＧＵＩおよび／またはＡＰＩと関連して利用できることを理解されたい。さらに、コマンドラインインターフェースは、画像サポートが限られた、かつ／または通信チャネルが低帯域幅のハードウェア（例えば、ビデオカード）および／またはディスプレイ（例えば、白黒、およびＥＧＡ）と関連して利用することができる。

図１１〜１２は、特許請求の対象による方法を示す。説明を簡単にするために、こうした方法は一連の作用として示してある。対象となる革新事項は例示した作用および／または作用の順序に限定されないことを理解されたい。例えば、作用は、様々な順序で、かつ／または並行して起こってよく、本明細書に提示も記述もしていない他の作用とともに起こり得る。さらに、例示するすべての作用が、特許請求の対象による方法の実装に必要となるわけではない。さらに、本方法は、別法として、状態図またはイベントによる相関付けられた一連の状態として表すことができることが、当業者には理解されよう。さらに、これ以降で、かつ本明細書を通して開示する方法は、このような方法のコンピュータへの移送および転送を円滑にするために、製造品上に格納することが可能であることをさらに理解されたい。本明細書で使用する製造品という用語は、どのコンピュータ可読デバイス、搬送波、または媒体からもアクセス可能なコンピュータプログラムを包含することを意図している。

図１１は、手書き文字認識を実現するために、異書体データで少なくとも１つの分類器をトレーニングする方法論１１００を示す。参照番号１１０２で、異書体データを生成することができる。異書体データは、自動的に、手作業で、かつ／またはそのどの組合せでも生成することができる。例えば、異書体データは、適切などのクラスタリング技法（後で論じる）を利用しても、自動的に生成することができる。言い換えると、クラスタリングを通じた、手書きキャラクタから異書体（例えば、キャラクタの形状および／またはスタイル）を識別する自動的な手法を実装することができる。別の例では、異書体データは、例えば、地理的領域、学区、言語、および書き方などに基づく筆跡に関連づけられたタイプおよび／またはスタイルを提供するための筆跡エキスパートを使用して、手作業で提供することができる。ユーザが漠然と支持し得る「異書体」と呼ぶことができる手書きキャラクタのスタイルが存在し得ることを理解されたい。欧米式手書きスタイルのカタログを構築することが、何度か試みられてきたが、今日に至るまでカタログは存在していない。それにも関わらず、特定の任意の国の学校システムにおいては、一握りの筆跡スタイルが教えられており、ある特定のスタイルが所与のどの学区においても採用されている。

参照番号１１０４で、異書体データを使用して、分類器をトレーニングすることができる。例えば、異書体ニューラルネットワーク（ＮＮ）認識器は、線形分類器とのカスケード形式でよく、ＮＮからの出力は、キャラクタ特徴ベクトルをキャラクタ異書体データにマップすることができる。線形組合せ器（例えば、異書体フォルダ）は、異書体データを使ってトレーニングすることができる。異書体トレーニング分類器は、手書き文字認識の正確さを向上させるために、非異書体トレーニング分類器と組み合わせることができることを理解されたい。参照番号１１０６で、異書体データでトレーニングされた分類器を利用することによって、手書きキャラクタの最適化された手書き文字認識を実現することができる。

図１２は、最適化された手書き文字認識の実現を円滑にする方法論１２００を示す。参照番号１２０２で、手書き文字認識をそれに対して実装することができる手書きキャラクタを受け取ることができる。参照番号１２０４で、異書体を作成することができ、特徴ベクトルを使用することができる。異書体は、自動的に、手作業で、および／またはそのどの組合せでも作成することができる。例えば、異書体は、（例えば、上述した）クラスタリングを使用して、自動的に作成することができる。

参照番号１２０６で、異書体データで第１の分類器をトレーニングすることができ、非異書体データで第２の分類器をトレーニングすることができる。第１の分類器は、異書体分類器（例えば、上述した異書体ＮＮ）でよい。第２の分類器は、基本分類器（例えば、上述した基本ＮＮ）でよい。参照番号１２０８で、第１および第２の分類器の出力を組み合わせることができる。出力の組合せは、例えば、線形分類器（例えば、線形組合せ器）、パーソナライザ、ＲＢＦカーネル、サポートベクターマシン（ＳＶＭ）などだが、それに限定されない、適切などの組合せ器によっても実装することができる。第１および第２の分類器の出力を組み合わせることによって、受け取った手書きキャラクタの、最適化された、優れた手書き文字認識を実現することができる。

特許請求の対象の様々な態様を実装する状況をさらに規定するために、図１３〜１４および以下の説明は、対象となる革新事項の様々な態様を実装することができる適切なコンピューティング環境の、簡潔で一般的な説明を与えることを意図している。例えば、パーソナライズ化コンポーネントは、以前の図面において記載したように、異書体データでトレーニングされた、少なくとも１つの分類器を使用して、最適化され、かつ／または強化された手書き文字認識を実現し、このような適切なコンピューティング環境において実装することができる。これまで、ローカルコンピュータおよび／またはリモートコンピュータ上で実行されるコンピュータプログラムのコンピュータ実行可能命令という一般的な状況において特許請求の対象を説明したが、対象となる革新事項は他のプログラムモジュールとの組合せでも実装できることが当業者には理解されよう。概して、プログラムモジュールは、特定のタスクを実施し、かつ／または特定の抽象データタイプを実装するルーチン、プログラム、コンポーネント、データ構造などを含む。

さらに、本発明の方法は、他のコンピュータシステム構成とともに実施できることが当業者には理解されよう。他のコンピュータシステム構成は、シングルプロセッサコンピュータシステムまたはマルチプロセッサコンピュータシステム、ミニコンピュータ、メインフレームコンピュータ、ならびにパーソナルコンピュータ、ハンドヘルドコンピューティングデバイス、マイクロプロセッサベースの家電製品および／またはプログラム可能な家電製品などを含み、こうしたシステムはそれぞれ、関連づけられた１つまたは複数のデバイスと動作可能に通信することができる。例示した特許請求の対象の態様は、通信ネットワークを介してリンクされるリモート処理デバイスによって特定のタスクが実施される分散型コンピューティング環境でも実施することができる。ただし、すべてではなくともいくつかの対象となる革新事項の態様は、スタンドアロンコンピュータにおいても実施することができる。分散型コンピューティング環境では、プログラムモジュールは、ローカルメモリ記憶デバイスまたはリモートメモリ記憶デバイス内またはその両方に配置することができる。

図１３は、特許請求の対象と相互作用し得る例としてのコンピューティング環境１３００の概略的なブロック図である。システム１３００は、１つまたは複数のクライアント（群）１３１０を含む。クライアント（群）１３１０は、ハードウェアおよび／またはソフトウェア（例えば、スレッド、プロセス、コンピューティングデバイス）でよい。システム１３００は、１つまたは複数のサーバ（群）１３２０も含む。サーバ（群）１３２０は、ハードウェアおよび／またはソフトウェア（例えば、スレッド、プロセス、コンピューティングデバイス）でよい。サーバ１３２０は、例えば、対象となる革新事項を利用して変換を実施するためのスレッドを収容することができる。

クライアント１３１０とサーバ１３２０の間で起こり得る１つの通信内容は、２つ以上のコンピュータプロセスの間で伝送されるように適合されたデータパケットの形をとり得る。システム１３００は、クライアント（群）１３１０とサーバ（群）１３２０の間の通信を円滑にするのに利用することができる通信フレームワーク１３４０を含む。クライアント（群）１３１０は、クライアント（群）１３１０にローカルな情報を格納するのに利用することができる、１つまたは複数のクライアントデータストア（群）１３５０に動作可能に接続される。同様に、サーバ（群）１３２０は、サーバ１３２０にローカルな情報を格納するのに利用することができる、１つまたは複数のサーバデータストア（群）１３３０に動作可能に接続される。

図１４を参照すると、特許請求の対象の様々な態様を実装する例示的な環境１４００が、コンピュータ１４１２を含む。コンピュータ１４１２は、処理ユニット１４１４、システムメモリ１４１６、およびシステムバス１４１８を含む。システムバス１４１８は、システムメモリ１４１６を含むがそれに限定されないシステムコンポーネントを処理ユニット１４１４に結合する。処理ユニット１４１４は、市販されている様々なプロセッサのいずれでもよい。デュアルマイクロプロセッサおよび他のマルチプロセッサアーキテクチャも、処理ユニット１４１４として利用することができる。

システムバス１４１８は、市販されている様々などのバスアーキテクチャも用いるメモリバスもしくはメモリコントローラ、周辺バスもしくは外部バス、および／またはローカルバスを含むいくつかのタイプのバス構造（群）のどれでもよく、こうしたバス構造は、業界標準アーキテクチャ（ＩＳＡ）、マイクロチャネルアーキテクチャ（ＭＳＡ）、拡張ＩＳＡ（ＥＩＳＡ）、インテリジェントドライブエレクトロニクス（ＩＤＥ）、ＶＥＳＡローカルバス（ＶＬＢ）、周辺装置相互接続（ＰＣＩ）、カードバス、ユニバーサルシリアルバス（ＵＳＢ）、拡張グラフィックスポート（ＡＧＰ）、ＰＣカードアダプタ（ＰＣＭＣＩＡ）、ファイアワイア（ＩＥＥＥ１３９４）、および小型コンピュータシステムインターフェース（ＳＣＳＩ）を含むが、それに限定されない。

システムメモリ１４１６は、揮発性メモリ１４２０および不揮発性メモリ１４２２を含む。例えば起動中に、コンピュータ１４１２内部の要素の間で情報を転送するための基本ルーチンを含む基本入出力システム（ＢＩＯＳ）が、不揮発性メモリ１４２２に格納される。限定ではなく例として、不揮発性メモリ１４２２は、読出し専用メモリ（ＲＯＭ）、プログラム可能ＲＯＭ（ＰＲＯＭ）、電気的プログラム可能ＲＯＭ（ＥＰＲＯＭ）、電気的消去可能プログラム可能ＲＯＭ（ＥＥＰＲＯＭ）、またはフラッシュメモリを含み得る。揮発性メモリ１４２０は、外部キャッシュメモリとして作用するランダムアクセスメモリ（ＲＡＭ）を含む。限定ではなく例として、ＲＡＭは、スタティックＲＡＭ（ＳＲＡＭ）、ダイナミックＲＡＭ（ＤＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、ダブルデータレート方式ＳＤＲＡＭ（ＤＤＲＳＤＲＡＭ）、拡張ＳＤＲＡＭ（ＥＳＤＲＡＭ）、シンクリンクＤＲＡＭ（ＳＬＤＲＡＭ）、およびランバスダイレクトＲＡＭ（ＲＤＲＡＭ）、ダイレクトランバスダイナミックＲＡＭ（ＤＲＤＲＡＭ）、ランバスダイナミックＲＡＭ（ＲＤＲＡＭ）など、多くの形で市販されている。

コンピュータ１４１２は、取外し可能／固定式、揮発性／不揮発性コンピュータ記憶媒体も含む。図１４は、例えばディスク記憶装置１４２４を示す。ディスク記憶装置１４２４は、磁気ディスクドライブ、フロッピー（登録商標）ディスクドライブ、テープドライブ、Ｊａｚドライブ、Ｚｉｐドライブ、ＬＳ−１００ドライブ、フラッシュメモリカード、またはメモリスティックなどのデバイスを含むが、それに限定されない。さらに、ディスク記憶装置１４２４は、記憶媒体を別個に含むことも、コンパクトディスクＲＯＭデバイス（ＣＤ−ＲＯＭ）、書込み可能ＣＤドライブ（ＣＤ−Ｒドライブ）、書換え可能ＣＤドライブ（ＣＤ−ＲＷドライブ）、またはデジタル多目的ディスクＲＯＭドライブ（ＤＶＤ−ＲＯＭ）などの光ディスクドライブを含むがそれに限定されない他の記憶媒体と組み合わせて含むこともできる。システムバス１４１８へのディスク記憶装置１４２４の接続を円滑にするために、インターフェース１４２６などの取外し可能または固定式インターフェースが、通常は使われる。

図１４は、適切な動作環境１４００において述べられる、ユーザと基本的なコンピュータリソースとの間の媒介として作用するソフトウェアを示すことを理解されたい。このようなソフトウェアは、オペレーティングシステム１４２８を含む。オペレーティングシステム１４２８は、ディスク記憶装置１４２４に格納することができ、コンピュータシステム１４１２のリソースを制御し割り振るように作用する。システムアプリケーション１４３０は、システムメモリ１４１６またはディスク記憶装置１４２４のどちらかに格納された、プログラムモジュール１４３２およびプログラムデータ１４３４を介して、オペレーティングシステム１４２８によるリソース管理を活用する。特許請求の対象は、様々なオペレーティングシステム、またはオペレーティングシステムの組合せを用いて実装できることを理解されたい。

ユーザは、入力デバイス（群）１４３６を介して、コマンドまたは情報をコンピュータ１４１２に入力する。入力デバイス１４３６は、ポインティングデバイス、例えばマウス、トラックボール、スタイラス、タッチパッド、キーボード、マイクロホン、ジョイスティック、ゲームパッド、衛星パラボラアンテナ、スキャナ、ＴＶチューナカード、デジタルカメラ、デジタルビデオカメラ、ウェブカメラなどを含むが、それに限定されない。こうしたおよび他の入力デバイスは、インターフェースポート（群）１４３８を介して、システムバス１４１８によって処理ユニット１４１４に接続される。インターフェースポート（群）１４３８は、例えば、シリアルポート、パラレルポート、ゲームポート、およびユニバーサルシリアルバス（ＵＳＢ）を含む。出力デバイス（群）１４４０は、入力デバイス（群）１４３６と同じタイプのポートの一部を使う。したがって、例えば、ＵＳＢポートは、コンピュータ１４１２への入力を可能にし、コンピュータ１４１２から出力デバイス１４４０に情報を出力するのに用いることができる。出力アダプタ１４４２は、他の出力デバイス１４４０の中でも、専用アダプタを必要とする、モニタ、スピーカ、およびプリンタのようないくつかの出力デバイス１４４０があることを示すために図示してある。出力アダプタ１４４２は、限定ではなく例として、出力デバイス１４４０とシステムバス１４１８の間の接続手段を提供するビデオカードおよびサウンドカードを含む。リモートコンピュータ（群）１４４４など、他のデバイスおよび／またはデバイスからなるシステムは、入力および出力機能両方を提供することに留意されたい。

コンピュータ１４１２は、１つまたは複数のリモートコンピュータ、例えばリモートコンピュータ（群）１４４４への論理接続を使用してネットワーク接続された環境において動作することができる。リモートコンピュータ（群）１４４４は、パーソナルコンピュータ、サーバ、ルータ、ネットワークＰＣ、ワークステーション、マイクロプロセッサベースの機器、ピアデバイスまたは他の共通ネットワークノードなどでよく、通常、コンピュータ１４１２に関連して説明した要素の多くまたはすべてを含む。簡潔にするために、メモリ記憶装置１４４６のみをリモートコンピュータ（群）１４４４とともに示してある。リモートコンピュータ（群）１４４４は、ネットワークインターフェース１４４８を介してコンピュータ１４１２に論理的に接続され、さらに通信接続手段１４５０を介して物理的に接続される。ネットワークインターフェース１４４８は、ローカルエリアネットワーク（ＬＡＮ）およびワイドエリアネットワーク（ＷＡＮ）などの有線および／または無線通信ネットワークを包含する。ＬＡＮ技術は、光ファイバ分散データインターフェース（ＦＤＤＩ）、銅線配線データインターフェース（ＣＤＤＩ）、イーサネット（登録商標）、トークンリングなどを含む。ＷＡＮ技術は、二地点間リンク、統合サービスデジタルネットワーク（ＩＳＤＮ）のような回路交換ネットワークおよびその変形、パケット交換ネットワーク、ならびにデジタル加入者線（ＤＳＬ）を含むが、それに限定されない。

通信接続手段（群）１４５０は、ネットワークインターフェース１４４８をバス１４１８に接続するのに利用されるハードウェア／ソフトウェアを指す。通信接続手段１４５０は、説明をわかりやすくするためにコンピュータ１４１２内部に示してあるが、コンピュータ１４１２の外部にあってもよい。ネットワークインターフェース１４４８への接続に必要なハードウェア／ソフトウェアは、単なる例として、標準的な電話レベルのモデム、ケーブルモデム、およびＤＳＬモデムを含むモデム、ＩＳＤＮアダプタ、ならびにイーサネット（登録商標）カードなど、内部および外部技術を含む。

上で説明した内容は、特許請求の対象のいくつかの例を含む。当然ながら、特許請求の対象を説明するためのコンポーネントまたは方法のあらゆる組合せを説明することはできないが、対象となる革新事項のさらに多くの組合せおよび入替えが可能であることが当業者には理解されよう。したがって、特許請求の対象は、添付の請求項の精神およびその範囲内であるこのようなすべての変更形態、修正形態、および変形形態を包含することを意図したものである。

特に、上述したコンポーネント、デバイス、回路、システムなどによって実施される様々な機能に関して、このようなコンポーネントを説明するのに用いた用語（「手段」への言及も含む）は、特に示さない限り、説明した（例えば、機能的に等価な）コンポーネントの指定された機能を実施するとともに、開示した構造と構造的に等価でないとしても、本明細書において示した特許請求の対象の例示的な態様においてそうした機能を実施する、どのコンポーネントにも対応することを意図している。この点に関して、対象となる革新事項は、システムならびに特許請求の対象の様々な方法の作用および／またはイベントを実施するコンピュータ実行可能命令を有するコンピュータ可読媒体を含むことも理解されよう。

さらに、対象となる革新事項のある特定の特徴は、いくつかの実装形態のただ１つに関して開示したが、このような特徴は、所与のまたは特定のどのアプリケーションにとっても望ましく、有利であるように、他の実装形態の他の１つまたは複数の特徴と組み合わせることができる。さらに、詳細な説明または特許請求の範囲において「含む」という用語およびその変形が使われている限りでは、そうした用語は、「備える」という用語と同様に包括的であることを意図している。

異書体トレーニング分類器を使用して、筆跡に関連づけられたキャラクタの認識を円滑にする例示的なシステムを示すブロック図である。手書きキャラクタ認識を利用するために異書体データの使用を円滑にする例示的なシステムを示すブロック図である。キャラクタのクラスタリングに関連づけられた結果の可視化を円滑にする２分木を示すブロック図である。特許請求の対象に従って使用することができる様々な筆跡スタイルに関連づけられたテーブルを示すブロック図である。異書体分類器および基本分類器の使用を円滑にする例示的なシステムを示すブロック図である。対象となる革新事項による、パーソナライザサポートベクターマシンの利用を円滑にする例示的なシステムを示すブロック図である。線形組合せ器を利用する非パーソナライズ認識器の実装を円滑にする例示的なシステムを示すブロック図である。パーソナライザサポートベクターマシンを利用して手書きキャラクタの認識を円滑にする例示的なシステムを示すブロック図である。対象となる革新事項による、グラフ化された結果を示す図である。異書体トレーニング分類器を使用して、筆跡に関連づけられたキャラクタの認識を円滑にする例示的なシステムを示すブロック図である。手書き文字認識を実現するために、異書体データで少なくとも１つの分類器をトレーニングする例示的な方法論を示す図である。最適化された手書き文字認識の実現を円滑にする例示的な方法論を示す図である。特許請求の対象の新規態様を利用することができる例示的なネットワーク接続環境を示す図である。特許請求の対象に従って利用することができる例示的な動作環境を示す図である。

Claims

手書き分析を円滑にするシステムであって、
少なくとも１つの手書きキャラクタを受け取るインターフェースコンポーネントと、
前記少なくとも１つの手書きキャラクタの手書き文字認識を実現するように、筆跡スタイルに関連した異書体データに基づいて分類手段をトレーニングするパーソナライズ化コンポーネントと
を備えることを特徴とするシステム。
異書体データを生成する異書体コンポーネントをさらに備えることを特徴とする請求項１に記載のシステム。
前記異書体コンポーネントは、クラスタリング技法を使用して異書体データを自動的に生成することを特徴とする請求項２に記載のシステム。
前記クラスタリング技法の結果は、２分木および非類似度デンドログラムの少なくとも一方によって可視化されることを特徴とする請求項２に記載のシステム。
前記クラスタリング技法は、距離尺度として動的時間伸縮を使用する階層集積クラスタリング手法であることを特徴とする請求項３に記載のシステム。
異書体ニューラルネットワークに入力を提供するために多項特徴技法を使用する異書体ニューラルネットワーク（異書体ＮＮ）である第１の認識手段を利用する分類手段コンポーネントをさらに備えることを特徴とする請求項１に記載のシステム。
前記異書体ＮＮは異書体データを使用してトレーニングされることを特徴とする請求項６に記載のシステム。
前記第１の認識手段および前記異書体ＮＮは、シンプルフォルダ、線形フォルダ、および異書体フォルダの少なくとも１つを使用することを特徴とする請求項６に記載のシステム。
前記分類手段コンポーネントは、多項特徴技法を使用する基本ニューラルネットワーク（基本ＮＮ）である第２の認識手段を、基本ニューラルネットワークに入力を与えるのに利用することを特徴とする請求項６に記載のシステム。
前記基本ＮＮは、非異書体データを使用してトレーニングされることを特徴とする請求項９に記載のシステム。
前記第１の認識手段の出力および前記第２の認識手段の出力を組み合わせることができる組合せコンポーネントをさらに備えることを特徴とする請求項９に記載のシステム。
前記組合せコンポーネントは、線形組合せ手段および線形分類手段の少なくとも一方を利用することを特徴とする請求項１１に記載のシステム。
前記組合せコンポーネントは、データから学習することができる組合せ手段分類手段を利用することを特徴とする請求項１１に記載のシステム。
前記組合せ手段分類手段はサポートベクターマシンであることを特徴とする請求項１３に記載のシステム。
前記サポートベクターマシンは、ユーザからの筆跡サンプルを使用して、前記第１の認識手段の出力および前記第２の認識手段の出力を最適なやり方で組み合わせることを学習することを特徴とする請求項１４に記載のシステム。
前記パーソナライズ化コンポーネントは、疲労による変質を考慮に入れて、前記手書きキャラクタを推測することを特徴とする請求項１に記載のシステム。
前記異書体データは、地理的領域、学区、言語、および書き方の少なくとも１つに少なくとも部分的に基づき得ることを特徴とする請求項１に記載のシステム。
手書き文字認識の実現を円滑にするマシン実行方法であって、
異書体データを生成するステップと、
前記異書体データを使用して第１の分類手段をトレーニングするステップと、
手書きキャラクタの最適化された手書き文字認識を実現するステップと
を含むことを特徴とする方法。
手書きキャラクタを受け取るステップと、
異書体データを自動的に作成し、第２の分類手段を非異書体データでトレーニングする特徴ベクトルを与えるステップと、
線形組合せ手段、パーソナライザ、サポートベクターマシン（ＳＶＭ）、および組合せ手段分類手段の少なくとも１つを使用して、前記第１および第２の分類手段の出力を組み合わせるステップと
をさらに含むことを特徴とする請求項１８に記載の方法。
手書き分析を円滑にするマシン実装システムであって、
少なくとも１つの手書きキャラクタを受け取る手段と、
筆跡スタイルに関連した異書体データに基づいて、前記少なくとも１つの手書きキャラクタの手書き文字認識を実現するように分類手段をトレーニングする手段と
を備えることを特徴とするシステム。