JP2001357413A

JP2001357413A - アニメーション会話システムおよびそれに用いられるサーバ

Info

Publication number: JP2001357413A
Application number: JP2000176677A
Authority: JP
Inventors: Tokio Kamimura; 時男上村; Yuzuru Tanaka; 譲田中
Original assignee: Minolta Co Ltd
Current assignee: Minolta Co Ltd
Priority date: 2000-06-13
Filing date: 2000-06-13
Publication date: 2001-12-26

Abstract

(57)【要約】【課題】コンピュータによって仮想した実在または架空
の人物等との会話を遠隔的に行うこと。【解決手段】クライアント２には、ユーザから仮想の人
物等への第一のメッセージを入力する装置と、それを送
信する手段と、人物等からユーザへの第二のメッセージ
および人物等の顔アニメーションを受信する手段と、第
二のメッセージを出力する出力装置２２ｂと、顔アニメ
ーションを表示する表示装置２２ａとが設けられ、サー
バ３には、顔画像データベースと、第一のメッセージを
受信する手段と、第二のメッセージを生成する手段と、
第二のメッセージが出力されるタイミングと顔画像デー
タの動作とが合うように制御する動作制御データを生成
する手段と、動作制御データおよび顔画像データに基づ
いて顔アニメーションを生成する手段と、それらを送信
する手段とが設けられる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータによ
って仮想した実在または架空の人物等との会話を行える
ようにしたアニメーション会話システムに関し、特に、
ユーザがクライアントからネットワークを介してサーバ
にアクセスし、遠隔的に会話を行えるようにしたアニメ
ーション会話システムに関する。

【０００２】

【従来の技術】近年、コンピュータによって仮想された
実在または架空の人物、動物、人形、またはキャラクタ
などとコミュニケーションを取ることのできる技術が、
研究され開発されている。

【０００３】例えば、特開平１１−２１２９３４号に
は、仮想空間において飼育される生命体に対して、マウ
スまたはキーボードなどの入力装置を操作してコマンド
を入力し、所定の動作をさせる技術が開示されている。
これによると、仮想ペットに食事を与え、または仮想ペ
ットを寝かせ、褒め、叱り、または遊ばすなど、本物の
ペットと同じような世話を、コンピュータによって行
う。このような世話により、仮想ペットは成長し、ユー
ザは、表示装置またはスピーカなどから出力される画像
または音声によって仮想ペットの成長を確認しながら、
ペットの飼育を体験することができる。また、ネットワ
ークを介して遠隔的に仮想ペットを飼育することもでき
る。

【０００４】生命体の音声と画像との出力のタイミング
を合わせる方法には、例えば、特開平１０−３１２４６
７号に記載の音声を画像に合わせて出力する方法、特開
平１０−２９３８６０号に記載された画像を音声に合わ
せて出力する方法などがある。これらの方法によって、
画像が動作するアニメーションを作成し、アニメーショ
ンに同期して音声を出力することもできるので、ユーザ
は、出力される画像と音声とをリアルに感じ取ることが
できる。その他、実写映像を基にアニメーションを作成
する方法として、実写映像の認識によるアニメーション
合成技術がある（ＮＴＴ技術ジャーナル１９９８．１
２ｐ９８〜１０６）。係る技術は、１枚の写真から自
動的に似顔絵を作成し、その似顔絵を基に、目、口の開
閉状態の異なる表情、喜怒哀楽の表情を自動作成し、音
声などに同期して似顔絵アニメーションを合成する方法
である。

【０００５】

【発明が解決しようとする課題】上に述べた特開平１１
−２１２９３４号の技術では、ネットワークを介して遠
隔的に仮想ペットとコミュニケーションを取ることがで
きる。しかし、この従来の技術は、ユーザが入力装置か
ら入力するコマンドによって仮想ペットが制御され、表
示面に表示されるものであって、ユーザが仮想ペットに
対して取り得るコミュニケーションのパターンは限られ
ている。例えば、仮想ペットと会話を行うことはでき
ず、リアリティのあるコミュニケーションを取ることは
できない。

【０００６】また、特開平１０−３１２４６７号に記載
のアニメーションの作成技術は、例えば、ある人物が話
をするときの動きのアニメーションを作成することがで
きるが、人物からユーザへ向かって一方的に出力される
ものにすぎず、ユーザと人物とが会話を行うことはでき
ない。

【０００７】本発明は、コンピュータによって仮想した
実在または架空の人物等との会話を遠隔的に行うことの
できるシステム、サーバ、およびクライアントを提供す
ることを目的とする。

【０００８】

【課題を解決するための手段】本発明に係るシステム
は、実在または架空の人物、動物、人形、またはキャラ
クタなどをコンピュータによって仮想し、これら人物等
との会話を行えるようにしたアニメーション会話システ
ムであって、クライアントおよびサーバを有し、前記ク
ライアントには、ユーザから前記人物等へのメッセージ
である第一のメッセージを入力する入力装置と、当該第
一のメッセージを送信する手段と、前記人物等からユー
ザへのメッセージである第二のメッセージおよび前記人
物等の顔アニメーションを受信する手段と、当該第二の
メッセージをユーザに出力する出力装置と、当該顔アニ
メーションを表示する表示装置とが設けられ、前記サー
バには、前記人物等の顔画像データを記憶した記憶手段
と、前記第一のメッセージを受信する手段と、前記第二
のメッセージを生成する手段と、前記第二のメッセージ
に合わせて顔画像データを動作させる動作制御データを
生成する手段と、当該動作制御データおよび前記顔画像
データに基づいて前記顔アニメーションを生成する手段
と、前記第二のメッセージおよび前記顔アニメーション
を送信する手段とが設けられている。

【０００９】他の形態として、サーバからクライアント
に顔画像データを送信するようにし、クライアントにお
いて、受信した顔画像データに基づいて顔アニメーショ
ンを生成する手段を設ける。

【００１０】さらに他の形態として、クライアントに顔
画像データを記憶する記憶手段を設け、クライアントに
おいて、その記憶手段から顔画像データを抽出する。顔
画像データとして、好ましくは、人物の頭部、または
口、目、鼻、耳などの構成部分、および皮膚、筋肉、骨
格などが動作可能なように構造化された３次元モデルが
用いられる。人物として、俳優、歌手、その他の芸能人
またはスター、スポーツ選手、政治家などの有名人、ユ
ーザの先祖、歴史上の人物など、種々の実在または架空
の人物を用いることができる。また人物のみでなく、動
物、人形、または漫画のキャラクタなどを用いることも
可能である。

【００１１】

【発明の実施の形態】以下に示す３つの実施形態におい
て、種々の人物ＨＭＮをコンピュータによって仮想し、
その中からユーザが選択した人物ＨＭＮと会話を行える
ようにしたアニメーション会話システム１を例として説
明する。〔第一の実施形態〕図１は本発明に係る第一の実施形態
のアニメーション会話システム１の全体の構成を示すブ
ロック図、図２はクライアント２の磁気ディスク装置２
７に記憶されるプログラムなどの例を示す図、図３はサ
ーバ３の磁気ディスク装置３７に記憶されるプログラム
などの例を示す図、図４はサーバ３の磁気ディスク装置
３７に設けられるデータベースなどの例を示す図、図５
は人物ＨＭＮの一覧表ＬＳＴの例を示す図である。

【００１２】図１に示すように、アニメーション会話シ
ステム１は、クライアント２、サーバ３、およびネット
ワーク４などから構成される。クライアント２は、処理
装置２１、表示装置２２ａ、スピーカ２２ｂ、マウス２
３ａ、キーボード２３ｂ、マイク２３ｃ、通信制御装置
２４、ＣＤ−ＲＯＭ装置２５、フロッピィディスク装置
２６、および磁気ディスク装置２７などから構成され
る。

【００１３】処理装置２１は、ＣＰＵ２１ａ、ＲＡＭ２
１ｂ、およびＲＯＭ２１ｃなどから構成され、クライア
ントにおける一連の処理を実行する。ＲＡＭ２１ｂには
プログラムまたはデータなどが一時的に記憶され、ＲＯ
Ｍ２１ｃにはプログラムおよびクライアントのハードウ
ェアの設定情報などが記憶される。ＣＰＵ２１ａは、そ
れらのプログラムを実行する。

【００１４】表示装置２２ａは、人物ＨＭＮの顔のアニ
メーションを表示し、後述する文字データＴＸＴ２を表
示によってユーザに出力する。スピーカ２２ｂは、後述
する音声データＳＮＤ２を音声でユーザに出力する。マ
ウス２３ａおよびキーボード２３ｂは、ユーザから人物
ＨＭＮへのメッセージである第一のメッセージＭＧ１の
入力、またはクライアント２の操作などに用いられる。
マイク２３ｃは、第一のメッセージＭＧ１を音声によっ
て入力する。

【００１５】通信制御装置２４は、第一のメッセージＭ
Ｇ１、人物ＨＭＮからユーザへのメッセージである第二
のメッセージＭＧ２、後述する顔アニメーションデータ
ＦＡＤ、その他のデータの送受信を制御する。ＣＤ−Ｒ
ＯＭ装置２５、フロッピィディスク装置２６、および磁
気ディスク装置２７は、データおよびプログラムを記憶
する。

【００１６】サーバ３は、処理装置３１、表示装置３
２、マウス３３ａ、キーボード３３ｂ、通信制御装置３
４、ＣＤ−ＲＯＭ装置３５、フロッピィディスク装置３
６、および磁気ディスク装置３７などから構成される。

【００１７】処理装置３１は、ＣＰＵ３１ａ、ＲＡＭ３
１ｂ、およびＲＯＭ３１ｃなどから構成される。処理装
置３１それ自体の構成および機能は上に述べた処理装置
２１と同様である。通信制御装置３４は、第一のメッセ
ージＭＧ１、第二のメッセージＭＧ２、顔アニメーショ
ンデータＦＡＤ、その他のデータの送受信を制御する。

【００１８】ネットワーク４は、公衆回線、専用線、Ｌ
ＡＮ、無線回線、またはインターネットなどによって構
成される。クライアント２とサーバ３は、ネットワーク
４を介して接続される。

【００１９】第一のメッセージＭＧ１は、マイク２３ｃ
から入力された音声データＳＮＤ１、またはキーボード
３３ｂなどから入力された文字データＴＸＴ１などであ
る。第二のメッセージＭＧ２は、音声データＳＮＤ２ま
たは文字データＴＸＴ２などである。顔アニメーション
データＦＡＤは、人物ＨＭＮの顔の連続的な動作の画像
によって構成される顔アニメーションの情報である。

【００２０】図２に示すように、クライアント２の磁気
ディスク装置２７には、クライアント２の基本プログラ
ムであるＯＳ２ｓ、アニメーション会話システム１のク
ライアント側のアプリケーションプログラムであるクラ
イアント会話プログラム２ｐ、クライアント会話プログ
ラム２ｐに必要なデータ２ｄなどが記憶されている。ク
ライアント会話プログラム２ｐは、基本操作処理２ｂ
ｓ、その他の処理を行う。基本操作処理２ｂｓは、ＯＳ
２ｓとの連携、人物ＨＭＮの選択に関する処理、および
第一のメッセージＭＧ１の入力処理などを行うプロセス
である。これらのプログラムおよびデータは、適宜、Ｒ
ＡＭ２１ｂにロードされ、ＣＰＵ２１ａによって実行さ
れる。

【００２１】図３に示すように、サーバ３の磁気ディス
ク装置３７には、サーバ３の基本プログラムであるＯＳ
３ｓ、アニメーション会話システム１のサーバ側のアプ
リケーションプログラムであるサーバ会話プログラム３
ｐ、サーバ会話プログラム３ｐに必要な情報であるデー
タ３ｄなどが記憶されている。

【００２２】サーバ会話プログラム３ｐは、基本操作処
理３ｂｓ、言語認識会話エンジンＥＧ１およびアニメー
ションエンジンＥＧ２によって構成される。基本操作処
理３ｂｓは、ＯＳ３ｓとの連携、言語認識会話エンジン
ＥＧ１およびアニメーションエンジンＥＧ２などを統括
して制御するプロセスである。

【００２３】言語認識会話エンジンＥＧ１は、言語認識
処理３ｇｎおよび会話生成処理３ｋｉを行うシステムで
あり、それ自体は公知である。言語認識処理３ｇｎは、
音声データＳＮＤ１を分析して、日本語または英語など
の自然言語によって表現される文字データＴＸＴａを抽
出するプロセスである。会話生成処理３ｋｉは、音声デ
ータＳＮＤ２または文字データＴＸＴ２を生成するプロ
セスである。

【００２４】音声データＳＮＤ２を作成するために、そ
れぞれの人物ＨＭＮについて、本人または代替となる人
の音声データを予め取得しておく。それらの音声データ
に基づいて、会話生成処理３ｋｉにより音声合成が行わ
れる。

【００２５】アニメーションエンジンＥＧ２は、動作制
御処理３ｄｓおよびアニメーション生成処理３ａｎを行
う。動作制御処理３ｄｓは、動作制御データＤＳＤを生
成する。動作制御データＤＳＤとは、第二のメッセージ
ＭＧ２がスピーカ２２ｂまたは表示装置２２ａに出力さ
れるタイミングに合わせて人物ＨＭＮの顔画像データＦ
ＧＤが動作するように制御するための制御情報である。
アニメーション生成処理３ａｎは、動作制御データＤＳ
Ｄおよび顔画像データＦＧＤに基づいて、顔アニメーシ
ョンデータＦＡＤを生成するプロセスである。

【００２６】これらのプログラムは、適宜、ＲＡＭ３１
ｂにロードされ、ＣＰＵ３１ａによって実行される。ま
た、これらの処理で用いられる第一のメッセージＭＧ
１、顔画像データＦＧＤ、第二のメッセージＭＧ２、動
作制御データＤＳＤ、および顔アニメーションデータＦ
ＡＤなども、必要に応じてＲＡＭ３１ｂに一時的に記憶
される。

【００２７】図４に示すように、磁気ディスク装置３７
には、顔画像データベースＦＤＢ、人物情報データベー
スＨＤＢ、および会話データベースＫＤＢが設けられて
いる。

【００２８】顔画像データベースＦＤＢには顔画像デー
タＦＧＤが、人物情報データベースＨＤＢには各人物Ｈ
ＭＮに関する性別、性格、年齢などの情報である人物情
報ＨＭＪが、会話データベースＫＤＢには会話文を生成
するための文法および単語である文章情報ＢＮＪおよび
単語情報ＴＮＪが、それぞれ蓄積されている。

【００２９】顔画像データＦＧＤは、人物ＨＭＮの頭部
を、口、目、鼻、耳などの構成部分、および皮膚、筋
肉、骨格などが動作可能なように構造化された３次元モ
デルによって表現したデータである（図８参照）。人物
ＨＭＮとして、俳優、歌手、その他の芸能人またはスタ
ー、スポーツ選手、政治家などの有名人、ユーザの先
祖、歴史上の人物など、種々の実在または架空の人物を
用いることができる。また人物のみでなく、動物、人
形、または漫画のキャラクタなどを用いることも可能で
ある。

【００３０】このような顔画像データＦＧＤは、次に示
す種々の公知の方法により作成することができる。例え
ば、まず、次に示す方法によって３次元データを取得す
る。（１）２次元で撮影された通常の顔写真に基づいて構造
化顔画像を推定する方法。（２）２次元の複数枚の画像、およびそれを最影したカ
メラと被写体との位置関係を示すデータから３次元形状
を算出する方法（ステレオ撮影法）。（３）３次元計測装置を用いて人物または像を３次元測
定する方法。（４）３次元ＣＧキャラクターを新規に作成する方法。

【００３１】次に、取得した３次元データを、構造化さ
れた３次元モデルに変換する。変換の方法として、例え
ば、特開平８−２９７７５１号、特開平１１−３２８４
４０号などに開示された方法、本出願人が提案する特願
２０００−９０６２９号などを用いることができる。

【００３２】このようにして、例えば皮膚の３次元モデ
ルを作成する。そして、皮膚の３次元モデルに、筋肉お
よび骨格を付けてさらに構造化しておけばなおよい。図
５に示すように、一覧表ＬＳＴは、ユーザの会話の相手
となる複数の人物ＨＭＮを格納したデータベースであっ
て、各人物ＨＭＮを識別するための人物番号ＮＵＭ、そ
の人物番号ＮＵＭに対応する人物の名称である人物名Ｎ
ＡＭまたは顔の画像の例を示すサンプル画像ＳＭＰなど
のフィールドを有する。人物ＨＭＮ１、人物ＨＭＮ２な
どのように、複数の人物ＨＭＮに関するデータが保存さ
れている。

【００３３】次に、人物ＨＭＮとの会話を行う際に、ア
ニメーション会話システム１で行われる処理および操作
について、フローチャートを参照して説明する。図６は
第一の実施形態におけるアニメーション会話システム１
の処理の流れを示すフローチャート、図７は顔アニメー
ションデータＦＡＤおよび第二のメッセージＭＧ２を生
成する処理の流れを示すフローチャート、図８は顔画像
データＦＧＤ１の例を示す図である。

【００３４】図６に示すように、まず、クライアント２
において、会話の相手となる人物ＨＭＮを、マウス２３
ａまたはキーボード２３ｂを操作して一覧表ＬＳＴから
選択する（＃１１）。このとき、選択された人物ＨＭＮ
についての人物番号ＮＵＭがサーバ３へ送信される。な
お、一覧表ＬＳＴは、ネットワーク４を介してサーバ３
から提供されてもよいし、図１に示すように予め磁気デ
ィスク装置２７に保存されていてもよいし、ＣＤ−ＲＯ
Ｍまたはフロッピィディスクなどの媒体によって提供さ
れてもよい。

【００３５】サーバ３において、会話の開始前における
人物ＨＭＮのアニメーションを生成する。まず、受信し
た人物番号ＮＵＭのデータに対応する顔画像データＦＧ
Ｄおよび人物情報ＨＭＪが、顔画像データベースＦＤＢ
および人物情報データベースＨＤＢから抽出される（＃
１２）。

【００３６】次に、抽出された顔画像データＦＧＤおよ
び人物情報ＨＭＪに基づいて、顔アニメーションデータ
ＦＡＤが生成され（＃１３）、クライアント２へ送信さ
れる（＃１４）。クライアント２において、受信した顔
アニメーションデータＦＡＤが、人物ＨＭＮの初期状態
として表示装置２２ａに表示される（＃１５）。

【００３７】なお、顔アニメーションデータＦＡＤの生
成とともに第二のメッセージＭＧ２を生成し、それらを
クライアント２へ送信し、クライアント２において顔ア
ニメーションデータＦＡＤを表示するとともに第二のメ
ッセージＭＧ２をスピーカ２２ｂから出力してもよい。

【００３８】顔アニメーションデータＦＡＤおよび第二
のメッセージＭＧ２の生成方法については、後で説明す
る。ユーザは、表示装置２２ａに表示された人物ＨＭＮ
を見て、その人物ＨＭＮに話し掛ける。すなわち、クラ
イアント２において、第一のメッセージＭＧ１がマイク
２３ｃまたはキーボード２３ｂなどによって入力され、
入力された第一のメッセージＭＧ１がサーバ３へ送信さ
れる（＃１６）。

【００３９】なお、ステップ＃１３ないし＃１５を省略
し、最初にユーザから問いかけるようにしてもよい。サ
ーバ３において、受信した第一のメッセージＭＧ１、顔
画像データＦＧＤおよび人物情報ＨＭＪなどに基づい
て、次の顔アニメーションデータＦＡＤおよび第二のメ
ッセージＭＧ２が生成され（＃１７）、生成されたデー
タがクライアント２に送信される（＃１８）。

【００４０】クライアント２において、顔アニメーショ
ンデータＦＡＤおよび第二のメッセージＭＧ２が、表示
装置２２ａまたはスピーカ２２ｂによって出力される
（＃１９）。

【００４１】人物ＨＭＮとの会話を中止するための切断
要求が出された場合は（＃２０でイエス）、処理は終了
し、切断要求が出されていない場合は、ステップ＃１６
に戻り、ユーザと人物ＨＭＮとの会話（対話）が繰り返
される。

【００４２】ここで、ステップ＃１３およびステップ＃
１７で行われるアニメーションなどの生成方法について
説明する。本実施形態で用いられる顔画像データＦＧＤ
は、口、目、鼻、耳などの構成部分、および皮膚、筋
肉、骨格などを動作可能に構造化して構成した３次元モ
デルである。

【００４３】図８に示す顔画像データＦＧＤ１では、皮
膚の３次元モデルが示されている。皮膚の３次元モデル
は、人物ＨＭＮの顔（頭部）の皮膚を構成する多数のポ
リゴン、および、顔の動きを制御するための複数の制御
点ＰＮＴからなる。

【００４４】図７に示すように、サーバ３において、受
信した第一のメッセージＭＧ１の認識を行う（＃３
１）。第一のメッセージＭＧ１が文字データＴＸＴ１か
らなる場合は、言語認識処理３ｇｎを実行する必要はな
い。第一のメッセージＭＧ１が音声データＳＮＤ１から
なる場合は、言語認識会話エンジンＥＧ１によって言語
認識処理３ｇｎを実行し、文字データＴＸＴａを生成す
る。ただし、ステップ＃１３のように第一のメッセージ
を受信していない場合、または会話が所定時間途切れた
場合は、ステップ＃３１を省略する。

【００４５】第一のメッセージＭＧ２に返答するため
に、第二のメッセージＭＧ２を生成する。すなわち、言
語認識会話エンジンＥＧ１によって会話生成処理３ｋｉ
を実行し、文字データＴＸＴ２を生成し（＃３２）、生
成された文字データＴＸＴ２から音声データＳＮＤ２を
生成する（＃３３）。

【００４６】文字データＴＸＴ２の生成は、文字データ
ＴＸＴａまたはＴＸＴ１、文章情報ＢＮＪおよび単語情
報ＴＮＪなどを参照して行われる。例えば、文字データ
ＴＸＴａまたはＴＸＴ１が「お元気ですか」という問い
かけである場合に、人物情報ＨＭＪを参照して、人物Ｈ
ＭＮが係る問いかけに応答しそうな文章情報ＢＮＪを会
話データベースＫＤＢから抽出し、単語情報ＴＮＪを文
章情報ＢＮＪに当てはめて、「はい、元気です、あなた
はお元気ですか」または「はい、しかし少し疲れていま
す、あなたは大丈夫ですか」などの文字データＴＸＴ２
を生成する。

【００４７】文字データＴＸＴ２から音声データＳＮＤ
２への変換は公知の技術を用いればよい。ただし、ステ
ップ＃１３のように第一のメッセージを受信していない
場合、または会話が所定時間途切れた場合は、ステップ
＃３２において、人物情報ＨＭＪ、文章情報ＢＮＪおよ
び単語情報ＴＮＪなどを参照し、人物ＨＭＮがユーザへ
問いかけるような文字データＴＸＴ２を生成する。例え
ば、「こんにちは」、「どうしたの」などである。

【００４８】アニメーションエンジンＥＧ２によって、
動作制御データＤＳＤを生成し（＃３４）、顔アニメー
ションデータＦＡＤを生成する（＃３５）。動作制御デ
ータＤＳＤは、動作制御処理３ｄｓを実行することによ
って得られる。

【００４９】例えば、従来の技術の項で述べた特開平１
０−２９３８６０号の技術を用いると、顔画像データＦ
ＧＤを音声データＳＮＤ２に同期させることができる。
そして、アニメーション生成処理３ａｎを実行すること
によって、動作制御データＤＳＤに基づいて顔画像デー
タＦＧＤを動作させ、顔アニメーションデータＦＡＤを
生成する。

【００５０】図８に示す顔画像データＦＧＤ１の場合に
は、制御点ＰＮＴを制御することによって顔画像データ
ＦＧＤを動作させる。顔アニメーションデータＦＡＤを
送信するには、例えばＭＰＥＧなどの種々の符号化方式
を用いて圧縮すればよい。

【００５１】上述のように、第一の実施形態では、顔ア
ニメーションデータＦＡＤをサーバ３により生成してク
ライアント２に送信することにより、クライアント２で
はそれを受信して表示するだけでよくなり、性能または
仕様が低いためにアニメーション生成の処理が困難なク
ライアント２であっても、人物ＨＭＮとの会話を行うこ
とが可能となる。〔第二の実施形態〕第二の実施形態において、アニメー
ション会話システムの全体の構成は第一の実施形態の場
合と同様である。しかし、クライアント２およびサーバ
３の各磁気ディスク装置２７，３７に記憶されるプログ
ラム、および処理装置２１，３１による処理内容が第一
の実施形態の場合と異なる。

【００５２】すなわち、第一の実施形態では、サーバ３
の顔画像データベースＦＤＢから抽出した顔画像データ
ＦＧＤを、サーバ３のＲＡＭ３１ｂまたは磁気ディスク
装置３７に一時的に記憶したが、第二の実施形態では、
顔画像データＦＧＤをクライアント２に送信し、クライ
アント２のＲＡＭ２１ｂまたは磁気ディスク装置２７に
一時的に記憶する。そして、クライアント２の側におい
て、サーバ３から送信される動作制御データＤＳＤに基
づいて、顔アニメーションデータＦＡＤを生成する。

【００５３】図９は第二の実施形態における磁気ディス
ク装置２７に記憶されているプログラムなどの例を示す
図、図１０は第二の実施形態における磁気ディスク装置
３７に記憶されているプログラムなどの例を示す図であ
る。

【００５４】これらの図において、第一の実施形態の場
合と同じ機能を有する部分には同じ符号を付して説明を
省略しまたは簡略化する。以下同様である。図９に示す
ように、磁気ディスク装置２７には、人物ＨＭＮの顔の
アニメーションを生成する手段であるアニメーション生
成処理３ａｎ、サーバ３から送信された顔画像データＦ
ＧＤおよび動作制御データＤＳＤが記憶される。

【００５５】図１０に示すように、磁気ディスク装置３
７に記憶されるサーバ会話プログラム３ｐは、第一の実
施形態と同様に、基本操作処理３ｂｓ、言語認識会話エ
ンジンＥＧ１、およびアニメーションエンジンＥＧ２に
よって構成される。ただし、アニメーションエンジンＥ
Ｇ２は、動作制御処理３ｄｓを行うが、アニメーション
生成処理は行わない。

【００５６】次に、人物ＨＭＮとの会話を行う際に、ア
ニメーション会話システム１で行われる処理および操作
について、フローチャートを参照して説明する。図１１
は第二の実施形態におけるアニメーション会話システム
１の処理の流れを示すフローチャート、図１２は動作制
御データＤＳＤおよび第二のメッセージＭＧ２を生成す
る処理の流れを示すフローチャートである。

【００５７】図１１に示すように、クライアント２にお
いて、会話の相手となる人物ＨＭＮを一覧表ＬＳＴから
選択する（＃４１）。このとき、選択された人物ＨＭＮ
についての人物番号ＮＵＭがサーバ３へ送信される。人
物番号ＮＵＭを受信したサーバ３は、対応する顔画像デ
ータＦＧＤを顔画像データベースＦＤＢから読み出し、
クライアント２へ送信する（＃４２）。このような会話
のための前処理は、背景処理として自動的に行われる。

【００５８】サーバ３において、動作制御データＤＳＤ
が生成され（＃４３）、クライアント２へ送信される
（＃４４）。クライアント２において、顔画像データＦ
ＧＤを動作制御データＤＳＤに基づいて動作させ、これ
によって顔アニメーションデータＦＡＤを生成し、これ
と同時に表示装置２２ａに表示する（＃４５）。

【００５９】なお、サーバ３において、動作制御データ
ＤＳＤの生成とともに第二のメッセージＭＧ２を生成
し、それらをクライアント２へ送信し、クライアント２
において顔アニメーションデータＦＡＤを表示するとと
もに第二のメッセージＭＧ２をスピーカ２２ｂから出力
してもよい。

【００６０】クライアント２において、第一のメッセー
ジＭＧ１が入力され、サーバ３へ送信される（＃４
６）。サーバ３において、第一のメッセージＭＧ１およ
び人物情報ＨＭＪなどに基づいて、動作制御データＤＳ
Ｄおよび第二のメッセージＭＧ２が生成され（＃４
７）、生成されたデータがクライアント２へ送信される
（＃４８）。

【００６１】そして、顔画像データＦＧＤを動作制御デ
ータＤＳＤに基づいて動作させながら表示装置２２ａに
出力し、これと同期して第二のメッセージＭＧ２を表示
装置２２ａまたはスピーカ２２ｂへ出力する（＃４
９）。

【００６２】切断要求が出されるまで、ユーザと人物Ｈ
ＭＮとの会話が繰り返される（＃４６〜５０）。ここ
で、図１２を参照して、ステップ＃４３およびステップ
＃４７で行われる動作制御データなどの生成方法につい
て説明する。

【００６３】サーバ３において、受信した第一のメッセ
ージＭＧ１の認識を行う（＃６１）。文字データＴＸＴ
２を生成し（＃６２）、生成された文字データＴＸＴ２
から音声データＳＮＤ２を生成し、第二のメッセージＭ
Ｇ２を生成する（＃６３）。そして、アニメーションエ
ンジンＥＧ２によって、動作制御データＤＳＤを生成す
る（＃６４）。

【００６４】上述のように、第二の実施形態では、サー
バ３で抽出した顔画像データＦＧＤをクライアント２に
送信し、クライアント２において、動作制御データＤＳ
Ｄに基づいて顔画像データＦＧＤを動作させてアニメー
ションを生成する。これにより、サーバ３とクライアン
ト２との間のデータ通信量を減少させ、高速なアニメー
ションの表示が可能となる。〔第三の実施形態〕第三の実施形態において、アニメー
ション会話システムの全体の構成は第二の実施形態の場
合と同様である。磁気ディスク装置２７，３７に記憶さ
れるプログラムの内容は、図９および図１０に示す第二
の実施形態の場合と大体同じである。しかし、クライア
ント２およびサーバ３の各磁気ディスク装置２７，３７
に記憶されるデータが第二の実施形態の場合と異なり、
これによる処理内容が若干異なる。

【００６５】すなわち、第二の実施形態では、顔画像デ
ータベースＦＤＢについてもクライアント２に設け、ク
ライアント２において、顔画像データＦＧＤの抽出およ
び一時記憶、および顔アニメーションデータの生成を行
う。サーバ３は、クライアント２から送信される第一の
メッセージＭＧ１に基づいて、動作制御データＤＳＤお
よび第二のメッセージＭＧ２の生成を行う。

【００６６】図１３は、第三の実施形態におけるクライ
アント２の磁気ディスク装置２７およびサーバ３の磁気
ディスク装置３７に設けられているデータベースなどの
例を示す図である。

【００６７】図１３に示すように、顔画像データベース
ＦＤＢは、サーバ３の磁気ディスク装置３７には設けら
れておらず、クライアント２の磁気ディスク装置２７の
みに設けられている。

【００６８】第三の実施形態におけるアニメーション会
話システム１の処理内容は、第二の実施形態についての
図１１のフローチャートとほぼ同じである。次に相違点
のみについて説明する。

【００６９】図１１のステップ＃４２において、顔画像
データＦＧＤを、クライアント２の磁気ディスク装置２
７に設けられている顔画像データベースＦＤＢから読み
出し、そのまま一時的に記憶する。他への送信は行わな
い。その他の処理は同じである。

【００７０】上述のように、第三の実施形態では、顔画
像データベースＦＤＢをクライアント２の磁気ディスク
装置２に設けることにより、サーバ３から顔画像データ
ＦＧＤを送信する必要がなくなり、会話の開始までに要
する時間を短縮することが可能となる。

【００７１】上に説明した３つの実施形態のように、サ
ーバ３によって第二のメッセージＭＧ２を生成すること
により、クライアント２の処理の負荷を軽減させて、遠
隔的に人物ＨＭＮとの会話をすることができる。

【００７２】顔画像データＦＧＤが３次元的に構造化さ
れているため、顔の動きや感情表現が豊かであり且つ自
然である。ユーザの話し掛けを理解した顔アニメーショ
ンが、３次元画像による感情表現と音声とを交えて返事
をしてくれるので、ユーザは双方向対話を楽しむことが
できる。

【００７３】また、人物ＨＭＮを選択することにより、
歴史上の人物や血縁の故人との対話サービスを実現する
ことができる。例えば、顔画像データベースＦＤＢの中
から人物ＨＭＮとして「ご先祖」を選択することによっ
て、ユーザは今は亡きご先祖の顔アニメーションとの対
話を日常的に楽しむことができる。

【００７４】人物ＨＭＮが実在の有名人である場合に、
有名人の実生活を煩わせることなく、有名人と多数のフ
ァンとの対話を実現することができる。言語認識会話エ
ンジンＥＧ１において、先祖、有名人、歴史上の人物な
どのように、人物ＨＭＮの種類に応じて会話の内容を設
定しておくことによって、ユーザと人物ＨＭＮとの間で
内容のある会話を行うことができる。

【００７５】しかも、サーバ３を常時稼動させておくこ
とにより、ユーザは、時間および場所を問うことなく、
人物ＨＭＮとの会話を楽しむことができる。また、会話
データベースＫＤＢのメンテナンスをサーバ３で行うこ
とができるので、クライアント２で特別なメンテナンス
を行うことなく、最新の話題や流行の言葉などに容易に
対応することができる。

【００７６】上に述べた実施形態においては、人物ＨＭ
Ｎの音声の生成をサーバ３によって行ったが、文字デー
タＴＸＴ２のみをサーバ３で生成し、音声データＳＮＤ
２をクライアント２で生成してもよい。

【００７７】上に述べた実施形態において、サーバ３お
よびクライアント２として、ワークステーションまたは
パーソナルコンピュータなどを用いることができる。ま
た、クライアント３としては、通信機能を有した機器、
例えば、携帯電話機、モバイル機器、その他の種々の機
器を用いることができる。

【００７８】その他、アニメーション会話システム１の
全体または各部の構成、回路、処理内容、処理順序、会
話の内容などは、本発明の趣旨に沿って適宜変更するこ
とができる。

【００７９】

【発明の効果】本発明によると、コンピュータによって
仮想した実在または架空の人物等との会話を遠隔的に行
うことができる。サーバによって第二のメッセージを生
成するので、クライアントの処理の負荷を軽減させるこ
とができる。

【００８０】請求項２の発明によると、データ通信量を
減少させ、高速なアニメーションの表示を行うことがで
きる。請求項３の発明によると、会話の開始までに要す
る時間を短縮することができる。

【図面の簡単な説明】

【図１】本発明に係るアニメーション会話システムの全
体の構成を示すブロック図である。

【図２】第一の実施形態におけるクライアント側に記憶
されているプログラムを示す図である。

【図３】第一の実施形態におけるサーバ側に記憶されて
いるプログラムを示す図である。

【図４】サーバの磁気ディスク装置に設けられているデ
ータベースを示す図である。

【図５】人物の一覧表の例を示す図である。

【図６】第一の実施形態におけるアニメーション会話シ
ステムの処理の流れを示すフローチャートである。

【図７】顔アニメーションデータおよび第二のメッセー
ジを生成する処理の流れを示すフローチャートである。

【図８】顔画像データの例を示す図である。

【図９】第二の実施形態におけるクライアント側に記憶
されているプログラムを示す図である。

【図１０】第二の実施形態におけるサーバ側に記憶され
ているプログラムを示す図である。

【図１１】第二の実施形態におけるアニメーション会話
システムの処理の流れを示すフローチャートである。

【図１２】動作制御データおよび第二のメッセージを生
成する処理の流れを示すフローチャートである。

【図１３】第三の実施形態におけるクライアントおよび
サーバのそれぞれの磁気ディスク装置に記憶されている
データベースを示す図である。

【符号の説明】

１アニメーション会話システム２クライアント２１処理装置２２ａ表示装置（出力装置）２２ｂスピーカ（出力装置）２３ａマウス（入力装置）２３ｂキーボード（入力装置）２３ｃマイク（入力装置）２４通信制御装置３サーバ３１処理装置３４通信制御装置ＦＤＢ顔画像データベース（記憶手段）ＥＧ１言語認識会話エンジン（第二のメッセージを生
成する手段）ＥＧ２アニメーションエンジン（動作制御データを生
成する手段、顔アニメーションを生成する手段）３ａｎアニメーション生成処理（顔アニメーションを
生成する手段）４ネットワークＨＭＮ人物ＭＧ１第一のメッセージＭＧ２第二のメッセージＦＡＤ顔アニメーションデータ

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｎ 7/14 Ｇ１０Ｌ 3/00 ５７１ＵＦターム(参考） 5B050 BA08 BA12 CA07 CA08 EA24 FA10 5C064 AA06 AB04 AC05 AC06 AC12 AC16 AC17 AD08 AD09 AD13 5D015 KK02 KK04 LL06 LL08 5D045 AA20 AB26

Claims

【特許請求の範囲】

【請求項１】実在または架空の人物、動物、人形、また
はキャラクタなどをコンピュータによって仮想し、これ
ら人物等との会話を行えるようにしたアニメーション会
話システムであって、クライアントおよびサーバを有し、前記クライアントには、ユーザから前記人物等へのメッ
セージである第一のメッセージを入力する入力装置と、
当該第一のメッセージを送信する手段と、前記人物等か
らユーザへのメッセージである第二のメッセージおよび
前記人物等の顔アニメーションを受信する手段と、当該
第二のメッセージをユーザに出力する出力装置と、当該
顔アニメーションを表示する表示装置とが設けられ、前記サーバには、前記人物等の顔画像データを記憶した
記憶手段と、前記第一のメッセージを受信する手段と、
前記第二のメッセージを生成する手段と、前記第二のメ
ッセージに合わせて顔画像データを動作させる動作制御
データを生成する手段と、当該動作制御データおよび前
記顔画像データに基づいて前記顔アニメーションを生成
する手段と、前記第二のメッセージおよび前記顔アニメ
ーションを送信する手段とが設けられている、ことを特徴とするアニメーション会話システム。
【請求項２】実在または架空の人物、動物、人形、また
はキャラクタなどをコンピュータによって仮想し、これ
ら人物等との会話を行えるようにしたアニメーション会
話システムであって、クライアントおよびサーバを有し、前記クライアントには、ユーザから前記人物等へのメッ
セージである第一のメッセージを入力する入力装置と、
当該第一のメッセージを送信する手段と、前記人物等か
らユーザへのメッセージである第二のメッセージをユー
ザに出力する出力装置と、当該第二のメッセージ、前記
人物等の顔を画像データ化した顔画像データ、および当
該第二のメッセージに合わせて顔画像データを動作させ
る動作制御データを受信する手段と、当該動作制御デー
タおよび当該顔画像データに基づいて前記人物等の顔ア
ニメーションを生成する手段と、当該顔アニメーション
を表示する表示装置とが設けられ、前記サーバには、前記顔画像データを記憶した記憶手段
と、前記第一のメッセージを受信する手段と、前記第二
のメッセージを生成する手段と、前記動作制御データを
生成する手段と、前記第二のメッセージおよび前記動作
制御データを送信する手段とが設けられている、ことを特徴とするアニメーション会話システム。
【請求項３】実在または架空の人物、動物、人形、また
はキャラクタなどをコンピュータによって仮想し、これ
ら人物等との会話を行えるようにしたアニメーション会
話システムであって、クライアントおよびサーバを有し、前記クライアントには、前記人物等の顔画像データを記
憶した記憶手段と、ユーザから前記人物等へのメッセー
ジである第一のメッセージを入力する入力装置と、当該
第一のメッセージを送信する手段と、前記人物等からユ
ーザへのメッセージである第二のメッセージをユーザに
出力する出力装置と、当該第二のメッセージ、前記顔画
像データ、および当該第二のメッセージに合わせて顔画
像データを動作させる動作制御データを受信する手段
と、当該動作制御データおよび当該顔画像データに基づ
いて前記人物等の顔アニメーションを生成する手段と、
当該顔アニメーションを表示する表示装置とが設けら
れ、前記サーバには、前記第一のメッセージを受信する手段
と、前記第二のメッセージを生成する手段と、前記動作
制御データを生成する手段と、前記第二のメッセージお
よび前記動作制御データを送信する手段とが設けられて
いる、ことを特徴とするアニメーション会話システム。
【請求項４】実在または架空の人物、動物、人形、また
はキャラクタなどをコンピュータによって仮想し、これ
ら人物等との会話を行えるようにしたアニメーション会
話システムに用いられるサーバであって、前記人物等の顔画像データを記憶した記憶手段と、ユーザから前記人物等へのメッセージである第一のメッ
セージを受信する手段と、前記人物等からユーザへのメッセージである第二のメッ
セージを生成する手段と、前記第二のメッセージの出力に合わせて顔画像データを
動作させる動作制御データを生成する手段と、前記動作制御データおよび前記顔画像データに基づいて
前記顔アニメーションを生成する手段と、前記第二のメッセージおよび前記顔アニメーションを送
信する手段と、を有してなることを特徴とするサーバ。
【請求項５】実在または架空の人物、動物、人形、また
はキャラクタなどをコンピュータによって仮想し、これ
ら人物等との会話を行えるようにしたアニメーション会
話システムに用いられるサーバであって、前記人物等の顔画像データを記憶した記憶手段と、ユーザから前記人物等へのメッセージである第一のメッ
セージを受信する手段と、前記人物等からユーザへのメッセージである第二のメッ
セージを生成する手段と、前記第二のメッセージの出力に合わせて顔画像データを
動作させる動作制御データを生成する手段と、前記第二のメッセージおよび前記動作制御データを送信
する手段と、を有してなることを特徴とするサーバ。
【請求項６】実在または架空の人物、動物、人形、また
はキャラクタなどをコンピュータによって仮想し、これ
ら人物等との会話を行えるようにしたアニメーション会
話システムに用いられるサーバであって、ユーザから前記人物等へのメッセージである第一のメッ
セージを受信する手段と、前記人物等からユーザへのメッセージである第二のメッ
セージを生成する手段と、前記第二のメッセージの出力に合わせて前記人物等の顔
画像データを動作させる動作制御データを生成する手段
と、前記第二のメッセージおよび前記動作制御データを送信
する手段と、を有してなることを特徴とするサーバ。
【請求項７】実在または架空の人物、動物、人形、また
はキャラクタなどをコンピュータによって仮想し、これ
ら人物等との会話を行えるようにしたアニメーション会
話システムに用いられるクライアントであって、ユーザから前記人物等へのメッセージである第一のメッ
セージを入力する入力装置と、当該第一のメッセージを送信する手段と、前記人物等からユーザへのメッセージである第二のメッ
セージをユーザに出力する出力装置と、前記第二のメッセージ、前記人物等の顔を画像データ化
した顔画像データ、および前記第二のメッセージの出力
に合わせて顔画像データを動作させる動作制御データを
受信する手段と、前記動作制御データおよび前記顔画像データに基づいて
前記人物等の顔アニメーションを生成する手段と、前記顔アニメーションを表示する表示装置と、を有してなることを特徴とするクライアント。
【請求項８】前記顔画像データは、動作可能に構造化さ
れた３次元モデルであり、前記顔アニメーションを生成する手段は、前記動作制御
データに基づいて３次元モデルの構造化された部分を動
作させる、請求項１、２、３、４、または７のいずれかに記載のシ
ステム、サーバ、またはクライアント。