JP2002041084A

JP2002041084A - 対話処理システム

Info

Publication number: JP2002041084A
Application number: JP2000225091A
Authority: JP
Inventors: Tsukimi Wakabayashi; つきみ若林
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2000-07-26
Filing date: 2000-07-26
Publication date: 2002-02-08

Abstract

(57)【要約】【課題】使用者に応じた話し方及び内容の発話を行う
と共に、その時々の使用者の状況に応じた話し方及び内
容の発話を行ことが出来る親しみ易い対話処理システム
を提供すること。【解決手段】使用者情報及び使用者発話情報に基づい
て、応答発話の内容を決定する発話内容決定手段４と、
使用者情報、使用者発話情報、及び前記応答発話の内容
に基づいて、応答発話の特徴を設定する発話特徴決定手
段５と、前記決定された応答発話の内容、及び前記設定
された応答発話の特徴に基づいて発話出力する発話手段
６とを設ける。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、人間と対話するユ
ーザインタフェースの一つである対話処理システムに関
し、特に、自然言語で人間と対話するための応答発話生
成方法に特徴を有する対話処理システムに関するもので
ある。

【０００２】

【従来の技術】従来の対話型ユーザインタフェースにお
いては、使用者を個人として扱い、使用者に応じて言葉
遣いや声の調子を変えることによって、話し掛けている
相手が誰であるかを使用者に知らせたり親しみ易さを与
えることが難しかった。これを解決する方法として、使
用者の年齢・性別・心理的距離等の属性を推定し、使用
者の属性に基づいて言葉使いや声の調子、話す内容を変
えることの出来る発話方法が特開平１１−１７５０８１
として提案されている。

【０００３】

【発明が解決しようとする課題】しかしながら、上記提
案の方法においては、使用者属性のみに着目しており、
実際の対話場面における使用者の反応をフィードバック
することが考慮されていない。年代、性別、使用回数等
の属性を同じくする使用者であっても、話し方や話題の
好みはそれぞれ異なり、また、その時の気分によっても
異なるものとなる。これらは使用者自身の話し方や態度
に反映されるものであり、使用者属性のみでは個々の使
用者やその時々に適した応答発話の生成は困難である。
従って、使用者の話し方や態度を基にその時々の使用者
に相応しい発話応答を行うインタフェースを提供するこ
とが課題であった。

【０００４】そこで本発明は、使用者属性に加え、使用
者の発話内容や話し方（使用者の発話の属性情報）とシ
ステムの発話応答の対応から使用者プロファイルを作成
し、使用者に応じた話し方及び内容の発話を行うと共
に、その時々の使用者の状況に応じた話し方及び内容の
発話を行ことが出来る親しみ易い対話処理システムを提
供することを目的とする。

【０００５】

【課題を解決するための手段】そこで、上記課題を解決
するために本発明は、下記の対話処理システムを提供す
るものである。（１）使用者の属性情報を推定する使用者特徴推定手
段と、前記使用者の発話から得られる言語的な意味表現
情報を含む前記使用者の発話の属性情報を推定する使用
者発話特徴推定手段と、前記使用者の属性情報及び前記
使用者の発話の属性情報を使用者毎に格納する使用者プ
ロファイル格納手段と、前記使用者の属性情報及び前記
使用者の発話の属性情報に基づいて、応答発話の内容を
決定する発話内容決定手段と、前記使用者の属性情報、
前記使用者の発話の属性情報、及び前記応答発話の内容
に基づいて、応答発話の特徴を設定する発話特徴決定手
段と、前記決定された応答発話の内容、及び前記設定さ
れた応答発話の特徴に基づいて発話出力する発話手段
と、を備えたことを特徴とする対話処理システム。（２）前記使用者発話特徴推定手段で推定される前記
使用者の発話の属性情報は、前記言語的な意味表現情報
に加え、前記使用者の発話から得られる韻律情報及び言
葉遣い情報の内の少なくとも一方の情報を含むことを特
徴とする請求項１記載の対話処理システム。（３）前記使用者の属性情報及び前記使用者の発話の
属性情報は、使用者の使用毎に前記使用者プロファイル
格納手段に追加格納され、前記発話内容決定手段が前記
応答発話の内容を決定する動作、及び前記発話特徴決定
手段が前記応答発話の特徴を決定する動作の内の少なく
とも一方の動作が、前記格納される使用者の属性情報及
び使用者の発話の属性情報の変化に基づいて行われるこ
とを特徴とする請求項１または２記載の対話処理システ
ム。

【０００６】

【発明の実施の形態】本発明の実施の形態を図を用いて
説明する。図１に本発明の対話処理システムの一実施例
の基本構成を示す。本対話処理システムは使用者特徴推
定手段１、使用者発話特徴推定手段２、使用者プロファ
イル格納手段３、発話内容決定手段４、発話特徴決定手
段５、発話手段６を備えている。

【０００７】使用者発話特徴推定手段２では、使用者の
発話から言語解析を行い使用者の発話内容を推定すると
共に使用者の言葉遣い、口調等の発話特徴を推定する。
これらの情報は使用者発話情報（使用者の発話の属性情
報）として使用者プロファイル格納手段３に格納され、
発話内容決定手段４及び発話特徴決定手段５に送られ
る。使用者特徴推定手段１では、使用者の外観から性別
・年代等の特徴を推定する。使用者がリピーターの場合
は、使用者を特定する。これらの情報は使用者情報（使
用者の属性情報）として使用者プロファイル格納手段３
に格納され、発話内容決定手段４及び発話特徴決定手段
５に送られる。使用者プロファイル格納手段３では、使
用者発話情報と使用者情報を格納し、発話内容決定手段
４及び発話特徴決定手段５に送る。発話内容決定手段４
では、使用者発話情報と使用者情報を元に発話内容を決
定する。発話内容は発話内容情報として、発話特徴決定
手段５及び発話手段６に送られる。発話特徴決定手段５
では、使用者発話情報と使用者情報と発話内容情報を元
に、現在の使用者及び発話内容に適した言葉遣い、口調
等の特徴を決定する。これらの特徴は発話特徴情報とし
て発話手段６に送られる。発話手段６では、発話内容情
報と発話特徴情報を元に、自然言語による発話を生成し
使用者に対し応答出力する。

【０００８】本発明の一実施例のより詳しい構成を図２
に示す。使用者発話特徴推定手段２には音声入力手段２
３、音声言語解析手段２２、韻律推定手段２５、言葉遣
い推定手段２４、言語解析辞書２１、韻律照合辞書２
７、言葉遣い照合辞書２６を用いる。使用者特徴推定手
段１には画像入力手段１１、使用者識別手段１３、年齢
推定手段１４、性別推定手段１５、年齢照合辞書１６、
性別照合辞書１７、使用者照合辞書１２を用いる。使用
者プロファイル格納手段３には、対話履歴格納手段３
３、使用者発話特徴格納手段３１、使用者情報格納手段
３２を用いる。

【０００９】発話内容決定手段４には発話内容選択手段
４１、発話内容データベース４２を用いる。発話特徴決
定手段５には発話特徴設定手段５１、発話特徴データベ
ース５２を用いる。発話手段６には発話文生成手段６
１、発話音声生成手段６３、音声出力手段６５、発話画
像生成手段６２、画像出力手段６４を用いる。

【００１０】以下に、これらの構成を用いた対話処理の
流れを説明する。使用者特徴推定手段１では、使用者の
映った画像から、外見から使用者を特定すると共に、使
用者の特徴を推定する。使用者がシステムの前に姿を現
わすと、画像入力手段１１から使用者の画像を入力し、
人物画像データを使用者識別手段１３、年齢推定手段１
４、性別推定手段１５に送る。使用者識別手段１３で
は、人物画像データを使用者照合辞書１２と照合し、既
に使用者登録された使用者であれば、使用者を特定し、
使用者識別情報を使用者情報格納手段３２に格納すると
共に年齢推定手段１４及び性別推定手段１５に送る。新
規の使用者であれば新しい使用者識別情報を生成し、使
用者情報格納手段３２に格納する。使用者識別情報は、
発話内容決定手段４及び発話特徴決定手段５に送られ
る。

【００１１】人物画像データの内、使用者識別に用いる
照合情報は使用者照合辞書１２に蓄積される。年齢推定
手段１４では、人物画像データを年齢照合辞書１６と照
合して年齢を推定し、使用者情報格納手段３２に格納す
る。使用者識別情報が与えられている場合は、使用者情
報格納手段３２から年齢情報を取り出し参照する。推定
年齢が取り出した年齢情報と異なる場合は、使用者情報
格納手段３２に年齢情報を送り年齢情報を追加する。こ
の推定年齢変化情報は、発話内容決定時に使用可能とな
る。性別推定手段１５では、人物画像データを性別照合
辞書１７と照合して性別を推定し、使用者情報格納手段
３２に格納する。使用者識別情報が与えられている場合
は、使用者情報格納手段３２から性別情報を取り出し参
照する。推定性別が取り出した性別情報と異なる場合
は、使用者情報格納手段３２に推定した性別情報を送り
性別情報を追加する。この推定性別変化情報は、発話内
容決定時に使用可能となる。

【００１２】使用者発話特徴推定手段２では、使用者の
発話音声から発話の内容及び話し方の特徴を推定する。
使用者がシステムに話し掛けると音声入力手段２３から
使用者の発話音声を入力し音声データとして音声言語解
析手段２２、韻律推定手段２５に送る。音声言語解析手
段２２では、言語解析辞書２１を用いて使用者の発話を
音声認識・解析し使用者発話内容情報を推定する。省略
表現等を含む発話やいろいろな意味に解釈可能な発話に
関しては、対話履歴格納手段３３から過去の対話内容を
取り出し、意味を補って解析する。使用者発話内容情報
は対話履歴格納手段３３に格納する。解析結果の形態素
情報は韻律推定手段２５及び言葉遣い推定手段２４に送
られる。韻律推定手段２５では、音声データと形態素情
報から韻律照合辞書２７を用いて使用者の発話音声の大
きさ、速さ、ピッチ等を抽出して韻律的な特徴を推定
し、使用者発話特徴格納手段３１に格納する。言葉遣い
推定手段２４では形態素情報から言葉遣い照合辞書２６
を用いて使用者の言葉遣いの特徴を推定し、使用者発話
特徴格納手段３１に格納する。言葉遣いの特徴の例とし
ては、敬語、若者言葉、方言等が挙げられる。

【００１３】使用者プロファイル格納手段３では、対話
履歴格納手段３３、使用者発話特徴格納手段３１、使用
者情報格納手段３２への格納情報を相互に対応づけて格
納する。それぞれの格納情報は、発話内容決定手段４及
び発話特徴決定手段５から参照することが出来る。

【００１４】発話内容決定手段４では、使用者識別情報
を元に対話履歴格納手段３３より過去の対話内容情報及
び使用者発話内容情報を、使用者発話特徴格納手段３１
より使用者発話特徴情報を、使用者情報格納手段３２よ
り使用者情報を取り出す。発話内容選択手段４１で、こ
れらの情報を元に発話内容データベース４２から発話内
容を選択する。発話内容は対話履歴格納手段３５に格納
される。

【００１５】発話特徴決定手段５では、使用者識別情報
を元に対話履歴格納手段３３より過去の対話内容情報及
び使用者発話内容情報に加え、発話内容決定手段４で決
定した発話内容情報、使用者発話特徴格納手段３１より
使用者発話特徴情報、使用者情報格納手段３２より使用
者情報を取り出す。発話特徴設定手段５１で、これらの
情報を元に発話特徴データベース５２から発話特徴パラ
メータを取り出し発話特徴を設定し、発話内容情報と共
に発話手段６に送る。発話特徴情報はまた、対話履歴格
納手段３３に格納される。

【００１６】発話手段６では、発話情報を元に発話出力
を行う。発話文生成手段６１では、発話情報を元に実際
に発話する文を生成する。発話音声生成手段６３では、
発話文を発話特徴情報で設定された発話特徴を有する音
声とし、音声出力手段６５から音声出力する。発話画像
生成手段６２では、発話文と発話特徴情報から、発話内
容及び発話特徴に適した画像、例えば、発話特徴に合っ
た表情で話すエージェントの画像等を生成し、画像出力
手段６４より出力する。

【００１７】この方法による発話内容決定の例として、
使用者に適すると予測される書籍を紹介する情報案内シ
ステムの応答発話生成を考える。初めて使用する使用者
の場合は、推定年齢、性別、発話特徴から、同じ特徴を
持つ使用者の平均的な好みを初期値として与え、既に使
用したことのある使用者の場合は、前回迄の使用者情報
及び対話履歴を元に初期値を設定する。発話内容及び発
話特徴はこの初期値を元にして、対話の流れ即ち対話履
歴と使用者の発話特徴及びその変化により決定する。シ
ステムは使用者の話し方に合わせた言葉遣いや韻律で話
すことが出来る。以前に使用したことのある使用者に関
して前回と発話特徴が変化している場合、応答の発話内
容及び発話特徴はこの変化から使用者の状態を推測し、
これを反映したものとなる。

【００１８】例えば、使用者が従来に比べ小さく低い声
で不明瞭に話した場合、使用者が元気が無さそうだと判
断し、使用者の好みの初期値及び対話により得られた条
件に加え、元気の出る内容の書籍を紹介することが出来
る。或いは使用者が従来に比べ早口で丁寧でない言葉遣
いで話した場合、使用者が忙しそうだと判断し、使用者
の好みの初期値及び対話により得られた条件に加え、携
帯に適した短編の文庫本を紹介することが出来る。

【００１９】

【発明の効果】以上の通り、本発明の対話処理システム
は、使用者属性に加え、使用者の発話内容や話し方（使
用者の発話属性）から使用者プロファイルを作成し、こ
の情報を元に発話内容及び発話の仕方を決めることによ
り、使用者に応じた内容及び話し方の発話を行うことが
出来る。更に、本発明の対話処理システムは、格納され
た情報の変化を元に発話内容及び発話の仕方を決めるこ
とにより、その時々の使用者の状態や気分に応じた内容
及び話し方の発話を行うことが出来る。これにより、使
用者一人一人のその時々に応じた応答を行う、親しみ易
い対話型ユーザインタフェースを提供することが出来
る。

【図面の簡単な説明】

【図１】対話処理システムの一実施例の基本構成を示す
図である。

【図２】対話処理システムの一実施例の詳細な構成を示
す図である。

【符号の説明】

１使用者特徴推定手段２使用者発話特徴推定手段３使用者プロファイル格納手段４発話内容決定手段５発話特徴決定手段６発話手段

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/00 Ｇ１０Ｌ 3/00 ５５１Ｐ 15/28

Claims

【特許請求の範囲】

【請求項１】使用者の属性情報を推定する使用者特徴推
定手段と、前記使用者の発話から得られる言語的な意味表現情報を
含む前記使用者の発話の属性情報を推定する使用者発話
特徴推定手段と、前記使用者の属性情報及び前記使用者の発話の属性情報
を使用者毎に格納する使用者プロファイル格納手段と、前記使用者の属性情報及び前記使用者の発話の属性情報
に基づいて、応答発話の内容を決定する発話内容決定手
段と、前記使用者の属性情報、前記使用者の発話の属性情報、
及び前記応答発話の内容に基づいて、応答発話の特徴を
設定する発話特徴決定手段と、前記決定された応答発話の内容、及び前記設定された応
答発話の特徴に基づいて発話出力する発話手段と、を備
えたことを特徴とする対話処理システム。
【請求項２】前記使用者発話特徴推定手段で推定される
前記使用者の発話の属性情報は、前記言語的な意味表現
情報に加え、前記使用者の発話から得られる韻律情報及
び言葉遣い情報の内の少なくとも一方の情報を含むこと
を特徴とする請求項１記載の対話処理システム。
【請求項３】前記使用者の属性情報及び前記使用者の発
話の属性情報は、使用者の使用毎に前記使用者プロファ
イル格納手段に追加格納され、前記発話内容決定手段が前記応答発話の内容を決定する
動作、及び前記発話特徴決定手段が前記応答発話の特徴
を決定する動作の内の少なくとも一方の動作が、前記格
納される使用者の属性情報及び使用者の発話の属性情報
の変化に基づいて行われることを特徴とする請求項１ま
たは２記載の対話処理システム。