JP2002132291A

JP2002132291A - 自然言語対話処理装置およびその方法並びにその記憶媒体

Info

Publication number: JP2002132291A
Application number: JP2000326575A
Authority: JP
Inventors: Koji Sakamoto; 浩司阪本; Haruhiro Kuboyama; 晴弘久保山; Masaru Nakamori; 勝中森; Akira Baba; 朗馬場; Priotti Paulo; パウロ・プリオッティ
Original assignee: Matsushita Electric Works Ltd
Current assignee: Panasonic Electric Works Co Ltd
Priority date: 2000-10-26
Filing date: 2000-10-26
Publication date: 2002-05-09

Abstract

(57)【要約】【課題】聴覚障害者の文字入力待ち時間を無くし、円
滑な対話をおこなうことができる自然言語対話処理装置
を提供する。【解決手段】マイク１から入力した相手話者の発話を
音声認識部２で認識し多結果を発話文表示部５によりタ
ッチパネルディスプレイ６に表示する。一方、対話文デ
ータベース４より複数の応答文の候補を読み出し、応答
文リスト表示部７によりタッチパネルディスプレイ６に
表示する。利用者が選択しタッチパネルディスプレイ６
から入力した応答文は、応答文認識部８で認識され、音
声合成部９で音声合成されてスピーカ１０から出力され
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、聴覚障害者と健常
者との間で自然言語の音声による対話を支援する自然言
語対話処理装置およびその方法並びにその記憶媒体に関
する。

【０００２】

【従来の技術】従来の聴覚障害者（以下、利用者とい
う）と健常者（以下、相手話者という）との対話を支援
する自然言語対話処理装置としては、特開平９−１１６
６４８号公報記載の携帯用通信装置が知られている。

【０００３】この装置は、通信回線との接続を得るモデ
ムと、文字データを画面表示及び入力できる文字入出力
手段と、文字入出力手段から文字データが入力されたと
き該文字データを音声合成して音声信号に変換してモデ
ムを介して送信する音声合成手段と、モデムを介して受
信した相手話者の音声信号を音声認識して文字信号に変
換して前記文字入出力手段の画面に表示する音声理解手
段とを備えるものである。この装置を用いれば、電話に
よる通話に近い形で聴覚障害者と健常者が簡易に通話す
ることができる。

【０００４】

【発明が解決しようとする課題】しかしながら、上記従
来技術によれば、聴覚障害者は文字入出力手段により話
したい言葉を文字入力しなければならず、簡単な単語の
やり取り以上の複雑な会話の場合には、聴覚障害者の文
字入力待ち時間が生じ、円滑な対話が進まないという問
題点があった。

【０００５】以上の問題点に鑑み、本発明の目的は、聴
覚障害者の文字入力待ち時間を無くし、円滑な対話をお
こなうことができる自然言語対話処理装置を提供するこ
とである。

【０００６】

【課題を解決するための手段】請求項１記載の発明は、
上記課題を解決するため、相手話者の音声を入力して音
声信号に変換する音声入力手段と、この音声信号を音声
認識してテキストデータに変換する音声認識手段と、こ
の音声認識手段が参照する辞書と、前記テキストデータ
を発話文の文字情報として表示装置へ表示する発話文表
示制御手段と、予め複数の対話文を記憶する対話文デー
ターベースと、対話文データーベースに記憶された複数
の応答文を文字情報として表示装置へ表示する応答文リ
スト表示制御手段と、表示された複数の応答文の中から
一つの応答文の選択を入力する選択入力手段と、選択さ
れた応答文を相手話者に通知する通知手段と、を備えた
ことを要旨とする自然言語対話処理装置である。

【０００７】本発明において、相手話者の音声から得ら
れた文字情報及び複数の応答文を表示する表示装置と応
答文の選択を入力する選択入力手段は、表示画面と選択
入力手段とが一体となり操作が容易なタッチパネルが好
ましい。

【０００８】利用者は、このタッチパネルに表示された
相手話者の発話を文字情報として読み取ることができる
とともに、同じ画面に好ましくは同時に表示された複数
の応答文の中から、一つの応答文を選択することによ
り、この応答文が相手話者に通知される。

【０００９】また、表示装置の画面を分割して、相手話
者の音声を認識して文字情報をして表示する発話文表示
領域と、この発話文に対する応答文の候補を複数表示す
る応答文表示領域とを設け、発話文と応答文とを同時に
表示することが好ましい。

【００１０】相手話者の音声を認識した発話文、及び応
答文の表示装置への表示形態は、日本語の場合、かな
文、漢字混じり文のいずれでもよいが、双方から一方の
表示形態を選択切替できるようにしてもよい。

【００１１】応答文を相手話者に通知する通知手段とし
ては、表示画面中の選択された応答文を他の文とは異な
るコントラスト、明るさ、色、大きさで表示してもよい
し、選択された応答文を音声変換して音声で通知するこ
ともできる。

【００１２】さらに、発話文表示制御手段は、対話相手
の発話文のテキストデータを記憶し、利用者の選択によ
り、会話を遡って以前の発話文を文字情報表示できるよ
うにしてもよい。

【００１３】請求項２記載の発明は、上記課題を解決す
るため、相手話者の音声を入力して音声信号に変換する
音声入力手段と、この音声信号を音声認識してテキスト
データに変換する音声認識手段と、この音声認識手段が
参照する辞書と、前記テキストデータを文字情報として
表示装置へ表示する発話文表示制御手段と、予め対話状
況毎に複数の対話文を記憶する対話文データーベース
と、前記テキストデータに基づいて対話状況を判定する
対話制御手段と、この対話制御手段が判定した対話状況
に対応する複数の対話文を文字情報として表示装置へ表
示する応答文リスト表示制御手段と、表示された複数の
応答文の中から一つの応答文の選択を入力する選択入力
手段と、選択された応答文を相手話者に通知する通知手
段と、を備えたことを要旨とする自然言語対話処理装置
である。

【００１４】請求項３記載の発明は、上記課題を解決す
るため、相手話者の音声を入力して音声信号に変換する
音声入力手段と、この音声信号を音声認識してテキスト
データに変換する音声認識手段と、この音声認識手段が
参照する辞書と、前記テキストデータを文字情報として
表示装置へ表示する発話文表示制御手段と、予め対話状
況毎に複数の対話文を記憶する対話文データーベース
と、前記テキストデータ及び以前の対話内容に基づいて
対話状況を判定するとともに文脈情報を導出する対話制
御手段と、この対話制御手段が判定した対話状況に対応
する複数の対話文から前記文脈情報に適合する応答文を
選択して文字情報として表示装置へ表示する応答文リス
ト表示制御手段と、表示された複数の応答文の中から一
つの応答文の選択を入力する選択入力手段と、選択され
た応答文を相手話者に通知する通知手段と、を備えたこ
とを要旨とする自然言語対話処理装置である。

【００１５】請求項４記載の発明は、上記課題を解決す
るため、請求項３記載の自然言語対話処理装置におい
て、前記文脈情報に基づいて現在進行している対話内の
キーワードを予測するキーワード予測手段と、前記辞書
内の前記キーワードの選択確率を上げる辞書変更手段
と、を備えたことを要旨とする。

【００１６】請求項５記載の発明は、上記課題を解決す
るため、請求項２ないし請求項４のいずれか１項記載の
自然言語対話処理装置において、前記応答文の文体を制
御する表層制御手段を備えたことを要旨とする。

【００１７】請求項６記載の発明は、上記課題を解決す
るため、請求項５記載の自然言語対話処理装置におい
て、利用者が相手話者に関する相手話者情報を入力する
相手話者情報入力手段を備え、この相手話者情報に基づ
いて前記表層制御手段が応答文の文体を制御することを
要旨とする。

【００１８】請求項７記載の発明は、上記課題を解決す
るため、請求項３記載の自然言語対話処理装置におい
て、利用者が相手話者に関する情報を入力する相手話者
情報入力手段を備え、この相手話者情報に基づいて前記
対話状況を決定するか、或いはこの相手話者情報に基づ
いて前記対話文データベースに登録された対話文セット
の優先度を変更することができることを要旨とする。

【００１９】請求項８記載の発明は、上記課題を解決す
るため、請求項３ないし請求項７のいずれか１項記載の
自然言語対話処理装置において、前記選択入力手段から
入力された応答文の情報を前記対話制御部に入力し、前
記対話制御手段は、該情報に基づいて、前記対話文デー
タベースから次に選択する応答文の確率を変更すること
ができることを要旨とする。

【００２０】請求項９記載の発明は、上記課題を解決す
るため、請求項１ないし請求項８のいずれか１項記載の
自然言語対話処理装置において、前記通知手段は、前記
選択入力手段で選択された応答文を音声信号に変換する
音声合成手段と、この音声合成手段が変換した音声信号
を音声として出力する音声出力手段と、を備えたことを
要旨とする。

【００２１】請求項１０記載の発明は、上記課題を解決
するため、相手話者の音声を入力して音声信号に変換す
る音声入力過程と、この音声信号を音声認識してテキス
トデータに変換する音声認識過程と、前記テキストデー
タを文字情報として表示装置へ表示する発話文表示過程
と、対話文データーベースに記憶された複数の対話文を
文字情報として表示装置へ表示する応答文リスト表示過
程と、表示された複数の応答文の中から一つの応答文の
選択を入力する選択入力過程と、選択された応答文を相
手話者に通知する通知過程と、を備えたことを要旨とす
る自然言語対話処理方法である。

【００２２】請求項１１記載の発明は、上記課題を解決
するため、相手話者の音声を入力して音声信号に変換す
る音声入力過程と、この音声信号を音声認識してテキス
トデータに変換する音声認識過程と、前記テキストデー
タを文字情報として表示装置へ表示する発話文表示過程
と、前記テキストデータに基づいて対話状況を判定する
対話状況判定過程と、この対話状況に対応する複数の対
話文を対話文データベースから検索し、検索された対話
文を文字情報として表示装置へ表示する応答文リスト表
示過程と、表示された複数の応答文の中から一つの応答
文の選択を入力する選択入力過程と、選択された応答文
を相手話者に通知する通知過程と、を備えたことを要旨
とする自然言語対話処理方法である。

【００２３】請求項１２記載の発明は、上記課題を解決
するため、相手話者の音声を入力して音声信号に変換す
る音声入力過程と、この音声信号を音声認識してテキス
トデータに変換する音声認識過程と、前記テキストデー
タを文字情報として表示装置へ表示する発話文表示過程
と、前記テキストデータ及び以前の対話内容に基づいて
対話状況を判定するとともに文脈情報を導出する文脈導
出過程と、対話状況に対応する複数の対話文から文脈情
報に適合する応答文を対話文データベースから選択して
文字情報として表示装置へ表示する応答文リスト表示過
程と、表示された複数の応答文の中から一つの応答文の
選択を入力する選択入力過程と、選択された応答文を相
手話者に通知する通知過程と、を備えたことを要旨とす
る自然言語対話処理方法である。

【００２４】請求項１３記載の発明は、上記課題を解決
するため、請求項１２記載の自然言語対話処理方法にお
いて、前記文脈情報に基づいて現在進行している対話内
のキーワードを予測するキーワード予測過程と、前記辞
書内の前記キーワードの選択確率を上げる辞書変更過程
と、を備えたことを要旨とする。

【００２５】請求項１４記載の発明は、上記課題を解決
するため、請求項１１ないし請求項１３のいずれか１項
記載の自然言語対話処理方法において、前記応答文の文
体を制御する表層制御過程を備えたことを要旨とする。

【００２６】請求項１５記載の発明は、上記課題を解決
するため、請求項１４記載の自然言語対話処理方法にお
いて、利用者が相手話者に関する相手話者情報を入力す
る相手話者情報入力過程を備え、この相手話者情報に基
づいて前記表層制御過程が応答文の文体を制御すること
を要旨とする。

【００２７】請求項１６記載の発明は、上記課題を解決
するため、請求項１２記載の自然言語対話処理方法にお
いて、利用者が相手話者に関する情報を入力する相手話
者情報入力過程と、この相手話者情報に基づいて前記対
話状況を決定するか、或いは前記相手話者情報に基づい
て前記対話文データベースに登録された対話文セットの
優先度を変更する対話制御過程と、を備えたことを要旨
とする。

【００２８】請求項１７記載の発明は、上記課題を解決
するため、請求項１２ないし請求項１６のいずれか１項
記載の自然言語対話処理方法において、前記選択入力過
程で入力された応答文の情報に基づいて、前記対話文デ
ータベースから次に選択する応答文の確率を変更する過
程を備えたことを要旨とする。

【００２９】請求項１８記載の発明は、上記課題を解決
するため、請求項１０ないし請求項１７のいずれか１項
記載の自然言語対話処理方法において、前記通知過程
は、前記選択入力過程で選択された応答文を音声信号に
変換する音声合成過程と、この音声合成過程が変換した
音声信号を音声として出力する音声出力過程と、を備え
たことを要旨とする。

【００３０】請求項１９記載の発明は、上記課題を解決
するため、相手話者の音声を入力して音声信号に変換
し、この音声信号を音声認識してテキストデータに変換
し、前記テキストデータを文字情報として表示装置へ表
示し、予め対話文データーベースに記憶された複数の対
話文を文字情報として表示装置へ表示し、表示された複
数の応答文の中から一つの応答文の選択を入力し、選択
された応答文を相手話者に通知する自然言語対話処理プ
ログラムを記憶したコンピュータ読み取り可能な記憶媒
体である。

【００３１】また、請求項１９記載のコンピュータ読み
取り可能な記憶媒体は、請求項１１記載の自然言語対話
処理方法に対応して、相手話者の音声を入力して音声信
号に変換し、この音声信号を音声認識してテキストデー
タに変換し、前記テキストデータを文字情報として表示
装置へ表示し、前記テキストデータに基づいて対話状況
を判定し、この対話状況に対応する複数の対話文を対話
文データベースから検索し、検索された対話文を文字情
報として表示装置へ表示し、表示された複数の応答文の
中から一つの応答文の選択を入力し、選択された応答文
を相手話者に通知する自然言語対話処理プログラムを記
憶したコンピュータ読み取り可能な記憶媒体としてもよ
い。

【００３２】また、請求項１９記載のコンピュータ読み
取り可能な記憶媒体は、請求項１２記載の自然言語対話
処理方法に対応して、相手話者の音声を入力して音声信
号に変換し、この音声信号を音声認識してテキストデー
タに変換し、前記テキストデータを文字情報として表示
装置へ表示し、前記テキストデータ及び以前の対話内容
に基づいて対話状況を判定するとともに文脈情報を導出
し、前記対話状況に対応する複数の対話文から前記文脈
情報に適合する応答文を対話文データベースから選択し
て文字情報として表示装置へ表示し、表示された複数の
応答文の中から一つの応答文の選択を入力し、選択され
た応答文を相手話者に通知する自然言語対話処理プログ
ラムを記憶したコンピュータ読み取り可能な記憶媒体と
してもよい。

【００３３】

【発明の実施の形態】次に図面を参照して、本発明の実
施の形態を詳細に説明する。図１は、本発明に係る自然
言語対話処理装置の第１の実施形態の構成を示すシステ
ム構成図である。

【００３４】図１において、自然言語対話処理装置は、
相手話者である利用者Ａ（健常者）の音声を入力し音声
信号に変換するマイク１と、この音声信号を音声認識し
てテキストデータを出力する音声認識部２と、音声認識
部２が参照する辞書３と、予め複数の対話文を記憶した
対話文データベース４と、相手話者の音声を音声認識し
た結果である発話文とこれに対する応答文候補を表示す
る表示装置及び応答文の選択入力手段を兼ねるタッチパ
ネルディスプレイ６と、音声認識部２が出力したテキス
トデータを文字情報としてタッチパネルディスプレイ６
へ表示する発話文表示部５と、対話文データベース４か
ら読み出した複数の応答文をタッチパネルディスプレイ
６に表示する応答文リスト表示部７と、タッチパネルデ
ィスプレイ６から利用者Ｂ（聴覚障害者）が選択入力し
た応答文を認識する応答文認識部８と、応答文認識部８
が認識した応答文を音声合成して音声信号を出力する音
声合成部９と、音声合成部９が出力する音声信号を音に
変換して利用者Ａに伝えるスピーカ１０とを備えてい
る。

【００３５】音声認識部２は、不特定話者・連続音声認
識に属する音声認識を行うもので、音声信号を入力し、
この認識結果であるテキストデータを出力するものであ
る。この不特定話者・連続音声認識は、例えば、平山、
平島による文献「不特定話者、連続音声認識システムの
開発とその応用」（International Symposium "Compute
r World '91"September 24-26,1991,Osaka,Japan）に示
されている音声認識方法が知られている。

【００３６】また、デジタル信号処理により音声の特
徴を抽出し、予め辞書に登録された音素モデルと前記
抽出された特徴とを確率・統計手法により比較し、予
め辞書に登録された統計的言語モデル（ｎ−ｇｒａｍ）
を利用して音素や単語の接続性や文法の制御を行い、
認識結果のテキストデータを出力する音声認識方法を利
用することができる。日本語音声認識の場合、認識結果
は、かな文、漢字混じり文いずれでもよいが、漢字混じ
り文の場合、辞書３に漢字表現機能を必要とする。

【００３７】辞書３は、音声認識部２が参照する辞書で
あり、音素モデル、単語辞書、単語モデル、構文モデル
等を予め記憶するものである。

【００３８】対話文データベース４は、この自然言語対
話処理装置が利用される可能性がある対話文を予測し、
これらの複数の対話文の全てを予め登録して記憶するデ
ーターベースである。

【００３９】発話文表示部５は、音声認識部２が認識し
た相手話者の音声である発話文のテキストデータを文字
情報としてタッチパネルディスプレイに６に表示させる
制御を行うものである。タッチパネルディスプレイ６が
表示する各文字のフォントは、発話文表示部５またはタ
ッチパネルディスプレイ６のいずれに設けてもよい。

【００４０】タッチパネルディスプレイ６は、タッチス
クリーンディスプレイとも呼ばれ、ＣＲＴや液晶表示パ
ネル等の画像表示装置の画面上にスクリーン状の位置入
力装置を重ねて配置したものである。位置検出方式の違
いにより、感圧式、抵抗膜式、光位置検出式などの種々
の方式があるが、いずれの位置検出方式であってもかま
わない。特許請求の範囲との対応で言えば、表示装置と
選択入力手段とを兼ね備えるものである。

【００４１】応答文リスト表示部７は、対話文データベ
ース４から読み出された複数の応答文をタッチパネルデ
ィスプレイ６に表示させる制御を行うものである。応答
文認識部８は、タッチパネルディスプレイ６に表示され
た複数の応答文の中から、利用者Ｂがいずれの応答文を
選択したかを認識し、この認識した応答文のテキストデ
ータを音声合成部９に送るものである。

【００４２】音声合成部９は、規則合成方式やテキスト
合成方式などの音声合成により音声信号を生成するもの
である。規則合成方式は、音素や音節など単語よりも短
い単位に対して、イントネーションやアクセントなどの
韻律情報を与えた上で、時間規則やパラメータ規則等の
様々な合成規則を用いて音声信号を生成する合成方式で
ある。規則合成方式を利用する場合、対話文データベー
ス４には、応答文のテキストデータとともに各応答文に
対応する発音記号列を記憶し、応答文認識部８が認識し
た応答文に対応する発音記号列を音声合成部９に与えて
合成音声を得るようにしてもよい。

【００４３】テキスト合成方式は、本発明に好適な音声
合成方式であり、テキストデータからそれに対応する音
声を合成するものである。テキスト合成方式を利用する
場合、音声合成部９は、応答文認識部８から与えられた
応答文のテキストデータに対して、テキストを構文・意
味解析し、解析結果としての音素記号列と韻律記号を得
て、以下、規則合成と同様な処理により合成音声を得る
ものである。

【００４４】次に、上記構成の第１実施形態の動作を図
４のフローチャートを参照して説明する。

【００４５】まず、図４（ａ）に示すように、相手話者
が発話することにより、本自然言語対話処理装置が起動
され、マイク１を通じて入力される相手話者の音声を音
声認識部２で音声認識してテキストデータに変換し（ス
テップＳ１０、以下ステップをＳと略す）、このテキス
トデータを文字情報として発話文表示部５がタッチパネ
ルディスプレイ６の画面に表示する（Ｓ１２）。次い
で、応答処理（Ｓ２０）が行われる。

【００４６】図４（ｂ）は、応答処理の詳細を示すフロ
ーチャートである。応答処理が開始されると（Ｓ２０−
１）、応答文のリストを対話文データベース４より読み
込み（Ｓ２２）、応答文リスト表示部７が応答文のリス
トをタッチパネルディスプレイ６の画面へ文字表示する
（Ｓ２４）。このとき、応答文のリスト表示は、選択さ
れる確率の高い順に表示するのが好ましい。またタッチ
パネルディスプレイ６の応答文表示領域にすべての応答
文を表示できなければ、スクロール等の技術を利用して
順次異なる応答文を表示するようにしてもよい。

【００４７】次いで利用者の応答文選択入力を待ち（Ｓ
２６）、利用者がタッチパネルディスプレイ６に触れて
選択入力があると、選択された応答文のテキストデータ
を応答文認識部８で認識処理を行う（Ｓ２８）。そし
て、認識した応答文を音声合成部９で音声合成して（Ｓ
３０）、スピーカ１０から応答文を音声出力して相手話
者に伝え（Ｓ３２）、処理を終了する。

【００４８】なお図示しないが、スピーカ１０から音声
出力中は、音声認識部２の認識を停止するか、或いは、
スピーカ１０への出力信号の反転遅延波形をマイク入力
信号に加算することにより、スピーカ１０からの音声が
マイク１に入力するのを打ち消して、応答文の音声出力
を相手話者の発話と誤認識するのを防止する。

【００４９】以後、再度相手話者が発話することによ
り、上記の動作が繰り返され、相手話者と利用者との間
で会話が交わされることとなる。

【００５０】尚、本実施形態の変形例として、応答文を
音声にて通知する音声合成部９及びスピーカ１０を除去
し、その代わりに、表示装置であるタッチパネルディス
プレイ６の画面上で応答文を通知することもできる。

【００５１】即ち、利用者Ｂが選択し応答文認識部８が
認識した応答文を表示コントラストや表示色、或いは表
示文字の大きさや字体を変えて表示したり、応答文に番
号を付与して選択された応答文番号のコントラスト反転
や表示色の変更等により、利用者Ａに通知するようにし
てもよい。

【００５２】このような変形例は、利用者Ａと利用者Ｂ
とが同じ表示装置を見ることができる環境、例えば携帯
用の自然言語対話処理装置に有効である。

【００５３】図２は、本発明に係る自然言語対話処理装
置の第２の実施形態の構成を示すシステム構成図であ
る。

【００５４】図２において、自然言語対話処理装置は、
相手話者である利用者Ａ（健常者）の音声を入力し音声
信号に変換するマイク１と、この音声信号を音声認識し
てテキストデータを出力する音声認識部２と、音声認識
部２が参照する辞書３と、音声認識部２が認識したテキ
ストデータと後述する話者同定部１６及び応答文認識部
８の認識結果に基づいて利用者Ａ，Ｂ間の対話を制御す
る対話制御部１１と、予め対話状況毎に複数の対話文を
記憶した対話文データベース１２と、音声認識部２が認
識したテキストデータである発話文及び複数の応答文を
表示する表示装置及び応答文の選択入力手段を兼ねるタ
ッチパネルディスプレイ６と、音声認識部２が出力した
テキストデータを文字情報としてタッチパネルディスプ
レイ６へ表示する発話文表示部５と、対話文データベー
ス１２から読み出した複数の応答文に文体制御を行う表
層情報を追加する表層制御部１３と、対話文データーベ
ース１２から読み出した複数の応答文を表層情報により
加工した応答文を生成する応答文生成部１４と、応答文
生成部１４が生成した複数の応答文をタッチパネルディ
スプレイ６に表示する応答文リスト表示部７と、タッチ
パネルディスプレイ６から利用者Ｂ（聴覚障害者）が選
択入力した応答文を認識する応答文認識部８と、応答文
認識部８が認識した応答文を音声合成して音声信号を出
力する音声合成部９と、音声合成部９が出力する音声信
号を音に変換するスピーカ１０と、利用者Ｂが相手話者
を入力する相手話者選択入力手段であるボタン１５と、
ボタン１５から入力された相手話者選択信号に基づいて
相手話者を同定し対話制御部１１へ通知する話者同定部
１６とを備えている。

【００５５】図２の構成要素の内、マイク１、音声認識
部２、発話文表示部５、タッチパネルディスプレイ６、
応答文リスト表示部７、応答文認識部８、音声合成部
９、及びスピーカ１０は、図１に示した第１実施形態と
同様の構成要素であるので、重複する説明は省略する。

【００５６】辞書３は、対話制御部１１が認識した現在
の対話状況により単語モデル内の確率を変更できるよう
になっている。これ以外は、第１実施形態の辞書３と同
様である。

【００５７】対話文データベース１２には、予め対話状
況毎に複数の応答文が記憶されている。対話制御部１１
は、ボタン１５による相手話者選択信号や、音声認識部
２が認識した相手話者の発話内容、応答文認識部８が認
識した応答文により、対話状況を判定し、この対話状況
に応じた応答文を対話文データベース１２から読み出し
て表層制御部１３に渡す。

【００５８】対話状況毎に記憶された複数の対話文は、
例えば、相手話者選択信号の種類毎に根（root）を持つ
有向木の構造（directed tree structure）とすること
ができる。そして、音声認識部２が認識した相手話者の
発話や、応答文認識部８が認識した応答文に応じて順次
木構造をたどり、複数の応答文候補を読み出し、選択さ
れた応答文及び次の発話文により木を探索する処理を行
うのが好ましい。

【００５９】また対話状況毎に複数記憶された各応答文
は、それぞれ重み係数または選択回数が付与され、重み
係数または選択回数の大きい応答文の順に応答文リスト
が作成され表示されるようになっている。これは、上記
有向木の構造で言えば、一つの節点に接続された複数の
枝にそれぞれ重み係数または選択回数が与えられている
と考えればよい。

【００６０】表層制御部１３では、対話制御部１１から
の情報に基づいて、応答文に文体を制御する表層情報を
付加する。この表層情報には、尊敬語、謙譲語、丁寧語
等の敬語の文体や、命令文が含まれる。応答文生成部１
４では、応答文を表層情報に従った文体に加工して、応
答文リスト表示部７へ出力する。以下、複数の応答文が
応答文リスト表示部７からタッチパネルディスプレイ６
へ表示されるのは、第１実施形態と同様である。

【００６１】次に、図５及び図６のフローチャートを参
照して、第２実施形態の動作を説明する。第２実施形態
における処理は、相手話者の発話を認識して表示する相
手話者の発話処理、相手話者の情報や応答文の選択を対
話文データベースに登録したり音声認識結果に基づいて
応答文リストを生成する対話処理、応答文リスト生成処
理、選択された応答文を認識して音声出力する応答処
理、及び相手話者入力処理に分割されている。

【００６２】まず、図５（ａ）に示すように、相手話者
が発話することにより、相手話者の発話処理が開始さ
れ、マイク１を通じて入力される相手話者の音声を音声
認識部２で音声認識してテキストデータに変換し（ステ
ップＳ１０）、このテキストデータを文字情報として発
話文表示部５がタッチパネルディスプレイ６の画面に表
示する（Ｓ１２）。次いで、認識した発話文を対話処理
へ出力して（Ｓ１４）、相手話者の発話処理を終了す
る。

【００６３】図５（ｂ）は、対話処理の詳細を示すフロ
ーチャートである。対話処理が開始されると（Ｓ４
０）、相手話者情報の入力があるか否かを判定し（Ｓ４
２）、相手話者情報があれば、この相手話者情報を対話
文データベースに登録する（Ｓ４４）。次いで選択済み
の応答文情報の入力があるかどうかを判定し（Ｓ４
６）、入力があれば、選択された応答文情報を対話文デ
ータベースに登録する（Ｓ４８）。

【００６４】次いで、音声認識部が認識したテキストデ
ータの入力があるかどうかを判定し（Ｓ５０）、入力が
あれば、応答文リスト生成処理（Ｓ６０）を呼び出す。
入力がないか、応答文リスト生成処理から戻ると、対話
処理を終了する。

【００６５】図５（ｃ）は、応答文リスト生成処理の詳
細を説明するフローチャートである。応答文リスト生成
処理が始まると（Ｓ６０−１）、入力された相手話者と
相手話者の発話内容に基づいて判定される対話状況に応
じた複数の応答文を対話文データベース１２から読み出
し、各応答文に付与された優先度に応じて、優先度の高
い応答文から順に配列した応答文リストを生成する（Ｓ
６２）。

【００６６】応答文リスト生成が完了すれば（Ｓ６４の
判定がＹｅｓ）、音声認識部２が参照する辞書３へ重要
な単語リストを登録し（Ｓ６６）、応答文リストに付加
された表層情報に従った文体加工を応答文生成部１４で
施し（Ｓ６８）、応答文リスト表示部７へ応答処理を行
うべく応答文リストを出力して（Ｓ７０）、リターンす
る。

【００６７】次いで、図６（ａ）に示すように、応答処
理が始まると（Ｓ８０）、応答文リスト表示部７は、タ
ッチパネルディスプレイ６へ応答文のリストを表示する
（Ｓ８２）。このとき、タッチパネルディスプレイ６の
応答文表示領域にすべての応答文を表示できなければ、
スクロール等の技術を利用して順次異なる応答文を表示
するようにしてもよい。

【００６８】次いで利用者の応答文選択入力を待ち（Ｓ
８４）、利用者がタッチパネルディスプレイ６に触れて
選択入力があると、選択された応答文のテキストデータ
を応答文認識部８で認識処理を行う（Ｓ８８）。次い
で、選択された応答文情報を対話文データベースへ登録
するために対話処理部へ出力し（Ｓ９０）、認識した応
答文を音声合成部９で音声合成して（Ｓ９２）、スピー
カ１０から応答文を音声出力して相手話者に伝えて（Ｓ
９４）、処理を終了する。

【００６９】なお図示しないが、スピーカ１０から音声
出力中は、音声認識部２の認識を停止するか、或いは、
スピーカ１０への出力信号の反転遅延波形をマイク入力
信号に加算することにより、スピーカ１０からの音声が
マイク１に入力するのを打ち消して、応答文の音声出力
を相手話者の発話と誤認識するのを防止する。

【００７０】図６（ｂ）は、相手話者入力処理の詳細を
説明するフローチャートである。まず、相手話者入力処
理が開始されると（Ｓ１００）、ボタン１５からの相手
話者情報の入力を待ち（Ｓ１０２）、入力があると、入
力された相手話者情報を対話文データベースへ登録すべ
く対話処理部へ出力して（Ｓ１０４）、処理を終了す
る。

【００７１】図３は、本発明に係る自然言語対話処理装
置を汎用コンピュータシステム上で動作する自然言語対
話処理プログラムにより実現する場合のコンピュータシ
ステムの構成を示すシステム構成図である。

【００７２】図３において、自然言語対話処理プログラ
ムを実行するコンピュータシステムは、音声を入力して
音声信号を出力するマイク１と、マイク１からの音声信
号を増幅するアンプ２１と、アンプ２１の出力をＡ／Ｄ
変換する入力部２２と、コンピュータシステムにより合
成されたディジタル合成音声信号をＤ／Ａ変換によりア
ナログ合成音声信号に変換する出力部２３と、出力部２
３から出力されるアナログ合成音声信号を増幅するパワ
ーアンプ２０と、パワーアンプ２０の駆動により鳴動す
るスピーカ１０と、マイクロプロセッサ等を使用したＣ
ＰＵ２４と、発話文及び複数の応答文を表示する一方、
複数の応答文から利用者Ｂが選択を入力するタッチパネ
ルディスプレイ６と、タッチパネルディスプレイ６への
入出力インタフェースである入出力部２５と、自然言語
対話処理プログラムを実行形式で記憶するプログラムメ
モリ２６と、自然言語対話処理プログラムが参照する各
種データを一時記憶するデータメモリ２７と、音声認識
または音声合成で参照する辞書を記憶した外部記憶装置
（磁気ディスク）３と、予め複数の対話文を対話文デー
タベースとして記憶した外部記憶装置（磁気ディスク）
４と、入力部２２、出力部２３、ＣＰＵ２４、入出力部
２５、プログラムメモリ２６、データメモリ２７、外部
記憶装置３、外部記憶装置４を相互に接続するバス２８
と、を備えている。

【００７３】本発明の自然言語対話処理プログラムを記
憶した記憶媒体は、例えば、フロッピィディスク媒体
や、ＣＤ−ＲＯＭなどの記憶媒体に記憶され、バス２８
に着脱可能に接続される図示しないフロッピィディスク
ドライブやＣＤ−ＲＯＭドライブからプログラムメモリ
２６に読み込まれて、実行される。

【００７４】図７は、第２実施形態に係る自然言語対話
処理装置をドアホンに適用した場合の具体的な利用者Ａ
（健常者）と利用者Ｂ（障害者）の対話例を説明するダ
イアログ図である。この例では、玄関ドア付近に、マイ
ク、スピーカ、呼出ベル、及び来訪者を撮影するモニタ
カメラが設けられ、例えば、利用者Ｂの居間に表示装置
と応答文選択入力手段を兼ねるタッチパネルディスプレ
イが設けられているものとする。そして、タッチパネル
ディスプレイの画面２００は、例えば図８に示すよう
に、相手話者の発話文を表示する発話文表示領域２０１
と、発話文表示領域をスクロールするボタン２０２と、
複数の応答文を表示する応答文表示領域２０３と、応答
文表示領域をスクロールするボタン２０４と、モニタカ
メラの映像を表示する来訪者モニタ領域２０５と、相手
話者選択を入力する相手話者ボタン２０６と、非常呼出
ボタン２０７と、玄関錠の解錠ボタン２０８とが設けら
れている。

【００７５】図７において、まず相手話者として隣人が
訪問し、呼出ベルを押下する。呼出ベルが押下される
と、自然言語対話処理装置が起動し、モニタカメラの映
像を来訪者モニタ領域２０５に表示するとともに、図示
しない来訪者報知ランプが点滅して、利用者Ｂに来訪者
を告げる。

【００７６】利用者Ｂは、来訪者モニタ領域の映像によ
り来訪者が隣人と知り、相手話者ボタン２０６の中の隣
人ボタンを押下する。これにより対話制御部１１は、隣
人訪問という対話状況を認識し、隣人との会話に対応す
る対話文セットを対話文データーベース１２から読み出
す。以下、隣人との会話に係る自然言語対話処理装置の
処理を隣人会話タスクと呼ぶ。

【００７７】対話制御部１１は、対話文データーベース
１２に隣人会話タスクとして登録されている複数の対話
文の中から、会話の最初に登録されている＜応答、挨
拶、質問＞に関する応答文リストを取得し、タッチパネ
ルディスプレイ６に表示する。この表示が図中符号１０
１で示す１．「はい、もしもし」と２．「どなたです
か」である。

【００７８】次いで、利用者Ｂが１と２との選択肢から
１を選択し、数字の１または「はい、もしもし」の文に
触れたとすると、応答文認識部８が１．「はい、もしも
し」が選択されたことを認識して対話制御部１１に通知
するとともに、音声合成部９へテキストデータ「はい、
もしもし」を送る。対話制御部１１は、応答文１．「は
い、もしもし」が選択されたことを対話文データベース
１２へ登録する。音声合成部９からは、”はい、もしも
し”という音声が合成され、スピーカ１０から出力され
る。

【００７９】これを聞いた相手話者（隣人）は、”鈴木
です。ちょっといいですか”とマイク１に向かって話し
かける。この音声は、音声認識部２で認識されて対話制
御部１１へ”鈴木です。いいですか”と伝えられる。

【００８０】対話制御部１１は、発話文表示部５を介し
て、タッチパネルディスプレイ６の発話文表示領域２０
１へ”鈴木です。いいですか”を表示する一方、｛す
ずき、いいですか｝というキーワードに着目し、予め登
録されている会話データから｛隣人＝すずき、用件＝不
明｝という文脈情報を導出する。次いで対話制御部１１
は、この文脈情報から用件を尋ねる応答文リストを対話
文データベース１２から読み出し、応答文リスト表示部
７を介してタッチパネルディスプレイ６へ表示する。こ
の応答文リスト表示は、図７符号１０３に示すように、
１．「なんですか」、２．「どうしました」、３．「い
ま行きます」、４．「もう一度お願いします」４つの応
答文の候補が表示される。ここで、利用者Ｂが１．「な
んですか」を選択したとすると、この「なんですか」の
選択が応答文認識部８で認識されて対話制御部１１へ伝
えられ、対話文データーベース１２へ登録される一方、
音声合成部９へテキストデータ「なんですか」が送ら
れ、音声合成されてスピーカ１０から”なんですか”が
出力される。

【００８１】これを聞いた相手話者（隣人）は、”田舎
の野菜を差し上げようと思って”とマイク１に向かって
話しかける。この音声は、音声認識部２で認識されて対
話制御部１１へ”なかの野菜をさしあげるおもって”
と伝えられる。

【００８２】対話制御部１１は、発話文表示部５を介し
て、タッチパネルディスプレイ６の発話文表示領域２０
１へ”なかの野菜をさしあげるおもって”を表示する
一方、｛なか野菜さしあげる｝というキーワードに
着目し、＜用件＝野菜さしあげる＞という文脈情報を
認識し、対話タスクを隣人会話タスクから｛もらう｝対
話タスクに絞る。

【００８３】次いで対話制御部１１は、｛もらう｝対話
タスクの応答文リストを対話文データベース１２から読
み出し、応答文リスト表示部７を介してタッチパネルデ
ィスプレイ６へ表示する。この応答文リスト表示は、図
７符号１０５に示すように、１．「ありがとうございま
すただいま参ります」、２．「いま行きます」、３．
「野菜もらえるのですか」、４．「もう一度お願いしま
す」４つの応答文の候補が表示される。ここで、利用者
Ｂが２．「いま行きます」を選択したとすると、この
「いま行きます」の選択が応答文認識部８で認識されて
対話制御部１１へ伝えられ、対話文データーベース１２
へ登録される一方、音声合成部９へテキストデータ「い
ま行きます」が送られ、音声合成されてスピーカ１０か
ら”いま行きます”が出力される。そして解錠ボタン２
０８を押下すると、玄関ドアのロックが解除されるとと
もに、本自然言語対話処理装置による対話処理が終了す
る。

【００８４】尚、相手話者を入力する相手話者ボタン２
０６には、先の例で使用した隣人ボタン以外に、ヘルパ
ーＡ、ヘルパーＢ、郵便配達、宅配人等のボタンが設け
られ、相手話者に応じた応答文の表層制御が行えるよう
になっている。

【００８５】さらに、対話文データーベース１２には、
対話タスクを進めるのに必要な情報を問い合わせる際、
どのような質問を応答文リストに採り上げるかを判断す
るための係数を利用している。

【００８６】例えば、対話タスク｛もらう｝は、次の表
１に示す、対象、値、属性、係数からなる情報群を利用
している。この係数の大きい情報を優先して、相手に問
い合わせるように応答文を生成する。係数の値は、設計
者が決定する。

【００８７】

【表１】

【００８８】

【発明の効果】請求項１記載の発明によれば、相手話者
の発した音声を文字情報として表示装置へ表示するの
で、利用者は相手話者の発話を認識することができると
ともに、表示装置に表示された複数の応答文の中から一
つの応答文を選択して入力することにより、選択された
応答文が相手話者に通知されるので、利用者は応答文を
文字入力する必要がなくなり、相手話者が応答文入力の
ために待たされることなく円滑な会話を行うことができ
るという効果がある。

【００８９】請求項２記載の発明によれば、請求項１の
発明の効果に加えて、予め対話状況毎に複数の対話文を
対話文データベースに記憶しておき、相手話者の音声を
変換したテキストデータに基づいて対話制御手段が対話
状況を判定し、応答文リスト表示制御手段が対話状況に
対応する複数の応答文を文字情報として表示装置に表示
するので、対話状況により予め絞り込まれた応答文から
容易に適切な応答文を選択することができるという効果
がある。

【００９０】請求項３記載の発明によれば、請求項１の
発明の効果に加えて、対話制御手段が前記テキストデー
タ及び以前の対話内容に基づいて対話状況を判定すると
ともに文脈情報を導出し、対話制御手段が判定した対話
状況に対応する複数の対話文から前記文脈情報に適合す
る応答文を選択して文字情報として表示装置へ表示する
ようにしたので、対話状況に加えて文脈情報を考慮した
応答文の絞り込みを行って、さらに適切な応答文候補を
表示することができるという効果がある。

【００９１】請求項４記載の発明によれば、請求項３の
発明の効果に加えて、前記文脈情報に基づいて現在進行
している対話内のキーワードを予測し、前記辞書内のキ
ーワードの選択確率を上げるようにしたので、相手話者
の音声認識をより正確に行うことができる効果がある。

【００９２】請求項５記載の発明によれば、請求項２な
いし請求項４記載の発明の効果に加えて、前記応答文の
文体を制御する表層制御手段を備えたので、応答文の文
体を相手話者に応じて適切に切り替えることができると
いう効果がある。

【００９３】請求項６記載の発明によれば、請求項５記
載の発明の効果に加えて、利用者が相手話者に関する相
手話者情報を入力する相手話者情報入力手段を備え、こ
の相手話者情報に基づいて前記表層制御手段が応答文の
文体を制御するようにしたので、利用者が相手話者情報
を入力するだけで、自動的に相手話者に適合した応答文
の文体を得ることができるという効果がある。

【００９４】請求項７記載の発明によれば、請求項３記
載の発明の効果に加えて、利用者が入力した相手話者情
報に基づいて対話状況を決定するか、或いはこの相手話
者情報に基づいて対話文データベースに登録された対話
文セットの優先度を変更するようにしたので、相手話者
に応じた正確な対話状況を決定したり、相手話者に応じ
た適切な応答文を選択候補として表示できるという効果
がある。

【００９５】請求項８記載の発明によれば、請求項３な
いし請求項７記載の発明の効果に加えて、選択入力手段
から入力された応答文の情報に基づいて、対話文データ
ベースから次に選択する応答文の確率を変更することが
できるようにしたので、対話の進行状況に合わせて、適
切な応答文を選択して表示することができるという効果
がある。

【００９６】請求項９記載の発明によれば、請求項１な
いし請求項８記載の発明の効果に加えて、前記通知手段
は、前記選択入力手段で選択された応答文を音声信号に
変換する音声合成手段と、この音声合成部が変換した音
声信号を音声として出力する音声出力手段と、を備えた
ことにより、応答文を音声で相手話者に通知することが
でき、相手話者は表示装置の文字を見ることなく、音声
で応答を聞くことができるので、さらに対話を容易にす
ることができるという効果がある。

【００９７】請求項１０記載の発明によれば、相手話者
の発した音声を文字情報として表示装置へ表示するの
で、利用者は相手話者の発話を認識することができると
ともに、表示装置に表示された複数の応答文の中から一
つの応答文を選択して入力することにより、選択された
応答文が相手話者に通知されるので、利用者は応答文を
文字入力する必要がなくなり、相手話者が応答文入力の
ために待たされることなく円滑な会話を行うことができ
るという効果がある。

【００９８】請求項１１記載の発明によれば、請求項１
０の発明の効果に加えて、予め対話状況毎に複数の対話
文を対話文データベースに記憶しておき、相手話者の音
声を変換したテキストデータに基づいて対話制御手段が
対話状況を判定し、応答文リスト表示制御手段が対話状
況に対応する複数の応答文を文字情報として表示装置に
表示するので、対話状況により予め絞り込まれた応答文
から容易に適切な応答文を選択することができるという
効果がある。

【００９９】請求項１２記載の発明によれば、請求項１
０の発明の効果に加えて、文脈導出過程が前記テキスト
データ及び以前の対話内容に基づいて対話状況を判定す
るとともに文脈情報を導出し、この文脈情報に適合する
応答文を選択して文字情報として表示装置へ表示するよ
うにしたので、対話状況に加えて文脈情報を考慮した応
答文の絞り込みを行って、さらに適切な応答文候補を表
示することができるという効果がある。

【０１００】請求項１３記載の発明によれば、請求項１
２の発明の効果に加えて、前記文脈情報に基づいて現在
進行している対話内のキーワードを予測し、前記辞書内
のキーワードの選択確率を上げるようにしたので、相手
話者の音声認識をより正確に行うことができる効果があ
る。

【０１０１】請求項１４記載の発明によれば、請求項１
１ないし請求項１３記載の発明の効果に加えて、前記応
答文の文体を制御する表層制御過程を備えたので、応答
文の文体を相手話者に応じて適切に切り替えることがで
きるという効果がある。

【０１０２】請求項１５記載の発明によれば、請求項１
４記載の発明の効果に加えて、利用者が相手話者に関す
る相手話者情報を入力する相手話者情報入力過程を備
え、この相手話者情報に基づいて前記表層制御過程が応
答文の文体を制御するようにしたので、利用者が相手話
者情報を入力するだけで、自動的に相手話者に適合した
応答文の文体を得ることができるという効果がある。

【０１０３】請求項１６記載の発明によれば、請求項１
２記載の発明の効果に加えて、利用者が入力した相手話
者情報に基づいて対話状況を決定するか、或いはこの相
手話者情報に基づいて対話文データベースに登録された
対話文セットの優先度を変更するようにしたので、相手
話者に応じた正確な対話状況を決定したり、相手話者に
応じた適切な応答文を選択候補として表示できるという
効果がある。

【０１０４】請求項１７記載の発明によれば、請求項１
２ないし請求項１６記載の発明の効果に加えて、選択入
力手段から入力された応答文の情報に基づいて、対話文
データベースから次に選択する応答文の確率を変更する
ことができるようにしたので、対話の進行状況に合わせ
て、適切な応答文を選択して表示することができるとい
う効果がある。

【０１０５】請求項１８記載の発明によれば、請求項１
０ないし請求項１７記載の発明の効果に加えて、選択さ
れた応答文を相手話者に通知する通知過程は、選択され
た応答文を音声信号に変換する音声合成過程と、この音
声信号を音声として出力する音声出力過程と、を備えた
ことにより、応答文を音声で相手話者に通知することが
でき、相手話者は表示装置の文字を見ることなく、音声
で応答を聞くことができるので、さらに対話を容易にす
ることができるという効果がある。

【０１０６】請求項１９記載の発明によれば、相手話者
の音声を入力して音声信号に変換し、この音声信号を音
声認識してテキストデータに変換し、前記テキストデー
タを発話文の文字情報として表示装置へ表示し、予め対
話文データーベースに記憶された複数の応答文を文字情
報として表示装置へ表示し、表示された複数の応答文の
中から一つの応答文の選択を入力し、選択された応答文
を相手話者に通知する自然言語対話処理プログラムに可
搬性を与え、容易に運搬及び他のコンピュータにインス
トールすることができるという効果がある。

【図面の簡単な説明】

【図１】本発明に係る自然言語対話処理装置の第１の実
施形態の構成を示すブロック構成図である。

【図２】本発明に係る自然言語対話処理装置の第２の実
施形態の構成を示すブロック構成図である。

【図３】本発明に係る自然言語対話処理方法を実現する
自然言語対話処理プログラムの実行環境の構成を示すハ
ードウェアブロック構成図である。

【図４】第１実施形態の動作を説明するフローチャート
である。

【図５】第２実施形態の動作を説明するフローチャート
である。

【図６】第２実施形態の動作を説明するフローチャート
である。

【図７】実施形態における健常者と聴覚障害者との対話
の具体例を説明する図である。

【図８】実施形態におけるタッチパネルディスプレイの
表示例を説明する図である。

【符号の説明】

１マイク２音声認識部３辞書４対話文データベース５発話文表示部６タッチパネルディスプレイ７応答文リスト表示部８応答文認識部９音声合成部１０スピーカ

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 3/00 Ｅ (72)発明者中森勝大阪府門真市大字門真1048番地松下電工株式会社内 (72)発明者馬場朗大阪府門真市大字門真1048番地松下電工株式会社内 (72)発明者パウロ・プリオッティ大阪府門真市大字門真1048番地松下電工株式会社内Ｆターム(参考） 5B075 KK07 KK13 KK33 KK37 ND03 ND20 ND22 ND34 PP03 PP07 PP12 PP13 PP24 PQ02 PQ04 UU26 5D015 AA05 LL05 LL06 LL11 5D045 AB30

Claims

【特許請求の範囲】

【請求項１】相手話者の音声を入力して音声信号に変
換する音声入力手段と、前記音声信号を音声認識してテキストデータに変換する
音声認識手段と、該音声認識手段が参照する辞書と、前記テキストデータを文字情報として表示装置へ表示す
る発話文表示制御手段と、複数の対話文を予め記憶する対話文データーベースと、対話文データーベースに記憶された複数の対話文を文字
情報として前記表示装置へ表示する応答文リスト表示制
御手段と、前記表示された複数の応答文の中から一つの応答文の選
択を入力する選択入力手段と、前記選択された応答文を相手話者に通知する通知手段
と、を備えたことを特徴とする自然言語対話処理装置。
【請求項２】相手話者の音声を入力して音声信号に変
換する音声入力手段と、前記音声信号を音声認識してテキストデータに変換する
音声認識手段と、該音声認識手段が参照する辞書と、前記テキストデータを文字情報として表示装置へ表示す
る発話文表示制御手段と、予め対話状況毎に複数の対話文を記憶する対話文データ
ーベースと、前記テキストデータに基づいて対話状況を判定する対話
制御手段と、該対話制御手段が判定した対話状況に対応する複数の対
話文を文字情報として前記表示装置へ表示する応答文リ
スト表示制御手段と、前記表示された複数の応答文の中から一つの応答文の選
択を入力する選択入力手段と、前記選択された応答文を相手話者に通知する通知手段
と、を備えたことを特徴とする自然言語対話処理装置。
【請求項３】相手話者の音声を入力して音声信号に変
換する音声入力手段と、前記音声信号を音声認識してテキストデータに変換する
音声認識手段と、該音声認識手段が参照する辞書と、前記テキストデータを文字情報として表示装置へ表示す
る発話文表示制御手段と、予め対話状況毎に複数の対話文を記憶する対話文データ
ーベースと、前記テキストデータ及び以前の対話内容に基づいて対話
状況を判定するとともに文脈情報を導出する対話制御手
段と、該対話制御手段が判定した対話状況に対応する複数の対
話文から前記文脈情報に適合する応答文を選択して文字
情報として前記表示装置へ表示する応答文リスト表示制
御手段と、前記表示された複数の応答文の中から一つの応答文の選
択を入力する選択入力手段と、前記選択された応答文を相手話者に通知する通知手段
と、を備えたことを特徴とする自然言語対話処理装置。
【請求項４】請求項３記載の自然言語対話処理装置に
おいて、前記文脈情報に基づいて現在進行している対話内のキー
ワードを予測するキーワード予測手段と、前記辞書内の前記キーワードの選択確率を上げる辞書変
更手段と、を備えたことを特徴とする自然言語対話処理
装置。
【請求項５】請求項２ないし請求項４のいずれか１項
記載の自然言語対話処理装置において、前記応答文の文体を制御する表層制御手段を備えたこと
を特徴とする自然言語対話処理装置。
【請求項６】請求項５記載の自然言語対話処理装置に
おいて、利用者が相手話者に関する相手話者情報を入力する相手
話者情報入力手段を備え、前記相手話者情報に基づいて前記表層制御手段が応答文
の文体を制御することを特徴とする自然言語対話処理装
置。
【請求項７】請求項３記載の自然言語対話処理装置に
おいて、利用者が相手話者に関する情報を入力する相手話者情報
入力手段を備え、前記相手話者情報に基づいて前記対話状況を決定する
か、或いは前記相手話者情報に基づいて前記対話文デー
タベースに登録された対話文セットの優先度を変更する
ことができることを特徴とする自然言語対話処理装置。
【請求項８】請求項３ないし請求項７のいずれか１項
記載の自然言語対話処理装置において、前記選択入力手段から入力された応答文の情報を前記対
話制御部に入力し、前記対話制御手段は、該情報に基づいて、前記対話文デ
ータベースから次に選択する応答文の確率を変更するこ
とができることを特徴とする自然言語対話処理装置。
【請求項９】請求項１ないし請求項８のいずれか１項
記載の自然言語対話処理装置において、前記通知手段
は、前記選択入力手段で選択された一文を音声信号に変換す
る音声合成手段と、該音声合成部が変換した音声信号を音声として出力する
音声出力手段と、を備えたことを特徴とする自然言語対
話処理装置。
【請求項１０】相手話者の音声を入力して音声信号に
変換する音声入力過程と、前記音声信号を音声認識してテキストデータに変換する
音声認識過程と、前記テキストデータを文字情報として表示装置へ表示す
る発話文表示過程と、対話文データーベースに記憶された複数の対話文を文字
情報として表示装置へ表示する応答文リスト表示過程
と、前記表示された複数の応答文の中から一つの応答文の選
択を入力する選択入力過程と、前記選択された応答文を相手話者に通知する通知過程
と、を備えたことを特徴とする自然言語対話処理方法。
【請求項１１】相手話者の音声を入力して音声信号に
変換する音声入力過程と、前記音声信号を音声認識してテキストデータに変換する
音声認識過程と、前記テキストデータを文字情報として表示装置へ表示す
る発話文表示過程と、前記テキストデータに基づいて対話状況を判定する対話
状況判定過程と、前記対話状況に対応する複数の対話文を対話文データベ
ースから検索し、検索された対話文を文字情報として表
示装置へ表示する応答文リスト表示過程と、前記表示された複数の応答文の中から一つの応答文の選
択を入力する選択入力過程と、前記選択された応答文を相手話者に通知する通知過程
と、を備えたことを特徴とする自然言語対話処理方法。
【請求項１２】相手話者の音声を入力して音声信号に
変換する音声入力過程と、前記音声信号を音声認識してテキストデータに変換する
音声認識過程と、前記テキストデータを文字情報として表示装置へ表示す
る発話文表示過程と、前記テキストデータ及び以前の対話内容に基づいて対話
状況を判定するとともに文脈情報を導出する文脈導出過
程と、前記対話状況に対応する複数の対話文から前記文脈情報
に適合する応答文を対話文データベースから選択して文
字情報として表示装置へ表示する応答文リスト表示過程
と、前記表示された複数の応答文の中から一つの応答文の選
択を入力する選択入力過程と、前記選択された応答文を相手話者に通知する通知過程
と、を備えたことを特徴とする自然言語対話処理方法。
【請求項１３】請求項１２記載の自然言語対話処理方
法において、前記文脈情報に基づいて現在進行している対話内のキー
ワードを予測するキーワード予測過程と、前記辞書内の前記キーワードの選択確率を上げる辞書変
更過程と、を備えたことを特徴とする自然言語対話処理
方法。
【請求項１４】請求項１１ないし請求項１３のいずれ
か１項記載の自然言語対話処理方法において、前記応答文の文体を制御する表層制御過程を備えたこと
を特徴とする自然言語対話処理方法。
【請求項１５】請求項１４記載の自然言語対話処理方
法において、利用者が相手話者に関する相手話者情報を入力する相手
話者情報入力過程を備え、前記相手話者情報に基づいて前記表層制御過程が応答文
の文体を制御することを特徴とする自然言語対話処理方
法。
【請求項１６】請求項１２記載の自然言語対話処理方
法において、利用者が相手話者に関する情報を入力する相手話者情報
入力過程と、前記相手話者情報に基づいて前記対話状況を決定する
か、或いは前記相手話者情報に基づいて前記対話文デー
タベースに登録された対話文セットの優先度を入れ替え
る対話制御過程と、を備えたことを特徴とする自然言語
対話処理方法。
【請求項１７】請求項１２ないし請求項１６のいずれ
か１項記載の自然言語対話処理方法において、前記選択入力過程で入力された応答文の情報に基づい
て、前記対話文データベースから次に選択する応答文の
確率を変更する過程を備えたことを特徴とする自然言語
対話処理方法。
【請求項１８】請求項１０ないし請求項１７のいずれ
か１項記載の自然言語対話処理方法において、前記通知
過程は、前記選択入力過程で選択された一文を音声信号に変換す
る音声合成過程と、該音声合成過程が変換した音声信号を音声として出力す
る音声出力過程と、を備えたことを特徴とする自然言語
対話処理方法。
【請求項１９】相手話者の音声を入力して音声信号に
変換し、前記音声信号を音声認識してテキストデータに変換し、前記テキストデータを文字情報として表示装置へ表示
し、予め対話文データーベースに記憶された複数の対話文を
文字情報として表示装置へ表示し、前記表示された複数の応答文の中から一つの応答文の選
択を入力し、前記選択された応答文を相手話者に通知する自然言語対
話処理プログラムを記憶したコンピュータ読み取り可能
な記憶媒体。