JP2008249893A - 音声応答装置及びその方法 - Google Patents
音声応答装置及びその方法 Download PDFInfo
- Publication number
- JP2008249893A JP2008249893A JP2007089640A JP2007089640A JP2008249893A JP 2008249893 A JP2008249893 A JP 2008249893A JP 2007089640 A JP2007089640 A JP 2007089640A JP 2007089640 A JP2007089640 A JP 2007089640A JP 2008249893 A JP2008249893 A JP 2008249893A
- Authority
- JP
- Japan
- Prior art keywords
- response
- voice
- user
- voice response
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】利用者の行動に対応した反応が可能な音声応答装置を提供する。
【解決手段】音声応答装置10は、入力取得部101、応答内容生成部102、応答出力部103、周囲音取得部104、聴取状態判断部105から構成され、周囲音情報に含まれる利用者音声、応答音声、環境音を分析し、(1)前記利用者が前記音声応答に回答している場合は、前記回答に対する新たな音声応答を生成し、(2)前記利用者に前記応答音声が聞こえていない場合は、前記音声応答を繰り返し、(3)前記利用者が前記音声応答に回答できない場合は、前記音声応答を中断する。
【選択図】 図1
【解決手段】音声応答装置10は、入力取得部101、応答内容生成部102、応答出力部103、周囲音取得部104、聴取状態判断部105から構成され、周囲音情報に含まれる利用者音声、応答音声、環境音を分析し、(1)前記利用者が前記音声応答に回答している場合は、前記回答に対する新たな音声応答を生成し、(2)前記利用者に前記応答音声が聞こえていない場合は、前記音声応答を繰り返し、(3)前記利用者が前記音声応答に回答できない場合は、前記音声応答を中断する。
【選択図】 図1
Description
本発明は、音声応答機能を持つテレビなどの家電機器に好適な音声応答装置及びその方法に関する。
近年、音声インターフェイスを備えた一般家庭向けの製品が数多く商品化されている。特に、音声による使用方法のガイダンスにより、複雑な操作が必要となる家電機器も使いやすくなり、様々な機能を有効に活用することができるようになってきている。しかしながら、必ずしも利用者がガイダンスなどのシステム応答を聞き取り、適切な入力を行う状況であるとは限らず、利用者の状況に応じた応答処理を行う技術が必要となる。
そこで、特許文献1では、利用者入力の複雑さや入力までの時間などから利用者の作業負荷を推定してシステムの応答内容を変更する処理方法が提案されている。
また、特許文献2では、音声対話インタフェースを持つカーナビゲーションシステムなどにおいて、車両情報より利用者の状況を判断し、応答処理を変更する機能が提案されている。
また、特許文献3では、聞き手の「笑い声」や「拍手」などの情報によって応答内容を変更する機能が提案されている。
また、特許文献4では利用者の入力音声から、その雑音レベルを推定し、応答内容を変更する方式が提案されている。
また、特許文献5では、装置の音声出力に対して利用者が一定時間回答や操作の実行を行わなかった場合には、再度、入力を促す応答を出力する応答処理を行うことにより、利用者の回答を支援する方式が提案されている。
特開2003−108191公報
特開2004−233676公報
特開2004− 24867公報
米国公開特許2002−95295公報
特開2005−22065公報
上記の背景技術のような音声応答機能や音声対話機能を備えた家電機器においては、音声応答出力時は、利用者がその応答を聞き、必要な回答や操作を実行できる状態であることが前提となっている。
しかし、家庭内における利用状況を考えると、家庭内の様々な雑音により、装置の応答音声を利用者が聞き取れない状況や、装置とのやり取り以外の行為を利用者が行っていて装置の応答に対する回答や操作の実行ができない状況を考慮しなければならない。
例えば、音声応答機能を持つテレビの操作を考えると、音声応答が出力されたときに、利用者の周辺において他の家電機器の動作音があり音声応答装置の音声が聞こえない場合が考えられる。また、応答出力が行われている途中で利用者が携帯電話で話し始めるなど、装置の応答内容に対して回答や操作の実行ができない場合が考えられる。
このように、応答出力が聞こえず利用者が入力できない場合において、音声応答装置が処理を中断せずに進めてしまうと、利用者にとって意図しない動作が実行されることがある。また、音声応答装置に関係しない行為を行っている場合に応答出力を繰り返し行うと、利用者には不要な応答出力が必要となる。
そこで、本発明は、上記問題点に鑑み利用者の行動に対応した反応が可能な音声応答装置及びその方法を提供する。
本発明は、利用者に対して音声応答する音声応答装置において、前記音声応答を行った時の利用者の周囲の音に関する周囲音情報を取得する周囲音声取得部と、前記周囲音情報に含まれる利用者音声、応答音声、環境音を分析し、(1)前記利用者が前記応答音声の回答している状態、(2)前記利用者に前記応答音声が聞こえていない状態、または、(3)前記利用者が前記音声応答に回答できない状態かを判断する聴取状態判断部と、(1)前記利用者が前記音声応答に回答している場合は、前記回答に対する新たな音声応答を生成し、(2)前記利用者に前記応答音声が聞こえていない場合は、前記音声応答を繰り返し、(3)前記利用者が前記音声応答に回答できない場合は、前記音声応答を中断する応答内容生成部と、を具備する音声応答装置である。
本発明によれば、利用者の聴取状態を判断することにより利用者が音声応答装置への回答が困難な場合でも、利用者の状況に柔軟な応答の制御が可能となる。
以下図面を参照して、本発明の一実施形態に係る音声応答装置について説明する。
(第1の実施形態)
本発明の第1の実施形態に係る音声応答装置10について図1〜図8に基づいて説明する。
本発明の第1の実施形態に係る音声応答装置10について図1〜図8に基づいて説明する。
(1)音声応答装置の構成
図1は、本実施形態に係る音声応答装置10の構成例である。音声応答装置10は、入力取得部101、応答内容生成部102、応答出力部103、周囲音取得部104、聴取状態判断部105から構成される。
図1は、本実施形態に係る音声応答装置10の構成例である。音声応答装置10は、入力取得部101、応答内容生成部102、応答出力部103、周囲音取得部104、聴取状態判断部105から構成される。
(1−1)入力取得部101
入力取得部101は、利用者からの入力を取得する。例えば、マイクなどによって利用者の発した音声信号を取り込み、音声判断処理を行い、テキスト情報に変換して出力する。あるいは、リモートコントローラの赤外線信号などを受信し、受信内容を出力する。
入力取得部101は、利用者からの入力を取得する。例えば、マイクなどによって利用者の発した音声信号を取り込み、音声判断処理を行い、テキスト情報に変換して出力する。あるいは、リモートコントローラの赤外線信号などを受信し、受信内容を出力する。
(1−2)応答内容生成部102
応答内容生成部102は、入力取得部101で取得した利用者の入力情報に基づき、応答内容を決定する。
応答内容生成部102は、入力取得部101で取得した利用者の入力情報に基づき、応答内容を決定する。
応答内容生成部102は、アプリケーションに入力情報を出力し、アプリケーションがデータベースシステムの場合は、入力された検索要求に対応する検索結果を取得し、検索結果に基づき、応答内容を生成する。
また、応答内容生成部102は利用者の入力の有無に係らず、設定した時刻やアプリケーションにおいて状況が変化した場合に、応答音声が必要となる場合は、応答内容を生成し出力することができる。
(1−3)応答出力部103
応答出力部103は、応答内容生成部2にて生成した応答内容を、例えば、テキストとして取得し、合成音に変換して出力する。なお、出力する音声は、予め録音をしていた音声を再生するだけでもよい。
応答出力部103は、応答内容生成部2にて生成した応答内容を、例えば、テキストとして取得し、合成音に変換して出力する。なお、出力する音声は、予め録音をしていた音声を再生するだけでもよい。
(1−4)周囲音取得部104
周囲音取得部104は、利用者のそばにあるマイク、利用者のそばにあるリモートコントローラなどの装置に付属されたマイク、利用者の傍にいるロボットに付属されたマイク、または、壁や天井に備え付けられたマイクに入力された周囲音情報を取得する。
周囲音取得部104は、利用者のそばにあるマイク、利用者のそばにあるリモートコントローラなどの装置に付属されたマイク、利用者の傍にいるロボットに付属されたマイク、または、壁や天井に備え付けられたマイクに入力された周囲音情報を取得する。
(1−5)聴取状態判断部105
聴取状態判断部105は、周囲音取得部104の出力である周囲音情報を分析し、分析結果を利用して予め決められた聴取状態の判断基準に基づき利用者の聴取状態を判断し、その判断結果を聴取状態判断結果として出力する。
聴取状態判断部105は、周囲音取得部104の出力である周囲音情報を分析し、分析結果を利用して予め決められた聴取状態の判断基準に基づき利用者の聴取状態を判断し、その判断結果を聴取状態判断結果として出力する。
(2)聴取状態判断方法
聴取状態の判断は、利用者の周囲音の分析を行い、決めたルールに基づき聴取判断内容を決定する。以下、具体例を説明する。
聴取状態の判断は、利用者の周囲音の分析を行い、決めたルールに基づき聴取判断内容を決定する。以下、具体例を説明する。
(2−1)第1の例
図2は、聴取状態判断方法の第1の例を示した図である。
図2は、聴取状態判断方法の第1の例を示した図である。
聴取状態判断部105では、応答出力部103より出力された応答音声の発声開始時刻及び発声終了時刻情報を取得し、取得した応答音声の発声開始時刻から応答音声の発声終了時刻までの周囲音情報を分析し、平均音量情報を取得する。平均音量が基準値を上回った場合には、聴取状態が「聞こえている」とし平均音量が一定値を下回った場合には聴取状態が「聞こえていない」とし、この聴取状態判断結果を出力する。この基準値は、予め決められた値でもよく、また、過去の装置利用時において、応答音声に対する利用者の回答が行われた時点の周囲音情報における装置応答音声の音量の平均値を元に算出してもよい。
なお、本実施形態では、平均音量を利用したが、周囲音情報より、ノイズレベルを計測し、所定の値を上回った場合には、「聞こえていない」とし、聴取状態判断結果としても良い。例えば、音声信号とノイズレベルの比率を計算し、その値が0dB以上であった場合には、「聞こえていない」と判断してもよい。
(2−2)第2の例
図3は、聴取状態判断方法の第2の例を示した図である。
図3は、聴取状態判断方法の第2の例を示した図である。
聴取状態判断部105では、周囲音情報より、発声区間及び発声区間の発声者を取得する。すなわち、応答出力部103より出力された応答音声の発声時刻及び発声終了時刻情報を取得し、応答音声の発声時間内において、利用者自身の発声と利用者以外の発声が含まれていることが確認された場合には、「利用者が他の話者に話していて回答できない」という判断を行い、聴取状態判断結果として出力する。
また、応答音声の発声時間内において、利用者音声区間の割合が例えば50%といった、ある値より大きかった場合には、「利用者が他の話者と話していて回答できない」という判断をしてもよい。
(2−3)第3の例
図4は、聴取状態判断方法の第3の例を示した図である。
図4は、聴取状態判断方法の第3の例を示した図である。
聴取状態判断部105では、周囲音情報より、発声区間及び発声区間の発声者を取得する。すなわち、応答出力部103より出力された応答音声の発声時刻及び発声終了時刻情報を取得し、周囲音情報より取得した利用者の発声区間に、応答音声の発声開始時刻、または、発声終了時刻が含まれている場合には、「利用者が他の話者と話していて回答できない」と判断し、判断結果を出力する。
(2−4)第4の例
図5は、聴取状態判断方法の第4の例を示した図である。
図5は、聴取状態判断方法の第4の例を示した図である。
聴取状態判断部105では、周囲音情報より、装置利用に関係しない人間の発声以外の音の有無を判定する。有無を判断する音は、物がぶつかる時の音などの人間の発声以外の音や、電話やインターホンの呼び出し音など装置利用環境で発生しうる音で、過去の装置利用時には現れなかった音や、過去の装置利用時において、応答装置に対する回答が行なわれなかった場合に発生していた音などである。
このような人間の発声以外の音の音響的な特徴が周囲音情報に含まれている場合には、装置利用に関連しない特定の音があると判断する。
すなわち、応答出力部103より出力された応答音声の発声時刻及び発声終了時刻情報を取得し、応答音声の発声時間内あるいは、発声開始時刻の10秒前から発声終了時刻までといった一定の区間内において装置利用に関連しない特定の音が検出された場合には、利用者が「他のことをしていて回答できない」と判断し、判断結果を出力する。
(3)応答内容の生成
聴取状態判断部105によって取得された聴取状態判断結果に基づき、応答内容生成部102は、応答内容を生成する。
聴取状態判断部105によって取得された聴取状態判断結果に基づき、応答内容生成部102は、応答内容を生成する。
「聞こえている」と判断され、利用者からその回答があった場合には、その回答に対する応答を生成する。
一方、聴取状態が「聞こえていない」と判断された場合には、同一内容の応答内容を、音量を大きくして出力するか、聞こえやすいように音質(例えば、男性の声から女性の声)を変えて出力する。
また、聴取状態が「利用が他の話者と話していて回答できない」あるいは「他のことをしていて回答できない」と判断された場合には、音声応答装置10の中断を示す応答内容を生成し、出力すると共に、音声応答装置10はその動作を中断する。
なお、応答音声終了時刻から一定時間経過後、聴取状態判断結果に基づいた応答内容の生成を行うように設定してもよい。
また、音声応答装置10の動作中断時においても、一定区間毎に利用者の聴取状態を判断し、「他のことをしていて回答できない」「利用者が他の話者と話していて回答できない」という判断がなされなくなった場合には、応答内容生成部102は再度中断状態が終了を示す応答内容を生成し出力すると共に、音声応答装置10の動作を再開する。
以上のような聴取状態判断結果に基づく応答内容の生成は、予め聴取状態判断に対応した応答生成方法を規定しておくことで、実現することができる。
(4)処理手順
以下、音声応答装置10の処理手順Aの詳細に説明する。なお、図6は処理手順Aの処理内容を説明するフローチャートである。
以下、音声応答装置10の処理手順Aの詳細に説明する。なお、図6は処理手順Aの処理内容を説明するフローチャートである。
ステップA1において、周囲音抽出を開始する。
ステップA2において、音声応答装置10が応答音声を出力する。
ステップA3において、応答音声出力後の聴取状態判断を行い、聴取状態判断結果が「聞こえている」と判断される場合にはステップA4へ進み、聴取状態判断結果が「聞こえていない」「他の人と話していて回答できない」「他のことをしていて回答できない」といった装置応答音声が伝達されていないと判断される場合にはステップA5へ進む。
ステップA4において、所定時間内に利用者の入力があった場合には、利用者の入力に対する処理を実行する。所定時間内に利用者の入力がなかった場合には再度応答内容を出力するためステップA2へ進む。
ステップA5において、聴取状態判断結果が「聞こえていない」と判断された場合には、再度応答出力を行うためステップA2へ進む。この場合、応答出力の音量が大きくなるように、または、小さくなるように変更してもよい。また、聴取状態判断結果が「他の人と話していて回答できない」「他のことをしていて回答できない」などのように装置応答に対する入力を行うことが困難な聴取状態である場合には、応答装置の動作を中断する。
(5)具体例
上記処理について、音声応答装置10を内蔵したテレビを具体例にして詳しく説明する。
上記処理について、音声応答装置10を内蔵したテレビを具体例にして詳しく説明する。
図7は、音声応答装置10を内蔵したテレビと利用者のやり取りの例であり、野球の結果をデータベースとして管理していて、利用者からの問い合わせに回答すると共に、関連する映像再生が可能なテレビを想定している。
図7に示した対話例では、装置利用時において、装置応答2の出力中に利用者が携帯電話で他の人と話し出し回答ができなくなった場面を想定したものであり、このような場面での処理について説明する。
音声応答装置10は、利用者に「ホームランシーンを再生しますか」と問い合わせる装置応答2が再生終了後、聴取状態判断部105は周囲音声取得部103の出力を受け、聴取状態判断結果を出力する。
聴取状態を判断するため、ここでは、聴取状態判断ルールを用いている。図8は聴取状態判断ルールの一例である。
例えば、携帯電話で話をしていて、応答音声再生中の利用者発声時間が基準値を超えた場合、聴取状態判断部105は聴取状態判断ルールに基づき「他の人と話していて回答できない」という判断結果として出力する。
「他の人と話していて回答できない」という聴取状態判断結果を取得した応答内容生成部102は、装置応答2に対する入力を行うことが困難として、応答処理を中断することにより、音声応答装置10の不要な応答出力を中断することができる。また、このとき装置応答3として、「応答を中断します。」と応答してもよい。
応答処理の動作は中断するが、周囲音情報を一定間隔で取得し、利用者の発声が検出されなくなった場合は、中断していた応答処理を再開し、「Aチームのホームランシーンが再生できます」といった応答出力を行うことにより、利用者が継続してテレビとのやり取りを続けることができる。
なお、このような聴取状態判断結果に対する処理は予め規定されており、その処理方法に基づいて動作すればよく、聴取状態判断結果が「他の人と話していて回答できない」である場合でも、応答の重要性によっては、再度応答を繰り返すように処理を行っても良い。
(6)効果
このように本実施形態によれば、利用者の聴取状態に応じた音声応答の制御が可能となり、利用者が音声応答装置への回答ができない状態になっても、音声応答装置10が意図しない動作をせず利用者に余分な負担を生じない。
このように本実施形態によれば、利用者の聴取状態に応じた音声応答の制御が可能となり、利用者が音声応答装置への回答ができない状態になっても、音声応答装置10が意図しない動作をせず利用者に余分な負担を生じない。
また、利用者が音声応答装置10とは関係のない行為を行っている場合に、音声応答装置10が利用者の行為を阻害する応答を出力することがなく、利用者に負担をかけない。
(第2の実施形態)
次に、本発明の第2の実施形態に係る音声応答装置20について図9に基づいて説明する。
次に、本発明の第2の実施形態に係る音声応答装置20について図9に基づいて説明する。
(1)音声応答装置の構成
図9は、本実施形態に係る音声応答装置20の構成例である。
図9は、本実施形態に係る音声応答装置20の構成例である。
音声応答装置20は、入力取得部201、応答内容生成部202、応答出力部203から構成される。聴取状態判断装置21は、周囲音取得部211、聴取状態判断部212から構成される。音声応答装置20と聴取状態判断装置21は、例えば無線LANなどのネットワークで接続されており、必要な情報のやり取りが自由に行えるようになっている。
(1−1)入力取得部201
入力取得部201は、例えば、マイクなどによって利用者の発した音声信号を取り込み、音声認識処理を行い、テキスト情報に変換して出力する。あるいは、リモートコントローラの赤外線信号などを受信し、受信内容を出力する。
入力取得部201は、例えば、マイクなどによって利用者の発した音声信号を取り込み、音声認識処理を行い、テキスト情報に変換して出力する。あるいは、リモートコントローラの赤外線信号などを受信し、受信内容を出力する。
(1−2)応答内容生成部202
応答内容生成部202は、入力取得部201で取得した利用者の入力情報に基づき、応答内容を決定する。
応答内容生成部202は、入力取得部201で取得した利用者の入力情報に基づき、応答内容を決定する。
例えば、応答内容生成部202は、アプリケーションに入力情報を出力し、例えば、アプリケーションがデータベースシステムの場合は、入力された検索要求に対応する検索結果を取得し、検索結果に基づき、応答内容を生成する。
応答内容生成部202は利用者の入力の有無に係らず、設定した時刻やアプリケーションにおいて状況が変化した場合に、応答音声が必要となる場合は、応答内容を生成し出力することが可能でなる。
(1−3)応答出力部203
応答出力部203は、応答内容生成部202にて生成した応答内容を、例えば、テキストとして取得し、合成音に変換して出力する。なお、出力する音声は予め録音をしていた音声を再生するだけでもよい。
応答出力部203は、応答内容生成部202にて生成した応答内容を、例えば、テキストとして取得し、合成音に変換して出力する。なお、出力する音声は予め録音をしていた音声を再生するだけでもよい。
(1−4)周囲音取得部204
周囲音取得部204は、利用者のそばにあるマイク、利用者の傍にいるロボットに付属されたマイク、または、壁や天井に備え付けられたマイクに入力された周囲音情報を取得する。
周囲音取得部204は、利用者のそばにあるマイク、利用者の傍にいるロボットに付属されたマイク、または、壁や天井に備え付けられたマイクに入力された周囲音情報を取得する。
(1−5)聴取状態判断部205
聴取状態判断部205は、周囲音取得部104の出力である周囲音情報を分析し、分析結果を利用して予め決められた聴取状態の判断基準に基づき利用者の聴取状態を判断し、聴取状態判断結果を音声応答装置20へと出力する。
聴取状態判断部205は、周囲音取得部104の出力である周囲音情報を分析し、分析結果を利用して予め決められた聴取状態の判断基準に基づき利用者の聴取状態を判断し、聴取状態判断結果を音声応答装置20へと出力する。
聴取状態判断部205において、聴取状態を判断するために音声応答装置20の応答発声開始時刻が必要な場合は、音声応答装置20より取得することが可能である。
なお、音声応答装置20の発声開始時刻が取得できない場合でも、周囲音取得情報を分析し、音声応答装置20からの応答音声区間を特定することにより聴取状態判断が可能となる。
(2)応答の内容
応答内容生成部202は応答処理を出力後、聴取状態判断部205に聴取状態判断結果を問い合わせ、聴取状態判断結果に応じて応答処理内容を決定する。なお、応答内容生成部202は所定時間利用者からの入力が行われなかった場合に、聴取状態判断結果を取得してもよい。
応答内容生成部202は応答処理を出力後、聴取状態判断部205に聴取状態判断結果を問い合わせ、聴取状態判断結果に応じて応答処理内容を決定する。なお、応答内容生成部202は所定時間利用者からの入力が行われなかった場合に、聴取状態判断結果を取得してもよい。
(3)効果
以上のような、本実施形態の構成により、音声応答装置20が周囲音情報を取得するためのマイクを備えていなくても、聴取状態判断結果に基づいた応答内容生成の制御が可能となる。
以上のような、本実施形態の構成により、音声応答装置20が周囲音情報を取得するためのマイクを備えていなくても、聴取状態判断結果に基づいた応答内容生成の制御が可能となる。
また、聴取状態判断部105の処理量が膨大である場合にも、音声応答装置20には負荷がかからないため、音声応答装置20の処理に影響与えることなく応答内容生成の制御が可能となる。
(変更例)
本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
上記実施形態は、音声応答機能を持つテレビとして説明したが、例えば、音声応答による受付を行うシステムやカーナビゲーションなどの音声応答機能を持つ機器において適用することが可能である。
また、上記実施形態は、利用者からの入力を音声による入力として説明したが、利用者入力がタッチパネルやリモコン入力であることを前提とした音声応答装置にも適用することができる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
10 音声応答装置
101 入力取得部
102 応答内容生成部
103 応答出力部
104 周囲音取得部
105 聴取状態判断部
101 入力取得部
102 応答内容生成部
103 応答出力部
104 周囲音取得部
105 聴取状態判断部
Claims (11)
- 利用者に対して音声応答する音声応答装置において、
前記音声応答を行った時の利用者の周囲の音に関する周囲音情報を取得する周囲音声取得部と、
前記周囲音情報に含まれる利用者音声、応答音声、環境音を分析し、(1)前記利用者が前記応答音声の回答している状態、(2)前記利用者に前記応答音声が聞こえていない状態、または、(3)前記利用者が前記音声応答に回答できない状態かを判断する聴取状態判断部と、
(1)前記利用者が前記音声応答に回答している場合は、前記回答に対する新たな音声応答を生成し、(2)前記利用者に前記応答音声が聞こえていない場合は、前記音声応答を繰り返し、(3)前記利用者が前記音声応答に回答できない場合は、前記音声応答を中断する応答内容生成部と、
を具備する音声応答装置。 - 前記利用者が発声した音声を認識する音声認識部を具備し、
前記応答内容生成部は、前記認識した利用者音声に基づいて前記音声応答を生成する、
請求項1記載の音声応答装置。 - 前記聴取状態判断部は、前記周囲音情報に含まれる前記応答音声の音量が基準値に到達していないときは、前記音声応答が前記利用者に聞こえていないと判断する、
請求項1記載の音声応答装置。 - 前記聴取状態判断部が、前記応答音声が聞こえていないと判断したときは、
前記応答内容生成部は、前記応答音声の音量を大きくして繰り返す、
請求項1記載の音声応答装置。 - 前記聴取状態判断部は、前記応答音声の発声時間内の前記周囲音情報に含まれる前記応答音声以外の音に基づいて、前記利用者が前記音声応答に回答できない状態であるか否かを判断する、
請求項1記載の音声応答装置。 - 前記聴取状態判断部は、前記応答音声の発声時間内の前記周囲音情報に前記利用者音声と前記利用者以外の音声が含まれているときは、前記利用者が前記音声応答に回答できない状態と判断する、
請求項5記載の音声応答装置。 - 前記聴取状態判断部は、前記周囲音情報より取得した前記利用者の発声区間に、前記応答音声の発声開始時刻、または、発声終了時刻が含まれているときは、前記利用者が前記音声応答に回答できない状態と判断する、
請求項5記載の音声応答装置。 - 前記聴取状態判断部は、前記応答音声の発声時間内の前記周囲音情報に任意の物理音が含まれているときは、前記利用者が前記音声応答に回答できない状態と判断する、
請求項5記載の音声応答装置。 - 前記中断後に取得された周囲音情報に基づき、前記音声応答の再開処理を行う応答再開処理部を具備する、
請求項1記載の音声応答装置。 - 利用者に対して音声応答する音声応答方法において、
前記音声応答を行った時の利用者の周囲の音に関する周囲音情報を取得する周囲音声取得ステップと、
前記周囲音情報に含まれる利用者音声、応答音声、環境音を分析し、(1)前記利用者が前記応答音声の回答している状態、(2)前記利用者に前記応答音声が聞こえていない状態、または、(3)前記利用者が前記音声応答に回答できない状態かを判断する聴取状態判断ステップと、
(1)前記利用者が前記音声応答に回答している場合は、前記回答に対する新たな音声応答を生成し、(2)前記利用者に前記応答音声が聞こえていない場合は、前記音声応答を繰り返し、(3)前記利用者が前記音声応答に回答できない場合は、前記音声応答を中断する応答内容生成ステップと、
を具備する音声応答方法。 - 利用者に対して音声応答するためのコンピュータで実現される音声応答プログラムにおいて、
前記音声応答を行った時の利用者の周囲の音に関する周囲音情報を取得する周囲音声取得機能と、
前記周囲音情報に含まれる利用者音声、応答音声、環境音を分析し、(1)前記利用者が前記応答音声の回答している状態、(2)前記利用者に前記応答音声が聞こえていない状態、または、(3)前記利用者が前記音声応答に回答できない状態かを判断する聴取状態判断機能と、
(1)前記利用者が前記音声応答に回答している場合は、前記回答に対する新たな音声応答を生成し、(2)前記利用者に前記応答音声が聞こえていない場合は、前記音声応答を繰り返し、(3)前記利用者が前記音声応答に回答できない場合は、前記音声応答を中断する応答内容生成機能と、
を実現する音声応答プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007089640A JP2008249893A (ja) | 2007-03-29 | 2007-03-29 | 音声応答装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007089640A JP2008249893A (ja) | 2007-03-29 | 2007-03-29 | 音声応答装置及びその方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008249893A true JP2008249893A (ja) | 2008-10-16 |
Family
ID=39974925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007089640A Pending JP2008249893A (ja) | 2007-03-29 | 2007-03-29 | 音声応答装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008249893A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111708507A (zh) * | 2019-03-18 | 2020-09-25 | 柯尼卡美能达株式会社 | 声音信息处理装置以及记录介质 |
JP2021051212A (ja) * | 2019-09-25 | 2021-04-01 | トヨタ自動車株式会社 | 情報処理方法 |
JP2022033841A (ja) * | 2020-06-23 | 2022-03-02 | 株式会社ユピテル | システム及びプログラム |
-
2007
- 2007-03-29 JP JP2007089640A patent/JP2008249893A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111708507A (zh) * | 2019-03-18 | 2020-09-25 | 柯尼卡美能达株式会社 | 声音信息处理装置以及记录介质 |
CN111708507B (zh) * | 2019-03-18 | 2023-06-30 | 柯尼卡美能达株式会社 | 声音信息处理装置以及记录介质 |
JP2021051212A (ja) * | 2019-09-25 | 2021-04-01 | トヨタ自動車株式会社 | 情報処理方法 |
JP7259680B2 (ja) | 2019-09-25 | 2023-04-18 | トヨタ自動車株式会社 | 情報処理方法 |
JP2022033841A (ja) * | 2020-06-23 | 2022-03-02 | 株式会社ユピテル | システム及びプログラム |
JP7403171B2 (ja) | 2020-06-23 | 2023-12-22 | 株式会社ユピテル | システム及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11922095B2 (en) | Device selection for providing a response | |
JP4837917B2 (ja) | 音声に基づく装置制御 | |
US11204685B1 (en) | Voice communication targeting user interface | |
KR102513461B1 (ko) | 헤드폰 시스템 | |
US9792901B1 (en) | Multiple-source speech dialog input | |
JP2005084253A (ja) | 音響処理装置、方法、プログラム及び記憶媒体 | |
JP2014191029A (ja) | 音声認識システムおよび音声認識システムの制御方法 | |
WO2017141530A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6904357B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US20240096343A1 (en) | Voice quality enhancement method and related device | |
CN109473097B (zh) | 一种智能语音设备及其控制方法 | |
JP2018109663A (ja) | 音声処理装置、対話システム、端末装置、プログラム及び音声処理方法 | |
JP2007334968A (ja) | 音声切換装置 | |
JP2019184809A (ja) | 音声認識装置、音声認識方法 | |
JP6678315B2 (ja) | 音声再生方法、音声対話装置及び音声対話プログラム | |
JP2008249893A (ja) | 音声応答装置及びその方法 | |
JP5251588B2 (ja) | 携帯電話端末装置及び通話伝達の判断方法 | |
WO2018198791A1 (ja) | 信号処理装置および方法、並びにプログラム | |
JP2005192004A (ja) | ヘッドセットおよびヘッドセットの音楽データの再生制御方法 | |
JP7456387B2 (ja) | 情報処理装置、及び情報処理方法 | |
JP2014171202A (ja) | 一時停止機能を有する映像再生装置または音声再生装置 | |
JP2018165805A (ja) | 対話装置、対話装置の制御方法およびプログラム | |
JP2018081147A (ja) | コミュニケーション装置、サーバ、制御方法、および情報処理プログラム | |
WO2020066154A1 (ja) | 情報処理装置及び情報処理方法、コンピュータプログラム、並びに対話システム | |
JP2015055790A (ja) | 音声応答システム、音声処理装置、音声応答装置、音声応答方法、及び音声処理プログラム |