JP6664359B2 - 音声処理装置、方法およびプログラム - Google Patents
音声処理装置、方法およびプログラム Download PDFInfo
- Publication number
- JP6664359B2 JP6664359B2 JP2017172162A JP2017172162A JP6664359B2 JP 6664359 B2 JP6664359 B2 JP 6664359B2 JP 2017172162 A JP2017172162 A JP 2017172162A JP 2017172162 A JP2017172162 A JP 2017172162A JP 6664359 B2 JP6664359 B2 JP 6664359B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- response
- content data
- time
- response content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Telephonic Communication Services (AREA)
Description
[第1の実施形態]
(構成)
図1は、この発明の第1の実施形態に係る、ユーザとの音声対話を実現するシステムの概略構成図である。本実施形態では、音声処理装置の非限定的な例として音声対話装置について説明する。
次に、以上のように構成された音声対話装置1の動作を説明する。
以上詳述したように、この発明の第1の実施形態では、以下のような効果が奏せられる。
なお、この発明は上記第1の実施形態に限定されるものではない。例えば、上記第1の実施形態では、音声対話装置とサーバとの組み合わせによってユーザとの対話を実現している。しかしながら、音声対話装置とサーバとを1つの装置として実現してもよい。また、上記第1の実施形態では、応答音声の出力とフィラー情報の出力との両方を実現する音声対話装置について説明したが、これらを別個の異なる装置によって実現してもよい。
Claims (7)
- ユーザからの発話音声の認識、当該認識の結果に基づく応答内容データの生成、および当該応答内容データに対応する応答音声の合成の実施とともに使用される、音声処理装置であって、
前記発話音声の長さと、過去の応答内容データに関する情報とに基づいて、前記発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を予測する予測部と、
前記予測された遅延時間内において、当該遅延時間に応じたフィラー情報を出力するフィラー情報出力部と
を備え、
前記予測部は、
前記発話音声の長さを検出し、当該検出された発話音声の長さに基づいて前記発話音声の認識に要する第1の時間を予測する手段と、
前記過去の応答内容データに関する情報に基づいて、前記発話音声の認識の結果に基づく応答内容データの生成に要する第2の時間を予測する手段と、
前記過去の応答内容データに関する情報に基づいて、前記生成される応答内容データに対応する応答音声の合成に要する第3の時間を予測する手段と、
前記予測された第1、第2および第3の時間に基づいて、前記発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を予測する手段と
を備える音声処理装置。 - 前記第1の時間を予測する手段は、
前記ユーザからの過去の発話音声の長さと、当該長さの発話音声の認識に要した時間とに基づいて、前記発話音声の長さと前記発話音声の認識に要する時間との係数を算出する手段と、
前記検出された発話音声の長さと、前記算出された、発話音声の長さと発話音声の認識に要する時間との係数とに基づいて、前記第1の時間を予測する手段と
を備える、請求項1に記載の音声処理装置。 - 前記過去の応答内容データに関する情報は、前記過去の応答内容データに対応する応答音声の合成に要した時間を含み、
前記第3の時間を予測する手段は、前記第3の時間を、所定の回数の前記過去の応答音声の合成に要した時間の平均値に基づいて予測する、請求項1又は2に記載の音声処理装置。 - 前記出力されたフィラー情報の再生が終了した際に、前記ユーザからの発話音声に対する応答音声の合成が完了しているか否かを判定する判定部を、さらに備え、
前記フィラー情報出力部は、前記応答音声の合成が完了していないと判定された場合に、追加のフィラー情報を出力する、請求項1乃至3のいずれかに記載の音声処理装置。 - 前記出力されたフィラー情報の再生が終了した際に、前記ユーザからの発話音声に対する応答音声の合成が完了しているか否かを判定し、さらに、前記応答音声の合成が完了していないと判定された場合に、前記ユーザからの発話音声の認識と、当該認識の結果に基づく応答内容データの生成が完了しているか否かを判定する判定部を、さらに備え、
前記過去の応答内容データに関する情報は、前記ユーザからの過去の発話音声に対する応答内容データの長さと、当該長さの応答内容データに対応する応答音声の合成に要した時間とを含み、
前記第3の時間を予測する手段は、
前記ユーザからの過去の発話音声に対する応答内容データの長さと、当該長さの応答内容データに対応する応答音声の合成に要した時間とに基づいて、前記応答内容データの長さと前記応答音声の合成に要する時間との係数を算出する手段と、
前記応答音声の合成が完了していないと判定され、かつ、前記ユーザからの発話音声の認識と、当該認識の結果に基づく応答内容データの生成が完了していると判定された場合に、前記ユーザからの発話音声に対する応答内容データの長さと、前記算出された、応答内容データの長さと応答音声の合成に要する時間との係数とに基づいて、前記第3の時間を再予測する手段とを備え、
前記遅延時間を予測する手段は、前記再予測された第3の時間に基づいて、前記ユーザからの発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を再予測し、
前記フィラー情報出力部は、前記再予測された遅延時間内において、前記ユーザからの発話音声の終了時点からの経過時間を前記再予測された遅延時間から減算した時間に応じた、追加のフィラー情報を出力する、請求項1乃至3のいずれかに記載の音声処理装置。 - ユーザからの発話音声の認識、当該認識の結果に基づく応答内容データの生成、および当該応答内容データに対応する応答音声の合成の実施とともに使用される、コンピュータおよびメモリを備える装置が実行する音声処理方法であって、
前記発話音声の長さと、過去の応答内容データに関する情報とに基づいて、前記発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を予測する過程と、
前記予測された遅延時間内において、当該遅延時間に応じたフィラー情報を出力する過程と
を備え、
前記予測する過程は、
前記発話音声の長さを検出し、当該検出された発話音声の長さに基づいて前記発話音声の認識に要する第1の時間を予測する過程と、
前記過去の応答内容データに関する情報に基づいて、前記発話音声の認識の結果に基づく応答内容データの生成に要する第2の時間を予測する過程と、
前記過去の応答内容データに関する情報に基づいて、前記生成される応答内容データに対応する応答音声の合成に要する第3の時間を予測する過程と、
前記予測された第1、第2および第3の時間に基づいて、前記発話音声の終了時点から前記応答音声の出力を開始するまでに要する遅延時間を予測する過程と
を備える音声処理方法。 - 請求項1乃至5のいずれかに記載の音声処理装置が備える前記各部および当該各部が備える前記各手段としてコンピュータを機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017172162A JP6664359B2 (ja) | 2017-09-07 | 2017-09-07 | 音声処理装置、方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017172162A JP6664359B2 (ja) | 2017-09-07 | 2017-09-07 | 音声処理装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019045831A JP2019045831A (ja) | 2019-03-22 |
JP6664359B2 true JP6664359B2 (ja) | 2020-03-13 |
Family
ID=65816438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017172162A Active JP6664359B2 (ja) | 2017-09-07 | 2017-09-07 | 音声処理装置、方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6664359B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113711307B (zh) * | 2019-04-23 | 2023-06-27 | 三菱电机株式会社 | 设备控制装置及设备控制方法 |
CN113450096A (zh) * | 2021-06-25 | 2021-09-28 | 未鲲(上海)科技服务有限公司 | 资源转移数据的处理方法、装置、电子设备及介质 |
CN115565535B (zh) * | 2022-09-21 | 2024-04-12 | 南京浮点智算数字科技有限公司 | 一种智能语音客服系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5958475B2 (ja) * | 2014-01-17 | 2016-08-02 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
JP6495014B2 (ja) * | 2015-01-08 | 2019-04-03 | シャープ株式会社 | 音声対話制御装置、音声対話制御装置の制御方法、および音声対話装置 |
-
2017
- 2017-09-07 JP JP2017172162A patent/JP6664359B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019045831A (ja) | 2019-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106971709B (zh) | 统计参数模型建立方法和装置、语音合成方法和装置 | |
EP3061086B1 (en) | Text-to-speech performance evaluation | |
JP6731326B2 (ja) | 音声対話装置及び音声対話方法 | |
JP4539537B2 (ja) | 音声合成装置,音声合成方法,およびコンピュータプログラム | |
JP4869268B2 (ja) | 音響モデル学習装置およびプログラム | |
JP6664359B2 (ja) | 音声処理装置、方法およびプログラム | |
JP2006098993A (ja) | 音声処理装置およびそのためのコンピュータプログラム | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
JPWO2017168936A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6111802B2 (ja) | 音声対話装置及び対話制御方法 | |
EP3567586B1 (en) | Voice interaction system, voice interaction method, and program | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
EP4231283A1 (en) | Speech recognition method and apparatus, and device, storage medium and program product | |
JP2006285254A (ja) | 音声速度測定方法及び装置並びに録音装置 | |
JP2015014665A (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
CN112908308B (zh) | 一种音频处理方法、装置、设备及介质 | |
JP6028556B2 (ja) | 対話制御方法及び対話制御用コンピュータプログラム | |
JP2018185561A (ja) | 対話支援システム、対話支援方法、及び対話支援プログラム | |
JP6621593B2 (ja) | 対話装置、対話システム、及び対話装置の制御方法 | |
JP2018128575A (ja) | 話し終わり判定装置、話し終わり判定方法およびプログラム | |
EP4165542A1 (en) | Using canonical utterances for text or voice communication | |
JP5223843B2 (ja) | 情報処理装置およびプログラム | |
JP6044490B2 (ja) | 情報処理装置、話速データ生成方法、及びプログラム | |
JP5914119B2 (ja) | 音響モデル性能評価装置とその方法とプログラム | |
JP6233103B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191210 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6664359 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |