JP6459330B2 - 音声認識装置、音声認識方法、及び音声認識プログラム - Google Patents
音声認識装置、音声認識方法、及び音声認識プログラム Download PDFInfo
- Publication number
- JP6459330B2 JP6459330B2 JP2014188865A JP2014188865A JP6459330B2 JP 6459330 B2 JP6459330 B2 JP 6459330B2 JP 2014188865 A JP2014188865 A JP 2014188865A JP 2014188865 A JP2014188865 A JP 2014188865A JP 6459330 B2 JP6459330 B2 JP 6459330B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- voice
- voice recognition
- section
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000012545 processing Methods 0.000 claims description 30
- 238000003384 imaging method Methods 0.000 claims description 9
- 210000004556 brain Anatomy 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 49
- 230000006870 function Effects 0.000 description 13
- 230000004044 response Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Navigation (AREA)
Description
前述実施形態に限定されるものではなく、例えば、以下に示す変形または拡張が可能である。
「音声認識処理することなくユーザに音声認識要求する意図が存在するか否かを判定する」方法の一例が、ステップS6〜S10に示される処理となるが、これらの処理は、その一部または全部を用いて判定しても良いし、単独で他の判定処理を行っても、この他の判定処理をステップS6〜S10の一部又は全部に加えて判定しても良い。
Claims (4)
- 音声ガイダンスの再生区間中及びその後の音データを取得する音取得手段(3)の取得音から前記音声ガイダンスの再生音を除去する再生音除去手段(3a)と、
前記再生音除去手段により前記音声ガイダンスの再生音が除去された除去後の音データに基づいて、前記音取得手段の取得音に含まれるユーザ発話音を音声認識処理することなく音声認識要求する意図が存在するか否かを判定する判定手段(3b、9a、10a)と、
前記判定手段により音声認識要求する意図が存在すると判定されたときには音声ガイダンスの再生区間を音声認識対象区間として含め、前記判定手段により音声認識要求する意図が存在しないと判定されたときには前記音声ガイダンスの再生区間を音声認識対象区間に含めずその後の前記取得音に含まれる前記ユーザ発話音の音入力区間を含む区間を音声認識対象区間に設定する音声認識対象区間設定手段(3c)と、
前記音声認識対象区間設定手段により設定された前記音声認識対象区間にて音声認識する音声認識部(4)と、を備えることを特徴とする音声認識装置。 - 請求項1記載の音声認識装置において、
前記判定手段は、
前記再生音除去手段により前記音声ガイダンスの再生音が除去された除去後の音データに基づいて、前記音取得手段の取得音に含まれるユーザ発話音に音声認識要求する意図が存在するか否かを判定するときには、
(A)前記除去後の音データの音量が所定閾値を超える、
(B)前記所定閾値を超えた音量が所定時間以上継続する、
(C)前記除去後の音データ中にユーザ発話音が存在する、
(D)前記除去後の音データに基づいてユーザがマイクに向いていると判定、
(E)前記除去後の音データ中にユーザ話者が複数存在しない、
(F)撮像手段により撮像されたユーザの顔、身体又は視線がマイクに向いていると判定、
(G)人の脳波を検出して前記意図が存在すると判定、
の条件のうち、少なくとも1つ以上の条件を満たしたときに、前記音取得手段の取得音に含まれるユーザ発話音に音声認識要求する意図が存在すると判定することを特徴とする音声認識装置。 - 音声ガイダンスの再生区間中及びその後の音データを取得する音取得手段の取得音から前記音声ガイダンスの再生音を除去し、
前記音声ガイダンスの再生音が除去された除去後の音データに基づいて、前記音取得手段の取得音に含まれるユーザ発話音を音声認識処理することなく音声認識要求する意図が存在するか否かを判定し、
音声認識要求する意図が存在すると判定されたときには音声ガイダンスの再生区間を音声認識対象区間として含め、音声認識要求する意図が存在しないと判定されたときには前記音声ガイダンスの再生区間を音声認識対象区間に含めずその後の前記取得音に含まれる前記ユーザ発話音の音入力区間を含む区間を音声認識対象区間に設定し、
設定された前記音声認識対象区間にて音声認識する音声認識方法。 - 音声認識装置に、
音声ガイダンスの再生区間中及びその後の音データを取得する音取得手段の取得音から前記音声ガイダンスの再生音を除去する手順と、
前記音声ガイダンスの再生音が除去された除去後の音データに基づいて、前記音取得手段の取得音に含まれるユーザ発話音を音声認識処理することなく音声認識要求する意図が存在するか否かを判定する手順と、
音声認識要求する意図が存在すると判定されたときには音声ガイダンスの再生区間を音声認識対象区間として含め、音声認識要求する意図が存在しないと判定されたときには前記音声ガイダンスの再生区間を音声認識対象区間に含めずその後の前記取得音に含まれる前記ユーザ発話音の音入力区間を含む区間を音声認識対象区間に設定する手順と、
設定された前記音声認識対象区間にて音声認識する手順と、を実行させる音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014188865A JP6459330B2 (ja) | 2014-09-17 | 2014-09-17 | 音声認識装置、音声認識方法、及び音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014188865A JP6459330B2 (ja) | 2014-09-17 | 2014-09-17 | 音声認識装置、音声認識方法、及び音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016061888A JP2016061888A (ja) | 2016-04-25 |
JP6459330B2 true JP6459330B2 (ja) | 2019-01-30 |
Family
ID=55795944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014188865A Expired - Fee Related JP6459330B2 (ja) | 2014-09-17 | 2014-09-17 | 音声認識装置、音声認識方法、及び音声認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6459330B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6673243B2 (ja) * | 2017-02-02 | 2020-03-25 | トヨタ自動車株式会社 | 音声認識装置 |
JP6916647B2 (ja) * | 2017-03-31 | 2021-08-11 | 本田技研工業株式会社 | 車両制御システム、車両制御方法、および車両制御プログラム |
JP2021144259A (ja) * | 2018-06-06 | 2021-09-24 | ソニーグループ株式会社 | 情報処理装置および方法、並びにプログラム |
JP7206167B2 (ja) * | 2019-08-13 | 2023-01-17 | Tvs Regza株式会社 | 受信装置 |
WO2022176085A1 (ja) * | 2021-02-18 | 2022-08-25 | 三菱電機株式会社 | 車載向け音声分離装置及び音声分離方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4282704B2 (ja) * | 2006-09-27 | 2009-06-24 | 株式会社東芝 | 音声区間検出装置およびプログラム |
JP2009025579A (ja) * | 2007-07-20 | 2009-02-05 | Nissan Motor Co Ltd | 音声認識装置および音声認識方法 |
EP2107553B1 (en) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Method for determining barge-in |
JP2010281855A (ja) * | 2009-06-02 | 2010-12-16 | Nissan Motor Co Ltd | 音声対話装置および音声対話方法 |
JP5431282B2 (ja) * | 2010-09-28 | 2014-03-05 | 株式会社東芝 | 音声対話装置、方法、プログラム |
JP2013160877A (ja) * | 2012-02-03 | 2013-08-19 | Mitsubishi Electric Corp | エレベータの音声認識装置および音声認識方法 |
JP6066471B2 (ja) * | 2012-10-12 | 2017-01-25 | 本田技研工業株式会社 | 対話システム及び対話システム向け発話の判別方法 |
-
2014
- 2014-09-17 JP JP2014188865A patent/JP6459330B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016061888A (ja) | 2016-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9230538B2 (en) | Voice recognition device and navigation device | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
WO2017138934A1 (en) | Techniques for spatially selective wake-up word recognition and related systems and methods | |
JP2008299221A (ja) | 発話検知装置 | |
CN112397065A (zh) | 语音交互方法、装置、计算机可读存储介质及电子设备 | |
EP1494208A1 (en) | Method for controlling a speech dialog system and speech dialog system | |
EP3654329B1 (en) | In-vehicle device and speech recognition method | |
WO2018167949A1 (ja) | 車内通話制御装置、車内通話システムおよび車内通話制御方法 | |
CN112585674B (zh) | 信息处理装置、信息处理方法和存储介质 | |
JP6827536B2 (ja) | 音声認識装置および音声認識方法 | |
JP6847324B2 (ja) | 音声認識装置、音声認識システム、及び音声認識方法 | |
JP2018116206A (ja) | 音声認識装置、音声認識方法及び音声認識システム | |
JP5375423B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP6673243B2 (ja) | 音声認識装置 | |
JP6539940B2 (ja) | 音声認識装置及び音声認識プログラム | |
JP5074759B2 (ja) | 対話制御装置、対話制御方法及び対話制御プログラム | |
JP2020148805A (ja) | 音声認識システム、及び、音声認識方法 | |
JP4178931B2 (ja) | 音声認識装置 | |
JP2006208486A (ja) | 音声入力装置 | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JP7172120B2 (ja) | 音声認識装置及び音声認識方法 | |
JP4281369B2 (ja) | 音声認識装置 | |
JP7429107B2 (ja) | 音声翻訳装置、音声翻訳方法及びそのプログラム | |
JP2008309865A (ja) | 音声認識装置および音声認識方法 | |
JP7242873B2 (ja) | 音声認識補助装置および音声認識補助方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181217 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6459330 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |