JP7552481B2 - 音声認識プログラム及び音声認識装置 - Google Patents
音声認識プログラム及び音声認識装置 Download PDFInfo
- Publication number
- JP7552481B2 JP7552481B2 JP2021060919A JP2021060919A JP7552481B2 JP 7552481 B2 JP7552481 B2 JP 7552481B2 JP 2021060919 A JP2021060919 A JP 2021060919A JP 2021060919 A JP2021060919 A JP 2021060919A JP 7552481 B2 JP7552481 B2 JP 7552481B2
- Authority
- JP
- Japan
- Prior art keywords
- volume
- frequent
- voice
- value
- judgment value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 68
- 230000035945 sensitivity Effects 0.000 claims description 64
- 238000004364 calculation method Methods 0.000 claims description 47
- 230000007613 environmental effect Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 description 28
- 238000005259 measurement Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 16
- 238000012937 correction Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 230000010365 information processing Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
- Machine Translation (AREA)
Description
11a 音声認識プログラム
15 内蔵マイク(音声入力装置の一部、音声入力手段の一部)
20 有線マイク(音声入力装置の一部、音声入力手段の一部)
21 無線マイク(音声入力装置の一部、音声入力手段の一部)
V 音声
Vm 最頻音量
Th 閾値オフセット値
St_B 開始判定値
Ed_B 終了判定値
S22,S23 最頻音量取得ステップ、最頻音量取得手段
S25 オフセット算出ステップ
S26 開始判定値算出ステップ、開始判定値算出手段
S27 終了判定値算出ステップ、終了判定値算出手段
S20,S40 種類取得ステップ
S3~S5 事前判定値算出ステップ
S7~S10 音声認識ステップ、音声認識手段
Claims (7)
- コンピュータに音声認識処理を実行させる音声認識プログラムであって、
入力された音声の音量の最頻値である最頻音量を取得する最頻音量取得ステップと、
その最頻音量取得ステップで取得された最頻音量から、周囲の環境音と発話との音量差である閾値オフセット値を算出するオフセット算出ステップと、
前記最頻音量取得ステップで取得された最頻音量と、前記オフセット算出ステップで算出された閾値オフセット値と、開始感度とを加算した値に基づいて発話の開始を判定する音量である開始判定値を算出する開始判定値算出ステップと、
前記最頻音量取得ステップで取得された最頻音量と、前記オフセット算出ステップで算出された閾値オフセット値と、前記開始感度よりも小さい音量である終了感度とを加算した値に基づいて発話の終了を判定する音量である終了判定値を算出する終了判定値算出ステップと、
入力された前記音声の音量が前記開始判定値算出ステップで算出された開始判定値を超えた場合に音声認識を開始し、前記音声認識の開始後に入力された前記音声の音量が前記終了判定値算出ステップで算出された終了判定値を下回った場合に音声認識を終了する音声認識ステップと、
を備えていることを特徴とする音声認識プログラム。 - 前記最頻音量取得ステップは、その直近の第1所定時間内に入力された前記音声の音量から最頻音量を取得するものであることを特徴とする請求項1記載の音声認識プログラム。
- 最初に前記音声認識ステップを実行する以前の第2所定時間内において、前記最頻音量取得ステップによる最頻音量の取得と、その取得された最頻音量に基づく前記開始判定値算出ステップによる開始判定値の算出とを行う事前判定値算出ステップを備え、
前記音声認識ステップは、前記事前判定値算出ステップで算出された開始判定値に基づいて音声認識を行うことを特徴とする請求項1又は2に記載の音声認識プログラム。 - 最初に前記音声認識ステップを実行する以前の第2所定時間内において、前記最頻音量取得ステップによる最頻音量の取得と、その取得された最頻音量に基づく前記終了判定値算出ステップによる終了判定値の算出とを行う事前判定値算出ステップを備え、
前記音声認識ステップは、前記事前判定値算出ステップで算出された終了判定値に基づいて音声認識を行うことを特徴とする請求項1から3のいずれかに記載の音声認識プログラム。 - 前記最頻音量取得ステップは、その直近の第1所定時間内に入力された前記音声の音量から最頻音量を取得するものであり、
前記第2所定時間は、前記第1所定時間以下の時間であることを特徴とする請求項3又は4に記載の音声認識プログラム。 - 前記音声を入力した音声入力装置の種類を取得する種類取得ステップを備え、
前記最頻音量取得ステップは、入力された前記音声の音量の最頻値を、前記種類取得ステップで取得された音声入力装置の種類に応じて補正した値を最頻音量として取得するものであることを特徴とする請求項1から5のいずれかに記載の音声認識プログラム。 - 音声を入力する音声入力手段と、
その音声入力手段で入力された音声の音量の最頻値である最頻音量を取得する最頻音量取得手段と、
その最頻音量取得手段で取得された最頻音量から、周囲の環境音と発話との音量差である閾値オフセット値を算出するオフセット算出手段と、
前記最頻音量取得手段で取得された最頻音量と、前記オフセット算出手段で算出された閾値オフセット値と、開始感度とを加算した値に基づいて発話の開始を判定する音量である開始判定値を算出する開始判定値算出手段と、
前記最頻音量取得手段で取得された最頻音量と、前記オフセット算出手段で算出された閾値オフセット値と、前記開始感度よりも小さい音量である終了感度とを加算した値に基づいて発話の終了を判定する音量である終了判定値を算出する終了判定値算出手段と、
入力された前記音声の音量が前記開始判定値算出手段で算出された開始判定値を超えた場合に音声認識を開始し、前記音声認識の開始後に入力された前記音声の音量が前記終了判定値算出手段で算出された終了判定値を下回った場合に音声認識を終了する音声認識手段と、を備えていることを特徴とする音声認識装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021013495 | 2021-01-29 | ||
JP2021013495 | 2021-01-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022117374A JP2022117374A (ja) | 2022-08-10 |
JP7552481B2 true JP7552481B2 (ja) | 2024-09-18 |
Family
ID=82750009
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021060919A Active JP7552481B2 (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
JP2021060936A Active JP7542826B2 (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
JP2021060947A Pending JP2022117376A (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021060936A Active JP7542826B2 (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
JP2021060947A Pending JP2022117376A (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (3) | JP7552481B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005031632A (ja) | 2003-06-19 | 2005-02-03 | Advanced Telecommunication Research Institute International | 発話区間検出装置、音声エネルギ正規化装置、コンピュータプログラム及びコンピュータ |
JP2016033530A (ja) | 2014-07-30 | 2016-03-10 | 株式会社東芝 | 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5223843B2 (ja) | 2009-10-22 | 2013-06-26 | 富士通株式会社 | 情報処理装置およびプログラム |
-
2021
- 2021-03-31 JP JP2021060919A patent/JP7552481B2/ja active Active
- 2021-03-31 JP JP2021060936A patent/JP7542826B2/ja active Active
- 2021-03-31 JP JP2021060947A patent/JP2022117376A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005031632A (ja) | 2003-06-19 | 2005-02-03 | Advanced Telecommunication Research Institute International | 発話区間検出装置、音声エネルギ正規化装置、コンピュータプログラム及びコンピュータ |
JP2016033530A (ja) | 2014-07-30 | 2016-03-10 | 株式会社東芝 | 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2022117374A (ja) | 2022-08-10 |
JP7542826B2 (ja) | 2024-09-02 |
JP2022117375A (ja) | 2022-08-10 |
JP2022117376A (ja) | 2022-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6420306B2 (ja) | スピーチエンドポインティング | |
JP5281659B2 (ja) | 音声対話装置、対話制御方法及び対話制御プログラム | |
US10777193B2 (en) | System and device for selecting speech recognition model | |
JP4246703B2 (ja) | 自動音声認識の方法 | |
US20140372121A1 (en) | Speech processing device and method | |
JP7081164B2 (ja) | 表示制御装置、通信装置、表示制御方法および通信方法 | |
JP5431282B2 (ja) | 音声対話装置、方法、プログラム | |
JP6495015B2 (ja) | 音声対話制御装置、音声対話制御装置の制御方法、および音声対話装置 | |
JP2007286097A (ja) | 音声受付クレーム検出方法、装置、音声受付クレーム検出プログラム、記録媒体 | |
US10403289B2 (en) | Voice processing device and voice processing method for impression evaluation | |
JP7552481B2 (ja) | 音声認識プログラム及び音声認識装置 | |
JP6969491B2 (ja) | 音声対話システム、音声対話方法及びプログラム | |
JP2002535708A (ja) | 音声認識方法及び音声認識装置 | |
JP2011002534A (ja) | 音声認識装置 | |
JP7512281B2 (ja) | 対話装置 | |
JP2000250568A (ja) | 音声区間検出装置 | |
JP2015161718A (ja) | 発話検出装置、発話検出方法及び発話検出プログラム | |
JP4437047B2 (ja) | 音声対話装置 | |
TWI585756B (zh) | 口吃偵測方法與裝置、電腦程式產品 | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JP7378770B2 (ja) | 評価装置、評価方法、及び評価プログラム | |
JP2010211122A (ja) | 音声認識装置及び方法 | |
US20240233718A9 (en) | Semantically conditioned voice activity detection | |
JP2020119288A (ja) | 促し発話装置、促し発話方法及びプログラム | |
JP2008225001A (ja) | 音声認識装置および音声認識方法,音声認識用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211223 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230801 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240430 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240806 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7552481 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |