JP7378770B2 - 評価装置、評価方法、及び評価プログラム - Google Patents
評価装置、評価方法、及び評価プログラム Download PDFInfo
- Publication number
- JP7378770B2 JP7378770B2 JP2019154876A JP2019154876A JP7378770B2 JP 7378770 B2 JP7378770 B2 JP 7378770B2 JP 2019154876 A JP2019154876 A JP 2019154876A JP 2019154876 A JP2019154876 A JP 2019154876A JP 7378770 B2 JP7378770 B2 JP 7378770B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- distance
- microphone
- throat
- spectral feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims description 55
- 230000003595 spectral effect Effects 0.000 claims description 130
- 230000005236 sound signal Effects 0.000 claims description 49
- 238000004364 calculation method Methods 0.000 claims description 47
- 238000012937 correction Methods 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 13
- 238000000034 method Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000013459 approach Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 description 52
- 238000001514 detection method Methods 0.000 description 40
- 238000012854 evaluation process Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
上記式(1)中、mxは第2のスペクトル特徴量であるメルケプストラム係数を示し、mx’は第1のスペクトル特徴量であるメルケプストラム係数を示し、DはLPCの次数である整数を示す。MCDは、聴取音の品質を評価するためのパラメータであり、0に近いほど2つの音声のスペクトル特性が近いことを示す。なお、距離算出部13は、第1のスペクトルと第2のスペクトルとの近さ(距離)を評価することができるパラメータであれば他のパラメータを算出してもよい。例えば、上記式(1)に示すルートの項をスペクトル距離として算出してもよいし、上記式(1)に示すΣの値をスペクトル距離として算出してもよいし、LPCケプストラム距離(LCD)をスペクトル距離として算出してもよい。
Claims (9)
- 咽喉マイクの装着位置を評価する評価装置であって、
ユーザの咽喉部の複数の装着位置のそれぞれに対応して咽喉マイクからの音声信号を基に第1のスペクトル特徴量を抽出し、音響マイクからの音声信号を基に第2のスペクトル特徴量を抽出する抽出部と、
前記第1のスペクトル特徴量及び前記第2のスペクトル特徴量を基に、スペクトル距離を算出する距離算出部と、
前記複数の装着位置のそれぞれに対応して、前記距離算出部によって時間的に連続して算出された前記スペクトル距離の平均値を算出および出力する距離出力部と、
を備える評価装置。 - 前記第1のスペクトル特徴量を、補正用のモデルを用いて、第2のスペクトル特徴量の特性に近づくように補正する補正部をさらに備え、
前記距離算出部は、補正後の前記第1のスペクトル特徴量及び前記第2のスペクトル特徴量を基に前記スペクトル距離を算出する、
請求項1に記載の評価装置。 - 前記距離算出部は、前記スペクトル距離として前記第1のスペクトル特徴量と前記第2のスペクトル特徴量の差を数値化して前記スペクトル距離を算出する、
請求項1又は2に記載の評価装置。 - 前記距離算出部は、前記スペクトル距離としてメルケプストラム距離を算出する、
請求項3に記載の評価装置。 - 前記距離出力部は、前記咽喉マイクあるいは前記音響マイクからの前記音声信号を基に認識された発話区間において算出された前記スペクトル距離の平均値を算出する、
請求項1~4のいずれか1項に記載の評価装置。 - 前記距離出力部は、前記咽喉マイクあるいは前記音響マイクからの前記音声信号を基に一定期間ごとに時間窓を順次シフトさせて前記スペクトル距離の平均値を算出し、シフトさせた前記時間窓ごとの前記平均値を順次出力する、
請求項1~5のいずれか1項に記載の評価装置。 - 前記距離出力部は、ユーザの咽喉部の複数の装着位置を順次画面上に表示させるとともに、それぞれの装着位置に対応して算出した前記スペクトル距離の平均値を順次画面上に表示させる、
請求項1~6のいずれか1項に記載の評価装置。 - 咽喉マイクの装着位置を評価する評価方法であって、
ユーザの咽喉部の複数の装着位置のそれぞれに対応して咽喉マイクからの音声信号を基に第1のスペクトル特徴量を抽出し、音響マイクからの音声信号を基に第2のスペクトル特徴量を抽出する抽出ステップと、
前記第1のスペクトル特徴量及び前記第2のスペクトル特徴量を基に、スペクトル距離を算出する距離算出ステップと、
前記複数の装着位置のそれぞれに対応して、前記距離算出ステップにおいて時間的に連続して算出された前記スペクトル距離の平均値を算出および出力する距離出力ステップと、
を備える評価方法。 - コンピュータを、
ユーザの咽喉部の複数の装着位置のそれぞれに対応して咽喉マイクからの音声信号を基に第1のスペクトル特徴量を抽出し、音響マイクからの音声信号を基に第2のスペクトル特徴量を抽出する抽出部、
前記第1のスペクトル特徴量及び前記第2のスペクトル特徴量を基に、スペクトル距離を算出する距離算出部、及び
前記複数の装着位置のそれぞれに対応して、前記距離算出部によって時間的に連続して算出された前記スペクトル距離の平均値を算出および出力する距離出力部、
として機能させる評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019154876A JP7378770B2 (ja) | 2019-08-27 | 2019-08-27 | 評価装置、評価方法、及び評価プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019154876A JP7378770B2 (ja) | 2019-08-27 | 2019-08-27 | 評価装置、評価方法、及び評価プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021033134A JP2021033134A (ja) | 2021-03-01 |
JP7378770B2 true JP7378770B2 (ja) | 2023-11-14 |
Family
ID=74678258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019154876A Active JP7378770B2 (ja) | 2019-08-27 | 2019-08-27 | 評価装置、評価方法、及び評価プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7378770B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250577A (ja) | 1999-02-24 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識装置及び同装置に使用される学習方法ならびに学習装置及び同方法がプログラムされ記録された記録媒体 |
JP2005140860A (ja) | 2003-11-04 | 2005-06-02 | Canon Inc | 音声認識装置およびその制御方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2473195C (en) * | 2003-07-29 | 2014-02-04 | Microsoft Corporation | Head mounted multi-sensory audio input system |
JP2019010436A (ja) * | 2017-06-30 | 2019-01-24 | ヤマハ株式会社 | 生体センサおよび生体センサの信号取得方法 |
-
2019
- 2019-08-27 JP JP2019154876A patent/JP7378770B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250577A (ja) | 1999-02-24 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識装置及び同装置に使用される学習方法ならびに学習装置及び同方法がプログラムされ記録された記録媒体 |
JP2005140860A (ja) | 2003-11-04 | 2005-06-02 | Canon Inc | 音声認識装置およびその制御方法 |
Non-Patent Citations (1)
Title |
---|
鈴木貴仁他,スペクトラム変換とボトルネック特徴量を用いた咽喉マイクの大語彙連続音声認識,日本音響学会2018年春季研究発表会講演論文集[CD-ROM],2018年03月,pp.121-122 |
Also Published As
Publication number | Publication date |
---|---|
JP2021033134A (ja) | 2021-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110148402B (zh) | 语音处理方法、装置、计算机设备及存储介质 | |
US10628484B2 (en) | Vibrational devices as sound sensors | |
US7949523B2 (en) | Apparatus, method, and computer program product for processing voice in speech | |
WO2019214047A1 (zh) | 建立声纹模型的方法、装置、计算机设备和存储介质 | |
US20150301796A1 (en) | Speaker verification | |
US6032115A (en) | Apparatus and method for correcting the difference in frequency characteristics between microphones for analyzing speech and for creating a recognition dictionary | |
KR20160122542A (ko) | 발음 유사도 측정 방법 및 장치 | |
US7908142B2 (en) | Apparatus and method for identifying prosody and apparatus and method for recognizing speech | |
JP3673507B2 (ja) | 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム | |
JP5803125B2 (ja) | 音声による抑圧状態検出装置およびプログラム | |
US9531333B2 (en) | Formant amplifier | |
JP7378770B2 (ja) | 評価装置、評価方法、及び評価プログラム | |
JP2003044078A (ja) | 発声速度正規化分析を用いた音声認識装置 | |
JP5949634B2 (ja) | 音声合成システム、及び音声合成方法 | |
JP2010060846A (ja) | 合成音声評価システム及び合成音声評価方法 | |
CN116312561A (zh) | 一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置 | |
JP4883750B2 (ja) | 音響評定装置、およびプログラム | |
JP2007206603A (ja) | 音響モデルの作成方法 | |
JP2014106247A (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
Kyriakides et al. | Isolated word endpoint detection using time-frequency variance kernels | |
US11806213B2 (en) | Voice transmission compensation apparatus, voice transmission compensation method and program | |
JP4632831B2 (ja) | 音声認識方法および音声認識装置 | |
JP2009025388A (ja) | 音声認識装置 | |
JP2004309959A (ja) | 音声認識装置および音声認識方法 | |
JP2007127891A (ja) | 発話主体同定装置及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20190919 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220712 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230606 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231025 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7378770 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |