JPS6039700A - 音声区間検出方法 - Google Patents
音声区間検出方法Info
- Publication number
- JPS6039700A JPS6039700A JP58147311A JP14731183A JPS6039700A JP S6039700 A JPS6039700 A JP S6039700A JP 58147311 A JP58147311 A JP 58147311A JP 14731183 A JP14731183 A JP 14731183A JP S6039700 A JPS6039700 A JP S6039700A
- Authority
- JP
- Japan
- Prior art keywords
- linear predictive
- predictive analysis
- distance
- frame
- change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、音声区間と音声の存在しない区間とが連続し
ている入力音より音声区間を検出する音声区間検出方法
に関するものである。
ている入力音より音声区間を検出する音声区間検出方法
に関するものである。
従来例の構成とその問題点
音声認識を行なう場合、マイクから連続して入力される
入力音から、実際の音声の区間を検出することが必須で
ある。従来の音声区間検出方法は、音声区間を専らパワ
の変化を利用して検出していた。すなわち、無音部分と
音声区間を識別するieワのスレッショルドを定め、そ
の値を越える入力があると音声区間とするというもので
あった。この方法では、パワのスレッショルドが高い場
合には一語頭が無声破裂音である場合など、その部分の
パワが小さい場合に音声区間として検出されないことが
生じ、反対にスレッショルドを低くした場合には、音声
区間直前の口中音等の雑音を音声区間に含んでしまいや
すく、音声認識誤りの原因となっていた。
入力音から、実際の音声の区間を検出することが必須で
ある。従来の音声区間検出方法は、音声区間を専らパワ
の変化を利用して検出していた。すなわち、無音部分と
音声区間を識別するieワのスレッショルドを定め、そ
の値を越える入力があると音声区間とするというもので
あった。この方法では、パワのスレッショルドが高い場
合には一語頭が無声破裂音である場合など、その部分の
パワが小さい場合に音声区間として検出されないことが
生じ、反対にスレッショルドを低くした場合には、音声
区間直前の口中音等の雑音を音声区間に含んでしまいや
すく、音声認識誤りの原因となっていた。
発明の目的
本発明は、上記従来例の欠点を除去し、音声区間を正し
く検出することにより、音声認識の認識率を向上させる
ことを目的とするものである。
く検出することにより、音声認識の認識率を向上させる
ことを目的とするものである。
発明の構成
本発明は上記目的を達成するために、入力音をフレーム
に区切り、フレーム毎に線形予測分析(LPG )を行
ない、これにより得られる残差パワの変化、隣接フレー
ム間のLPCケシストラム距離の変化、残差パワに重み
装置LPCケシストラム距離の変化等により音声区間を
判定検出する音声区間検出方法である。
に区切り、フレーム毎に線形予測分析(LPG )を行
ない、これにより得られる残差パワの変化、隣接フレー
ム間のLPCケシストラム距離の変化、残差パワに重み
装置LPCケシストラム距離の変化等により音声区間を
判定検出する音声区間検出方法である。
実施例の説明
以下に本発明の一実施例について図面と共に説明する。
第1図に示すように入力音を10m5毎のフレームに区
切り(ステップ1)、フレーム毎にノクワ及び、LPC
ケシストラムを算出しくステップ2 、3 )、次に隣
接フレーム間の残差・ぐワに重みを置いたケプストラム
距離を算出する(ステップ4)。ケシストラム距離につ
いて説明する。1番目のフレームの第n次のLPCケプ
ストラム係数をCn(I)とすると、工′番目のフレー
ムとCI−1)番目のフレームの間のN次迄の通常のケ
シストラム距離は第(1)式で表わされる。
切り(ステップ1)、フレーム毎にノクワ及び、LPC
ケシストラムを算出しくステップ2 、3 )、次に隣
接フレーム間の残差・ぐワに重みを置いたケプストラム
距離を算出する(ステップ4)。ケシストラム距離につ
いて説明する。1番目のフレームの第n次のLPCケプ
ストラム係数をCn(I)とすると、工′番目のフレー
ムとCI−1)番目のフレームの間のN次迄の通常のケ
シストラム距離は第(1)式で表わされる。
〔ケプストラム距離)2=(Co (I) Co (I
−1))2+ 2 J:、 (cn(x)−cn(x−
i))2・・・・・・(1) ここで0次のLPCケシストラム係数は、残差パワの対
数に相当するものである。これに対し、残差パワに重み
をおいたケシストラム距離は第(2)式で定義される。
−1))2+ 2 J:、 (cn(x)−cn(x−
i))2・・・・・・(1) ここで0次のLPCケシストラム係数は、残差パワの対
数に相当するものである。これに対し、残差パワに重み
をおいたケシストラム距離は第(2)式で定義される。
〔残差パワに重みをおいたケシストラム距離〕2= (
Co (I)−Co(I−1))” X2Σ(cn (
I )−cn(I−1) )2n=t ・・・・・・(2) 本実施例における音声区間検出は、第1図に示すように
先スノクワ変化を調べ、ノ母ワがスレッショルドより大
きい区間を仮の音声区間と定め(ステラf5)、次にそ
の語頭付近で、前記により算出された残差iQワに重み
をおいたケシストラム距離が著しく大きくなるフレーム
を探し、そのフレームを真の語頭として、音声区間を修
正する(ステップ6)ものである。
Co (I)−Co(I−1))” X2Σ(cn (
I )−cn(I−1) )2n=t ・・・・・・(2) 本実施例における音声区間検出は、第1図に示すように
先スノクワ変化を調べ、ノ母ワがスレッショルドより大
きい区間を仮の音声区間と定め(ステラf5)、次にそ
の語頭付近で、前記により算出された残差iQワに重み
をおいたケシストラム距離が著しく大きくなるフレーム
を探し、そのフレームを真の語頭として、音声区間を修
正する(ステップ6)ものである。
次に本実施例の効果について、第2図とともに説明する
。第2図は単語「クマガヤ」の「り」の部分の各種パラ
メータの時間変化を示す。第2図において11はパワ、
12は残差パワ、13は隣接フレームとのケシストラム
距離、14は隣接フレームとの残差/4’ワに重みをお
いたケシストラム距離を示す。第2図において、パワ1
1と残差パワ12は音声区間全体にわたって高いレベル
を示すが語頭の正確な位置は雑音の影響等により見い出
しにくり、一方隣接フレームとのケプストラム距離13
、隣接フレームとの・ぐワに重みを置いたケシストラム
距離14は語頭で著しく大きな値が得られるが、音声の
定常部分では値が小さくなることが示される。本実施例
はこれらノクラメータの良好な組み合わせの例であり、
先ずノやワ11により音声区間を大まかに検出し、次に
語頭な隣接フレームとの残差i4ワに重みをおいたケシ
ストラム距離14を用いて修正することにより、音声区
間検出の精度を高めるものである。
。第2図は単語「クマガヤ」の「り」の部分の各種パラ
メータの時間変化を示す。第2図において11はパワ、
12は残差パワ、13は隣接フレームとのケシストラム
距離、14は隣接フレームとの残差/4’ワに重みをお
いたケシストラム距離を示す。第2図において、パワ1
1と残差パワ12は音声区間全体にわたって高いレベル
を示すが語頭の正確な位置は雑音の影響等により見い出
しにくり、一方隣接フレームとのケプストラム距離13
、隣接フレームとの・ぐワに重みを置いたケシストラム
距離14は語頭で著しく大きな値が得られるが、音声の
定常部分では値が小さくなることが示される。本実施例
はこれらノクラメータの良好な組み合わせの例であり、
先ずノやワ11により音声区間を大まかに検出し、次に
語頭な隣接フレームとの残差i4ワに重みをおいたケシ
ストラム距離14を用いて修正することにより、音声区
間検出の精度を高めるものである。
なお、残差ノ母ワに重みをおいたケシストラム距離14
として、第(2)式の他に、第(3)式のように定義す
ることもできる。これを、用いてもほぼ同様な結果を得
られる。
として、第(2)式の他に、第(3)式のように定義す
ることもできる。これを、用いてもほぼ同様な結果を得
られる。
〔残差)切に重みをおいたケシストラム距離〕2QkX
(Co (I)−Co (I 1))2+2Σ(cn
(I)−cn (I−1) )21 ・・・・・・(3) なお、k〉1である。
(Co (I)−Co (I 1))2+2Σ(cn
(I)−cn (I−1) )21 ・・・・・・(3) なお、k〉1である。
発明の効果
本発明は上記のように、音声区間全体の大まかな検出、
語頭の精密化を夫々に適したパラメータを用いることに
より、音声区間を精度よく検出することができるので、
音声認識において高い認識率を得られるという利点を有
する。
語頭の精密化を夫々に適したパラメータを用いることに
より、音声区間を精度よく検出することができるので、
音声認識において高い認識率を得られるという利点を有
する。
第1図は本発明の一実施例における音声区間検出法のス
テップを示す流れ図。 第2図は単語「クマガヤ」の「り」の部分の、本発明で
用いるノ4ラメータの時間変化を示す図である。 第1図 第2図
テップを示す流れ図。 第2図は単語「クマガヤ」の「り」の部分の、本発明で
用いるノ4ラメータの時間変化を示す図である。 第1図 第2図
Claims (4)
- (1) 入力音をフレームに区切り、フレーム毎に線形
予測分析を行い、この線形予測分析により得られる残差
/fワの変化により音声区間を検出することを特徴とす
る音声区間検出方法。 - (2)入力音をフレームに区切り、フレーム毎の線形予
測分析により線形予測分析ケプストラムをめ、隣接フレ
ーム間のケプストラム距離の変化により音声区間を検出
することを特徴とする音声区間検出方法。 - (3)入力音をフレームに区切り、フレーム毎に線形予
測分析を行い、この線形予測分析により得られる残差パ
ワーの変化と、線形予測分析結果よりめられた線形予測
分析ケプストラムの隣接フレーム間のケプストラム距離
の変化又は残差ノクワに重みを置いたケプストラム距離
の変化とを利用して音声区間を検出することを特徴とす
る音声区間検出方法。 - (4) 入力音をフレームに区切り、フレーム毎にめら
れるパワの変化と、入力音のフレーム毎の線形予測分析
結果よりめられた線形予測分析ケプストラムの隣接フレ
ーム間のケプストラム距離の変化又は残差ieワに重み
を置いたケプストラム距離の変化とを利用して音声区間
を検出することを特徴とする音声区間検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58147311A JPS6039700A (ja) | 1983-08-13 | 1983-08-13 | 音声区間検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58147311A JPS6039700A (ja) | 1983-08-13 | 1983-08-13 | 音声区間検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6039700A true JPS6039700A (ja) | 1985-03-01 |
JPH0225199B2 JPH0225199B2 (ja) | 1990-05-31 |
Family
ID=15427320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58147311A Granted JPS6039700A (ja) | 1983-08-13 | 1983-08-13 | 音声区間検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6039700A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01286643A (ja) * | 1988-05-13 | 1989-11-17 | Fujitsu Ltd | 音声検出装置 |
JPH02267599A (ja) * | 1989-04-10 | 1990-11-01 | Fujitsu Ltd | 音声検出装置 |
-
1983
- 1983-08-13 JP JP58147311A patent/JPS6039700A/ja active Granted
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01286643A (ja) * | 1988-05-13 | 1989-11-17 | Fujitsu Ltd | 音声検出装置 |
JPH02267599A (ja) * | 1989-04-10 | 1990-11-01 | Fujitsu Ltd | 音声検出装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0225199B2 (ja) | 1990-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7567900B2 (en) | Harmonic structure based acoustic speech interval detection method and device | |
EP0764937B1 (en) | Method for speech detection in a high-noise environment | |
JP5229234B2 (ja) | 非音声区間検出方法及び非音声区間検出装置 | |
US20060253285A1 (en) | Method and apparatus using spectral addition for speaker recognition | |
JPH06332492A (ja) | 音声検出方法および検出装置 | |
JP2969862B2 (ja) | 音声認識装置 | |
JPWO2003107326A1 (ja) | 音声認識方法及びその装置 | |
JP2797861B2 (ja) | 音声検出方法および音声検出装置 | |
JPS6039700A (ja) | 音声区間検出方法 | |
JPH0449952B2 (ja) | ||
JPS63281200A (ja) | 音声区間検出方式 | |
JPH03114100A (ja) | 音声区間検出装置 | |
JPH07295588A (ja) | 発話速度推定方法 | |
JPH0222399B2 (ja) | ||
JP2666296B2 (ja) | 音声認識装置 | |
JPS59149400A (ja) | 音声入力装置 | |
JP2019032400A (ja) | 発話判定プログラム、発話判定方法、及び発話判定装置 | |
JP2951333B2 (ja) | 音声信号の区間判別方法 | |
JP3026855B2 (ja) | 音声認識装置 | |
Pattanayak et al. | Significance of single frequency filter for the development of children's KWS system. | |
JP3125928B2 (ja) | 音声認識装置 | |
US20220199074A1 (en) | A dialog detector | |
JPS6239754B2 (ja) | ||
JPS59170894A (ja) | 音声区間の切り出し方式 | |
JPS6227798A (ja) | 音声認識装置 |