JP2643593B2 - 音声・モデム信号識別回路 - Google Patents
音声・モデム信号識別回路Info
- Publication number
- JP2643593B2 JP2643593B2 JP2327729A JP32772990A JP2643593B2 JP 2643593 B2 JP2643593 B2 JP 2643593B2 JP 2327729 A JP2327729 A JP 2327729A JP 32772990 A JP32772990 A JP 32772990A JP 2643593 B2 JP2643593 B2 JP 2643593B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- short
- input
- value
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000013528 artificial neural network Methods 0.000 claims description 37
- 238000001514 detection method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000001934 delay Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000005316 response function Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
- Time-Division Multiplex Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ディジタル入力信号が音声信号であるかモ
デム信号であるかを識別する音声・モデム信号識別回路
に関する。
デム信号であるかを識別する音声・モデム信号識別回路
に関する。
衛星通信,海底ケーブル通信等の長距離回線の有効利
用を図るために、高能率音声符号化(例えば、ADPCM)
技術とディジタル音声挿入(DSI)技術とを組合せた高
能率端局装置(DCME Digital Circuit Multiplication
Equipment)が開発されている。この装置では、音声信
号とモデム信号とで、相異なるビットレートの符号化を
行なう必要を生じる。例えば、音声信号は32Kbps ADPC
Mで符号化されるが、モデム信号にもこれと同じ符号化
を適用すると、特に高速のモデム信号の場合、データ誤
り率が許容限界を超えてしまう。データ誤り率を許容限
界内に抑えるには、モデム信号を音声符号よりも高いレ
ート、例えば40Kbps ADPCMで符号化する必要がある。
用を図るために、高能率音声符号化(例えば、ADPCM)
技術とディジタル音声挿入(DSI)技術とを組合せた高
能率端局装置(DCME Digital Circuit Multiplication
Equipment)が開発されている。この装置では、音声信
号とモデム信号とで、相異なるビットレートの符号化を
行なう必要を生じる。例えば、音声信号は32Kbps ADPC
Mで符号化されるが、モデム信号にもこれと同じ符号化
を適用すると、特に高速のモデム信号の場合、データ誤
り率が許容限界を超えてしまう。データ誤り率を許容限
界内に抑えるには、モデム信号を音声符号よりも高いレ
ート、例えば40Kbps ADPCMで符号化する必要がある。
従って上述の高能率端局装置は、時分割多重化信号中
の音声信号とモデム信号とを識別してそれぞれの符号化
回路に導いてやるために、音声・モデム信号識別回路を
必要とする。
の音声信号とモデム信号とを識別してそれぞれの符号化
回路に導いてやるために、音声・モデム信号識別回路を
必要とする。
このような音声・モデム信号識別回路は、例えばIEEE
GLOBECOM'88(Globar Telecommunications Conferenc
e&Exibition,1988),Conference Record Vol.III,1419
〜1427頁に、S.Casale等により示されている。この論文
中の第2図に示されているように、従来の音声・モデム
信号識別回路は、与えられた信号と、この原信号を高域
フィルタに通して高域成分、および原信号を低減フィル
タに通した低減成分、の3つの信号ごとに、短時間エネ
ルギー、ゼロ交差数、差分信号のゼロ交差数を算出し、
各算出結果の分布範囲を判定用の各しきい値と比較する
ことにより、与えられた信号が音声信号かモデム信号か
を判定する。この判定の基準となる各しきい値は、予め
音声信号とモデム信号とについて収集した標本データの
統計的特徴を分析した結果により、設定される。各判定
結果を照合して、入力信号が音声信号あるいはモデム信
号のいずれであるかを最終的に識別する。
GLOBECOM'88(Globar Telecommunications Conferenc
e&Exibition,1988),Conference Record Vol.III,1419
〜1427頁に、S.Casale等により示されている。この論文
中の第2図に示されているように、従来の音声・モデム
信号識別回路は、与えられた信号と、この原信号を高域
フィルタに通して高域成分、および原信号を低減フィル
タに通した低減成分、の3つの信号ごとに、短時間エネ
ルギー、ゼロ交差数、差分信号のゼロ交差数を算出し、
各算出結果の分布範囲を判定用の各しきい値と比較する
ことにより、与えられた信号が音声信号かモデム信号か
を判定する。この判定の基準となる各しきい値は、予め
音声信号とモデム信号とについて収集した標本データの
統計的特徴を分析した結果により、設定される。各判定
結果を照合して、入力信号が音声信号あるいはモデム信
号のいずれであるかを最終的に識別する。
上述した従来の音声・モデム信号識別回路では、短時
間エネルギーおよび零交差数の算出データをそれぞれ別
の判定器へ入力し、各判定器での判定結果を更に最終の
判定器へ入力するよう構成されている。各判定器の判定
結果は“0"および“1"の2値表示なので、短時間エネル
ギーおよび零交差数の相互関連を示す情報が大幅に欠落
してしまい、信号対雑音比が異なる種々の回線において
音声およびモデム信号を精度良く識別するのに十分な情
報量が得られず、この結果、処理量が多いを割には十分
な識別率が得られない。
間エネルギーおよび零交差数の算出データをそれぞれ別
の判定器へ入力し、各判定器での判定結果を更に最終の
判定器へ入力するよう構成されている。各判定器の判定
結果は“0"および“1"の2値表示なので、短時間エネル
ギーおよび零交差数の相互関連を示す情報が大幅に欠落
してしまい、信号対雑音比が異なる種々の回線において
音声およびモデム信号を精度良く識別するのに十分な情
報量が得られず、この結果、処理量が多いを割には十分
な識別率が得られない。
更に、各判定器における判定結果から矛盾無く最終の
判定を伝えるよう各判定器でのしきい値を設定するに
は、多量の実験データと、多大な分析工数とを必要とす
る。
判定を伝えるよう各判定器でのしきい値を設定するに
は、多量の実験データと、多大な分析工数とを必要とす
る。
本発明の回路は、入力信号を処理して音声信号または
モデム信号のいいずれかに応じて異なる特徴をもつ複数
の信号を発生する信号処理手段と、 前記複数信号に応答して音声信号またはモデム信号の
いずれに近い特徴をもつかを示す関数値のデータを発生
するニュートラルネットワークと、 前記関数値のデータに応答して前記入力信号が音声信
号またはモデム信号のいずれであるかを示す信号を出力
する判定手段とを含み、 前記信号処理手段は、前記入力信号の短時間自己相関
係数を計算する相関係数計算器と、 前記入力信号の無音部を検出し無音部検出時における
遅れゼロの前記短時間自己相関係数の値を保持する雑音
電力値保持回路と、 該雑音電力値保持回路の保持値を遅れゼロの前記短時
間自己相関係数から減算した値で遅れゼロ以外の前記短
時間自己相関係数を除算して得る正規化係数値を示す複
数の信号を送出する正規化器とを備えている。
モデム信号のいいずれかに応じて異なる特徴をもつ複数
の信号を発生する信号処理手段と、 前記複数信号に応答して音声信号またはモデム信号の
いずれに近い特徴をもつかを示す関数値のデータを発生
するニュートラルネットワークと、 前記関数値のデータに応答して前記入力信号が音声信
号またはモデム信号のいずれであるかを示す信号を出力
する判定手段とを含み、 前記信号処理手段は、前記入力信号の短時間自己相関
係数を計算する相関係数計算器と、 前記入力信号の無音部を検出し無音部検出時における
遅れゼロの前記短時間自己相関係数の値を保持する雑音
電力値保持回路と、 該雑音電力値保持回路の保持値を遅れゼロの前記短時
間自己相関係数から減算した値で遅れゼロ以外の前記短
時間自己相関係数を除算して得る正規化係数値を示す複
数の信号を送出する正規化器とを備えている。
前記雑音電力値保持回路は、前記入力信号の有音部を
検出する有音検出器と、 前記遅れゼロの短時間自己相関係数値を該有音検出器
の検出時間に相当する標本時間遅延する遅延回路と、 前記有音検出器の検出結果が無音部を示している時の
前記遅延回路の出力信号を保持し出力する保持回路とか
ら構成される。
検出する有音検出器と、 前記遅れゼロの短時間自己相関係数値を該有音検出器
の検出時間に相当する標本時間遅延する遅延回路と、 前記有音検出器の検出結果が無音部を示している時の
前記遅延回路の出力信号を保持し出力する保持回路とか
ら構成される。
次に図面を参照して本発明について説明する。
第1図を参照すると、本発明の第1の実施例の回路
は、短時間自己相関係数計算器30と、ニュートラルネッ
トワーク6と、判定器31とを縦続に接続して構成されて
いる。この回路において、入力端子1から入力されるデ
ィジタル信号は、短時間自己相関係数計算器30に入力さ
れる。短時間自己相関係数計算器30は、入力ディジタル
信号の時系列{x(n)|nは整数}と時間窓幅Wの方形
窓とを用いて、次に式(1)により、自己相関係数を計
算する。
は、短時間自己相関係数計算器30と、ニュートラルネッ
トワーク6と、判定器31とを縦続に接続して構成されて
いる。この回路において、入力端子1から入力されるデ
ィジタル信号は、短時間自己相関係数計算器30に入力さ
れる。短時間自己相関係数計算器30は、入力ディジタル
信号の時系列{x(n)|nは整数}と時間窓幅Wの方形
窓とを用いて、次に式(1)により、自己相関係数を計
算する。
この短時間自己相関係数は、入力ディジタル信号の振
幅の影響を除去するため、入力ディジタル信号の電力値
であるRn(0)で正規化されて、<Rn(k)>となる。
幅の影響を除去するため、入力ディジタル信号の電力値
であるRn(0)で正規化されて、<Rn(k)>となる。
正規化された短時間自己相関係数は、ニューラルネッ
トワーク6に入力される。
トワーク6に入力される。
第2図(a)および(b)は、第1図中のニューラル
ネットワーク6の接続構成および構成要素をそれぞれ例
示するブロック図である。すなわち、同図(a)は、入
力層60,中間層61,出力層62から成る層構造をもつニュー
ラルネットワークを示す。入力層60は4つのユニット70
を有し、中間層61は2つのユニット71を、出力層62は1
つのユニット72をそれぞれ有する。例えばユニット70
は、同図(a)に示すごとく、入力端からデータx1,x2,
x3,x4を受けて、乗算器81,82,83,84でそれぞれ重みw1,w
2,w3,w4を付けたあと、加算器85で加算して総和u、す
なわち、 を算出し、これに関数発生器86で関数fを作用させて出
力する。関数fとしては、微分可能なシグモイド(sigm
oid)関数、すなわち f(u)=1/(1+e-u) ……(4) を用い、この値をユニット70の出力データyとする。
ネットワーク6の接続構成および構成要素をそれぞれ例
示するブロック図である。すなわち、同図(a)は、入
力層60,中間層61,出力層62から成る層構造をもつニュー
ラルネットワークを示す。入力層60は4つのユニット70
を有し、中間層61は2つのユニット71を、出力層62は1
つのユニット72をそれぞれ有する。例えばユニット70
は、同図(a)に示すごとく、入力端からデータx1,x2,
x3,x4を受けて、乗算器81,82,83,84でそれぞれ重みw1,w
2,w3,w4を付けたあと、加算器85で加算して総和u、す
なわち、 を算出し、これに関数発生器86で関数fを作用させて出
力する。関数fとしては、微分可能なシグモイド(sigm
oid)関数、すなわち f(u)=1/(1+e-u) ……(4) を用い、この値をユニット70の出力データyとする。
第2図(a)中のユニット71,72もこれと同様に、入
力データの重み付け総和にシグモイド関数を作用させた
出力データを発生する。第2図(a)は、階層型のニュ
ーラルネットワークを用いた例を示し、それぞれ出力側
から入力側へのフィールドバック接続をもたない入力層
61,中間層62,出力層63を縦続に接続した構成である。
力データの重み付け総和にシグモイド関数を作用させた
出力データを発生する。第2図(a)は、階層型のニュ
ーラルネットワークを用いた例を示し、それぞれ出力側
から入力側へのフィールドバック接続をもたない入力層
61,中間層62,出力層63を縦続に接続した構成である。
階層型のニューラル・ネットワーク6の領域分類機能
の学習は、バックプロパゲーションのアルゴリズムによ
り行う。すなわち、入力層60の各ユニット70に入力デー
タを与えて各ユニットで変換させ、中間層61に伝えて、
最後に出力層62から出力を得る。この実際の出力値と、
望ましい出力値とを比べ、その差を減らすように重みwi
を逐次に修正していく。
の学習は、バックプロパゲーションのアルゴリズムによ
り行う。すなわち、入力層60の各ユニット70に入力デー
タを与えて各ユニットで変換させ、中間層61に伝えて、
最後に出力層62から出力を得る。この実際の出力値と、
望ましい出力値とを比べ、その差を減らすように重みwi
を逐次に修正していく。
この修正では、ユニットの入力wiに対する重みwiのm
回目の修正値wi(m)から、(m+1)回目の修正値wi
(m+1)を次式(5)〜(7)により算出する。
回目の修正値wi(m)から、(m+1)回目の修正値wi
(m+1)を次式(5)〜(7)により算出する。
wi(m+1)=wi(m)+ηδx′i ……(5) 但し、 x′i:当該ユニットで重みwiを乗算される入力値、 η:学習定数 当該ユニットが出力層にあれば、 δ=v(1−v)(d−v) ……(6) 但し、 v:実際の出力値 d:実際の出力値 また当該ユニットが出力層以外にあれば、 但し、総和のkは当該ユニットよりも後段の層のすべ
てのユニットにわたる。
てのユニットにわたる。
x′j:当該ユニットの出力値 以上のアルゴリズムは、実際の出力値vと望ましい出
力値dとの平均二乗誤差を極小化するように、重みwiを
修正していく。学習時には、まずニューラルネットワー
ク6内の各重み値を適宜初期設定したあと、多数の音声
信号およびモデム信号の短期間自己相関数値(正規化し
たもの)の標本データを順次にニューラルネットワーク
6に入力して出力データを得る。また標本データごとに
音声信号が入力された場合には値「1」、モデム信号が
入力された場合には値「0」の2値信号を、希望出力値
として与える。標本データごとに、ニューラルネットワ
ーク6の出力データを得たあと、式(5)〜(7)によ
る各重み値の修正を、出力層62から初めて入力層60の側
に向って、実行する。この修正は、上述の平均二乗誤差
の極小点に到達するまで、繰返される。
力値dとの平均二乗誤差を極小化するように、重みwiを
修正していく。学習時には、まずニューラルネットワー
ク6内の各重み値を適宜初期設定したあと、多数の音声
信号およびモデム信号の短期間自己相関数値(正規化し
たもの)の標本データを順次にニューラルネットワーク
6に入力して出力データを得る。また標本データごとに
音声信号が入力された場合には値「1」、モデム信号が
入力された場合には値「0」の2値信号を、希望出力値
として与える。標本データごとに、ニューラルネットワ
ーク6の出力データを得たあと、式(5)〜(7)によ
る各重み値の修正を、出力層62から初めて入力層60の側
に向って、実行する。この修正は、上述の平均二乗誤差
の極小点に到達するまで、繰返される。
上述の、バックプロパゲーションによる学習終了後、
ニューラルネットワーク6は、学習結果の重みを用いて
動作する。この動作時に入力された短時間自己相関係数
は、ニューラルネットワーク6の領域分類機能により、
音声信号領域の短時間自己相関係数であるかモデム信号
領域の短時間自己相関係数であるかの分類がなされる。
ニューラルネットワーク6は、学習結果の重みを用いて
動作する。この動作時に入力された短時間自己相関係数
は、ニューラルネットワーク6の領域分類機能により、
音声信号領域の短時間自己相関係数であるかモデム信号
領域の短時間自己相関係数であるかの分類がなされる。
ニューラルネットワーク6の出力は、例えば音声信号
の場合に「1」を、モデム信号の場合に「0」を出力す
るように学習させた場合でも、各ユニット70〜72の応答
関数がsigmoid関数であるため、「0」から「1」まで
の間の連続値をとり得る。このために、判定器31におい
て、あらかじめ決められたしきい値(例えば0.5)との
比較により、しきい値以上の場合に音声信号であると判
定し、しきい値未満の場合にモデム信号と判定して、出
力端子8に識別結果として出力している。
の場合に「1」を、モデム信号の場合に「0」を出力す
るように学習させた場合でも、各ユニット70〜72の応答
関数がsigmoid関数であるため、「0」から「1」まで
の間の連続値をとり得る。このために、判定器31におい
て、あらかじめ決められたしきい値(例えば0.5)との
比較により、しきい値以上の場合に音声信号であると判
定し、しきい値未満の場合にモデム信号と判定して、出
力端子8に識別結果として出力している。
第3図は本発明の第2の実施例のブロック図であり、
第1の実施例(第1図参照)の判定器31のあとに、加算
器32と、その出力データに定数を乗算して加算器32の入
力データを与える乗算器33とから成る積分器とを付加接
続し、更にこの積分器のあとに判定器34を付加接続した
構成を示す。
第1の実施例(第1図参照)の判定器31のあとに、加算
器32と、その出力データに定数を乗算して加算器32の入
力データを与える乗算器33とから成る積分器とを付加接
続し、更にこの積分器のあとに判定器34を付加接続した
構成を示す。
この積分器を付加することにより、散発的に生じる誤
識別を平滑化して除去でき、短時間で散発的に生じる識
別結果の不安定性を防止し、識別率を向上できる。
識別を平滑化して除去でき、短時間で散発的に生じる識
別結果の不安定性を防止し、識別率を向上できる。
次に、第1および第2の実施例について、実験データ
の例を示す。この実験は、第3図の回路(第1図の回路
を含んでいる)を汎用ディジタル信号プロセッサ(DS
P)集積回路(日本電気(株)製のμPD77C25)により実
現して、行われた。短時間自己相関関数計算機30では、
時間窓幅W=64とし、遅れK=0〜4の関数値を算出し
て、基準化値<R(1)>〜<R(4)>をニューラル
ネットワーク6に入力する。ニューラルネットワーク6
は、入力層60に3個のユニット70を、また出力層62に1
個のユニット72をそれぞれもち、中間層61を設けない2
層構成のものを使用した。ニューラルネットワーク6の
学習は、ミニコンピュータ上でオフライン・シミュレー
ションにより行なった。このシミュレーションは、日本
人の成人男性2人、成人女性1人の音声信号と、2400bp
s(CCITT V.26bis)、4800bps(V.27bis)、9600bps
(V29)のモデム信号とについて行ない、音声信号入力
時に“1"、モデム信号入力時に“0"のニューラルネット
ワーク出力を得るよう、バックプロパゲーション法で学
習させた。学習して得られらた重み係数値をニューラル
・ネットワーク6に書込んで識別を行なった結果、表1
に示すように識別率が得られた。
の例を示す。この実験は、第3図の回路(第1図の回路
を含んでいる)を汎用ディジタル信号プロセッサ(DS
P)集積回路(日本電気(株)製のμPD77C25)により実
現して、行われた。短時間自己相関関数計算機30では、
時間窓幅W=64とし、遅れK=0〜4の関数値を算出し
て、基準化値<R(1)>〜<R(4)>をニューラル
ネットワーク6に入力する。ニューラルネットワーク6
は、入力層60に3個のユニット70を、また出力層62に1
個のユニット72をそれぞれもち、中間層61を設けない2
層構成のものを使用した。ニューラルネットワーク6の
学習は、ミニコンピュータ上でオフライン・シミュレー
ションにより行なった。このシミュレーションは、日本
人の成人男性2人、成人女性1人の音声信号と、2400bp
s(CCITT V.26bis)、4800bps(V.27bis)、9600bps
(V29)のモデム信号とについて行ない、音声信号入力
時に“1"、モデム信号入力時に“0"のニューラルネット
ワーク出力を得るよう、バックプロパゲーション法で学
習させた。学習して得られらた重み係数値をニューラル
・ネットワーク6に書込んで識別を行なった結果、表1
に示すように識別率が得られた。
表1中で、識別率(A)は第1図の実施例、また識別
率(B)は第3図の実施例の実験データを示す。なお、
音声〜、モデム〜は学習した入力信号であり、
残余の音声〜、モデム,は学習していない入力
信号である。
率(B)は第3図の実施例の実験データを示す。なお、
音声〜、モデム〜は学習した入力信号であり、
残余の音声〜、モデム,は学習していない入力
信号である。
以上説明したように、第1ないし第3の実施例では少
数の遅れについての短時間自己相関係数により、入力デ
ィジタル信号の特徴を分類でき、実用上十分な識別率が
得られる。これに伴なって、ニューラルネットワークの
ユニット数も少なくて済み、ニューラルネットワークの
学習を自動的に短時間で行える。
数の遅れについての短時間自己相関係数により、入力デ
ィジタル信号の特徴を分類でき、実用上十分な識別率が
得られる。これに伴なって、ニューラルネットワークの
ユニット数も少なくて済み、ニューラルネットワークの
学習を自動的に短時間で行える。
なお、ニューラルネットワーク6については、階層型
のものをバックプロパゲーション法で学習させ使用する
場合を説明したが、これに限定されるものでは無い。ユ
ニット間接続にフィールドバック結合を含む相互結合型
のものを、ホップフィールド(J.J.Hopfield)による方
法あるいはヒントン(G.E.Hinton)等による方法で学習
させ使用しても良い。
のものをバックプロパゲーション法で学習させ使用する
場合を説明したが、これに限定されるものでは無い。ユ
ニット間接続にフィールドバック結合を含む相互結合型
のものを、ホップフィールド(J.J.Hopfield)による方
法あるいはヒントン(G.E.Hinton)等による方法で学習
させ使用しても良い。
第4図は本発明の第3の実施例を示すブロック図であ
り、第1図の実施例におけるニューラル・ネットワーク
6のすぐあとに、加算器32および乗算器33から成る積分
器を接続し、この積分器の出力データ値がしきい値を超
えたか否かで音声信号かモデム信号かを判定する判定器
34を付加接続した構成を示す。この構成は、第3図の実
施例において、判定器31を除去したものに相当するが、
第2図の場合と同様に、ニューラルネットワーク6が出
力する関数値の散発的な不安定性を平滑化して、安定な
識別結果を得ることができる。
り、第1図の実施例におけるニューラル・ネットワーク
6のすぐあとに、加算器32および乗算器33から成る積分
器を接続し、この積分器の出力データ値がしきい値を超
えたか否かで音声信号かモデム信号かを判定する判定器
34を付加接続した構成を示す。この構成は、第3図の実
施例において、判定器31を除去したものに相当するが、
第2図の場合と同様に、ニューラルネットワーク6が出
力する関数値の散発的な不安定性を平滑化して、安定な
識別結果を得ることができる。
第1図,第3図,および第4図の回路において、入力
ディジタル信号に含まれている背景白色雑音が無視でき
ない場合、遅れk=0の短時間自己相関係数R(0)
は、背景白色雑音の電力値分だけ増大する。他方、遅れ
k=0以外の短時間自己相関係数R(n)(n>0)
は、背景白色雑音の影響を殆んど受けない。この結果、
R(0)で正規化した短時間自己相関係数<R(n)>
(n>0)は、雑音を含まない場合より小さな値にな
り、信号識別を誤らせる原因となる。
ディジタル信号に含まれている背景白色雑音が無視でき
ない場合、遅れk=0の短時間自己相関係数R(0)
は、背景白色雑音の電力値分だけ増大する。他方、遅れ
k=0以外の短時間自己相関係数R(n)(n>0)
は、背景白色雑音の影響を殆んど受けない。この結果、
R(0)で正規化した短時間自己相関係数<R(n)>
(n>0)は、雑音を含まない場合より小さな値にな
り、信号識別を誤らせる原因となる。
第5図は、このような背景白色雑音の悪影響を除去す
る手段を付加した、本発明の第4の実施例ブロック図で
ある。同図の回路は、入力ディジタル信号と、短時間自
己相関係数計算器16で得られるRn(0)とを受信し、無
音部における入力ディジタル信号の電力値を保持する雑
音電力値保持回路43を、第1図の回路に付加接続した構
成をもつ。
る手段を付加した、本発明の第4の実施例ブロック図で
ある。同図の回路は、入力ディジタル信号と、短時間自
己相関係数計算器16で得られるRn(0)とを受信し、無
音部における入力ディジタル信号の電力値を保持する雑
音電力値保持回路43を、第1図の回路に付加接続した構
成をもつ。
雑音電力値保持回路43は、第6図に示すように、入力
されたディジタル信号の有音部を検出する有音検出器43
Aと、入力された入力信号の電力値をこの有音検出器43A
の検出時間に相当する標本時間だけ遅延する遅延回路43
Bと、有音検出器43Aが無音であると出力した時の遅延回
路43Bの出力を、無音部の信号電力値として保持する保
持回路43Cとから構成される。
されたディジタル信号の有音部を検出する有音検出器43
Aと、入力された入力信号の電力値をこの有音検出器43A
の検出時間に相当する標本時間だけ遅延する遅延回路43
Bと、有音検出器43Aが無音であると出力した時の遅延回
路43Bの出力を、無音部の信号電力値として保持する保
持回路43Cとから構成される。
次に、本実施例の音声・モデム信号識別回路の動作に
ついて第5図および第6図を参照して説明する。
ついて第5図および第6図を参照して説明する。
入力端子1から入力されたディジタル信号は、短時間
自己相関係数計算器16の相関係数計算器42と雑音電力値
保持回路43とに入力される。相関係数計算器42は、第1
図の回路の場合と同様に、前述した式(1)により短時
間自己相関係数を計算する。
自己相関係数計算器16の相関係数計算器42と雑音電力値
保持回路43とに入力される。相関係数計算器42は、第1
図の回路の場合と同様に、前述した式(1)により短時
間自己相関係数を計算する。
また、雑音電力値保持回路43では、入力ディジタル信
号は、有音検出器音43Aに入力される。有音検出器43A
は、入力されたディジタル信号が有音であるか無音であ
るかの検出を行う。遅延回路43Bは、有音検出器43Aの検
出遅れを補正するために、この遅延時間に相当する標本
時間だけ、入力の信号すなわち電力値Rn(0)を遅延し
て出力する。保持回路43Cは、有音検出器43Aの出力が無
音の状態から有音の状態に変化したとの遅延回路43Bの
出力値の保持し出力する。
号は、有音検出器音43Aに入力される。有音検出器43A
は、入力されたディジタル信号が有音であるか無音であ
るかの検出を行う。遅延回路43Bは、有音検出器43Aの検
出遅れを補正するために、この遅延時間に相当する標本
時間だけ、入力の信号すなわち電力値Rn(0)を遅延し
て出力する。保持回路43Cは、有音検出器43Aの出力が無
音の状態から有音の状態に変化したとの遅延回路43Bの
出力値の保持し出力する。
このように、雑音電力値保持回路43では、入力ディジ
タル信号と相関係数計算器42の出力する遅れ0の短時間
自己相関係数Rn(0)(入力信号電力値)とを入力し、
入力ディジタル信号が無い時の背景白色雑音の電力値を
保持し、出力する。
タル信号と相関係数計算器42の出力する遅れ0の短時間
自己相関係数Rn(0)(入力信号電力値)とを入力し、
入力ディジタル信号が無い時の背景白色雑音の電力値を
保持し、出力する。
正規化器14には、相関係数計算器42および雑音電力値
保持回路43の両出力データが入力される。ここで、入力
信号電力値R(0)は背景白色雑音の電力値が加算され
ており、この背景白色雑音の電力値は、信号の有無にか
かわらず一定とみなせる。このため、背景白色雑音の電
力値は入力ディジタル信号が無い時の入力信号の電力値
であり、これが雑音電力値保持回路43からの出力され
る。正規化器44では、入力信号電力値Rn(0)から雑音
電力値保持回路43の出力値を差引き、背景白色雑音の影
響を取り除いた遅れ0の短時間自己相関係数をRn(0)
とする。
保持回路43の両出力データが入力される。ここで、入力
信号電力値R(0)は背景白色雑音の電力値が加算され
ており、この背景白色雑音の電力値は、信号の有無にか
かわらず一定とみなせる。このため、背景白色雑音の電
力値は入力ディジタル信号が無い時の入力信号の電力値
であり、これが雑音電力値保持回路43からの出力され
る。正規化器44では、入力信号電力値Rn(0)から雑音
電力値保持回路43の出力値を差引き、背景白色雑音の影
響を取り除いた遅れ0の短時間自己相関係数をRn(0)
とする。
R′n(0)=Rn(0)−NOIS ……(8) ただし、式(8)のNOISは雑音電力値保持回路13の出
力値である。
力値である。
正規化器44における正規化は式(8)の結果を用いて
次の式(9)により行う。
次の式(9)により行う。
式(9)により求められた短時間自己相関係数は、背
景白色雑音の影響を取り除いた短時間自己相関係数R
n(0)で正規化されるため、背景白色雑音の影響を受
けない。この正規化された短時間自己相関係数は、ニュ
ーラルネットワーク6に入力される。入力された短時間
自己相関係数は、ニューラルネットワーク6の領域分類
機能により、音声信号領域の短時間自己相関係数である
かモデム信号領域の短時間自己相関係数であるかの分類
がなされる。
景白色雑音の影響を取り除いた短時間自己相関係数R
n(0)で正規化されるため、背景白色雑音の影響を受
けない。この正規化された短時間自己相関係数は、ニュ
ーラルネットワーク6に入力される。入力された短時間
自己相関係数は、ニューラルネットワーク6の領域分類
機能により、音声信号領域の短時間自己相関係数である
かモデム信号領域の短時間自己相関係数であるかの分類
がなされる。
ニューラルネットワーク6の出力が、例えば音声信号
の場合に「1」を、モデム信号の場合に「0」を出力す
るように学習させた場合でも、ニューロンユニットの応
答関数がsigmoid関数であるため、「0」から「1」ま
での間の接続値をとる。このために判定器31において、
あらかじめ決められたしきい値(例えば0.5)との比較
により、しきい値以上の場合に音声信号であると判定
し、しきい値未満の場合にモデム信号と判定して、出力
端子8に識別結果として出力する。
の場合に「1」を、モデム信号の場合に「0」を出力す
るように学習させた場合でも、ニューロンユニットの応
答関数がsigmoid関数であるため、「0」から「1」ま
での間の接続値をとる。このために判定器31において、
あらかじめ決められたしきい値(例えば0.5)との比較
により、しきい値以上の場合に音声信号であると判定
し、しきい値未満の場合にモデム信号と判定して、出力
端子8に識別結果として出力する。
このように、本実施例は、遅れ0の短時間自己相関係
数Rn(0)から背景白色雑音の信号電力値を差引いた値
で正規化することにより、背景白色雑音の影響を受けな
い短時間自己相関係数Rn(k)が得られる。このため、
背景白色雑音の多い状況下でも音声信号とモデム信号と
の識別率の低下起こらない。
数Rn(0)から背景白色雑音の信号電力値を差引いた値
で正規化することにより、背景白色雑音の影響を受けな
い短時間自己相関係数Rn(k)が得られる。このため、
背景白色雑音の多い状況下でも音声信号とモデム信号と
の識別率の低下起こらない。
第7図(a),(b)は本発明の第5の実施例を示す
ブロック図である。同図(a)において、入力端子1か
ら与えられるディジタル信号は、適応予測器21および減
算器22へ入力される。適応予測器21は、例えばADPCM用
の適用予測器であり、予測信号と入力ディジタル信号と
の差である誤差信号を減算器22から受けて、誤差信号を
ゼロに近付けるよう予測係数24を修正していく。この適
応予測器21は、同図(b)に示すごとく、m個(mは整
数)の遅延器D1,D2,…,Dmから成るタップ付遅延回路の
各タップ出力に、係数器A1,A2,…,Amから与えられる係
数器a1,a2,…,amを乗算器M1,M2,…,Mmにて乗じ、各乗算
結果を加算器Sで加算して、加算結果を予測信号として
出力する。各係数a1ないしamは、減算器22から受ける誤
差信号をゼロに近付けるように適応的に修正されて、乗
算器M1ないしMmに与えられると共に、ニューラルネット
ワーク6へ予測係数24として与えられる。
ブロック図である。同図(a)において、入力端子1か
ら与えられるディジタル信号は、適応予測器21および減
算器22へ入力される。適応予測器21は、例えばADPCM用
の適用予測器であり、予測信号と入力ディジタル信号と
の差である誤差信号を減算器22から受けて、誤差信号を
ゼロに近付けるよう予測係数24を修正していく。この適
応予測器21は、同図(b)に示すごとく、m個(mは整
数)の遅延器D1,D2,…,Dmから成るタップ付遅延回路の
各タップ出力に、係数器A1,A2,…,Amから与えられる係
数器a1,a2,…,amを乗算器M1,M2,…,Mmにて乗じ、各乗算
結果を加算器Sで加算して、加算結果を予測信号として
出力する。各係数a1ないしamは、減算器22から受ける誤
差信号をゼロに近付けるように適応的に修正されて、乗
算器M1ないしMmに与えられると共に、ニューラルネット
ワーク6へ予測係数24として与えられる。
この予測係数は、音声信号とモデム信号とで異なった
特徴を有し、しかも入力ディジタル信号の信号対雑音比
や信号振幅に依存しない。学習済みのニューラルネット
ワーク6で音声信号かモデム信号かを分類され、判定器
31でしきい値との比較によりいずれの信号であるか判定
される。
特徴を有し、しかも入力ディジタル信号の信号対雑音比
や信号振幅に依存しない。学習済みのニューラルネット
ワーク6で音声信号かモデム信号かを分類され、判定器
31でしきい値との比較によりいずれの信号であるか判定
される。
第8図は本発明の第6の実施例のブロック図である。
同図において、入力端子1から入力する信号は、低域通
過フィルタ11,高域通過フィルタ12,短時間エネルギー計
算器13,および零交差数計算器14に入力される。短時間
エネルギー計算器13は、入力信号と、低域通過フィルタ
11および高域通過フィルタ12の出力信号とを受信し、各
信号の短時間エネルギーを計算する。零交差数計算器14
は、入力信号と、低域通過フィルタ11および高域通過フ
ィルタ12の出力信号とを受信し、それぞれの零交差数お
よび1サンプル前との差分信号についての零交差数を計
算する。ニューラルネットワーク6には、短時間エネル
ギー計算器4および零交差数計算器5の両出力信号を並
列に入力する。
同図において、入力端子1から入力する信号は、低域通
過フィルタ11,高域通過フィルタ12,短時間エネルギー計
算器13,および零交差数計算器14に入力される。短時間
エネルギー計算器13は、入力信号と、低域通過フィルタ
11および高域通過フィルタ12の出力信号とを受信し、各
信号の短時間エネルギーを計算する。零交差数計算器14
は、入力信号と、低域通過フィルタ11および高域通過フ
ィルタ12の出力信号とを受信し、それぞれの零交差数お
よび1サンプル前との差分信号についての零交差数を計
算する。ニューラルネットワーク6には、短時間エネル
ギー計算器4および零交差数計算器5の両出力信号を並
列に入力する。
このニューラルネットワーク6の入力信号は、従来の
音声・モデム信号を識別回路でも使われているように、
音声信号とモデム信号とで異なった特徴を有している。
従来の識別回路では、短時間エネルギーと零交差数とを
それぞれ別の判定器に与えて信号識別にさせているのに
対し、本実施例では、両者を並列にニューラルネットワ
ーク6に与えて信号領域の分類を行なわせる。従って従
来の回路では、短時間エネルギーおよび零交差数の相互
関連による信号識別が不可能であるのに対し、本実施例
では、両者の相互関係を含めた総合的な信号識別を行な
うことができ、従来回路よりも高い識別率が得られる。
音声・モデム信号を識別回路でも使われているように、
音声信号とモデム信号とで異なった特徴を有している。
従来の識別回路では、短時間エネルギーと零交差数とを
それぞれ別の判定器に与えて信号識別にさせているのに
対し、本実施例では、両者を並列にニューラルネットワ
ーク6に与えて信号領域の分類を行なわせる。従って従
来の回路では、短時間エネルギーおよび零交差数の相互
関連による信号識別が不可能であるのに対し、本実施例
では、両者の相互関係を含めた総合的な信号識別を行な
うことができ、従来回路よりも高い識別率が得られる。
以上説明したように本発明によれば、入力信号の自己
相関を示す信号は音声信号とモデム信号とで顕著に異な
る特徴をもち、その上白色雑音の影響で受け難いので、
これをニューラルネットワークで分類することにより、
実用上十分に高い識別率を得ることができる。また、信
号識別用の条件であるニューラルネットワークの重みの
値は、学習時に自動的に設定される。
相関を示す信号は音声信号とモデム信号とで顕著に異な
る特徴をもち、その上白色雑音の影響で受け難いので、
これをニューラルネットワークで分類することにより、
実用上十分に高い識別率を得ることができる。また、信
号識別用の条件であるニューラルネットワークの重みの
値は、学習時に自動的に設定される。
更に、入力信号の特徴をもつ信号を複数組用いる場
合、例えば入力信号の短時間エネルギーと零交差数とを
用いる場合でも、その複数組の信号を同一のニューラル
ネットワークに入力して、各組相互間の関連も含めて分
類できる。従って、各組ごとに識別している従来回路に
比べて、より高い識別率が得られる。
合、例えば入力信号の短時間エネルギーと零交差数とを
用いる場合でも、その複数組の信号を同一のニューラル
ネットワークに入力して、各組相互間の関連も含めて分
類できる。従って、各組ごとに識別している従来回路に
比べて、より高い識別率が得られる。
第1図は本発明の第1の実施例のブロック図、第2図
(a),(b)は、第1図中のニューラルネットワーク
の構成を示すブロック図、第3図は本発明の第2の実施
例の一部を示すブロック図、第4図は本発明の第3の実
施例を示すブロック図、第5図は本発明の第4の実施例
を示すブロック図、第6図は第5図中の雑音電力値保持
回路の構成を示すブロック図、第7図(a),(b)は
本発明の第5の実施例を示すブロック図、第8図は本発
明の第6の実施例を示すブロック図である。 1,10……入力端子、6……ニューラルネットワーク、60
……入力層、61……中間層、62……出力層、70〜72……
ユニット、31,34……判定器、8……出力端子、11……
低域通過フィルタ、12……高域通過フィルタ、13……短
時間エネルギー計算器、14……零交差数計算器、21……
適応予測器、22……減算器、24……予測係数、30……短
時間自己相関関数計算器、32……加算器、33……乗算
器、43……雑音電力値保持回路、42……相関係数計算
器、44……正規化器。
(a),(b)は、第1図中のニューラルネットワーク
の構成を示すブロック図、第3図は本発明の第2の実施
例の一部を示すブロック図、第4図は本発明の第3の実
施例を示すブロック図、第5図は本発明の第4の実施例
を示すブロック図、第6図は第5図中の雑音電力値保持
回路の構成を示すブロック図、第7図(a),(b)は
本発明の第5の実施例を示すブロック図、第8図は本発
明の第6の実施例を示すブロック図である。 1,10……入力端子、6……ニューラルネットワーク、60
……入力層、61……中間層、62……出力層、70〜72……
ユニット、31,34……判定器、8……出力端子、11……
低域通過フィルタ、12……高域通過フィルタ、13……短
時間エネルギー計算器、14……零交差数計算器、21……
適応予測器、22……減算器、24……予測係数、30……短
時間自己相関関数計算器、32……加算器、33……乗算
器、43……雑音電力値保持回路、42……相関係数計算
器、44……正規化器。
フロントページの続き (56)参考文献 特開 平2−195399(JP,A) 特開 平2−72398(JP,A) 特開 平2−192335(JP,A) 特開 平1−232464(JP,A) 特開 平1−320565(JP,A) 特開 平2−32395(JP,A) 特開 平1−222299(JP,A)
Claims (2)
- 【請求項1】入力信号を処理して音声信号またはモデム
信号のいずれかに応じて異なる特徴をもつ複数の信号を
発生する信号処理手段と、 前記複数信号に応答して音声信号またはモデム信号のい
ずれに近い特徴をもつかを示す関数値のデータを発生す
るニューラルネットワークと、 前記関数値のデータに応答して前記入力信号が音声信号
またはモデム信号のいずれであるかを示す信号を出力す
る判定手段とを含み、 前記信号処理手段は、前記入力信号の短時間自己相関係
数を計算する相関係数計算器と、 前記入力信号の無音部を検出し無音部検出時における遅
れゼロの前記短時間自己相関係数の値を保持する雑音電
力値保持回路と、 該雑音電力値保持回路の保持値を遅れゼロの前記短時間
自己相関係数から減算した値で遅れゼロ以外の前記短時
間自己相関係数を除算して得る正規化係数値を示す複数
の信号を送出する正規化器とを有することを特徴とする
音声・モデム信号識別回路。 - 【請求項2】前記雑音電力値保持回路は、前記入力信号
の有音部を検出する有音検出器と、 前記遅れゼロの短時間自己相関係数値を該有音検出器の
検出時間に相当する標本時間遅延する遅延回路と、 前記有音検出器の検出結果が無音部を示している時の前
記遅延回路の出力信号を保持し出力する保持回路とを有
する請求項1記載の音声・モデム信号識別回路。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31013489 | 1989-11-28 | ||
JP1-310134 | 1989-11-28 | ||
JP2-47869 | 1990-02-28 | ||
JP4786990 | 1990-02-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03273722A JPH03273722A (ja) | 1991-12-04 |
JP2643593B2 true JP2643593B2 (ja) | 1997-08-20 |
Family
ID=26388074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2327729A Expired - Lifetime JP2643593B2 (ja) | 1989-11-28 | 1990-11-27 | 音声・モデム信号識別回路 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5315704A (ja) |
EP (1) | EP0435458B1 (ja) |
JP (1) | JP2643593B2 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69229584T2 (de) * | 1991-08-30 | 2000-07-20 | Texas Instruments Inc., Dallas | Telefonsignalklassifizierung und Verfahren und System zur Telefonnachrichtenablieferung |
JPH0685764A (ja) * | 1992-08-31 | 1994-03-25 | Nec Corp | Adpcm符復号化装置 |
GB2278984A (en) * | 1993-06-11 | 1994-12-14 | Redifon Technology Limited | Speech presence detector |
FR2725859B1 (fr) * | 1994-10-17 | 1996-12-20 | Alcatel Mobile Comm France | Dispositif de reconnaisance d'informations portees par un signal recu |
US5737485A (en) * | 1995-03-07 | 1998-04-07 | Rutgers The State University Of New Jersey | Method and apparatus including microphone arrays and neural networks for speech/speaker recognition systems |
JP3094832B2 (ja) * | 1995-03-24 | 2000-10-03 | 三菱電機株式会社 | 信号識別器 |
GB2306010A (en) * | 1995-10-04 | 1997-04-23 | Univ Wales Medicine | A method of classifying signals |
US5745874A (en) * | 1996-03-04 | 1998-04-28 | National Semiconductor Corporation | Preprocessor for automatic speech recognition system |
JP3199648B2 (ja) * | 1996-03-19 | 2001-08-20 | 三菱電機株式会社 | 信号識別器及び音声周波数帯域内信号伝送装置及び信号識別方法 |
US5999898A (en) * | 1996-06-20 | 1999-12-07 | International Business Machines Corporation | Voice/data discriminator |
DE69716266T2 (de) * | 1996-07-03 | 2003-06-12 | British Telecommunications P.L.C., London | Sprachaktivitätsdetektor |
US5926090A (en) * | 1996-08-26 | 1999-07-20 | Sharper Image Corporation | Lost article detector unit with adaptive actuation signal recognition and visual and/or audible locating signal |
US6708146B1 (en) * | 1997-01-03 | 2004-03-16 | Telecommunications Research Laboratories | Voiceband signal classifier |
FI971679A (fi) * | 1997-04-18 | 1998-10-19 | Nokia Telecommunications Oy | Puheen havaitseminen tietoliikennejärjestelmässä |
US6718297B1 (en) | 2000-02-15 | 2004-04-06 | The Boeing Company | Apparatus and method for discriminating between voice and data by using a frequency estimate representing both a central frequency and an energy of an input signal |
CA2432324A1 (en) | 2001-08-06 | 2003-02-20 | Index Corporation | Apparatus for determining dog's emotions by vocal analysis of barking sounds and method for the same |
US20030086444A1 (en) * | 2001-09-28 | 2003-05-08 | Globespan Virata, Incorporated | Voice/tone discriminator |
DE10245107B4 (de) * | 2002-09-27 | 2006-01-26 | Siemens Ag | Voice Activity Detection auf Basis von unüberwacht trainierten Clusterverfahren |
US20050015244A1 (en) * | 2003-07-14 | 2005-01-20 | Hideki Kitao | Speech section detection apparatus |
US20060241937A1 (en) * | 2005-04-21 | 2006-10-26 | Ma Changxue C | Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments |
KR100802984B1 (ko) | 2006-11-24 | 2008-02-14 | 연세대학교 산학협력단 | 기준 모델을 이용하여 미확인 신호를 판별하는 방법 및장치 |
JP6852786B2 (ja) | 2017-04-20 | 2021-03-31 | ヤマハ株式会社 | 機械学習装置、情報処理装置及び出力装置 |
EP3624113A1 (en) * | 2018-09-13 | 2020-03-18 | Nxp B.V. | Apparatus for processing a signal |
CN109472284A (zh) * | 2018-09-18 | 2019-03-15 | 浙江大学 | 一种基于无偏嵌入零样本学习的电芯缺陷分类方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3097349A (en) * | 1961-08-28 | 1963-07-09 | Rca Corp | Information processing apparatus |
FR2374651A1 (fr) * | 1976-12-16 | 1978-07-13 | Labo Cent Telecommunicat | Dispositif d'elimination des lobes secondaires d'auto-correlation d'un signal continu periodique code en phase |
US4281218A (en) * | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
US4321686A (en) * | 1980-01-24 | 1982-03-23 | Communications Satellite Corporation | Correction processor of self-adaptive filters |
IT1144551B (it) * | 1981-02-24 | 1986-10-29 | Cselt Centro Studi Lab Telecom | Dispositivo numerico per la discriminazione di segnali vocali e segnali dati entrambi numerizzati |
GB2139052A (en) * | 1983-04-20 | 1984-10-31 | Philips Electronic Associated | Apparatus for distinguishing between speech and certain other signals |
US4660166A (en) * | 1985-01-22 | 1987-04-21 | Bell Telephone Laboratories, Incorporated | Electronic network for collective decision based on large number of connections between signals |
US4802103A (en) * | 1986-06-03 | 1989-01-31 | Synaptics, Inc. | Brain learning and recognition emulation circuitry and method of recognizing events |
US4807168A (en) * | 1987-06-10 | 1989-02-21 | The United States Of America As Represented By The Administrator, National Aeronautics And Space Administration | Hybrid analog-digital associative neural network |
JPH01222299A (ja) * | 1988-03-01 | 1989-09-05 | Nippon Denso Co Ltd | 音声認識装置 |
AU608432B2 (en) * | 1988-03-11 | 1991-03-28 | Lg Electronics Inc. | Voice activity detection |
JP2736361B2 (ja) * | 1988-03-11 | 1998-04-02 | 日本電信電話株式会社 | ニューラルネット構成方法 |
JPH07104848B2 (ja) * | 1988-06-22 | 1995-11-13 | 株式会社エイ・ティ・アール自動翻訳電話研究所 | ニューラルネットの学習効率化方法 |
JPH0232395A (ja) * | 1988-07-22 | 1990-02-02 | Fujitsu Ltd | 音声区間切出制御方式 |
JPH0272398A (ja) * | 1988-09-07 | 1990-03-12 | Hitachi Ltd | 音声信号用前処理装置 |
US5048100A (en) * | 1988-12-15 | 1991-09-10 | Michael Kuperstein | Self organizing neural network method and system for general classification of patterns |
JPH02192335A (ja) * | 1989-01-20 | 1990-07-30 | Toshiba Corp | 語頭検出方式 |
JPH02195399A (ja) * | 1989-01-24 | 1990-08-01 | Sekisui Chem Co Ltd | 男女声の識別方式 |
-
1990
- 1990-11-27 JP JP2327729A patent/JP2643593B2/ja not_active Expired - Lifetime
- 1990-11-27 EP EP90312860A patent/EP0435458B1/en not_active Expired - Lifetime
- 1990-11-28 US US07/618,844 patent/US5315704A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0435458B1 (en) | 1995-02-01 |
US5315704A (en) | 1994-05-24 |
JPH03273722A (ja) | 1991-12-04 |
EP0435458A1 (en) | 1991-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2643593B2 (ja) | 音声・モデム信号識別回路 | |
US5185848A (en) | Noise reduction system using neural network | |
US7031916B2 (en) | Method for converging a G.729 Annex B compliant voice activity detection circuit | |
US11798574B2 (en) | Voice separation device, voice separation method, voice separation program, and voice separation system | |
EP0911806B1 (en) | Method and apparatus to detect and delimit foreground speech | |
WO2010001393A9 (en) | Apparatus and method for classification and segmentation of audio content, based on the audio signal | |
US20120158401A1 (en) | Music detection using spectral peak analysis | |
CN113488063B (zh) | 一种基于混合特征及编码解码的音频分离方法 | |
US4081605A (en) | Speech signal fundamental period extractor | |
CN112017632A (zh) | 一种自动化会议记录生成方法 | |
US20030061040A1 (en) | Probabalistic networks for detecting signal content | |
US6199036B1 (en) | Tone detection using pitch period | |
CN111341351A (zh) | 基于自注意力机制的语音活动检测方法、装置及存储介质 | |
US5046100A (en) | Adaptive multivariate estimating apparatus | |
US5999898A (en) | Voice/data discriminator | |
WO2005029463A1 (en) | A method for recovering target speech based on speech segment detection under a stationary noise | |
CN111341331B (zh) | 基于局部注意力机制的语音增强方法、装置及介质 | |
EP0308433B1 (en) | An adaptive multivariate estimating apparatus | |
KR102358151B1 (ko) | 컨볼루션 순환신경망을 이용한 잡음 제거 방법 | |
Lee et al. | An improved voice activity detection algorithm employing speech enhancement preprocessing | |
US6961718B2 (en) | Vector estimation system, method and associated encoder | |
JPH0556520B2 (ja) | ||
JPS6324335B2 (ja) | ||
Wu et al. | Adaptive pitch detection algorithm for noisy signals | |
CN117174104A (zh) | 基于融合多路编码特征协同解码的单通道语音增强方法 |