JP5413575B2 - Noise suppression method, apparatus, and program - Google Patents
Noise suppression method, apparatus, and program Download PDFInfo
- Publication number
- JP5413575B2 JP5413575B2 JP2009049915A JP2009049915A JP5413575B2 JP 5413575 B2 JP5413575 B2 JP 5413575B2 JP 2009049915 A JP2009049915 A JP 2009049915A JP 2009049915 A JP2009049915 A JP 2009049915A JP 5413575 B2 JP5413575 B2 JP 5413575B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- snr
- suppression coefficient
- temporary output
- suppression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000001629 suppression Effects 0.000 title claims description 173
- 238000000034 method Methods 0.000 title claims description 25
- 238000004364 calculation method Methods 0.000 claims description 87
- 230000008569 process Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 description 73
- 238000006243 chemical reaction Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 26
- 230000007774 longterm Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012886 linear function Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
- Noise Elimination (AREA)
Description
本発明は雑音抑圧の方法、装置及びプログラムに関する。 The present invention relates to a noise suppression method, apparatus, and program.
ノイズサプレッサ(雑音抑圧システム)は、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムであり、一般的に、周波数領域に変換した入力信号を用いて雑音成分のパワースペクトルを推定し、この推定パワースペクトルを入力信号から差し引くことにより、所望の音声信号に混在する雑音を抑圧するように動作する。雑音成分のパワースペクトルを継続的に推定することにより、非定常な雑音の抑圧にも適用することができる。ノイズサプレッサとしては、例えば、特許文献1に記載されている方式がある。
A noise suppressor (noise suppression system) is a system that suppresses noise (noise) superimposed on a desired audio signal, and generally estimates the power spectrum of a noise component using an input signal converted to the frequency domain. Then, the estimated power spectrum is subtracted from the input signal to operate so as to suppress noise mixed in the desired audio signal. By continuously estimating the power spectrum of the noise component, it can also be applied to non-stationary noise suppression. As a noise suppressor, for example, there is a method described in
さらに、演算量を削減した実現として、非特許文献1に記載されている方式がある。
Furthermore, there is a method described in
これらいずれの方式も、基本的な動作は等しい。すなわち、入力信号を線形変換で周波数領域に変換し、振幅成分を取り出して周波数成分毎に抑圧係数を計算する。その抑圧係数と各周波数成分における振幅の積と各周波数成分の位相を組み合わせて逆変換して雑音抑圧された出力を得る。このとき、抑圧係数はゼロと1の間の値であり、ゼロなら完全抑圧で出力はゼロ、1なら抑圧なしで入力がそのまま出力される。 Both of these methods have the same basic operation. That is, the input signal is converted into the frequency domain by linear conversion, the amplitude component is extracted, and the suppression coefficient is calculated for each frequency component. A noise-suppressed output is obtained by combining the suppression coefficient, the product of the amplitude of each frequency component, and the phase of each frequency component and performing inverse transform. At this time, the suppression coefficient is a value between zero and 1, and if it is zero, the output is completely suppressed, and if it is 1, the input is output as it is without suppression.
特許文献1に開示されたノイズサプレッサは、サンプル値系列として供給された劣化音声信号(所望音声信号と雑音の混在する信号)にフーリエ変換などの変換を施して複数の周波数成分に分割し、その中に含まれる雑音のパワースペクトルを複数の周波数成分それぞれに対して推定する。雑音推定方式の一例としては、過去の信号対雑音比で劣化音声を重み付けて雑音成分とする方式があり、その詳細は特許文献1に記載されている。供給された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて、劣化音声に乗算することによって雑音が抑圧された強調音声を求めるための抑圧係数を生成する。抑圧係数は周波数成分毎に求めるので、周波数成分の数と等しい抑圧係数が得られる。雑音抑圧係数生成の一例としては、強調音声の平均二乗パワーを最小化する最小平均二乗短時間スペクトル振幅法が広く用いられており、その詳細は特許文献1に記載されている。抑圧係数生成の過程で、先天的SNRも周波数別に推定する。推定先天的SNRは、抑圧係数生成に用いられると同時に、補正抑圧係数を求めるためにも用いられる。劣化音声と抑圧係数を各周波数で乗算し、その積を強調音声のパワースペクトルとして逆変換を行い、強調音声信号サンプルとする。これまでの処理ではパワースペクトルを用いた例を説明したが、代わりにその平方根に相当する振幅値を用いることができることは、広く知られている。
The noise suppressor disclosed in
これまで説明した関連する技術の構成では、残留雑音と出力歪が一般的にトレードオフの関係にあり、小さな残留雑音と小さな出力歪を両立することはできない。このため、過剰な抑圧による出力信号歪の増加を避けるためにある程度の残留雑音を許容するか、反対に、十分小さな残留雑音のために過剰な抑圧による出力歪を許容するかのどちらかを受け入れる必要があった。この問題に対して、推定雑音と仮出力から計算した音声存在確率に基づいて、音声区間では低歪を優先した抑圧を、非音声区間では低残留雑音を優先した抑圧を行うノイズサプレッサが、非特許文献2に開示されている。
In the configuration of the related technology described so far, the residual noise and output distortion are generally in a trade-off relationship, and it is impossible to achieve both small residual noise and small output distortion. Therefore, either tolerate some residual noise to avoid an increase in output signal distortion due to excessive suppression, or conversely, allow output distortion due to excessive suppression for sufficiently small residual noise. There was a need. In response to this problem, a noise suppressor that performs suppression with priority given to low distortion in the speech period and suppression with priority given to low residual noise in the non-speech period is based on the speech existence probability calculated from the estimated noise and the temporary output. It is disclosed in
非特許文献2に開示されたノイズサプレッサは、音声区間では低歪を優先した抑圧を、非音声区間では低残留雑音を優先した抑圧を行い、さらに音声区間と非音声区間の残留雑音レベルに不連続が生じないように、抑圧係数を設定する。このため、非音声区間における小さな残留雑音と音声区間における小さな出力歪を両立し、さらに両者の境界において不連続が生じない、高音質な強調音声を出力することができる。
The noise suppressor disclosed in Non-Patent
しかしながら、これまで説明した非特許文献2に開示された構成では、特に音声に対して雑音が大きなパワーを有する際に、音声区間と非音声区間の区別に誤りが生じるという問題がある。このため、非音声区間で大きな残留雑音を生じる、または音声区間で歪が大きくなる場合がある。これは、出力である強調音声の音質低下として知覚される。
However, in the configuration disclosed in
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、音声に対して雑音が大きなパワーを有する場合でも、非音声区間における小さな残留雑音と音声区間における小さな出力歪を両立し、高音質な強調音声を出力することのできる雑音抑圧の方法、装置、及びプログラムを提供することにある。 Therefore, the present invention has been invented in view of the above problems, and its purpose is to reduce a small residual noise in a non-voice section and a small output distortion in a voice section even when the noise has a large power for the voice. It is an object to provide a noise suppression method, apparatus, and program that are compatible and can output high-quality enhanced speech.
上記課題を解決する本発明は、入力信号を周波数領域信号に変換し、該周波数領域信号を用いて第1の推定雑音を求め、該第1の推定雑音と前記周波数領域信号を用いて抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけして仮出力を求め、該仮出力を用いて第2の推定雑音を求め、該第2の推定雑音を用いて音声らしい区間と非音声らしい区間を定め、前記音声らしい区間では歪が少なくなるように、前記非音声らしい区間では残留雑音が少なくなるように、前記抑圧係数を補正して補正抑圧係数を求め、該補正抑圧係数で前記周波数領域信号を重みづけすることによって雑音を抑圧することを特徴とする雑音抑圧の方法である。 The present invention that solves the above problem converts an input signal into a frequency domain signal, obtains a first estimated noise using the frequency domain signal, and uses the first estimated noise and the frequency domain signal to suppress a suppression coefficient. And calculating a temporary output by weighting the frequency domain signal with the suppression coefficient, determining a second estimated noise using the temporary output, and using the second estimated noise to determine a speech-like interval and a non-speech A correct interval is determined, and a correction suppression coefficient is obtained by correcting the suppression coefficient so that residual noise is reduced in the non-speech interval so that distortion is reduced in the speech-like interval, and the correction suppression coefficient is used to determine the correction suppression coefficient. A noise suppression method is characterized in that noise is suppressed by weighting a frequency domain signal.
上記課題を解決する本発明は、入力信号を周波数領域信号に変換し、該周波数領域信号を用いて前記入力信号における第1の音声含有率を推定し、該含有率に応じて決定した抑圧係数を用いて前記入力信号に含まれる雑音を抑圧して強調音声を求める際に、前記抑圧係数を求め、前記強調信号に残留する雑音を推定し、前記残留する雑音を用いて前記強調音声における第2の音声含有率を求め、前記第2の音声含有率が高いときには前記強調音声の歪が少なくなるように、前記第2の音声含有率が低いときには前記強調音声に残留する雑音が少なくなるように、前記入力信号に含まれる雑音を抑圧して強調音声を求めることを特徴とする雑音抑圧の方法である。尚、本発明における第一の音声含有率と第二の音声含有率とが、上述した本発明の第一の推定雑音と第二の推定雑音とに相当する。 The present invention that solves the above-described problems converts an input signal into a frequency domain signal, estimates a first voice content rate in the input signal using the frequency domain signal, and determines a suppression coefficient determined according to the content rate Is used to suppress the noise included in the input signal and obtain the enhanced speech, to obtain the suppression coefficient, to estimate the noise remaining in the enhanced signal, and to use the remaining noise to When the second audio content rate is high, distortion of the emphasized speech is reduced. When the second audio content rate is low, noise remaining in the emphasized speech is reduced. In addition, the noise suppression method is characterized in that noise included in the input signal is suppressed to obtain enhanced speech. In addition, the 1st audio | voice content rate and 2nd audio | voice content rate in this invention are corresponded to the 1st estimated noise and 2nd estimated noise of this invention mentioned above.
上記課題を解決する本発明は、入力信号を周波数領域信号に変換する変換部と、該周波数領域信号を用いて第1の推定雑音を求める第1の雑音推定部と、該第1の推定雑音と前記周波数領域信号を用いて抑圧係数を定める雑音抑圧係数生成部と、該抑圧係数で前記周波数領域信号を重みづけして仮出力を求める第1の乗算器と、該仮出力を用いて第2の推定雑音を求める第2の雑音推定部と、該第2の推定雑音を用いて音声らしい区間と非音声らしい区間を定める仮出力SNR計算部と、前記音声らしい区間では歪が少なくなるように、前記非音声らしい区間では残留雑音が少なくなるように、前記抑圧係数を補正して補正抑圧係数を求める抑圧係数補正部と、該補正抑圧係数で前記周波数領域信号を重みづけすることによって雑音を抑圧する第2の乗算器とを有することを特徴とする雑音抑圧装置である。 The present invention for solving the above-described problems includes a conversion unit that converts an input signal into a frequency domain signal, a first noise estimation unit that obtains a first estimated noise using the frequency domain signal, and the first estimated noise. And a noise suppression coefficient generator that determines a suppression coefficient using the frequency domain signal, a first multiplier that obtains a temporary output by weighting the frequency domain signal with the suppression coefficient, and a first multiplier using the temporary output A second noise estimator that obtains the estimated noise of 2, a temporary output SNR calculator that uses the second estimated noise to determine a speech-like section and a non-speech-like section, and distortion is reduced in the speech-like section. In addition, a suppression coefficient correction unit that corrects the suppression coefficient to obtain a corrected suppression coefficient so that residual noise is reduced in the non-voice-like section, and noise by weighting the frequency domain signal with the corrected suppression coefficient Repress A noise suppression apparatus characterized by a second multiplier.
上記課題を解決する本発明は、コンピュータに、入力信号を周波数領域信号に変換し、該周波数領域信号を用いて第1の推定雑音を求め、該第1の推定雑音と前記周波数領域信号を用いて抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけして仮出力を求め、該仮出力を用いて第2の推定雑音を求め、該第2の推定雑音を用いて音声らしい区間と非音声らしい区間を定め、前記音声らしい区間では歪が少なくなるように、前記非音声らしい区間では残留雑音が少なくなるように、前記抑圧係数を補正して補正抑圧係数を求め、該補正抑圧係数で前記周波数領域信号を重みづけすることによって雑音を抑圧する処理を実行させるための雑音抑圧プログラムである。 The present invention that solves the above-described problems is a computer that converts an input signal into a frequency domain signal, obtains a first estimated noise using the frequency domain signal, and uses the first estimated noise and the frequency domain signal. A suppression coefficient is determined, the frequency domain signal is weighted with the suppression coefficient to obtain a temporary output, a second estimated noise is obtained using the temporary output, and a speech-like section is obtained using the second estimated noise. A non-voice-like section is determined, and a correction suppression coefficient is obtained by correcting the suppression coefficient so that residual noise is reduced in the non-voice-like section so that distortion is reduced in the voice-like section, and the correction suppression A noise suppression program for executing a process of suppressing noise by weighting the frequency domain signal with a coefficient.
本発明は、非音声区間における小さな残留雑音と音声区間における小さな出力歪を両立し、さらに両者の境界において不連続が生じない、高音質な強調音声を出力することができる。 The present invention can output high-quality emphasized speech in which a small residual noise in a non-speech segment and a small output distortion in a speech segment are compatible, and discontinuity does not occur at the boundary between the two.
図1は、本発明の最良の実施の形態を示すブロック図である。入力端子1に供給された劣化音声は、変換部2においてフーリエ変換などの変換を施して複数の周波数成分に分割され、その振幅2乗成分(パワースペクトル)が乗算器5、雑音推定部300、雑音抑圧係数生成部601、及び乗算器660へ供給される。位相は、逆変換部3に伝達される。
FIG. 1 is a block diagram showing a preferred embodiment of the present invention. The degraded speech supplied to the
雑音推定部300は、劣化音声パワースペクトルの中に含まれる雑音のパワースペクトルを複数の周波数成分それぞれに対して推定し、雑音抑圧係数生成部601に伝達する。雑音抑圧係数生成部601は、劣化音声パワースペクトルと推定雑音パワースペクトルを用いて抑圧係数を生成し、乗算器660と抑圧係数補正部651とに供給する。乗算器660は、劣化音声パワースペクトルと抑圧係数との積を仮出力として求め、音声存在確率計算部670、仮出力SNR計算部680、及び雑音推定部301に供給する。雑音推定部301は、乗算器660の乗算結果である仮出力を受け、仮出力に含まれる雑音のパワースペクトルを複数の周波数成分kそれぞれに対して推定し、仮出力の推定雑音θn 2(k)として音声存在確率計算部670と仮出力SNR計算部680に伝達する。
The
音声存在確率計算部670は、仮出力の推定雑音と仮出力からフレームn、周波数成分kにおける音声存在確率Vn(k)を求めて、仮出力SNR計算部680と抑圧係数補正部651に供給する。音声存在確率の一例として、仮出力xn 2(k)と仮出力の推定雑音θn 2(k)の比を用いることができる。すなわち、次式によって音声存在確率Vn(k)を定める。
The speech existence
仮出力SNR計算部680は、音声存在確率Vn(k)を用いて、仮出力と仮出力との推定雑音から仮出力SNRを求め、抑圧係数補正部651に供給する。仮出力SNRの一例として、仮出力の長時間平均xn 2(k)バーと仮出力の推定雑音パワースペクトルθn 2(k)による長時間出力SNRξn L(k)を用いることができる。このとき、仮出力SNRξn L(k)は次式で与えられる。
The temporary output
音声存在確率Vn(k)が大きいかどうかの判定は、音声存在確率Vn(k)を予め定められた閾値Vth(k)と比較して行うことができる。音声存在確率が大きいということは、音声区間である可能性が高いことを意味する。フレームnに音声区間である確率をμn(k)とすると、非音声区間である確率は1−μn(k)となる。このとき、長時間平均xn+1 2(k)バーは、現在の長時間平均xn 2(k)バーを用いて次式で更新することができる。 The determination of whether or not the voice presence probability V n (k) is large can be made by comparing the voice presence probability V n (k) with a predetermined threshold value V th (k). A high voice presence probability means that there is a high possibility that the voice section is a voice section. If the probability that the frame n is a speech segment is μ n (k), the probability that it is a non-speech segment is 1−μ n (k). At this time, the long-time average x n + 1 2 (k) bar can be updated by the following equation using the current long-time average x n 2 (k) bar.
また、Vn(k)−Vth(k)の符号をとって、μn(k)を次式で計算することもできる。 Further, μ n (k) can be calculated by the following equation by taking the sign of V n (k) −V th (k).
抑圧係数補正部651は、仮出力SNRと音声存在確率Vn(k)を用いて抑圧係数Gn(k)バーを補正し、補正抑圧係数Gn(k)ハットとして乗算器5に供給すると同時に雑音抑圧係数生成部601に帰還する。乗算器5は、変換部2から供給された劣化音声と抑圧係数補正部651から供給された補正抑圧係数を各周波数で乗算し、その積を強調音声のパワースペクトルとして逆変換部3に伝達する。逆変換部3は、乗算器5から供給された強調音声パワースペクトルと変換部2から供給された劣化音声の位相を合わせて逆変換を行い、強調音声信号サンプルとして、出力端子4に供給する。これまでの処理ではパワースペクトルを用いた例を説明したが、代わりにその平方根に相当する振幅値を用いることができることは、広く知られている。
When the suppression
図2は、変換部2の構成を示すブロック図である。変換部2はフレーム分割部21、窓がけ処理部22、及びフーリエ変換部23から構成されている。劣化音声信号サンプルは、フレーム分割部21に供給され、K/2サンプル毎のフレームに分割される。ここに、Kは偶数とする。フレームに分割された劣化音声信号サンプルは、窓がけ処理部22に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号yn(t)(t=0,1,...,K/2−1)に対するw(t)で窓がけされた信号yn(t)バーは、次式で与えられる。
FIG. 2 is a block diagram illustrating a configuration of the
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)しては、例えば次式に示すハニング窓を用いることができる。 Hereinafter, the description will be continued by taking as an example a case in which 50% of two consecutive frames overlap each other. As w (t), for example, a Hanning window represented by the following equation can be used.
図3は、逆変換部3の構成を示すブロック図である。逆変換部3は逆フーリエ変換部33、窓がけ処理部32、及びフレーム合成部31から構成されている。逆フーリエ変換部33は、乗算器5から供給された強調音声パワースペクトル|Xn(k)|2バーを用いて求めた強調音声振幅スペクトル|Xn(k)|バーと変換部2から供給された劣化音声位相スペクトルarg Yn(k)とを乗算して、強調音声Xn(k)バーを求める。すなわち、
FIG. 3 is a block diagram showing the configuration of the
得られた強調音声Xn(k)バーに逆フーリエ変換を施し、1フレームがKサンプルから構成される時間領域サンプル値系列xn(t)バー(t=0,1,...,K−1)として、窓がけ処理部32に供給し、窓関数w(t)との乗算を行う。第nフレームの入力信号xn(t)バー(t=0,1,...,K/2−1)に対するw(t)で窓がけされた信号xn(t)バーは、次式で与えられる。
The obtained emphasized speech X n (k) bar is subjected to inverse Fourier transform, and a time domain sample value sequence x n (t) bar (t = 0, 1,. -1) is supplied to the
図4は、図1の雑音推定部300の構成を示すブロック図である。雑音推定部300は、推定雑音計算部310、重み付き劣化音声計算部320、及びカウンタ330から構成される。雑音推定部300に供給された劣化音声パワースペクトルは、推定雑音計算部310、及び重み付き劣化音声計算部320に伝達される。重み付き劣化音声計算部320は、供給された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて重み付き劣化音声パワースペクトルを計算し、推定雑音計算部310に伝達する。推定雑音計算部310は、劣化音声パワースペクトル、重み付き劣化音声パワースペクトル、及びカウンタ330から供給されるカウント値を用いて雑音のパワースペクトルを推定し、推定雑音パワースペクトルとして出力すると同時に、重み付き劣化音声計算部320に帰還する。なお、雑音推定部301は雑音推定部300とまったく同じ構成とすることができる。入力である劣化音声スペクトルが仮出力スペクトルに対応するように、入力を供給する。その場合、動作も雑音推定部300とまったく同じになるので、詳細な説明は省略する。
FIG. 4 is a block diagram illustrating a configuration of the
図5は、図4に含まれる推定雑音計算部310の構成を示すブロック図である。更新判定部400、レジスタ長記憶部410、推定雑音記憶部420、スイッチ430、シフトレジスタ440、加算器450、最小値選択部460、除算部470、カウンタ480を有する。スイッチ430には、重み付き劣化音声パワースペクトルが供給されている。スイッチ430が回路を閉じたときに、重み付き劣化音声パワースペクトルは、シフトレジスタ440に伝達される。シフトレジスタ440は、更新判定部400から供給される制御信号に応じて、内部レジスタの記憶値を隣接レジスタにシフトする。シフトレジスタ長は、後述するレジスタ長記憶部410に記憶されている値に等しい。シフトレジスタ440の全レジスタ出力は、加算器450に供給される。加算器450は、供給された全レジスタ出力を加算して、加算結果を除算部470に伝達する。
FIG. 5 is a block diagram showing a configuration of estimated
一方、更新判定部400には、カウント値、周波数別劣化音声パワースペクトル及び周波数別推定雑音パワースペクトルが供給されている。更新判定部400は、カウント値が予め設定された値に到達するまでは常に“1”を、到達した後は入力された劣化音声信号が雑音であると判定されたときに“1”'を、それ以外のときに“0”を出力し、カウンタ480、スイッチ430、及びシフトレジスタ440に伝達する。スイッチ430は、更新判定部から供給された信号が“1”のときに回路を閉じ、“0”のときに開く。カウンタ480は、更新判定部から供給された信号が“1”のときにカウント値を増加し、“0”のときには変更しない。シフトレジスタ440は、更新判定部から供給された信号が“1”のときにスイッチ430から供給される信号サンプルを1サンプル取り込むと同時に、内部レジスタの記憶値を隣接レジスタにシフトする。最小値選択部460には、カウンタ480の出力とレジスタ長記憶部410の出力が供給されている。
On the other hand, the
最小値選択部460は、供給されたカウント値とレジスタ長のうち、小さい方を選択して、除算部470に伝達する。除算部470は、加算器450から供給された劣化音声パワースペクトルの加算値をカウント値又はレジスタ長の小さい方の値で除算し、商を周波数別推定雑音パワースペクトルλn(k)として出力する。Bn(k)(n=0,1,...,N−1)をシフトレジスタ440に保存されている劣化音声パワースペクトルのサンプル値とすると、λn(k)は、
The minimum
図6は、図5に含まれる更新判定部400の構成を示すブロック図である。更新判定部400は、論理和計算部4001、比較部4004、4002、閾値記憶部4005、4003、閾値計算部4006を有する。図4のカウンタ330から供給されるカウント値は、比較部4002に伝達される。閾値記憶部4003の出力である閾値も、比較部4002に伝達される。比較部4002は、供給されたカウント値と閾値を比較し、カウント値が閾値より小さいときに“1”を、カウント値が閾値より大きいときに“0”を、論理和計算部4001に伝達する。一方、閾値計算部4006は、図5の推定雑音記憶部420から供給される推定雑音パワースペクトルに応じた値を計算し、閾値として閾値記憶部4005に出力する。最も簡単な閾値の計算方法は、推定雑音パワースペクトルの定数倍である。
FIG. 6 is a block diagram illustrating a configuration of the
その他に、高次多項式や非線形関数を用いて閾値を計算することも可能である。閾値記憶部4005は、閾値計算部4006から出力された閾値を記憶し、1フレーム前に記憶された閾値を比較部4004へ出力する。比較部4004は、閾値記憶部4005から供給される閾値と図1の変換部2から供給される劣化音声パワースペクトルを比較し、劣化音声パワースペクトルが閾値よりも小さければ“1”を、大きければ“0”を論理和計算部4001に出力する。すなわち、推定雑音パワースペクトルの大きさをもとに、劣化音声信号が雑音であるか否かを判別している。論理和計算部4001は、比較部4202の出力値と比較部4204の出力値との論理和を計算し、計算結果を図5のスイッチ430、シフトレジスタ440及びカウンタ480に出力する。このように、初期状態や無音区間だけでなく、有音区間でも劣化音声パワーが小さい場合には、更新判定部400は“1”を出力する。すなわち、推定雑音の更新が行われる。閾値の計算は各周波数で行われるため、各周波数で推定雑音の更新を行うことができる。
In addition, it is possible to calculate the threshold value using a high-order polynomial or a nonlinear function. The threshold
図7は、重み付き劣化音声計算部320の構成を示すブロック図である。重み付き劣化音声計算部320は、推定雑音記憶部3201、周波数別SNR計算部3202、非線形処理部3204、及び乗算器3203を有する。推定雑音記憶部3201は、図4の推定雑音計算部310から供給される推定雑音パワースペクトルを記憶し、1フレーム前に記憶された推定雑音パワースペクトルを周波数別SNR計算部3202へ出力する。周波数別SNR計算部3202は、推定雑音記憶部3201から供給される推定雑音パワースペクトルと図1の変換部2から供給される劣化音声パワースペクトルを用いてSNRを周波数帯域毎に求め、非線形処理部3204に出力する。具体的には、次式に従って、供給された劣化音声パワースペクトルを推定雑音パワースペクトルで除算して周波数別SNRγn(k)ハットを求める。
FIG. 7 is a block diagram illustrating a configuration of the weighted deteriorated
非線形処理部3204は、周波数別SNR計算部3202から供給されるSNRを用いて重み係数ベクトルを計算し、重み係数ベクトルを乗算器3203に出力する。乗算器3203は、図1の変換部2から供給される劣化音声パワースペクトルと、非線形処理部3204から供給される重み係数ベクトルの積を周波数帯域毎に計算し、重み付き劣化音声パワースペクトルを図4の推定雑音計算部310に出力する。
The
非線形処理部3204は、多重化された入力値それぞれに応じた実数値を出力する、非線形関数を有する。図8に、非線形関数の例を示す。f1を入力値としたとき、図8に示される非線形関数の出力値f2は、
The
非線形処理部3204は、周波数別SNR計算部3202から供給される周波数帯域別SNRを、非線形関数によって処理して重み係数を求め、乗算器3203に伝達する。すなわち、非線形処理部3204はSNRに応じた1から0までの重み係数を出力する。SNRが小さい時は1を、大きい時は0を出力する。
The
図7の乗算器3203で劣化音声パワースペクトルと乗算される重み係数は、SNRに応じた値になっており、SNRが大きい程、すなわち劣化音声に含まれる音声成分が大きい程、重み係数の値は小さくなる。推定雑音の更新には一般に劣化音声パワースペクトルが用いられるが、推定雑音の更新に用いる劣化音声パワースペクトルに対して、SNRに応じた重みづけを行うことで、劣化音声パワースペクトルに含まれる音声成分の影響を小さくすることができ、より精度の高い雑音推定を行うことができる。なお、重み係数の計算に非線形関数を用いた例を示したが、非線形関数以外にも線形関数や高次多項式など、他の形で表されるSNRの関数を用いる事も可能である。
The weighting coefficient multiplied by the deteriorated sound power spectrum by the
図9は、図1に含まれる雑音抑圧係数生成部601の構成を示すブロック図である。図16に示した雑音抑圧係数生成部600の構成と比較すると、推定先天的SNR計算部620の出力である推定先天的SNRが出力されない点が異なる。すなわち、雑音抑圧係数生成部601の出力は、抑圧係数だけである。
FIG. 9 is a block diagram illustrating a configuration of the noise suppression
図10は、図9に含まれる推定先天的SNR計算部620の構成を示すブロック図である。推定先天的SNR計算部620は、値域限定処理部6201、後天的SNR記憶部6202、抑圧係数記憶部6203、乗算器6204、6205、重み記憶部6206、重み付き加算部6207、加算器6208を有する。図9の後天的SNR計算部610から供給される後天的SNRγn(k)(k=0,1,...,M−1)は、後天的SNR記憶部6202と加算器6208とに伝達される。後天的SNR記憶部6205は、第nフレームにおける後天的SNRγn(k)を記憶すると共に、第n−1フレームにおける後天的SNRγn−1(k)を乗算器6205に伝達する。図1の抑圧係数補正部651から供給される補正抑圧係数Gn(k)バー(k=0,1,...,M−1)は、抑圧係数記憶部6203に伝達される。抑圧係数記憶部6203は、第nフレームにおける補正抑圧係数Gn(k)バーを記憶すると共に、第n−1フレームにおける補正抑圧係数Gn−1(k)バーを乗算器6204に伝達する。乗算器6204は、供給されたGn(k)バーを2乗してGn−1 2(k)バーを求め、乗算器6205に伝達する。乗算器6205は、Gn−1 2(k)バーとγn−1(k)とをk=0,1,...,M−1に対して乗算して、Gn−1 2(k)バーγn−1(k)を求め、結果を重み付き加算部6207に過去の推定SNR922として伝達する。
FIG. 10 is a block diagram illustrating a configuration of the estimated innate
加算器6208の他方の端子には−1が供給されており、加算結果γn(k)−1が値域限定処理部6201に伝達される。値域限定処理部6201は、加算器6208から供給された加算結果γn(k)−1に値域限定演算子P[・]による演算を施し、結果であるP[γn(k)−1]を重み付き加算部6207に瞬時推定SNR921として伝達する。ただし、P[x]は次式で定められる。
The other terminal of the
図11は、図10に含まれる重み付き加算部6207の構成を示すブロック図である。重み付き加算部6207は、乗算器6901、6903、定数乗算器6905、加算器6902、6904を有する。図10の値域限定処理部6201から周波数帯域別瞬時推定SNRが、図10の乗算器6205から過去の周波数帯域別SNRが、図10の重み記憶部6206から重みが、それぞれ入力として供給される。値αを有する重みは、定数乗算器6905と乗算器6903に伝達される。定数乗算器6905は入力信号を−1倍して得られた−αを、加算器6904に伝達する。加算器6904のもう一方の入力としては1が供給されており、加算器6904の出力は両者の和である1−αとなる。1−αは乗算器6901に供給されて、もう一方の入力である周波数帯域別瞬時推定SNRP[γn(k)−1]と乗算され、積である(1−α)P[γn(k)−1]が加算器6902に伝達される。一方、乗算器6903では、重みとして供給されたαと過去の推定SNRが乗算され、積であるαGn−1 2(k)バーγn−1(k)が加算器6902に伝達される。加算器6902は、(1−α)P[γn(k)−1]とαGn−1 2(k)バーγn−1(k)の和を、周波数帯域別推定先天的SNRとして、出力する。
FIG. 11 is a block diagram illustrating a configuration of the
図12は、図9に含まれる雑音抑圧係数生成部630を示すブロック図である。雑音抑圧係数生成部630は、MMSE STSAゲイン関数値計算部6301、一般化尤度比計算部6302、及び抑圧係数計算部6303を有する。以下、非特許文献3(1984年12月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第32巻、第6号(IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING,VOL.32, NO.6, PP.1109-1121, DEC, 1984)、1109〜1121ページ)に記載されている計算式をもとに、抑圧係数の計算方法を説明する。
FIG. 12 is a block diagram showing the noise suppression
フレーム番号をn、周波数番号をkとし、γn(k)を図9の後天的SNR計算部610から供給される周波数別後天的SNR、ξn(k)ハットを図9の推定先天的SNR計算部620から供給される周波数別推定先天的SNR、qを図9の音声非存在確率記憶部640から供給される音声非存在確率とする。
The frame number is n, the frequency number is k, γ n (k) is the acquired SNR by frequency supplied from the acquired
また、ηn(k)=ξn(k)ハット/(1−q)、vn(k)=(ηn(k)γn(k))/(1+ηn(k))とする。 Further, η n (k) = ξ n (k) hat / (1-q), v n (k) = (η n (k) γ n (k)) / (1 + η n (k)).
MMSE STSAゲイン関数値計算部6301は、図9の後天的SNR計算部610から供給される後天的SNRγn(k)、図9の推定先天的SNR計算部620から供給される推定先天的SNRξn(k)ハット及び図9の音声非存在確率記憶部640から供給される音声非存在確率qをもとに、周波数帯域毎にMMSE STSAゲイン関数値を計算し、抑圧係数計算部6303に出力する。周波数帯域毎のMMSE STSAゲイン関数値Gn(k)は、
The MMSE STSA gain function
一般化尤度比計算部6302は、図9の後天的SNR計算部610から供給される後天的SNRγn(k)、図9の推定先天的SNR計算部620から供給される推定先天的SNRξn(k)ハット及び図9の音声非存在確率記憶部640から供給される音声非存在確率qをもとに、周波数帯域毎に一般化尤度比を計算し、抑圧係数計算部6303に伝達する。周波数帯域毎の一般化尤度比Λn(k)は、
The generalized
抑圧係数計算部6303は、MMSE STSAゲイン関数値計算部6301から供給されるMMSE STSAゲイン関数値Gn(k)と一般化尤度比計算部6302から供給される一般化尤度比Λn(k)から周波数帯域毎に抑圧係数を計算し、図1の抑圧係数補正部651へ出力する。周波数帯域毎の抑圧係数Gn(k)バーは、
The suppression
図13に、抑圧係数補正部651の構成例を示す。抑圧係数補正部651は、抑圧係数下限値計算部6512と最大値選択部6511とを含む。抑圧係数下限値計算部6512には、仮出力SNRξnL(k)と音声存在確率Vnが供給されている。抑圧係数下限値計算部6512は、次式に基づいて、関数A(ξn L(k))と音声区間に対応した抑圧係数最小値fsを用いて、抑圧係数の下限値Amin(Vn,ξn L(k))を計算し、最大値選択部6511に伝達する。
FIG. 13 shows a configuration example of the suppression
最大値計算部6511は、雑音抑圧係数計算部630から受けた抑圧係数Gn(k)バーと抑圧係数下限値計算部6512を比較して、大きいほうの値を補正抑圧係数Gn(k)ハットとして出力する。この処理は、次式で表すことができる。
Maximum
なお、これまでの実施の形態では、特許文献1に従って、各周波数成分に対して独立に、抑圧係数を計算し、それを用いて雑音抑圧を行う例について説明してきた。しかし、演算量を削減するために、非特許文献1に開示されているように、複数の周波数成分に対して共通の抑圧係数を計算し、それを用いて雑音抑圧を行うこともできる。その場合は、図1の変換部2と雑音推定部300及び雑音抑圧係数生成部601の間に帯域統合部を具備する構成となる。
In the embodiments described so far, according to
さらに、非特許文献1にあるように、図1の変換部2の前にオフセット消去部を、変換部2の直後に振幅補正部と位相補正部を具備することにより、周波数領域で高域通過フィルタを形成することもでき、演算量を削減することができる。また、複数の周波数成分に対して共通の抑圧係数を計算する際に、特定の周波数帯域に対応した雑音推定値を補正することもできる。
Further, as described in
図14は、本発明の第2の実施の形態に基づく信号処理装置のブロック図である。本発明の第2の実施形態は、プログラム制御により動作するコンピュータ(中央処理装置;プロセッサ;データ処理装置)1000と、入力端子1及び出力端子4とから構成されている。コンピュータ1000は、変換部2、乗算器5、逆変換部3、雑音推定部300、雑音抑圧係数生成部601、乗算器660、音声存在確率計算部670、仮出力SNR計算部680、抑圧係数補正部651を含む。
FIG. 14 is a block diagram of a signal processing device according to the second embodiment of the present invention. The second embodiment of the present invention includes a computer (central processing unit; processor; data processing unit) 1000 that operates by program control, and an
入力端子1に供給された劣化音声は、コンピュータ1000内の変換部2においてフーリエ変換などの変換を施して複数の周波数成分に分割され、雑音推定部300、雑音抑圧係数生成部601、乗算器660及び乗算器5へ供給される。位相は、逆変換部3に伝達される。雑音推定部300は、劣化音声パワースペクトルの中に含まれる雑音のパワースペクトルを複数の周波数成分それぞれに対して推定し、雑音抑圧係数生成部601、音声存在確率計算部670、仮出力SNR計算部680に伝達する。雑音抑圧係数生成部601は、劣化音声パワースペクトルと推定雑音パワースペクトルを用いて抑圧係数を生成し、乗算器660と抑圧係数補正部651とに供給する。乗算器660は、劣化音声パワースペクトルと抑圧係数の積を仮出力として求め、音声存在確率計算部670と仮出力SNR計算部680に供給する。音声存在確率計算部670は、仮出力と推定雑音から音声存在確率を求めて、仮出力SNR計算部680と抑圧係数補正部651とに供給する。仮出力SNR計算部680は、音声存在確率を用いて、仮出力と推定雑音から仮出力SNRを求め、抑圧係数補正部651に供給する。抑圧係数補正部651は、仮出力SNR、音声存在確率、及び抑圧係数を用いて補正抑圧係数を求め、これを乗算器5に供給すると同時に雑音抑圧係数生成部601に帰還する。乗算器5は、変換部2から供給された劣化音声と抑圧係数補正部651から供給された補正抑圧係数を各周波数で乗算し、その積を強調音声のパワースペクトルとして逆変換部3に伝達する。逆変換部3は、乗算器5から供給された強調音声パワースペクトルと変換部2から供給された劣化音声の位相を合わせて逆変換を行い、強調音声信号サンプルとして、出力端子4に供給する。
The deteriorated speech supplied to the
このような構成で動作させることによって、本実施の形態では、音声区間では低歪を優先した抑圧を、非音声区間では低残留雑音を優先した抑圧を行い、さらに音声区間と非音声区間の残留雑音レベルに不連続が生じないように、抑圧係数を設定する。このため、非音声区間における小さな残留雑音と音声区間における小さな出力歪を両立し、さらに両者の境界において不連続が生じない、高音質な強調音声を出力することができる。 By operating in such a configuration, in the present embodiment, suppression with priority given to low distortion is performed in the speech segment, suppression with priority to low residual noise is performed in the non-speech segment, and residual in the speech segment and the non-speech segment is further performed. A suppression coefficient is set so that discontinuity does not occur in the noise level. For this reason, it is possible to output high-quality emphasized speech in which a small residual noise in a non-speech segment and a small output distortion in a speech segment are compatible, and discontinuity does not occur at the boundary between the two.
これまで説明した全ての実施の形態では、雑音抑圧の方式として、最小平均2乗誤差短時間スペクトル振幅法を仮定してきたが、その他の方法にも適用することができる。このような方法の例として、非特許文献5(1979年12月、プロシーディングス・オブ・ザ・アイ・イー・イー・イー、第67巻、第12号 (PROCEEDINGS OF THE IEEE, VOL.67, NO.12, PP.1586-1604, DEC, 1979)、1586〜1604ページ)に開示されているウィーナーフィルタ法や、非特許文献6(1979年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第27巻、第2号 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.27, NO.2, PP.113-120, APR, 1979)、113〜120ページ)に開示されているスペクトル減算法などがあるが、これらの詳細な構成例については説明を省略する。 In all the embodiments described so far, the minimum mean square error short-time spectrum amplitude method has been assumed as a noise suppression method, but it can also be applied to other methods. As an example of such a method, Non-Patent Document 5 (December 1979, Proceedings of the IEE, Vol. 67, No. 12 (PROCEEDINGS OF THE IEEE, VOL.67, NO.12, PP.1586-1604, DEC, 1979), pages 1586 to 1604), and Non-Patent Document 6 (April 1979, IEE Transactions) On-Acoustics Speech and Signal Processing, Vol. 27, No. 2 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.27, NO.2, PP.113-120, APR, 1979 ), Pages 113 to 120), and the like. However, description of these detailed configuration examples will be omitted.
以上好ましい実施の形態及び態様をあげて本発明を説明したが、本発明は必ずしも上記実施の形態、実施例及び態様に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。 Although the present invention has been described with reference to the preferred embodiments and aspects, the present invention is not necessarily limited to the above-described embodiments, examples, and aspects, and various modifications may be made within the scope of the technical idea. Can be implemented.
1 入力端子
2 変換部
3 逆変換部
4 出力端子
5,660,3203,6204,6205,6901,6903,6507 乗算器
21 フレーム分割部
22,32 窓がけ処理部
23 フーリエ変換部
31 フレーム合成部
33 逆フーリエ変換部
300,301 雑音推定部
310 推定雑音計算部
320 重み付き劣化音声計算部
330,480 カウンタ
400 更新判定部
410 レジスタ長記憶部
420,3201 推定雑音記憶部
430,6505 スイッチ
440 シフトレジスタ
450,6208,6902, 6904 加算器
460 最小値選択部
470 除算部
600,601 雑音抑圧係数生成部
610 後天的SNR計算部
620 推定先天的SNR計算部
630 雑音抑圧係数計算部
640 音声非存在確率記憶部
650,651 抑圧係数補正部
670 音声存在確率計算部
680 仮出力SNR計算部
1000 コンピュータ
3202 周波数別SNR計算部
3204 非線形処理部
4001 論理和計算部
4002,4004,6504 比較部
4003,4005,6503 閾値記憶部
4006 閾値計算部
6201 値域限定処理部
6202 後天的SNR記憶部
6203 抑圧係数記憶部
6206 重み記憶部
6207 重み付き加算部
6301 MMSE STSAゲイン関数値計算部
6302 一般化尤度比計算部
6303 抑圧係数計算部
6501 最大値選択部
6502 抑圧係数下限値記憶部
6506 修正値記憶部
6511 最大値選択部
6512 抑圧係数下限値計算部
6905 定数乗算器
DESCRIPTION OF
23
Claims (10)
該周波数領域信号を用いて第1の推定雑音を求め、
該第1の推定雑音と前記周波数領域信号を用いて抑圧係数を定め、
該抑圧係数で前記周波数領域信号を重みづけして仮出力を求め、
該仮出力を用いて第2の推定雑音を求め、
該第2の推定雑音を用いて前記仮出力のSNRを求め、
前記仮出力SNRが高いときに歪が少なくなるように、前記仮出力SNRが低いときに残留雑音が少なくなるように、前記抑圧係数を補正して補正抑圧係数を求め、
該補正抑圧係数で前記周波数領域信号を重みづけすることによって雑音を抑圧する
ことを特徴とする雑音抑圧の方法。 Convert the input signal to a frequency domain signal,
Determining a first estimated noise using the frequency domain signal;
A suppression coefficient is determined using the first estimated noise and the frequency domain signal,
Weighting the frequency domain signal with the suppression coefficient to obtain a temporary output,
A second estimated noise is obtained using the temporary output,
An SNR of the temporary output is obtained using the second estimated noise,
Correcting the suppression coefficient so as to reduce residual noise when the temporary output SNR is low so as to reduce distortion when the temporary output SNR is high, and obtaining a corrected suppression coefficient;
A noise suppression method comprising suppressing noise by weighting the frequency domain signal with the correction suppression coefficient.
該比の値が大きいときに前記仮出力SNRが低いときの残留雑音が小さくなるように、前記補正抑圧係数を求める
ことを特徴とする請求項1に記載の雑音抑圧の方法。 Find the ratio of the average power when the temporary output SNR is high and the average power when the temporary output SNR is low ,
2. The noise suppression method according to claim 1, wherein the correction suppression coefficient is obtained so that residual noise when the temporary output SNR is low becomes small when the ratio value is large.
該比の値が小さいときに前記仮出力SNRが低いときの残留雑音が大きくなるように、前記補正抑圧係数を求める
ことを特徴とする請求項1又は請求項2に記載の雑音抑圧の方法。 Find the ratio of the average power when the temporary output SNR is high and the average power when the temporary output SNR is low ,
3. The noise suppression method according to claim 1, wherein the correction suppression coefficient is obtained so that residual noise becomes large when the temporary output SNR is low when the ratio value is small.
該周波数領域信号を用いて前記入力信号における第1の音声含有率を推定し、
前記第1の音声含有率に応じて決定した抑圧係数を用いて、前記入力信号に含まれる雑音を抑圧して強調音声を求め、
前記強調音声に残留する雑音を推定し、
前記残留する雑音を用いて前記強調音声における第2の音声含有率を求め、
前記第2の音声含有率が高いときには前記強調音声の歪が少なくなるように、前記第2の音声含有率が低いときには前記強調音声に残留する雑音が少なくなるように、前記入力信号に含まれる雑音を抑圧して強調音声を求める
ことを特徴とする雑音抑圧の方法。 Convert the input signal to a frequency domain signal,
Using the frequency domain signal to estimate a first audio content in the input signal;
Using the suppression coefficient determined in accordance with the first speech content rate, the noise included in the input signal is suppressed to obtain enhanced speech,
Estimating noise remaining in the enhanced speech ;
Using the residual noise to determine a second speech content in the enhanced speech;
It is included in the input signal so that distortion of the emphasized sound is reduced when the second sound content rate is high, and noise remaining in the emphasized sound is reduced when the second sound content rate is low. A method of noise suppression, characterized in that enhanced speech is obtained by suppressing noise.
該周波数領域信号を用いて第1の推定雑音を求める第1の雑音推定部と、
該第1の推定雑音と前記周波数領域信号を用いて抑圧係数を定める雑音抑圧係数生成部と、
該抑圧係数で前記周波数領域信号を重みづけして仮出力を求める第1の乗算器と、
該仮出力を用いて第2の推定雑音を求める第2の雑音推定部と、
該第2の推定雑音を用いて前記仮出力のSNRを求める仮出力SNR計算部と、
前記仮出力のSNRが高いときに歪が少なくなるように、前記仮出力のSNRが小さいときに残留雑音が少なくなるように、前記抑圧係数を補正して補正抑圧係数を求める抑圧係数補正部と、
該補正抑圧係数で前記周波数領域信号を重みづけすることによって雑音を抑圧する第2の乗算器と
を有することを特徴とする雑音抑圧装置。 A converter for converting an input signal into a frequency domain signal;
A first noise estimator for obtaining a first estimated noise using the frequency domain signal;
A noise suppression coefficient generator that determines a suppression coefficient using the first estimated noise and the frequency domain signal;
A first multiplier for obtaining a temporary output by weighting the frequency domain signal with the suppression coefficient;
A second noise estimation unit for obtaining a second estimated noise using the temporary output;
A temporary output SNR calculation unit for obtaining an SNR of the temporary output using the second estimated noise;
A suppression coefficient correction unit that corrects the suppression coefficient to obtain a corrected suppression coefficient so that distortion is reduced when the SNR of the temporary output is high and residual noise is reduced when the SNR of the temporary output is small ; ,
And a second multiplier that suppresses noise by weighting the frequency domain signal with the correction suppression coefficient.
さらに前記仮出力SNRが高いときの平均パワーと前記仮出力SNRが低いときの平均パワーの比を求め、
該比の値が大きいときに前記仮出力SNRが低いときの残留雑音が小さくなるように、前記抑圧係数を補正する
ことを特徴とする請求項5に記載の雑音抑圧装置。 The suppression coefficient correction unit
Furthermore, the ratio of the average power when the temporary output SNR is high and the average power when the temporary output SNR is low is obtained,
The noise suppression apparatus according to claim 5, wherein the suppression coefficient is corrected so that residual noise is reduced when the temporary output SNR is low when the ratio value is large.
さらに前記仮出力SNRが高いときの平均パワーと前記仮出力SNRが低いときの平均パワーの比を求め、
該比の値が小さいときに前記仮出力SNRが低いときの残留雑音が大きくなるように、前記抑圧係数を補正する
ことを特徴とする請求項5又は請求項6に記載の雑音抑圧装置。 The suppression coefficient correction unit
Furthermore, the ratio of the average power when the temporary output SNR is high and the average power when the temporary output SNR is low is obtained,
The noise suppression device according to claim 5 or 6, wherein the suppression coefficient is corrected so that residual noise becomes large when the temporary output SNR is low when the ratio value is small.
入力信号を周波数領域信号に変換し、
該周波数領域信号を用いて第1の推定雑音を求め、
該第1の推定雑音と前記周波数領域信号を用いて抑圧係数を定め、
該抑圧係数で前記周波数領域信号を重みづけして仮出力を求め、
該仮出力を用いて第2の推定雑音を求め、
該第2の推定雑音を用いて前記仮出力のSNRを求め、前記仮出力のSNRが高いときに歪が少なくなるように、前記仮出力のSNRが低いときに残留雑音が少なくなるように、前記抑圧係数を補正して補正抑圧係数を求め、
該補正抑圧係数で前記周波数領域信号を重みづけすることによって雑音を抑圧する
処理を実行させるための雑音抑圧プログラム。 On the computer,
Convert the input signal to a frequency domain signal,
Determining a first estimated noise using the frequency domain signal;
A suppression coefficient is determined using the first estimated noise and the frequency domain signal,
Weighting the frequency domain signal with the suppression coefficient to obtain a temporary output,
A second estimated noise is obtained using the temporary output,
The SNR of the temporary output is obtained using the second estimated noise, and the residual noise is reduced when the SNR of the temporary output is low so that the distortion is reduced when the SNR of the temporary output is high . Correcting the suppression coefficient to obtain a corrected suppression coefficient;
A noise suppression program for executing a process of suppressing noise by weighting the frequency domain signal with the correction suppression coefficient.
さらに前記仮出力のSNRが高いときの平均パワーと前記仮出力のSNRが低いときの平均パワーの比を求め、
該比の値が大きいときに前記仮出力のSNRが低いときの残留雑音が小さくなるように、前記抑圧係数を補正する
処理を実行させるための請求項8に記載の雑音抑圧プログラム。 On the computer,
Furthermore, the ratio of the average power when the SNR of the temporary output is high and the average power when the SNR of the temporary output is low is obtained,
The noise suppression program according to claim 8, wherein a process for correcting the suppression coefficient is executed so that residual noise when the SNR of the temporary output is low is small when the ratio value is large.
さらに前記仮出力のSNRが高いときの平均パワーと前記仮出力のSNRが低いときの平均パワーの比を求め、
該比の値が小さいときに前記仮出力のSNRが低いときの残留雑音が大きくなるように、前記抑圧係数を補正する
処理を実行させるための請求項8又は請求項9に記載の雑音抑圧プログラム。 On the computer,
Furthermore, the ratio of the average power when the SNR of the temporary output is high and the average power when the SNR of the temporary output is low is obtained,
The noise suppression program according to claim 8 or 9, for executing processing for correcting the suppression coefficient so that residual noise becomes large when the SNR of the temporary output is low when the ratio value is small. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009049915A JP5413575B2 (en) | 2009-03-03 | 2009-03-03 | Noise suppression method, apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009049915A JP5413575B2 (en) | 2009-03-03 | 2009-03-03 | Noise suppression method, apparatus, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010204392A JP2010204392A (en) | 2010-09-16 |
JP5413575B2 true JP5413575B2 (en) | 2014-02-12 |
Family
ID=42965940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009049915A Expired - Fee Related JP5413575B2 (en) | 2009-03-03 | 2009-03-03 | Noise suppression method, apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5413575B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012070670A1 (en) * | 2010-11-25 | 2012-05-31 | 日本電気株式会社 | Signal processing device, signal processing method, and signal processing program |
JP6337519B2 (en) | 2014-03-03 | 2018-06-06 | 富士通株式会社 | Speech processing apparatus, noise suppression method, and program |
CN108806707B (en) | 2018-06-11 | 2020-05-12 | 百度在线网络技术(北京)有限公司 | Voice processing method, device, equipment and storage medium |
CN111986691B (en) * | 2020-09-04 | 2024-02-02 | 腾讯科技(深圳)有限公司 | Audio processing method, device, computer equipment and storage medium |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4282227B2 (en) * | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | Noise removal method and apparatus |
JP2002258897A (en) * | 2001-02-27 | 2002-09-11 | Fujitsu Ltd | Noise suppression device |
JP3457293B2 (en) * | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | Noise suppression device and noise suppression method |
JP4670483B2 (en) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | Method and apparatus for noise suppression |
JP4787979B2 (en) * | 2006-12-13 | 2011-10-05 | 富士通テン株式会社 | Noise detection apparatus and noise detection method |
JP2008216721A (en) * | 2007-03-06 | 2008-09-18 | Nec Corp | Noise suppression method, device, and program |
-
2009
- 2009-03-03 JP JP2009049915A patent/JP5413575B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010204392A (en) | 2010-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5435204B2 (en) | Noise suppression method, apparatus, and program | |
JP5791092B2 (en) | Noise suppression method, apparatus, and program | |
JP4670483B2 (en) | Method and apparatus for noise suppression | |
KR101052445B1 (en) | Method and apparatus for suppressing noise, and computer program | |
JP5483000B2 (en) | Noise suppression device, method and program thereof | |
JP4886715B2 (en) | Steady rate calculation device, noise level estimation device, noise suppression device, method thereof, program, and recording medium | |
JP2008203879A (en) | Noise suppressing method and apparatus, and computer program | |
WO2011055830A1 (en) | Signal processing method, information processor, and signal processing program | |
EP2346032A1 (en) | Noise suppression device and audio decoding device | |
JP2008216720A (en) | Signal processing method, device, and program | |
JP2008216721A (en) | Noise suppression method, device, and program | |
JP6064600B2 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
WO2012070670A1 (en) | Signal processing device, signal processing method, and signal processing program | |
JP5788873B2 (en) | Signal processing method, information processing apparatus, and signal processing program | |
JP3858668B2 (en) | Noise removal method and apparatus | |
JP2008058480A (en) | Signal processing method and apparatus | |
JP5413575B2 (en) | Noise suppression method, apparatus, and program | |
JP6070953B2 (en) | Signal processing apparatus, signal processing method, and storage medium | |
JP6011536B2 (en) | Signal processing apparatus, signal processing method, and computer program | |
JP2008219549A (en) | Method, device and program of signal processing | |
JP4395772B2 (en) | Noise removal method and apparatus | |
JP2003131689A (en) | Noise removing method and device | |
JP4968355B2 (en) | Method and apparatus for noise suppression | |
JP2013130815A (en) | Noise suppression device | |
JP5066141B2 (en) | Signal enhancement apparatus, method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131016 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131029 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5413575 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |