JP2005348173A - Noise reduction method, device for executing the same method, program and its recording medium - Google Patents
Noise reduction method, device for executing the same method, program and its recording medium Download PDFInfo
- Publication number
- JP2005348173A JP2005348173A JP2004166216A JP2004166216A JP2005348173A JP 2005348173 A JP2005348173 A JP 2005348173A JP 2004166216 A JP2004166216 A JP 2004166216A JP 2004166216 A JP2004166216 A JP 2004166216A JP 2005348173 A JP2005348173 A JP 2005348173A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- gain factor
- noise reduction
- frequency
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 44
- 238000009499 grossing Methods 0.000 claims abstract description 46
- 238000003780 insertion Methods 0.000 claims abstract description 10
- 230000037431 insertion Effects 0.000 claims abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims abstract description 8
- 230000005236 sound signal Effects 0.000 claims description 36
- 238000012935 Averaging Methods 0.000 claims description 4
- 101150042690 Snrk gene Proteins 0.000 description 23
- 238000012545 processing Methods 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
この発明は、雑音低減方法、この方法を実施する装置、プログラムおよびその記録媒体に関し、特に、マイクロホンを用いた音声通信において目的音声に重畳してマイクロホンに収音された雑音信号を低減し、音声品質を向上させる雑音低減方法、この方法を実施する装置、プログラムおよびその記録媒体に関する。 The present invention relates to a noise reduction method, an apparatus for implementing the method, a program, and a recording medium thereof, and more particularly, to reduce a noise signal superimposed on a target voice and collected by a microphone in voice communication using a microphone. The present invention relates to a noise reduction method for improving quality, an apparatus for implementing the method, a program, and a recording medium thereof.
目的音声信号に雑音信号の重畳した入力音声信号から雑音信号を低減する従来例を図2を参照して説明する。
図2において、マイクロホン11に収音される目的音声に不要な雑音が混入して得られた入力音声信号X(n)=S(n)+N(n)をアナログ/ディジタル(A/D)変換器21においてディジタル化し、周波数帯域分割部22に入力する。なお、S(n)は目的音声信号を示しており、N(n)は混入した不要な雑音信号である。周波数帯域分割部22に入力されたA/D変換後の入力音声信号X(n)は、ここで周波数領域の信号に変換されてから複数周波数帯域に分割される。周波数帯域分割部22において分割された各周波数帯域信号を、入力音声信号パワー計算部24、ゲインファクタ挿入部28に入力する。以降、入力音声信号X(n)のk番目の周波数帯域信号を代表として、周波数帯域信号Xk(n)に対する処理の流れを説明する。
A conventional example of reducing a noise signal from an input voice signal in which a noise signal is superimposed on a target voice signal will be described with reference to FIG.
In FIG. 2, an input voice signal X (n) = S (n) + N (n) obtained by mixing unnecessary noise into the target voice collected by the microphone 11 is converted from analog to digital (A / D). The signal is digitized by the
入力音声信号パワー計算部24においては、入力された周波数帯域信号Xk(n)のパワーレベルを計算し、S/N比推定部27、雑音パワー推定部51に入力する。雑音パワー推定部51においては、入力された入力音声信号パワーPXk(n)を用いて雑音パワーPNk(n)を推定する。S/N比推定部27においては、入力音声信号パワーPXk(n)、推定雑音パワーPNk(n)および1処理フレーム前にゲインファクタ挿入部28で得た雑音を低減した信号Y’k(n)を用いて目的音声信号対雑音信号比(S/N比)SNRk(n)を推定する。S/N比推定部27で推定したS/N比SNRk(n)は、ゲインファクタ計算部30および入力音声信号加算率決定部52に入力する。ゲインファクタ計算部30においては、S/N比推定部27から入力されたS/N比SNRk(n)を用いてゲインファクタG(SNRk(n))が決定される。ここで、ゲインファクタG(SNRk(n))の具体的な計算は、スペクトルサブトラクション、ウィナーフィルタ、ML推定法、MMSE法その他の短時間スペクトラル振幅(STSA)推定に基づいて実施される。ゲインファクタ計算部30で推定されたゲインファクタG(SNRk(n))は、ゲインファクタ挿入部28に入力される。ゲインファクタ挿入部28においては、ゲインファクタG(SNRk(n))を用いて雑音低減を行う。具体的には、周波数帯域分割部22より入力された周波数帯域信号Xk(n)に周波数領域でゲインファクタG(SNRk(n))を重畳(掛算)する演算を行う。そして、斯くして得られた、雑音を低減した雑音低減信号Y’k(n)を入力音声信号加算部53およびS/N比推定部27に入力する。これと並行して、入力音声信号加算率決定部52においては、入力されたS/N比SNRk(n)を用いてS/N比に基づいた入力音声信号加算率αを決定し、入力音声信号加算部53に入力する。
The input voice signal
入力音声信号加算部53においては、雑音低減信号Y’k(n)に入力音声信号加算率αに準じた割合で周波数帯域信号Xk(n)を加算(付加)して下記の周波数帯域信号Yk(n)を出力する(特許文献1 参照)。
Yk(n)=αXk(n)+(1−α)Y’k(n)
周波数帯域信号Yk(n)は時間領域変換部29に入力され、全帯域が合成されると共に時間領域信号に逆変換されて、ディジタル/アナログ(D/A)変換器34に入力される。ここで、ディジタル/アナログ変換器34においてアナログ信号に変換された雑音の低減された出力信号Y(n)が出力される。
Yk (n) = αXk (n) + (1−α) Y′k (n)
The frequency band signal Yk (n) is input to the time
以上の従来例において、ゲインファクタG(SNRk(n))はS/N比を用いて計算する。さて、S/N比は、目的音声信号と雑音信号のパワー比に相当するが、入力音声信号X(n)には目的音声信号S(n)と雑音信号N(n)が混在しているので、それぞれのパワーを独立に測定することはできない。そのために、特許文献1においては、それぞれのパワーおよびS/N比を推定する方法が採用されているが、推定したパワーおよびS/N比には推定誤差が生じる。この推定誤差の影響で、計算したゲインファクタは真のS/N比を基にした理想的な値とはならない。即ち、周波数領域で隣り合うゲインファクタが真のS/N比を基にした理想的な値と比較して断続的(飛び飛び)になるところから、処理後の出力音声信号Y(n)に歪みを発生させる原因となる。 In the above conventional example, the gain factor G (SNRk (n)) is calculated using the S / N ratio. The S / N ratio corresponds to the power ratio between the target voice signal and the noise signal, but the target voice signal S (n) and the noise signal N (n) are mixed in the input voice signal X (n). Therefore, each power cannot be measured independently. Therefore, in Patent Document 1, a method of estimating each power and S / N ratio is adopted, but an estimation error occurs in the estimated power and S / N ratio. Due to the influence of this estimation error, the calculated gain factor is not an ideal value based on the true S / N ratio. That is, the gain factor adjacent in the frequency domain becomes intermittent (jumps) compared with the ideal value based on the true S / N ratio, and is distorted into the processed output audio signal Y (n). It will cause to generate.
以上のことから、この発明は、推定したパワー、S/N比に推定誤差があっても、処理後の出力音声信号の歪みの発生を抑え、且つ充分な雑音低減を実現する雑音低減方法、この方法を実施する装置、プログラムおよびその記録媒体を提供するものである。 From the above, the present invention provides a noise reduction method that suppresses the occurrence of distortion of the output audio signal after processing and realizes sufficient noise reduction even if there is an estimation error in the estimated power and S / N ratio, An apparatus, a program, and a recording medium for implementing the method are provided.
請求項1:入力音声信号から雑音信号を低減する雑音低減方法において、入力音声信号を周波数領域の信号に変換し、入力音声信号の周波数帯域信号から周波数毎の入力音声信号パワーを計算し、周波数毎の入力音声信号パワーから周波数毎の雑音パワーを推定し、周波数毎の入力音声信号パワーと周波数毎の雑音パワーから素ゲインファクタを計算し、素ゲインファクタを平滑化し、平滑化ゲインファクタを入力音声信号の周波数帯域信号に重畳して雑音低減信号の周波数帯域信号を計算し、雑音低減信号の周波数帯域信号を時間領域の信号に逆変換して出力する雑音低減方法を構成した。 [Claim 1] A noise reduction method for reducing a noise signal from an input voice signal, converting the input voice signal into a frequency domain signal, calculating an input voice signal power for each frequency from a frequency band signal of the input voice signal, The noise power for each frequency is estimated from the input audio signal power for each frequency, the prime gain factor is calculated from the input voice signal power for each frequency and the noise power for each frequency, the prime gain factor is smoothed, and the smoothed gain factor is input. A noise reduction method is constructed in which a frequency band signal of a noise reduction signal is calculated by being superimposed on a frequency band signal of an audio signal, and the frequency band signal of the noise reduction signal is inversely converted into a time domain signal and output.
請求項2:請求項1に記載される雑音低減方法において、素ゲインファクタに重み付け加算平均する平滑化処理を施す雑音低減方法を構成した。
請求項3:請求項1および請求項2の内の何れかに記載される雑音低減方法において、平滑化ゲインファクタを強調し、強調化ゲインファクタを入力音声信号の周波数帯域信号に重畳して雑音低減信号の周波数帯域信号を計算する雑音低減方法を構成した。
請求項4:請求項3に記載される雑音低減方法において、平滑化ゲインファクタの値の大小によって、平滑化ゲインファクタを0もしくは1に近づける強調化処理を施す雑音低減方法を構成した。
[2] The noise reduction method according to [1], wherein a noise reduction method for performing a smoothing process of weighting and averaging the prime gain factors is configured.
[3] The noise reduction method according to any one of [1] and [2], wherein the smoothing gain factor is emphasized, and the emphasis gain factor is superimposed on the frequency band signal of the input speech signal to reduce the noise. A noise reduction method for calculating the frequency band signal of the reduced signal was constructed.
According to a fourth aspect of the present invention, in the noise reduction method according to the third aspect of the present invention, a noise reduction method is implemented in which an enhancement process is performed to bring the smoothing gain factor close to 0 or 1 depending on the value of the smoothing gain factor.
請求項5:入力音声信号から雑音信号を低減する雑音低減装置において、入力音声信号を周波数領域の信号に変換して複数周波数帯域に分割する周波数帯域分割部22と、入力音声信号の周波数帯域信号から周波数毎の入力音声信号パワーを計算する入力音声信号パワー計算部24と、周波数毎の入力音声信号パワーから周波数毎の雑音パワーを推定する雑音パワー推定部51と、周波数毎の入力音声信号パワーと周波数毎の雑音パワーから素ゲインファクタを計算する素ゲインファクタ計算部61と、素ゲインファクタを平滑化するゲインファクタ平滑部62と、平滑化ゲインファクタを入力音声信号の周波数帯域信号に重畳して雑音低減信号の周波数帯域信号を計算するゲインファクタ挿入部28と、雑音低減信号の周波数帯域信号を時間領域に逆変換して出力する時間領域変換部29とを具備する雑音低減装置を構成した。
5. A noise reduction apparatus for reducing a noise signal from an input audio signal, wherein the frequency
請求項6:請求項5に記載される雑音低減装置において、素ゲインファクタに重み付け加算平均する平滑化処理を施す雑音低減装置を構成した。
請求項7:請求項5および請求項6の内の何れかに記載される雑音低減装置において、平滑化ゲインファクタを強調するゲインファクタ強調化部63を具備し、強調化ゲインファクタを入力音声信号の周波数帯域信号に重畳して雑音低減信号の周波数帯域信号を計算する雑音低減装置を構成した。
請求項8:請求項7に記載される雑音低減装置において、平滑化ゲインファクタの値の大小によって、平滑化ゲインファクタを0もしくは1に近づける強調化処理を施す雑音低減装置を構成した。
Claim 6: The noise reduction apparatus according to claim 5, wherein a noise reduction apparatus that performs a smoothing process that performs weighted addition averaging on the prime gain factor is configured.
[7] The noise reduction apparatus according to any one of [5] and [6], further comprising a gain
Claim 8: The noise reduction apparatus according to claim 7, wherein the noise reduction apparatus is configured to perform enhancement processing for making the smoothing gain factor close to 0 or 1 depending on the value of the smoothing gain factor.
請求項9:請求項1ないし請求項4の内の何れかに記載される雑音低減方法をコンピュータに書き込み読み出す符号によって記述した雑音低減プログラムを構成した。
請求項10:請求項9に記載される雑音低減プログラムを記録した記録媒体を構成した。
Claim 9: The noise reduction program which described the noise reduction method in any one of Claim 1 thru | or 4 by the code | symbol written in and read out to a computer was comprised.
Claim 10: A recording medium on which the noise reduction program according to claim 9 is recorded is configured.
この発明は、ゲインファクタの平滑化を行うことによりゲインファクタの周波数領域における断続性が減少して出力音声信号の歪みの発生が抑えられ、平滑化した後のゲインファクタを強調化することにより、処理後の音声の周波数成分の一部の欠損を回避することにより音声の「こもり」を低減し、且つ雑音を充分に抑圧するという効果を奏するに到る。 In the present invention, by performing smoothing of the gain factor, the discontinuity in the frequency domain of the gain factor is reduced and the occurrence of distortion of the output audio signal is suppressed, and by emphasizing the gain factor after smoothing, By avoiding the loss of part of the frequency component of the processed voice, the effect of reducing the “clouding” of the voice and suppressing the noise sufficiently can be achieved.
この発明を実施するための最良の形態を図1を参照して説明する。
図1は雑音低減装置の実施例を説明する図であるが、この実施例は、先の特許文献1において図1を参照して説明されている雑音低減装置と比較して、ゲインファクタ計算部30の構成を異にするのみで、その他の構成は共通している。以上のことから、この実施例におけるゲインファクタ計算部30以外の部位における各値の計算は、この特許文献1に記載される方法に倣って実行することができる。
マイクロホン11で収音される目的音声に不要な雑音が混入して得られた入力音声信号X(n)=S(n)+N(n)はアナログ/ディジタル(A/D)変換器21においてディジタル信号に変換され、周波数帯域分割部22に入力される。なお、S(n)は目的音声信号を示しており、N(n)は混入した不要な雑音信号である。周波数帯域分割部22において、入力された音声信号X(n)は周波数領域の信号に変換されて複数周波数帯域に分割される。分割された各周波数帯域信号は、入力音声信号パワー計算部24、およびゲインファクタ挿入部28に入力される。以降、入力音声信号のk番目の周波数帯域信号を代表として、k番目の周波数帯域信号Xk(n)に対する処理の流れを説明する。入力音声信号パワー計算部24においては、入力された周波数帯域信号Xk(n)からパワーレベルを計算し、計算結果である入力音声信号パワーPXk(n)をS/N比推定部27、雑音パワー推定部51に入力する。雑音パワー推定部51においては、入力された入力音声信号パワーPXk(n)を用いて雑音パワーPNk(n)を推定する。S/N比推定部27においては、入力音声信号パワーPXk(n)、推定雑音パワーPNk(n)および1処理フレーム前にゲインファクタ挿入部28で得た雑音を低減した周波数帯域信号Y’k(n)を用いてS/N比SNRk(n)を推定する。S/N比推定部27で推定したS/N比SNRk(n)は、ゲインファクタ計算部30および入力音声信号加算率決定部52に入力される。
The best mode for carrying out the present invention will be described with reference to FIG.
FIG. 1 is a diagram for explaining an embodiment of a noise reduction apparatus. This embodiment is a gain factor calculation unit as compared with the noise reduction apparatus described with reference to FIG. Only the configuration of 30 is different, and the other configurations are common. From the above, the calculation of each value in the part other than the gain
An input voice signal X (n) = S (n) + N (n) obtained by mixing unnecessary noise in the target voice collected by the microphone 11 is digitally converted by an analog / digital (A / D)
ここで、この発明の実施例においては、ゲインファクタ計算部30は素ゲインファクタ計算部61と、ゲインファクタ平滑部62と、ゲインファクタ強調部63とより成る。このゲインファクタ計算部30においては、始めに、素ゲインファクタ計算部61でS/N比推定部27から入力されたS/N比SNRk(n)を用いて素ゲインファクタG(SNRk(n))が計算される。素ゲインファクタの具体的な計算は、スペクトルサブトラクション、ウィナーフィルタ、ML推定法、MMSE法その他の短時間スペクトラル振幅(STSA)推定に基づいて実行される。ゲインファクタはS/N比を元に計算されるが、具体的には入力音声信号に占める目的音声の周波数領域における周波数領域それぞれの比率を意味し、S/N比を元に計算されたそのままのゲインファクタを素ゲインファクタと称している。
Here, in the embodiment of the present invention, the gain
次に、ゲインファクタ平滑部62において、素ゲインファクタG(SNRk(n))に対して重みをつけた平滑化を行う。素ゲインファクタ計算部61で計算された素ゲインファクタG(SNRk(n))は、[発明が解決しようとする課題]の項においても説明した通り、S/N比の推定誤差の影響で理想の値との間のずれが生じ、周波数領域において各素ゲインファクタに断続性が生じる。このために、この実施例においては、周波数軸上で隣り合う素ゲインファクタの断続性を緩和することにより、各ゲインファクタの値を滑らかにする平滑化を行う。以下、平滑化の仕方を具体的に説明する。 Next, the gain factor smoothing unit 62 performs smoothing with a weight applied to the prime gain factor G (SNRk (n)). The prime gain factor G (SNRk (n)) calculated by the prime gain factor calculation unit 61 is ideal due to the influence of the estimation error of the S / N ratio as described in the section “Problems to be Solved by the Invention”. And a discontinuity occurs in each elementary gain factor in the frequency domain. For this reason, in this embodiment, smoothing is performed to smooth the values of the respective gain factors by relaxing the discontinuity of the elementary gain factors adjacent on the frequency axis. Hereinafter, the smoothing method will be described in detail.
k番目の周波数帯域の素ゲインファクタG(SNRk(n))をG(k)と置き代えて、平滑化した後の平滑化ゲインファクタGe(k)とすると、平滑化処理の1例は、以下の式で表すことができる。
Ge(k)=Σi,j a(i)×G(j)/Σi a(i)
この式は、インデックスjで示されるk番目の周波数帯域に隣接する複数の素ゲインファクタG(j)の平均値を求め、k番目の周波数帯域の平滑化ゲインファクタGe(k)とする平滑化処理を示す。和をとる際のiとjの総数は同数であり、またその総数は最も多くても周波数分析点数以下である。重み係数a(i)は、平均値を計算する場合の各素ゲインファクタの影響、即ち、断続性を緩和する割合を制御する。以上の処理の後に、平滑化ゲインファクタGe(k)、即ち、Ge(SNRk(n))を出力する。
When the prime gain factor G (SNRk (n)) of the kth frequency band is replaced with G (k) and the smoothed gain factor Ge (k) after smoothing is performed, an example of the smoothing process is as follows: It can be represented by the following formula.
Ge (k) = Σ i, j a (i) × G (j) / Σ i a (i)
This equation obtains an average value of a plurality of elementary gain factors G (j) adjacent to the kth frequency band indicated by the index j, and performs smoothing as a smoothing gain factor Ge (k) of the kth frequency band. Indicates processing. The total number of i and j when taking the sum is the same, and the total is at most equal to or less than the number of frequency analysis points. The weighting factor a (i) controls the influence of each elementary gain factor when calculating the average value, that is, the rate at which the discontinuity is relaxed. After the above processing, a smoothing gain factor Ge (k), that is, Ge (SNRk (n)) is output.
次に、ゲインファクタ強調部63において、ゲインファクタ平滑化部62で既に平滑化した平滑化ゲインファクタGe(k)の強調化を行う。平滑化ゲインファクタGe(k)は平滑化によって不連続性がなくなるが、トレードオフで「なまる」という弊害が生じる。具体的には、k番目の周波数帯域のゲインファクタが1で、k−1番目の周波数帯域のゲインファクタが0.92、k+2番目の周波数帯域のゲインファクタが0.93の時に、この3つの周波数帯域で平均値からk番目の周波数帯域の平滑化ゲイン係数を決めると、0.95となる。なお、この例では重み係数a(i)は、全て1としている。
Next, in the gain
上述した通り、ゲインファクタはS/N比を元に計算されるが、具体的には入力音声信号に占める目的音声の周波数領域における周波数領域それぞれの比率である。即ち、計算されたゲインファクタが1に近い時は入力音声信号中に雑音は小さく目的音声の割合が多い状態を意味し、0に近い時は入力音声信号中の目的音声は小さく雑音の割合が多い状態であることを意味する。先に説明した通り、平滑化ゲインファクタが「なまる」と、その値は0および1から離れることになる。1から離れると、例えば、先の例の様に平滑化して0.95になると、本来目的音声のみが存在する周波数領域の成分を95%にするため、目的音声に5%の欠損が生じる。0から離れると、例えば、0.05になると、雑音のみが存在して100%低減すべき時に、95%の低減となり雑音が残留し通話品質に悪影響を及ぽす。そこで、以下に示す平滑化され「なまった」平滑化ゲインファクタGe(k)の強調化処理を行う。周波数領域でk番目を強調化してゲインファクタをGg(k)とした場合、強調化処理は平滑化ゲインファクタGe(k)の値の大小によって、それぞれのゲイン係数を0もしくは1に近づける処理である。即ち、平滑化ゲインファクタGe(k)が大きい1に近い場合は、より1に近づけて目的音声をより通し易くし、平滑化ゲインファクタGe(k)が小さい0に近い場合は、より0に近づけて雑音をより大きく低減する様に平滑化ゲインファクタGe(k)を強調する。この強調化処理の具体的な1例を以下に式で示す。
Ge(k)がth1より大きい場合:Gg(k)=th1×(Ge(k)/th1)v1
Ge(k)がth2より小さい場合:
Gg(k)=1−(1−th2){(1−Ge(k))/(1−th2) }v2
ここで、v1(k)およびv2(k)は1以上の整数とする。また、th1とth2は、th1≧th2の関係を満たす0以上1以下の整数である。Ge(k)は0から1の範囲の値を持つので、th1より大きい場合、より1に近づき、th2より小さい場合、より0に近づく処理をこの式は実現する。以上の処理の後に、強調化したゲインファクタGg(k)、即ち、Gg(SNRk(n))を出力する。
As described above, the gain factor is calculated on the basis of the S / N ratio. Specifically, the gain factor is the ratio of each frequency domain in the frequency domain of the target speech occupied in the input speech signal. That is, when the calculated gain factor is close to 1, it means that the noise is small in the input voice signal and the ratio of the target voice is high, and when it is close to 0, the target voice in the input voice signal is small and the ratio of the noise is high. It means that there are many states. As explained above, when the smoothing gain factor is “rounded”, the value will deviate from 0 and 1. When moving away from 1, for example, when smoothed to 0.95 as in the previous example, the frequency domain component in which only the target speech originally exists is 95%, so a 5% loss occurs in the target speech. When the distance from 0 is, for example, 0.05, when only noise is present and should be reduced by 100%, the noise is reduced by 95% and the speech quality is adversely affected. Therefore, the following smoothing “smoothed” smoothing gain factor Ge (k) is enhanced. When the gain factor is Gg (k) by emphasizing the k-th in the frequency domain, the enhancement process is a process of making each gain coefficient close to 0 or 1 depending on the magnitude of the value of the smoothing gain factor Ge (k). is there. That is, when the smoothing gain factor Ge (k) is close to 1, it is closer to 1 to make it easier to pass the target speech, and when the smoothing gain factor Ge (k) is close to 0, it is more close to 0. The smoothing gain factor Ge (k) is emphasized so that the noise is greatly reduced by approaching. A specific example of this enhancement processing is shown by the following formula.
When Ge (k) is larger than th1: Gg (k) = th1 × (Ge (k) / th1) v1
When Ge (k) is smaller than th2:
Gg (k) = 1- (1-th2) {(1-Ge (k)) / (1-th2)} v2
Here, v1 (k) and v2 (k) are integers of 1 or more. Further, th1 and th2 are integers of 0 or more and 1 or less that satisfy the relationship of th1 ≧ th2. Since Ge (k) has a value in the range of 0 to 1, this expression realizes processing closer to 1 when it is larger than th1, and closer to 0 when it is smaller than th2. After the above processing, the enhanced gain factor Gg (k), that is, Gg (SNRk (n)) is output.
ゲインファクタ計算部30内のゲインファクタ強調部63で計算された強調化ゲインファクタG(SNRk(n))は、ゲインファクタ挿入部28に入力される。ゲインファクタ挿入部28においては、強調化ゲインファクタGg(SNRk(n))を用いて雑音低減を行う。具体的には、周波数帯域分割部22から入力された周波数帯域信号Xk(n)に、周波数領域で強調化ゲインファクタGg(SNRk(n))を重畳(掛算)する計算を行う。そして、雑音を低減した信号Y’k(n)を入力音声信号加算部53およびS/N比推定部27に入力する。これと並行して、入力音声信号加算率決定部52においては、入力されたS/N比SNRk(n)を用いてS/N比に基づいた入力音声信号加算率αを決定し、入力音声信号加算部53に入力する。
The enhanced gain factor G (SNRk (n)) calculated by the gain
入力音声信号加算部53においては、雑音を低減した信号Y’k(n)に入力音声信号加算率αに準じた割合で周波数帯域信号Xk(n)を加算(付加)して、従来例について先に説明した通りの下記の周波数帯域信号Yk(n)を出力する。
Yk(n)=αXk(n)+(1−α)Y’k(n)
周波数帯域信号Yk(n)は、時間領域変換部29に入力され、全帯域が合成されると共に時間領域の信号に逆変換される。この逆変換された時間領域の信号はディジタル/アナログ変換器34に入力され、アナログ信号に変換されて雑音の低減された出力信号Y(n)として出力される。
In the input audio signal adding unit 53, the frequency band signal Xk (n) is added (added) to the signal Y′k (n) whose noise is reduced at a rate according to the input audio signal addition rate α, and the conventional example is obtained. The following frequency band signal Yk (n) as described above is output.
Yk (n) = αXk (n) + (1−α) Y′k (n)
The frequency band signal Yk (n) is input to the time
ところで、この発明の雑音低減装置は、これをDSP(Digital Signal Processor)により構成することができる。また、コンピュータによりプログラムを実行させることにより機能させてもよい。この場合は、そのプログラムはCD−ROM、フロッピー(登録商標)ディスク、磁気ディスクなどに記録されたものを、コンピュータ内のプログラム用メモリに取り込んで行うことになる。このプログラム用メモリには、通信によりプログラムをダウンロードさせてもよい。 By the way, the noise reduction device of the present invention can be configured by a DSP (Digital Signal Processor). Moreover, you may make it function by making a computer run a program. In this case, the program is recorded on a CD-ROM, a floppy (registered trademark) disk, a magnetic disk, or the like by being loaded into a program memory in the computer. The program memory may be downloaded by communication.
11 マイクロホン 21 アナログ/ディジタル変換器
22 周波数帯域分割部 24 入力音声信号パワー計算部
27 S/N比推定部 28 ゲインファクタ挿入部
29 時間領域変換部 30 ゲインファクタ計算部
34 ディジタル/アナログ変換器 51 雑音パワー推定部
52 入力音声信号加算率決定部 53 入力音声信号加算部
61 素ゲインファクタ計算部 62 ゲインファクタ平滑化部
63 ゲインファクタ強調部
DESCRIPTION OF SYMBOLS 11
Claims (10)
入力音声信号を周波数領域の信号に変換し、入力音声信号の周波数帯域信号から周波数毎の入力音声信号パワーを計算し、周波数毎の入力音声信号パワーから周波数毎の雑音パワーを推定し、周波数毎の入力音声信号パワーと周波数毎の雑音パワーから素ゲインファクタを計算し、素ゲインファクタを平滑化し、平滑化ゲインファクタを入力音声信号の周波数帯域信号に重畳して雑音低減信号の周波数帯域信号を計算し、雑音低減信号の周波数帯域信号を時間領域の信号に逆変換して出力することを特徴とする雑音低減方法。 In a noise reduction method for reducing a noise signal from an input voice signal,
Convert the input audio signal into a frequency domain signal, calculate the input audio signal power for each frequency from the frequency band signal of the input audio signal, estimate the noise power for each frequency from the input audio signal power for each frequency, and for each frequency Calculate the raw gain factor from the input voice signal power and noise power at each frequency, smooth the prime gain factor, and superimpose the smoothed gain factor on the frequency band signal of the input voice signal to generate the frequency band signal of the noise reduction signal. A noise reduction method comprising: calculating, inversely converting a frequency band signal of a noise reduction signal into a time domain signal, and outputting the signal.
素ゲインファクタに重み付け加算平均する平滑化処理を施すことを特徴とする雑音低減方法。 The noise reduction method according to claim 1,
A noise reduction method, characterized by performing a smoothing process of weighting and averaging an elementary gain factor.
平滑化ゲインファクタを強調し、強調化ゲインファクタを入力音声信号の周波数帯域信号に重畳して雑音低減信号の周波数帯域信号を計算することを特徴とする雑音低減方法。 In the noise reduction method according to any one of claims 1 and 2,
A noise reduction method characterized by emphasizing a smoothing gain factor and calculating a frequency band signal of a noise reduction signal by superimposing the enhanced gain factor on a frequency band signal of an input voice signal.
平滑化ゲインファクタの値の大小によって、平滑化ゲインファクタを0もしくは1に近づける強調化処理を施すことを特徴とする雑音低減方法。 The noise reduction method according to claim 3,
A noise reduction method characterized by performing an emphasis process for making a smoothing gain factor close to 0 or 1 depending on a value of a smoothing gain factor.
入力音声信号を周波数領域の信号に変換して複数周波数帯域に分割する周波数帯域分割部と、入力音声信号の周波数帯域信号から周波数毎の入力音声信号パワーを計算する入力音声信号パワー計算部と、周波数毎の入力音声信号パワーから周波数毎の雑音パワーを推定する雑音パワー推定部と、周波数毎の入力音声信号パワーと周波数毎の雑音パワーから素ゲインファクタを計算する素ゲインファクタ計算部と、素ゲインファクタを平滑化するゲインファクタ平滑部と、平滑化ゲインファクタを入力音声信号の周波数帯域信号に重畳して雑音低減信号の周波数帯域信号を計算するゲインファクタ挿入部と、雑音低減信号の周波数帯域信号を時間領域に逆変換して出力する時間領域変換部とを具備することを特徴とする雑音低減装置。 In a noise reduction device that reduces a noise signal from an input voice signal,
A frequency band dividing unit that converts an input audio signal into a frequency domain signal and divides the signal into a plurality of frequency bands; an input audio signal power calculation unit that calculates an input audio signal power for each frequency from the frequency band signal of the input audio signal; A noise power estimator for estimating noise power for each frequency from input voice signal power for each frequency; a prime gain factor calculator for calculating a prime gain factor from input voice signal power for each frequency and noise power for each frequency; Gain factor smoothing unit that smoothes the gain factor, gain factor insertion unit that calculates the frequency band signal of the noise reduction signal by superimposing the smoothing gain factor on the frequency band signal of the input audio signal, and the frequency band of the noise reduction signal A noise reduction apparatus comprising: a time domain conversion unit that converts a signal back to the time domain and outputs the signal.
素ゲインファクタに重み付け加算平均する平滑化処理を施すことを特徴とする雑音低減装置。 The noise reduction device according to claim 5, wherein
A noise reduction apparatus characterized by performing a smoothing process of weighted addition averaging on an elementary gain factor.
平滑化ゲインファクタを強調するゲインファクタ強調化部を具備し、強調化ゲインファクタを入力音声信号の周波数帯域信号に重畳して雑音低減信号の周波数帯域信号を計算することを特徴とする雑音低減装置。 In the noise reduction device according to any one of claims 5 and 6,
A noise reduction device comprising a gain factor emphasizing unit for emphasizing a smoothing gain factor, and calculating a frequency band signal of a noise reduction signal by superimposing the enhancement gain factor on a frequency band signal of an input voice signal .
平滑化ゲインファクタの値の大小によって、平滑化ゲインファクタを0もしくは1に近づける強調化処理を施すことを特徴とする雑音低減装置。 The noise reduction device according to claim 7,
A noise reduction apparatus characterized by performing an emphasis process for making a smoothing gain factor close to 0 or 1 depending on a value of a smoothing gain factor.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004166216A JP4223441B2 (en) | 2004-06-03 | 2004-06-03 | Noise reduction method, apparatus for implementing the method, program, and recording medium therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004166216A JP4223441B2 (en) | 2004-06-03 | 2004-06-03 | Noise reduction method, apparatus for implementing the method, program, and recording medium therefor |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005348173A true JP2005348173A (en) | 2005-12-15 |
JP4223441B2 JP4223441B2 (en) | 2009-02-12 |
Family
ID=35500115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004166216A Expired - Lifetime JP4223441B2 (en) | 2004-06-03 | 2004-06-03 | Noise reduction method, apparatus for implementing the method, program, and recording medium therefor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4223441B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008116686A (en) * | 2006-11-06 | 2008-05-22 | Nec Engineering Ltd | Noise suppression device |
CN110718233A (en) * | 2019-09-29 | 2020-01-21 | 华声设计研究院(深圳)有限公司 | Acoustic auxiliary noise reduction method and device based on psychoacoustics |
CN113782011A (en) * | 2021-08-26 | 2021-12-10 | 清华大学苏州汽车研究院(相城) | Training method of frequency band gain model and voice noise reduction method for vehicle-mounted scene |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09258792A (en) * | 1996-03-25 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | Noise reducing method and device |
JP2000047697A (en) * | 1998-07-30 | 2000-02-18 | Nec Eng Ltd | Noise canceler |
JP3454402B2 (en) * | 1996-11-28 | 2003-10-06 | 日本電信電話株式会社 | Band division type noise reduction method |
-
2004
- 2004-06-03 JP JP2004166216A patent/JP4223441B2/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09258792A (en) * | 1996-03-25 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | Noise reducing method and device |
JP3454402B2 (en) * | 1996-11-28 | 2003-10-06 | 日本電信電話株式会社 | Band division type noise reduction method |
JP2000047697A (en) * | 1998-07-30 | 2000-02-18 | Nec Eng Ltd | Noise canceler |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008116686A (en) * | 2006-11-06 | 2008-05-22 | Nec Engineering Ltd | Noise suppression device |
JP4757775B2 (en) * | 2006-11-06 | 2011-08-24 | Necエンジニアリング株式会社 | Noise suppressor |
CN110718233A (en) * | 2019-09-29 | 2020-01-21 | 华声设计研究院(深圳)有限公司 | Acoustic auxiliary noise reduction method and device based on psychoacoustics |
CN110718233B (en) * | 2019-09-29 | 2022-03-01 | 东莞市中光通信科技有限公司 | Acoustic auxiliary noise reduction method and device based on psychoacoustics |
CN113782011A (en) * | 2021-08-26 | 2021-12-10 | 清华大学苏州汽车研究院(相城) | Training method of frequency band gain model and voice noise reduction method for vehicle-mounted scene |
CN113782011B (en) * | 2021-08-26 | 2024-04-09 | 清华大学苏州汽车研究院(相城) | Training method of frequency band gain model and voice noise reduction method for vehicle-mounted scene |
Also Published As
Publication number | Publication date |
---|---|
JP4223441B2 (en) | 2009-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW594676B (en) | Noise reduction device | |
JP6877488B2 (en) | Equipment and methods for processing audio signals using harmonic postfilters | |
JP4836720B2 (en) | Noise suppressor | |
KR101935183B1 (en) | A signal processing apparatus for enhancing a voice component within a multi-channal audio signal | |
JP5341128B2 (en) | Improved stability in hearing aids | |
JP6134078B1 (en) | Noise suppression | |
JP2004272052A (en) | Voice section detecting device | |
JP2001134287A (en) | Noise suppressing device | |
JPWO2004040555A1 (en) | Speech enhancement device | |
JP2008216720A (en) | Signal processing method, device, and program | |
JP6339896B2 (en) | Noise suppression device and noise suppression method | |
JP2004086102A (en) | Voice processing device and mobile communication terminal device | |
CN112602150A (en) | Noise estimation method, noise estimation device, voice processing chip and electronic equipment | |
JP2008216721A (en) | Noise suppression method, device, and program | |
JP2000330597A (en) | Noise suppressing device | |
JP2003140700A (en) | Method and device for noise removal | |
JP2008309955A (en) | Noise suppresser | |
JP4223441B2 (en) | Noise reduction method, apparatus for implementing the method, program, and recording medium therefor | |
JP5413575B2 (en) | Noise suppression method, apparatus, and program | |
JP2002175099A (en) | Method and device for noise suppression | |
CN102568491B (en) | Noise suppression method and equipment | |
JP2006113515A (en) | Noise suppressor, noise suppressing method, and mobile communication terminal device | |
JP6707914B2 (en) | Gain processing device and program, and acoustic signal processing device and program | |
JP4395772B2 (en) | Noise removal method and apparatus | |
CN114363753A (en) | Noise reduction method and device for earphone, earphone and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060725 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060725 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080909 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081111 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4223441 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111128 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111128 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121128 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121128 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131128 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |