KR101254876B1 - 노이즈 게이트, 수음 장치 및 노이즈 제거 방법 - Google Patents
노이즈 게이트, 수음 장치 및 노이즈 제거 방법 Download PDFInfo
- Publication number
- KR101254876B1 KR101254876B1 KR1020117011535A KR20117011535A KR101254876B1 KR 101254876 B1 KR101254876 B1 KR 101254876B1 KR 1020117011535 A KR1020117011535 A KR 1020117011535A KR 20117011535 A KR20117011535 A KR 20117011535A KR 101254876 B1 KR101254876 B1 KR 101254876B1
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- signal
- signal level
- frequency spectrum
- audio signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 12
- 238000001228 spectrum Methods 0.000 claims abstract description 60
- 230000005236 sound signal Effects 0.000 claims abstract description 57
- 238000006243 chemical reaction Methods 0.000 claims 2
- 230000000593 degrading effect Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/34—Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
- H03G3/345—Muting during a short period of time when noise pulses are detected, i.e. blanking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
Abstract
화자의 발화 음성을 열화시키지 않고, 정상 노이즈만을 제거한 음성 신호를 출력할 수 있는 노이즈 게이트를 제공하는 것에 있다. 수음 장치(1)는, FFT 처리부(11), 노이즈 게이트(12) 및 IFFT 처리부(13)를 구비한다. 수음 장치(1)는, 수음한 음성 신호(NE'T)를 FFT 처리부(11)에 의해 주파수 스펙트럼(NE'N)으로 변환한다. 노이즈 게이트(12)는 음성 신호의 주파수 스펙트럼(NE'N)에 기초하여 정상 노이즈의 노이즈 스펙트럼(N'N)을 추정한다. 노이즈 게이트(12)는, 음성 신호의 주파수 스펙트럼(NE'N)과 노이즈 스펙트럼(N'N)의 신호 레벨비가 임계값 미만인 경우에는 음성 신호의 신호 레벨(게인)을 저감하여 출력한다. 수음 장치(1)는, 정상 노이즈(N'N)를 제거한 후의 주파수 스펙트럼(CO'N)을 IFFT 처리부(13)에 의해 역변환하여 생성한 음성 신호(CO'T)를 출력한다.
Description
본 발명은, 음성 신호에 포함되는 노이즈를 제거하는 노이즈 게이트, 수음 장치 및 노이즈 제거 방법에 관한 것이다.
종래, 수음 장치에서는, 노이즈를 제거하는 수단으로서 노이즈 게이트를 설치하고 있다(예를 들어, 특허문헌 1 참조).
예를 들어, 특허문헌 1에 기재된 노이즈 게이트 장치에서는, 음성 신호의 증폭을 행하는 헤드 증폭기의 증폭도에 따라 노이즈 게이트의 임계값을 변경하여, 임계값 미만의 음성 신호를 제거하고 있다.
그러나 특허문헌 1에 기재된 노이즈 게이트 장치에서는, 임계값 미만의 음성 신호를 제거하기 때문에, 화자의 발화 음성이 임계값 미만의 음성 신호에 포함되어 있는 경우, 신호 레벨이 임계값 미만인 발화 음성이 제거되어 버린다는 문제가 발생한다.
따라서, 본 발명은, 음성 신호를 열화시키지 않고, 정상적인 노이즈를 간단히 제거할 수 있는 노이즈 게이트, 수음 장치 및 노이즈 제거 방법을 제공한다.
본 발명의 노이즈 게이트는, 입력된 음성 신호의 주파수 스펙트럼에 기초하여, 상기 음성 신호에 포함되는 정상적인 노이즈(이하, 정상 노이즈라고 칭한다)의 노이즈 스펙트럼을 추정한다. 노이즈 게이트는, 입력된 음성 신호의 주파수 스펙트럼과, 추정한 노이즈 스펙트럼의 신호 레벨비를 산출한다. 노이즈 게이트는, 산출한 신호 레벨비가 소정의 임계값 미만인 주파수 대역의 신호 레벨을 내린 상기 음성 신호의 주파수 스펙트럼을 출력한다.
이에 의해, 노이즈 게이트는, 화자의 발화 음성을 포함하는 음성 신호의 주파수 스펙트럼을 출력하여, 정상 노이즈로 이루어지는 음성 신호의 주파수 스펙트럼의 신호 레벨을 저감하기 때문에, 화자의 발화 음성을 열화시키지 않고, 정상 노이즈만을 제거한 음성 신호를 출력할 수 있다.
또한, 임계값은, 신호 레벨비가 1이 되는 값보다 추정 수단의 추정 오차에 대응하는 값만큼 크게 설정해도 좋다. 노이즈 게이트는, 임계값과 비교하는 신호 레벨비를, 추정한 정상 노이즈를 사용하여 산출하고 있기 때문에, 정상 노이즈의 추정 오차를 고려하기 위해서이다.
이에 의해, 노이즈 게이트는, 정상 노이즈의 신호 레벨이 실제보다 작은 값으로 추정된 경우에도 정상 노이즈를 제거할 수 있다.
또한, 본 발명의 수음 장치는, 상술한 노이즈 게이트를 구비한다. 수음 장치는, 음성을 수음하여 생성한 음성 신호를 주파수 영역의 신호인 주파수 스펙트럼으로 변환하여, 노이즈 게이트에 출력한다. 또한, 수음 장치는, 노이즈 게이트로부터 출력된 음성 신호의 주파수 스펙트럼을 시간 영역의 신호인 음성 신호로 역변환한다.
이에 의해, 수음 장치는, 상술한 노이즈 게이트를 사용함으로써, 수음한 음성 신호로부터 정상 노이즈를 제거할 수 있다. 이로 인해, 수음 장치는, 수음한 화자의 발화 음성을 열화시키지 않고, 방음(放音)할 수 있다.
본 발명에 따르면, 음성 신호의 주파수 스펙트럼을 입력하는 공정과, 상기 입력에 의해 입력된 음성 신호의 주파수 스펙트럼에 기초하여, 노이즈 스펙트럼을 추정하는 공정과, 상기 음성 신호의 주파수 스펙트럼과, 상기 추정 공정에 의해 추정된 노이즈 스펙트럼의 신호 레벨비를 산출하는 공정과, 상기 산출 공정에 의해 산출된 신호 레벨비가 소정의 임계값 미만인 주파수 대역의 게인을 내린 상기 음성 신호의 주파수 스펙트럼을 출력하는 공정을 구비한 노이즈 제거 방법을 제공한다.
또한, 상기 임계값은, 상기 신호 레벨비가 1이 되는 값보다 상기 추정 공정에서 사용되는 추정부의 추정 오차에 대응하는 값만큼 크게 설정된다.
본 발명의 노이즈 게이트는, 화자의 발화 음성을 열화시키지 않고, 정상 노이즈만을 제거한 음성 신호를 출력할 수 있다.
도 1은 수음 장치의 기능, 구성을 도시하는 블록도이다.
도 2는 게인 테이블의 일례를 나타내는 도면이다.
도 3의 (A) 내지 (C)는, 정상 노이즈, 음성 신호 및 노이즈 제거 후의 음성 신호의 일례를 나타내는 도면이다.
도 4는 게인 테이블의 다른 예를 나타내는 도면이다.
도 2는 게인 테이블의 일례를 나타내는 도면이다.
도 3의 (A) 내지 (C)는, 정상 노이즈, 음성 신호 및 노이즈 제거 후의 음성 신호의 일례를 나타내는 도면이다.
도 4는 게인 테이블의 다른 예를 나타내는 도면이다.
본 발명에 관한 수음 장치(1)에 대하여, 도 1, 도 2를 참조하여 설명한다. 도 1은, 수음 장치의 기능, 구성을 도시하는 블록도이다. 도 2는, 게인 테이블의 일례를 나타내는 도면이다. 수음 장치(1)는, 노이즈 게이트(12)(도 1 참조)를 구비한다. 수음 장치(1)는, 수음한 음성 신호(NE'T)를 주파수 스펙트럼(NE'N)으로 변환한다. 수음 장치(1)는, 노이즈 게이트(12)에 의해 음성 신호(NE'N)에 포함되는 정상 노이즈(N'N)를 제거한다. 이때, 정상 노이즈(N'N)는, 노이즈 게이트(12)에 의해 주파수 스펙트럼(NE'N)에 기초하여 추정된다. 수음 장치(1)는, 정상 노이즈(N'N)를 제거한 후의 주파수 스펙트럼(CO'N)을 시간축으로 역변환하여 생성한 음성 신호(CO'T)를 출력한다. 또한, 이하의 설명에서는, 시간 영역의 신호는 말단의 기호를 'T로 나타내고, 주파수 영역의 신호는 말단의 기호를 'N으로 나타낸다.
우선, 수음 장치(1)의 기능, 구성에 대하여, 도 1, 도 2를 참조하여 설명한다. 도 1에 도시한 바와 같이, 수음 장치(1)는, 마이크(MIC), FFT 처리부(11), 노이즈 게이트(12) 및 IFFT 처리부(13)를 구비한다.
마이크(MIC)는, 주위의 음성을 수음하여 음성 신호를 생성한다. 마이크(MIC)는, 생성한 음성 신호(NE'T)를 FFT 처리부(11)로 출력한다.
FFT 처리부(11)는, 고속 푸리에 변환 회로이며, 시간 영역의 신호인 음성 신호(NE'T)를 주파수 영역의 신호인 음성 신호(NE'N)로 변환하여, 노이즈 게이트(12)의 추정부(121) 및 노이즈 제거부(122)로 음성 신호(NE'N)를 출력한다.
노이즈 게이트(12)는, 추정부(121) 및 노이즈 제거부(122)를 구비한다.
추정부(121)는, FFT 처리부(11)로부터 입력된 음성 신호(NE'N)에 포함되는 정상 노이즈(N'N)를 추정하는 처리를 행한다. 추정부(121)는, 음성 신호(NE'N)의 어느 한 샘플 타이밍에서의 주파수 스펙트럼(이하, 음성 스펙트럼이라고 칭한다)(S(NE'N))을 순차 취득함과 함께 일시 기억한다. 추정부(121)는, 이 취득 및 기억한 복수회의 음성 스펙트럼(S(NE'N))에 기초하여, 정상 노이즈(N'N)의 어느 한 샘플 타이밍에서의 주파수 스펙트럼(이하, 노이즈 스펙트럼이라고 칭한다)(S(N'N))을 추정한다. 그리고 추정부(121)는, 추정한 노이즈 스펙트럼(S(N'N))을 노이즈 제거부(122)로 출력한다.
예를 들어, 어느 한 샘플링 타이밍(T)에서의 노이즈 스펙트럼을 S(N'N(T))로 하고, 동일 샘플링 타이밍(T)에서의 음성 스펙트럼을 S(NE'N(T))로 하고, 직전의 샘플링 타이밍(T-1)에서의 노이즈 스펙트럼을 S(N'N(T-1))로 한다. 또한, α, β는 망각 상수이며, 예를 들어 α=0.9, β=0.1이 된다. 노이즈 스펙트럼(S(N'N(T)))은, 다음 수학식 1로 표현할 수 있다.
[수학식 1]
S(N'N(T)) = αS(N'N(T-1)) + βS(NE'N(T))
이와 같이, 음성 스펙트럼에 기초하여 노이즈 스펙트럼(S(N'N(T)))을 추정함으로써, 주위 소음 등의 정상 노이즈를 추정할 수 있다. 또한, 추정부(121)는, 마이크(MIC)가 수음한 음성 신호의 레벨이 낮은 상태(무음 상태)인 경우만 노이즈 스펙트럼의 추정 처리를 행하는 것으로 한다.
노이즈 제거부(122)는, FFT 처리부(11)로부터 입력된 음성 신호(NE'N)로부터 정상 노이즈(N'N)를 제거하고, 노이즈 제거 후의 음성 신호(CO'N)를 IFFT 처리부(13)로 출력한다. 구체적으로는, 노이즈 제거부(122)는, 음성 스펙트럼(S(NE'N))과, 추정부(121)로부터 입력된 노이즈 스펙트럼(S(N'N))의 신호 레벨비를 산출한다. 노이즈 제거부(122)는, 산출한 신호 레벨비가 임계값 미만인 경우, 신호 레벨비가 임계값 미만인 주파수 대역에서의, 음성 스펙트럼(S(NE'N))의 게인을 내려 출력한다.
예를 들어, 노이즈 제거부(122)는, 도 2에 도시하는 게인 테이블(TBL)을 구비한다. 게인 테이블(TBL)은, 산출한 신호 레벨비에 따라 음성 스펙트럼(S(NE'N))의 게인을 정한다. 게인 테이블(TBL)은, 신호 레벨비가 임계값 이상인 경우, 게인을 1로 하고, 신호 레벨비가 임계값 미만인 경우, 게인을 0으로 한다. 이 경우, 노이즈 제거 후의 음성 신호(CO'N)의 어느 한 샘플 타이밍에서의 주파수 스펙트럼(S(CO'N))은, 다음 수학식 2로 표현할 수 있다.
[수학식 2]
S(CO'N) = (TBL(S(NE'N)/S(N'N))·S(NE'N)
이 결과, 노이즈 제거부(122)는, 신호 레벨비가 임계값 이상인 주파수에서는 음성 스펙트럼(S(NE'N))을, 신호 레벨을 변경하지 않고 그대로 출력한다. 또한, 노이즈 제거부(122)는, 신호 레벨비가 임계값 미만인 주파수 대역에서는 음성 스펙트럼(S(NE'N))을 노이즈 스펙트럼(S(N'N))으로 간주하여 그 신호 레벨을 0으로서 출력한다.
또한, 노이즈 제거부(122)는, 정상 노이즈(N'N)의 추정 오차를 고려하여, 임계값을 신호 레벨비가 1이 되는 값(1.0)보다 약간 큰 값으로 해도 좋다. 이렇게 하면, 노이즈 제거부(122)는, 정상 노이즈(N'N)의 추정 오차에 의해 정상 노이즈(N'N)의 신호 레벨이 실제보다 작게 추정된 경우에도 정상 노이즈(N'N)를 제거할 수 있다.
IFFT 처리부(13)는, 역고속 푸리에 변환 회로이며, 주파수 영역의 신호인 음성 신호(CO'N)를 시간 영역의 신호인 음성 신호(CO'T)로 변환하여 출력한다.
이상으로부터, 수음 장치(1)는, 화자의 발화 음성이 존재하는 주파수 대역의 음성 신호를 감쇠시키지 않고 그대로 남길 수 있기 때문에, 화자의 발화 음성을 열화시키지 않고 방음할 수 있다.
노이즈 게이트(12)의 출력값인 노이즈 제거 후의 음성 신호(CO'N)에 대하여, 도 3의 (A) 내지 도 3의 (C)를 참조하여 설명한다. 도 3의 (A) 내지 도 3의 (C)는, 정상 노이즈, 음성 신호 및 노이즈 제거 후의 음성 신호의 일례를 나타내는 도면이다. 도 3의 (A)는, 정상 노이즈의 신호 레벨을 나타내고, 도 3의 (B)는 정상 노이즈를 포함하는 음성 신호의 신호 레벨을 나타내고, 도 3의 (C)는 노이즈 제거 후의 음성 신호의 신호 레벨을 나타낸다.
수음 장치(1)는, 도 3의 (A)에 도시한 바와 같은 정상 노이즈(N'N)를 추정하여, 도 3의 (B)에 도시한 바와 같은 음성 신호(NE'N)를 생성했다고 하자. 음성 신호(NE'N)로부터 정상 노이즈(N'N)를 제거하기 위하여, 수음 장치(1)는, 간단히 음성 신호(NE'N)로부터 노이즈(N'N)를 빼면, 도 3의 (C)의 파선과 같이, 화자의 발화 음성이 존재하는 주파수 대역에서도 음성 신호(NE'N)의 신호 레벨을 감쇠시켜 버려, 음질이 열화된 음성을 방음해 버린다. 또한, 수음 장치(1)는, 정상 노이즈(N'N)의 추정 오차에 의해, 음성 신호(NE'N)에 정상 노이즈(N'N)가 남는 경우가 존재한다. 이 경우, 수음 장치(1)는, 화자의 발화 음성이 존재하지 않는 주파수 대역에서 신호 레벨의 편차가 현저하게 발생하기 때문에, 뮤지컬 노이즈가 발생해 버린다.
한편, 본 실시 형태에서는, 수음 장치(1)는, 도 3의 (C)의 실선과 같이, 화자의 발화 음성이 존재하는 주파수 대역을 남기고, 화자의 발화 음성이 존재하지 않는 주파수 대역(노이즈만이 존재하는 주파수 대역)의 음성 신호의 신호 레벨(게인)을 내리기 때문에, 화자의 발화 음성의 음질을 열화시키지 않고, 방음할 수 있다. 또한, 수음 장치(1)는, 음성 신호(NE'N)와 정상 노이즈(N'N)의 신호 레벨비에 따라 출력값(CO'N)을 결정하기 때문에, 화자의 발화 음성이 존재하지 않는 주파수 대역에서 신호 레벨의 편차가 발생하기 어려워, 뮤지컬 노이즈의 발생을 방지할 수 있다. 또한, 수음 장치(1)는, 음성 신호(NE'N)와 정상 노이즈(N'N)의 신호 레벨비를 구하기 때문에, 화자의 발화 음성이 작아도 노이즈만이 존재하는 주파수 대역을 검출할 수 있다.
또한, 상술한 실시 형태에서는, 수음 장치(1)는, 화자의 발화 음성이 존재하는 주파수 대역의 음성 신호의 신호 레벨을 유지하고, 화자의 발화 음성이 존재하지 않는 주파수 대역의 음성 신호의 신호 레벨(게인)을 0으로서 출력했다. 그러나 수음 장치(1)는, 화자의 발화 음성이 존재하는 주파수 대역의 음성 신호의 신호 레벨을 유지함과 함께, 화자의 발화 음성이 존재하지 않는 주파수 대역의 음성 신호의 신호 레벨(게인)을 0보다 큰 값까지 내려도 좋다. 도 4는, 게인 테이블의 다른 예를 나타내는 도면이다. 이 경우, 예를 들어, 도 4에 도시한 바와 같이 수음 장치(1)는, 화자의 발화 음성이 존재하지 않는 주파수 대역의 음성 신호의 게인을 0.5로 하고, 화자의 발화 음성이 존재하지 않는 주파수 대역의 음성 신호의 신호 레벨을 0.5배로 하여 출력한다. 이에 의해, 수음 장치(1)는, 화자의 발화 음성이 존재하는 주파수 대역에 포함되는 정상 노이즈가 두드러지지 않기 때문에, 화자의 음성을 자연스럽게 방음할 수 있다.
본 발명을 상세하게 또한 특정한 실시 형태를 참조하여 설명해 왔지만, 본 발명의 정신, 범위 또는 의도의 범위를 일탈하지 않고 여러 변경이나 수정을 가할 수 있는 것은 당업자에게 있어서 명확하다.
본 발명은, 2008년 11월 21일 출원의 일본 특허 출원(일본 특허 출원 제2008-298332)에 기초하는 것이고, 그 내용은 여기에 참조로서 원용된다.
<산업상의 이용가능성>
화자의 발화 음성을 열화시키지 않고, 정상 노이즈만을 제거한 음성 신호를 출력하는 노이즈 게이트를 제공할 수 있다.
1: 수음 장치
11: FFT 처리부
12: 노이즈 게이트
121: 추정부
122: 노이즈 제거부
13 : IFFT 처리부
MIC: 마이크
11: FFT 처리부
12: 노이즈 게이트
121: 추정부
122: 노이즈 제거부
13 : IFFT 처리부
MIC: 마이크
Claims (5)
- 음성 신호의 주파수 스펙트럼이 입력되는 입력 수단과,
상기 입력 수단에 입력된 음성 신호의 주파수 스펙트럼에 기초하여, 노이즈 스펙트럼을 추정하는 추정 수단과,
상기 음성 신호의 주파수 스펙트럼과 상기 추정 수단이 추정한 노이즈 스펙트럼과의 신호 레벨비를 산출하여, 상기 신호 레벨비가 소정의 임계값 미만인 주파수 대역의 신호 레벨을 내리고, 상기 신호 레벨비가 상기 소정의 임계값 이상인 주파수 대역의 신호 레벨을 변경하지 않은 상기 음성 신호의 주파수 스펙트럼을 출력하는 출력 수단을 구비한 노이즈 게이트. - 제1항에 있어서, 상기 임계값은, 상기 신호 레벨비가 1이 되는 값보다 상기 추정 수단의 추정 오차에 대응하는 값만큼 크게 설정되는 노이즈 게이트.
- 제1항 또는 제2항에 기재된 노이즈 게이트와,
주위의 음성을 수음하여 음성 신호를 생성하는 수음 수단과,
상기 수음 수단이 생성한 음성 신호를 주파수 영역의 신호인 주파수 스펙트럼으로 변환하는 변환 수단과,
상기 변환 수단에 의해 변환된 주파수 스펙트럼을, 상기 노이즈 게이트의 입력 수단에 입력하고,
상기 노이즈 게이트의 출력 수단이 출력한 음성 신호의 주파수 스펙트럼을 시간 영역의 신호인 음성 신호로 역변환하는 역변환 수단을 구비한 수음 장치. - 음성 신호의 주파수 스펙트럼을 입력하는 공정과,
상기 입력에 의해 입력된 음성 신호의 주파수 스펙트럼에 기초하여, 노이즈 스펙트럼을 추정하는 공정과,
상기 음성 신호의 주파수 스펙트럼과 상기 추정하는 공정에 의해 추정한 노이즈 스펙트럼과의 신호 레벨비를 산출하는 공정과,
상기 산출하는 공정에 의해 산출된 신호 레벨비가 소정의 임계값 미만인 주파수 대역의 신호 레벨을 내리고, 상기 신호 레벨비가 상기 소정의 임계값 이상인 주파수 대역의 신호 레벨을 변경하지 않은 상기 음성 신호의 주파수 스펙트럼을 출력하는 공정을 구비한 노이즈 제거 방법. - 제4항에 있어서, 상기 임계값은, 상기 신호 레벨비가 1이 되는 값보다 상기 추정하는 공정에서 사용되는 추정부의 추정 오차에 대응하는 값만큼 크게 설정되는 노이즈 제거 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2008-298332 | 2008-11-21 | ||
JP2008298332A JP2010122617A (ja) | 2008-11-21 | 2008-11-21 | ノイズゲート、及び収音装置 |
PCT/JP2009/069588 WO2010058804A1 (ja) | 2008-11-21 | 2009-11-18 | ノイズゲート、収音装置及びノイズ除去方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110082176A KR20110082176A (ko) | 2011-07-18 |
KR101254876B1 true KR101254876B1 (ko) | 2013-04-15 |
Family
ID=42198243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117011535A KR101254876B1 (ko) | 2008-11-21 | 2009-11-18 | 노이즈 게이트, 수음 장치 및 노이즈 제거 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9036830B2 (ko) |
EP (1) | EP2352148B1 (ko) |
JP (1) | JP2010122617A (ko) |
KR (1) | KR101254876B1 (ko) |
CN (1) | CN102216984B (ko) |
WO (1) | WO2010058804A1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5614261B2 (ja) * | 2010-11-25 | 2014-10-29 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びプログラム |
FR2969435A1 (fr) * | 2010-12-20 | 2012-06-22 | France Telecom | Mesure de bruit impulsif par detection spectrale |
CN102393986B (zh) * | 2011-08-11 | 2013-05-08 | 重庆市科学技术研究院 | 基于音频判别的盗伐检测方法、装置及系统 |
CN102868956B (zh) * | 2012-09-24 | 2015-02-11 | 深圳市纳芯威科技有限公司 | 噪声门电路以及音频功放设备 |
EP3108669B1 (en) * | 2014-02-18 | 2020-04-08 | Dolby International AB | Device and method for tuning a frequency-dependent attenuation stage |
WO2018148095A1 (en) * | 2017-02-13 | 2018-08-16 | Knowles Electronics, Llc | Soft-talk audio capture for mobile devices |
US10368173B1 (en) | 2017-03-24 | 2019-07-30 | Advanced Bionics Ag | Systems and methods for minimizing an effect of system noise generated by a cochlear implant system |
US10595134B1 (en) | 2017-03-24 | 2020-03-17 | Advanced Bionics Ag | Systems and methods for detecting and reacting to system noise generated by a cochlear implant system |
KR102466134B1 (ko) * | 2018-06-26 | 2022-11-10 | 엘지디스플레이 주식회사 | 표시 장치 |
CN112447166B (zh) * | 2019-08-16 | 2024-09-10 | 阿里巴巴集团控股有限公司 | 一种针对目标频谱矩阵的处理方法及装置 |
US11557307B2 (en) * | 2019-10-20 | 2023-01-17 | Listen AS | User voice control system |
CN113938805B (zh) * | 2020-07-14 | 2024-04-23 | 广州汽车集团股份有限公司 | 一种低音音质的量化方法及装置 |
JP2023106686A (ja) | 2022-01-21 | 2023-08-02 | ヤマハ株式会社 | 音声処理装置および音声処理方法 |
JP2023137650A (ja) | 2022-03-18 | 2023-09-29 | ヤマハ株式会社 | 音信号処理方法及び音信号処理装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09204196A (ja) * | 1995-12-12 | 1997-08-05 | Nokia Mobile Phones Ltd | 雑音抑圧器及び移動局並びに雑音抑圧方法 |
KR20020005674A (ko) * | 1999-04-12 | 2002-01-17 | 클라스 노린, 쿨트 헬스트룀 | 스펙트럼 감산을 사용하는 이중 마이크로폰 신호 잡음감소용 시스템 및 방법 |
KR20020033819A (ko) * | 1999-09-22 | 2002-05-07 | 조셉 더블유. 킹스 주니어. | 멀티모드 음성 인코더 |
JP2006050067A (ja) | 2004-08-02 | 2006-02-16 | Sony Corp | ノイズ低減回路、電子機器、ノイズ低減方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940009391B1 (ko) | 1985-07-01 | 1994-10-07 | 모토로라 인코포레이티드 | 잡음 억제 시스템 |
US4811404A (en) * | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
US6717991B1 (en) | 1998-05-27 | 2004-04-06 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for dual microphone signal noise reduction using spectral subtraction |
US6459914B1 (en) | 1998-05-27 | 2002-10-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging |
US6175602B1 (en) | 1998-05-27 | 2001-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6574593B1 (en) | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US6604070B1 (en) | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6581032B1 (en) | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
CN1204708C (zh) * | 2000-05-10 | 2005-06-01 | Adc宽带通路系统公司 | 用于返回信道频谱管理器的系统和处理 |
US7742746B2 (en) * | 2007-04-30 | 2010-06-22 | Qualcomm Incorporated | Automatic volume and dynamic range adjustment for mobile audio devices |
JP2008298332A (ja) | 2007-05-30 | 2008-12-11 | Aisin Seiki Co Ltd | 冷蔵庫 |
-
2008
- 2008-11-21 JP JP2008298332A patent/JP2010122617A/ja active Pending
-
2009
- 2009-11-18 WO PCT/JP2009/069588 patent/WO2010058804A1/ja active Application Filing
- 2009-11-18 EP EP09827585.2A patent/EP2352148B1/en active Active
- 2009-11-18 KR KR1020117011535A patent/KR101254876B1/ko not_active IP Right Cessation
- 2009-11-18 US US13/130,532 patent/US9036830B2/en active Active
- 2009-11-18 CN CN2009801462950A patent/CN102216984B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09204196A (ja) * | 1995-12-12 | 1997-08-05 | Nokia Mobile Phones Ltd | 雑音抑圧器及び移動局並びに雑音抑圧方法 |
KR20020005674A (ko) * | 1999-04-12 | 2002-01-17 | 클라스 노린, 쿨트 헬스트룀 | 스펙트럼 감산을 사용하는 이중 마이크로폰 신호 잡음감소용 시스템 및 방법 |
KR20020033819A (ko) * | 1999-09-22 | 2002-05-07 | 조셉 더블유. 킹스 주니어. | 멀티모드 음성 인코더 |
JP2006050067A (ja) | 2004-08-02 | 2006-02-16 | Sony Corp | ノイズ低減回路、電子機器、ノイズ低減方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2352148A1 (en) | 2011-08-03 |
CN102216984B (zh) | 2013-03-27 |
WO2010058804A1 (ja) | 2010-05-27 |
US9036830B2 (en) | 2015-05-19 |
KR20110082176A (ko) | 2011-07-18 |
EP2352148A4 (en) | 2012-08-22 |
US20110268288A1 (en) | 2011-11-03 |
CN102216984A (zh) | 2011-10-12 |
JP2010122617A (ja) | 2010-06-03 |
EP2352148B1 (en) | 2013-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101254876B1 (ko) | 노이즈 게이트, 수음 장치 및 노이즈 제거 방법 | |
JP5036874B2 (ja) | エコー消去装置 | |
EP2444966B1 (en) | Audio signal processing device and audio signal processing method | |
JP5332733B2 (ja) | エコーキャンセラ | |
US7620172B2 (en) | Method and system for eliminating noises and echo in voice signals | |
WO2016056167A1 (ja) | エコーキャンセル装置、エコーキャンセルプログラム及びエコーキャンセル方法 | |
WO2010055650A1 (ja) | 適応フィルタ及びこれを有するエコーキャンセラ | |
JP2009014937A (ja) | エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム | |
CN109273019B (zh) | 用于回声抑制的双重通话检测的方法及回声抑制 | |
WO2009104252A1 (ja) | 音処理装置、音処理方法及び音処理プログラム | |
KR20100003530A (ko) | 전자기기에서 음성 신호의 잡음 제거 장치 및 방법 | |
KR20100053890A (ko) | 잡음 제거 장치 및 잡음 제거 방법 | |
KR101182017B1 (ko) | 휴대 단말기에서 복수의 마이크들로 입력된 신호들의잡음을 제거하는 방법 및 장치 | |
US9426570B2 (en) | Audio processing device and method | |
JP3110201B2 (ja) | ノイズ除去装置 | |
US20080118055A1 (en) | Echo processing method and device | |
WO2009107750A1 (ja) | 音響エコーキャンセラ | |
WO2020203258A1 (ja) | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム | |
JP6369192B2 (ja) | エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末 | |
KR101607902B1 (ko) | 복합 하울링 제거 장치 | |
JP2003264483A (ja) | エコー抑圧装置、エコー抑圧方法、電話機、及びテレビ電話システム | |
JP4534529B2 (ja) | ハウリング抑圧方法及び装置 | |
JP2023130254A (ja) | 音声処理装置および音声処理方法 | |
JP5640393B2 (ja) | エコー除去装置、方法及びプログラム | |
JP6314608B2 (ja) | エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160318 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170317 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |