[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

DE112012000052B4 - Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen - Google Patents

Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen Download PDF

Info

Publication number
DE112012000052B4
DE112012000052B4 DE112012000052.8T DE112012000052T DE112012000052B4 DE 112012000052 B4 DE112012000052 B4 DE 112012000052B4 DE 112012000052 T DE112012000052 T DE 112012000052T DE 112012000052 B4 DE112012000052 B4 DE 112012000052B4
Authority
DE
Germany
Prior art keywords
noise
filter
transition
reference filter
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE112012000052.8T
Other languages
English (en)
Other versions
DE112012000052T5 (de
Inventor
Bijal Joshi
Suat Yeldener
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Continental Automotive Systems Inc
Original Assignee
Continental Automotive Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Continental Automotive Systems Inc filed Critical Continental Automotive Systems Inc
Publication of DE112012000052T5 publication Critical patent/DE112012000052T5/de
Application granted granted Critical
Publication of DE112012000052B4 publication Critical patent/DE112012000052B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/07Mechanical or electrical reduction of wind noise generated by wind passing a microphone

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

Verfahren zur Unterdrückung von Rauschen in einem Audiosignal (30), umfassend:Erzeugen einer Rausch-Wahrscheinlichkeits-Klassifizierung (50) durch Berechnen eines geglätteten Energieverhältnisses auf Grundlage eines Eingangssignales, wobei das geglättete Energieverhältnis eine Rausch-Wahrscheinlichkeit darstellt; undadaptives Überdecken des Rauschens durch:Auswählen eines Referenzfilters (60) auf Grundlage der Rausch-Wahrscheinlichkeits-Klassifizierung (50), undAnwenden des ausgewählten Referenz-Filters (60) an dem Eingangssignal, um ein Ausgangssignal zu erzeugen,weiterhin umfassend einen der folgenden Schritte:a) Verwenden verschiedener Glättungs-Koeffizienten, um das geglättete Energieverhältnis zu berechnen, und zwar auf Grundlage wenigstens einer Art von Rausch-Wahrscheinlichkeits-Klassifizierungs-Übergang, ausgewählt von: einem Sprache-zu-Rauschen-Übergang; und einem Rauschen-zu-Sprache-Übergangb) Verwenden verschiedener Werte für einen Glättungskoeffizienten, um eine geglättete Verstärkung für jeden Referenzfilter einer Mehrzahl von Referenzfiltern, aus der der Referenzfilter ausgewählt wird, zu berechnen, und zwar auf der Grundlage wenigstens einer Art von einem Rausch-Wahrscheinlichkeits-Klassifizierungs-Übergang, ausgewählt von:einem Sprache-zu-Rauschen-Übergang; und einem Rauschen-zu-Sprache-Übergang,c) Verwenden verschiedener Glättungskoeffizienten, um eine geglättete Zwangsfrequenz jedes Referenzfilters einer Mehrzahl von Referenzfiltern, aus der der Referenzfilter ausgewählt wird,zu berechnen, und zwar auf der Grundlage wenigstens einer Art von Rausch-Wahrscheinlichkeits-Klassifizierungs-Übergang, ausgewählt von:einem Sprache-zu-Rauschen-Übergang; und einem Rauschen-zu-Sprache-Übergang.

Description

  • Hintergrund
  • Windrauschen bzw. Windgeräusche, welche während im Freien durchgeführter Telefongespräche auftreten, in einem fahrenden Fahrzeug, oder in einer sonstwie windigen Umgebung, sind ein ernsthaftes Problem. Windrauschen kann dazu führen, dass der Hörer am anderen Ende eines Telefonats nicht in der Lage ist, die Stimme des Anrufers zu verstehen bzw. zu hören.
  • Die EP 1 750 483 A1 beschreibt ein Hörgerät mit Unterdrückung von Windgeräuschen, bei dem die Erkennung von Windgeräuschen nur einen einzigen Vergleich des Eingangssignalleistungsanteils bei ersten niedrigen Frequenzen mit dem Eingangssignal-Leistungsniveau bei Frequenzen ermöglicht, die die ersten niedrigen Frequenzen umfassen können.
  • Windgeschwindigkeit und -Richtung ändern sich kontinuierlich und als ein Ergebnis ist es sehr schwierig, diese Faktoren von Telefonunterhaltungen abzuhalten. Herkömmliche Verfahren und Vorrichtungen zur Unterdrückung von Wind und/oder Rauschen sind ineffektiv. Die Erfindung stellt ein effektives Verfahren und/oder eine Vorrichtung zum Ausblenden/zur Überdeckung bzw. Auslöschung von Windgeräuschen während eines Telefonats bereit, während hörbare Sprache aufrechterhalten wird. Ein Verfahren und eine Vorrichtung zur Überdeckung, Entfernung bzw. Unterdrückung von Windgeräuschen wäre eine Verbesserung gegenüber dem Stand der Technik.
  • Figurenliste
    • 1 zeigt ein Blockdiagramm für einen adaptiven Windgeräusch-Überdeckungsfilter;
    • 2 zeigt ein Blockdiagramm einer Umsetzung des adaptiven Windgeräusch-Überdeckungsfilters unter Verwendung eines Computers;
    • 3 zeigt mehrere Beispiel-Frequenzantworten der primären Rausch-Überdeckungsfilter;
    • 4 zeigt Frequenzantwort-Änderungen für eine lineare primäre Rausch-Überdeckungs-Filter-Verstärkung (W)-Änderung von 0,1 bis 0,9 bei einer festen Zwangsfrequenz (CF) ;
    • 5 zeigt Frequenzantwort-Änderungen für eine lineare primäre Rausch-Überdeckungsfilter-CF-Änderung von 50 Hz bis 550 Hz, und zwar bei einer festen Verstärkung W;
    • 6 zeigt Frequenzantwort-Änderungen für einen linearen Referenzfilter auf Grundlage von verschiedenen W und CF;
    • 7A und 7B zeigen Oszilloskop-Kurven eines Eingangssignals vor und nach Filtern des Audiosignals unter Verwendung des adaptiven Windgeräusch-Überdeckungsfilters; und
    • 8 ist eine Darstellung von Eigenschaften der zeitlichen Änderung des adaptiven Windgeräusch-Überdeckungsfilters, um das in 7B gezeigte Ausgangssignal aus dem in 7A gezeigten Eingangssignal bereitzustellen.
  • Detaillierte Beschreibung
  • 1 ist ein Funktions-Blockdiagramm eines Verfahrens und einer Vorrichtung 10 zum Überdecken von Windgeräusch. Eine Ausführungsform wird von einem Computer umgesetzt, welcher in einer Speichereinrichtung, welche mit dem Computer gekoppelt ist, gespeicherte Programmanweisungen ausführt. Die Anweisungen veranlassen den Computer, durch die verschiedenen Funktionsblöcke identifizierte Funktionen auszuführen. 1 zeigt daher ein Verfahren, wobei jedoch der Fachmann erkennen wird, dass das in 1 dargestellte Verfahren auch unter Verwendung eines digitalen Signalprozessors (DSP), eines Feld-programmierten Gate-Arrays bzw. FPGA, als auch unter Verwendung von diskreten Komponenten umsetzbar ist. 1 soll daher auch dazu dienen, eine Vorrichtung darzustellen.
  • Eine Ausführungsform umfasst einen Tiefpassfilter 15, welcher Audiosignale 30 empfängt, wie zum Beispiel solche von einem herkömmlichen Mikrofon 25 ausgegebene Signale. In der bevorzugten Ausführungsform ist der Tiefpassfilter 15 ein digitaler Filter, welcher aus verschiedenen Computer-Programmroutinen besteht, welche digitale Darstellungen des Audiosignals 30 vom Mikrofon 25 bearbeiten.
  • Wie in der Figur dargestellt ist, werden die analogen Audiosignale 30 in einen Fast-Fourier-Transformations(FFT)-Berechner 35 eingegeben, welcher zur Verwendung von Programmanweisungen ausgebildet ist. Die Ausgabe des FFT-Berechners wird in einen Multiplizierer 40 eingegeben, welcher ebenso dazu ausgebildet ist, Programmanweisungen zu verwenden. Der Multiplizierer 40 multipliziert die Ausgabe des Fast-Fourier-Transformations-Berechners 35 mit der Ausgabe eines adaptiven Windgeräusch-Überdeckungs-Filters 45.
  • Der adaptive Windgeräusch-Überdeckungs-Filter 45 empfängt Information von einem Windgeräusch-Wahrscheinlichkeits-Klassifizierungs-Block 50 und wendet entsprechende Referenzfilter 60 an, um einen Zielfilter zu erzeugen, um diesen an der Ausgabe des FFT 35 anzuwenden. Die Windgeräusch-Wahrscheinlichkeits-Klassifizierung 50 erzeugt eine Ausgabe, welche darauf hindeutet, ob das Signal 30 vom Mikrofon 25 möglicherweise Geräusch, Sprache oder eine Kombination aus Sprache und Geräusch aufweist. Die Windgeräusch-Wahrscheinlichkeits-Klassifizierung wird aus Information abgeleitet, welche von einem Windgeräusch-Detektor 65 erhalten wurde.
  • Digitale Signale, welche eine Windgeräusch-unterdrückte Version des Audiosignals vom Mikrofon 25 darstellen, werden vom Multiplizierer 40 ausgegeben, wenn eine Entscheidung dahingehend getroffen worden ist, dass das Audiosignal 30 vom Mikrofon 25 möglicherweise Windgeräusch aufweist. Die Ausgabe des adaptiven Windgeräusch-Überdeckungsfilters 45 besteht daher aus Frequenzbereich-Windgeräusch-Überdeckungs-Filterkoeffizienten 58, welche in den Multiplizierer 40 eingegeben werden. Die Ausgabe des Multiplizierers 40 wird in einen inversen Fast-Fourier-Transformations(IFFT)-Schaltkreis 70 eingegeben, dessen Ausgabe 75 eine Rausch-verminderte Kopie der Spracheingabe in das Mikrofon 25 ist.
  • In einer Ausführungsform wird eine Windgeräusch-Erkennung durch einen Vergleich des Tiefpass-gefilterten Signals mit dem Audio-Eingabesignal 30 durchgeführt. Der Vergleich wird als ein Verhältnis des Energieniveaus in jedem der Signale berechnet. In der Ausführungsform, welche das Verhältnis der Tiefpass-gefilterten Signalenergie Pt zu der Gesamtenergie des Eingangssignales PT verwendet, ist der Vergleich ein Verhältnis, welche unten in Gleichung (1) ausgedrückt wird. In der Ausführungsform weist der Tiefpassfilter eine Cut-Off-Frequenz bei 150 Hz auf. ρ ( n ) = P t ( n ) P T ( n )
    Figure DE112012000052B4_0001
    wobei ρ das Energieverhältnis für einen gegebenen Eingabe-Rahmen n ist. In einer Ausführungsform ist ein Rahmen 10 ms lang.
  • Eine Windgeräusch-Wahrscheinlichkeits-Klassifizierung (50) wird durch Verwendung eines „geglätteten Energieverhältnisses“ berechnet. Das geglättete Energieverhältnis wird durch Gleichung (2) unten ausgedrückt: ξ ( n ) = α ξ ( n 1 ) + ( 1 α ) ρ ( n )
    Figure DE112012000052B4_0002
    wobei α der Glättungskoeffizient ist, dessen Wert vom Design abhängt, jedoch so ausgewählt ist, um das Hauptgewicht derart zu bestimmen, um es auf einen oder mehrere vorherige Werte von ξ zu setzen. Außerdem liegt der Wert von α zwischen 0 und 1. In einer Ausführungsform liegt α im Bereich von [0,75, 1), wobei die eckige Klammer „[“ den Einfluss des benachbarten Wertes anzeigt, das heißt der angrenzende Wert soll innerhalb des Bereiches liegen, und die runde Klammer bedeutet bis zu, jedoch nicht einschließlich des benachbarten Wertes, das heißt der Wert „1“ ist nicht in dem Bereich enthalten, jedoch alle Werte, die kleiner sind.
  • In Gleichung (2) definiert der Wert ξ(n) die Wahrscheinlichkeit von Sprache bzw. Rauschen in dem Eingangssignal. Und, wie in Gleichung (2) gesehen werden kann, dass die Sprache- bzw. Geräuschwahrscheinlichkeitsbestimmung eine Stichprobe verwendet, welche durch den Ausdruck (1-α) · ρ(n) dargestellt wird, und zumindest eine zuvor-erhaltene Probe bzw. Messwert oder „vorheriges“ Signal, welches durch den Ausdruck α · ξ(n-1) dargestellt wird. In der Ausführungsform werden die folgenden Sprach- und Geräusch-Klassifizierungen durch Vergleichen numerischer Werte von ξ erhalten, welche aus Gleichung (2) mit Nutzer-definierten numerischen Schwellenwerten erzielt wurden: ψ = " Speech only " : if ξ < S P _ O N L Y _ T H R ψ = " Mostly speech " : if  S P _ O N L Y _ T H R < ξ < N S _ S P _ T H R ψ = " Mostly wind noise " : if  N S _ S P _ T H R < ξ < N S _ T H R ψ = " Wind noise only " : if  N S _ T H R < ξ }
    Figure DE112012000052B4_0003
    wobei,
    SP_ONLY_THR ein Schwellenwert für eine Sprach-Klassifizierung ist;
    NS SP THR ein Zwischen-Schwellenwert zur Identifizierung einer hohen Wahrscheinlichkeit von Sprache bzw. Windgeräusch ist;
    NS THR ein hoher Schwellenwert für eine Windgeräusch-Klassifizierung ist, und;
    Ψ eine Windgeräusch-Wahrscheinlichkeits-Klassifizierung ist.
  • Es könnten mehrere Klassifizierungen von Ψ vorhanden sein, als in der Familie von Gleichungen (3) dargestellt sind, zum Beispiel „mehr Sprache“, „mehr Windgeräusch“, „Sprache und Windgeräusch zu gleichen Anteilen“, usw., um einen gleichmäßigeren Übergang zwischen Windgeräusch und Sprache einzuhalten.
  • Die in der Familie von Gleichungen (3) definierten Schwellenwerte werden verwendet, um Eigenschaften eines primären adaptiven Überdeckungsfilters 45 zu bestimmen. Die Eigenschaften eines primären adaptiven Überdeckungsfilters 45 werden wenigstens mit einem Referenzfilter 60 verglichen und danach ausgewählt, um eine geeignete Unterdrückung und/oder Verstärkung des Rauschens und/oder der Sprache in dem Audiosignal zuzulassen. Beispielhafte Frequenzantworten der Referenzfilter 60 sind in 3 dargestellt, wobei ein mit einem „-“ dargestellter Filter eine weniger aggressive Dämpfung ausführt und ein mit einem „+“ dargestellter Filter sich eher aggressiv verhält. Die in 3 dargestellten Kurven zeigen Beispiele unterschiedlicher Dämpfungseigenschaften von unterschiedlichen Referenzfiltern. Die durchgängige Linie in 3 zeigt, dass ein Referenzfilter Signale linear von 600 Hz bis hinunter zu 0 Hz abschwächt. Mit anderen Worten, die durchgezogene Linie zeigt, dass ein Referenzfilter in abnehmender Weise Eingangssignale linear von 0 Hz bis etwa 600 Hz abschwächt. Die anderen Kurven zeigen, dass weitere Referenzfilter Dämpfungseigenschaften aufweisen können, welche in unterschiedlichen Frequenzbereichen mehr oder weniger aggressiv sein können.
  • Der adaptive Windgeräusch-Überdeckungsfilter 45 leitet eine Zwangs- (das heißt geeignete bzw. relevante) Frequenz (CF) sowie eine Verstärkung W für die CF ab, welche durch die Bestimmung der Windgeräusch-Wahrscheinlichkeits-Klassifizierung Ψ bestimmt wurde, welche aus der Windgeräusch-Wahrscheinlichkeits-Klassifizierung 50 empfangen wurde. In einer Ausführungsform werden CF und W des Filters 45 für den Rahmen n durch die folgende Familie von Gleichungen (4) bestimmt:
    Figure DE112012000052B4_0004
    wobei,
    a und b Skalierungsparameter sind; und 0 ≤ b ≤ a ≤ 1 gilt.
    Gmax und Gmin sind jeweils die an dem Signal angewandte maximale Dämpfung und minimale Dämpfung;
  • NsFreq, NsSpFreq, SpNsFreq und SpFreq sind vorbestimmte CFs für „Geräusch“-, „überwiegend Geräusch“-, „überwiegend Sprache“- und „Sprache“-Klassifizierung, und zwar jeweils von den Familien der Gleichungen (3), wie oben definiert ist.
  • Die Werte von a, b, Gmax, Gmin, NsFreq, NsSpFreq, SpMsFreq und SpFreq werden experimentell a priori bestimmt, um eine Geräuschunterdrückung von dem Eingangssignal zu optimieren. Nach Bestimmung der Zwangsfrequenz (CF) und Zielverstärkung (W) aus der wie oben dargestellten Familie von Gleichungen (4) werden jeweils ein Verstärkungsfaktor bzw. ein Dämpfungsfaktor Glow und Ghigh wie in Gleichung (5a) und (6a) dargestellt berechnet. Der Verstärkungs- bzw. Dämpfungs-Faktor Glow wird an den Frequenzen unterhalb CF angewendet, wie in Gleichung (5b) dargestellt ist, und Ghigh wird an den Frequenzen oberhalb CF angewendet, wie in Gleichung (6b) dargestellt ist. G l o w = W ( n ) G ( f i l t ( C F ) )
    Figure DE112012000052B4_0005
    f i l t ( 0 : C F 1 ) = f i l t ( 0 : C F 1 ) G l o w
    Figure DE112012000052B4_0006

    wobei filt ein von den Referenzfiltern 60 ausgewählter Filter ist;
    filt (0:CF-1) die Filterkoeffizienten des ausgewählten Referenzfilters bis zu CF-1 sind;
    G(filt:(CF)) ist der momentane Verstärkungswert des ausgewählten Referenzfilters bei CF;
    Glow ist die berechnete Verstärkung, welche an den Referenzfilter-Koeffizienten unterhalb CF angewendet worden ist, wie in Gleichung (5b) dargestellt ist.
  • Und, G h i g h = 1 W ( n ) G ( f i l t ( F i l t L e n ) ) G ( f i l t ( C F ) )
    Figure DE112012000052B4_0007
    f i l t ( C F : F i l t L e n ) = ( f i l t ( C F : F i l t L e n ) G ( f i l t ( C F ) ) ) G h i g h
    Figure DE112012000052B4_0008
    wobei filt(CF:FiltLen) die Filterkoeffizienten des Referenzfilters von CF bis zu der letzten Frequenz (FiltLen) des Filters sind;
  • G(filt(FiltLen)) und G(filt(CF)) jeweils die momentanen Verstärkungen der Referenzfilter-Koeffizienten bei der letzten Frequenz (FiltLen) des Referenzfilters sowie bei der CF sind;
  • Ghigh die berechnete neue Verstärkung ist, welche an den normalisierten Filterkoeffizienten des Referenzfilters (filt) oberhalb CF geworden ist, wie in Gleichung (6b) dargestellt ist.
  • Ein Anpassen von CF des Filters 45 auf Grundlage von Glow und Ghigh in Antwort auf vorherige Eigenschaften des Rauschens in einem Signal verändert in effektiver Weise die Form des Durchlassbereiches des Filters 45, und zwar in Echtzeit, und zwar in Antwort auf sich ändernde Rauschniveaus in dem Signal 30 von der Audioquelle bzw. dem Mikrofon 25. Die Gestalt der Durchlassbereich-Eigenschaft des Filters 45 wird daher in Echtzeit empirisch angepasst, das heißt auf Grundlage von Beobachtungen von Rausch-Eigenschaften, wie zum Beispiel der Filter 45 Rauschsignale auf dem Eingangssignal 30 durch Reduzieren der Amplitude der Signale abschwächt, und zwar in einem besonderen Frequenzbereich, wo die Signale von dem Fast-Fourier-Transformations-Berechner 35 empfangen werden. Mit anderen Worten, der adaptive Windgeräusch-Überdeckungsfilter 45 erzeugt Filterkoeffizienten, um selektiv verschiedene Frequenzbereiche zu dämpfen, um in von dem Fast-Fourier-Transformations-Berechner 35 empfangenen Signalen Windgeräuschinhalt zu unterdrücken. Der adaptive Windgeräusch-Überdeckungsfilter 45 extrahiert daher in effektiver Weise Sprachsignale aus dem Eingangssignal 30. Verschiedene Frequenzbereiche werden durch Bestimmen von Koeffizienten der FFT-Berechner-Ausgabe abgeschwächt.
  • Ein langsamer gleitender Durchschnitt auf Grundlage sowohl vorheriger W als auch CF wird für einen gleichmäßigeren Übergang zwischen einem Sprach- und Geräusch-Teil des Eingangssignales berechnet. Für W kann der langsame gleitende Durchschnitt folgendermaßen ausgedrückt werden: W ^ ( n ) = β W ( n 1 ) + ( 1 β ) W ( n )
    Figure DE112012000052B4_0009
    wobei β ein Glättungskoeffizient zwischen 0 und 1 ist. In einer Ausführungsform ist der Wert von β im Bereich von [0,75, 1) gesetzt. Ein Glätten der Filterkoeffizienten für CF wird wie in Gleichung (9) unten dargestellt ist berechnet.
  • 4 zeigt Beispiele verschiedener Filterkoeffizienten, wobei CF konstant bei 300 Hz verbleibt, und sich die Verstärkung W linear von 0,1 bis 0,9 ändert. 5 zeigt verschiedene Werte von CF mit einem Wert von W = 0,5, und wobei CF sich zwischen 50 Hz bis 550 Hz ändert. Zusammengefasst zeigen 4 und 5 die Änderungen hinsichtlich W und CF auf Grundlage eines linearen Referenzfilters, jedoch könnte ein tatsächlicher Referenzfilter eine beliebige Länge und Gestalt aufweisen. 6 zeigt die lineare Referenzfilter-Änderung auf Grundlage verschiedener W und CF.
  • Bedeutsamer Weise kann der Referenzfilter 60 unterschiedliche Frequenzbereiche und unterschiedliche Formen für unterschiedliche Werte von Ψ aufweisen. Dies unterstützt ein Anpassen des adaptiven Windgeräusch-Überdeckungsfilters 45 an unterschiedliche Geräusch-Eigenschaften in Echtzeit, auf Grundlage von tatsächlichen Geräuschbedingungen in der tatsächlichen Umgebung, wo der Filter 45 verwendet wird. Es kann ebenso mehr als eine Verstärkung W als auch mehr als eine Frequenz CF geben, um eine gleichmäßige Filterantwort zu erzielen, das heißt, eine mit mehreren Filterschritten.
  • Gleichung (8) unten ist eine Windgeräusch-Überdeckungsfilter-Antwort, welche an dem Eingangssignal im Frequenzbereich angewendet werden soll. Die Funktion AdaptiveWin ist eine Funktion, welche den Windgeräusch-Überdeckungsfilter auf Grundlage der Werte von CF, Ŵ und Filt des Referenzfilters erzeugt, wie in Gleichungen (5) und (6) unten dargestellt ist. W n m ( ω ) = A d a p t i v e W i n ( C F , W ^ , f i l t )
    Figure DE112012000052B4_0010
    wobei Wnm den Windgeräusch-Überdeckungsfilter darstellt.
  • Sowie die Windgeräusch-Überdeckungsfilter-Koeffizienten bestimmt sind, wird eine Mittelung für jeden Koeffizienten des für gleichmäßige Änderungen hinsichtlich CF gebildeten neuen Filters durchgeführt. Dies hilft, die Klangqualität zu verbessern und erzeugt einen angenehm zu hörenden Übergang zwischen Sprache und Rauschen. W ^ n m ( n ) = δ W n m ( n 1 ) + ( 1 δ ) W n m ( n )
    Figure DE112012000052B4_0011
    wobei δ ein Glättungskoeffizient zwischen 0 und 1 ist. In einer Ausführungsform ist der Wert von δ im Bereich von [0,75, 1) .
  • In Gleichung (9) wird der Wert von δ derart ausgewählt, um unterschiedliche Anstiegsraten zwischen Sprache-zu-Rauschen und Rauschen-zu-Sprache-Übergängen bereitzustellen, und in der Lage zu sein, mehr oder weniger schnell eine Anpassung von einem Zustand zum nächsten zu finden. δ kann somit als eine Anstiegsrate betrachtet werden, welches eine Rate ist, bei welcher ein Sprache-zu-Rauschen- und Rauschen-zu-Sprache-Übergang durchgeführt wird. Ein Überdecken des Rauschens in dem adaptiven Windgeräusch-Überdeckungsfilter 45 ist eine einfache Multiplikation 40 der Filterkoeffizienten 58 und von dem FFT-Berechner 35 empfangener Eingaben. Diese Multiplikation kann wie folgt ausgedrückt werden: X ^ ( ω ) = W n m ( ω ) X ( ω )
    Figure DE112012000052B4_0012
    wobei X ( ω ) = F F T ( x ( n ) )
    Figure DE112012000052B4_0013
    und wobei X̅ ein Windgeräusch-unterdrücktes Signal im Frequenzbereich ist, und wobei ω eine spezifische Frequenz darstellt.
  • Ein Geräusch-unterdrücktes Audio-Ausgangssignal 75 wird durch Berechnen einer inversen Fourier-Transformation (IFFT) 70 an Signalausgängen von dem adaptiven Windgeräusch-Überdeckungsfilter 45 mittels des Multiplizierers 40 erzielt. Die IFFT-Ausgabe 75 kann folgendermaßen ausgedrückt werden: x ¯ ( n ) = I F F T ( X ^ ( ω ) )
    Figure DE112012000052B4_0014
    wobei X̅ die Windgeräusch-unterdrückte Endausgabe 75 für den Rahmen n im Zeitbereich ist.
  • Das in 1 dargestellte System überdeckt in effektiver Weise Windrauschen in Audiosignalen durch Klassifizieren bestimmter Niedrigfrequenz-Signale als Windrauschen und Signale oberhalb einer bestimmten Frequenz als Sprache und Verwenden einer aktuellen Vorgeschichte an Rausch-Eigenschaften im Signal. Das System 10 passt das Rauschfiltern auf Grundlage einer aktuellen Vorgeschichte der Eingangssignale 30 an (wenigstens ein vorheriger Messwert), so dass sich die Eigenschaften des Filters 45 zeitlich ändern. Ein zeitliches Verfolgen der Geräusch-Eigenschaften unterstützt ein Überdecken von plötzlichen Windgeräuschen, welche als Schwankungen bekannt sind und versetzt das System 10 in die Lage, sich an verschiedene akustische Umgebungen anzupassen, welche umfassen, jedoch nicht ausschließlich, Ansteck-Mikrofone, Konferenzräume oder andere Umgebungen, wo ein Hintergrundgeräusch sonst über ein Mikrofon in einem Audiosignal detektierbar wäre.
  • 2 ist ein Blockdiagramm eines Audiosystems 100, welches Teil eines Radios bildet. Eine Ausführungsform umfasst einen Computer, das heißt eine zentrale Bearbeitungseinheit (CPU) 70 mit zugeordnetem Speicher 75, welcher Programmanweisungen für die CPU 70 speichert. Analoge Ausgangssignale von dem Mikrofon 25 werden durch einen Analog-zu-Digital (A/D)-Umwandler 80 in eine digitale Form umgewandelt. Das digitale Signal von dem A/D-Umwandler 80 wird in die CPU 70 eingegeben und von dieser unter Verwendung der oben beschriebenen Methode bearbeitet. Die Speichereinrichtung 75 speichert Programmanweisungen, welche bei Ausführung durch die CPU 70 die CPU 70 veranlassen, die oben beschriebenen Schritte auszuführen, einschließlich ein Ändern von Eigenschaften des adaptiven Windgeräusch-Überdeckungsfilters entsprechend dem in einem Eingangssignal 30 detektierten Geräuschinhalt. Die CPU 70 gibt eine digitale Darstellung des korrigierten digitalen Geräuschsignals an einen Digital-zu-Analog (D/A)-Umwandler 90 aus. Das analoge Signal von dem D/A-Umwandler 90 wird einem Lautsprecher 95 zugeführt. Ein Beispiel der Ausgabesignal-Qualitätsverbesserung wird in 7A und 7B gezeigt.
  • 7A ist eine Oszilloskopkurve eines momentanen Audiosignales, welches wie oben beschrieben in den adaptiven Windgeräusch-Filter eingegeben wurde. 7B ist eine Oszilloskopkurve desselben Signales nach einem Durchgang, das heißt nach Bearbeitung durch den adaptiven Windgeräusch-Filter. Kurzzeitige Geräuschschwankungen im Eingangssignal, wie in 7A gezeigt, werden von dem Ausgabesignal entfernt, wie in 7B dargestellt. Das Ausgabesignal ist ansonsten das gleiche oder im Wesentlichen das gleiche wie das Eingabesignal.
  • 8 zeigt, wie sich Eigenschaften des adaptiven Windgeräusch-Überdeckungsfilters zeitlich ändern, um das in 7B dargestellte Ausgabesignal des in 7A dargestellten Eingabesignales bereitzustellen. Die Verstärkung bzw. Dämpfung des Filters wird als eine vertikal-ausgerichtete Achse dargestellt, welche senkrecht zu zwei weiteren beliebigen senkrechten Achsen ist, welche mit „Frequenz“ und „Sekunden“ gekennzeichnet sind.
  • In 7A ist die erste bzw. am Weitesten links befindliche Geräusch-Schwankung von dem in 7B gezeigten Ausgabesignal weggelassen. Diese erste Geräusch-Schwankung ist unterdrückt, und zwar durch Anpassen der Verstärkung des Filters, um die Schwankung (bzw. den „Burst“) zu unterdrücken.
  • Wie in 8 dargestellt ist, werden EingabesignalFrequenzen unterhalb etwa 300 Hz abgeschwächt, das heißt sie weisen eine Verstärkung von 0 auf, und zwar unmittelbar nach der in der Figur dargestellten Anfangs- bzw. Start-Zeit. Die Verstärkung, welche Eingangssignalen oberhalb 300 Hz bereitgestellt wird, steigt jedoch linear an.
  • In 7A ist eine zweite Geräusch-Schwankung bei t=4 Sekunden erkennbar. Diese zweite Geräusch-Schwankung ist von dem in 7B dargestellten Ausgabesignal weggelassen. Die zweite Geräusch-Schwankung bei t=4 Sekunden ist unterdrückt, und zwar durch Anpassen der Verstärkung des Filters, um die zweite Geräusch-Schwankung zu unterdrücken.
  • In 8 werden bei t=4 Sekunden Eingabesignalfrequenzen unterhalb etwa 300 Hz abgeschwächt, das heißt sie weisen eine geringe oder keine Verstärkung auf, wohingegen die Niedrigfrequenz-Filterverstärkung genau vor und genau nach t=4 Sekunden größer ist. Ein Reduzieren bzw. Eliminieren der Verstärkung von Niedrigfrequenzsignalen um 4 Sekunden herum unterdrückt somit die Geräusch-Schwankung, wie in 7B dargestellt ist.
  • Die letzte bzw. am Meisten rechts befindliche Geräusch-Schwankung, welche in 7A gezeigt ist, ist ebenso von der in 7B gezeigten Ausgabe weggelassen. In 8 ist die Verstärkung des Filters bei t=12 Sekunden als reduziert dargestellt. Die reduzierte Verstärkung bei t=12 Sekunden unterdrückt die Geräusch-Schwankung des in 7B dargestellten Ausgabesignals.
  • In einer bevorzugten Ausführungsform wurden Filtereigenschaften ausgewählt, um relativ niedrige Frequenzsignale zu unterdrücken, das heißt unterhalb etwa 300 Hz, und von relativ kurzer Zeitdauer, das heißt weniger als ein paar Hundert Millisekunden. Solche Signale entstehen typischerweise durch Windstöße, welche an einem Mikrofon vorbeiziehen. Es können unterschiedliche Filtereigenschaften ausgewählt werden, um Signale mit unterschiedlichen Frequenzen und unterschiedlichen Zeitdauern zu unterdrücken. Das Verfahren und die Vorrichtung, welche hierin offenbart sind, sollten daher nicht auf ein Filtern von lediglich Windgeräusch beschränkt betrachtet werden. Durch entsprechende Auswahl von Betriebseigenschaften kann der adaptive Filter durch elektrischen Überschlag verursachtes Hochfrequenz-Elektrorauschen unterdrücken bzw. verstärken, wie zum Beispiel das Zündungsgeräusch einer Zündkerze. Der Filter kann ebenso verwendet werden, um Signale innerhalb eines Frequenzbandes zu unterdrücken bzw. zu verstärken.
  • Während eine bevorzugte Ausführungsform des Filters Signale dämpft, kann der hierin offenbarte Filter ebenso für eine selektive Verstärkung von Signalen bei unterschiedlichen Frequenzen oder innerhalb Nutzer-bestimmter Durchlassbereichen angewendet werden. Ein selektives Verstärken von Signalen in Durchgangsbereichen kann bei Radar, Sonar und Zwei-Wege-Radio-Kommunikationssystemen angewendet werden.
  • Der Fachmann wird bevorzugen, dass in einer alternativen Ausführungsform das Tiefpass-Filtern anstelle eines Bandpass-Filters verwendet werden kann, wodurch Frequenzspektrum-Segmente selektiv gefiltert werden, wobei das Ergebnis eine Feststellung ist, ob ein Rauschen vorhanden ist oder nicht. Ein Beispiel eines Bandpass-Filters wäre ein Filter, welcher selektiv Audiosignale zwischen etwa 100 Hz bis zu etwa 300 bis 400 Hz filtert.
  • In einer Ausführungsform wurden die folgenden Schwellenwerte verwendet:
    • a. Von den Familienmitgliedern von Gleichung (3) SP ONLY THR = 0,3; NS_SP_THR = 0,5 und NS_THR = 0,7.
    • b. Von Familienmitgliedern aus Gleichung (4) a = 0,6, b = 0,3, Gmax = -30 dB, Gmin = 0 dB, NsFreq = 300 Hz, NsSpFreq = 250 Hz, SpNsFreq = 200 Hz und SpFreq = 150 Hz.
  • In einer alternativen Ausführungsform wird das von dem Tiefpassfilter 15 oder einer anderen Filtereinrichtung ausgeführte Filtern durch eine analoge Schaltkreiseinrichtung durchgeführt, welche dem Elektronik-Fachmann gut bekannt ist. Solche Filter können entweder passiv oder aktiv sein.
  • Der Windgeräusch-Erkennungsschaltkreis 65 kann alternativ unter Verwendung von Operationsverstärkern umgesetzt werden, um entweder eine Differenz oder ein Verhältnis zwischen den Energieniveaus des Signals vom Filter 15 zu dem Eingangssignal 30 zu berechnen. Ebenso kann die Windgeräusch-Wahrscheinlichkeits-Klassifizierung 50 unter Verwendung analoger Operationsverstärker umgesetzt werden, um Signale zu einem Array von aktiven Filtern auszugeben, welche eine analoge Version des adaptiven Windgeräusch-Überdeckungsfilters 45 bilden.
  • In einer Analogeinrichtung-Umgebung kann der Fast-Fourier-Transformations-Berechner 35 durch ein Array von Frequenzselektiven aktiven Filtern ersetzt werden, von denen jeder dazu ausgebildet ist, Abschnitte des Spektrums des Eingangssignales 30 selektiv zu verstärken.
  • Die vorangegangene Beschreibung dient lediglich Zwecken der Darstellung. Der tatsächliche Umfang der Erfindung ist durch die beigefügten Ansprüche definiert.

Claims (20)

  1. Verfahren zur Unterdrückung von Rauschen in einem Audiosignal (30), umfassend: Erzeugen einer Rausch-Wahrscheinlichkeits-Klassifizierung (50) durch Berechnen eines geglätteten Energieverhältnisses auf Grundlage eines Eingangssignales, wobei das geglättete Energieverhältnis eine Rausch-Wahrscheinlichkeit darstellt; und adaptives Überdecken des Rauschens durch: Auswählen eines Referenzfilters (60) auf Grundlage der Rausch-Wahrscheinlichkeits-Klassifizierung (50), und Anwenden des ausgewählten Referenz-Filters (60) an dem Eingangssignal, um ein Ausgangssignal zu erzeugen, weiterhin umfassend einen der folgenden Schritte: a) Verwenden verschiedener Glättungs-Koeffizienten, um das geglättete Energieverhältnis zu berechnen, und zwar auf Grundlage wenigstens einer Art von Rausch-Wahrscheinlichkeits-Klassifizierungs-Übergang, ausgewählt von: einem Sprache-zu-Rauschen-Übergang; und einem Rauschen-zu-Sprache-Übergang b) Verwenden verschiedener Werte für einen Glättungskoeffizienten, um eine geglättete Verstärkung für jeden Referenzfilter einer Mehrzahl von Referenzfiltern, aus der der Referenzfilter ausgewählt wird, zu berechnen, und zwar auf der Grundlage wenigstens einer Art von einem Rausch-Wahrscheinlichkeits-Klassifizierungs-Übergang, ausgewählt von: einem Sprache-zu-Rauschen-Übergang; und einem Rauschen-zu-Sprache-Übergang, c) Verwenden verschiedener Glättungskoeffizienten, um eine geglättete Zwangsfrequenz jedes Referenzfilters einer Mehrzahl von Referenzfiltern, aus der der Referenzfilter ausgewählt wird, zu berechnen, und zwar auf der Grundlage wenigstens einer Art von Rausch-Wahrscheinlichkeits-Klassifizierungs-Übergang, ausgewählt von: einem Sprache-zu-Rauschen-Übergang; und einem Rauschen-zu-Sprache-Übergang.
  2. Verfahren nach Anspruch 1, wobei der Schritt des Erzeugens einer Rausch-Wahrscheinlichkeits-Klassifizierung (50) weiterhin umfasst: Filtern des Eingangssignales, um einen gefilterten Abschnitt des Signals bereitzustellen; Vergleichen einer Beziehung zwischen dem Eingangssignal und dem gefilterten Abschnitt des Signals mit einer Mehrzahl an Schwellenwerten.
  3. Verfahren nach Anspruch 1, wobei die Rausch-Wahrscheinlichkeits-Klassifizierung (50)auf Grundlage eines Vergleichs mit Schwellenwerten identifiziert wird.
  4. Verfahren nach Anspruch 3, wobei der Wert jedes Schwellenwertes der Mehrzahl von Schwellenwerten vorbestimmt wird.
  5. Verfahren nach Anspruch 1, wobei der Referenzfilter aus einer Mehrzahl von Referenzfiltern (60) ausgewählt wird.
  6. Verfahren nach Anspruch 5, wobei jeder Filter von der Mehrzahl von Referenzfiltern (60) wahlweise eine oder mehrere entsprechende Zwangsfrequenzen und eine oder mehrere entsprechende Verstärkungen aufweist.
  7. Verfahren nach Anspruch 5, weiterhin umfassend den Schritt des Glättens der einen oder mehreren entsprechenden Verstärkungen jedes Referenzfilters.
  8. Verfahren nach Anspruch 6, weiterhin umfassend den Schritt des Glättens einer Frequenzantwort jedes Referenzfilters.
  9. Verfahren nach Anspruch 1, weiterhin umfassend den Schritt des Auswählens einer Mehrzahl von Zwangsfrequenzen für eine entsprechende Anzahl von Referenzfiltern.
  10. Verfahren nach Anspruch 5, weiterhin umfassend den Schritt des Änderns einer Frequenzantwort der Referenzfilter auf Grundlage einer ausgewählten Verstärkung.
  11. Verfahren nach Anspruch 5, weiterhin umfassend den Schritt des Änderns einer Frequenzantwort der Referenzfilter auf Grundlage einer oder mehrerer Verstärkungen und einer oder mehrerer Zwangsfrequenzen.
  12. Verfahren nach Anspruch 5, weiterhin umfassend den Schritt: Separates Ändern einer Frequenzantwort oberhalb und unterhalb einer Zwangsfrequenz auf Grundlage einer ausgewählten Verstärkung.
  13. Vorrichtung, umfassend: Einen Prozessor; und eine mit dem Prozessor gekoppelte Speichereinrichtung, wobei die Speichereinrichtung Programmanweisungen speichert, welche bei Ausführung durch den Prozessor den Prozessor dazu bringen: eine Rausch-Wahrscheinlichkeits-Klassifizierung (50) zu erzeugen, und zwar durch Berechnen eines geglätteten Energieverhältnisses auf Grundlage eines Eingangssignales, wobei das geglättete Energieverhältnis eine Rausch-Wahrscheinlichkeit darstellt; und das Rauschen adaptiv zu überdecken durch: Auswählen eines Referenzfilters (60) auf Grundlage der Rausch-Wahrscheinlichkeits-Klassifizierung (50), und Anwenden des ausgewählten Referenzfilters (60) an dem Eingangssignal, um ein Ausgangssignal zu erzeugen; eine Speichereinrichtung mit Programmanweisungen, welche bei Ausführung durch den Prozessor den Prozessor dazu bringen: Verschiedene Glättungskoeffizienten zu verwenden, (a) um das geglättete Energieverhältnis zu berechnen, (b) um eine geglättete Verstärkung für jeden Filter von einer Mehrzahl von Referenzfiltern, aus der der Referenzfilter ausgewählt wird, zu berechnen, oder (c) um eine geglättete Zwangsfrequenz jedes Filters einer Mehrzahl von Referenzfiltern, aus der der Referenzfilter ausgewählt wird, zu berechnen, und zwar auf Grundlage wenigstens einer Art von Rausch-Wahrscheinlichkeits-Klassifizierungs-Übergang, ausgewählt von: einem Sprache-zu-Rauschen-Übergang; und einem Rauschen-zu-Sprache-Übergang.
  14. Vorrichtung nach Anspruch 13, wobei der ausgewählte Referenzfilter (60) dazu ausgebildet ist, Signale in einem Frequenzbereich wahlweise abzuschwächen, wobei die abgeschwächten Signale Rauschsignale umfassen.
  15. Vorrichtung nach Anspruch 13, weiterhin umfassend eine Speichereinrichtung mit Programmanweisungen, welche bei Ausführung den Prozessor dazu bringen, eine Rausch-Wahrscheinlichkeits-Klassifizierung zu erzeugen, welche weiterhin umfasst: Filtern des Eingangssignales, um einen gefilterten Abschnitt des Signals bereitzustellen; Vergleichen einer Beziehung zwischen dem Eingangssignal und dem gefilterten Abschnitt des Signals mit einer Mehrzahl an Schwellenwerten.
  16. Vorrichtung nach Anspruch 13, weiterhin umfassend eine Speichereinrichtung mit Programmanweisungen, welche bei Ausführung den Prozessor dazu bringen, auf Grundlage eines Vergleiches mit den Schwellenwerten eine Rausch-Wahrscheinlichkeit zu klassifizieren.
  17. Vorrichtung nach Anspruch 13, weiterhin umfassend eine Speichereinrichtung mit Programmanweisungen, welche bei Ausführung den Prozessor dazu bringen, auf Grundlage eines Vergleiches mit vorbestimmten Schwellenwerten eine Rausch-Wahrscheinlichkeit zu klassifizieren.
  18. Vorrichtung nach Anspruch 13, weiterhin umfassend eine Speichereinrichtung mit Programmanweisungen, welche bei Ausführung den Prozessor dazu bringen, den Referenzfilter aus einer Mehrzahl von Referenzfiltern auszuwählen, wobei jeder Filter Signale in einem Frequenzbereich unterschiedlich abschwächt.
  19. Vorrichtung nach Anspruch 18, wobei jeder Referenzfilter wenigstens eine Zwangsfrequenz aufweist.
  20. Vorrichtung nach Anspruch 19, wobei jeder Referenzfilter eine vorbestimmte Frequenzantwort oberhalb und unterhalb der Zwangsfrequenz des Referenzfilters auf Grundlage einer ausgewählten Verstärkung aufweist.
DE112012000052.8T 2011-01-24 2012-01-23 Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen Active DE112012000052B4 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/012,062 2011-01-24
US13/012,062 US8983833B2 (en) 2011-01-24 2011-01-24 Method and apparatus for masking wind noise
PCT/US2012/022141 WO2012102977A1 (en) 2011-01-24 2012-01-23 Method and apparatus for masking wind noise

Publications (2)

Publication Number Publication Date
DE112012000052T5 DE112012000052T5 (de) 2013-05-16
DE112012000052B4 true DE112012000052B4 (de) 2022-08-18

Family

ID=45607372

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112012000052.8T Active DE112012000052B4 (de) 2011-01-24 2012-01-23 Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen

Country Status (5)

Country Link
US (1) US8983833B2 (de)
CN (1) CN103329201B (de)
BR (1) BR112013017017A2 (de)
DE (1) DE112012000052B4 (de)
WO (1) WO2012102977A1 (de)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5919647B2 (ja) * 2011-05-11 2016-05-18 富士通株式会社 風雑音抑圧装置、半導体集積回路及び風雑音抑圧方法
CN104508737B (zh) 2012-06-10 2017-12-05 纽昂斯通讯公司 用于具有多个声学区域的车载通信系统的噪声相关的信号处理
EP2859772B1 (de) * 2012-06-10 2018-12-19 Nuance Communications, Inc. Windgeräuscherkennung für wageninstallierte kommunikationssysteme mit mehreren akustischen zonen
KR101681188B1 (ko) 2012-12-28 2016-12-02 한국과학기술연구원 바람 소음 제거를 통한 음원 위치 추적 장치 및 그 방법
RU2658128C2 (ru) 2013-06-21 2018-06-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерации адаптивной формы спектра комфотного шума
DE112013007579B4 (de) * 2013-11-08 2024-11-14 General Electric Technology Gmbh Flüssigbrennstoffpatrone für eine Brennstoffdüse und Brennstoffdüse
DE102014204557A1 (de) * 2014-03-12 2015-09-17 Siemens Medical Instruments Pte. Ltd. Übertragung eines windreduzierten Signals mit verminderter Latenzzeit
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
JP6421313B2 (ja) * 2014-07-28 2018-11-14 株式会社オーディオテクニカ マイクロホン装置
CN104539819A (zh) * 2014-12-26 2015-04-22 贵州万臻时代通讯技术有限公司 一种抑制移动通信终端风噪声的方法
JP6556463B2 (ja) * 2015-03-02 2019-08-07 クラリオン株式会社 フィルタ生成装置、フィルタ生成方法およびフィルタ生成プログラム
US9330684B1 (en) 2015-03-27 2016-05-03 Continental Automotive Systems, Inc. Real-time wind buffet noise detection
CN105228054B (zh) * 2015-10-15 2019-07-05 深圳市大疆灵眸科技有限公司 飞行装置、拍摄装置及其录音降噪装置和方法
US9712348B1 (en) * 2016-01-15 2017-07-18 Avago Technologies General Ip (Singapore) Pte. Ltd. System, device, and method for shaping transmit noise
CN105957536B (zh) * 2016-04-25 2019-11-12 深圳永顺智信息科技有限公司 基于通道聚合度频域回声消除方法
US9838737B2 (en) 2016-05-05 2017-12-05 Google Inc. Filtering wind noises in video content
US9838815B1 (en) * 2016-06-01 2017-12-05 Qualcomm Incorporated Suppressing or reducing effects of wind turbulence
US10462567B2 (en) 2016-10-11 2019-10-29 Ford Global Technologies, Llc Responding to HVAC-induced vehicle microphone buffeting
US10186260B2 (en) * 2017-05-31 2019-01-22 Ford Global Technologies, Llc Systems and methods for vehicle automatic speech recognition error detection
CN107180627B (zh) * 2017-06-22 2020-10-09 潍坊歌尔微电子有限公司 去除噪声的方法和装置
US10525921B2 (en) 2017-08-10 2020-01-07 Ford Global Technologies, Llc Monitoring windshield vibrations for vehicle collision detection
US10562449B2 (en) 2017-09-25 2020-02-18 Ford Global Technologies, Llc Accelerometer-based external sound monitoring during low speed maneuvers
US10479300B2 (en) 2017-10-06 2019-11-19 Ford Global Technologies, Llc Monitoring of vehicle window vibrations for voice-command recognition
CN108564963B (zh) * 2018-04-23 2019-10-18 百度在线网络技术(北京)有限公司 用于增强语音的方法和装置
GB201814408D0 (en) * 2018-09-05 2018-10-17 Calrec Audio Ltd A method and apparatus for processing an audio signal stream to attenuate an unwanted signal portion
FR3086451B1 (fr) * 2018-09-20 2021-04-30 Sagemcom Broadband Sas Filtrage d'un signal sonore acquis par un systeme de reconnaissance vocale
CN110364175B (zh) * 2019-08-20 2022-02-18 北京凌声芯语音科技有限公司 语音增强方法及系统、通话设备
US11217221B2 (en) * 2019-10-03 2022-01-04 GM Global Technology Operations LLC Automotive noise mitigation
CN111277718B (zh) * 2020-01-21 2021-10-08 上海推乐信息技术服务有限公司 一种回声消除系统及其方法
TWI779261B (zh) 2020-01-22 2022-10-01 仁寶電腦工業股份有限公司 風切濾波裝置
CN112802486B (zh) * 2020-12-29 2023-02-14 紫光展锐(重庆)科技有限公司 一种噪声抑制方法、装置及电子设备
US11404061B1 (en) * 2021-01-11 2022-08-02 Ford Global Technologies, Llc Speech filtering for masks
US11490198B1 (en) * 2021-07-26 2022-11-01 Cirrus Logic, Inc. Single-microphone wind detection for audio device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1750483A1 (de) 2005-08-02 2007-02-07 GN ReSound A/S Hörhilfegerät mit Windgeräuschunterdrückung

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5867581A (en) * 1994-10-14 1999-02-02 Matsushita Electric Industrial Co., Ltd. Hearing aid
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6529868B1 (en) * 2000-03-28 2003-03-04 Tellabs Operations, Inc. Communication system noise cancellation power signal calculation techniques
US6959056B2 (en) * 2000-06-09 2005-10-25 Bell Canada RFI canceller using narrowband and wideband noise estimators
WO2003076889A1 (en) * 2002-03-08 2003-09-18 Koninklijke Kpn N.V. Method and system for measuring a system's transmission quality
US20040148160A1 (en) * 2003-01-23 2004-07-29 Tenkasi Ramabadran Method and apparatus for noise suppression within a distributed speech recognition system
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7127076B2 (en) * 2003-03-03 2006-10-24 Phonak Ag Method for manufacturing acoustical devices and for reducing especially wind disturbances
JP4739219B2 (ja) * 2003-10-16 2011-08-03 エヌエックスピー ビー ヴィ 適応ノイズ下限トラッキングを伴う音声動作検出
US7216811B2 (en) * 2004-04-16 2007-05-15 Microscan Systems Incorporated Barcode scanner with linear automatic gain control (AGC), modulation transfer function detector, and selectable noise filter
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US20080243496A1 (en) * 2005-01-21 2008-10-02 Matsushita Electric Industrial Co., Ltd. Band Division Noise Suppressor and Band Division Noise Suppressing Method
KR101118217B1 (ko) * 2005-04-19 2012-03-16 삼성전자주식회사 오디오 데이터 처리 장치 및 방법
US7774396B2 (en) * 2005-11-18 2010-08-10 Dynamic Hearing Pty Ltd Method and device for low delay processing
US7844453B2 (en) * 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
JP5056157B2 (ja) * 2007-05-18 2012-10-24 ソニー株式会社 ノイズ低減回路
US20090010453A1 (en) * 2007-07-02 2009-01-08 Motorola, Inc. Intelligent gradient noise reduction system
US8712762B2 (en) * 2007-07-27 2014-04-29 Vereniging Voor Christelijk Hoger Onderwijs, Wetenschappelijk Onderzoek En Patiëntenzor Noise suppression in speech signals
US8184816B2 (en) * 2008-03-18 2012-05-22 Qualcomm Incorporated Systems and methods for detecting wind noise using multiple audio sources
US9767817B2 (en) * 2008-05-14 2017-09-19 Sony Corporation Adaptively filtering a microphone signal responsive to vibration sensed in a user's face while speaking
ES2582232T3 (es) * 2008-06-30 2016-09-09 Dolby Laboratories Licensing Corporation Detector de actividad de voz de múltiples micrófonos
US8515097B2 (en) * 2008-07-25 2013-08-20 Broadcom Corporation Single microphone wind noise suppression
JP5298769B2 (ja) * 2008-10-27 2013-09-25 ヤマハ株式会社 雑音推定装置、通話装置および雑音推定方法
JP5439118B2 (ja) * 2008-11-14 2014-03-12 パナソニック株式会社 騒音制御装置
US8873769B2 (en) * 2008-12-05 2014-10-28 Invensense, Inc. Wind noise detection method and system
JP5214824B2 (ja) * 2009-07-15 2013-06-19 ヴェーデクス・アクティーセルスカプ 補聴器システムにおける適応的風切音抑制のための方法および処理ユニットならびに補聴器システム
US8571231B2 (en) * 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
KR101737824B1 (ko) * 2009-12-16 2017-05-19 삼성전자주식회사 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
EP2765787B1 (de) * 2013-02-07 2019-12-11 Sennheiser Communications A/S Verfahren zur Reduzierung von nicht korreliertem Rauschen in einer Audioverarbeitungsvorrichtung

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1750483A1 (de) 2005-08-02 2007-02-07 GN ReSound A/S Hörhilfegerät mit Windgeräuschunterdrückung

Also Published As

Publication number Publication date
BR112013017017A2 (pt) 2019-09-24
WO2012102977A1 (en) 2012-08-02
CN103329201A (zh) 2013-09-25
US8983833B2 (en) 2015-03-17
CN103329201B (zh) 2015-11-25
DE112012000052T5 (de) 2013-05-16
US20120191447A1 (en) 2012-07-26

Similar Documents

Publication Publication Date Title
DE112012000052B4 (de) Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen
DE112009000805B4 (de) Rauschreduktion
DE112011104737B4 (de) Geräuschunterdrückungsvorrichtung
DE69428119T2 (de) Verringerung des hintergrundrauschens zur sprachverbesserung
EP0912974B1 (de) Verfahren zur verringerung von störungen eines sprachsignals
DE112012005855B4 (de) Störungsunterdrückungsvorrichtung
DE60034212T2 (de) Verfahren und vorrichtung zur adaptiven rauschunterdrückung
DE112010005895B4 (de) Störungsunterdrückungsvorrichtung
EP1919257B1 (de) Pegelabhängige Geräuschreduktion
DE112011105791B4 (de) Störungsunterdrückungsvorrichtung
DE10017646A1 (de) Geräuschunterdrückung im Zeitbereich
DE112012005782T5 (de) Nachhallunterdrückungsvorrichtung
DE112011106045B4 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
DE102015207706B3 (de) Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals
EP3565270B1 (de) Verfahren zur rauschunterdrückung in einem audiosignal
DE102014221528B4 (de) Akkurate Vorwärts-SNR-Schätzung basierend auf MMSE-Sprachpräsenzwahrscheinlichkeit
DE102013011761A1 (de) Kraftfahrzeug mit einer Freisprecheinrichtung und Verfahren zur Erzeugung eines Frequenzganges für Freisprecheinrichtungen
DE112016004394T5 (de) Heulunterdrückungsvorrichtung
DE112018003662T5 (de) Sprachsignalnivellierung
EP3818727B1 (de) Vorrichtung und verfahren zur modifizierung eines lautsprechersignals zur vermeidung einer membranüberauslenkung
EP2080197B1 (de) Vorrichtung zur geräuschunterdrückung bei einem audiosignal
DE102018117557B4 (de) Adaptives nachfiltern
DE102018117558A1 (de) Adaptives nachfiltern
DE10137348A1 (de) Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen
DE102019102414B4 (de) Verfahren und System zur Detektion von Reibelauten in Sprachsignalen

Legal Events

Date Code Title Description
R082 Change of representative

Representative=s name: BONN, ROMAN, DIPL.-ING. DR.-ING., DE

R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0021020000

Ipc: G10L0021020800

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final