JP3936819B2 - Microphone system - Google Patents
Microphone system Download PDFInfo
- Publication number
- JP3936819B2 JP3936819B2 JP12151899A JP12151899A JP3936819B2 JP 3936819 B2 JP3936819 B2 JP 3936819B2 JP 12151899 A JP12151899 A JP 12151899A JP 12151899 A JP12151899 A JP 12151899A JP 3936819 B2 JP3936819 B2 JP 3936819B2
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- signal
- microphones
- noise
- adaptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
【0001】
【発明の属する技術分野】
本発明はマイクロホンシステムに係わり、特に、2つマイクロホンの出力信号を用いて適応信号処理を行いSN比を改善した話者音声信号を出力するマイクロホンシステムに関する。
【0002】
【従来の技術】
現在の音声認識システムは、15dB以上のSN比(S:音声/N:ノイズ)が確保されている場合、約95%の認識率を実現できるくらいの技術レベルにまで達している。しかし、周囲に存在するノイズによりSN比が低下すると、それに伴って認識率が急激に低下する性質も有している。図8はSN比と認識性能との関係をいくつかの種類のマイクロホン(無指向性、単一指向性、狭指向性、AMNOR(Adaptive Microphone-array for Noise Reduction))について評価したもので、SN比と認識率がおおむねS字特性100を示す帯の中に包含されている。この図8から明らかなように、認識率はSN比の低下により急激に低下し、SN比が0dBの環境下において約50%にまで低下してしまう。
【0003】
そのため、自動車が発生するノイズ(エンジン音・ロードノイズ・パターンノイズ・風切り音など)が存在する自動車車室内において、上記のような認識性能の劣化は避けられず、音声認識システムを車載化する上で大きな問題の一つとなっている。
前記したような事情から、周囲に存在するノイズの影響を少なくし、高いSN比で音声を受音するための方式が種々提案されており、複数のマイクロホンとディジタル信号処理を用いた高SN比受音システムはその一例である。かかる高SN比受音システムの中で最も簡単な構成のものは図9に示すように2つのマイクロホンを使用するシステムであるが、他にも、Griffith-Jim型アレイやAMNORといった、より高度なシステムが提案されている。
【0004】
図9において、1,2は第1、第2のマイクロホン、3は適応信号処理部であり、誤差信号eが入力されると共にマイクロホン2の出力信号x2が参照信号として入力され、誤差信号eのパワーが最小となるようにLMS(Least Mean Square)アルゴリズムに基づいて適応信号処理を行う。適応信号処理部3において、3aはLMS演算部、3bは例えばFIR型デジタルフィルタ構成の適応フィルタである。LMS演算部3aは適応信号処理により誤差信号eのパワーが最小となるように適応フィルタ3bの係数を決定する。
【0005】
4はマイクロホン1から出力されるノイズ信号を目標信号として入力される目標応答設定部であり、音響系の逆特性を精度よく近似するためのものである。適応フィルタ3bのタップ長の半分の信号遅延時間をdとするとき、目標応答設定部4は該時間dの遅延特性を有し、オーディオ周波数帯域でフラットな特性(ゲイン1の特性)を有する。すなわち、目標応答設定部4は、図10(a)に示すようにゲイン1のフラットな周波数特性を備え、図10(b)に示すように遅延時間dを有するインパルス応答特性を有している。この目標応答設定部4は、FIR型デジタルフィルタの遅延時間dに対応する係数を1にし、他の係数を0にすることにより実現できる。
5は減算部であり、目標応答設定部4から出力する目標応答より適応フィルタ3bの出力信号を減算して誤差信号eを出力する。
【0006】
非音声認識時、マイクロホン1、2にはノイズのみが入力し、適応信号処理部3は適応信号処理により誤差信号e、すなわち、ノイズ出力のパワーが最小となるようにフィルタ係数Wを決定する。一方、音声認識時には、適応信号処理部3はフィルタ係数の更新をせず、前記非音声認識時に決定したフィルタ係数Wを適応フィルタ3bに設定して音声信号を出力する。
図9に示すシステムに本来求められている理想的な性能は、音声認識時に出力信号として音声信号Xs(z)のみ(ノイズ出力は0)を出力することである。すなわち、ノイズ出力En(z)に関して、
En(z)=Xn1(z)z-d−Xn2(z)W(z) (1)
{En(z)}2の平均が最小値をとるように調整可能なパラメータ(適応フィルタ3bの係数)Wを決定することである。ただし、Xn1(z),Xn2(z)はマイクロホン1、2の出力信号に含まれるノイズ信号である。
【0007】
【発明が解決しようとする課題】
自動車には騒音源が多数存在するため、マイクロホン1,2が拾う自動車車室内ノイズのコヒーレンスは、マイクロホン1,2を遠ざけるにしたがって低下する傾向を有している。このため、2つのマイクロホン1,2を遠ざける程、(1)式の条件が満たされにくくなってしまう問題が生じ、マイクロホン1,2はできるだけ近い位置に配置する必要がある。
ところが、2つのマイクロホン1,2をできるだけ近い位置に配置すると、2つのマイクロホンにほぼ同様の音声とノイズがそれぞれ入射する可能性が高くなり、(1)式を満たすように適応フィルタ係数Wを決定してノイズを消去すると、音声までもが消去されてしまう。一方、音声が歪まないように適応フィルタ係数Wを決定すると、ノイズがほとんど消えず、SN比もほとんど改善されなくなってしまうという問題が発生する。
【0008】
かかる問題は、図9に示したシステム特有のものではなく、Griffith-Jim型アレイやAMNORといった、より高度な高SN比受音システムを採用した場合でも、ほぼ同様に発生する。
以上から本発明の目的は、マイクロホンを2つ使用する図9のマイクロホンシステムにおいて、音声信号のSN比を改善できるようにすることである。
【0009】
【課題を解決するための手段】
上記課題は本発明によれば、第1、第2の2つのマイクロホンと、第1のマイクロホンから出力される信号を入力されて目標信号を出力する目標信号出力部と、第2のマイクロホンから出力される信号を参照信号として入力されて適応信号処理を行う適応信号処理部と、適応信号処理部を構成する適応フィルタの出力信号と前記目標信号との差を出力する誤差信号発生部とを備えた車載のマイクロホンシステムにおいて、前記第1、第2のマイクロホンを接近して配置すると共に、第1のマイクロホンを話者の顔の真上車室天井に配置し、前記第2のマイクロホンを該第1のマイクロホンの位置より1〜5cm程度後頭部側の車室天井に離して配置することにより、第1のマイクロホンは第2のマイクロホンに比べて話者音声が大きく、かつ該話者音声に対する自動車内の話者音声以外の雑音が少なくなるようにし、第2のマイクロホンは第1のマイクロホンに比べて話者音声が小さく、かつ該話者音声に対する自動車内の話者音声以外の雑音が大きくなるようにし、前記適応信号処理部は、前記第1、第2のマイクロホンにノイズのみが入力する非音声認識時、適応信号処理により前記誤差信号発生部から出力する誤差信号のパワーが最小となるように前記適応フィルタの係数を決定し、前記第1、第2のマイクロホンにノイズと音声信号が入力する音声認識時、該適応フィルタの係数を更新せず、前記誤差信号を音声信号として出力することにより達成される。
このようにすれば、2つのマイクロホンの出力信号に含まれるノイズXn1(z),Xn2(z)を略等しくでき、一方、2つのマイクロホンの出力信号に含まれる音声信号Xs1(z),Xs2(z)を異ならせることができる。従って、ノイズ信号入力時のEn(z)の2乗平均値が最小となるように適応フィルタ係数Wを決定しても、(2)式の音声出力Es(z)は零とならず、音声信号のSN比を改善することができる。
【0010】
マイクロホンの具体的な配置例としては、一方のマイクロホンを話者の顔の真上に配置し、他方のマイクロホンを該一方のマイクロホンの位置より1〜5cm程度後頭部側に離して配置する。このようにすれば、人間の音声放射特性により、マイクロホンが比較的近距離に配置されているにも拘らず、1つのマイクロホンはできるだけ高いSN比で音声を拾い、もう一方のマイクロホンでは、できるだけ低いSN比で音声を拾うようにできる。
【0011】
【発明の実施の形態】
(a)マイクロホンシステムの構成
図1は本発明のマイクロホンシステムの構成図であり、図9のシステムと同一部分には同一符号を付している。図中、10は話者であり、例えば自動車の運転手、11,12は第1、第2のマイクロホンである。第1のマイクロホン11は話者の顔の真上天井に配置し、第2のマイクロホン12は第1のマイクロホン位置より1〜5cm程度後頭部側の天井に配置する。
3は適応信号処理部で、誤差信号eが入力されると共にマイクロホン2の出力信号x2が参照信号として入力され、誤差信号eのパワーが最小となるようにLMSアルゴリズムに基づいて適応信号処理を行う。適応信号処理部3において、3aはLMS演算部、3bはFIR型デジタルフィルタ構成の適応フィルタである。LMS演算部3aは適応信号処理により誤差信号eのパワーが最小となるように適応フィルタ3bの係数を決定する。適応信号処理部3は、非音声認識時においてのみ適応信号処理により適応フィルタ3bのフィルタ係数Wを決定し、音声認識時にはフィルタ係数の更新をせず、前記非音声認識時に決定したフィルタ係数Wを適応フィルタ3bに設定する。
4はマイクロホン11から出力する信号を目標信号として入力される目標応答設定部で、時間dの遅延特性を有し、かつ、オーディオ周波数帯域でフラットな特性(ゲイン1の特性)を有している。5は減算部で、目標応答設定部4から出力する目標応答より適応フィルタ3bの出力信号を減算して誤差信号eを出力する。
【0012】
(b)人間の音声放射特性
図2は人間の音声放射特性であり、(a)は話者10の口元を含む水平面において口元から所定距離の位置における音声レベルを周波数毎に示す放射特性図、(b)は話者10の口元を含む垂直面において口元から所定距離の位置における音声レベルを周波数毎に示す放射特性図である。図中、Aは125Hz〜250Hz、Bは500Hz〜700Hz、Cは1400Hz〜2000Hz、Dは4000Hz〜5600Hzの特性である。この放射特性図より明らかなように、人間が発生する音声は、話者正面方向に最も強く放射され、上方や下方、及び左右方向に放射される音声のパワーは、話者正面方向に比べて小さい。
それゆえ、図1のように第1のマイクロホン11を話者の顔の真上天井に配置し、第2のマイクロホン12を第1のマイクロホン位置より1〜5cm程度後頭部側の天井に配置すれば、▲1▼2つのマイクロホン11,12で受音するノイズのパワーをほぼ同一にできる一方、▲2▼2つのマイクロホン11,12で受音する音声パワーを異ならせることができる。すなわち、2つのマイクロホン11,12の出力信号に含まれるノイズXn1(z),Xn2(z)を略等しくできると共に、2つのマイクロホン11,12の出力信号に含まれる音声信号Xs1(z),Xs2(z)を異ならせることができ、[Xn1(z)/Xn2(z)]≠[Xs1(z)/Xs2(z)]とすることが可能である。
【0013】
(c)動作
マイクロホン11、12にノイズのみが入力する非音声認識時において、適応信号処理部3は適応信号処理により次式
En(z)=Xn1(z)z-d−Xn2(z)W(z) (1)
において、{En(z)}2の平均値が最小となるように適応フィルタ3bのフィルタ係数Wを決定する。
一方、音声認識時、適応信号処理部3はフィルタ係数の更新をせず、前記非音声認識時に決定したフィルタ係数Wを適応フィルタ3bに設定して音声信号を出力する。この場合、マイクロホン11,12の出力に含まれる音声信号Xs1(z),
Xs2(z)は異なり、[Xn1(z)/Xn2(z)]≠[Xs1(z)/Xs2(z)]となるため、次式
Es(z)=Xs1(z)z-d−Xs2(z)W(z) (2)
により求まる音声出力Es(z)は最小値には(ノイズと異なり、あまり小さくは)ならない。
以上より、(1)式のノイズ出力En(z)のパワーが0となるように適応フィルタ係数Wを決定しても、(2)式の音声出力Es(z)はノイズと同様に小さくはならず、音声信号のSN比を改善することができる。
【0014】
以上要約すれば、図1に示すように、マイクロホン11,12を比較的近距離に配置することで2つのマイクロホンが出力するノイズ間のコヒーレンスの低下を少なくし、更に、図2に示すような人間の音声放射特性を考慮することで、マイクロホン11,12が比較的近距離に配置されているにも拘らず、1つのマイクロホン11はできるだけ高いSN比で音声を拾い、もう一方のマイクロホン12では、できるだけ低いSN比で音声を拾う。この結果、ノイズ出力が零となるように適応フィルタ係数Wを決定しても、音声出力はノイズと同様に小さくはならず、音声信号のSN比を改善することができる。
【0015】
(d)マイクロホン位置とSN比改善量の検討
図2の放射特性より人間が発声し空間に放射した音声は、後頭部側で特に大きく減衰し、正面に放射される音声に比べてレベルが小さくなることがわかる。それゆえ、本発明のマイクロホンシステムは、図1に示したように人間の頭部真上付近から後頭部側にかけて設置するのが基本であり、このように第1、第2のマイクロホン11、12を設置することによりSN比をより大きく改善することができる。
図3はペアマイクロホン位置の説明図、図4は図3の各ペアマイクロホン位置におけるSN比改善量を示す図である。図3に示すように、3cm間隔のペアマイクロホン11,12を複数の位置▲1▼,▲2▼,▲3▼に設置し、それぞれのSN比の改善量(どの程度SN比が向上するか)を、1500ccの乗用車(セダン)で調べてみると、図4に示す結果が得られた。この図4より、ペアマイクロホン11,12を▲1▼の位置に設置したとき、すなわち、「1つのマイクロホンを話者10の顔のほぼ真上に設置し、もう1つのマイクロホンを少し離して後頭部側に配置したとき」にSN比の改善量が最も高くなることがわかる。
【0016】
図5はペアマイクロホン間隔の説明図、図6は図5の各ペアマイクロホン間隔におけるSN比改善量を示す図である。図5に示すように、第1のマイクロホン11を話者10の顔のほぼ真上に固定し、第2のマイクロホン12を後頭部側にそれぞれ3cm,6cm,9cm,12cm離して配置し、最適なマイクロホンの間隔について調べてみると、図6に示す結果が得られた。この図6より、2つのマイクロホン11,12の間隔が狭いほど、SN比の改善量は高いと考えられる。しかし、図1に示したシステムでは、間隔を0cmとするとノイズを完全に消去できるが、音声もまた完全に消去してしまう。このため、音声受音システムとして機能しないことになる。また、小型マイクロホンといえどもそれ自体の大きさがあるため、マイクロホンどうしを完全にくっつけても、マイクロホンの中心間間隔は1cm程度より小さくはならない。それゆえ、マイクロホンの間隔は、車種の違いとマイクロホンの大きさにより若干の幅があるものの、せいぜい1〜5cm程度にするのがよい。
【0017】
図7は発声者別のSN比改善量説明図である。この図7より明らかなように、本発明のマイクロホンシステムでは、人の違いによる性能(SN比改善量)のばらつきは1dB程度であり、話者の違いによる影響は少ない。
以上2つのマイクロホンを話者の頭上に配置した場合について説明したが、2つのマイクロホンを比較的近距離に配置し、1つのマイクロホンにより、できるだけ高いSN比で音声を拾い、もう一方のマイクロホンにより、できるだけ低いSN比で音声を拾うようにできれば、配置位置は頭上に限らない。
以上、本発明を実施例により説明したが、本発明は請求の範囲に記載した本発明の主旨に従い種々の変形が可能であり、本発明はこれらを排除するものではない。
【0018】
【発明の効果】
以上本発明によれば、各マイクロホンを接近して配置すると共に、一方のマイクロホンから出力する信号のSN比を高くし、他方のマイクロホンから出力する信号のSN比を低くするようにしたから、ノイズ出力が最小となるように適応フィルタ係数を決定しても、音声出力は零とならず、音声信号のSN比を改善することができる。すなわち、少ないマイクロホン数であるにも拘らず、高いSN比で音声を受音出力することができる。
又、本発明によれば、一方のマイクロホンを話者の顔の真上天井に配置し、他方のマイクロホンを該一方のマイクロホンの位置より1〜5cm程度後頭部側に離して配置することにより、マイクロホンが比較的近距離に配置されているにも拘らず、1つのマイクロホンはできるだけ高いSN比で音声を拾い、もう一方のマイクロホンでは、できるだけ低いSN比で音声を拾うようにできる。
【図面の簡単な説明】
【図1】本発明のマイクロホンシステムの構成図である。
【図2】人間の音声放射特性図である。
【図3】ペアマイクロホンの位置説明図である。
【図4】ペアマイクロホン位置とSN比改善量の関係図である。
【図5】ペアマイクロホンの間隔説明図である。
【図6】ペアマイクロホンの間隔とSN比改善量の関係図である。
【図7】発声者別SN比改善量説明図である。
【図8】 SN比と認識率の関係図である。
【図9】従来のマイクロホンを2つ使用した場合の高SN比受音システムである。
【図10】目標応答設定部の特性図である。
【符号の説明】
11,12・・第1、第2のマイクロホン
3・・適応信号処理部
3a・・LMS演算部
3b・・適応フィルタ
4・・目標応答設定部
5・・減算部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a microphone system, and more particularly to a microphone system that outputs a speaker voice signal with an improved SN ratio by performing adaptive signal processing using output signals of two microphones.
[0002]
[Prior art]
The current speech recognition system has reached a technical level that can achieve a recognition rate of about 95% when a signal-to-noise ratio (S: voice / N: noise) of 15 dB or more is secured. However, when the S / N ratio is reduced due to noise present in the surrounding area, the recognition rate is rapidly lowered. Fig. 8 shows the relationship between SN ratio and recognition performance for several types of microphones (omnidirectional, unidirectional, narrow directivity, AMNOR (Adaptive Microphone-array for Noise Reduction)). Ratios and recognition rates are generally contained within a band showing the S-
[0003]
For this reason, the above-mentioned deterioration in recognition performance is unavoidable in automobile interiors where noise generated by automobiles (engine noise, road noise, pattern noise, wind noise, etc.) is present, and a voice recognition system is mounted on the vehicle. It is one of the big problems.
In view of the circumstances described above, various methods have been proposed for receiving sound with a high S / N ratio while reducing the influence of surrounding noise, and a high S / N ratio using a plurality of microphones and digital signal processing has been proposed. A sound receiving system is an example. The simplest configuration of such a high S / N ratio receiving system is a system using two microphones as shown in FIG. 9, but other advanced systems such as Griffith-Jim type array and AMNOR are also used. A system has been proposed.
[0004]
9, 1 and 2 first, second microphone, 3 is an adaptive signal processing unit, the output signal x 2
[0005]
Reference numeral 4 denotes a target response setting unit that receives a noise signal output from the
A subtracting
[0006]
At the time of non-speech recognition, only noise is input to the
The ideal performance originally required for the system shown in FIG. 9 is to output only the speech signal Xs (z) (noise output is 0) as an output signal during speech recognition. That is, regarding the noise output En (z),
En (z) = Xn 1 (z) z -d −Xn 2 (z) W (z) (1)
It is to determine a parameter W (coefficient of the
[0007]
[Problems to be solved by the invention]
Since there are many noise sources in automobiles, the coherence of automobile interior noise picked up by the
However, if the two
[0008]
Such a problem is not unique to the system shown in FIG. 9, but occurs in a similar manner even when a more advanced high S / N ratio receiving system such as a Griffith-Jim type array or AMNOR is adopted.
From the above, an object of the present invention is to improve the S / N ratio of an audio signal in the microphone system of FIG. 9 using two microphones.
[0009]
[Means for Solving the Problems]
According to the present invention, the above-described problem is achieved by the first and second microphones, the target signal output unit that receives the signal output from the first microphone and outputs the target signal, and the output from the second microphone. An adaptive signal processing unit for performing adaptive signal processing by inputting the received signal as a reference signal, and an error signal generating unit for outputting a difference between the output signal of the adaptive filter constituting the adaptive signal processing unit and the target signal In the in-vehicle microphone system, the first and second microphones are disposed close to each other, the first microphone is disposed on the ceiling of the cabin directly above the speaker's face, and the second microphone is disposed on the first microphone. by spaced apart from the position of the first microphone in the
In this way, the noises Xn 1 (z) and Xn 2 (z) included in the output signals of the two microphones can be made substantially equal, while the audio signal Xs 1 (z) included in the output signals of the two microphones. , Xs 2 (z) can be made different. Therefore, even if the adaptive filter coefficient W is determined so that the root mean square value of En (z) at the time of noise signal input is minimized, the audio output Es (z) in equation (2) does not become zero, The signal-to-noise ratio of the signal can be improved.
[0010]
As a specific arrangement example of the microphone, one microphone is arranged right above the speaker's face, and the other microphone is arranged about 1 to 5 cm away from the position of the one microphone on the back of the head. In this way, due to the human sound radiation characteristics, one microphone picks up the sound with the highest possible signal-to-noise ratio, even though the microphones are located relatively close, and the other microphone has the lowest possible The sound can be picked up by SN ratio.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
(A) Configuration of Microphone System FIG. 1 is a configuration diagram of a microphone system according to the present invention, and the same components as those in the system of FIG. In the figure, 10 is a speaker, for example, a car driver, and 11 and 12 are first and second microphones. The
3 is adaptive signal processing unit, the output signal x 2
Reference numeral 4 denotes a target response setting unit which receives a signal output from the
[0012]
(B) Human voice radiation characteristics FIG. 2 shows human voice radiation characteristics, and (a) is a radiation characteristic chart showing the voice level at a predetermined distance from the mouth for each frequency on a horizontal plane including the mouth of the
Therefore, as shown in FIG. 1, the
[0013]
(C) At the time of non-speech recognition in which only noise is input to the operating
En (z) = Xn 1 (z) z -d −Xn 2 (z) W (z) (1)
, The filter coefficient W of the
On the other hand, at the time of speech recognition, the adaptive
Xs 2 (z) is different and [Xn 1 (z) / Xn 2 (z)] ≠ [Xs 1 (z) / Xs 2 (z)].
Es (z) = Xs 1 (z) z -d −Xs 2 (z) W (z) (2)
The audio output Es (z) obtained by the above does not become the minimum value (unlike noise, it is not so small).
From the above, even if the adaptive filter coefficient W is determined so that the power of the noise output En (z) in equation (1) is 0, the audio output Es (z) in equation (2) is not as small as noise. In other words, the S / N ratio of the audio signal can be improved.
[0014]
In summary, as shown in FIG. 1, by arranging the
[0015]
(D) Examination of microphone position and S / N ratio improvement amount The sound uttered by humans and radiated into the space from the radiation characteristics of FIG. 2 is particularly greatly attenuated on the back of the head, and the level becomes smaller than the sound radiated to the front. I understand that. Therefore, as shown in FIG. 1, the microphone system of the present invention is basically installed from near the human head to the back of the head. Thus, the first and
FIG. 3 is an explanatory diagram of the position of the pair microphone, and FIG. 4 is a diagram showing the SN ratio improvement amount at each pair microphone position of FIG. As shown in FIG. 3,
[0016]
FIG. 5 is an explanatory diagram of the pair microphone interval, and FIG. 6 is a diagram showing the SN ratio improvement amount at each pair microphone interval of FIG. As shown in FIG. 5, the
[0017]
FIG. 7 is an explanatory diagram of the SN ratio improvement amount for each speaker. As can be seen from FIG. 7, in the microphone system of the present invention, the variation in performance (SN ratio improvement amount) due to the difference between persons is about 1 dB, and the influence due to the difference between speakers is small.
The case where the two microphones are arranged above the speaker's head has been described above, but the two microphones are arranged at a relatively short distance, one microphone picks up the sound with the highest possible SN ratio, and the other microphone If the voice can be picked up with a signal-to-noise ratio as low as possible, the arrangement position is not limited to overhead.
The present invention has been described with reference to the embodiments. However, the present invention can be variously modified in accordance with the gist of the present invention described in the claims, and the present invention does not exclude these.
[0018]
【The invention's effect】
As described above, according to the present invention, the microphones are arranged close to each other, the SN ratio of the signal output from one microphone is increased, and the SN ratio of the signal output from the other microphone is decreased. Even if the adaptive filter coefficient is determined so that the output is minimized, the audio output does not become zero, and the SN ratio of the audio signal can be improved. That is, although the number of microphones is small, sound can be received and output with a high SN ratio.
Also, according to the present invention, one microphone is disposed on the ceiling directly above the speaker's face, and the other microphone is disposed about 1 to 5 cm away from the position of the one microphone on the back of the head, thereby Although one microphone is picked up with a signal-to-noise ratio as high as possible, one microphone can pick up sound with a signal-to-noise ratio as low as possible.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a microphone system of the present invention.
FIG. 2 is a human radiation characteristic diagram.
FIG. 3 is a diagram illustrating the position of a pair microphone.
FIG. 4 is a relationship diagram between a pair microphone position and an SN ratio improvement amount.
FIG. 5 is an explanatory diagram of a pair microphone interval;
FIG. 6 is a relationship diagram between a pair microphone interval and an SN ratio improvement amount.
FIG. 7 is an explanatory diagram of an SN ratio improvement amount for each speaker.
FIG. 8 is a relationship diagram between SN ratio and recognition rate.
FIG. 9 shows a high S / N ratio sound receiving system in the case of using two conventional microphones.
FIG. 10 is a characteristic diagram of a target response setting unit.
[Explanation of symbols]
11, 12... First and
Claims (1)
前記第1、第2のマイクロホンを接近して配置すると共に、第1のマイクロホンを話者の顔の真上車室天井に配置し、前記第2のマイクロホンを該第1のマイクロホンの位置より1〜5cm程度後頭部側の車室天井に離して配置することにより、第1のマイクロホンは第2のマイクロホンに比べて話者音声が大きく、かつ該話者音声に対する自動車内の話者音声以外の雑音が少なくなるようにし、第2のマイクロホンは第1のマイクロホンに比べて話者音声が小さく、かつ該話者音声に対する自動車内の話者音声以外の雑音が大きくなるようにし、
前記適応信号処理部は、前記第1、第2のマイクロホンにノイズのみが入力する非音声認識時、適応信号処理により前記誤差信号発生部から出力する誤差信号のパワーが最小となるように前記適応フィルタの係数を決定し、前記第1、第2のマイクロホンにノイズと音声信号が入力する音声認識時、該適応フィルタの係数を更新せず、前記誤差信号を音声信号として出力する、
ことを特徴とするマイクロホンシステム。The first and second microphones, a signal output from the first microphone, a target signal output unit that outputs a target signal, and a signal output from the second microphone are input as reference signals. In-vehicle microphone system comprising an adaptive signal processing unit that performs adaptive signal processing and an error signal generation unit that outputs a difference between an output signal of an adaptive filter that constitutes the adaptive signal processing unit and the target signal,
The first and second microphones are disposed close to each other, the first microphone is disposed on the ceiling of the passenger compartment and directly above the speaker's face, and the second microphone is positioned 1 from the position of the first microphone. By placing the first microphone about 5 cm away from the ceiling on the back of the passenger compartment , the first microphone has a louder speaker voice than the second microphone, and noise other than the speaker voice in the car relative to the speaker voice. The second microphone has a lower speaker voice than the first microphone, and a noise other than the speaker voice in the car corresponding to the speaker voice is increased.
The adaptive signal processing unit is adapted to minimize the power of the error signal output from the error signal generation unit by adaptive signal processing during non-speech recognition in which only noise is input to the first and second microphones. A coefficient of a filter is determined, and at the time of voice recognition in which noise and a voice signal are input to the first and second microphones, the error signal is output as a voice signal without updating the coefficient of the adaptive filter;
A microphone system characterized by this.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12151899A JP3936819B2 (en) | 1999-04-28 | 1999-04-28 | Microphone system |
US09/551,273 US7146013B1 (en) | 1999-04-28 | 2000-04-18 | Microphone system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12151899A JP3936819B2 (en) | 1999-04-28 | 1999-04-28 | Microphone system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000312396A JP2000312396A (en) | 2000-11-07 |
JP3936819B2 true JP3936819B2 (en) | 2007-06-27 |
Family
ID=14813211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP12151899A Expired - Fee Related JP3936819B2 (en) | 1999-04-28 | 1999-04-28 | Microphone system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3936819B2 (en) |
-
1999
- 1999-04-28 JP JP12151899A patent/JP3936819B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000312396A (en) | 2000-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9002028B2 (en) | Noisy environment communication enhancement system | |
EP1591995B1 (en) | Indoor communication system for a vehicular cabin | |
US7146013B1 (en) | Microphone system | |
CN103517185B (en) | Method for reducing noise in an acoustic signal of a multi-microphone audio device operating in a noisy environment | |
JP5913340B2 (en) | Multi-beam acoustic system | |
US9002027B2 (en) | Space-time noise reduction system for use in a vehicle and method of forming same | |
US5699436A (en) | Hands free noise canceling headset | |
US9992572B2 (en) | Dereverberation system for use in a signal processing apparatus | |
US8467551B2 (en) | Vehicular directional microphone assembly for preventing airflow encounter | |
US20080031468A1 (en) | System for improving communication in a room | |
US20220256267A1 (en) | Noise reduction device | |
CN113066468A (en) | Active noise interference elimination optimization device and method based on in-vehicle environment | |
JP2000312395A (en) | Microphone system | |
CN112673420A (en) | Silent zone generation | |
EP4439550A1 (en) | Active noise reduction method and device for vehicle and storage medium | |
JPH06110474A (en) | Noise eliminating device | |
JP3936819B2 (en) | Microphone system | |
JP5383008B2 (en) | Speech intelligibility improvement system and speech intelligibility improvement method | |
JP3688934B2 (en) | Microphone system | |
EP0639962B1 (en) | Hands free noise canceling headset | |
EP4111444B1 (en) | Narrowband cancellation | |
CN114495890A (en) | Active noise reduction method, storage medium, active noise reduction controller and aircraft | |
WO2021065080A1 (en) | Voice processing system and voice processing device | |
KR102053109B1 (en) | Method and apparatus for directional beamforming using microphone array | |
JP2000172281A (en) | In-compartment sound controller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070320 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100330 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120330 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120330 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140330 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |