以下、本発明を適用した実施の形態について図面を参照して説明する。ただし、本発明は以下の実施の形態に限定されるものではない。また、本発明は、以下の内容を自由に組み合わせたものを含むものとする。
1−1.マイクロフォンユニット1の構成
はじめに、本実施の形態に係るマイクロフォンユニット1の構成について説明する。
本実施の形態に係るマイクロフォンユニット1は、図1及び図2(A)に示すように、筐体10を含む。筐体10は、マイクロフォンユニット1の外形を構成する部材である。筐体10(マイクロフォンユニット1)の外形は多面体構造となっていてもよい。筐体10の外形は、図1に示すように、六面体(直方体又は立方体)となっていてもよい。ただし、筐体10の外形は六面体以外の多面体構造となっていてもよい。あるいは、筐体10の外形は、球状構造(半球状構造)等の、多面体以外の構造となっていてもよい。
筐体10は、図2(A)に示すように、内部空間100(第1及び第2の空間102,104)を有する。すなわち、筐体10は所定の空間を区画する構造をなしており、内部空間100とは、筐体10によって区画される空間である。筐体10は、内部空間100と、筐体10の外部の空間(外部空間110)とを電気的・磁気的に遮蔽する遮蔽構造(電磁シールド構造)をなしていてもよい。これにより、後述する振動膜30及び電気信号出力回路40が、筐体10の外部(外部空間110)に配置された電子部品の影響を受けにくくすることができるため、精度の高い雑音除去機能を実現することが可能なマイクロフォンユニットを提供することができる。
そして、筐体10には、図1及び図2(A)に示すように、筐体10の内部空間100と外部空間110とを連通させる貫通穴が形成されている。本実施の形態では、筐体10には、第1の貫通穴12と第2の貫通穴14とが形成されている。ここで、第1の貫通穴12は、第1の空間102と外部空間110とを連通する貫通穴である。また、第2の貫通穴14は、第2の空間104と外部空間110とを連通する貫通穴である。なお、第1及び第2の空間102,104については後で詳述する。第1及び第2の貫通穴12,14の外形は特に限定されるものではないが、例えば図1に示すように、円形となっていてもよい。ただし、第1及び第2の貫通穴12,14の外形は、円形以外の形状であってもよく、例えば矩形であってもよい。
本実施の形態では、図1及び図2(A)に示すように、第1及び第2の貫通穴12,14は、六面体構造(多面体構造)をなす筐体10の1つの面15に形成されている。ただし、変形例として、第1及び第2の貫通穴12,14は、それぞれ、多面体の異なる面に形成されていてもよい。例えば、第1及び第2の貫通穴12,14は、六面体の対向する面に形成されていてもよく、六面体の隣り合う面に形成されていてもよい。また、本実施の形態では、筐体10には、1つの第1の貫通穴12と1つの第2の貫通穴14とが形成されている。ただし、本発明はこれに限られず、筐体10には、複数の第1の貫通穴12及び複数の第2の貫通穴14が形成されていてもよい。
本実施の形態に係るマイクロフォンユニット1は、図2(A)及び図2(B)に示すように、仕切り部材20を含む。ここで、図2(B)は、仕切り部材20を正面から観察した図である。仕切り部材20は、筐体10内に、内部空間100を分割するように設けられる。本実施の形態では、仕切り部材20は、内部空間100を、第1の空間102及び第2の空間104に分割するように設けられる。すなわち、第1及び第2の空間102,104は、それぞれ、筐体10及び仕切り部材20で区画された空間であるといえる。
仕切り部材20は、音波を伝搬する媒質が、筐体10の内部で、第1の空間102と第2の空間104との間を移動しないように(移動できないように)設けられていてもよい。例えば、仕切り部材20は、内部空間100(第1及び第2の空間102,104)を筐体10内部で気密に分離する、気密隔壁であってもよい。
仕切り部材20は、図2(A)及び図2(B)に示すように、少なくとも一部が振動膜30で構成されている。振動膜30は、音波が入射すると、法線方向に振動する部材である。そして、マイクロフォンユニット1では、振動膜30の振動に基づいて電気信号を抽出することで、振動膜30に入射した音声を示す電気信号を取得する。すなわち、振動膜30は、マイクロフォン(音響信号を電気信号に変換する電気音響変換器)の振動膜であってもよい。
以下、本実施の形態に適用可能なマイクロフォンの一例として、コンデンサ型マイクロフォン200の構成について説明する。なお、図3は、コンデンサ型マイクロフォン200について説明するための図である。
コンデンサ型マイクロフォン200は、振動膜202を有する。なお、振動膜202が、本実施の形態に係るマイクロフォンユニット1の振動膜30に相当する。振動膜202は、音波を受けて振動する膜(薄膜)で、導電性を有し、電極の一端を形成している。コンデンサ型マイクロフォン200は、また、電極204を有する。電極204は、振動膜202と対向して配置されている。これにより、振動膜202と電極204とは容量を形成する。コンデンサ型マイクロフォン200に音波が入射すると、振動膜202が振動して、振動膜202と電極204との間隔が変化し、振動膜202と電極204との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として取り出すことによって、振動膜202の振動に基づく電気信号を取得することができる。すなわち、コンデンサ型マイクロフォン200に入射する音波を、電気信号に変換して出力することができる。なお、コンデンサ型マイクロフォン200では、電極204は、音波の影響を受けない構造をなしていてもよい。例えば、電極204はメッシュ構造をなしていてもよい。
ただし、本発明に適用可能なマイクロフォン(振動膜30)は、コンデンサ型マイクロフォンに限られるものではなく、既に公知となっているいずれかのマイクロフォンを適用することができる。例えば、振動膜30は、動電型(ダイナミック型)、電磁型(マグネティック型)、圧電型(クリスタル型)等の、種々のマイクロフォンの振動膜であってもよい。
あるいは、振動膜30は、半導体膜(例えばシリコン膜)であってもよい。すなわち、振動膜30は、シリコンマイク(Siマイク)の振動膜であってもよい。シリコンマイクを利用することで、マイクロフォンユニット1の小型化、及び、高性能化を実現することができる。
振動膜30の外形は特に限定されるものではない。図2(B)に示すように、振動膜30の外形は円形をなしていてもよい。このとき、振動膜30と第1及び第2の貫通穴12,14とは、径が(ほぼ)同じ円形であってもよい。ただし、振動膜30は、第1及び第2の貫通穴12,14よりも大きくてもよく、小さくてもよい。また、振動膜30は、第1及び第2の面35,37を有する。第1の面35は第1の空間102を向く面であり、第2の面37は第2の空間104を向く面である。
なお、本実施の形態では、振動膜30は、図2(A)に示すように、法線が筐体10の面15に平行に延びるように設けられていてもよい。言い換えると、振動膜30は、面15と直交するように設けられていてもよい。そして、振動膜30は、第2の貫通穴14の側方(近傍)に配置されていてもよい。すなわち、振動膜30は、第1の貫通穴12からの距離と、第2の貫通穴14からの距離とが等しくならないように配置されていてもよい。ただし、変形例として、振動膜30は、第1及び第2の貫通穴12,14の中間に配置されていてもよい(図示せず)。
本実施の形態では、仕切り部材20は、図2(A)及び図2(B)に示すように、振動膜30を保持する保持部32を含んでいてもよい。そして、保持部32は、筐体10の内壁面に密着していてもよい。保持部32を筐体10の内壁面に密着させることで、第1及び第2の空間102,104を気密に分離することができる。
本実施の形態に係るマイクロフォンユニット1は、振動膜30の振動に基づいて電気信号を出力する電気信号出力回路40を含む。電気信号出力回路40は、少なくとも一部が、筐体10の内部空間100内に形成されてもよい。電気信号出力回路40は、例えば、筐体10の内壁面に形成されてもよい。すなわち、本実施の形態では、筐体10を電気回路の回路基板として利用してもよい。
図4には、本実施の形態に適用可能な電気信号出力回路40の一例を示す。電気信号出力回路40は、コンデンサ42(振動膜30を有するコンデンサ型マイクロフォン)の静電容量の変化に基づく電気信号を、信号増幅回路44で増幅して出力するように構成されていてもよい。コンデンサ42は、例えば、振動膜ユニット41の一部を構成していてもよい。なお、電気信号出力回路40は、チャージアップ回路46と、オペアンプ48とを含んで構成されていてもよい。これにより、コンデンサ42の静電容量の変化を精密に取得することが可能になる。本実施の形態では、例えば、コンデンサ42、信号増幅回路44、チャージアップ回路46、オペアンプ48は、筐体10の内壁面に形成されていてもよい。また、電気信号出力回路40は、ゲイン調整回路45を含んでいてもよい。ゲイン調整回路45は、信号増幅回路44の増幅率(ゲイン)を調整する役割を果たす。ゲイン調整回路45は、筐体10の内部に設けられていてもよいが、筐体10の外部に設けられていてもよい。
ただし、振動膜30としてシリコンマイクを適用する場合には、電気信号出力回路40は、シリコンマイクの半導体基板に形成された集積回路によって実現してもよい。
また、電気信号出力回路40は、アナログ信号をデジタル信号に変換する変換回路や、デジタル信号を圧縮(符号化)する圧縮回路などをさらに含んでいてもよい。
本実施の形態に係るマイクロフォンユニット1は、以上のように構成されていてもよい。マイクロフォンユニット1によると、簡単な構成で、精度の高い雑音除去機能を実現することができる。以下、マイクロフォンユニット1の雑音除去原理について説明する。
1−2.マイクロフォンユニット1の雑音除去原理
(1)マイクロフォンユニット1の構成と、振動膜30の振動原理
はじめに、マイクロフォンユニット1の構成から導き出される、振動膜30の振動原理について説明する。
本実施の形態では、振動膜30は、両側(第1及び第2の35,37)から音圧を受ける。そのため、振動膜30の両側に、同時に、同じ大きさの音圧がかかると、当該2つの音圧は振動膜30で打ち消しあい、振動膜30を振動させる力とはならない。逆に言うと、振動膜30は、両側に受ける音圧に差があるときに、その音圧の差によって振動する。
また、第1及び第2の貫通穴12,14に入射した音波の音圧は、第1及び第2の空間102,104の内壁面に均等に伝達される(パスカルの原理)。そのため、振動膜30の第1の空間102を向く面(第1の面35)は、第1の貫通穴12に入射した音圧と等しい音圧を受け、振動膜30の第2の空間104を向く面(第2の面37)は、第2の貫通穴14に入射した音圧と等しい音圧を受ける。
すなわち、第1及び第2の面35,37が受ける音圧は、それぞれ、第1及び第2の貫通穴12,14に入射した音の音圧であり、振動膜30は、第1及び第2の面35,37(第1及び第2の貫通穴12,14)に入射した音波の音圧の差によって振動する。
(2)音波の性質
音波は、媒質中を進行するにつれ減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例するため、音圧Pは、音源からの距離rとの関係において、
と表すことができる。なお、式(1)中、kは比例定数である。図5には、式(1)を表すグラフを示すが、本図からもわかるように、音圧(音波の振幅)は、音源に近い位置(グラフの左側)では急激に減衰し、音源から離れるほどなだらかに減衰する。
マイクロフォンユニット1を接話型の音声入力装置に適用する場合、ユーザの音声は、マイクロフォンユニット1(第1及び第2の貫通穴12,14)の近傍から発生する。そのため、ユーザの音声は、第1及び第2の貫通穴12,14の間で大きく減衰し、第1及び第2の貫通穴12,14に入射するユーザ音声の音圧、すなわち、第1及び第2の面35,37に入射するユーザ音声の音圧には、大きな差が現れる。
これに対して雑音成分は、ユーザの音声に比べて、音源が、マイクロフォンユニット1(第1及び第2の貫通穴12,14)から遠い位置に存在する。そのため、雑音の音圧は、第1及び第2の貫通穴12,14の間でほとんど減衰せず、第1及び第2の貫通穴12,14に入射する雑音の音圧には、ほとんど差が現れない。
(3)雑音除去原理
上述したように、振動膜30は、第1及び第2の面35,37に同時に入射する音波の音圧の差によって振動する。そして、第1及び第2の面35,37に入射する雑音の音圧の差は非常に小さいため、振動膜30で打ち消される。これに対して、第1及び第2の面35,37に入射するユーザ音声の音圧の差は大きいため、ユーザ音声は振動膜30で打ち消されず、振動膜30を振動させる。
このことから、マイクロフォンユニット1によると、振動膜30は、ユーザの音声のみによって振動しているとみなすことができる。そのため、マイクロフォンユニット1(電気信号出力回路40)から出力される電気信号は、雑音が除去された、ユーザ音声のみを示す信号とみなすことができる。
すなわち、本実施の形態に係るマイクロフォンユニット1によると、簡易な構成で、雑音が除去されたユーザ音声を示す電気信号を取得することが可能な音声入力装置を提供することができる。
1−3.マイクロフォンユニット1で、より精度の高い雑音除去機能を実現するための条件
上述したように、マイクロフォンユニット1によると、雑音が除去された、ユーザ音声のみを示す電気信号を取得することが可能になる。ただし、音波は位相成分を含んでいる。そのため、第1及び第2の貫通穴12,14(振動膜30の第1及び第2の面35,37)に入射する音波の位相差を考慮すれば、より精度の高い雑音除去機能を実現することが可能な条件(マイクロフォンユニット1の設計条件)を導出することができる。以下、より精度の高い雑音除去機能を実現するために、マイクロフォンユニット1が満たすべき条件について説明する。
マイクロフォンユニット1によると、先に説明したように、振動膜30を振動させる音圧(第1及び第2面35,37が受ける音圧の差:以下、適宜、「差分音圧」と称する)に基づいて出力される信号を、ユーザ音声を示す信号とみなす。このマイクロフォンユニットによると、振動膜30を振動させる音圧(差分音圧)に含まれる雑音成分が、第1又は第2の面35,37に入射する音圧に含まれる雑音成分よりも小さくなったことをもって、雑音除去機能が実現されたと評価することができる。詳しくは、差分音圧に含まれる雑音成分の強度の、第1又は第2の面35,37に入射する音圧に含まれる雑音成分の強度に対する比を示す雑音強度比が、差分音圧に含まれるユーザ音声成分の強度の、第1又は第2の面35,37に入射する音圧に含まれるユーザ音声成分の強度に対する比を示すユーザ音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。
以下、この雑音除去機能を実現するために、マイクロフォンユニット1(筐体10)が満たすべき具体的な条件について説明する。
はじめに、振動膜30の第1及び第2の面35,37(第1及び第2の貫通穴12,14)に入射する音声の音圧について検討する。ユーザ音声の音源から第1の貫通穴12までの距離をR、第1及び第2の貫通穴12,14の中心間距離をΔrとすると、位相差を無視すれば、第1及び第2の貫通穴12,14に入射する、ユーザ音声の音圧(強度)P(S1)及びP(S2)は、
と表すことができる。
そのため、ユーザ音声の位相差を無視したときの、第1の面35(第1の貫通穴12)に入射するユーザ音声の音圧の強度に対する、差分音圧に含まれるユーザ音声成分の強度の比率を示すユーザ音声強度比ρ(P)は、
と表される。
ここで、マイクロフォンユニット1が接話型の音声入力装置に利用される場合、ΔrはRに比べて充分小さいとみなすことができる。
そのため、上述の式(4)は、
と変形することができる。
すなわち、ユーザ音声の位相差を無視した場合のユーザ音声強度比は、式(A)と表されることがわかる。
ところで、ユーザ音声の位相差を考慮すると、ユーザ音声の音圧Q(S1)及びQ(S2)は、
と表すことができる。なお、式中、αは位相差である。
このとき、ユーザ音声強度比ρ(S)は、
と表される。式(7)を考慮すると、ユーザ音声強度比ρ(S)の大きさは、
と表すことができる。
ところで、式(8)のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、Δr/Rsinωt項は振幅成分の強度比を示す。ユーザ音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、ユーザ音声を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、Δr/Rsinωtとは、
の関係を満たしていることが重要である。
ここで、
と表すことができるため、上述の式(B)は、
と表すことができる。
式(10)の振幅成分を考慮すると、本実施の形態に係るマイクロフォンユニット1は、
を満たす必要があることがわかる。
なお、上述したように、ΔrはRに比べて充分小さいとみなすことができるため、sin(α/2)は充分小さいとみなすことができ、
と近似することができる。
また、位相差であるαとΔrとの関係を、
と表せば、式(D)は、
と変形することができる。
すなわち、本実施の形態では、マイクロフォンユニット1が式(E)に示す関係を満たしていれば、ユーザ音声を精度よく抽出することができる。
次に、第1及び第2の面35,37(第1及び第2の貫通穴12,14)に入射する雑音の音圧について検討する。
第1及び第2の面35,37に入射する雑音成分の振幅を、A,A´とすると、位相差成分を考慮した雑音の音圧Q(N1)及びQ(N2)は、
と表すことができ、第1の面35(第1の貫通穴12)に入射する雑音成分の音圧の強度に対する、差分音圧に含まれる雑音成分の強度の比率を示す雑音強度比ρ(N)は、
と表すことができる。
なお、先に説明したように、第1及び第2の面35,37(第1及び第2の貫通穴12,14)に入射する雑音成分の振幅(強度)はほぼ同じであり、A=A´と扱うことができる。そのため、上記の式(15)は、
と変形することができる。
そして、雑音強度比の大きさは、
と表すことができる。
ここで、上述の式(9)を考慮すると、式(17)は、
と変形することができる。
そして、式(11)を考慮すると、式(18)は、
と変形することができる。
ここで、式(D)を参照すれば、雑音強度比の大きさは、
と表すことができる。なお、Δr/Rとは、式(A)に示すように、ユーザ音声の振幅成分の強度比である。式(F)から、このマイクロフォンユニット1では、雑音強度比がユーザ音声の強度比Δr/Rよりも小さくなることがわかる。
以上のことから、ユーザ音声の位相成分の強度比が振幅成分の強度比よりも小さくなるマイクロフォンユニット1によれば(式(B)参照)、雑音強度比がユーザ音声強度比よりも小さくなる(式(F)参照)。逆に言うと、雑音強度比がユーザ音声強度比よりも小さくなるように設計されたマイクロフォンユニット1によると、精度の高い雑音除去機能を実現することができる。
1−4.マイクロフォンユニット1の製造方法
以下、本実施の形態に係るマイクロフォンユニット1の製造方法について説明する。本実施の形態では、第1及び第2の貫通穴12,14の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、雑音強度比(雑音の位相成分に基づく強度比)との対応関係を示すデータを利用して、マイクロフォンユニット1を製造してもよい。
雑音の位相成分に基づく強度比は、上述した式(18)で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、
と表すことができる。
そして、式(20)のαに各値を代入すれば、位相差αと、雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図6には、横軸をα/2πとし、縦軸に雑音の位相成分に基づく強度比(デシベル値)を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。
なお、位相差αは、式(12)に示すように、距離Δrと波長λとの比であるΔr/λの関数で表すことができ、図6の横軸は、Δr/λとみなすことができる。すなわち、図6は、雑音の位相成分に基づく強度比と、Δr/λとの対応関係を示すデータであるといえる。
本実施の形態では、このデータを利用して、マイクロフォンユニット1を製造する。図7は、このデータを利用してマイクロフォンユニット1を製造する手順について説明するためのフローチャート図である。
はじめに、雑音の強度比(雑音の位相成分に基づく強度比)と、Δr/λとの対応関係を示すデータ(図6参照)を用意する(ステップS10)。
次に、用途に応じて、雑音の強度比を設定する(ステップS12)。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、0dB以下に設定する。
次に、当該データに基づいて、雑音の強度比に対応するΔr/λの値を導出する(ステップS14)。
そして、λに主要な雑音の波長を代入することによって、Δrが満たすべき条件を導出する(ステップS16)。
具体例として、主要な雑音が1KHzであり、その波長が0.347mとなる環境下で、雑音の強度が20dB低下するマイクロフォンユニット1を製造する場合について考える。
はじめに、雑音の強度比が0dB以下になるための条件について検討する。図6を参照すると、雑音の強度比を0dB以下とするためには、Δr/λの値を0.16以下とすればよいことがわかる。すなわち、Δrの値が55.46mm以下とすればよいことがわかり、これが、マイクロフォンユニット1(筐体10)の必要条件となる。
次に、1KHzの雑音の強度を20dB低下させるための条件について考える。図6を参照すると、雑音の強度を20dB低下させるためには、Δr/λの値を0.015とすればよいことがわかる。そして、λ=0.347mとすると、Δrの値が5.199mm以下のときに、この条件を満たすことがわかる。すなわち、Δrを約5.2mm以下に設定すれば、雑音除去機能を有するマイクロフォンユニットを製造することが可能になる。
なお、本実施の形態に係るマイクロフォンユニット1を接話型の音声入力装置に利用する場合、ユーザ音声の音源とマイクロフォンユニット1(第1及び第2の貫通穴12,14)との間隔は、通常5cm以下である。また、ユーザ音声の音源とマイクロフォンユニット1(第1及び第2の貫通穴12,14)との間隔は、マイクロフォンユニット1が収納される筐体の設計によって設定することが可能である。そのため、ユーザの音声の強度比であるΔr/Rの値は、0.1(雑音の強度比)よりも大きくなり、雑音除去機能が実現されることがわかる。
なお、通常、雑音は単一の周波数に限定されるものではない。しかし、主要な雑音として想定された雑音よりも周波数の低い雑音は、当該主要な雑音よりも波長が長くなるため、Δr/λの値は小さくなり、このマイクロフォンユニット1で除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、主要な雑音として想定された雑音よりも周波数の高い雑音は、当該主要な雑音よりも早く減衰するため、マイクロフォンユニット1(振動膜30)に与える影響を無視することができる。このことから、本実施の形態に係るマイクロフォンユニット1は、主要な雑音として想定された雑音とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。
また、本実施の形態では、式(12)からもわかるように、第1及び第2の貫通穴12,14を結ぶ直線上から入射する雑音を想定した。この雑音は、第1及び第2の貫通穴12,14の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係るマイクロフォンユニット1は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係るマイクロフォンユニット1によると、すべての方向から入射する雑音を除去することができる。
1−5.効果
以下、マイクロフォンユニット1が奏する効果についてまとめる。
先に説明したように、マイクロフォンユニット1によると、振動膜30の振動を示す電気信号(振動膜30の振動に基づく電気信号)取得するだけで、雑音成分が除去された音声を示す電気信号を取得することができる。すなわち、マイクロフォンユニット1では、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため、簡単な構成で、深い雑音除去が可能な高品質のマイクロフォンユニットを提供することができる。特に、第1及び第2の貫通穴12,14の中心間距離Δrを5.2mm以下に設定することで、より精度の高い雑音除去機能を実現することが可能なマイクロフォンユニットを提供することができる。
また、マイクロフォンユニット1では、位相差に基づく雑音強度比が最も大きくなるように入射する雑音を除去することができるように、筐体10(第1及び第2の貫通穴12,14の位置)を設計することが可能になる。そのため、このマイクロフォンユニット1によると、全方位から入射する雑音を除去することができる。すなわち、本発明によると、全方位から入射する雑音を除去することが可能なマイクロフォンユニットを提供することができる。
なお、マイクロフォンユニット1によると、壁などで反射した後に振動膜30(第1及び第2の面35,37)に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声は、長距離を伝搬した後にマイクロフォンユニット1に入射するため、通常のユーザ音声よりも遠くに存在する音源から発生した音声であるとみなすことができ、かつ、反射により大きくエネルギーを消失しているため、雑音成分と同様に、第1及び第2の貫通穴12,14の間で音圧が大きく減衰することがない。そのため、このマイクロフォンユニット1によると、壁などで反射した後に入射するユーザ音声成分も、雑音と同様に(雑音の一種として)除去される。
そして、マイクロフォンユニット1を利用すれば、雑音を含まない、ユーザ音声を示す信号を取得することができる。そのため、マイクロフォンユニット1を利用することで、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
1−6.音声入力装置
次に、マイクロフォンユニット1を有する音声入力装置2について説明する。
(1)音声入力装置2の構成
はじめに、音声入力装置2の構成について説明する。図8及び図9は、音声入力装置2の構成について説明するための図である。なお、以下に説明する音声入力装置2は、接話型の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
図8は、音声入力装置2の構造を説明するための図である。
音声入力装置2は、筐体50を有する。筐体50は、音声入力装置2の外形を構成する部材である。筐体50には基本姿勢が設定されていてもよく、これにより、ユーザ音声の進行径路を規制することができる。筐体50には、ユーザの音声を受け付けるための開口52が形成されていてもよい。
音声入力装置2では、マイクロフォンユニット1は、筐体50内部に設置される。マイクロフォンユニット1は、第1及び第2の貫通穴12,14が開口52に連通(重複)するように、筐体50に設置されていてもよい。マイクロフォンユニット1は、弾性体54を介して、筐体50に設置されていてもよい。これにより、筐体50の振動がマイクロフォンユニット1(筐体10)に伝わりにくくなるため、マイクロフォンユニット1を精度よく動作させることができる。
マイクロフォンユニット1は、第1及び第2の貫通穴12,14がユーザ音声の進行方向に沿ってずれて配置されるように、筐体50に設置されていてもよい。そして、ユーザ音声の進行径路の上流側に配置される貫通穴を第1の貫通穴12とし、下流側に配置される貫通穴を第2の貫通穴14としてもよい。振動膜30が第2の貫通穴14の側方に配置されたマイクロフォンユニット1を、上記のように配置すると、ユーザ音声を、振動膜30の両面(第1及び第2の面35,37)に同時に入射させることができる。詳しくは、マイクロフォンユニット1では、第1の貫通穴12の中心から第1の面35までの距離が、第1の貫通穴12から第2の貫通穴14までの距離とほぼ等しくなるため、第1の貫通穴12を通過したユーザ音声が第1の面35に入射するまでに必要な時間は、第1の貫通穴12上を通過したユーザ音波が第2の貫通穴14を介して第2の面37に入射するまでに必要な時間と、ほぼ等しくなる。すなわち、ユーザが発声した音声が、第1の面35に入射するまでにかかる時間と、第2の面37に入射するまでにかかる時間とが等しくなる。そのため、ユーザ音声を、第1及び第2の面35,37に同時に入射させることができ、位相ずれによるノイズが発生しないように、振動膜30を振動させることができる。言い換えると、先に説明した式(8)においてα=0となり、sinωt−sin(ωt−α)=0となることから、Δr/Rsinωt項(振幅成分のみ)が抽出されることがわかる。そのため、人の音声としては高周波帯域である7KHz程度のユーザ音声が入力された場合でも、第1の面35に入射する音圧と第2の面37に入射する音圧との位相ひずみの影響を無視することができ、ユーザ音声を正確に示す電気信号を取得することが可能になる。
(2)音声入力装置2の機能
次に、図9を参照して、音声入力装置2の機能について説明する。なお、図9は、音声入力装置2の機能を説明するためのブロック図である。
音声入力装置2は、マイクロフォンユニット1を有する。マイクロフォンユニット1は、振動膜30の振動に基づいて生成された電気信号を出力する。なお、マイクロフォンユニット1から出力される電気信号は、雑音成分が除去された、ユーザ音声を示す電気信号である。
音声入力装置2は、演算処理部60を有していてもよい。演算処理部60は、マイクロフォンユニット1(電気信号出力回路40)から出力された電気信号に基づいて各種の演算処理を行う。演算処理部60は、電気信号に対する解析処理を行ってもよい。演算処理部60は、マイクロフォンユニット1からの出力信号を解析することにより、ユーザ音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部60は、マイクロフォンユニット1の出力信号を解析処理することにより、ユーザ音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部60は、マイクロフォンユニット1からの出力信号に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部60は、マイクロフォンユニット1からの出力信号を増幅する処理を行ってもよい。また、演算処理部60は、後述する通信処理部70の動作を制御してもよい。なお、演算処理部60は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。あるいは、演算処理部60は、上記各機能を、専用のハードウエアによって実現してもよい。
音声入力装置2は、通信処理部70をさらに含んでいてもよい。通信処理部70は、音声入力装置2と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部70は、ネットワークを介して、他の端末に信号(マイクロフォンユニット1からの出力信号)を送信する機能を有していてもよい。通信処理部70は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部70を介して取得した出力信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置2は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置2は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置2は、通信処理部70を有しない構成となっていてもよい。
なお、上述した演算処理部60及び通信処理部70は、パッケージングされた半導体装置(集積回路装置)として、筐体50内に配置されていてもよい。ただし、本発明はこれに限られるものではない。例えば、演算処理部60は、筐体50の外部に配置されていてもよい。演算処理部60が筐体50の外部に配置されている場合、演算処理部60は、通信処理部70を介して、差分信号を取得してもよい。
なお、音声入力装置2は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、音声入力装置2は、操作情報を入力するための操作キーをさらに含んでいてもよい。
音声入力装置2は、以上の構成をなしていてもよい。この音声入力装置2は、マイクロフォンユニット1を利用する。そのため、この音声入力装置2は、雑音を含まない、入力音声を示す信号を取得することができ、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
また、音声入力装置2をマイクシステムに適用すれば、スピーカから出力されるユーザの声も、雑音として除去される。そのため、ハウリングが起こりにくいマイクシステムを提供することができる。
図10〜図12には、音声入力装置2の例として、携帯電話300、マイク(マイクシステム)400、及び、リモートコントローラ500を、それぞれ示す。また、図13には、情報入力端末としての音声入力装置602と、ホストコンピュータ604とを含む、情報処理システム600の概略図を示す。
1−7.変形例
なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。
以下、具体的な変形例を示す。
(1)第1の変形例
図14には、本発明を適用した実施の形態の第1の変形例に係るマイクロフォンユニット3を示す。
マイクロフォンユニット3は、振動膜80を含む。振動膜80は、筐体10の内部空間100を第1の空間112と、第2の空間114とに分割する仕切り部材の一部を構成する。振動膜80は、法線が面15と直交するように(すなわち、面15と平行になるように)設けられている。振動膜80は、第2の貫通穴14の側方に、第1及び第2の貫通穴12,14と重複しないように設けられていてもよい。また、振動膜80は、筐体10の内壁面と間隔をあけて配置されていてもよい。
(2)第2の変形例
図15には、本発明を適用した実施の形態の第2の変形例に係るマイクロフォンユニット4を示す。
マイクロフォンユニット4は、振動膜90を含む。振動膜90は、筐体10の内部空間100を第1の空間122と、第2の空間124とに分割する仕切り部材の一部を構成する。振動膜90は、法線が面15と直交するように設けられている。振動膜90は、筐体10の内壁面(面15とは反対側の面)と面一になるように設けられていてもよい。振動膜90は、筐体10の内側(内部空間100)から、第2の貫通穴14をふさぐように設けられていてもよい。すなわち、マイクロフォンユニット3では、第2の貫通穴14の内部空間のみを第2の空間124とし、内部空間100のうち、第2の空間124以外の空間を第1の空間122としてもよい。これによると、筐体10を薄く設計することが可能になる。
(3)第3の変形例
図16には、本発明を適用した実施の形態の第3の変形例に係るマイクロフォンユニット5を示す。
マイクロフォンユニット5は、筐体11を含む。筐体11は、内部空間101を有する。そして、内部空間101は、仕切り部材20によって、第1の領域132と第2の領域134とに分割されている。マイクロフォンユニット5では、仕切り部材20は、第2の貫通穴14の側方に配置される。また、マイクロフォンユニット5では、仕切り部材20は、内部空間101を、第1及び第2の空間132,134の容積が等しくなるように分割する。
(4)第4の変形例
図17には、本発明を適用した実施の形態の第4の変形例に係るマイクロフォンユニット6を示す。
マイクロフォンユニット6は、図17に示すように、仕切り部材21を有する。そして、仕切り部材21は、振動膜31を有する。振動膜31は、筐体10内部で、法線が面15と斜めに交差するように保持されている。
(5)第5の変形例
図18には、本発明を適用した実施の形態の第5の変形例に係るマイクロフォンユニット7を示す。
マイクロフォンユニット7では、図18に示すように、仕切り部材20が、第1及び第2の貫通穴12,14の中間に配置されている。すなわち、第1の貫通穴12と仕切り部材20との距離が、第2の貫通穴14と仕切り部材20との距離と等しくなっている。なお、マイクロフォンユニット7では、仕切り部材20は、筐体10の内部空間100を均等に分割するように配置されていてもよい。
(6)第6の変形例
図19には、本発明を適用した実施の形態の第6の変形例に係るマイクロフォンユニット8を示す。
マイクロフォンユニット8では、図19に示すように、筐体が、凸曲面16を有する構造となっている。そして、第1及び第2の貫通穴12,14は、凸曲面16に形成されている。
(7)第7の変形例
図20には、本発明を適用した実施の形態の第7の変形例に係るマイクロフォンユニット9を示す。
マイクロフォンユニット9では、図20に示すように、筐体が、凹曲面17を有する構造となっている。そして、第1及び第2の貫通穴12,14は、凹曲面17の両側に配置されていてもよい。ただし、第1及び第2の貫通穴12,14は、凹曲面17に形成されていてもよい。
(8)第8の変形例
図21には、本発明を適用した実施の形態の第8の変形例に係るマイクロフォンユニット13を示す。
マイクロフォンユニット13では、図21に示すように、筐体が、球面18を有する構造となっている。なお、球面18の底面は円形であってもよいが、これに限られるものではなく、底面は楕円形となっていてもよい。そして、第1及び第2の貫通穴12,14は、球面18に形成されている。
これらのマイクロフォンユニットによっても、上述と同様の効果を奏することができる。そのため、振動膜の振動に基づいて電気信号を取得することで、雑音成分を含まない、ユーザ音声のみを示す電気信号を取得することができる。
2−1.集積回路装置の構成
はじめに、図22〜図24を参照して、本発明を適用した実施の形態に係る集積回路装置1の構成について説明する。なお、本実施の形態に係る集積回路装置1は、音声入力素子(マイク素子)として構成され、接話型の音声入力装置等に適用することができる。
本実施の形態に係る集積回路装置1は、図22及び図23に示すように、半導体基板1100を有する。なお、図22は集積回路装置1001(半導体基板1100)の斜視図であり、図23は、集積回路装置1001の断面図である。半導体基板1100は、半導体チップであってもよい。あるいは、半導体基板1100は、集積回路装置1001となる領域を複数有する半導体ウエハであってもよい。半導体基板1100は、シリコン基板であってもよい。
半導体基板1100には、第1の振動膜1012が形成されている。第1の振動膜1012は、半導体基板1100の所与の面1101から形成された第1の凹部1102の底部であってもよい。第1の振動膜1012は、第1のマイクロフォン1010を構成する振動膜である。すなわち、第1の振動膜1012は音波が入射することによって振動するように形成されており、間隔をあけて対向配置された第1の電極1014と対になって第1のマイクロフォン1010を構成する。第1の振動膜1012に音波が入射すると、第1の振動膜1012が振動し、第1の振動膜1012と第1の電極1014との間隔が変化して、第1の振動膜1012と第1の電極1014との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として出力することによって、第1の振動膜1012を振動させる音波(第1の振動膜1012に入射する音波)を、電気信号(電圧信号)に変換して出力することができる。以下、第1のマイクロフォン1010から出力される電圧信号を、第1の電圧信号と呼ぶ。
半導体基板1100には、第2の振動膜1022が形成されている。第2の振動膜1022は、半導体基板1100の所与の面1101から形成された第2の凹部1104の底部であってもよい。第2の振動膜1022は、第2のマイクロフォン1020を構成する振動膜である。すなわち、第2の振動膜1022は音波が入射することによって振動するように形成されており、間隔をあけて対向配置された第2の電極1024と対になって第2のマイクロフォン1020を構成する。第2のマイクロフォン1020は、第1のマイクロフォン1010と同様の作用によって、第2の振動膜1022を振動させる音波(第2の振動膜22に入射する音波)を、電圧信号に変換して出力する。以下、第2のマイクロフォン1020から出力される電圧信号を、第2の電圧信号と呼ぶ。
本実施の形態では、第1及び第2の振動膜1012,1022は半導体基板1100に形成されており、例えばシリコン膜であってもよい。すなわち、第1及び第2のマイクロフォン1010,1020は、シリコンマイク(Siマイク)であってもよい。シリコンマイクを利用することで、第1及び第2のマイクロフォン1010,1020の小型化、及び、高性能化を実現することができる。第1及び第2の振動膜1012,1022は、法線が平行になるように配置されていてもよい。また、第1及び第2の振動膜1012,1022は、法線と直交する方向にずれて配置されていてもよい。
第1及び第2の電極1014,1024は、半導体基板1100の一部であってもよく、あるいは、半導体基板1100上に配置された導電体であってもよい。また、第1及び第2の電極1014,1024は、音波の影響を受けない構造をなしていてもよい。例えば、第1及び第2の電極1014,1024は、メッシュ構造をなしていてもよい。
半導体基板1100には、集積回路1016が形成されている。集積回路1016の構成は特に限定されないが、例えば、トランジスタ等の能動素子や、抵抗等の受動素子を含んでいてもよい。
本実施の形態に係る集積回路装置は、差分信号生成回路1030を有する。差分信号生成回路1030は、第1の電圧信号と、第2の電圧信号とを受け付けて、両者の差を示す差分信号を生成(出力)する。差分信号生成回路1030では、第1及び第2の電圧信号に対して例えばフーリエ解析などの解析処理を行うことなく、差分信号を生成する処理を行う。差分信号生成回路1030は、半導体基板1100に構成された集積回路1016の一部であってもよい。図24には、差分信号生成回路1030の回路図の一例を示すが、差分信号生成回路1030の回路構成はこれに限られるものではない。
なお、本実施の形態に係る集積回路装置1001は、差分信号を増幅する信号増幅回路をさらに含んでいてもよい。信号増幅回路は、集積回路1016の一部を構成していてもよい。ただし、集積回路装置は、信号増幅回路を含まない構成になっていてもよい。
本実施の形態に係る集積回路装置1001では、第1及び第2の振動膜1012,1022、及び、集積回路1016(差分信号生成回路1030)は、1つの半導体基板1100に形成されている。半導体基板1100は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)ととらえてもよい。第1及び第2の振動膜1012,1022を、同一基板(半導体基板1100)に形成することで、第1及び第2の振動膜1012,1022を精度よく形成することができるとともに、第1及び第2の振動膜1012,1022を極めて近接させることが可能になる。
なお、本実施の形態に係る集積回路装置1001によると、後述するように、第1及び第2の電圧信号の差を示す差分信号を利用して、雑音成分を除去する機能を実現する。この機能を高精度に実現するために、第1及び第2の振動膜1012,1022は、一定の制約を満たすように配置してもよい。第1及び第2の振動膜1012,1014が満たすべき制約の詳細については後述するが、本実施の形態では、第1及び第2の振動膜1012,1022は、雑音強度比が、入力音声強度比よりも小さくなるように配置されてもよい。これにより、差分信号を、雑音成分が除去された音声成分を示す信号とみなすことが可能になる。第1及び第2の振動膜1012,1022は、例えば、中心間距離Δrが5.2mm以下になるように配置されていてもよい。
本実施の形態に係る集積回路装置1001は以上のように構成されていてもよい。これによると、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。なお、その原理については後述する。
2−2.雑音除去機能
以下、集積回路装置1001による音声除去原理、及び、これを実現するための条件について説明する。
(1)雑音除去原理
はじめに、雑音除去原理について説明する。
音波は、媒質中を進行するにつれ減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例するため、音圧Pは、音源からの距離Rとの関係において、
と表すことができる。なお、式(1)中、kは比例定数である。図5には、式(1)を表すグラフを示すが、本図からもわかるように、音圧(音波の振幅)は、音源に近い位置(グラフの左側)では急激に減衰し、音源から離れるほどなだらかに減衰する。本実施の形態に係る集積回路装置では、この減衰特性を利用して雑音成分を除去する。
すなわち、集積回路装置1001を接話型の音声入力装置に適用する場合、ユーザは、雑音の音源よりも、集積回路装置1001(第1及び第2の振動膜1012,1022)に近い位置で音声を発することになる。そのため、第1及び第2の振動膜1012,1022の間で、ユーザの音声は大きく減衰し、第1及び第2の電圧信号に含まれるユーザ音声の強度には差が現れる。これに対して雑音成分は、ユーザの音声に比べて音源が遠いため、第1及び第2の振動膜1012,1022の間でほとんど減衰しない。そのため、第1及び第2の電圧信号に含まれる雑音の強度には、差が現れないとみなすことができる。このことから、第1及び第2の電圧信号の差を検出すれば雑音が消去され、集積回路装置1の近傍で発声されたユーザの音声成分のみが残ることになる。すなわち、第1及び第2の電圧信号の差を検出することで、雑音成分が含まれない、ユーザの音声成分のみを示す電圧信号(差分信号)を取得することができる。そして、この集積回路装置1によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理によって、精度よく雑音が除去された、ユーザ音声を示す信号を取得することができる。
ただし、音波は位相成分を有する。そのため、より精度の高い雑音除去機能を実現するためには、第1及び第2の電圧信号に含まれる音声成分及び雑音成分の位相差を考慮する必要がある。
以下、差分信号を生成することによって雑音除去機能を実現するために、集積回路装置1が満たすべき具体的な条件について説明する。
(2)集積回路装置が満たすべき具体的条件
集積回路装置1001によると、先に説明したように、第1及び第2の電圧信号の差分を示す差分信号を、雑音を含まない入力音声信号であるとみなす。この集積回路装置によると、差分信号に含まれる雑音成分が、第1又は第2の電圧信号に含まれる雑音成分よりも小さくなったことをもって、雑音除去機能が実現できたと評価することができる。詳しくは、差分信号に含まれる雑音成分の強度の、第1又は第2の電圧信号に含まれる雑音成分の強度に対する比を示す雑音強度比が、差分信号に含まれる音声成分の強度の、第1又は第2の電圧信号に含まれる音声成分の強度に対する比を示す音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。
以下、この雑音除去機能を実現するために、集積回路装置1001(第1及び第2の振動膜1012,1022)が満たすべき具体的な条件について説明する。
はじめに、第1及び第2のマイクロフォン1010,1020(第1及び第2の振動膜1012,1022)に入射する音声の音圧について検討する。入力音声(ユーザの音声)の音源から第1の振動膜1012までの距離をRとし、位相差を無視すれば、第1及び第2のマイクロフォン1010,1020で取得される、入力音声の音圧(強度)P(S1)及びP(S2)は、
と表すことができる。
そのため、入力音声の位相差を無視した時の、第1のマイクロフォン10で取得される入力音声成分の強度に対する、差分信号に含まれる入力音声成分の強度の比率を示す音声強度比ρ(P)は、
と表される。
ここで、本実施の形態に係る集積回路装置が接話式の音声入力装置に利用されるマイク素子である場合、ΔrはRに比べて充分小さいとみなすことができるため、上述の式(4)は、
と変形することができる。
すなわち、入力音声の位相差を無視した場合の音声強度比は、式(A)と表されることがわかる。
ところで、入力音声の位相差を考慮すると、ユーザ音声の音圧Q(S1)及びQ(S2)は、
と表すことができる。なお、式中、αは位相差である。
このとき、音声強度比ρ(S)は、
と表される。式(7)を考慮すると、音声強度比ρ(S)の大きさは、
と表すことができる。
ところで、式(8)のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、Δr/Rsinωt項は振幅成分の強度比を示す。入力音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、入力音声(ユーザの音声)を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、Δr/Rsinωtとは、
の関係を満たしていることが必要である。
ここで、
と表すことができるため、上述の式(B)は、
と表すことができる。
式(10)の振幅成分を考慮すると、本実施の形態に係る集積回路装置1は、
を満たす必要があることがわかる。
なお、上述したように、ΔrはRに比べて充分小さいとみなすことができるため、sin(α/2)は充分小さいとみなすことができ、
と近似することができる。
また、位相差であるαとΔrとの関係を、
と表せば、式(D)は、
と変形することができる。
すなわち、本実施の形態では、入力音声(ユーザの音声)を精度よく抽出するためには、集積回路装置1が式(E)に示す関係を満たすことが必要である。
次に、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に入射する雑音の音圧について検討する。
第1及び第2のマイクロフォン10,20で取得される雑音成分の振幅を、A,A´とすると、位相差成分を考慮した雑音の音圧Q(N1)及びQ(N2)は、
と表すことができ、第1のマイクロフォン10で取得される雑音成分の強度に対する、差分信号に含まれる雑音成分の強度の比率を示す雑音強度比ρ(N)は、
と表すことができる。
なお、先に説明したように、第1及び第2のマイクロフォン10,20で取得される雑音成分の振幅(強度)はほぼ同じであり、A=A´と扱うことができる。そのため、上記の式(15)は、
と変形することができる。
そして、雑音強度比の大きさは、
と表すことができる。
ここで、上述の式(9)を考慮すると、式(17)は、
と変形することができる。
そして、式(11)を考慮すると、式(18)は、
と変形することができる。
ここで、式(D)を参照すれば、雑音強度比の大きさは、
と表すことができる。なお、Δr/Rとは、式(A)に示すように、入力音声(ユーザ音声)の振幅成分の強度比である。式(F)から、この集積回路装置1では、雑音強度比が入力音声の強度比Δr/Rよりも小さくなることがわかる。
以上のことから、入力音声の位相成分の強度比が振幅成分の強度比よりも小さくなる集積回路装置1によれば(式(B)参照)、雑音強度比が入力音声強度比よりも小さくなる(式(F)参照)。逆に言うと、雑音強度比が入力音声強度比よりも小さくなるように設計された集積回路装置1によると、精度の高い雑音除去機能を実現することができる。
2−3.集積回路装置の製造方法
以下、本実施の形態に係る集積回路装置の製造方法について説明する。本実施の形態では、第1及び第2の振動膜1012,1022の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、雑音強度比(雑音の位相成分に基づく強度比)との対応関係を示すデータを利用して、集積回路装置を製造してもよい。
雑音の位相成分に基づく強度比は、上述した式(18)で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、
と表すことができる。
そして、式(20)のαに各値を代入すれば、位相差αと雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図6には、横軸をα/2πとし、縦軸に雑音の位相成分に基づく強度比(デシベル値)を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。
なお、位相差αは、式(12)に示すように、距離Δrと波長λとの比であるΔr/λの関数で表すことができ、図5の横軸は、Δr/λとみなすことができる。すなわち、図5は、雑音の位相成分に基づく強度比と、Δr/λとの対応関係を示すデータであるといえる。
本実施の形態では、このデータを利用して、集積回路装置1001を製造する。図7は、このデータを利用して集積回路装置1を製造する手順について説明するためのフローチャート図である。
はじめに、雑音の強度比(雑音の位相成分に基づく強度比)と、Δr/λとの対応関係を示すデータ(図6参照)を用意する(ステップS10)。
次に、用途に応じて、雑音の強度比を設定する(ステップS12)。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、0dB以下に設定する。
次に、当該データに基づいて、雑音の強度比に対応するΔr/λの値を導出する(ステップS14)。
そして、λに主要な雑音の波長を代入することによって、Δrが満たすべき条件を導出する(ステップS16)。
具体例として、主要な雑音が1KHzであり、その波長が0.347mとなる環境下で、雑音の強度が20dB低下する集積回路装置を製造する場合について考える。
はじめに、必要条件として、雑音の強度比が0dB以下になるための条件について検討する。図6を参照すると、雑音の強度比を0dB以下とするためには、Δr/λの値を0.16以下とすればよいことがわかる。すなわち、Δrの値が55.46mm以下とすればよいことがわかり、これが、この集積回路装置の必要条件となる。
次に、1KHzの雑音の強度を20dB低下させるための条件について考える。図6を参照すると、雑音の強度を20dB低下させるためには、Δr/λの値を0.015とすればよいことがわかる。そして、λ=0.347mとすると、Δrの値が5.199mm以下のときに、この条件を満たすことがわかる。すなわち、Δrを約5.2mm以下に設定すれば、雑音除去機能を有する集積回路装置を製造することが可能になる。
なお、本実施の形態に係る集積回路装置1001は接話式の音声入力装置に利用されるため、ユーザの音声の音源と集積回路装置1001(第1又は第2の振動膜1012,1022)との間隔は、通常5cm以下である。また、ユーザ音声の音源と集積回路装置1001(第1及び第2の振動膜1012,1022)との間隔は、筐体の設計によって制御することが可能である。そのため、入力音声(ユーザの音声)の強度比であるΔr/Rの値は、0.1(雑音の強度比)よりも大きくなり、雑音除去機能が実現されることがわかる。
なお、通常、雑音は単一の周波数に限定されるものではない。しかし、主要な雑音として想定された雑音よりも周波数の低い雑音は、当該主要な雑音よりも波長が長くなるため、Δr/λの値は小さくなり、この集積回路装置によって除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、主要な雑音として想定された雑音よりも周波数の高い雑音は、当該主要な雑音よりも早く減衰するため、集積回路装置に与える影響を無視することができる。このことから、本実施の形態に係る集積回路装置は、主要な雑音として想定された雑音とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。
また、本実施の形態では、式(12)からもわかるように、第1及び第2の振動膜1012,1022を結ぶ直線上から入射する雑音を想定した。この雑音は、第1及び第2の振動膜1012,1022の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係る集積回路装置1001は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係る集積回路装置1001によると、すべての方向から入射する雑音が除去される。
2−4.効果
以下、集積回路装置1001が奏する効果についてまとめる。
先に説明したように、集積回路装置1001によると、第1及び第2のマイクロフォン1010,1020で取得された電圧信号の差分を示す差分信号を生成するだけで、雑音成分が除去された音声成分を取得することができる。すなわち、この音声入力装置では、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため、簡単な構成で、精度の高い雑音除去機能を実現することが可能な集積回路装置(マイク素子・音声入力素子)を提供することができる。
また、集積回路装置1001では、位相差に基づく雑音強度比が最も大きくなるように入射する雑音を除去することができるように、第1及び第2の振動膜1012,1022が配置されている。そのため、この集積回路装置1001によると、全方位から入射する雑音が除去される。すなわち、本発明によると、全方位から入射する雑音を除去することが可能な集積回路装置を提供することができる。
なお、集積回路装置1001によると、壁などで反射した後に集積回路装置1001に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声の音源は、長距離を伝搬した後に集積回路装置1に入射するため、通常のユーザ音声の音源よりも遠いとみなすことができ、かつ、反射により大きくエネルギーを消失しているため、雑音成分と同様に、第1及び第2の振動膜1012,1022の間で音圧が大きく減衰することがない。そのため、この集積回路装置1001によると、壁などで反射した後に入射するユーザ音声成分も、雑音と同様に(雑音の一種として)除去される。
また、集積回路装置1001によると、第1及び第2の振動膜1012,1022と、差分信号生成回路1030とが1つの半導体基板1100に形成されている。これによると、第1及び第2の振動膜1012,1022を、高精度に形成することができ、また、第1及び第2の振動膜1012,1022の中心間距離を極めて近接させることができる。そのため、雑音除去精度が高く、かつ、外形が小さい集積回路装置を提供することができる。
そして、集積回路装置1001を利用すれば、雑音を含まない、入力音声を示す信号を取得することができる。そのため、この集積回路装置を利用することで、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
2−5.音声入力装置
次に、集積回路装置1001を有する音声入力装置1002について説明する。
(1)音声入力装置の構成
はじめに、音声入力装置2の構成について説明する。図25及び図26は、音声入力装置1002の構成について説明するための図である。なお、以下に説明する音声入力装置1002は、接話式の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
図25は、音声入力装置2002の構造を説明するための図である。
音声入力装置1002は、筐体1040を有する。筐体1040は、音声入力装置1002の外形を構成する部材であってもよい。筐体1040には基本姿勢が設定されていてもよく、これにより、入力音声(ユーザの音声)の進行径路を規制することができる。筐体1040には、入力音声(ユーザの音声)を受け付けるための開口1042が形成されていてもよい。
音声入力装置1002では、集積回路装置1001は、筐体1040に設置される。集積回路装置1001は、第1及び第2の凹部1102,1104が開口1042に連通するように、筐体1040に設置されていてもよい。集積回路装置1001は、第1及び第2の振動膜1012,1022が入力音声の進行径路に沿ってずれて配置されるように、筐体1040に設置されていてもよい。そして、入力音声の進行径路の上流側に配置される振動膜を第1の振動膜1012とし、下流側に配置される振動膜を第2の振動膜1022としてもよい。
次に、図26を参照して、音声入力装置1002の機能について説明する。なお、図26は、音声入力装置1002の機能を説明するためのブロック図である。
音声入力装置1002は、第1及び第2のマイクロフォン1010,1020を有する。第1及び第2のマイクロフォン1010,1020は、第1及び第2の電圧信号を出力する。
音声入力装置1002は、差分信号生成回路1030を有する。差分信号生成回路1030は、第1及び第2のマイクロフォン1010,1020から出力された第1及び第2の電圧信号を受け付けて、両者の差を示す差分信号を生成する。
なお、第1及び第2のマイクロフォン1010,1020と、差分信号生成回路1030とは、1つの半導体基板1100で実現される。
音声入力装置1002は、演算処理部1050を有していてもよい。演算処理部1050は、差分信号生成回路1030で生成された差分信号に基づいて各種の演算処理を行う。演算処理部1050は、差分信号に対する解析処理を行ってもよい。演算処理部1050は、差分信号を解析することにより、入力音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部1050は、差分信号を解析処理することにより、入力音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部1050は、入力音声に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部1050は、差分信号を増幅する処理を行ってもよい。また、演算処理部1050は、後述する通信処理部1060の動作を制御してもよい。なお、演算処理部1050は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。
音声入力装置1002は、通信処理部1060をさらに含んでいてもよい。通信処理部1060は、音声入力装置と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部1060は、ネットワークを介して、他の端末に信号(差分信号)を送信する機能を有していてもよい。通信処理部1060は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部1060を介して取得した差分信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置は、通信処理部1060を有しない構成となっていてもよい。
なお、上述した演算処理部1050及び通信処理部1060は、パッケージングされた半導体装置(集積回路装置)として、筐体1040内に配置されていてもよい。ただし、本発明はこれに限られるものではない。例えば、演算処理部1050は、筐体1040の外部に配置されていてもよい。演算処理部1050が筐体1040の外部に配置されている場合、演算処理部1050は、通信処理部1060を介して、差分信号を取得してもよい。
なお、音声入力装置1002は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、本実施の形態に係る音声入力装置は、操作情報を入力するための操作キーをさらに含んでいてもよい。
音声入力装置1002は、以上の構成をなしていてもよい。この音声入力装置1002は、マイク素子(音声入力素子)として集積回路装置1を利用する。そのため、この音声入力装置1002は、雑音を含まない、入力音声を示す信号を取得することができ、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
また、音声入力装置1002をマイクシステムに適用すれば、スピーカから出力されるユーザの声も、雑音として除去される。そのため、ハウリングが起こりにくいマイクシステムを提供することができる。
2−6.変形例
以下、本発明を適用した実施の形態の変形例について説明する。
図27は、本実施の形態に係る集積回路装置1003について説明するための図である。
本実施の形態に係る集積回路装置1003は、図27に示すように、半導体基板1200を有する。半導体基板1200には、第1及び第2の振動膜1012,1022が形成されている。ここで、第1の振動膜1015は、半導体基板1200の第1の面1201から形成された第1の凹部1210の底部である。また、第2の振動膜1025は、半導体基板1200の第2の面1202(第1の面1201と対向する面)から形成された第2の凹部1220の底部である。すなわち、集積回路装置1003(半導体基板1200)によると、第1及び第2の振動膜1015,1025は、法線方向に(半導体基板1200の厚み方向に)ずれて配置される。なお、半導体基板1200では、第1及び第2の振動膜1015,1025は、法線距離が5.2mm以下になるように配置されていてもよい。あるいは、第1及び第2の振動膜1015,1025は、中心間距離が5.2mm以下になるように配置されていてもよい。
図28は、集積回路装置1003が実装された音声入力装置1004について説明するための図である。集積回路装置1003は、筐体1040に実装される。集積回路装置1003は、図28に示すように、第1の面1201が、筐体1040におけるの開口1042が形成された面を向くように、筐体1040に実装されていてもよい。そして、集積回路装置1003は、第1の凹部1210が開口1042に連通するように、かつ、第2の振動膜1025が開口1042と重複するように、筐体1040に実装されていてもよい。
本実施の形態では、集積回路装置1003は、第1の凹部1210に連通する開口1212の中心が、第2の振動膜1025(第2の凹部1220の底面)の中心よりも、入力音声の音源に近い位置に配置されるように設置されていてもよい。集積回路装置1003は、入力音声が、第1及び第2の振動膜1015,1025に、同時に到着するように設置されていてもよい。例えば、集積回路装置1003は、入力音声の音源(モデル音源)と第1の振動膜1015との間隔が、モデル音源と第2の振動膜1025との間隔と同じになるように設置されていてもよい。集積回路装置1003は、上記の条件を満たすように、基本姿勢が設定された筐体に設置されていてもよい。
本実施の形態に係る音声入力装置によると、第1及び第2の振動膜1015,1025に入射する入力音声(ユーザの音声)の、入射時間のずれを低減することができる。そのため、入力音声の位相差成分が含まれないように差分信号を生成することができることから、入力音声の振幅成分を精度よく抽出することが可能になる。
なお、凹部(第1の凹部1210)内では音波は拡散しないため、音波の振幅ほとんど減衰しない。そのため、この音声入力装置では、第1の振動膜1015を振動させる入力音声の強度(振幅)は、開口1212における入力音声の強度と同じとみなすことができる。このことから、音声入力装置が、入力音声が第1及び第2の振動膜1015,1025に同時に到達するように構成されている場合でも、第1及び第2の振動膜1015,1025を振動させる入力音声の強度には差が現れる。そのため、第1及び第2の電圧信号の差を示す差分信号を取得することで、入力音声を抽出することができる。
まとめると、この音声入力装置によると、入力音声の位相差成分に基づくノイズを含まないように、入力音声の振幅成分(差分信号)を取得することができる。そのため、精度の高い雑音除去機能を実現することが可能になる。
最後に、図29〜図31に、本発明の実施の形態に係る音声入力装置の例として、携帯電話1300、マイク(マイクシステム)1400、及び、リモートコントローラ1500を、それぞれ示す。また、図32には、情報入力端末としての音声入力装置1602と、ホストコンピュータ1604とを含む、情報処理システム1600の概略図を示す。
3−1.本実施の形態に係る音声入力装置の構成
はじめに、図33〜図35を参照して、本発明を適用した実施の形態に係る音声入力装置2001の構成について説明する。なお、以下に説明する音声入力装置2001は、接話式の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
本実施の形態に係る音声入力装置は、第1の振動膜2012を有する第1のマイクロフォン2010と、第2の振動膜2022を有する第2のマイクロフォン2020とを含む。ここで、マイクロフォンとは、音響信号を電気信号へ変換する電気音響変換器である。第1及び第2のマイクロフォン2010,2020は、それぞれ、第1及び第2の振動膜2012,2022(振動板)の振動を、電圧信号として出力する変換器であってもよい。
本実施の形態に係る音声入力装置では、第1のマイクロフォン2010は第1の電圧信号を生成する。また、第2のマイクロフォン2020は第2の電圧信号を生成する。すなわち、第1及び第2のマイクロフォン2010,2020で生成された電圧信号を、それぞれ、第1及び第2の電圧信号と呼んでもよい。
第1及び第2のマイクロフォン2010,2020の機構については特に限定されるものではない。図34には、第1及び第2のマイクロフォン2010,2020に適用可能なマイクロフォンの一例として、コンデンサ型マイクロフォン2100の構造を示す。コンデンサ型マイクロフォン2100は、振動膜2102を有する。振動膜2102は、音波を受けて振動する膜(薄膜)で、導電性を有し、電極の一端を形成している。コンデンサ型マイクロフォン2100は、また、電極2104を有する。電極2104は、振動膜2102と対向して配置されている。これにより、振動膜2102と電極2104とは容量を形成する。コンデンサ型マイクロフォン2100に音波が入射すると、振動膜2102が振動して、振動膜2102と電極2104との間隔が変化し、振動膜2102と電極2104との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として出力することによって、コンデンサ型マイクロフォン2100に入射する音波を、電気信号に変換することができる。なお、コンデンサ型マイクロフォン2100では、電極2104は、音波の影響を受けない構造をなしていてもよい。例えば、電極2104はメッシュ構造をなしていてもよい。
ただし、本発明に適用可能なマイクロフォンは、コンデンサ型マイクロフォンに限られるものではなく、既に公知となっているいずれかのマイクロフォンを適用することができる。例えば、第1及び第2のマイクロフォン2010,2020として、動電型(ダイナミック型)、電磁型(マグネティック型)、圧電型(クリスタル型)等のマイクロフォンを適用してもよい。
第1及び第2のマイクロフォン2010,2020は、第1及び第2の振動膜2012,2022がシリコンによって構成されたシリコンマイク(Siマイク)であってもよい。シリコンマイクを利用することで、第1及び第2のマイクロフォン2010,2020の小型化、及び、高性能化を実現することができる。このとき、第1及び第2のマイクロフォン2010,2020は、1つの集積回路装置として構成されていてもよい。すなわち、第1及び第2のマイクロフォン2010,2020は、1つの半導体基板に構成されていてもよい。このとき、後述する差分信号生成部2030も、同一の半導体基板に形成されていてもよい。すなわち、第1及び第2のマイクロフォン2010,2020は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。ただし、第1のマイクロフォン2010と第2のマイクロフォン2020とは、別々のシリコンマイクとして構成されていてもよい。
本実施の形態に係る音声入力装置では、後述するように、第1及び第2の電圧信号の差を示す差分信号を利用して、雑音成分を除去する機能を実現する。この機能を実現するために、第1及び第2のマイクロフォン(第1及び第2の振動膜2012,2022)は、一定の制約を満たすように配置される。第1及び第2の振動膜2012,2022が満たすべき制約の詳細については後述するが、本実施の形態では、第1及び第2の振動膜2012,2022(第1及び第2のマイクロフォン2010,2020)は、雑音強度比が、入力音声強度比よりも小さくなるように配置される。これにより、差分信号を、雑音成分が除去された音声成分を示す信号とみなすことが可能になる。第1及び第2の振動膜2012,2022は、例えば、中心間距離が5.2mm以下になるように配置されていてもよい。
なお、本実施の形態に係る音声入力装置では、第1及び第2の振動膜2012,2022の向きは、特に限定されるものではない。第1及び第2の振動膜2012,2022は、法線が平行になるように配置されていてもよい。このとき、第1及び第2の振動膜2012,2022は、法線が同一直線にならないように配置されていてもよい。例えば、第1及び第2の振動膜2012,2022は、図示しない基部(例えば回路基板)の表面に、間隔をあけて配置されていてもよい。あるいは、第1及び第2の振動膜2012,2022は、法線方向にずれて配置されていてもよい。ただし、第1及び第2の振動膜2012,2022は、法線が平行にならないように配置されていてもよい。第1及び第2の振動膜2012,2022は、法線が直交するように配置されていてもよい。
そして、本実施の形態に係る音声入力装置は、差分信号生成部2030を有する。差分信号生成部2030は、第1のマイクロフォン2010で取得された第1の電圧信号と、第2のマイクロフォン2020で取得された第2の電圧信号との差(電圧差)を示す差分信号を生成する。差分信号生成部2030では、第1及び第2の電圧信号に対して例えばフーリエ解析などの解析処理を行うことなく、両者の差を示す差分信号を生成する処理を行う。差分信号生成部2030の機能は、専用のハードウェア回路(差分信号生成回路)によって実現してもよく、CPUなどによる信号処理によって実現してもよい。
本実施の形態に係る音声入力装置は、差分信号を増幅する信号増幅部をさらに含んでいてもよい。差分信号生成部2030と信号増幅部とは、1つの制御回路によって実現してもよい。ただし、本実施の形態に係る音声入力装置は、信号増幅部を内部に持たない構成をなしていてもよい。
図35には、差分信号生成部2030と信号増幅部とを実現可能な回路の一例を示す。図35に示す回路によれば、第1及び第2の電圧信号を受け付けて、その差を示す差分信号を10倍に増幅した信号を出力することになる。ただし、差分信号生成部2030及び信号増幅部を実現するための回路構成は、これに限られるものではない。
本実施の形態に係る音声入力装置は、筐体2040を含んでいてもよい。このとき、音声入力装置の外形は、筐体2040によって構成されていてもよい。筐体2040には基本姿勢が設定されていてもよく、これにより、入力音声の進行径路を規制することができる。第1及び第2の振動膜2012,2022は、筐体2040の表面に形成されていてもよい。あるいは、第1及び第2の振動膜2012,2022は、筐体2040に形成された開口(音声入射口)と対向するように、筐体2040内部に配置されていてもよい。そして、第1及び第2の振動膜2012,2022は、音源(入射音声のモデル音源)からの距離が異なるように配置されていてもよい。例えば図33に示すように、筐体2040は、入力音声の進行径路が筐体2040の表面に沿うように、基本姿勢が設定されていてもよい。そして、第1及び第2の振動膜2012,2022は、入力音声の進行径路に沿って配置されていてもよい。そして、入力音声の進行径路の上流側に配置される振動膜を第1の振動膜2012とし、下流側に配置される振動膜を第2の振動膜2022としてもよい。
本実施の形態に係る音声入力装置は、演算処理部2050をさらに含んでいてもよい。演算処理部2050は、差分信号生成部2030で生成された差分信号に基づいて各種の演算処理を行う。演算処理部2050は、差分信号に対する解析処理を行ってもよい。演算処理部2050は、差分信号を解析することにより、入力音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部2050は、差分信号を解析処理することにより、入力音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部2050は、入力音声に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部2050は、差分信号を増幅する処理を行ってもよい。また、演算処理部2050は、後述する通信処理部2060の動作を制御してもよい。なお、演算処理部2050は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。
演算処理部2050は、筐体2040の内部に配置されていてもよいが、筐体2040の外部に配置されていてもよい。演算処理部2050が筐体2040の外部に配置されている場合、演算処理部2050は、後述する通信処理部2060を介して、差分信号を取得してもよい。
本実施の形態に係る音声入力装置は、通信処理部2060をさらに含んでいてもよい。通信処理部2060は、音声入力装置と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部2060は、ネットワークを介して、他の端末に信号(差分信号)を送信する機能を有していてもよい。通信処理部2060は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部2060を介して取得した差分信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置は、通信処理部2060を有しない構成となっていてもよい。
本実施の形態に係る音声入力装置は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、本実施の形態に係る音声入力装置は、操作情報を入力するための操作キーをさらに含んでいてもよい。
本実施の形態に係る音声入力装置は、以上の構成をなしていてもよい。この音声入力装置によると、第1及び第2の電圧信号の差を出力するだけの簡単な処理によって、雑音成分が除去された音声成分を示す信号(電圧信号)が生成される。そのため、本発明によると、小型化が可能で、かつ、優れた雑音除去機能を有する音声入力装置を提供することができる。なお、その原理、製造方法及び効果については、2−2〜2−4で説明した内容と同様である。
3−2.他の実施の形態に係る音声入力装置
次に、本発明を適用した他の実施の形態に係る音声入力装置について、図36を参照して説明する。
本実施の形態に係る音声入力装置は、基部2070を含む。基部2070の主面2072には、凹部2074が形成されている。そして、本実施の形態に係る音声入力装置では、凹部2074の底面2075に第1の振動膜2012(第1のマイクロフォン2010)が配置され、基部2070の主面2072に第2の振動膜2022(第2のマイクロフォン2020)が配置される。なお、凹部2074は、主面2072に対して垂直に延びていてもよく、凹部2074の底面2075は、主面2072と平行な面であってもよい。底面2075は、凹部2074と直交する面であってもよい。また、凹部2074は、第1の振動膜2012と同じ外形をなしていてもよい。
本実施の形態では、凹部2074は、領域2076と開口2078との間隔よりも浅くなっていてもよい。すなわち、凹部2074の深さをdとし、領域2076と開口2078との間隔をΔGとすると、基部2070は、d≦ΔGを満たしていてもよい。基部2070は、2d=ΔGを満たしていてもよい。なお、ΔGは5.2mm以下であってもよい。あるいは、基部2070は、第1及び第2の振動膜2012,2022の中心間を結ぶ直線距離が5.2mm以下になるように構成されていてもよい。
基部2070は、凹部2074に連通する開口2078が、主面2072における第2の振動膜2022が配置される領域2076よりも、入力音声の音源に近い位置に配置されるように設置される。基部2070は、入力音声が、第1及び第2の振動膜2012,2022に、同時に到着するように設置されていてもよい。例えば、基部2070は、入力音声の音源(モデル音源)と第1の振動膜2012との間隔が、モデル音源と第2の振動膜22との間隔と同じになるように設置されていてもよい。基部2070は、上記の条件を満たすように、基本姿勢が設定された筐体に設置されていてもよい。
本実施の形態に係る音声入力装置によると、第1及び第2の振動膜2012,2022に入射する入力音声(ユーザの音声)の、入射時間のずれを低減することができる。すなわち、入力音声の位相差成分が含まれないように差分信号を生成することができることから、入力音声の振幅成分を精度よく抽出することが可能になる。
なお、凹部74内では音波は拡散しないため、音波の振幅ほとんど減衰しない。そのため、この音声入力装置では、第1の振動膜2012を振動させる入力音声の強度(振幅)は、開口2078における入力音声の強度と同じとみなすことができる。このことから、音声入力装置が、入力音声が第1及び第2の振動膜2012,2022に同時に到達するように構成されている場合でも、第1及び第2の振動膜2012,2022を振動させる入力音声の強度には差が現れる。そのため、第1及び第2の電圧信号の差を示す差分信号を取得することで、入力音声を抽出することができる。
まとめると、この音声入力装置によると、入力音声の位相差成分に基づくノイズを含まないように、入力音声の振幅成分(差分信号)を取得することができる。そのため、精度の高い雑音除去機能を実現することが可能になる。
なお、凹部2074の深さをΔG以下(5.2mm以下)とすることで、凹部2074の共振周波数を高く設定することができるため、凹部2074で共振ノイズが発生することを防止することができる。
図37には、本実施の形態に係る音声入力装置の変形例を示す。
本実施の形態に係る音声入力装置は、基部2080を含む。基部2080の主面2082には、第1の凹部2084と、第1の凹部2084よりも浅い第2の凹部2086が形成されている。第1及び第2の凹部2084,2086の深さの差であるΔdは、第1の凹部2084に連通する第1の開口2085と、第2の凹部2086に連通する第2の開口2087との間隔であるΔGよりも小さくなっていてもよい。そして、第1の振動膜2012は第1の凹部2084の底面に配置され、第2の振動膜2022は第2の凹部2086の底面に配置される。
この音声入力装置であっても、上記と同様の効果を奏するため、精度の高い雑音除去機能を実現することが可能になる。
4−1.音声入出力装置及び通話装置
図38は、本実施の形態の音声入出力装置及び通話装置の機能ブロック図である。
本実施の形態の音声入出力装置3010は、マイクロフォン3032からの入力に基づき第1の音声信号3034を生成する音声入力部3030と、第2の音声信号3048に基づきスピーカ3046から音声を出力する音声出力部3040とを含む。
音声入力部3030は、内部空間を有する筐体と、前記筐体内に設けられた、前記内部空間を第1の空間と第2の空間とに分割する、少なくとも一部が振動膜で構成された仕切り部材と、前記振動膜の振動に基づいて第1の音声信号である電気信号を出力する電気信号出力回路と、を含み、前記筐体には、前記第1の空間と前記筐体の外部空間とを連通する第1の貫通穴と、前記第2の空間と前記筐体の外部空間とを連通する第2の貫通穴とが形成されているマイクロフォンユニットが実装されてもよい。ここでマイクロフォンユニットは、図1から図21で説明した構成で実現してもよい。
また音声入力部3030は、第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号とを受け付けて、前記第1及び第2の電圧信号の差を示す差分信号に基づき第1の音声信号を生成する差分信号生成回路と、が形成された半導体基板を有する集積回路装置が実装されてもよい。ここで集積回路装置は、図22から図28で説明した構成で実現してもよい。
また音声入力部3030は、第1の振動膜を有する第1のマイクロフォンと、第2の振動膜を有する第2のマイクロフォンと、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号に基づき第1の音声信号を生成する差分信号生成部と、を含み、前記第1及び第2の振動膜は、前記差分信号に含まれる雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されていてもよい。ここで音声入力部3030は、図33から図37で説明した構成で実現してもよい。
また音声入力部3030はマイクロフォンからの入力に基づき第1の音声信号を生成するハンズフリー型に構成してもよい。
音声出力部3040は、記第1の音声信号3034に基づき通話時の周囲雑音を検出する周囲雑音検出部3042と、検出された周囲雑音の大きさに基づき、前記スピーカ3046の音量を制御する音量制御部3044とを含むように構成してもよい。
また音声出力部3040と前記音声入力部2030とは、分離して設置される構成でもよい。
本実施の形態によれば、雑音環境において使用する場合でも音声入力用のマイクロフォンから得る周囲雑音の強度に合わせてスピーカの音量を連続的または段階的に制御することにより、音声入力者にスピーカから出力される音を聞き取りやすくすること、例えば通話の場合には送話と受話を容易にならしめる音声音声入出力装置を提供することができる。
またマイクロフォンは、機器に直接的・間接的作用する衝撃音を容易にかつ極めて効果的に抑圧する特性を備えている。すなわち空気中を伝搬する音のみならず、固体中を伝搬する音も除去することが可能である。固体中の音の伝搬速度は空気中の伝搬速度に比べて極めて速い(約10倍程度)ため、マイクロフォンが設置された固体に加わった衝撃音(雑音)は、ほぼ同時に前記振動膜に到達するため、空気中を伝搬する雑音と同様に除去することができる。
したがって、従来きわめて不快な現象であった「スピーカから発した音が装置の筺体内または固体内を伝播してマイクに伝わり、マイクから再び通話の相手に音声エコーとなって戻っていくエコー現象」を効果的に除去することができる。
またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、例えば卓上に設置したハンズフリー電話機などに組み込むことにより、高性能のハンズフリー拡声通話装置を提供することができる。
従って、本実施の形態によればマイクロフォンに直接・間接に作用する衝撃雑音などに対しても雑音抑圧性能に優れることから、ハンズフリー型の音声入出力装置に組み込むことにより従来から極めて不快でまた除去が困難であった衝撃雑音下においても優れた性能の機器を提供することが出来る。
なおパソコンのキーボード、作業ロボット、デジタル録音機、補聴器などに組み込んでも同様の効果を得ることができる。
またマイクロフォンとスピーカ間に生じるハウリング抑圧性能にも優れることから、雑音環境に強い新しい音声入出力装置を提供することが出来る。
本実施の形態の通話装置3020は、音声入出力装置3010と、音声入力部3030が生成した第1の音声信号3034を通話相手の装置に送信する送信部3050と、通話相手の装置から送信される第2の音声信号3048を受信する受信部3060と、を含む。
なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。
1…マイクロフォンユニット、2…音声入力装置、3…マイクロフォンユニット、4…マイクロフォンユニット、5…マイクロフォンユニット、6…マイクロフォンユニット、7…マイクロフォンユニット、8…マイクロフォンユニット、9…マイクロフォンユニット、10…筐体、11…筐体、12…第1の貫通穴、13…マイクロフォンユニット、14…第2の貫通穴、16…凸曲面、17…凹曲面、18…球面、20…仕切り部材、21…仕切り部材、30…振動膜、31…振動膜、32…保持部、40…電気信号出力回路、41…振動膜ユニット、42…コンデンサ、44…信号増幅回路、45…ゲイン調整回路、46…チャージアップ回路、48…オペアンプ、50…筐体、52…開口、54…弾性体、 60…演算処理部、70…通信処理部、80…振動膜、100…内部空間、101…内部空間、102…第1の空間、104…第2の空間、112…第1の空間、114…第2の空間、110…外部空間、112…第1の空間、114…第2の空間、122…第1の空間、124…第2の空間、132…第1の空間、134…第2の空間、200…コンデンサ型マイクロフォン、202…振動膜、204…電極、300…携帯電話、400…マイク、500…リモートコントローラ、600…情報処理システム、602…音声入力装置、604…ホストコンピュータ、1001…集積回路装置、1002…音声入力装置、1003…集積回路装置、1004、音声入力装置、1010…第1のマイクロフォン、1012…第1の振動膜、1014…第1の電極、1015…第1の振動膜、1016…集積回路、1020…第2のマイクロフォン、1022…第2の振動膜、1024…第2の電極、1025…第2の振動膜、1030…差分信号生成回路、1040…筐体、1042…開口、1050…演算処理部、1060…通信処理部、1100…半導体基板、1102…第1の凹部、1104…第2の凹部、1200…半導体基板、1201…第1の面、1202…第2の面、1210…第1の凹部、1212…開口、1220…第2の凹部、1300…携帯電話、1400…マイク、1500…リモートコントローラ、1600…情報処理システム、1602…音声入力装置、1604…ホストコンピュータ
2001…音声入力装置、2010…第1のマイクロフォン、2012…第1の振動膜、2020…第2のマイクロフォン、2022…第2の振動膜、2030…差分信号生成部、2040…筐体、2050…演算処理部、2060…通信処理部、2070…基部、2072…主面、2074…凹部、2075…底面、2076…領域、2078…開口、2080…基部、2082…主面、2084…第1の凹部、2085…第1の開口、2086…第2の凹部、2087…第2の開口、2100…コンデンサ型マイクロフォン、20102…振動膜、2104…電極、3010…音声入出力装置、3020…通話装置、3030…音声入力部、3032…マイクロフォン、3034…第1の音声信号、3040…音声出力部、3042…周囲雑音検出部、3044…音量制御部、3046…スピーカ、3050…送信部、3060…受信部