[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2006503526A - 動的なバイノーラルサウンドの取込及び再生 - Google Patents

動的なバイノーラルサウンドの取込及び再生 Download PDF

Info

Publication number
JP2006503526A
JP2006503526A JP2005501606A JP2005501606A JP2006503526A JP 2006503526 A JP2006503526 A JP 2006503526A JP 2005501606 A JP2005501606 A JP 2005501606A JP 2005501606 A JP2005501606 A JP 2005501606A JP 2006503526 A JP2006503526 A JP 2006503526A
Authority
JP
Japan
Prior art keywords
microphone
listener
output
head
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005501606A
Other languages
English (en)
Other versions
JP2006503526A5 (ja
Inventor
アルガズィ,ヴィー.,ラルフ
ドゥダ,リチャード,オー.
トンプソン,デニス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of JP2006503526A publication Critical patent/JP2006503526A/ja
Publication of JP2006503526A5 publication Critical patent/JP2006503526A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Stereophonic Arrangements (AREA)

Abstract

生の又は録音されたのいずれかである3次元サウンドを取り込み、再生する新しい手法を説明する。MTB又は「モーショントラックドバイノーラル」と称する方法で、複数のマイクロホン(14)、ヘッドトラッカ(18)、及び特殊な信号処理手順を使用して、マイクロホン(14)によって拾われた信号を組み合わせる。MTBは、サウンドが発生している空間に聴取者の耳を効果的に置き、聴取者の頭部の動きと同期して仮想耳を移動することによって、高い度合のリアリズムを達成する。MTBは、空間音響を録音するユニバーサルフォーマットも提供する。

Description

本発明は、全般的には空間音響(spatial sound)の取込及び再生に関し、具体的には、3次元空間音響の動的特性を取り込み、再生する方法及びシステムに関する。
関連出願の相互参照
本願は、参照によって本明細書に組み込まれる2002年10月18日出願の米国特許出願第60/419734号明細書からの優先権を主張するものである。本願は、参照によって本明細書に組み込まれる2003年4月15日出願の米国特許出願第10/414261号明細書からの優先権も主張する。
連邦が出資する調査又は開発に関する陳述
本発明は、全米科学財団によって授与された許可番号IIS−00−97256号及びITR−00−86075号の下で政府の支援を受けて作られた。政府は、本発明に関するある権利を有する。
コンパクトディスクで提出される材料に関する参照による組込み
適用なし。
著作権保護の対象になる材料の告知
この特許文書の材料の一部は、米国及び他国の著作権法の下での著作権保護の対称である。著作権の所有者は、米国特許商標局の公に入手可能なファイル又は記録に現れる特許文書又は特許開示の何人による写真複製にも異議を唱えないが、それ以外のすべての著作権を留保する。著作権所有者は、これによって、米国特許施行規則第1.14条により権利を制限なしに含む、この特許文書を秘密に保たせることに対するどの権利も放棄しない。
空間音響の取込及び再生には、複数の代替手法があり、使用される特定の手法は、通常、音源が自然音源とコンピュータ生成音源のどちらであるかに依存する。自然音響の録音及び再生に関する空間音響テクノロジの優れた概要が、F.Rumsey,Spatial Audio(Focal Press,Oxford,2001)にあり、仮想音源の生成及びリアルタイム「レンダリング」のコンピュータベースの方法に関する匹敵する概要が、D.B.Begault,3−D Sound for Virtual Reality and Multimedia(AP Professional,Boston,1994)にある。次は、よく知られた手法の一部の概要である。
サラウンドサウンド(たとえば、ステレオ、4チャネル方式、Dolby(登録商標)5.1など)は、これまで、空間音響を録音し、再生する最も人気のある手法である。この手法は、概念的には単純である、すなわち、サウンドが来て欲しいところにラウドスピーカを置けば、サウンドがその位置から来るようになる。しかし、実際には、それほど単純ではない。ラウドスピーカの間、特に側面に沿った位置からサウンドが来るように見せることは、困難である。同一のサウンドが、複数のスピーカから来る場合に、先行音効果が、サウンドが最も近いスピーカから来るように見えることをもたらし、これは、スピーカの近くに座った人に特に不適当である。最良の結果は、かなり狭い「スイートスポット」の近くにいるように聴取者を制限することである。また、複数の高品質スピーカの必要が、不便かつ高価であり、家庭での使用に関して、多くの人が、3つ以上のスピーカの使用が許容不能であることに気付いている。
その制限を減らしてサラウンドサウンドを実現する代替の形がある。たとえば、ホームシアタシステムは、通常、2つのラウドスピーカの間のスペースを超えてサウンドステージを拡張する音響心理学的効果を含む2チャネルミックスを提供する。スピーカ信号をヘッドホン信号に変換することによって、複数のラウドスピーカの必要をなくすことも可能であり、これは、いわゆるDolby(登録商標)ヘッドホンに使用される技法である。しかし、これらの代替案のそれぞれが、それ自体の制限も有する。
サラウンドサウンドシステムは、遠くから来るサウンドを再生するにはよいが、一般に、耳元でささやく人など、非常に近くにある源の効果を生成することができない。最後に、効果的なサラウンドサウンド録音を生成することは、専門のサウンドエンジニアの仕事であり、その手法は、テレビ会議又はアマチュアに適しない。
もう1つの手法が、Ambisonics(商標)である。広く使用されてはいないが、サラウンドサウンドに対するAmbisonics手法は、録音を行うという問題の多くを解決する(M.A.Gerzon,“Ambisonics in multichannel broadcasting and video”,Preprint 2034,74th Convention of the Audio Engineering Society(New York、Oct.8−12、1983);後にJ.Aud.Eng.Soc.、Vol.33、No.11、pp.859−871(Oct.、1985)で出版)。これは、抽象的に、低次球面調和関数によって入射音場と近似する方法と説明された(J.S.Bamford and J.Vanderkooy,“Ambisonic sound for us”,Preprint 4138,99th Convention of the Audio Engineering Society(New York,Oct.6−9、1995))。Ambisonic録音では、SoundField(商標)マイクロホンと称する特殊なコンパクトなマイクロホンアレイを使用して、3つの直交する次元でのローカル圧力及び圧力差を感知する。基本的なAmbisonic手法が拡張されて、3つを超える次元からの録音が可能にされ、よりよい角度分解能が、対応する複雑さの増加と共に提供された。
他のサラウンドサウンド方法と同様に、Ambisonicsは、マトリクス化方法を使用して、ラウドスピーカのアレイを駆動し、したがって、マルチスピーカシステムの他の長所及び短所のすべてを有する。更に、すべてのスピーカが、ローカル圧力成分を再生するのに使用される。その結果、聴取者が、スイートスポット内に位置する時に、その成分が聴取者の頭部の中にあるかのように聞かれ、頭の動きが、気を散らせるティンブラルアーティファクト(timbral artifact)を誘導する(W.G.Gardner,3−D Audio Using Loudspeakers(Kluwer Academic Publishers,Boston,1998),p.18)。
ウェーブフィールドシンセシス(wave−field synthesis)は、もう1つの手法であるが、非常に実用的ではない。理論上、十分なマイクロホン及び十分なラウドスピーカがあれば、囲む表面上のマイクロホンによって取り込まれたサウンドを使用して、録音が行われた空間の中全体に存在する音圧場を再生することができる(M.M.Boone,“Acoustic rendering with wave field synthesis”,Proc.ACM SIGGRAPH and Eurographics Campfire:Acoustic Rendering for Virtual Environments,Snowbird,UT、May 26−29、2001))。理論的要件は厳しいが(すなわち、数十万個のラウドスピーカ)、100個を超えるラウドスピーカのアレイを使用するシステムが、構成され、効果的であると言われている。しかし、この手法は、明らかに費用効率が悪い。
バイノーラル(binaural)取込が、もう1つの手法である。3次元サウンドを取り込むのに数百チャネルを有する必要がないことが周知であり、実際に、2チャネルで十分である。2チャネルバイノーラル録音又は2チャネル「ダミーヘッド」録音は、3D画像の立体再生の音響類似物であるが、空間音響を取り込むのに長く使用されてきた(J.Sunier,“Binaural overview:Ears where the mikes are. Part I”,Audio,Vol.73,No.11,pp.75−84(Nov.1989);J.Sunier,“Binaural overview:Ears where the mikes are.Part II”,Audio,Vol.73,No.12,pp.49−57(Dec.1989);K.Genuit,H.W.Gierlich,and U.Kunzli,“Improved possibilities of binaural recording and playback techniques”,Preprint 3332,92nd Convention Audio Engineering Society(Vienna,Mar.1992))。基本的な発想は、単純である。音の空間特性を知覚するのに人間の頭脳によって使用される情報の主な源は、左右の耳の鼓膜に達する圧力波から来る。これらの圧力波を再生できるならば、聴取者は、正確にオリジナルの音が作られた時にその聴取者が存在していたかのように音を聞くことができる。
鼓膜に達する圧力波は、(a)音源、(b)リスニング環境、ならびに(c)聴取者自身の体による入射波の反射、回折、及び散乱を含む複数の要因によって影響される。聴取者と正確に同一のサイズ、形状、及び音響特性を有するマネキンが、耳道内の、人間の鼓膜が位置する場所に置かれたマイクロホンを備えるならば、鼓膜に達する信号を、伝えるか録音することができる。信号が、ヘッドホンを介して聞かれる(ヘッドホンドライバから鼓膜までの伝達関数を訂正する適切な補償付きで)時に、音の圧力波が再生され、聴取者は、マネキンの位置及び方位に実際にいるかのように、正しい空間特性のすべてを有する音を聞く。主な問題は、鼓膜の共鳴を訂正することである。ヘッドホンドライバは、耳道の外部にあるので、耳道共鳴は、2回すなわち、録音時に1回と再生時に1回現れる。これは、耳道がブロックされ、マイクロホンがブロックされた入口と同一平面にある、いわゆる「ブロックドミーティアス(blocked meatus)」録音の推奨につながる(H.Moller,“Fundamentals of binaural technology”,Applied Acoustics,Vol.36,No.5,pp.171−218(1992))。バイノーラル取込では、特にテレフォニ応用例で、部屋の反響が自然に聞こえる。特に人がマイクロホンから離れて話す場合に、環境音が過度にうつろで反響することが、スピーカホンでの一般的な経験である。バイノーラルピックアップを用いて聞かれる時に、この気を散らす反響の認識が消え、環境音が自然で明瞭になる。
それでも、バイノーラルサウンドの取込及び再生に関連する問題がある。最も明白な問題は、実際に必ず重要ではない。これには、(a)髪及び衣服の影響を含む、マネキンと特定の聴取者の間のサイズ、形状、及び音響特性の不可避の不一致、(b)圧力感知要素としての鼓膜とマイクロホンの間の差、及び(c)音源の知覚される位置に対する視覚的な又は触覚的な手がかりなどの非音響要因の影響が含まれる。たとえば、KEMAR(商標)マネキンでは、いわゆる「ツウィスロッキカプラ(Zwislocki coupler)」を使用して鼓膜インピーダンスの影響をシミュレートすることに、かなりの努力が捧げられた(M.D.Burkhard and R.M.Sachs,“Anthropometric manikin for auditory research”,J.Acoust.Soc.Am.,Vol.58,pp.214−222(1975)。KEMARは、Knowles Electronics,1151 Maplewood Drive,Itasca,Illinois,60143によって製造される)。しかし、マイクロホンは、どれほどよくても、変換器として鼓膜と同等でないことを諒解されたい。
はるかに重要な制限が、聴取者の頭部の動きから生じる動的な手がかりがないことである。音源が、マネキンの左に位置すると仮定する。聴取者は、聴取者の左側から来るものとして音を聞く。しかし、聴取者が、その音がアクティブである間に源に向けて向きを変えると仮定する。録音は、聴取者の動きを知らないので、音は、聴取者の左側から来るように見え続ける。聴取者の観点からは、音源が、空間内で左側に留まるように移動したように見える。多数の音源がアクティブである場合に、聴取者が動くときに、その経験は、音響の世界全体が、聴取者と正確に同期して移動することになる。「仮想プレゼンス」の感覚すなわち、録音が行われた環境に実際に存在するという感覚を有するためには、聴取者が移動する時に、静止音源が静止したままにならなければならない。言い換えると、仮想的な聴覚の源の空間的位置は、安定し、聴取者の動きと独立にならなければならない。
聴取者の動きの影響が、バイノーラル録音の別の欠陥の責任を負うと考えるべき理由がある。バイノーラル録音を聞く時に、左又は右からの音が、自然に離れているように見えるが、真上からの音は、必ず近過ぎるように見えることが、一般的な経験である。実際に、一部の聴取者は、頭の中又は後ろにあるものとしてその音源を経験する。この「フロンタルエクスターナライゼーション(frontal externalization)」の消失について、複数の理由が提案された。議論の1つは、我々が、真上にある音源を見ることを期待し、確認する視覚的手がかりがない時に、音の位置を後ろに投影するというものである。実際に、実生活の情況で、音源が前と後ろのどちらにあるかを知ることは、しばしば難しく、これが、我々が不安な時に回りを見渡す理由である。しかし、前後の曖昧さを解決するために、完全に後ろを向く必要はない。音源が、垂直の正中面のどこかにあると仮定する。我々の体は、この平面に関して基本的に対称なので、両耳に達する音は、本質的に同一である。しかし、少し左に頭を向けたと仮定する。音源が実際に前にある場合には、音は、左耳に達する前に右耳に達するが、音源が後ろにある場合には、その反対になる。この両耳間時間差の変化は、しばしば、前後の曖昧さを解決するのに十分である。
しかし、標準的なバイノーラル録音で何が起こるかに注意されたい。源が真上にある時に、我々は、左右の両方の耳で同一の信号を受け取る。録音は、聴取者の動きを知らないので、2つの信号は、我々が頭を動かす時に同一であり続ける。頭の動きにかかわらずに両耳の音が同一である場合に、音源がどこにありえるかを自問するならば、応えは「頭の中」である。動的な手がかりは、非常に強力である。標準的なバイノーラル録音は、そのような動的な手がかりを考慮に入れておらず、これが、「フロンタルコラップス(frontal collapse)」の主な理由である。
この問題を直す形の1つが、サーボ機構を使用して、聴取者の頭部が動く時にダミーの頭を動かすことである。実際に、そのようなシステムが、Horbach他によって実施された(U.Horbach,A.Karamustafaoglu,R.Pellegrini,P.Mackensen and G.Theile,“Design and applications of a data−based auralization system for surround sound”,Preprint 4976,106th Convention of the Audio Engineering Society(Munich,Germany,May 8−11,1999))。彼らは、そのシステムが極端に自然な音を作り、前後の混乱を事実上除去したと報告した。そのシステムは、非常に効果的であるが、一時に1人の聴取者だけによる使用に制限されることは明白であり、録音には全く使用することができない。
ヘッドトラッキング法を使用して、コンピュータ生成サウンドをレンダリングする際の、(i)聴取者の頭部の動きと独立の仮想的な聴覚の源の安定した位置、(ii)よいフロンタルエクスターナライゼーション、及び(iii)ほとんど又は全くない前後の混乱という長所を達成する多数のバーチャルオーディトリスペースシステム(Virtual−Auditory−Space systems、VASシステム)もある。しかし、VASシステムは、(i)各音源の分離された信号、(ii)各音源の位置の知識、(iii)源と同じ個数のチャネル、(iv)各源を別々にスペイシャライズ(spatialize)する、頭関連伝達関数(HRTF)、及び(v)部屋のエコー及び反響の効果と近似する追加の信号処理を必要とする。
ステレオ録音又はサラウンドサウンド録音など、ラウドスピーカを介して聞かれることを意図された録音にVAS技法を適用することが可能である。この場合に、音源(ラウドスピーカ)が分離され、その個数及び位置が既知である。録音では、別々のチャネルが提供され、音源は、シミュレートされた部屋に置かれたシミュレートされたラウドスピーカである。VASシステムは、これらのサウンド信号を、コンピュータ生成された信号をレンダリングするようにレンダリングする。実際に、まさにこの形でサラウンドサウンド録音にヘッドトラッキングを使用する市販製品(Sony社のMDR−DS8000ヘッドホンなど)がある。しかし、そのようなシステムが行える最もよいことは、ヘッドホンを介して、ラウドスピーカを聞く経験を再生することである。これは、生録音に簡単に適用可能ではなく、テレビ会議には全く不適切である。これらは、複数のラウドスピーカの必要をなくすが、サラウンドサウンドシステム及びAmbisonicシステムの多数の問題のすべてを継承している。
3つ以上のマイクロホンを使用してライブ空間音響を録音し、再生する多数の方法もある。しかし、ライブサウンドの取込用のシステムのうちで、ヘッドホン再生用に設計され、聴取者の動的な動きに応答するものは、1つだけが既知である。そのシステムは、以下ではマクグラスシステムと呼称するが、米国特許第6021206号明細書及び米国特許第6259795号明細書に記載されている。これらの特許の間の主要な相違は、第1の特許が単一の聴取者に関し、第2の特許が複数の聴取者に関することである。これらの特許の両方が、SoundFieldマイクロホンを用いて行われた録音のバイノーラルスペイシャライズに関する(F.Rumsey,Spatial Audio(Focal Press,Oxford,2001),pp.204−205)。
マクグラスシステムは、(i)サウンドが録音される時に、聴取者の頭部の方位が未知である、(ii)聴取者の頭部の位置は、ヘッドトラッカを用いて測定される、(iii)マルチチャネル録音をバイノーラル録音に変換するのに、信号処理手順が使用される、及び(iv)主な目標は、聴取者が頭を動かす時に位置が変化しない仮想源を生成することであるという特性を有する。マクグラスシステムで使用されるAmbisonic録音が、「聴取者が存在しない時」の聴取者の位置で展開される音場を取り込むことを試み、「聴取者が存在する時」の聴取者の位置の音場を取り込まないことに留意されたい。Ambisonic録音は、両耳時間差、両耳間レベル差、及び球形の頭の頭関連伝達関数(HRTF)によって誘導されるスペクトル変化を直接に取り込まない。したがって、マクグラスシステムは、録音された信号を使用して、複数の方向から入ってくる波を再構成しなければならず、HRTFを使用して、各入ってくる波を別々にスペイシャライズしなければならない。マクグラスシステムは、個別化されたHRTFを使用することができるが、このシステムは、複雑であり、再構成は、Ambisonicsに関連する制限のすべてをこうむる。
本発明の目的は、現在のテクノロジを大幅に超えるリアリズムの感覚すなわち、「そこにいる」という現実感を伴うサウンド再生を提供することである。本発明のもう1つの目的は、サウンド取込、保管、又は伝送、及び再生の両方に関して、比較的穏当な追加の複雑さでこれを達成することである。
本発明は、前述の制限の多くを克服し、静的バイノーラル録音の3つの最も深刻な問題すなわち、(a)頭の回転に対する仮想的な聴覚の源の位置の感度、(b)正中面エクスターナライゼーションの弱さ、及び(c)深刻な前後の混乱の存在を解決する。更に、本発明は、同時に聞いている一人の聴取者又は複数の聴取者に適用可能であり、リモートリスニング及び録音の両方に適用可能である。最後に、本発明は、次の意味での空間音響の録音の「ユニバーサルフォーマット」を提供する。すべての空間音響テクノロジ(たとえば、ステレオ、4チャネル、Dolby 6.1、Ambisonics、ウェーブフィールドシンセシスなど)によって生成されたサウンドを、本発明のフォーマットに変換し、その後、再生して、オリジナルの技法が提供できるものと同一の空間効果を再生することができる。したがって、既存録音のかなりの遺産を、品質の劣化をほとんど又は全く伴わずに保存することができる。
一般的な言葉では、本発明は、空間音響の動的3次元特性を取り込む。本明細書で「モーショントラックドバイノーラル(Motion−Tracked Binaural)と称し、「MTB」と省略される本発明は、リモートリスニング(たとえばテレフォニ)又は録音及び再生のいずれかに使用することができる。事実上、MTBは、1人又は複数の聴取者が、サウンドが発生しつつある(リモートリスニングの場合)又は発生しつつあった(録音の場合)空間に耳を置くことを可能にする。更に、本発明は、各聴取者が、リスニング中に独立に頭の向きを変えることを許容し、その結果、異なる聴取者が、頭を異なる方向に向けることができる。そうする際に、本発明は、頭の動きの知覚的に非常に重要な影響を正しく効率的に考慮に入れる。MTBは、サウンドが発生しつつある(又はあった)空間に聴取者の耳を効果的に置き、聴取者の頭部の動きと同期して仮想的な耳を移動することによって、高い度合のリアリズムを達成する。
これを達成するために、本発明は、そのサイズがほぼ人間の頭のサイズである表面に位置決めされた複数のマイクロホンを使用する。説明を単純にするために、マイクロホンが取り付けられる表面が球であると仮定することができる。しかし、本発明は、それに制限されず、さまざまな他の形で実施することができる。マイクロホンは、表面を均一に又は不均一にカバーすることができる。更に、必要なマイクロホンの数は、少ない。
マイクロホンアレイは、通常は、多分聴取者がいるであろうリスニング空間内の位置に置かれる。たとえば、テレビ会議の場合に、マイクロホンアレイを会議テーブルの中央に置くことができる。オーケストラ録音の場合に、マイクロホンアレイをコンサートホールで一番よい席に置くことができる。ホームシアタの場合に、マイクロホンアレイを技術的現状のシネマの一番よい席に置くことができる。マイクロホンによって取り込まれる音は、リモートリスニングの場合に録音と違う形で扱われる。リモートリスニング応用例では、マイクロホン信号が、聴取者に直接に送られるが、録音応用例では、信号が、マルチトラック録音に保管される。
各聴取者は、その人の頭の方位を動的に測定するヘッドトラッカを身に着ける。聴取者の頭部の座標の原点は、必ずマイクロホンアレイの座標の原点と一致すると仮定される。したがって、聴取者がどのように移動しても、サウンド再生システムは、聴取者の耳がマイクロホンに対してどこに位置するかを知っている。本発明の一実施形態では、本システムが、聴取者の耳に最も近い2つのマイクロホンを見つけ、この2つのマイクロホンからの適切に増幅された信号を、聴取者の頭部のヘッドホンの対にルーティングする。サウンド取込と同様に、この再生装置を実施する複数の可能な形がある。具体的に言うと、ヘッドホンリスニングだけを説明するが、いわゆる「クロストークキャンセル」技法を使用して、ヘッドホンの代わりにラウドスピーカを使用することも可能である(参照によって本明細書に組み込まれる、G.Gardner,3−D Audio Using Loudspeakers(Kluwer Academic Publishers,Boston,1998))。
好ましい実施形態では、より手の込んだ、音響心理学に基づく信号処理手順を使用して、マイクロホン信号の連続的補間を可能にし、これによって、少数のマイクロホンを用いる場合であっても、聴取者が頭を動かす時に発生する「クリック音」又は他のアーティファクトを除去する。
本発明の態様によれば、ヘッドトラッカが、聴取者の頭部の回転を補償するために信号処理を変更するのに使用される。説明を単純にするために、聴取者が、水平面内で角度θだけ頭を回すと仮定し、聴取者の両耳の特定の一方に送られる信号を検討されたい。一実施形態で、信号処理ユニットは、角度θを使用して、マイクロホンを切り替え、常に聴取者の耳の位置に最も近いマイクロホンを使用する。もう1つの実施形態で、信号処理ユニットは、角度θを使用して、最も近いマイクロホンと次に近いマイクロホンからの信号の間で補間又は「パン」する。もう1つの実施形態で、信号処理ユニットは、角度θに伴って変化する線形フィルタリング手順を使用して、最も近いマイクロホンと次に近いマイクロホンからの信号を組み合わせる。この第3の実施形態では、下でその使い方を説明する相補信号が、物理的マイクロホン又は物理的マイクロホンの出力を組み合わせた仮想マイクロホンのいずれかから入手される。一実施形態で、相補信号が、マイクロホンアレイのマイクロホンと別個であるが、同一の音場に置かれた追加マイクロホンから入手される。もう1つの実施形態で、相補信号が、アレイマイクロホンの特定の1つから入手される。もう1つの実施形態で、相補信号が、アレイマイクロホンの間で動的に切り替えることによって入手される。もう1つの実施形態で、相補信号が、動的に切り替えられるアレイマイクロホンの出力のスペクトル補間によって入手される。もう1つの実施形態で、左耳用と右耳用の2つの相補信号が、上で単一の相補信号に関して説明した方法のいずれかを使用して入手される。
本発明の態様によれば、サウンド再生装置に、オーディオ出力デバイスに接続される出力と、聴取者の頭部の動きを表す信号を供給するように構成されたヘッドトラッキングデバイスに接続される入力とを有する信号処理ユニットが含まれる。この信号処理ユニットは、聴取者の頭部が音場内でマイクロホンの位置に置かれている場合に、前記聴取者の耳の可能な位置を表す点で前記音場をサンプリングするように位置決めされた複数のマイクロホンの出力を表す信号を受信するように構成される。この信号処理ユニットは、更に、ヘッドトラッキングデバイスによって示される聴取者の頭部の移動に応答して、マイクロホン出力信号の間で選択し、オーディオ出力デバイスに1つ又は複数の選択された信号を提示するように構成される。オーディオ出力デバイス及びヘッドトラッキングデバイスは、任意選択として、信号処理ユニットに直接に接続するか、ワイヤレスとすることができる。
本発明のもう1つの態様によれば、信号処理ユニットは、ヘッドトラッキングデバイスによって示される聴取者の頭部の回転に応答して、聴取者の頭部が音場内に置かれている場合に、音場内の聴取者の耳の位置に関して複数のマイクロホンのうちの最も近いマイクロホン及び次に近いマイクロホンからの出力を表す信号を組み合わせ、組み合わされた出力をオーディオ出力デバイスに提示するように構成される。
本発明のもう1つの態様によれば、信号処理ユニットは、マイクロホン出力信号の各々に関連付けられた低域フィルタと、聴取者の左耳用の組み合わされた出力信号及び聴取者の右耳用の組み合わされた出力信号を生成するために低域フィルタの出力を組み合わせる、加算器などの手段とを含み、各組み合わされた出力信号は、聴取者の頭部が音場内に置かれている場合に、音場内の聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの出力を表す信号の組合せを含む。
本発明のもう1つの態様によれば、信号処理ユニットは、音場内に置かれた実際の又は仮想的な相補型マイクロホンからの出力を提供するように構成された高域フィルタと、高域フィルタからの出力信号を聴取者の右耳用の組み合わされた出力信号及び聴取者の左耳用の組み合わされた出力信号と組み合わせる、加算器などの手段とを含む。一実施形態で、同一の高周波数信号が、両方の耳に使用される。もう1つの実施形態で、右耳高域フィルタは、音場に置かれた右耳の実際の又は仮想的な相補型マイクロホンから出力を供給するように構成され、左耳高域フィルタは、音場に置かれた左耳の実際の又は仮想的な相補型マイクロホンから出力を供給するように構成される。この後者の実施形態では、右耳高域フィルタからの出力信号が、聴取者の右耳用の組み合わされた出力信号と組み合わされ、左耳高域フィルタからの出力信号が、聴取者の左耳用の組み合わされた出力信号と組み合わされる。
本発明のもう1つの態様によれば、動的なバイノーラルサウンドの取込及び再生の装置が、聴取者の頭部が音場に置かれている場合に、聴取者の耳の可能な位置を表す点で音場をサンプリングするように位置決めされた複数のマイクロホンを含む。信号処理ユニットは、マイクロホンから直接に、通信リンクを介して送信される信号を介して、あるいはマイクロホン信号が録音される媒体を読み取り、かつ/又は再生することによって、マイクロホン信号を受信することができる。
本発明のさらなる目的及び態様は、本明細書の次の部分で発表され、この詳細な説明は、制限を加えることなく、本発明の好ましい実施形態を完全に開示するためのものである。
本発明は、例示のみを目的とする下記の図面を参照することによって完全に理解される。
具体的に図面を参照すると、例示のために、本発明は、図1から図11に全般的に示された装置及び方法で実施される。それらならびに本明細書の説明から、本発明の好ましい実施形態が、(1)サウンド取込に3つ以上のマイクロホンを使用し(下で説明するように2本のマイクロホンだけでいくつかの有用な効果を達成することはできるが)、(2)聴取者の頭部の方位を測定するのにヘッドトラッキングデバイスを使用し、(3)マイクロホンの出力を選択的に組み合わせるのに音響心理学に基づく信号処理を使用することがわかる。
まず図1及び図2を参照すると、本発明によるバイノーラル動的サウンド取込再生システム10の実施形態が示されている。図示の実施形態では、システムに、複数のマイクロホン14を有する環状マイクロホンアレイ12、信号処理ユニット16、ヘッドトラッカ18、ならびに左ヘッドホン20及び右ヘッドホン22などのオーディオ出力デバイスが含まれる。この図に示されたマイクロホン配置を、パノラマ構成と呼ぶ。後で説明するように、3つの異なるクラスの応用例があり、これを、全方向性応用例、パノラマ応用例、及び収束(focused)応用例と呼ぶ。例のみとして、本発明を、パノラマ応用例に関して下の議論で示す。
図示の実施形態では、マイクロホンアレイ12に、その半径aが聴取者の頭部24の半径bとほぼ同一である円に沿って等間隔の8つのマイクロホン14(0から7までの番号を付す)が含まれる。本発明の目的は、実際にマイクロホンアレイの位置にいる(又はいた)という印象を聴取者に与えることである。それを行うために、マイクロホンが置かれる円は、聴取者の頭部のサイズと近似するものでなければならない。
8つのマイクロホンが、図示の実施形態で使用される。これに関して、本発明が、2つのマイクロホンならびに多数のマイクロホンを用いて機能できることに留意されたい。しかし、2つだけのマイクロホンの使用は、8つのマイクロホンほど現実的な感覚経験をもたらさず、両耳間軸(interaural axis)に近い音源について最もよい効果を生成する。より多くのマイクロホンを使用することができるが、8つは、8チャネルを有する録音機器が簡単に入手可能なので、便利な個数である。
これらの8つのマイクロホンによって作られる信号は、信号処理ユニット16内で組み合わされて、左ヘッドホン20及び右ヘッドホン22に向けられる2つの信号が作られる。たとえば、聴取者の頭部が、図1に示された方位である場合に、マイクロホン#6からの信号が、左耳に送られ、マイクロホン#2からの信号が、右耳に送られる。これは、標準的なバイノーラル録音で行われるものと本質的に同等である。
ここで、聴取者が頭を角度θだけ回転した、図2に示された状況を検討されたい。この角度は、ヘッドトラッカ18によって感知され、信号処理を変更するのに使用される。ヘッドトラッカは、市販されており、ヘッドトラッカの詳細は、説明しない。ヘッドトラッカが、回転運動を表す出力信号を生成することに留意することで十分である。角度θが、45°の正確な倍数である場合に、信号処理ユニット16は、単に、聴取者の耳と見当のあったマイクロホンの対を選択する。たとえば、θが正確に90°である場合に、信号処理ユニット16は、マイクロホン#0からの信号を左耳、マイクロホン#4からの信号を右耳に向ける。言い換えると、信号処理ユニット16は、図1に示された「正面向き」位置に関する、マイクロホンアレイの90°反時計回り回転に対応する位置を有するマイクロホン対を選択する。しかし、一般に、θは、45°の正確な倍数ではなく、信号処理ユニット16は、下で説明するように、マイクロホン出力を組み合わせてヘッドホン用の信号を提供しなければならない。
ヘッドトラッカが、基準方位に関する聴取者の頭部の方位の変化を表す信号を供給することを諒解されたい。方位は、通常は、3つのオイラー角(ピッチ、ロール、及びヨー)によって表されるが、他の角度座標も使用することができる。測定は、毎秒100回など、高いサンプリングレートで行われることが好ましいが、他のレートも使用することができる。
「チルトなし、ルールなし、正面」方位を定義する基準方位は、通常、処理の開始時に初期化されるが、望まれる時にいつでも、聴取者が変更することができる。図1を参照し、聴取者の左耳が、マイクロホン#6の位置にあり、聴取者の右耳がマイクロホン#2の位置に置かれていると仮定する。その後、聴取者が、回転せずに歩き回る場合に、聴取者の位置(及び聴取者の耳のxyz位置)は、サウンド再生に影響しない。その一方で、聴取者が頭を回転し、これによって、原点が必ず聴取者の頭部にあり、その方位が絶対に変化しない座標系での初期位置に対するユーザの耳の位置が変化する場合には、信号処理ユニット16は、図2に示されているように、その方位の変化を補償する。
一般に、聴取者が動きまわる時に、運動の並進成分と回転成分の両方がある。MTBシステムが、並進成分を無視することを諒解されたい。聴取者の頭部の中心は、必ず、MTBマイクロホンアレイの中心と一致すると仮定する。したがって、聴取者がどのように移動しても、ヘッドトラッカ18によって供給される信号を用いて、信号処理ユニット16が、マイクロホンに関する聴取者の耳の「位置」を常に知ることができる。用語「位置」は、しばしば、空間内の点の絶対位置(たとえば、ある定義された基準フレーム内のxyz座標)を意味するが、本発明のMTBシステムが、聴取者の耳の絶対位置を知る必要がなく、その相対位置だけでよいことに留意することが重要である。
信号処理ユニット16が頭の回転を考慮に入れるためにマイクロホン信号をどのように組み合わせるかを説明する前に、図1及び図2に、信号処理ユニット16に直接に供給されるマイクロホン出力が示されていることに留意されたい。しかし、この直接接続は、例示のみのために示されたものであり、実際に使用される構成を反映する必要はない。たとえば、図3に、テレビ会議構成を示す。図示の実施形態では、マイクロホン出力が、マルチプレクサ/送信器ユニット26に供給され、このマルチプレクサ/送信器ユニット26が、通信リンク30を介して、離れて位置するデマルチプレクサ/受信器ユニット28に信号を送信する。通信リンクは、無線リンク、光リンク、電話リンク、又は類似物とすることができる。その結果は、聴取者が、実際にマイクロホン位置にいるかのように、マイクロホンから拾い上げられたサウンドを経験することである。その一方で、図4に、録音構成を示す。図示の例では、マイクロホン出力が、録音ユニット32に供給され、この録音ユニット32は、ディスク、テープ、メモリカード、CD−ROM、又は類似物などの記憶媒体34に録音を保管する。後の再生について、記憶媒体が、コンピュータ/再生ユニット36によってアクセスされ、このコンピュータ/再生ユニット36が、信号処理ユニット16に供給する。
したがって、図からわかるように、信号処理ユニット16は、オーディオ入力を必要とし、その入力は、ジャック、無線入力、光入力、ハードワイヤード接続などの普通の形とすることができる。同一のことが、ヘッドトラッカ18の入力ならびにオーディオ出力にあてはまる。したがって、信号処理ユニット16と他のデバイスの間の接続及び本明細書で使用される用語「入力」及び「出力」が、特定の形に制限されないことを諒解されたい。
次に、図5から図7を参照して、本発明に従ってマイクロホン信号を組み合わせる異なる手順を説明する。説明を単純にするために、片方の耳だけについて説明するが、同一の手順が、必要な変更を加えてもう一方の耳に適用されることを理解されたい。これらの手順のそれぞれが、異なる状況で有用であり、それぞれを順番に説明する。
1つのそのような手順100を、図5に示すが、本明細書ではこれを手順1と呼称する。この手順では、信号処理ユニット16が、角度θを使用して、必ず聴取者の耳の位置に最も近いマイクロホンを使用することによって、マイクロホンを切り替える。これは、実施が最も単純な手順である。しかし、これは、頭の小さい動きに鈍感であり、性能が劣化するか多数のマイクロホンが必要になり、これによって複雑さが増す。更に、切替えは、可聴クリック音を防ぐために洗練されたフィルタリングと組み合わされなければならない。頭の方位がスイッチング境界の前後で移動する時に発生する可能な「チャタ」は、標準的なヒステリシス切替え技法を使用することによって除去することができる。
もう1つのそのような手順120を、図6に示すが、本明細書ではこれを手順2と呼称する。この手順では、信号処理ユニット16が、角度θを使用して、最も近いマイクロホンからの信号と次に近いマイクロホンからの信号の間で補間又は「パン」する。手順2は、マイクロホンの間でパンするが、頭の小さい動きに敏感であり、いくつかの応用例に適する。これは、2つのラウドスピーカの間のみかけの源を生成するために振幅パン式ステレオ録音で使用される原理と本質的に同一の原理に基づく(B.J.Bauer,“Phasor analysis of some stereophonic phenomena”,J.Acoust.Soc.Am.,Vol.33,No.11,pp.1536−1539(Nov.,1961))。この原理を数学的に表すために、x(t)が、時刻tに最も近いマイクロホンによって拾われた信号であり、x(t−T)が、次に近いマイクロホンによって拾われた信号であると仮定するが、Tは、音波があるマイクロホンから次のマイクロホンに伝搬するのに要する時間である。説明を単純にするために、入射波が取付け面に沿って移動する時の入射波の回折に起因する波形の変化は、すべて無視する。これらの変化は、マイクロホンが互いに適度に近い場合に、比較的小さい。
x(t)に、ある周波数fmaxを越える周波数が含まれず、時間遅れTが、約1/(4fmax)未満であり、効率wが0と1の間である場合に、(1−w)x(t)+wx(t−T)≒x(t−wT)であることを示すことができる。したがって、耳への光線と最も近いマイクロホンへの光線との間の角度に従ってパン係数wを変更することによって、時間遅れが2つのマイクロホンからの信号の時間遅れの間の対応する値になる信号を得ることができる。
手順2には、2つの誤差の源がある。第1は、T>1/(4fmax)の時の近似の崩壊である。第2は、2つのマイクロホンの出力が線形に組み合わされるか「ミキシング」される時に必ず生じるスペクトル着色(spectral coloration)である。
信号に対する結果の制限は、アレイ内のマイクロホンの個数Nに関して表すことができる。aが円の半径であり、cが音速であり、dが2つの隣接するマイクロホンの間の距離であるものとする。d=2asin(π/N)≒2πa/Nであり、Tの最大値がd/cなので、近似の崩壊は、信号にfmax≒Nc/(8πa)を超える大きいスペクトル内容が含まれる場合に発生することになる(T=d/cという前提が、音源が2つのマイクロホンをつなぐ直線上に位置するワーストケース状況に対応することに留意されたい。音源への方向が、マイクロホンの間の線に直交する場合には、波面は、それらのマイクロホンに同時に達し、誤差はない。しかし、ワーストケース状況は、たとえば源が真上にあり、耳が最も近いマイクロホンの中間になる位置に聴取者が首を回転した時に発生する、一般的な状況である。ちなみに、本発明人は、T=d/c<1/(4fmax)という条件が、dが1/4波長未満であるという条件と同等であることに気付いた。サンプリング理論から、マイクロホンを使って行っていることが、空間内で音響波形をサンプリングすることであることと、近似の崩壊を、空間サンプリング間隔が大きすぎる時のエイリアスの結果と解釈できることが暗示される)。
数値a=0.0875m、c=343m/s、及びN=8を使用して、fmax≒1.25kHzを得た。言い換えると、8マイクロホンアレイを用いると、ミキシングは、1.25kHzを超える大きいスペクトル内容がある場合に、正しい遅れた信号を生成することができなくなる。この限界は、マイクロホンの間の距離を減らすことによって引き上げることができる。2つのマイクロホンの出力が、線形に組み合わされる時に、到着時間の差も、スペクトルに櫛形フィルタパターンを導入し、これは好ましくない可能性がある。櫛形フィルタの最低周波数ノッチは、f=c/(2d)で発生する。やはり、d≒2πa/Nと仮定すると、f≒Nc/(4πa)≒2fmaxが得られる。fを、関心をもたれる最高周波数の少なくとも1オクターブ上にしたいので、誤差の両方の源が、本質的に同一の条件すなわち、fmax≒Nc/(8πa)を超える大きいスペクトル内容がないという要件につながることがわかる。表1に、a=0.0875mでc=343m/sの時に、この周波数がNに伴ってどのように変化するかを示す。
信号が、fmaxを超える大きいスペクトルエネルギを有しない場合に、手順2は、よい結果を生む。信号が、fmaxを超える大きいスペクトルエネルギを有し、fmaxが、十分に高い(約800Hz)場合に、手順2は、まだ許容可能である可能性がある。その理由は、人間の両耳間時間差に対する感度が、高周波数で鈍るからである。これは、近似の崩壊が関係なくなることを意味する。スペクトル着色が知覚可能になることは真実である。しかし、監視又はテレビ会議などの応用例について、「高忠実度」再生が必要でない可能性がある場合に、手順2の単純さによって、手順2が好ましい選択肢になる場合がある。
第3の、全体的に好ましい手順140を、図7に示すが、本明細書ではこれを手順3と呼称する。この手順では、信号処理ユニット16が、角度θに伴って変化する線形フィルタリング手順を使用して、最も近いマイクロホンと次に近いマイクロホンからの信号を組み合わせる。
手順3では、音響心理学によって誘導される線形フィルタリングを使用して信号を組み合わせる。空間サンプリングによって引き起こされる問題を解く、少なくとも2つの形がある。一方は、空間サンプリングレートを高めることすなわち、マイクロホンの数を増やすことである。他方は、マイクロホン信号を組み合わせる前にアンチエイリアスフィルタを適用し、高周波数を多少復元することである。後者の手法が、手順3の好ましい実施形態である。
手順3では、人間が高周波の両耳間時間差に敏感でないと言う事実を利用する。正弦波について、両耳間位相感度は、800Hzを超える周波数で急激に低下し、約1.6kHzで無視できるようになる(参照によって本明細書に組み込まれるJ.Blauert,Spatial Hearing(Revised Edition),p.149(MIT Press,Cambridge,MA,1996))。図7ならびに図8及び図9を参照すると、下記は、Nマイクロホンアレイの手順3に関連する処理ステップの例であり、この実施形態ではN=8である。
1.ブロック142で、k=1,…,Nについて、x(t)が、マイクロホンアレイのk番目のマイクロホンの出力であるものとする。
2.ブロック144で、約1.0kHzと約1.5kHzの間の範囲のカットオフ周波数fを超える鋭いロールオフを有する低域フィルタを用いてアレイのN個のマイクロホン(たとえば、この実施形態では8個のマイクロホン)のそれぞれの出力をフィルタリングする。k=1,…,Nについて、y(t)が、k番目の低域フィルタの出力であるものとする。
3.ブロック146で、手順2と同様にこれらのフィルタの出力を組み合わせて、低域出力zLP(t)を生成する。たとえば、右耳の信号を検討されたい。αが、右耳28への光線30と最も近いマイクロホン14closestへの光線32との間の角度であり、αが、2つの隣接するマイクロホン、たとえばこの例ではマイクロホン14closest及びマイクロホン14next_closestへの光線の間の角度であるものとする。yclosest(t)が、最も近いマイクロホン14closestの低域フィルタ200の出力であり、ynext(t)が、次に近いマイクロホン14next_closestの低域フィルタ202の出力であるものとする。すると、右耳の低域出力は、zLP(t)=(1−α/α)yclosest(t)+(α/α)ynext(t)によって与えられる。左耳の低域フィルタ出力は、同様に作られ、左耳信号の処理要素は、上で説明したものの複製なので、説明を明瞭にするために図9から省略した。
4.ブロック148で、相補型マイクロホン300を導入する。相補型マイクロホンの出力x(t)は、相補型高域フィルタ204によってフィルタリングされる。zHP(t)が、この高域フィルタの出力であるものとする。相補型マイクロホンは、別々のマイクロホン、アレイ内のマイクロホンの1つ、又はアレイ内のマイクロホンの出力を組み合わせることによって作成される「仮想」マイクロホンとすることができる。更に、右耳と左耳に異なる相補型マイクロホンを使用することができる。相補型マイクロホンのさまざまな代替実施形態ならびにこれらの代替形態の長所及び短所を、下で述べる。
5.次に、ブロック150で、高域フィルタリングされた相補信号の出力を、低域補間信号に加算し、結果の信号z(t)=zLP(t)+zHP(t)を、ヘッドホンに送る。やはり、右耳の信号と左耳の信号を別々に処理しなければならないことを観察されたい。一般に、信号zLP(t)は、右耳と左耳で異なる。下の代替案A、B、及びCについて、信号zHP(t)は、両方の耳で同一であるが、代替案Dでは異なる。
上で説明した信号処理が、信号処理ユニット16によって実行されることと、普通の低域フィルタ、高域フィルタ、加算器、及び他の信号処理要素が使用されることを諒解されたい。更に、信号処理ユニット16に、信号処理を実行するコンピュータ及び関連するプログラミングが含まれる。
手順3が、よい結果を生じることに留意されたい。これは、手順1及び手順2より実施が複雑であるが、この手順はすべてのスペクトル範囲を忠実にカバーする信号を生成するので、高忠実度再生の好ましい実施形態である。fを超えるスペクトル成分の両耳間時間差(ITD)は、制御されないが、人間の耳は、この周波数を超える位相に鈍感である。その一方で、f未満のITDは、正しく、左右方向の音の正しい時間的定位の手がかりにつながる。
を超えると、両耳間レベル差(ILD)が、最も重要な定位の手がかりを提供する。高周波数ILDは、相補型マイクロホン信号が正確にどのように入手されるかに依存する。これは、次に説明するマイクロホンの物理的取付け及び構成の後で説明する。
前に述べたように、マイクロホンアレイのマイクロホンは、物理的に異なる形で取り付けることができる。たとえば、固いワイヤ又は棒によって支持することによって、空間内に効果的に吊るすことができ、固い球の表面に取り付けることができ、あるいは、固い楕円体又は切り取られた円筒形又は八角形の箱など、垂直軸回りの回転の表面に取り付けることができる。
上で説明した実施形態で、マイクロホンのアレイが使用されるが、マイクロホンを均一な間隔にする必要がないことに留意することが重要である。
本発明によれば、3つの異なるクラスの応用例も区別され、これを、全方向性応用例、パノラマ応用例、及び収束応用例と呼ぶ。これまでに説明した実施形態は、パノラマ応用例に関するものである。
全方向性応用例では、聴取者が、好ましい方位を有しておらず、マイクロホンは、すべての表面(図示せず)で均一の間隔である必要がある。上で説明したパノラマ応用例では、聴取者の頭部の垂直軸が、通常は水平のままになるが、聴取者は、任意の向きに向くように回転することを望む可能性が同等に高い。この場合に、マイクロホンは、上で示したように、水平の円に沿って、好ましくは均等に離隔される。収束応用例では(コンサート、劇場、映画、テレビジョン、又はコンピュータモニタを見ることが典型である)、ユーザは、非常に好ましい方位を有する。この場合に、マイクロホンを、図10に示されているように、期待される耳の位置の近くでより密に離隔させて、より高いカットオフ周波数の使用に必要な又はこれを可能にするマイクロホンの数を減らすことができる。
これらの代替クラスの応用例ならびにマイクロホンの構成及び取付け表面のそれぞれが、異なるマイクロホン間時間遅れ及び異なるスペクトル着色を生じる。具体的に言うと、自由空間釣り下げは、表面取付け選択肢のどれよりも短い時間遅れにつながり、より大きい半径の必要につながる。表面取付け選択肢では、マイクロホンピックアップは、もはや全方向性でない。そうではなく、マイクロホンピックアップは、表面のサウンド散乱特性を継承する。たとえば、球面又は切り取られた円筒形表面について、高周波応答は、マイクロホンの同側での源の低周波応答より約6dB高くなり、高周波応答は、対側の源の取付け表面のサウンドシャドウ(sound shadow)によって、より大きく減衰する。取付け表面の影響を使用して、正しい両耳間レベル差ならびに正しい両耳間時間差を取り込めることにも留意されたい。
異なる取付け構成が、ヘッドトラッカの異なる要件につながる可能性があることは、観察に値する。たとえば、全方向性応用例について、方位角と仰角の両方を追跡しなければならない。パノラマ応用例について、対象の音源を、水平面内又はその近くで突き止めなければならない。この場合に、マイクロホンの取付けにどの表面が使用されるかにかかわりなく、水平の円の周囲に位置決めすることが好ましい可能性がある。これによって、方位角だけを測定する、より単純なヘッドトラッカを使用することが可能になる。
これまでは、暗黙のうちに、マイクロホンアレイが静止していると仮定してきた。しかし、MTBアレイを、車両、モバイルロボット、あるいは人又は動物に取り付けられない理由はない。たとえば、マイクロホンを担持するヘッドバンド又はカラーを身に着けた人からの信号を、他の聴取者に送信し、その聴取者が、移動する人が聞くものを経験することができる。移動応用例について、位置トラッカをMTBアレイに組み込むことが有利である可能性がある。すなわち、アレイが、回転され、並進される場合に、MTBアレイの回転を、聴取者の頭部の回転と組み合わせて、回転的に安定したサウンドイメージを維持することができる。
取付け表面のサイズを、聴取者の頭部のサイズに近くしなければならないと言った。しかし、MTBの可能な水中応用例もある。水中の音速は、空中の音速の約4.2倍なので、取付け表面のサイズを、それ相応にスケーリングしなければならない。これによって、媒体によって導入される両耳間時間差及び両耳間レベル差の変化の両方が訂正される。水中リモートリスニングについて、聴取者は、地上、船上、又は水中とすることができる。具体的に言うと、ダイバーが、ダイビングヘルメットに含まれるMTBアレイを有することができる。水中で経験される不自然に小さい両耳間時間差及び両耳間レベル差の故に、ダイバーが音源を定位するのが難しいことが周知である。ヘルメットマウントMTBアレイは、この問題を解決することができる。ダイバーが、唯一の聴取者であり、ヘルメットが、ダイバーの頭と共に回転する場合に、2つのマイクロホンを使用することで十分であり、ヘッドトラッキングなしで済ませることができる。しかし、誰かが、ダイバーが聞いているものを聞きたいと思う場合、又はダイバーがヘルメットの中で頭を回せる場合には、マルチマイクロホンMTBアレイが必要である。最後に、他のモバイル応用例と同様に、MTBアレイに取り付けられたトラッカを使用して、回転的に安定化されたサウンドイメージを維持することが望ましい。
球は、理想的な取付け表面であるように見えるが、特定の全方向応用例について、他の表面が実際に好ましい場合がある。球の極端な対称性が、「輝点」の展開をもたらし、この輝点は、球の、音源と正反対にある側での不自然な強い応答である。楕円体又は切り取られた円筒形は、より弱い輝点を有する。実用的な製造及び組立の考慮では、切り取られた円筒形が優先され、長方形、六辺形、又は八辺形の箱が好ましい場合がある。しかし、説明を単純にするために、この文書の残りでは、アレイマイクロホンが固い球に取り付けられると仮定する。
上で注記したように、表面に取り付けられたマイクロホンは、その表面のサウンド散乱特性を継承する。応答挙動の結果の異方性は、正しい両耳間レベル差につながるので、実際にはアレイマイクロホンに望ましい。しかし、高周波情報を音源に対するマイクロホンの方向と独立にしたい場合に、異方性は、高周波情報を伝える相補型マイクロホンに関する問題を生じる可能性がある。これによって、本発明人は、手順3で使用される相補型マイクロホンを実施する代替の形を検討することになった。
相補型マイクロホンの目的は、Nアレイマイクロホン信号の低域フィルタリングによって除去される高周波情報を復元することである。図7Bを参照すると、152に示されているように、この相補型マイクロホン信号を入手する、少なくとも5つの形があり、そのそれぞれが、独自の長所及び短所を有する。
代替案A:別々の相補型マイクロホンを使用する。この場合に、別々のマイクロホンが、高周波信号を拾うのに使用される。たとえば、これは、球の最上部に取り付けられた全方向性マイクロホンとすることができる。ピックアップは、球の下の音源について球の陰になるが、水平面内の音源について均一のカバレッジを提供する。
長所
(1)概念上単純である。
(2)帯域幅効率が良い。相補型マイクロホンは、全オーディオ帯域幅(CD品質で22.05kHz)を必要とするが、N個のアレイマイクロホンのそれぞれは、fの帯域幅だけを必要とする。たとえば、N=8、f=1.5kHzの場合に、8つのアレイマイクロホンは、一緒に、12kHzだけの帯域幅を必要とする。したがって、システム全体は、普通の2チャネルステレオCDを超える帯域幅を必要としない。
短所
(1)別のチャネルが必要である。これは、それ以外の点では魅力的なN=8アレイマイクロホンに関する短所である。というのは、8トラックレコーダ及び8チャネルA/Dコンバータが、市販製品で一般的であるが、この場合には9チャネルが必要になるからである。
(2)異方性。空間の半分について球の陰にならずに、物理的な相補型マイクロホンを置く場所がない。
(3)ILDが正しくない。同一の高周波信号が、左耳と右耳の両方に使用される時に、高周波両耳間レベル差(ILD)がない。これは、高周波エネルギがない音源については問題を起こさないが、低周波エネルギがない音源は、聴取者の耳の中心に定位される傾向がある。更に、広帯域源の衝突する手がかりが生じる。これによって、通常は、定位のぼけが増え、「分裂したイメージ」すなわち、あるべき位置の低周波源と頭の中心の高周波源の2つの源の知覚の形成につながる可能性がある。
代替案B:アレイマイクロホンの1つを使用する。相補型マイクロホンとして、アレイマイクロホンの1つを任意に選択する。
長所
(1)概念上単純である。
(2)帯域幅効率が良い(代替案Aと同一)。
(3)追加チャネルの必要がなくなる。
短所
(1)水平面内の源に関する異方性。相補型マイクロホンにどのマイクロホンが選択されても、そのマイクロホンは、反対側の源について、球のサウンドシャドウ内にある。これは、収束応用例については許容可能であり、望ましい場合もあるが、全方向性応用例又はパノラマ応用例については許容不能である可能性がある。
(2)ILDが正しくない(代替案Aと同一)。
代替案C:1つの動的に切り替えられるアレイマイクロホンを使用する。ヘッドトラッカ出力を使用して、聴取者の鼻に最も近いマイクロホンを選択する。
長所
(1)追加チャネルの必要がなくなる。
(2)異方性応答を使用して、前後の区別の追加の改善を得ることができる。後ろの源の頭のシャドウが、欠けている「耳介シャドウ」のある度合の置換物になる。
短所
(1)もはや帯域幅効率が良くない。どのチャネルが相補チャネルに使用されているかを知る方法がないので、N個のチャネルのすべてが、全オーディオ帯域幅を伝送するか録音しなければならない。しかし、監視など、単一ユーザ応用例について、帯域幅を維持することができる。というのは、その聴取者のために必要な1つの全帯域幅チャネルを、マイクロホンの間で動的に切り替えることができるからである。
(2)代替案Dで述べるように、スイッチング遷移を除去するために追加の信号処理が必要である。
(3)ILDが正しくない(代替案Aと同一)。
代替案D:2つの動的に切り替えられるアレイマイクロホンから仮想相補型マイクロホンを作成する。この選択肢では、右耳と左耳に異なる相補信号を使用する。所与の耳について、相補信号は、その耳に最も近い2つのマイクロホンから導出される。これは、低周波信号を入手する形に非常に似た形である。しかし、2つのマイクロホンの間のパン(許容不能な櫛形フィルタスペクトル着色を導入する)ではなく、2つのマイクロホンの間で切り替え、最も近いマイクロホンを常に選択する。この形で、球が、正しい両耳間レベル差を自動的に提供する。
長所
(1)追加チャネルの必要がない。
(2)ILDが正しい。
短所
(1)もはや帯域幅効率が良くない(代替案Cと同一)。
(2)スイッチング遷移を除去するために追加の信号処理が必要である。
(3)スペクトルの変化が可聴である。信号が突然に切り替えられる場合に、聴取者は、通常は、信号の不連続性によって生じるクリック音を聞く。頭の位置が本質的に切替え境界上にあり、頭の小さい震えによって頭が切替え境界をまたいで移動する時に信号が素早く2つのマイクロホンの間で切り替えられる場合に、これが特に迷惑になる。結果の一連の素早いスイッチング遷移が、非常に迷惑な「がたがたする」音を生じる可能性がある。がたがたする問題は、ヒステリシスを導入する標準的な技法によって簡単に解決される;スイッチング境界を越えたならば、スイッチング回路は、元に戻って切り替わる前に、元の領域へのある最小の角度の移動を必要とする。あるマイクロホンから別のマイクロホンに切り替える時に発生する不可避の不連続性は、単純なクロスフェード技法によって減らすことができる。瞬間的に切り替えるのではなく、第1信号のフェードアウトするバージョンと第2信号のフェードインするバージョンを加算することによって信号を導出することができる。結果は、第1信号がフェードアウトし、第2信号がフェードインする時間間隔Tfadeの長さに依存する。シミュレーション実験から、スイッチング遷移が、Tfade=10msの時に非常に弱く、Tfade=20msの時に聞き取れないことが示された。これらの数字は、ヘッドトラッカのデータレート(通常はサンプリングの間に約10msから20ms)に対して全く互換である。しかし、仮想相補型マイクロホンが変更される時、特に源がMTBアレイに近い時に、スペクトルの変化を聞くことができる場合がある。
代替案E:2つのアレイマイクロホンのスペクトルの間で補間し、時間的信号を再同期化することによって仮想相補型マイクロホンを作成する。代替案Dと同様に、この選択肢は、右耳と左耳に異なる相補信号を使用し、所与の耳について、相補信号が、その耳に最も近い2つのマイクロホンから導出される。代替案Eでは、耳に最も近い2つのマイクロホンの間で切り替えるのではなく、正しく補間することによって、代替案Dの知覚可能なスペクトル変化を除去する。問題は、フェーズキャンセレーション(phase cancellation)効果に出会わずにマイクロホン信号の高周波数部分を滑らかに組み合わせることである。高周波で耳が位相に鈍感であることを利用する基本的な解決策では、(a)各マイクロホンからの信号の短時間スペクトルを推定するステップと、(b)スペクトルの間で補間するステップと、(c)スペクトルから時間波形を再合成するステップとが用いられる。スペクトル分析、変更、及び再合成によって処理される信号という問題は、信号処理分野で周知である。古典的な方法に、(a)高速フーリエ変換分析及び再合成と、(b)フィルタバンク分析及び再合成とが含まれる。
長所
(1)追加チャネルの必要がない。
(2)ILDが正しい。
(3)スイッチング遷移又はスペクトルアーティファクトがない。
短所
(1)もはや帯域幅効率が良くない(代替案Cと同一)。
(2)計算要件が高い。
この5つの代替実施形態のいずれかを選好するのに適当な状況は、次のように要約することができる:代替案Aは、帯域幅効率が主な関心事である時に好ましい;代替案Bは、収束応用例にとってよい妥協である;代替案Cは、帯域幅のコストが許容可能である場合に、リモートリスニング(テレビ会議)に魅力的である;代替案Dは、代替案Eの性能に近いものとすることができる性能を、はるかに低い計算出費で提供する;代替案Eは、最大のリアリズムが主な関心事である時に好ましい。
表2に、手順1及び2と、代替案A及び代替案Dに関する手順3との長所及び短所を要約する。
MTBが、音場に球などの表面を挿入し、聴取者の耳が位置するはずの場所の近くの圧力を感知することによって、聴取者の耳に存在するはずの音場を取り込むことを試みることに留意されたい。これにより正しくない近似が生じる可能性がある2つの主な形がある。
1.頭のサイズの不一致。球が聴取者の頭部より小さい場合に、作られる両耳間差は、聴取者が通常経験する差より小さい。逆に、球が聴取者の頭部より大きい場合に、作られる両耳間差は、聴取者が通常経験する差より大きい。静的な定位誤差を生じるほかに、これは、聴取者が頭を回す時の音源の定位の不安定さにつながる。球が、聴取者の頭部より小さい場合に、源は、聴取者に伴って少し回転するように見えるが、球がより大きい場合には、源は、聴取者の動きと反対に回転するように見える。
2.耳介手がかりがない。外耳又は耳介が、最終的に鼓膜に達する音のスペクトルを変更することと、この変更が、方位角と仰角の両方に伴って変化することが、明確に確認されている。このスペクトル変化によって、源の仰角を判断するのに特に重要な耳介手がかりが作られる。その正確な性質は、複雑であり、人によって大きく異なる。しかし、主な特性は、その中心周波数が仰角に伴って規則正しく変化するスペクトルノッチである。このスペクトル変更は、源が頭上にある時に最小になる。MTB表面には、耳介が含まれないので、対応するスペクトル変化がない。高い仰角に対応する変化がないので、ほとんどの聴取者は、実際の角度にかかわりなく、源が多少上にあると知覚する。
この2つの問題を完全に訂正する一般的な手順は、知られていない。しかし、特殊であるが重要な状況に関する有用な方法がある。
頭サイズの不一致は、聴取者が通常はだいたい1方向を見ている収束応用例について、簡単に訂正することができる。aが球の半径であり、bが聴取者の頭部の半径であり、θが頭の回転角度であるものとする。真上に置かれている源のみかけの位置は、マイクロホンデータを処理する時にθの代わりに(b/a)θを使用することによって安定化することができる。この単純な訂正は、小さい角度の頭回転についてよく働く。更に、この技法を使用するために、聴取者の頭部の半径を測定する必要はない。θの代わりにαθを使用し、イメージが安定するまで係数αを聴取者に調整させるだけでよい。
問題の音源が、だいたい水平面内にある場合にも、耳介手がかりのなさを訂正することが可能である。この場合に、耳介の伝達関数を近似するフィルタを、各耳への信号パスに導入し、ユーザに、サウンドイメージが水平面内にあるように見えるまでフィルタパラメータを調整させる。
前述の説明から、本発明の背後にある一般的な概念が、(a)すべての可能な頭の方位について耳の位置の近くの点での音場をサンプリングするのに複数のマイクロホンを使用することと、(b)聴取者の耳からマイクロホンのそれぞれまでの距離を判定するのにヘッドトラッカを使用することと、(c)マイクロホン出力を低域フィルタリングすることと、(d)聴取者の耳の位置に置かれているマイクロホンによって拾い上げられるはずの信号の低周波数部分を推定するために、低域フィルタリングされた出力を線形に補間する(同等に、重み付けする、組み合わせる、「パン」する)ことと、(e)高周波内容を再挿入することとであることを諒解されたい。これと同一の原理を、さまざまな代替の形で実施し、拡張することができる。下記は、代替案に含まれる。
1.非常に少数又は非常に多数のいずれかのマイクロホンの使用。少数のマイクロホンは、低域フィルタのカットオフ周波数が適当に調整される場合に使用することができる。2つのマイクロホンだけでも、源がマイクロホンの正中面に近すぎない限り、動的変更の利益を得ることが可能である。その代わりに、非常に多数のマイクロホンを経済的に使用できる場合に、低域フィルタリングステップ及び高周波数復元ステップを省略することができる。十分な個数のマイクロホンがあれば、補間手順を単純な切替えに置換することができる。
2.球の表面全体にマイクロホンを取り付け、ヘッドトラッカを使用して聴取者の仰角及び方位角を両方を感知することによる、図8に示された構成の一般化。最も近いマイクロホンと次に近いマイクロホンは、もはや水平面内にある必要がなく、任意の頭の回転に対処することができる。
3.頭の下の人工胴体の導入。胴体によるサウンドの散乱によって、仰角及びエクスターナライゼーションの両方に役立つ可能性がある追加の定位手がかりがもたらされる。胴体の導入によって、マイクロホンアレイがはるかに大きく不体裁になるが、これは、要求の過酷な特定の応用例について正当化される可能性がある。
4.望まれないサウンド拾い上げを拒絶し又は減らすためのマイクロホンアレイによる各マイクロホンの置換。これは、望まれないサウンドが高い仰角又は低い仰角のいずれかにあり、MTB表面が切り取られた円筒である時に、特に魅力的である。この場合に、各マイクロホンを、マイクロホンの垂直の列によって置換することができ、これらのマイクロホンの出力を組み合わせて、水平面外の感度を下げることができる。
5.音響方向ファインダとしてMTBアレイを使用するための、2つの同心MTBアレイの使用。たとえば、図11に示されているように、頭のサイズの球402に取り付けられる小さいアレイのマイクロホン400と、球からのびる剛体の棒406に取り付けられるより大きいアレイのマイクロホン404。小さいMTBアレイは、普通に使用され、聴取者は、源に面するように回転する。次に、聴取者は、大きいMTBアレイに切り替える。聴取者が、源を直接に指している場合に、源のイメージが、センタリングされて見える。小さい頭の動きが、イメージの拡大された動きをもたらし、これによって、源を定位するのが簡単になる。
特に人気のあるサラウンドサウンドシステムを用いて空間音響を録音する多数の代替技法があることを諒解されたい。本発明を使用して、ヘッドホンを介して既存の空間音響録音を再生できることが望ましい。
上で述べたように、直接の手法は、技術的現状のサラウンドサウンドシステムの「スイートスポット」にマイクロホンアレイを置いて、既存の録音を再録音することである。これは、最適のリスニング経験を聴取者に与えるという長所を有する。その一方で、過去の商業的経験から、同一内容を複数のフォーマットで公に提示することが望ましくないことが示されている。
代替の手法は、シミュレートされたラウドスピーカを使用してシミュレートされた室内でシミュレートされたマイクロホンを励起することによって、再録音のプロセスをシミュレートすることである。最も単純な情況で、球形頭モデル(参照によって本明細書に組み込まれるV.R.Algazi,R.O.Duda and D.M.Thompson,“The use of head−and−torso models for improved spatial sound synthesis”,Preprint 5712,113th Convention of the Audio Engineering Society(Los Angeles,CA,Oct.5−8,2002))を使用して、マイクロホンアレイの特定のマイクロホンが仮想ラウドスピーカのそれぞれから拾い上げる信号を計算することができる。より高いリアリズムのために、部屋モデルを使用して、部屋の反射及び反響の影響をシミュレートすることができる(参照によって本明細書に組み込まれるD.B.Begault,3−D Sound for Virtual Reality and Multimedia(AP Professional,Boston,1994))。この信号処理手順は、オリジナル録音フォーマットの信号を本発明のMTB(モーショントラックドバイノーラル)フォーマットの信号に変換する特殊なリアルタイムハードウェアですぐに実施することができる。普通の再生ユニットからの信号をそのようなフォーマットコンバータを介してルーティングすることによって、1人又は複数の聴取者が、ヘッドホンを介して任意のCD又はDVDを聞き、なおかつ頭の動きへの応答性の利益を享受することができる。
MTBの同一の長所を、仮想聴覚空間の作成及びデータのスペイシャライズされた聴覚ディスプレイの両方について、完全にコンピュータ生成されるサウンドのレンダリングのために実現することができる。必要なものは、シミュレートされたMTBマイクロホンアレイによって取り込まれるサウンドを計算することだけである。計算されたマイクロホン信号を、物理的なマイクロホンからの信号の代わりに使用することができ、その結果、1人又は複数の聴取者が、ヘッドホンを介してその仮想サウンドを聞き、なおかつ頭の動きへの応答性の利益を享受することができる。生の物理的マイクロホン、録音された物理的マイクロホン、及びシミュレートされたマイクロホンの使用をカバーするために、請求項では、物理的マイクロホンによって拾われた信号、物理的マイクロホンから録音された信号、及びシミュレートされたマイクロホンについて計算された信号を、マイクロホン出力を「表す」信号と呼称する。
したがって、理解されるように、本発明の好ましい実施形態では、サウンド取込に3つ以上のマイクロホンを使用し;聴取者の頭部の方位を測定するのにヘッドトラッキングデバイスを使用し;マイクロホンの出力を組み合わせるのに音響心理学に基づく信号処理技法を使用する。本発明は、「自然に発生するサウンド」(部屋の反射及び反響を含む)を録音し、少ない固定された個数のチャネルを使用して、聴取者の頭部の動きと独立の仮想的な聴覚の源の安定した定位;よいフロンタルエクスターナライゼーション;及びほとんど又は全くない前後の混乱を聴取者に与えるために静的バイノーラル録音の主な制限を解決する能力を有する。本発明は、更に、生サウンドの「録音」に対処する。生のサウンドに関して、知覚的に重要なエコー及び反射は言うまでもなく、すべての音源について別々の信号を入手することが困難又は不可能であり、源の位置は、通常は未知である。更に、本発明を用いると、少数の固定された個数のチャネルがあり、適当なHRTFが、マイクロホンアレイによって自動的に作られ、複雑な実際の部屋のエコー及び反響が、自動的に取り込まれる。
上の説明に、多数の詳細が含まれるが、これらを、本発明の範囲を制限するものと解釈してはならず、これらは、単に、本発明の現在好ましい実施形態の一部の例示を提供するものである。したがって、本発明の範囲が、当業者に明白になる可能性がある他の実施形態を完全に含むことと、したがって、本発明の範囲が、請求項以外の何ものによっても制限されず、請求項では、単数形の要素への言及が、明示的に述べられない限り「唯一の」を意味するのではなく、「1つ又は複数の」を意図されていることを諒解されたい。当業者に既知の、上で説明した好ましい実施形態の要素の構造的同等物、化学的同等物、及び機能的同等物のすべてが、参照によって本明細書に特に組み込まれ、請求項に含まれることが意図されている。更に、請求項に含まれるので、装置又は方法が本発明によって解決が求められる各すべての問題に対処する必要はない。更に、本開示の要素、構成要素、又は方法ステップは、その要素、構成要素、又は方法ステップが請求項に明示的に具陳されるかどうかにかかわらずに、公に捧げることを意図されたものではない。本明細書の請求項の要素は、その要素が句「〜の手段」を使用して明示的に具陳されない限り、米国特許法第112条第6項の規定の下で解釈されてはならない。
Figure 2006503526
Figure 2006503526
本発明による動的なバイノーラルサウンドの取込及び再生のシステムの実施形態を示す概略図である。 ヘッドトラッキングを示す、図1に示されたシステムを示す概略図である。 テレビ会議用に構成された図2に示されたシステムの実施形態を示す概略図である。 録音及び再生用に構成された図2に示されたシステムの実施形態を示す概略図である。 本発明によるヘッドトラッキングの方法の第一実施形態を示す図である。 本発明によるヘッドトラッキングの方法の第2実施形態を示す図である。 本発明によるヘッドトラッキングの方法の第3実施形態を示す図である。 図7に示された方法によるヘッドトラッキングを例示する概略図である。 図7及び図8に示されたヘッドトラッキングの方法による信号処理の実施形態を示すブロック図である。 本発明による収束マイクロホン構成を示す概略図である。 本発明による方向発見マイクロホン構成を示す概略図である。

Claims (30)

  1. 信号処理ユニットを含むサウンド再生装置であって、
    前記信号処理ユニットは、オーディオ出力デバイスに接続される出力端子を有し、
    前記信号処理ユニットは、ヘッドトラッキングデバイスに接続される入力端子を有し、
    前記信号処理ユニットは、位置決めされた複数のマイクロホンの出力を表す信号を受信して、聴取者の頭部が音場内で前記複数のマイクロホンの位置に置かれている場合に、前記聴取者の耳の可能な位置を表す点で前記音場をサンプリングするように構成されており、
    前記信号処理ユニットが、前記ヘッドトラッキングデバイスによって示される前記聴取者の頭部の方位に応答して、前記マイクロホンの出力信号を処理し、そして、前記オーディオ出力デバイスにバイノーラル出力を提示するように構成されている
    ことを特徴とする装置。
  2. 前記信号処理ユニットは、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの出力を表す信号を組み合わせるように構成されている、請求項1に記載の装置。
  3. 前記信号処理ユニットが、
    前記マイクロホンの出力信号の各々に関連付けられた低域フィルタと、
    前記低域フィルタの出力を組み合わせて、前記聴取者の耳用の組み合わされた出力信号を生成するための手段であって、前記組み合わされた出力信号が、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号の組合せを含んでいるところの手段と
    を含む、請求項1に記載の装置。
  4. 信号処理ユニットが、更に、
    前記音場内に置かれた相補型マイクロホンから出力信号を提供するように構成された高域フィルタと、
    前記高域フィルタからの前記出力信号を、前記聴取者の耳用の前記組み合わされた出力信号と組み合わせる手段と
    を含む、請求項3に記載の装置。
  5. 信号処理ユニットを含むサウンド再生装置であって、
    前記信号処理ユニットは、オーディオ出力デバイスに接続される出力端子を有し、
    前記信号処理ユニットは、ヘッドトラッキングデバイスに接続される入力端子を有し、
    前記信号処理ユニットは、位置決めされた複数のマイクロホンの出力を表す信号を受信して、聴取者の頭部が音場内で前記複数のマイクロホンの位置に置かれている場合に、前記聴取者の右耳及び左耳の可能な位置を表す点で前記音場をサンプリングするように構成されており、
    前記信号処理ユニットが、前記ヘッドトラッキングデバイスによって示される前記聴取者の頭部の方位に応答して、マイクロホンの出力信号を組み合わせ、そして、前記オーディオ出力デバイスにバイノーラル出力を提示するように構成されている
    ことを特徴とする装置。
  6. 前記信号処理ユニットは、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の左耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの出力を表す信号を組み合わせるように構成されており、そして、
    前記信号処理ユニットは、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の右耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの出力を表す信号を組み合わせるように構成されている、
    ことを特徴とする、請求項5に記載の装置。
  7. 前記信号処理ユニットが、
    前記マイクロホンの出力信号の各々に関連付けられた低域フィルタと、
    前記低域フィルタの出力を組み合わせて、前記聴取者の左耳用の組み合わされた出力信号を生成するための手段であって、前記組み合わされた出力信号が、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の左耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンの前記出力を表す信号の組合せを含んでいるところの手段と、
    前記低域フィルタの出力を組み合わせて、前記聴取者の右耳用の組み合わされた出力信号を生成するための手段であって、前記組み合わされた出力信号が、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の右耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンの前記出力を表す信号の組合せを含んでいるところの手段と
    を含む、請求項5に記載の装置。
  8. 前記信号処理ユニットが、
    前記音場内に置かれた左耳相補型マイクロホンからの出力を提供するように構成された左耳高域フィルタと、
    前記音場内に置かれた右耳相補型マイクロホンからの出力を提供するように構成された右耳高域フィルタと、
    前記左耳高域フィルタからの前記出力を、前記聴取者の左耳用の前記組み合わされた出力と組み合わせる手段と、
    前記右耳高域フィルタからの前記出力を、前記聴取者の右耳用の前記組み合わされた出力と組み合わせる手段と
    を含む、請求項7に記載の装置。
  9. 信号処理ユニットを含むサウンド再生装置であって、
    前記信号処理ユニットは、オーディオ出力デバイスに接続される出力端子を有し、
    前記信号処理ユニットは、ヘッドトラッキングデバイスに接続される入力端子を有し、
    前記信号処理ユニットは、位置決めされた複数のマイクロホンの出力を表す信号を受信して、聴取者の頭部が音場内で前記複数のマイクロホンの位置に置かれている場合に、前記聴取者の耳の可能な位置を表す点で前記音場をサンプリングし、前記ヘッドトラッキングデバイスによって示される前記聴取者の頭部の方位に応答して、前記マイクロホンの出力信号を処理し、そして、前記オーディオ出力デバイスにバイノーラル出力を提示する手段を含む
    ことを特徴とする装置。
  10. 前記信号処理ユニットが、更に、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号を組み合わせる手段を含んでいる、請求項9に記載の装置。
  11. 前記信号処理ユニットが、更に、
    前記マイクロホンの出力信号の各々に関連付けられた低域フィルタと、
    前記低域フィルタの出力を組み合わせて、前記聴取者の耳用の組み合わされた出力信号を生成するための手段であって、前記組み合わされた出力信号が、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンの前記出力を表す信号の組合せを含んでいるところの手段と
    を含む、請求項9に記載の装置。
  12. 信号処理ユニットが、更に、
    前記音場内に置かれた相補型マイクロホンから出力信号を提供するように構成された高域フィルタと、
    前記高域フィルタからの前記出力信号を、前記聴取者の耳用の前記組み合わされた出力信号と組み合わせる手段と
    を含む、請求項11に記載の装置。
  13. 聴取者の頭部が音場内で複数のマイクロホンの位置に置かれている場合に、聴取者の耳の可能な位置を表す点で前記音場をサンプリングするように位置決めされた複数のマイクロホンと、
    信号処理ユニットと
    を含む、動的なバイノーラルサウンドを取り込み、そして、再生するための装置であって、
    前記信号処理ユニットは、オーディオ出力デバイスに接続される出力端子を有し、
    前記信号処理ユニットは、ヘッドトラッキングデバイスに接続される入力端子を有し、
    前記信号処理ユニットは、前記ヘッドトラッキングデバイスによって示される前記聴取者の頭部の方位に応答して、マイクロホンの出力信号を処理し、そして、前記オーディオ出力デバイスにバイノーラル出力を提示するように構成されている
    ことを特徴とする装置。
  14. 前記マイクロホンが、前記聴取者の頭部の半径と近似する半径を有する、表面に沿った環状アレイ内に位置決めされる、請求項13に記載の装置。
  15. 前記信号処理ユニットは、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号を組み合わせるように構成されている、請求項13に記載の装置。
  16. 前記信号処理ユニットが、
    前記マイクロホンの出力信号の各々に関連付けられた低域フィルタと、
    前記低域フィルタの出力を組み合わせて、前記聴取者の耳用の組み合わされた出力信号を生成するための手段であって、前記組み合わされた出力信号が、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号の組合せを含んでいるところの手段と
    を含む、請求項13に記載の装置。
  17. 前記音場内に置かれる相補型マイクロホンと、
    前記相補型マイクロホンから出力信号を提供するように構成された高域フィルタと、
    前記高域フィルタからの前記出力信号を、前記聴取者の耳用の前記組み合わされた出力信号と組み合わせる手段と
    を含み、前記低域フィルタによって除去された高周波数内容が、再挿入される、
    請求項16に記載の装置。
  18. 前記相補型マイクロホンが、本質的に、前記複数のマイクロホンにおける前記マイクロホンとは異なるマイクロホン、前記複数のマイクロホンにおける前記マイクロホンのうちの1つ、前記複数のマイクロホンのうちの複数の動的に切り替えられるマイクロホンからの信号から生成される仮想マイクロホン、及び、前記複数のマイクロホンのうちの2つのマイクロホンからの信号のスペクトル補間によって生成される仮想マイクロホンからなる群から選択される実際の又は仮想的なマイクロホンを含む、請求項17に記載の装置。
  19. 聴取者の頭部が音場内で複数のマイクロホンの位置に置かれている場合に、聴取者の左耳及び右耳の可能な位置を表す点で前記音場をサンプリングするように位置決めされた複数のマイクロホンと、
    信号処理ユニットと
    を含む、動的なバイノーラルサウンドを取り込み、そして、再生するための装置であって、
    前記信号処理ユニットは、オーディオ出力デバイスに接続される出力端子を有し、
    前記信号処理ユニットは、ヘッドトラッキングデバイスに接続される入力端子を有し、
    前記信号処理ユニットは、前記ヘッドトラッキングデバイスによって示される前記聴取者の頭部の方位に応答して、マイクロホンからの出力信号を組み合わせ、そして、前記オーディオ出力デバイスにバイノーラル出力を提示するように構成されている
    ことを特徴とする装置。
  20. 前記マイクロホンが、前記聴取者の頭部の半径と近似する半径を有する、表面に沿った環状アレイ内で位置決めされる、請求項19に記載の装置。
  21. 前記信号処理ユニットは、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の左耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの出力を表す信号を組み合わせるように構成されており、そして、
    前記信号処理ユニットは、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の右耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号を組み合わせるように構成されている、
    ことを特徴とする、請求項19に記載の装置。
  22. 前記信号処理ユニットが、
    前記マイクロホンの出力信号の各々に関連付けられた低域フィルタと、
    前記低域フィルタの出力を組み合わせて、前記聴取者の左耳用の組み合わされた出力信号を生成するための手段であって、前記組み合わされた出力信号が、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の左耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号の組合せを含んでいるところの手段と、
    前記低域フィルタの出力を組み合わせて、前記聴取者の右耳用の組み合わされた出力信号を生成するための手段であって、前記組み合わされた出力信号が、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の右耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号の組合せを含んでいるところの手段と
    を含む、請求項19に記載の装置。
  23. 前記信号処理ユニットが、
    前記音場内に置かれた左耳相補型マイクロホンからの出力を提供するように構成された左耳高域フィルタと、
    前記音場内に置かれた右耳相補型マイクロホンからの出力を提供するように構成された右耳高域フィルタと、
    前記左耳高域フィルタからの前記出力を、前記聴取者の左耳用の前記組み合わされた出力と組み合わせる手段と、
    前記右耳高域フィルタからの前記出力を、前記聴取者の右耳用の前記組み合わされた出力と組み合わせる手段と
    を含み、前記低域フィルタによって除去された高周波数内容が、再挿入される、
    請求項22に記載の装置。
  24. 前記相補型マイクロホンが、本質的に、前記複数のマイクロホンにおける前記マイクロホンとは異なるマイクロホン、前記複数のマイクロホンにおける前記マイクロホンのうちの1つ、前記複数のマイクロホンのうちの複数の動的に切り替えられるマイクロホンからの信号から生成される仮想マイクロホン、及び、前記複数のマイクロホンのうちの2つのマイクロホンからの信号のスペクトル補間によって生成される仮想マイクロホンからなる群から選択される実際の又は仮想的なマイクロホンを含む、請求項23に記載の装置。
  25. 聴取者の頭部が音場内で複数のマイクロホンの位置に置かれている場合に、聴取者の耳の可能な位置を表す点で前記音場をサンプリングするように位置決めされた複数のマイクロホンと、
    信号処理ユニットと
    を含む、動的なバイノーラルサウンドを取り込み、そして、再生するための装置であって、
    前記信号処理ユニットは、オーディオ出力デバイスに接続される出力端子を有し、
    前記信号処理ユニットは、ヘッドトラッキングデバイスに接続される入力端子を有し、
    前記信号処理ユニットは、前記ヘッドトラッキングデバイスによって示される前記聴取者の頭部の方位に応答して、前記マイクロホンの出力信号を処理し、そして、前記オーディオ出力デバイスにバイノーラル出力を提示する手段を含む
    ことを特徴とする装置。
  26. 前記マイクロホンが、前記聴取者の頭部の半径と近似する半径を有する、表面に沿った環状アレイ内で位置決めされる、請求項25に記載の装置。
  27. 前記信号処理ユニットが、更に、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号を組み合わせる手段を含んでいる、請求項25に記載の装置。
  28. 前記信号処理ユニットが、更に、
    前記マイクロホンの出力信号の各々に関連付けられた低域フィルタと、
    前記低域フィルタの出力を組み合わせて、前記聴取者の耳用の組み合わされた出力信号を生成するための手段であって、前記組み合わされた出力信号が、前記聴取者の頭部が前記音場内で前記マイクロホンの位置に置かれている場合に、前記音場内の前記聴取者の耳の位置に関して最も近いマイクロホン及び次に近いマイクロホンからの前記出力を表す信号の組合せを含んでいるところの手段と
    を含む、請求項25に記載の装置。
  29. 前記音場内に置かれた相補型マイクロホンと、
    前記相補型マイクロホンから出力信号を提供するように構成された高域フィルタと、
    前記高域フィルタからの前記出力信号を、前記聴取者の耳用の前記組み合わされた出力信号と組み合わせる手段と
    を含み、前記低域フィルタによって除去された高周波数内容が、再挿入される、
    請求項28に記載の装置。
  30. 前記相補型マイクロホンが、本質的に、前記複数のマイクロホンにおける前記マイクロホンとは異なるマイクロホン、前記複数のマイクロホンにおける前記マイクロホンのうちの1つ、前記複数のマイクロホンのうちの複数の動的に切り替えられるマイクロホンからの信号から生成される仮想マイクロホン、及び、前記複数のマイクロホンのうちの2つのマイクロホンからの信号のスペクトル補間によって生成される仮想マイクロホンからなる群から選択される実際の又は仮想的なマイクロホンを含む、請求項29に記載の装置。
JP2005501606A 2002-10-18 2003-09-26 動的なバイノーラルサウンドの取込及び再生 Pending JP2006503526A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41973402P 2002-10-18 2002-10-18
US10/414,261 US7333622B2 (en) 2002-10-18 2003-04-15 Dynamic binaural sound capture and reproduction
PCT/US2003/030392 WO2004039123A1 (en) 2002-10-18 2003-09-26 Dynamic binaural sound capture and reproduction

Publications (2)

Publication Number Publication Date
JP2006503526A true JP2006503526A (ja) 2006-01-26
JP2006503526A5 JP2006503526A5 (ja) 2006-11-09

Family

ID=32096117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005501606A Pending JP2006503526A (ja) 2002-10-18 2003-09-26 動的なバイノーラルサウンドの取込及び再生

Country Status (8)

Country Link
US (1) US7333622B2 (ja)
EP (1) EP1554910A4 (ja)
JP (1) JP2006503526A (ja)
KR (1) KR20050056241A (ja)
AU (1) AU2003273363A1 (ja)
CA (1) CA2502585A1 (ja)
MX (1) MXPA05004091A (ja)
WO (1) WO2004039123A1 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7817806B2 (en) 2004-05-18 2010-10-19 Sony Corporation Sound pickup method and apparatus, sound pickup and reproduction method, and sound reproduction apparatus
JP2012034312A (ja) * 2010-08-03 2012-02-16 Nippon Telegr & Teleph Corp <Ntt> 放射指向特性推定方法とその装置とプログラム
JP2013507796A (ja) * 2009-10-07 2013-03-04 ザ・ユニバーシティ・オブ・シドニー 記録された音場の再構築
US8670583B2 (en) 2009-01-22 2014-03-11 Panasonic Corporation Hearing aid system
JP2016507172A (ja) * 2013-01-11 2016-03-07 インスティテュート フューア ランドファンクテクニック ゲーエムベーハー 改良された指向特性を有するマイクロホン装置
JP2017046256A (ja) * 2015-08-28 2017-03-02 日本電信電話株式会社 バイノーラル信号生成装置、方法及びプログラム
JP2017143406A (ja) * 2016-02-10 2017-08-17 日本電信電話株式会社 バイノーラル音生成装置、マイクロホンアレイ、バイノーラル音生成方法、プログラム
JP2018005526A (ja) * 2016-06-30 2018-01-11 株式会社リコー 情報処理装置、及びプログラム
JP2018026701A (ja) * 2016-08-10 2018-02-15 株式会社カプコン 録音装置、映像音声処理プログラム及びゲーム装置
WO2019065447A1 (ja) * 2017-09-29 2019-04-04 Kddi株式会社 音響信号のミキシング装置及びコンピュータ可読記憶媒体
JP2020526962A (ja) * 2017-07-06 2020-08-31 ハドリー インコーポレイテッド 多チャネルバイノーラル録音および動的再生

Families Citing this family (107)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7415123B2 (en) * 2001-09-26 2008-08-19 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for producing spatialized audio signals
AU2003210624A1 (en) * 2002-01-18 2003-07-30 Polycom, Inc. Digital linking of multiple microphone systems
US7430300B2 (en) * 2002-11-18 2008-09-30 Digisenz Llc Sound production systems and methods for providing sound inside a headgear unit
US9971398B2 (en) * 2003-12-12 2018-05-15 Beyond Imagination Inc. Virtual encounters
US9841809B2 (en) * 2003-12-12 2017-12-12 Kurzweil Technologies, Inc. Virtual encounters
US20050130108A1 (en) * 2003-12-12 2005-06-16 Kurzweil Raymond C. Virtual encounters
US9948885B2 (en) * 2003-12-12 2018-04-17 Kurzweil Technologies, Inc. Virtual encounters
JP4192800B2 (ja) * 2004-02-13 2008-12-10 ソニー株式会社 音声集音装置と方法
GB2414369B (en) * 2004-05-21 2007-08-01 Hewlett Packard Development Co Processing audio data
EP1600791B1 (en) * 2004-05-26 2009-04-01 Honda Research Institute Europe GmbH Sound source localization based on binaural signals
US8687820B2 (en) * 2004-06-30 2014-04-01 Polycom, Inc. Stereo microphone processing for teleconferencing
US20060013409A1 (en) * 2004-07-16 2006-01-19 Sensimetrics Corporation Microphone-array processing to generate directional cues in an audio signal
US7720212B1 (en) * 2004-07-29 2010-05-18 Hewlett-Packard Development Company, L.P. Spatial audio conferencing system
US20060126926A1 (en) * 2004-11-30 2006-06-15 Vesely Michael A Horizontal perspective representation
US7928311B2 (en) * 2004-12-01 2011-04-19 Creative Technology Ltd System and method for forming and rendering 3D MIDI messages
US7505601B1 (en) * 2005-02-09 2009-03-17 United States Of America As Represented By The Secretary Of The Air Force Efficient spatial separation of speech signals
US20060212148A1 (en) * 2005-03-18 2006-09-21 Critech Enterprises Inc. Systems and methods for the evaluation of artistic performances
CN100495951C (zh) * 2005-05-09 2009-06-03 上海原动力通信科技有限公司 一种动态选择阵列天线结构的方法
EP1900252B1 (en) * 2005-05-26 2013-07-17 Bang & Olufsen A/S Recording, synthesis and reproduction of sound fields in an enclosure
DE102005033239A1 (de) * 2005-07-15 2007-01-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Steuern einer Mehrzahl von Lautsprechern mittels einer graphischen Benutzerschnittstelle
WO2007031905A1 (en) * 2005-09-13 2007-03-22 Koninklijke Philips Electronics N.V. Method of and device for generating and processing parameters representing hrtfs
US8340304B2 (en) * 2005-10-01 2012-12-25 Samsung Electronics Co., Ltd. Method and apparatus to generate spatial sound
US8130977B2 (en) * 2005-12-27 2012-03-06 Polycom, Inc. Cluster of first-order microphones and method of operation for stereo input of videoconferencing system
DE602006001051T2 (de) * 2006-01-09 2009-07-02 Honda Research Institute Europe Gmbh Bestimmung des entsprechenden Messfensters zur Schallquellenortung in Echoumgebungen
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
KR101339854B1 (ko) * 2006-03-15 2014-02-06 오렌지 주 성분 분석에 의해 다중채널 오디오 신호를 인코딩하기 위한 장치 및 방법
US8041041B1 (en) * 2006-05-30 2011-10-18 Anyka (Guangzhou) Microelectronics Technology Co., Ltd. Method and system for providing stereo-channel based multi-channel audio coding
EP1862813A1 (en) * 2006-05-31 2007-12-05 Honda Research Institute Europe GmbH A method for estimating the position of a sound source for online calibration of auditory cue to location transformations
DE102006029717A1 (de) * 2006-06-28 2008-01-03 Siemens Audiologische Technik Gmbh Hörvorrichtung mit orthogonal zueinander angeordneten Spulen
US8229754B1 (en) * 2006-10-23 2012-07-24 Adobe Systems Incorporated Selecting features of displayed audio data across time
US8401210B2 (en) * 2006-12-05 2013-03-19 Apple Inc. System and method for dynamic control of audio playback based on the position of a listener
ATE484761T1 (de) * 2007-01-16 2010-10-15 Harman Becker Automotive Sys Vorrichtung und verfahren zum verfolgen von surround kopfhörern unter verwendung von audiosignalen unterhalb der maskierten hörschwelle
EP1962559A1 (en) * 2007-02-21 2008-08-27 Harman Becker Automotive Systems GmbH Objective quantification of auditory source width of a loudspeakers-room system
US7792674B2 (en) * 2007-03-30 2010-09-07 Smith Micro Software, Inc. System and method for providing virtual spatial sound with an audio visual player
US8229143B2 (en) * 2007-05-07 2012-07-24 Sunil Bharitkar Stereo expansion with binaural modeling
CN101448186B (zh) * 2007-11-26 2012-07-18 鸿富锦精密工业(深圳)有限公司 扬声器音效自动调整系统及方法
CN101960865A (zh) * 2008-03-03 2011-01-26 诺基亚公司 用于捕获和呈现多个音频声道的装置
US8315366B2 (en) * 2008-07-22 2012-11-20 Shoretel, Inc. Speaker identification and representation for a phone
US8094834B1 (en) * 2008-11-14 2012-01-10 The United States Of America As Represented By The Secretary Of The Air Force Remote auditory spatial communication aid
DE102009014672A1 (de) * 2009-03-27 2010-10-07 Rheinmetall Defence Electronics Gmbh Mikrofonanordnung zur Ortung von Schallquellen
DE102009019405A1 (de) * 2009-04-29 2010-11-18 Atlas Elektronik Gmbh Vorrichtung und Verfahren zur binauralen Wiedergabe von Audio-Sonarsignalen
US8737648B2 (en) * 2009-05-26 2014-05-27 Wei-ge Chen Spatialized audio over headphones
US8140715B2 (en) * 2009-05-28 2012-03-20 Microsoft Corporation Virtual media input device
US8553897B2 (en) * 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
CN107071688B (zh) * 2009-06-23 2019-08-23 诺基亚技术有限公司 用于处理音频信号的方法及装置
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
EP2508010B1 (en) * 2009-11-30 2020-08-26 Nokia Technologies Oy An apparatus for processing audio signals in dependence of motion and orientation of the apparatus
JP2011120028A (ja) * 2009-12-03 2011-06-16 Canon Inc 音声再生装置、及びその制御方法
CA2731045C (en) 2010-02-05 2015-12-29 Qnx Software Systems Co. Enhanced spatialization system
US9107021B2 (en) 2010-04-30 2015-08-11 Microsoft Technology Licensing, Llc Audio spatialization using reflective room model
US9332372B2 (en) 2010-06-07 2016-05-03 International Business Machines Corporation Virtual spatial sound scape
JP5555068B2 (ja) * 2010-06-16 2014-07-23 キヤノン株式会社 再生装置及びその制御方法及びプログラム
US9094496B2 (en) * 2010-06-18 2015-07-28 Avaya Inc. System and method for stereophonic acoustic echo cancellation
TW201208335A (en) * 2010-08-10 2012-02-16 Hon Hai Prec Ind Co Ltd Electronic device
US9055382B2 (en) 2011-06-29 2015-06-09 Richard Lane Calibration of headphones to improve accuracy of recorded audio content
ITTO20110890A1 (it) * 2011-10-05 2013-04-06 Inst Rundfunktechnik Gmbh Interpolationsschaltung zum interpolieren eines ersten und zweiten mikrofonsignals.
US8942397B2 (en) 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
WO2013091677A1 (en) * 2011-12-20 2013-06-27 Squarehead Technology As Speech recognition method and system
WO2013142731A1 (en) 2012-03-23 2013-09-26 Dolby Laboratories Licensing Corporation Schemes for emphasizing talkers in a 2d or 3d conference scene
GB201211512D0 (en) * 2012-06-28 2012-08-08 Provost Fellows Foundation Scholars And The Other Members Of Board Of The Method and apparatus for generating an audio output comprising spartial information
US9094749B2 (en) 2012-07-25 2015-07-28 Nokia Technologies Oy Head-mounted sound capture device
US9237398B1 (en) 2012-12-11 2016-01-12 Dysonics Corporation Motion tracked binaural sound conversion of legacy recordings
US20140215332A1 (en) * 2013-01-31 2014-07-31 Hewlett-Packard Development Company, Lp Virtual microphone selection corresponding to a set of audio source devices
US9648439B2 (en) 2013-03-12 2017-05-09 Dolby Laboratories Licensing Corporation Method of rendering one or more captured audio soundfields to a listener
US9681246B2 (en) * 2014-02-28 2017-06-13 Harman International Industries, Incorporated Bionic hearing headset
WO2015134658A1 (en) 2014-03-06 2015-09-11 Dolby Laboratories Licensing Corporation Structural modeling of the head related impulse response
KR20160020377A (ko) 2014-08-13 2016-02-23 삼성전자주식회사 음향 신호를 생성하고 재생하는 방법 및 장치
CN104393938B (zh) * 2014-11-05 2017-05-03 南京大学科技园发展有限公司 微波感知声音信号的方法与装置
EP3245796B1 (en) * 2015-01-16 2019-10-16 Safariland, LLC Dual communications headset controller
US9584938B2 (en) * 2015-01-19 2017-02-28 Sennheiser Electronic Gmbh & Co. Kg Method of determining acoustical characteristics of a room or venue having n sound sources
DE102015201223A1 (de) * 2015-01-26 2016-07-28 Sennheiser Electronic Gmbh & Co. Kg Verfahren zum Betreiben eines Mikrofon-Arrays
EP3079074A1 (fr) * 2015-04-10 2016-10-12 B<>Com Procédé de traitement de données pour l'estimation de paramètres de mixage de signaux audio, procédé de mixage, dispositifs, et programmes d'ordinateurs associés
US20160330563A1 (en) * 2015-05-08 2016-11-10 Htc Corporation Virtual reality audio system and the player thereof, and method for generation of virtual reality audio
GB2540199A (en) * 2015-07-09 2017-01-11 Nokia Technologies Oy An apparatus, method and computer program for providing sound reproduction
US10397710B2 (en) 2015-12-18 2019-08-27 Cochlear Limited Neutralizing the effect of a medical device location
US10142743B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Parametrically formulated noise and audio systems, devices, and methods thereof
US11722821B2 (en) 2016-02-19 2023-08-08 Dolby Laboratories Licensing Corporation Sound capture for mobile devices
WO2017143067A1 (en) 2016-02-19 2017-08-24 Dolby Laboratories Licensing Corporation Sound capture for mobile devices
US9986363B2 (en) 2016-03-03 2018-05-29 Mach 1, Corp. Applications and format for immersive spatial sound
CN107290711A (zh) * 2016-03-30 2017-10-24 芋头科技(杭州)有限公司 一种语音寻向系统及方法
CN106572425A (zh) * 2016-05-05 2017-04-19 王杰 音频处理装置及方法
JP7010436B2 (ja) 2016-05-06 2022-01-26 ウニベルシダー デ メデジン バイノーラルサウンドキャプチャ装置
CN109417677B (zh) 2016-06-21 2021-03-05 杜比实验室特许公司 用于预渲染的双耳音频的头部跟踪
US9881647B2 (en) * 2016-06-28 2018-01-30 VideoStitch Inc. Method to align an immersive video and an immersive sound field
US10638250B2 (en) * 2016-09-23 2020-04-28 Apple Inc. Systems and methods for determining estimated head orientation and position with ear pieces
US10028071B2 (en) 2016-09-23 2018-07-17 Apple Inc. Binaural sound reproduction system having dynamically adjusted audio output
US10223821B2 (en) 2017-04-25 2019-03-05 Beyond Imagination Inc. Multi-user and multi-surrogate virtual encounters
US10405126B2 (en) 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
JP6884278B2 (ja) * 2017-10-11 2021-06-09 ラム,ワイ−シャン オーディオ再生においてクロストークキャンセルゾーンを作成するためのシステム及び方法
US10250973B1 (en) * 2017-11-06 2019-04-02 Bose Corporation Intelligent conversation control in wearable audio systems
US10567888B2 (en) * 2018-02-08 2020-02-18 Nuance Hearing Ltd. Directional hearing aid
US10419853B2 (en) 2018-02-21 2019-09-17 Apple Inc. Binaural audio capture using untethered wireless headset
US20190324117A1 (en) * 2018-04-24 2019-10-24 Mediatek Inc. Content aware audio source localization
WO2019217808A1 (en) * 2018-05-11 2019-11-14 Dts, Inc. Determining sound locations in multi-channel audio
US10477338B1 (en) * 2018-06-11 2019-11-12 Here Global B.V. Method, apparatus and computer program product for spatial auditory cues
DE102019107302A1 (de) 2018-08-16 2020-02-20 Rheinisch-Westfälische Technische Hochschule (Rwth) Aachen Verfahren zum Erzeugen und Wiedergeben einer binauralen Aufnahme
US10805729B2 (en) * 2018-10-11 2020-10-13 Wai-Shan Lam System and method for creating crosstalk canceled zones in audio playback
US11765522B2 (en) 2019-07-21 2023-09-19 Nuance Hearing Ltd. Speech-tracking listening device
US11659332B2 (en) 2019-07-30 2023-05-23 Dolby Laboratories Licensing Corporation Estimating user location in a system including smart audio devices
US11968268B2 (en) 2019-07-30 2024-04-23 Dolby Laboratories Licensing Corporation Coordination of audio devices
WO2021074818A1 (en) 2019-10-16 2021-04-22 Nuance Hearing Ltd. Beamforming devices for hearing assistance
US11638111B2 (en) * 2019-11-01 2023-04-25 Meta Platforms Technologies, Llc Systems and methods for classifying beamformed signals for binaural audio playback
US11089428B2 (en) 2019-12-13 2021-08-10 Qualcomm Incorporated Selecting audio streams based on motion
WO2021194487A1 (en) * 2020-03-25 2021-09-30 Hewlett-Packard Development Company, L.P. Head-related transfer functions with antropometric measurements
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications
US11774540B2 (en) * 2021-04-09 2023-10-03 LouStat Technologies, LLC Systems and methods for enhancing location of game in the field

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5230402A (en) * 1975-09-04 1977-03-08 Victor Co Of Japan Ltd Multichannel stereo system
US4388494A (en) * 1980-01-12 1983-06-14 Schoene Peter Process and apparatus for improved dummy head stereophonic reproduction
US4817149A (en) 1987-01-22 1989-03-28 American Natural Sound Company Three-dimensional auditory display apparatus and method utilizing enhanced bionic emulation of human binaural sound localization
US4893342A (en) * 1987-10-15 1990-01-09 Cooper Duane H Head diffraction compensated stereo system
EP0695109B1 (en) * 1994-02-14 2011-07-27 Sony Corporation Device for reproducing video signal and audio signal
US5570324A (en) * 1995-09-06 1996-10-29 Northrop Grumman Corporation Underwater sound localization system
AUPO099696A0 (en) 1996-07-12 1996-08-08 Lake Dsp Pty Limited Methods and apparatus for processing spatialised audio
US6021206A (en) * 1996-10-02 2000-02-01 Lake Dsp Pty Ltd Methods and apparatus for processing spatialised audio
AUPO316096A0 (en) 1996-10-23 1996-11-14 Lake Dsp Pty Limited Head tracking with limited angle output
US6243476B1 (en) 1997-06-18 2001-06-05 Massachusetts Institute Of Technology Method and apparatus for producing binaural audio for a moving listener
US6084973A (en) 1997-12-22 2000-07-04 Audio Technica U.S., Inc. Digital and analog directional microphone
JP3657120B2 (ja) * 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
US6845163B1 (en) * 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
US7340062B2 (en) 2000-03-14 2008-03-04 Revit Lawrence J Sound reproduction method and apparatus for assessing real-world performance of hearing and hearing aids
GB2374506B (en) 2001-01-29 2004-11-17 Hewlett Packard Co Audio user interface with cylindrical audio field organisation
US6961439B2 (en) 2001-09-26 2005-11-01 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for producing spatialized audio signals
JP4867121B2 (ja) * 2001-09-28 2012-02-01 ソニー株式会社 音声信号処理方法および音声再生システム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7817806B2 (en) 2004-05-18 2010-10-19 Sony Corporation Sound pickup method and apparatus, sound pickup and reproduction method, and sound reproduction apparatus
US8670583B2 (en) 2009-01-22 2014-03-11 Panasonic Corporation Hearing aid system
JP2013507796A (ja) * 2009-10-07 2013-03-04 ザ・ユニバーシティ・オブ・シドニー 記録された音場の再構築
JP2012034312A (ja) * 2010-08-03 2012-02-16 Nippon Telegr & Teleph Corp <Ntt> 放射指向特性推定方法とその装置とプログラム
JP2016507172A (ja) * 2013-01-11 2016-03-07 インスティテュート フューア ランドファンクテクニック ゲーエムベーハー 改良された指向特性を有するマイクロホン装置
JP2017046256A (ja) * 2015-08-28 2017-03-02 日本電信電話株式会社 バイノーラル信号生成装置、方法及びプログラム
JP2017143406A (ja) * 2016-02-10 2017-08-17 日本電信電話株式会社 バイノーラル音生成装置、マイクロホンアレイ、バイノーラル音生成方法、プログラム
JP2018005526A (ja) * 2016-06-30 2018-01-11 株式会社リコー 情報処理装置、及びプログラム
JP2018026701A (ja) * 2016-08-10 2018-02-15 株式会社カプコン 録音装置、映像音声処理プログラム及びゲーム装置
JP2020526962A (ja) * 2017-07-06 2020-08-31 ハドリー インコーポレイテッド 多チャネルバイノーラル録音および動的再生
US11671782B2 (en) 2017-07-06 2023-06-06 Huddly As Multi-channel binaural recording and dynamic playback
WO2019065447A1 (ja) * 2017-09-29 2019-04-04 Kddi株式会社 音響信号のミキシング装置及びコンピュータ可読記憶媒体
JP2019068210A (ja) * 2017-09-29 2019-04-25 Kddi株式会社 音響信号のミキシング装置及びプログラム
US10951984B2 (en) 2017-09-29 2021-03-16 Kddi Corporation Acoustic signal mixing device and computer-readable storage medium

Also Published As

Publication number Publication date
US20040076301A1 (en) 2004-04-22
US7333622B2 (en) 2008-02-19
CA2502585A1 (en) 2004-05-06
KR20050056241A (ko) 2005-06-14
WO2004039123A1 (en) 2004-05-06
MXPA05004091A (es) 2005-06-08
AU2003273363A1 (en) 2004-05-13
EP1554910A1 (en) 2005-07-20
EP1554910A4 (en) 2008-06-18

Similar Documents

Publication Publication Date Title
US7333622B2 (en) Dynamic binaural sound capture and reproduction
US20080056517A1 (en) Dynamic binaural sound capture and reproduction in focued or frontal applications
US20070009120A1 (en) Dynamic binaural sound capture and reproduction in focused or frontal applications
Kyriakakis Fundamental and technological limitations of immersive audio systems
US8437485B2 (en) Method and device for improved sound field rendering accuracy within a preferred listening area
Algazi et al. Headphone-based spatial sound
Theile et al. Wave field synthesis: A promising spatial audio rendering concept
Kyriakakis et al. Surrounded by sound
KR20170106063A (ko) 오디오 신호 처리 방법 및 장치
EP1433355A1 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener
JP6404354B2 (ja) 多くの拡声器信号を生成するための装置及び方法、並びにコンピュータ・プログラム
US20130243201A1 (en) Efficient control of sound field rotation in binaural spatial sound
Sunder Binaural audio engineering
US10440495B2 (en) Virtual localization of sound
Malham Toward reality equivalence in spatial sound diffusion
TWI821922B (zh) 用以呈現音訊物件之設備與方法
Geluso 3D acoustic recording
KR100275779B1 (ko) 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 장치 및 방법
Naoe et al. Performance evaluation of 3D sound field reproduction system using a few loudspeakers and wave field synthesis
Kang et al. Realistic audio teleconferencing using binaural and auralization techniques
Yao Influence of Loudspeaker Configurations and Orientations on Sound Localization
Ranjan 3D audio reproduction: natural augmented reality headset and next generation entertainment system using wave field synthesis
AU2002325063B2 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener
Lee et al. Reduction of sound localization error for non-individualized HRTF by directional weighting function
Sporer et al. Spatialized audio and 3D audio rendering

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060921

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080916

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080924

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081216