JP3572849B2 - 音源位置計測装置、及びカメラ撮影制御装置 - Google Patents
音源位置計測装置、及びカメラ撮影制御装置 Download PDFInfo
- Publication number
- JP3572849B2 JP3572849B2 JP3029297A JP3029297A JP3572849B2 JP 3572849 B2 JP3572849 B2 JP 3572849B2 JP 3029297 A JP3029297 A JP 3029297A JP 3029297 A JP3029297 A JP 3029297A JP 3572849 B2 JP3572849 B2 JP 3572849B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- sound
- microphone
- camera
- microphones
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Automatic Focus Adjustment (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Focusing (AREA)
Description
【発明の属する技術分野】
本発明は音源からの音情報によって音源位置を計算する音源位置計測装置、及び音源位置の情報に基づいてカメラの撮影位置を制御するカメラ撮影制御装置に関し、特に同一音源からの音が複数のマイクに到達するときの時間差を利用して音源位置を計算する音源位置計測装置、及びその計算結果に基づいてカメラの撮影位置を制御するカメラ撮影制御装置に関する。
【0002】
【従来の技術】
会議の映像記録や遠隔会議システムにおいては、会議の場全体を撮影したり、個々の発言者をズームアップして捉えることが重要である。これによって、発言者の表情や会議の雰囲気をよりよく捉え、会議の臨場感を高めることができるからである。しかも、このような撮影は自動的に行われることが望まれている。
【0003】
そこで、発言者を撮影できる会議システムとして特開平4−122184号公報や特開平4−297196号公報のような発明がなされている。前者は、個々の音源すなわち各発言者それぞれにマイクを割り当て、そのマイクからの信号によって発言者の検出を行うもので、発言者の撮影は1台のカメラによって行われる。一方後者の発明は、各話者ごとにカメラとマイクを割り当て、それぞれの話者の発言を各話者の声紋によって判別するという方法を採っている。また、特開平6−217304号公報では、話者ごとに固有の無線信号を発信する発信機を各マイクに取り付け、この無線信号を受信する受信機によって計測された受信信号をもとに発信機の座標位置を求める方法を採っている。
【0004】
ところが、これらのシステムでは、参加者全員に対してマイクを用意しなければならないため煩雑な設置作業が必要になると共に、カメラで撮影する位置はあらかじめ設定された場所のみであるため、柔軟性にかけていた。
【0005】
それに対し、特開平7−140527号公報に見られるカメラ撮影制御装置では、同一音源からの音を2本のマイクが捉えたときに、マイク間の音の位相差を利用して音源の方向を知るという方法をとることによって、少ないマイクで多くの音源方向にカメラを向けることができるように工夫している。
【0006】
また、同一音源からの音が複数のマイクに到達するときの時間差を利用して、音源の方向を知ること、すなわち音源定位が可能であることは広く知られている。この場合、2本のマイクでは、それらを結ぶ線の中点に垂直な面を対称面とした対称性が残るため、前後の判定ができなくなる。このため、特開平7−140527号公報に開示された発明では、カメラの脇にマイクを取り付け、カメラ前方の音のみを捉えるようにしている。
【0007】
また、会議の映像記録を行う際に各話者の発話時刻の情報を取得できると、後に映像の編集に場合に便利である。そこで従来は、各話者に割り当てられたマイクへの音声入力を検知することによって、発話時刻の情報を取得することも行われていた。
【0008】
【発明が解決しようとする課題】
しかし、話者をカメラで撮影する場合には、従来の方法によって求められるのはあくまで音源の方向であって、音源位置を求めるには至っていないという問題点があった。すなわち、求められる音源の方向はマイクの位置が基準となっていることから、マイクとカメラが一体でなくてはならない。その結果、マイクとカメラとを分離することができず、各話者からの発声を捉えやすい位置にマイクを配置することができないという制約があった。しかも、カメラで撮影する場合には、カメラから音源までの位置によってズームの度合いが変わるため、音源からの距離が分からないと、ズーム量を調節することはできない。
【0009】
また、発話時刻の情報を取得する場合に、話者ごとにマイクを割り当てるのでは、マイクの設置やケーブルの取り回し等のために煩雑な作業が必要となる。従って、もっと簡単な構成で、マイクの捉えた音声と話者とを対応づけられることが望まれている。
【0010】
本発明はこのような点に鑑みてなされたものであり、同一音源からの音が複数のマイクに到達するときの時間差を利用して、音源位置を求めることができる音源位置計測装置を提供することを目的とする。
【0011】
また、本発明の別の目的は、カメラとマイクとを異なる位置に配置しても、音源の方向へカメラを向けることができるカメラ撮影制御置を提供することである。
【0013】
【課題を解決するための手段】
本発明では上記課題を解決するために、音情報によって音源位置を計算する音源位置計測装置において、正三角形の3つの頂点に設置されたマイクと、1つの音源の発した音が前記マイクのそれぞれで捉えられた時刻を音検出時刻として検出する音信号検出手段と、前記マイクごとの音検出時刻に基づいて、前記マイクの2個ずつを組合わせることにより得られる3組のマイクペアごとの音の到達時間差を測定する時間差測定手段と、前記各マイクペアを結ぶ線から±60度の範囲を前記各マイクペアの音源計測範囲とし、前記各マイクペアが捉えた音の到達時間差の符号によって音源の存在可能範囲を限定し、それぞれの前記マイクの位置と前記マイクペアごとの音の到達時間差とから、音源位置を計算する音源位置計算手段と、を有することを特徴とする音源位置計測装置が提供される。
【0014】
このような音源位置計測装置によれば、ある音源から音が発せられると、各マイクにより、その音源からの距離に応じた時刻にその音が捉えられる。次いで、マイクが音を捉えた時刻が音信号検出手段で検出され、音検出時刻とされる。すると、その音検出時刻に基づいて、時間差測定手段により、マイクペアごとの音の到達時間差が測定される。そして、音源位置計算手段により、各マイクペアが捉えた音の到達時間差の符号によって音源の存在可能範囲が限定され、マイクペアごとの音の到達時間差に基づいて音源位置が計算される。
【0015】
また、回転台の上に設置されたカメラの向きを制御しながら撮影を行うカメラ撮影装置において、正三角形の3つの頂点に設置されたマイクと、1つの音源の発した音が前記マイクのそれぞれで捉えられた時刻を音検出時刻として検出する音信号検出手段と、前記マイクごとの音検出時刻に基づいて、前記マイクの2個ずつを組合わせることにより得られる3組のマイクペアごとの音の到達時間差を測定する時間差測定手段と、前記各マイクペアを結ぶ線から±60度の範囲を前記各マイクペアの音源計測範囲とし、前記各マイクペアが捉えた音の到達時間差の符号によって音源の存在可能範囲を限定し、それぞれの前記マイクの位置、前記マイクペアごとの音の到達時間差及び前記カメラの位置の情報に基づき、前記カメラに対する音源の相対的な位置を計算する音源位置計算手段と、前記音源位置計算手段が算出した音源の位置情報に基づき、音源の方向へカメラの向きを制御するカメラ制御手段と、を有することを特徴とするカメラ撮影制御装置が提供される。
【0016】
このようなカメラ撮影装置によれば、ある音源から音が発せられると、各マイクが、その音源からの距離に応じた時刻にその音を捉える。マイクが音を捉えた時刻が音信号検出手段により音検出時刻とされ、その音検出時刻に基づいて、時間差測定手段によりマイクペアごとの音の到達時間差が測定され、音源位置計算手段により、各マイクペアが捉えた音の到達時間差の符号によって音源の存在可能範囲が限定され、マイクペアごとの音の到達時間差に基づいて音源位置が計算される。そして、カメラ制御手段により、音源の方向へカメラの向きが制御される。これにより、常に話者に対してカメラを向けておくことができる。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。
図1は、本発明のカメラ撮影制御装置の原理構成図である。まず、所定の形状の三角形の3つの頂点にマイク1〜3が配置されている。音信号検出手段4は、1つの音源の発した音がマイク1〜3のそれぞれで捉えられた時刻を音検出時刻として検出するとともに、マイク1〜3の捉えた音声信号を映像・音声記録再生手段12に送る。時間差測定手段5は、マイクごとの音検出時刻に基づいて、マイク1〜3の2個ずつを組合わせることにより得られる3組のマイクペアごとの音の到達時間差を測定する。音源位置計算手段6は、それぞれのマイク1〜3の位置とマイクペアごとの音の到達時間差とから、音源位置を計算する。計算された音源位置の情報は、カメラ制御手段7と発話情報記録手段11とに渡される。
【0022】
カメラ制御手段7は、カメラ本体9が載せられてた回転台を回転させるカメラ駆動手段8と、カメラ本体9のズーム量を調整するための電動レンズ10とを制御している。そして、カメラ制御手段7は、音源位置情報に基づき、カメラが音源を所定の大きさで捉えるようにカメラの向きとズーム量を制御する。カメラ本体9で撮影された映像信号は、映像・音声記録再生手段12に送られる。
【0023】
発話情報記録手段11は、マイクが音を捉えた際の音源位置情報と、発話時刻とを記録する。映像・音声記録再生手段12は、カメラ本体9から送られた映像情報を記録再生する。再生指示手段13は、発話情報記録手段11に格納された情報を用いて、映像・音声記録再生手段12に対して再生指示を与える。
【0024】
このようなカメラ撮影制御装置によれば、ある場所で発言をした者がいると、その声は3本のマイク1〜3で捉えられる。すると、音信号検出手段4により、各マイク1〜3が音を捉えた時刻が検出され、音検出時刻とされる。この際、話者のいる位置から各マイク1〜3までの距離の違いにより、各マイク1〜3が音を捉える時刻には時間差が生じている。そこで、時間差測定手段5によりマイク1〜3の2個ずつを組合わせることにより3組のマイクペアが作られ、そのマイクぺアごとの音の到達時間差が測定される。そして、各マイクペアの音の到達時間差を用いて、音源位置計算手段6によって音源位置が計算される。この際、カメラ本体9の位置を基準とした座標系における音源位置が算出される。
【0025】
音源位置が求まると、カメラ制御手段7によりカメラ本体9から見た音源の方向と距離とが計算され、カメラ駆動手段8を制御することによりカメラ本体9が音源の方向に向けられるるとともに、電動レンズ10を制御することによりズーム量が調節される。
【0026】
一方、音信号検出手段4が検出した音声情報と、カメラ本体9が撮影した映像情報とが映像・音声記録再生手段12に記録されるとともに、音源ごとの発話時刻が発話情報記録手段11に格納される。そして、この装置のオペレータは、発話情報記録手段11に格納された情報により任意の話者の発話時刻を知ることができ、特定の話者の発言のみを映像・音声記録再生手段12から抽出して再生することもできる。
【0027】
このようにして、3本のマイクのみで音源位置を測定できるため、マイクとカメラとを離しておいてもカメラを音源に向けることができるとともに、カメラから音源までの距離に応じてズーム量を調整することもできる。さらに、音源位置と発話時刻とを対応づけて記録しておくことができるため、各話者の発話時刻と映像・音声記録再生手段12に記録された情報とを対応づけることにより、映像のインデックスを作成することができる。
【0028】
ところで、本発明のカメラ撮影制御装置は、テレビ会議システムや重要な会議のビデオ撮影として有効に利用できる。そこで、本発明のカメラ撮影制御装置を用いて会議の内容を撮影する場合を例にとり実施の形態を説明する。
【0029】
図2は、第1の実施の形態に係るカメラ撮影制御装置の配置図である。この例では、司会者21と向き合って、複数の参加者22a〜22kがコの字形のテーブル23に着いている。会議室の中央には、正三角形の頂点に配置された3本のマイク1〜3が置かれている。これらのマイク1〜3は、カメラ撮影制御装置の装置本体100に接続されている。装置本体100には、カメラ200が接続されている。
【0030】
発言者の声をマイク1〜3が捉えると、装置本体100によって音源位置が計算され、カメラが発言者の方向に向けられるとともに、カメラから発言者までの距離に応じてズーム・インやズーム・アウトが行われる。
【0031】
なお、3本のマイク1〜3の作る正三角形の辺の長さ、すなわちマイク間の距離は任意に設定可能であるが、ここでは会議の場で設置しやすく、常温での音速値340m/ sから計算しやすい値である68cmとしている。
【0032】
図3は、第1の実施の形態に係るカメラ撮影制御装置の内部構成図である。音声入力手段である正三角形の頂点に配置された3本のマイク1〜3は音信号検出器110に接続されている。音信号検出器110は、マイク1〜3の捉えた音を音声信号として出力するとともに、各マイク1〜3が音を捉えた時刻に応じた信号を出力する。その信号は、時間差測定器120に入力される。時間差測定器120は、各マイク1〜3が音を捉えた時刻の時間差を計算して、時間差データを出力する。その時間差データは音源位置計算器130に入力される。音源位置計算器130は、時間差データから音源位置を計算して出力する。
【0033】
基準信号発生器101は、同一音源からの音を各マイクが捉えた時刻の時間差を計測するため基準クロックを発生し、その基準クロックを時間差測定器120と音源位置計算器130とに供給する。ここでは周期0.5μsの方形波を生成している。この周期によって音の時間差計測の分解能が決まる。この実施の形態ではマイク間の距離が68cmであるため、マイク間の最大の時間差は68cmを音速(340m/ s)で割った値、すなわち2msとなる。0.5μsという値はこの4000分の1の値であるため、会議における話者位置計算には十分な分解能である。
【0034】
カメラ制御装置140は、音源位置計算器130から音源位置データを受け取り、カメラ本体203の方向およびズーム量を制御する。カメラ本体203は回転台201の上に固定されており、回転台201を回転させることによりカメラ本体203の方向を変えることができる。また、カメラ本体203には、撮影範囲を変える電動レンズ202を備えており、この電動レンズ202の調整によりズーム量が調整できる。カメラ本体203の撮影した画像は、映像出力103として出力される。
【0035】
このような構成のカメラ撮影制御装置によれば、図2の司会者21若しくは参加者22a〜22kが発言すると、その音声は3つのマイク1〜3で捉えられ音信号検出器110に入力される。以下に、音信号検出器110の詳細を説明する。
【0036】
図4は、音信号検出器110の内部構成を示す図である。音信号検出器110は、基本的に、アンプ111a〜111c、信号・電力変換器112a〜112c、レベル判定器113a〜113c、及び微分器114a〜114cの4つの要素を1組とした、3つの組から構成されている。
【0037】
各マイク1〜3からの信号103a〜103cは、信号を増幅するアンプ111a〜111cに入力される。アンプ111a〜111cの出力は、それぞれに対応して設けられた信号・電力変換器112a〜112cに入力されるとともに、ミキサー115にも入力される。ミキサー115は、アンプによって増幅された音声信号をステレオ信号に変換し、音声出力102として出力する。
【0038】
各信号・電力変換器112a〜112cは、アンプ111a〜111cの出力信号から音信号のパワーを求め、パワー信号をそれぞれに対応して設けられたレベル判定器113a〜113cに入力する。各レベル判定器113a〜113cは、パワー信号を特定のしきい値によって2値化したのちTTL(Transistor-Transistor-Logic )レベルの信号を、それぞれに対応して設けられた微分器114a〜114cに入力する。各微分器114a〜114cは、入力された信号の出力の立ち上がりを検出し、立ち上がりを示すトリガ信号104a〜104cを出力する。
【0039】
なお、微分器114a〜114cの出力の前には、ダイオードの働きにより、正の微分結果のみを出力するようにしてある。また、アンプ111a〜111cの増幅度とレベル判定器113a〜113cのしきい値は、各組ごとにボリュームによって任意に設定することができる。
【0040】
このような音信号検出器110における信号の変化を、マイク1からの信号103aを例にとり以下に説明する。
図5は、音信号検出器110における信号の変化を示す図である。なお、この図では全て横軸が時間であり、縦軸が電圧である。
【0041】
(A)はマイク1から入力された信号の波形を示す図である。マイク1からは比較的弱い波形の信号103aが入力されている。この信号103aがアンプ111aで増幅される。
【0042】
(B)はアンプ111aで増幅後の信号の波形を示す図である。アンプ111aにより増幅されることにより、(A)に示した波形に比べ振幅の大きい波形となっている。この信号は、信号・電圧変換器112aにより、パワー信号に変換される。
【0043】
(C)は、パワー信号の波形を示す図である。パワー信号は、正の値だけの信号である。この信号は、レベル判別器113aでしきい値116によってレベル判定がなされる。
【0044】
(D)は、レベル判定後の信号の波形を示す図である。レベル判定により2値化された信号が得られる。この信号が微分器114aを通過することにより、トリガ状の信号となる。
【0045】
(E)は、微分器114aから出力される信号の波形を示す図である。微分器114aから出力されるトリガ信号状の波形は、微分器114aに入力された信号の立ち上がり時を示している。
【0046】
このようにして、マイク1が捉えた音から、その音を捉えた時点を示すトリガ信号状の波形が得られる。この処理は、他の2つのマイク2,3の捉えた音に対しても同様に行われ、それぞれのマイク2,3に対応するトリガ信号104b〜104cが音信号検出器110の出力信号となる。
【0047】
各音信号検出器110から出力された3つのトリガ信号104a〜104cは、基準信号発生器101からのクロック信号とともに時間差測定器120に入力される。
【0048】
図6は、時間差測定器120の内部構成を示す図である。時間差測定器120は、3つのトリガ信号変換器121a〜121cと、3つの遅延器122a〜122cとから構成される。トリガ信号変換器121a〜121cは、入力されたトリガ信号104a〜104cを基準信号発生器101が生成する方形波のH(ハイ)レベルと同じ時間幅の方形波に変換する。また、各遅延器122a〜122cは、2つの方形波の時間差を測定する。
【0049】
このような構成の時間差測定器120によれば、入力されたトリガ信号104a〜104cは、トリガ信号変換器121a〜121cにより、基準信号である方形波のHレベルと同じ時間幅の方形波に変換される。
【0050】
図7は、トリガ信号から得られる方形波を示す図である。(A)はトリガ信号を表しており、(B)は方形波を表している。すなわち、ある時刻から160.8μs後にトリガ信号104aがあったとすると、そのトリガ信号104aはつぎの基準クロックがHレベルとなっている161.0μsから161.25μsの間がHレベルであるような方形波120aに変換される。
【0051】
基準クロックの周期に量子化された信号は、次に2つずつの信号をペアにして、遅延器122a〜122cに入力される。すなわち、マイク1とマイク2とによる信号のペア、マイク2とマイク3とによる信号のペア、そしてマイク3とマイク1とによる信号のペアの3つの組が遅延器122a〜122cに入力される。
【0052】
図8は、遅延器122aの内部構成を示す図である。遅延器122aは、実際にディレイ回路によって構成することも可能であるが、この例では信号がクロックの周期に合わせて量子化されていることを利用して、順序判定器122aa、カウンタ122abおよびデータ変換器122acによって構成している。
【0053】
順序判定器122aaはどちらの入力が先にあったかを判定するもので、マイク1による信号123a、マイク2による信号123b、およびクリア信号122adの3つの入力を持つ。そして、順序判定器122aaは、順序を判定するための出力である順序判定ビット122ae,122afをデータ変換器122acに対して出力するとともに、時間差計測のための信号122agをカウンタ122abへ出力する。
【0054】
カウンタ122abには、順序判定器122aaの出力122ag以外に、基準信号発生器101からのクロック信号122ahが入力されている。カウンタ122abは、順序判定器122aaの出力した信号122agがHレベルである間だけ、入力されているクロック信号122ahのHレベルの回数を計数するものであり、計数結果である計数出力122aiをデータ変換器122acに対して出力する。また、カウンタ122abは、順序判定器122aaに対するクリア信号122adも出力する。
【0055】
データ変換器122acは、順序判定器122aaの2つの順序判定ビット122ae,122afと、2バイトの符号無し2進数のカウンタ122abの計数出力122aiを、2バイトの符号付き2進数に変換するものである。そして、変換結果を出力データ105aとするとともにデータ変換終了信号106aを1パルスのHレベルとして出力する。
【0056】
このような構成の遅延器122aは、次のように動作する。
2つの信号123a,123bが入力されると、順序判定器122aaにより、どちらの信号の入力が早かったかが判定される。信号123aの入力のほうが早くHレベルになれば順序判定ビット122aeがHレベルに保たれ、逆に信号123bの入力のほうが早くHレベルになれば順序判定ビット122afがHレベルに保たれる。そして、カウンタ122abへ出力される信号122agは、2つの信号123a,123b入力のどちらかがHレベルになった時点から他方の信号がHレベルになるまでHレベルが保たれる。これらの順序判定器122aaの状態は、クリア信号122adがHレベルになることによってクリアされる。したがって、順序判定ビット122aeおよび順序判定ビット122afの出力がこの順序で(1,0)ならば信号123aの入力が早く、また(0,1)ならば信号123bの入力が早いことが判定できる。
【0057】
カウンタ122abは、信号122agがHレベルになると、入力されているクロック信号122ahのHレベルの回数の計数を開始する。信号122agがL(ロー)レベルになると、カウンタ122abは計数を停止し、計数した情報を16ビットの符号なし2進数として計数出力122aiとする。したがって、クロックの周期0.5μsにこの計数結果を乗じた値が計測された時間差となるが、ここではカウンタ122abの計数した値をそのまま用いる。カウンタ122abは、計数出力122aiが出力されると同時にクリア信号122adにも1パルスのHレベルの信号を送り出す。このクリア信号122adによって、順序判定器122aaの状態がクリアされ、次の入力に備える。
【0058】
2つの順序判定ビット122ae,122afの出力と2バイトの符号無し2進数のカウンタ122abの計数出力122aiとは、データ変換器122acにより2バイトの符号付き2進数に変換され、出力データ105aとなる。データ変換が終了すると、データ変換終了信号106aを1パルスのHレベルとして出力する。出力データ105aとデータ変換終了信号106aとは、次の音源位置計算器130に送られる。なお、3つの遅延器122a〜122cのそれぞれのデータ変換器は、マイクペアの順序を(1、2)、(2、3)および(3、1)とし、それぞれ第1列のマイクの音のほうが先であると、符号をプラスにし、逆の場合は符号をマイナスにする。
【0059】
ここで、音源位置計算器130の機能の詳細を説明する前に、音源位置の計算方法について述べる。音源位置計算の基本は、2つのマイクにおける音源方向の計算にある。
【0060】
図9は、音源方向の計算のためのマイクの座標系を示す図である。図に示すように、2つのマイク1,2を通る直線をu軸とし、2つのマイク1,2の中点を原点としたu−v座標系を考える。そして原点から−aだけ離れた位置(−a,0)にマイク1が、またaだけ離れた位置(a,0)にマイク2が置かれており、音源Pの位置が原点から(r,Θ)の位置にあるとすると、音源Pからの音がそれぞれのマイクに到達するときの時間差dtは、
【0061】
【数1】
dt=〔(r2 +2racos Θ+a2 )1/2 −(r2 −2racos Θ+a2 )1/2 〕/V0 ・・・(1)
となる。ただし、V0 は音速の値(常温で340m/ s)である。これをrをパラメータとしてプロットしてみる。
【0062】
図10は、マイク間の時間差と音源方向との関係式を示すグラフである。ただし、ここではa=1mで計算している。このように、dtに対するrの効果はΘに比べて十分小さく、rの値を変化させたとしても角度誤差は5度程度であることと、いずれのrをとってもΘが約25度より小さくなる領域ではそれまでの領域に比べてdtに対する角度感度が高くなっていることが分かる。このことから、マイクペアへの音の到達時間差を知ることによって、その音の音源の方向、すなわちu−v座標の原点と音源とを結ぶ直線を求めることができる。別のマイクペアによってもうひとつの直線を求めれば、それらの直線の交点から音源位置が求められる。
【0063】
本実施の形態では、マイクペアの組み合わせによって音源位置の計算を行うため、X軸から±60度の範囲を各マイクペアの計測範囲として音源位置計算を行う。
【0064】
図11は、1組のマイクペアの計測範囲を示す図である。2本のマイク1,2がu軸上に原点を挟んで配置されているとすれば、このマイクペアの計測範囲は、原点から見て、u軸を中心に正の方向に±60°、負の方向に±60°である。このように計測範囲を定め、3組のマイクペアのうち、音源位置が計測範囲内にある2つのマイクペアを使って音源位置の計算を行う。3本のマイクは正三角形の頂点に配置されているため、任意の音源位置に対して必ず2つのマイクペアがこの範囲に収まる。したがって、音源位置計算に利用するデータは、3つの時間差計数データから最も時間差の小さいデータを除外したものとなる。
【0065】
そこで、音源位置の計算には、まず、それぞれのマイクペアにおいて個別に図11に示したような座標系をとって音源方向を求める。音源方向は、計測された時間差データを角度−時間差情報テーブルと比較することによって求める。
【0066】
図12は角度−時間差情報テーブルを示す図である。この例ではマイク間の距離が68cmであるので、図のテーブルではrの値を3mに設定して、上の式でΘが0度から60度まで5度ごと2つのマイクの時間差情報を入力してある。テーブルの第1列目は、上から順に60度から5度ごとに0度までの角度が与えられており、第2列目にはその角度での2つのマイクの時間差データが格納されている。時間差データは、上の式で計算した時間差を基準クロックの周期である0.5μsで割った値の2バイトの符号付き整数表現にしてある。これによって、時間差測定器120で求めた時間差データとの比較が直接行える。時間差データから方向を知るには、このテーブルの第2列目を参照し、時間差データの絶対値がテーブル内の値を超えない最大のセルを見出せば、そのテーブルの第1列から角度データを得ることができる。このとき、図11のv軸の両側で線対称になっているが、時間差データの値がマイナスならばマイク1側に発話位置があり、またプラスならばマイク2側に発話位置があることになる。
【0067】
また、ここで求められた角度データは、2つのマイクを結ぶ軸(図11のu軸)を対称軸としてその軸から両側の2つの直線が解として成り立つが、この対称性の問題は、時間差データとマイクペアの組み合わせ情報とによって解決することができる。
【0068】
図13は、2つの時間差情報から音源位置を求めるための方法を説明する図である。この例では、マイク3,1のマイクペアとマイク2,3のマイクペアにより音源位置を求める。なお、各マイク1〜3を頂点とする正三角形の重心(各頂点と対辺の中点とを結ぶ線分の交点)が原点となるようにx−y座標が定義されている。マイク3,1のマイクペアからは2本の直線31a,31bが求められ、マイク2,3のマイクペアからも2本の直線32a,32bが求められる。また、音源Pからの音はマイク3に達するよりも速くマイク1およびマイク2に達するため、マイク2とマイク3とのペアからはプラスの角度情報(マイク2側に音源があることを示す)が得られ、またマイク3とマイク1のペアからはマイナスの角度情報(マイク1側に音源があることを示す)が得られる。しかも、図11に示したように、各マイクペアの計測範囲は制限されている。したがって、時間差情報の組み合わせにより、音源の範囲が限定できる。図13の例における音源位置は、第1象限のx軸からの角度が0〜60度の範囲に限定される。すなわち、直線31bおよび直線32bの可能性はないことになり、結局直線31aおよび直線32aの2つが残ることになる。
【0069】
このように、マイクペアの組み合わせと各マイクペアにおける時間差データの符号によって音源位置の範囲が特定される。その全部の組み合わせを以下に示す。
【0070】
図14は、マイクペアの組み合わせと時間差データの符号によって決まる音源の範囲を示す図である。図中での1、2、3はそれぞれマイク1,2,3の位置を示している。また、マイク1,2のマイクペアの時間差データを(1,2)、マイク2,3のマイクペアの時間差データを(2,3)、マイク3,1のマイクペアの時間差データを(3,1)としている。したがって、マイクペアの時間差データの符号と音源の範囲との関係は以下のようになる。なお、以下の説明における角度は、正のx軸からの角度(反時計回り)で表す。
【0071】
(2,3)>0、(3,1)<0であれば、音源は正のx軸からの角度が0〜60度の範囲内に限定される。
(1,2)>0、(3,1)<0であれば、音源は正のx軸からの角度が60〜120度の範囲内に限定される。
【0072】
(1,2)>0、(2,3)<0であれば、音源は正のx軸からの角度が120〜180度の範囲内に限定される。
(2,3)<0、(3,1)>0であれば、音源は正のx軸からの角度が180〜240度の範囲内に限定される。
【0073】
(1,2)<0、(3,1)>0であれば、音源は正のx軸からの角度が240〜300度の範囲内に限定される。
(1,2)<0、(2,3)>0であれば、音源は正のx軸からの角度が300〜360度の範囲内に限定される。
【0074】
なお、この図に示したマイクペアの時間差データの符号と音源の範囲との関係は、音源位置領域テーブルとして音源位置計算器130内に予め保持しておく。以上のようにして特定された2つの直線を図11のu−v座標系から図13のようなx−y座標系に座標変換すれば、それらの交点から音源位置P(x,y)が求められる。図13の例では、マイク3,1のペアの場合は点(−a/ 2,a/ 2√3)を通り、x軸と「60度+上記の方法で求めたu−v座標系での角度」の角度をなす直線31aを、またマイク2,3のペアの場合は点(0,−a/ 2√3)を通りx軸と「上記の方法で求めたu−v座標系での角度」の角度をなす直線32aを得て、それら直線の交点を求めればよい。
【0075】
位置の計算は、時間差測定器120で得られた3つの符号付き2進数情報を用いて、音源位置計算器130で行われる。音源位置計算器130はコンピュータ上に構築されている。
【0076】
図15は、音源位置測定器の内部構成を示す図である。図に示すように、音源位置測定器130は、CPU(Central Processing Unit )133を中心に構成されている。
【0077】
3つのポート131a〜131cは、時間差測定器120で計測されたデータを取り込みCPU133に供給する。ANDゲート132は、データをCPU133に取り込むタイミングを与える。CPU133は、各ポート131a〜131cからのデータを蓄えるためのレジスタ133a〜133cを有している。また、CPU133は、バス134を介して各種周辺機器との間のデータ転送を行う。
【0078】
バス134には、入力装置135、出力ポート136、メモリ137、およびハードディスク138が接続されている。入力装置135は、カメラとマイクとの位置関係を入力するためのものである。出力ポート136は、計算結果をカメラ制御装置140へ出力するための通信ポートである。メモリ137は、CPU133が実行するプログラムを一時的に保持するためのものである。ハードディスク138は、プログラム、角度−時間差情報テーブル、音源位置領域テーブルおよび座標変換テーブルを保持している。なお、音源位置計算器130で行われる音源位置の計算処理は、ハードディスク138に格納されたプログラムをメモリ137にロードし、そのプログラムをCPU133が実行することにより実施される処理である。
【0079】
このような音源位置計算器130に入力される時間差測定器120からの3つのデータ出力105a〜105cは、まず3つのポート131a〜131cに伝えられ、時間差測定器120からの出力106a〜106cがすべてHレベルになってANDゲート132の出力がHレベルになった時点で、CPU133の中の3つのレジスタ133a〜133cに取り込まれる。3つのレジスタ133a〜133cに取り込まれた3つの時間差データの内、最も時間差の少ないデータを除いた2つの時間差データが、あらかじめメモリ上に確保されている変数領域t1およびt2に書き込まれる。そして、この2つの時間差データに基づいて、前述の音源位置の計算が行われる。これにより、図13のx−y座標系での音源位置が求められる。その後、カメラ位置を原点にとったX−Y座標系へ座標変換し、X−Y座標系での音源位置P(X,Y)を求める。
図16は、マイクの座標系とカメラの座標系の関係を示す図である。マイク1〜3の中心(三角形の重心)がx−y座標の原点であり、カメラ200(図2に示す)の回転中心が、X−Y座標の原点である。
【0080】
実際には、マイク2およびマイク3を結ぶ線と平行なx軸と回転台201の0度の方向が平行となるようにマイク1〜3とカメラ200とが設置される。したがってこの際の座標変換は平行移動のみである。平行移動量のデータは、装置を設置した時点で測定し、入力装置135によって音源位置計算器130に入力する。音源位置計算器130は、このデータを用いて座標変換を行う。座標変換は平行移動だけでなく、両方の座標系がある角度をなしていた場合でも、この回転による座標変換を行うだけでよい。ただし、その際にはx−y座標系とX−Y座標系のなす角度を測定しておく必要がある。このようにして求められた音源位置P(X,Y)は、2バイトの浮動小数点データとして出力ポート136から送り出され、カメラ制御装置140に入力される。
【0081】
図17は、カメラ制御装置140の内部構成を示す図である。この図に示すように、カメラ制御装置140は、角度計算部141、ズーム量計算部142、データ出力部143、キャリブレーション部144、ボリューム145、及びキャリブレーション設定ボタン146から構成される。
【0082】
角度計算部141には、音源位置データP(X,Y)と回転台201の動作を知らせる信号204とが入力されている。角度計算部141は、信号204がLレベルのときに、音源位置データP(X,Y)を極座標系のデータ(R,Θ)に変換する。Rはカメラから音源位置までの距離、Θは音源位置PとX−Y座標系の原点とを結んだ線がX軸となす角度である。さらに、Θの値はロータリーエンコーダのデータフォーマットに変換され、データ出力部143に送られる。ここでは、角度Θを1.4で割った値の整数値を8ビットの符号無し2進数に変換する。この1.4という値は、360度を8ビットのデータの最大値256で割ったものである。角度計算部141で計算された音源までの距離Rは、ズーム量計算部142とキャリブレーション部144に送られる。キャリブレーション部144は、カメラと人物との距離が変化すると、それに合わせてカメラのズーム量も変化するため、基準距離と基準ズーム量の値という2つの基準情報をズーム量計算部142に設定するために設けている。キャリブレーション部144にはズーム量を手動で設定できるボリューム145およびキャリブレーション設定ボタン146が接続されている。キャリブレーション部144は、角度計算部141が出力する距離データを用い、その時点でのズーム量をボリューム145によって設定する。ボリューム145を回すとカメラ200の電動レンズが駆動され、ズーム量が変化するようになっている。ボリューム145を操作してちょうどよいズーム量となった時点でキャリブレーション設定ボタン146を押すと、その時点での距離データRoとズーム量データZoが基準情報としてズーム量計算部142に出力される。これらのデータを受け取ったズーム量計算部142は、それらの値をメモリに保持し、それ以後のズーム量の計算に用いる。ただし、本装置のように撮影対象が人物であるような場合には撮影対象の大きさが決まっているとみて差し支えないため、あらかじめ上の2つの基準情報のデフォルト値を設定してあってもよい。
【0083】
さて、角度計算部141で計算された音源までの距離Rはズーム量計算部142に送られ、ズーム量が計算される。ズーム量の計算は、距離Rを基準距離Roで割り、その値に基準ズーム量Zoを乗じることによって行う。計算された角度データとズーム量は、データ出力部143を経てそれぞれ回転台201および電動レンズ202に送られ、カメラ撮影装置が駆動される。このとき、回転台201の動作が終了しない間に次の撮影位置情報が出力されないよう、回転台201の動作を知らせる信号204が回転台201からカメラ制御装置140に送り出される。この信号はHレベルならば回転台201が動作中であることを示し、その間はカメラ制御装置140における計算は行われない。具体的には、この信号は角度計算部141に送られ、この信号がHレベルの間は音源位置計算器130から送られてくるデータを内部に取り込まない。
【0084】
このようにしてカメラ撮影が行われた会議は、映像出力103および音声出力102を通して記録したり遠隔地に電送することができる。この際、各会議場においては参加者全員のためにマイクを用意する必要がないとともに、3本のマイクとカメラとが同じ場所にある必要もない。したがって、マイクは全員の会話を捉えやすい位置に配置し、カメラは全員の表情を捉えやすい位置に配置できる。
【0085】
なお、上記の説明では、2本のマイクが捉えた音の到達時間差と音源方向との関係が、音源までの距離に依存しないことを利用して音源位置の計算を行っているが、3つのマイクが捉えた音の時間差から幾何学的に音源位置を計算することもできる。以下にその計算方法について説明する。
【0086】
まず、簡単のために、x−y座標系の(0,a)、(0,0)、(a,0)の3個所に3本のマイク1〜3が設置されているものとする。音源P(x,y)から発せられた音がそれぞれのマイク1〜3に達した時間を、それぞれt1、t2、t3とする。音源Pと各マイクとの距離をそれぞれl1,l2
,l3とすると、
【0087】
【数2】
である。各マイク間の時間差すなわちt1−t2をdt1 、t2−t3をdt2 、t3−t1をdt3 とし、音速の値をvsとすると、各マイク間の音の到達時間差は音源から各マイクまでの距離によって次のように与えられる。
【0088】
【数3】
これらの、式(2)、式(3)から
【0089】
【数4】
となり、この連立方程式を解けば音源位置P(x,y)を求めることができる。このような音源位置の求め方は、三角測量の原理と同様のものであって、広く知られている。この計算方法を用いるか、あるいは前述の第1の実施の形態で用いた方法で計算するのかは、音源位置計算器の性能や、要求される音の時間差計測の分解能によって判断する。例えば、高い分解能が要求される場合には、簡単な計算で高速に演算できる第1の実施の形態で説明した方法を用い、分解能が低くてよい場合には、角度−時間差情報テーブルなどの事前の準備が省ける幾何学的な音源位置計算方法を用いることができる。
【0090】
また、上記の第1の実施の形態では、マイクの床からの高さとカメラの床からの高さが同じ高さであるようなシステムであったが、カメラの位置を高くすることも可能である。この場合、マイクの床からの高さからカメラの床からの高さを引いた値をZ軸方向へのオフセット量dとして、カメラ制御装置内の計算において鉛直方向のカメラの向きを計算すればよい。ただし、上の座標系においては、鉛直下向きをZ軸の正の方向としている。すなわち、音源位置計算器130で求めてカメラ位置のオフセットを加えた音源位置P(X,Y)をP(X,Y,d)とし、床と垂直な方向の角度Φを
【0091】
【数5】
d/(X2+Y2)1/2 =tan Φ・・・(5)
によって求めればよい。Z軸方向にも回転可能な回転機構を実施例1の回転台に付加すれば、Z軸方向にオフセットがあった場合でも正しく話者を捉えることが可能となる。この回転機構は、第1の実施の形態と全く同様の構成で実現することができる。
【0092】
さらに、第1の実施の形態においては2次元平面内での音源位置計算を行っていたが、マイクを正三角錐の4つの頂点に配置することによって、3次元空間内の音源位置を知ることが可能である。正三角錐では4つの正三角形があり、それぞれの三角形で実施例1のような計算を行って各三角形の平面上での音源方向を示す三角形面に垂直な面を割り出すことができる。各正三角形ごとに音源方向を示す平面を見出せば、あとは各平面の交点を求めることで3次元空間内の音源位置を知ることができる。
【0093】
ところで、上記の第1の実施の形態では算出された音源位置情報をカメラの制御に利用する場合のみを説明したが、音源位置情報を映像信号のインデックス情報として利用することもできる。そのようなインデックス機能を有する音源位置記録装置を第2の実施の形態として以下に説明する。
【0094】
図18は、音源位置記録装置の内部構成図である。この音源位置記録装置は、3本のマイク1〜3、音信号検出器110、時間差測定器120、音源位置計算器130及び基準信号発生器101の構成は、図3に示した第1の実施の形態の構成と同じであるため、同一の番号を付して説明を省略する。また、この図には示していないが、音源位置計算器130には図3に示したものと同様のカメラ制御装置140が接続されており、そのカメラ制御装置140はカメラ本体203が設置された回転台201と電動レンズ202とを制御している。
【0095】
この実施の形態では、音源位置計算器130の出力は、カメラ制御装置140とともにコンピュータ151にも入力されている。コンピュータ151には、入力装置152、表示装置153、記憶装置154及び制御装置155が接続されていている。制御装置155には、さらに記録再生装置156が接続されている。
【0096】
コンピュータ151は、音源位置テーブルと時刻テーブルとを有しており、音源位置計算器130が出力した音源位置情報を音源位置テーブルに、またその情報を受け取った時刻を時刻テーブルに登録する。なお、コンピュータ151が実行する処理内容、及び音源位置テーブルと時刻テーブルとの詳細は後述する。
【0097】
入力装置152は、音源位置計算終了の合図やコメントデータなどの入力を行うためのものである。表示装置153は、音源位置データ、時刻データおよびコメントデータを表示するためのものである。記憶装置154は、音源位置データと時刻データおよびコメントデータを記憶するためのものであり、ハードディスク装置等を使用する。
【0098】
制御装置155は、記録再生装置156を制御するためものもである。記録再生装置156には音源位置記録と同時に、第1の実施の形態によって記録された映像記録が収められる。この第2の実施の形態では、ハードディスク上にディジタル記録された映像記録を用いている。ハードディスクは通常のテープ記録と異なり、ランダムアクセスが素早く行えるため、映像の検索作業を短時間に済ませることができる。利用者は、すでに記憶装置154に保存されている音源位置データと時刻データおよびコメントデータを表示装置153上に表示し、ここで再生の指示を作成する。例えば、司会者の発言部分だけを通して再生すれば、会議の議題リストを作成するといった作業が効率よく行える。制御装置155は、コンピュータが作成した再生時刻リストを元に再生装置の早送りや再生の指示を行う。再生が開始されると、入力装置から早送りの指示があるまで再生を続ける。
【0099】
図19は、音源位置テーブルの例を示す図である。音源位置テーブル41は2列36行のマトリックスであり、第1列目および第2列目にはそれぞれx座標値及びy座標値が格納される。このマトリックスには初期値として「nul」が入力されている。なお、36行という行数は、角度分解能が5度程度であることと、会場における参加者の数として高々この程度を想定していることによる。
【0100】
そして、マトリックスに格納されていない新しい音源位置データが音源位置計算器130から送られてくると、その座標値を次の行に追加して格納していく。このとき、すでに登録済みのデータと比較して角度誤差が5度以内で、かつ距離の誤差がx方向、y方向ともに±25cm以内であれば同じ位置とみなし、追加処理は行わない。その理由は、話者は着座姿勢を保っているとしても常に固定しているわけではなく、椅子を動かしたり頭をゆすったりすることが考えられるためである。
【0101】
図20は、時刻テーブルの例を示す図である。時刻テーブル42は初期状態で36列1024行のマトリックスであり、各行のインデックスが音源位置テーブル41の各行のインデックスに対応している。このマトリックスは、第1列以外には初期値として「nul」が入力されているが、第1列目には初期値として1が格納されている。この第1列目はポインタ情報を格納するために利用する。すなわち、この例では音源P1の時刻データがすでに3つ記録されているので、P1のポインタを与える第1行目には4が設定される。この情報により、音源P1からの次の時刻データがあった場合、このポインタを参照することによってどのアドレスにその時刻データを記入すればよいかをたやすく知ることができる。時刻データの記入が終わると、ポインタの値はインクリメントされる。
【0102】
時刻の表現形式は、ここでは計測開始時からの経過時間を0.1秒単位で計り、その値を2バイトの符号無し2進数によって表現している。したがって、1.3秒後の場合の時刻表現は「13」となる。もちろん、計測開始時からの経過時間が分かればよいので、別の表現をとっても構わない。この時、受け取った音源位置がすでに音源位置テーブル41に登録されているものであれば、その音源位置を示す行インデックスを求め、時刻テーブル42の対応する列インデックスのすでに記録されている時刻情報の後に新しい時刻情報が追加される。受け取った音源位置が音源位置テーブル41に未登録であれば、この音源位置を新たに音源位置テーブル41に時刻とともに登録する。
【0103】
音源位置テーブル41は2×36の大きさの2次元マトリックスであり、コンピュータのメモリ上に確保される。また時刻テーブル42は記録開始時は36×1024の大きさの2次元マトリックスがコンピュータのメモリ上に確保され、同一位置の時刻情報が満杯になると自動的にメモリアロケーション機能によって新たに1024行が追加される。
【0104】
図21は、音源位置記録の処理手順を示すフローチャートである。これはコンピュータ151によって行われる処理である。以下、処理手順をステップ番号に沿って説明する。
〔S1〕音源位置テーブルT1 と時刻テーブルT2 との領域をメモリ上に確保する。
〔S2〕位置格納変数Pと時刻格納変数xを確保する。
〔S3〕音源位置テーブルT1 と時刻テーブルT2 とを初期化する。
〔S4〕時刻tのカウントを開始する
〔S5〕音源位置計算器からの出力があるか否かを判断する。出力があればステップS6に進み、出力がなければこの処理を繰り返す。
〔S6〕現在の時刻tを時刻格納変数xに入力する。
〔S7〕音源位置(x、y)を位置格納変数Pに入力する。
〔S8〕位置格納変数Pが既に音源位置テーブルT1 に登録されているが否かを判断する。登録済みであればステップS10に進み、未登録であればステップS9に進む。
〔S9〕音源位置テーブルT1 に位置格納変数Pの値を新たに格納し、ステップS10に進む。
〔S10〕音源位置テーブルT1 での位置格納変数Pの行インデックスkを求める。
〔S11〕時刻テーブルT2 の列kの第1行目に格納されているポインタ値aを求め、時刻テーブルT2 のa行k列にxの値を格納する。
〔S12〕時刻テーブルT2 の列kの第1行目に格納されているポインタ値aをインクリメントする。
〔S13〕音源位置の計算が終了かいなかを判断する。終了であればステップS14に進み、終了でなければステップ5に進む。
〔S14〕記憶装置上に音源位置テーブルT1 および時刻テーブルT2 のデータを保存する。
〔S15〕必要に応じてコメントを付加し、処理を終了する。
【0105】
このようにして、音源位置と発話時刻の情報を映像のインデックスとして利用することができる。
【0106】
【発明の効果】
以上説明したように本発明の音源位置計測装置では、3本のマイクを所定の三角形の頂点に配置し、同一音源からの音が3本のマイクに到達する時間差を測定するようにしたため、各マイクの位置とマイクペアごとの音の到達時間差とから、音源の方向のみならず音源位置を算出することができる。
【0107】
また、本発明のカメラ撮影制御装置では、各マイクの位置、マイクペアごとの音の到達時間差及びカメラの位置から、カメラに対する音源の相対的な位置を計算するようにしたため、カメラとマイクとが離れた位置にあっても、カメラが音源の方向を向くように制御することができる。
【図面の簡単な説明】
【図1】本発明のカメラ撮影制御装置の原理構成図である。
【図2】第1の実施の形態に係るカメラ撮影制御装置の配置図である。
【図3】第1の実施の形態に係るカメラ撮影制御装置の内部構成図である。
【図4】音信号検出装置の内部構成を示す図である。
【図5】音信号検出器における信号の変化を示す図である。(A)はマイクから入力された信号の波形を示す図であり、(B)はアンプで増幅後の信号の波形を示す図であり、(C)は、パワー信号の波形を示す図であり、(D)は、レベル判定後の信号の波形を示す図であり、(E)は、微分器から出力される信号の波形を示す図である。
【図6】時間差測定器の内部構成を示す図である。
【図7】トリガ信号から得られる方形波を示す図である。(A)はトリガ信号を表しており、(B)は方形波を表している。
【図8】遅延器の内部構成を示す図である。
【図9】音源方向の計算のためのマイクの座標系を示す図である。
【図10】マイク間の時間差と音源方向との関係式を示すグラフである。
【図11】1組のマイクペアの計測範囲を示す図である。
【図12】角度−時間差情報テーブルを示す図である。
【図13】2つの時間差情報から音源位置を求めるための方法を説明する図である。
【図14】マイクペアの組み合わせと時間差データの符号によって決まる音源の範囲を示す図である。
【図15】音源位置測定器の内部構成を示す図である。
【図16】マイクの座標系とカメラの座標系の関係を示す図である。
【図17】カメラ制御装置の内部構成を示す図である。
【図18】音源位置記録装置の内部構成図である。
【図19】音源位置テーブルの例を示す図である。
【図20】時刻テーブルの例を示す図である。
【図21】音源位置記録の処理手順を示すフローチャートである。
【符号の説明】
1〜3 マイク
4 音信号検出手段
5 時間差測定手段
6 音源位置計算手段
7 カメラ制御手段
8 カメラ駆動手段
9 カメラ本体
10 電動レンズ
11 発話情報記録手段
12 映像・音声記録再生手段
13 再生指示手段
Claims (3)
- 音情報によって音源位置を計算する音源位置計測装置において、
正三角形の3つの頂点に設置されたマイクと、
1つの音源の発した音が前記マイクのそれぞれで捉えられた時刻を音検出時刻として検出する音信号検出手段と、
前記マイクごとの音検出時刻に基づいて、前記マイクの2個ずつを組合わせることにより得られる3組のマイクペアごとの音の到達時間差を測定する時間差測定手段と、
前記各マイクペアを結ぶ線から±60度の範囲を前記各マイクペアの音源計測範囲とし、前記各マイクペアが捉えた音の到達時間差の符号によって音源の存在可能範囲を限定し、それぞれの前記マイクの位置と前記マイクペアごとの音の到達時間差とから、音源位置を計算する音源位置計算手段と、
を有することを特徴とする音源位置計測装置。 - 回転台の上に設置されたカメラの向きを制御しながら撮影を行うカメラ撮影装置において、
正三角形の3つの頂点に設置されたマイクと、
1つの音源の発した音が前記マイクのそれぞれで捉えられた時刻を音検出時刻として検出する音信号検出手段と、
前記マイクごとの音検出時刻に基づいて、前記マイクの2個ずつを組合わせることにより得られる3組のマイクペアごとの音の到達時間差を測定する時間差測定手段と、
前記各マイクペアを結ぶ線から±60度の範囲を前記各マイクペアの音源計測範囲とし、前記各マイクペアが捉えた音の到達時間差の符号によって音源の存在可能範囲を限定し、それぞれの前記マイクの位置、前記マイクペアごとの音の到達時間差及び前記カメラの位置の情報に基づき、前記カメラに対する音源の相対的な位置情報を計算する音源位置計算手段と、
前記音源位置計算手段が算出した音源の位置情報に基づき、音源の方向へカメラの向きを制御するカメラ制御手段と、
を有することを特徴とするカメラ撮影制御装置。 - 回転台の上に設置されたカメラの向きを制御しながら撮影を行うカメラ撮影装置において、
所定の形状の三角形の3つの頂点に設置されたマイクと、
1つの音源の発した音が前記マイクのそれぞれで捉えられた時刻を音検出時刻として検出する音信号検出手段と、
前記マイクごとの音検出時刻に基づいて、前記マイクの2個ずつを組合わせることにより得られる3組のマイクペアごとの音の到達時間差を測定する時間差測定手段と、
それぞれの前記マイクの位置、マイクペアごとの音の到達時間差及び前記カメラの位置の情報に基づき、前記カメラに対する音源の相対的な位置情報を計算する音源位置計算手段と、
前記音源位置計算手段が算出した音源の前記位置情報に基づき、音源の方向へカメラの向きを制御するカメラ制御手段と、
前記マイクの捉えた音及び前記カメラの撮影した映像を、記録及び再生する映像・音声記録再生手段と、
前記音源位置計算手段の計算結果に基づいて、前記映像・音声記録再生手段が記録した映像のインデックスとして、音源位置ごとの発話時刻を記録する発話情報記録手段と、
を有することを特徴とするカメラ撮影制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3029297A JP3572849B2 (ja) | 1997-02-14 | 1997-02-14 | 音源位置計測装置、及びカメラ撮影制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3029297A JP3572849B2 (ja) | 1997-02-14 | 1997-02-14 | 音源位置計測装置、及びカメラ撮影制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10227849A JPH10227849A (ja) | 1998-08-25 |
JP3572849B2 true JP3572849B2 (ja) | 2004-10-06 |
Family
ID=12299664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3029297A Expired - Lifetime JP3572849B2 (ja) | 1997-02-14 | 1997-02-14 | 音源位置計測装置、及びカメラ撮影制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3572849B2 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000341658A (ja) * | 1999-05-27 | 2000-12-08 | Nec Eng Ltd | 話者方向検出システム |
DE10035222A1 (de) * | 2000-07-20 | 2002-02-07 | Bosch Gmbh Robert | Verfahren zur aktustischen Ortung von Personen in einem Detektionsraum |
JP4868671B2 (ja) * | 2001-09-27 | 2012-02-01 | 中部電力株式会社 | 音源探査システム |
JP4722347B2 (ja) * | 2000-10-02 | 2011-07-13 | 中部電力株式会社 | 音源探査システム |
WO2002029432A1 (en) * | 2000-10-02 | 2002-04-11 | Chubu Electric Power Co., Inc., | Sound source probing system |
JP2004257877A (ja) * | 2003-02-26 | 2004-09-16 | Seiko Epson Corp | 音源検出方法、音源検出装置及びロボット |
NO318096B1 (no) | 2003-05-08 | 2005-01-31 | Tandberg Telecom As | Arrangement og fremgangsmate for lokalisering av lydkilde |
JP4812302B2 (ja) * | 2005-01-12 | 2011-11-09 | 学校法人鶴学園 | 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム |
JP2007263614A (ja) * | 2006-03-27 | 2007-10-11 | Oki Electric Ind Co Ltd | 受波器位置校正装置及び方法 |
JPWO2007122729A1 (ja) * | 2006-04-18 | 2009-08-27 | 株式会社日立製作所 | 通信システム、通信装置及び音源方向特定装置 |
JP4660740B2 (ja) * | 2006-09-13 | 2011-03-30 | 独立行政法人産業技術総合研究所 | 電動車椅子搭載用音声入力装置 |
JP4451892B2 (ja) * | 2007-03-19 | 2010-04-14 | 株式会社リコー | 映像再生装置、映像再生方法、及び映像再生プログラム |
JP5047882B2 (ja) * | 2008-06-04 | 2012-10-10 | 日本電信電話株式会社 | 発話関連情報提示装置及び方法 |
KR100958932B1 (ko) | 2008-08-19 | 2010-05-19 | 주식회사 에스원 | 3차원 음원 위치 측정 기술을 이용한 침입 감지 장치 및 방법 |
JP2011033369A (ja) * | 2009-07-30 | 2011-02-17 | Ricoh Co Ltd | 会議装置 |
CN102033223B (zh) * | 2010-12-29 | 2012-10-03 | 北京信息科技大学 | 使用麦克风阵列对声源定位的方法 |
JP5647070B2 (ja) * | 2011-05-23 | 2014-12-24 | Kddi株式会社 | ポインティングシステム |
WO2013015461A1 (ko) * | 2011-07-22 | 2013-01-31 | 엘지전자 주식회사 | 음원 방향 탐지 장치 및 이를 포함하는 감시 카메라 |
JP2015161659A (ja) * | 2014-02-28 | 2015-09-07 | 株式会社熊谷組 | 音源方向推定装置、及び、音源推定用画像の表示装置 |
CN104502893B (zh) * | 2014-12-10 | 2017-05-10 | 北京智谷睿拓技术服务有限公司 | 定位方法、定位装置以及用户设备 |
KR101630614B1 (ko) * | 2015-03-25 | 2016-06-24 | (주)에어사운드 | 동영상 강의 콘텐츠 제작 시스템 및 방법 |
CN106328130A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种机器人语音寻向转动系统及方法 |
CN105005027A (zh) * | 2015-08-05 | 2015-10-28 | 张亚光 | 一种区域范围内目标对象的定位系统 |
JP2017156122A (ja) * | 2016-02-29 | 2017-09-07 | 沖電気工業株式会社 | 制御装置、制御方法、及び探知システム |
JP6697982B2 (ja) * | 2016-08-29 | 2020-05-27 | Kddi株式会社 | ロボットシステム |
JP6976131B2 (ja) * | 2017-10-16 | 2021-12-08 | 三菱重工サーマルシステムズ株式会社 | 空調システム及び空調制御方法 |
JP7154530B2 (ja) * | 2018-01-16 | 2022-10-18 | 株式会社ユピテル | 音源方向特定装置 |
JP2019123055A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置 |
CN110389597B (zh) * | 2018-04-17 | 2024-05-17 | 北京京东尚科信息技术有限公司 | 基于声源定位的摄像头调整方法、装置和系统 |
JP2019211393A (ja) * | 2018-06-07 | 2019-12-12 | 旭化成エレクトロニクス株式会社 | 判定装置、判定方法、判定プログラム |
US10565977B1 (en) | 2018-08-20 | 2020-02-18 | Verb Surgical Inc. | Surgical tool having integrated microphones |
JP2021072575A (ja) * | 2019-10-31 | 2021-05-06 | パナソニックIpマネジメント株式会社 | 音源表示システム及び音源表示装置 |
CN112104928A (zh) * | 2020-05-13 | 2020-12-18 | 苏州触达信息技术有限公司 | 一种智能音箱、控制智能音箱的方法和系统 |
CN113453138B (zh) * | 2021-06-29 | 2022-06-21 | 四川长虹电器股份有限公司 | 麦克风阵列中麦克风顺序的检测方法 |
-
1997
- 1997-02-14 JP JP3029297A patent/JP3572849B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH10227849A (ja) | 1998-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3572849B2 (ja) | 音源位置計測装置、及びカメラ撮影制御装置 | |
CN101218853B (zh) | 音频传输系统及通信会议装置 | |
CN104240606B (zh) | 显示装置及显示装置观看角度的调节方法 | |
CN104065798B (zh) | 声音信号处理方法及设备 | |
US20120163610A1 (en) | Apparatus, system, and method of image processing, and recording medium storing image processing control program | |
JP2023508002A (ja) | オーディオデバイス自動場所選定 | |
CN112672251B (zh) | 一种扬声器的控制方法和系统、存储介质及扬声器 | |
JP5206151B2 (ja) | 音声入力ロボット、遠隔会議支援システム、遠隔会議支援方法 | |
JP2004120459A (ja) | 音声出力装置 | |
JP2009177480A (ja) | 撮影装置 | |
JP3531084B2 (ja) | 指向性マイクロフォン装置 | |
WO2016078415A1 (zh) | 一种终端拾音控制方法、终端及终端拾音控制系统 | |
JP2008061186A (ja) | 指向特性制御装置、収音装置および収音システム | |
JP2006166007A (ja) | 音源方向検出方法、音源方向検出装置及び撮影装置 | |
JP2006304124A (ja) | 音源方向確定装置および音源方向確定方法 | |
US11425502B2 (en) | Detection of microphone orientation and location for directional audio pickup | |
CN112098949B (zh) | 一种定位智能设备的方法和装置 | |
JP2006270522A (ja) | 音像定位制御装置 | |
CN112099754A (zh) | 一种获取介绍信息的方法和智能设备 | |
JP2019186743A (ja) | スピーカ、スピーカシステム、及びこれを備えたテレビジョン受信機 | |
JPH07140527A (ja) | カメラ撮影制御装置 | |
TWI756607B (zh) | 自動擺位的音箱裝置及其音響系統 | |
JP7403778B2 (ja) | 音源方向特定装置 | |
JP2020115609A (ja) | 音声録音装置及びその制御方法、並びにプログラム | |
EP4404580A1 (en) | Broadcast-directing control method and apparatus, and storage medium and computer program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040608 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040621 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080709 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090709 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100709 Year of fee payment: 6 |