JP5611119B2 - Acoustic simulator, acoustic consulting apparatus, and processing method thereof - Google Patents
Acoustic simulator, acoustic consulting apparatus, and processing method thereof Download PDFInfo
- Publication number
- JP5611119B2 JP5611119B2 JP2011112427A JP2011112427A JP5611119B2 JP 5611119 B2 JP5611119 B2 JP 5611119B2 JP 2011112427 A JP2011112427 A JP 2011112427A JP 2011112427 A JP2011112427 A JP 2011112427A JP 5611119 B2 JP5611119 B2 JP 5611119B2
- Authority
- JP
- Japan
- Prior art keywords
- acoustic
- microphone
- information
- speaker
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
本発明は、使用環境に応じた音響機器の適切な設置を支援するためのシミュレーション技術及び当該シミュレーション結果を使用するコンサルティング技術に関する。 The present invention relates to a simulation technique for supporting appropriate installation of an audio device according to a use environment and a consulting technique using the simulation result.
近年、テレビ会議システムの普及が進んでいる。テレビ会議システムを用いれば、遠隔地間においても、音声と映像による双方向のコミュニケーションを実現することができる。 In recent years, video conferencing systems have become popular. If a video conference system is used, two-way communication using voice and video can be realized even between remote locations.
当該システムにおいて、音声はマイクロホンを通じて収録された後、遠方側に送信され、スピーカを通じて再生される。ところが、マイクロホンで収録される音声には、様々な雑音が混入する可能性があり、当該雑音の混入がスピーカから再生される音声の品質劣化の要因となっている。 In this system, sound is recorded through a microphone, transmitted to a remote side, and reproduced through a speaker. However, there is a possibility that various noises are mixed in the voice recorded by the microphone, and the mixing of the noise causes deterioration of the quality of the voice reproduced from the speaker.
一般には、空調機やプロジェクタが発生する風音を含む周囲雑音や音響エコーが問題にされやすい。音響エコーとは、マイクロホンと同じ室内に設置されたスピーカから再生された音がマイクロホンに混入することで発生する。 In general, ambient noise and acoustic echo including wind noise generated by air conditioners and projectors are likely to be a problem. Acoustic echo is generated when sound reproduced from a speaker installed in the same room as the microphone is mixed into the microphone.
ところが、マイクロホンで収録された音が何ら処理されることなく遠方に送信されることになると(音響エコーも送信されると)、遠方側の話者には、自分の発した声が遅れて戻ってくるように感じられる。この場合、会話の容易さが大きく損なわれてしまう。このため、周囲雑音や音響エコーを除去する機能を備える音響信号処理システムが従来より提案されている(例えば、非特許文献1参照)。 However, if the sound recorded by the microphone is transmitted far away without any processing (acoustic echoes are also sent), the far-side speaker returns with a delayed voice. It feels like coming. In this case, the ease of conversation is greatly impaired. For this reason, an acoustic signal processing system having a function of removing ambient noise and acoustic echo has been conventionally proposed (see, for example, Non-Patent Document 1).
また、周囲雑音や音響エコーの他、発話者の残響成分も一種の雑音である。このため、これら残響成分の抑圧も求められている。ところが、この残響成分は、発話者の声との相関が高い。このため、残響成分を除去する際に誤って発話者の声まで抑圧してしまう可能性がある。特に、初期反射音の除去は困難である。もっとも、発話者の口元からマイクロホンに直接伝わる音に対し、マイクホンまでの到来が数百ms程度遅れる後部残響成分を除去する技術が近年開発されている(例えば、非特許文献2参照)。 In addition to ambient noise and acoustic echo, the reverberation component of the speaker is also a kind of noise. For this reason, suppression of these reverberation components is also required. However, this reverberation component has a high correlation with the voice of the speaker. For this reason, when removing the reverberation component, the voice of the speaker may be erroneously suppressed. In particular, it is difficult to remove the initial reflected sound. However, in recent years, a technology has been developed to remove a rear reverberation component that delays arrival at the microphone by about several hundred ms from the sound directly transmitted from the speaker's mouth to the microphone (for example, see Non-Patent Document 2).
これら課題の解決には、テレビ会議システムを使用する前のチューニングや最適化が必要となる。これらの作業には、実際の現場で収録した音響特性を用いることが多い。例えば、音響環境を一種のシステムとみなし、音響環境に入った入力音(話者の口元やスピーカから出た瞬間の音)と、システムから出る出力音(マイクロホンに入った音)との間の関係をインパルス応答として計測し、チューニング及び最適化に活用することが多い。例えばインパルス応答の測定には、TSP(Time Stretched Pulse)が用いられている。 To solve these problems, tuning and optimization are required before using the video conference system. For these operations, the acoustic characteristics recorded at the actual site are often used. For example, considering the acoustic environment as a kind of system, the sound between the input sound that entered the acoustic environment (the sound of the moment when it comes out of the speaker's mouth or speaker) and the output sound that comes out of the system (the sound that entered the microphone) The relationship is often measured as an impulse response and used for tuning and optimization. For example, TSP (Time Stretched Pulse) is used for measuring the impulse response.
なお、これまで提案されているチューニングや最適化に関する技術は、いずれも主に音響信号処理で使用するパラメータの変更であり、収録したインパルス応答を使って該当環境における発話音声をシミュレートし、評価に用いている。 All of the tuning and optimization technologies that have been proposed so far are mainly changes in parameters used in acoustic signal processing. The recorded impulse response is used to simulate and evaluate speech speech in the corresponding environment. Used for.
因みに、コンサートホールその他建物の設計時や建築時における音響設計の用途では、対象建物のCADデータから音響環境をシミュレーションし、音の聞こえ方を事前に知ることができるシステムが開発されている(例えば、特許文献1参照)。 Incidentally, in the design of concert halls and other acoustic designs when building or building, a system has been developed that can simulate the acoustic environment from CAD data of the target building and know in advance how to hear the sound (for example, , See Patent Document 1).
ところが、前述した音響信号処理技術は、室内の環境(音響条件)の影響を受け易い。具体的には残響時間、雑音の種類及び発生位置、スピーカとマイクロホンの位置関係、スピーカの再生音量等の影響を受け易い。 However, the above-described acoustic signal processing technique is easily affected by the indoor environment (acoustic conditions). Specifically, it is easily affected by the reverberation time, the type and location of noise, the positional relationship between the speaker and the microphone, the reproduction volume of the speaker, and the like.
このため、テレビ会議システム等のチューニング及び最適化には、音響信号処理で使用するパラメータを単にチューニングするだけでなく、マイクロホンとスピーカの位置関係やマイクロホンの数を使用環境に応じて最適化する必要がある。 For this reason, tuning and optimization of video conferencing systems, etc. require not only tuning parameters used in acoustic signal processing, but also optimizing the positional relationship between microphones and speakers and the number of microphones according to the operating environment. There is.
また、既存の音響シミュレータは、事前に現場のCADデータが取得されていることが必要であり、CADデータが存在しない場合には、そもそも音響特性をシミュレーションすることができなかった。 In addition, existing acoustic simulators require that on-site CAD data be acquired in advance, and if CAD data does not exist, the acoustic characteristics could not be simulated in the first place.
これらの技術課題を鋭意検討した本発明者は、CADデータが存在しない又は利用できない環境下でも、マイクロホンとスピーカの位置関係等を使用環境に応じて最適化することができるシミュレーション技術及び当該処理結果を使用する音響コンサルティング技術を発明した。 The present inventor, who has intensively studied these technical problems, is able to optimize the positional relationship between the microphone and the speaker according to the use environment even in an environment where CAD data does not exist or cannot be used, and the processing result. Invented acoustic consulting technology that uses.
本発明に係る音響シミュレータは、音響システムを構築する空間内で実際に収録された音響データと、当該音響データの収録時に使用したマイクロホン及びスピーカの実測に基づく位置情報と、システム構築後に想定される音源、マイクロホン及びスピーカの位置情報等に基づいて、当該マイクロホンの設置位置における音響特性を推定する。 The acoustic simulator according to the present invention is assumed to be acoustic data actually recorded in a space for constructing an acoustic system, position information based on actual measurements of microphones and speakers used at the time of recording the acoustic data, and after system construction. Based on the position information of the sound source, the microphone, and the speaker, the acoustic characteristics at the installation position of the microphone are estimated.
また、本発明に係る音響コンサルティング装置は、音響シミュレータにより推定された音響特性が所定の性能を満たすか否かを評価し、評価結果をユーザーに提示する。 The acoustic consulting apparatus according to the present invention evaluates whether or not the acoustic characteristics estimated by the acoustic simulator satisfy a predetermined performance, and presents the evaluation result to the user.
本発明によれば、音響システムを構築する空間に関するCADデータが存在しない場合や利用できない場合でも、空間に適した音響環境の構築を支援することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
ADVANTAGE OF THE INVENTION According to this invention, even when the CAD data regarding the space which construct | assembles an acoustic system does not exist, or when it cannot utilize, it can support the construction of the acoustic environment suitable for space.
Problems, configurations, and effects other than those described above will be clarified by the following description of embodiments.
以下、図面に基づいて、本発明の実施の形態を説明する。なお、本発明の実施の態様は、後述する形態例に限定されるものではなく、その技術思想の範囲において、種々の変形が可能である。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The embodiment of the present invention is not limited to the embodiments described later, and various modifications are possible within the scope of the technical idea.
以下、CADデータが存在しない空間にテレビ会議システムを構築する場合に使用して好適な音響コンサルティング装置の仕組みを説明する。図1に、音響コンサルティング装置を適用するテレビ会議システムの設置環境例を示す。なお、本明細書における「テレビ会議システム」は、ビデオ会議システムやWeb会議システムも含む意味で使用する。 Hereinafter, a mechanism of an audio consulting apparatus suitable for use in constructing a video conference system in a space where CAD data does not exist will be described. FIG. 1 shows an installation environment example of a video conference system to which an acoustic consulting apparatus is applied. Note that the “video conference system” in this specification is used to include a video conference system and a web conference system.
(テレビ会議システムの構成要素と配置)
本形態例において、テレビ会議システムは、マイクロホンとスピーカを備える汎用のテレビ会議システムを想定する。もっとも、特定の用途に最適化されたテレビ会議システムであっても構わない。
(Components and arrangement of the video conference system)
In this embodiment, the video conference system is assumed to be a general-purpose video conference system including a microphone and a speaker. However, it may be a video conference system optimized for a specific application.
テレビ会議システム設置環境101は、テレビ会議システムを構築する空間(環境)であれば、特に制約はない。ここでは、会議室を想定する。この形態例の場合、会議室に配置された机102の上には会議用マイクロホン104が設置されているものとする。また、会議用スピーカ103は、同じ会議室内に配置されているものとする。会議用スピーカ103と会議用マイクロホン104は、汎用のテレビ会議システムに常に接続されていても良い。
The video conference
図1に係るテレビ会議システムは、発話者が2人の場合を想定する。図1では、想定する発話者の位置を、想定話者位置105−1及び105−2で表している。もっとも、システム的には発話者は1人でも3人以上でも良い。また、会議用スピーカ103や会議用マイクロホン104も、システム的には1台に限らず、複数台であっても良い。
The video conference system according to FIG. 1 assumes a case where there are two speakers. In FIG. 1, assumed speaker positions are represented by assumed speaker positions 105-1 and 105-2. However, the number of speakers may be one or more than three in terms of system. Further, the
図1には、テレビ会議システムを使用する際の音響条件を与える会議用スピーカ103、会議用マイクロホン104及び想定話者位置105−1及び105−2の他、音響特性の実測時に使用する4台の測定用マイクロホンアレイ106と2台の測定用スピーカアレイ107を描いている。
FIG. 1 shows a
この形態例の場合、測定用マイクロホンアレイ106及び測定用スピーカアレイ107は、テレビ会議システム設置環境101の音響特性の測定時に測定ユーザーによって配置される。図1の場合、測定用マイクロホンアレイ106は机102の四隅に配置されている。また、測定用スピーカアレイ107は、想定話者位置105−1及び105−2の背後に配置されている。
In the case of this embodiment, the
ここで、測定用スピーカアレイ107は、音響特性を測定する際の参照音の放出に使用される。この形態例の場合、測定用スピーカアレイ107は、複数のスピーカの集合体であるが、1台のスピーカにより構成されていても良い。
Here, the
なお、図1の場合、測定用マイクロホンアレイ106と測定用スピーカアレイ107はいずれも複数ずつ配置されているが、いずれも1台だけ配置しても良い。また、測定用マイクロホン106及び測定用スピーカアレイ107は、音響コンサルティング装置による音響特性の測定及び最適条件の出力の後、会議室から取り外される。もっとも、一部は、会議用スピーカ103や会議用マイクロホン104と兼用しても良い。
In the case of FIG. 1, a plurality of
(音響コンサルティング装置のハードウェア構成)
図2に、形態例に係る音響コンサルティング装置のハードウェア構成を示す。なお、音響シミュレーション装置は、音響コンサルティング装置の機能の一部として実現される。従って、音響コンサルティング装置のハードウェア構成は、音響シミュレーション装置と共通である。以下では、音響コンサルティング装置のハードウェア構成として説明する。
(Hardware configuration of acoustic consulting equipment)
FIG. 2 shows a hardware configuration of the acoustic consulting apparatus according to the embodiment. The acoustic simulation apparatus is realized as a part of the function of the acoustic consulting apparatus. Therefore, the hardware configuration of the acoustic consulting apparatus is the same as that of the acoustic simulation apparatus. Below, it demonstrates as a hardware constitutions of an acoustic consulting apparatus.
形態例に係る音響コンサルティング装置は、測定用マイクロホンアレイ106と測定用スピーカアレイ107を、コンピュータに接続することにより構成される。
The acoustic consulting apparatus according to the embodiment is configured by connecting the
測定用マイクロホンアレイ106で取り込んだ音響信号は、多チャンネルAD(Analog to Digital)変換装置202により、アナログ信号からデジタル信号に変換される。変換後のデジタル信号は中央演算装置203に与えられる。
The acoustic signal captured by the
中央演算装置203は、各種のプログラムを実行する。この形態例の場合、中央演算装置203は、会議室内の任意の位置に会議用マイクロホン104や会議用スピーカ103を配置した場合の音響特性をシミュレーションする処理やその処理結果を評価する処理等を実行する。当該処理機能を実現するプログラムを、本明細書では、「音響信号処理プログラム」ということにする。なお、音響信号処理プログラムは、不揮発性メモリ204に記憶されており、必要に応じて中央演算装置203に読み出される。因みに、当該プログラムを実行するためのワークメモリは、揮発性メモリ205上に確保される。
The
前述したように、形態例に係る音響コンサルティング装置は、テレビ会議システム設置環境101の音響特性を測定用マイクロホンアレイ106及び測定用スピーカアレイ107で実測し、音響シミュレーションのための基礎データとする。ここでの音響特性は、インパルス応答特性や周囲雑音である。
As described above, the acoustic consulting apparatus according to the embodiment actually measures the acoustic characteristics of the video conference
音響特性の測定時、中央演算装置203は、多チャンネルDA(Digital to Analog)変換装置206にインパルス応答測定用の参照信号をデジタル信号として送信する。当該参照信号は、多チャンネルDA変換装置206においてアナログ信号に変換され、測定用スピーカアレイ107に出力される。測定用スピーカアレイ107は、入力された参照信号に対応する音をテレビ会議システム設定環境101に放射する。
When measuring the acoustic characteristics, the
中央演算装置203には、ユーザーのためのインターフェースとして、マウス208及びキーボード209が用意されている。ユーザーは、これらのインターフェースを使用し、中央演算装置203に情報を入力する。また、音響シミュレーションの結果は、ディスプレイ210に表示され、ユーザーはシミュレーション結果や評価結果を目視により確認することができる。
The
(音響シミュレータとしての処理)
まず、本形態例に係る音響コンサルティング装置の基本機能(音響シミュレーション機能)について説明する。ここで、音響シミュレーション機能とは、会議用スピーカ103と会議用マイクロホン104をテレビ会議システム設置環境101内の任意の位置に仮想的に設定した場合に収録される音響特性をシミュレーションする機能である。
(Processing as an acoustic simulator)
First, the basic function (acoustic simulation function) of the acoustic consulting apparatus according to this embodiment will be described. Here, the acoustic simulation function is a function for simulating acoustic characteristics recorded when the
ただし、本形態例では、テレビ会議システム設置環境101のCADデータが存在しないことを前提とする。このため、音響シミュレータとして動作する音響コンサルティング装置は、テレビ会議システム設置環境101の音響特性を測定用マイクロホンアレイ106と測定用スピーカアレイ107を用いて測定し、当該測定結果を使用して仮想位置における音響特性を演算する。以下では、音響シミュレーション機能の提供主体を音響シミュレータと呼ぶ。
However, in this embodiment, it is assumed that there is no CAD data for the video conference
図3に、音響シミュレータの処理手順の概略を示す。音響シミュレータは、処理301〜処理303において、テレビ会議システム設置環境101に設置されている会議用マイクロホン104、会議用スピーカ103の位置情報及び想定話者位置105−1、105−2の登録処理を実行する。なお、処理301〜処理303の実行順序は一例であり、どのような順序で実行されても構わない。
FIG. 3 shows an outline of the processing procedure of the acoustic simulator. In
処理301において、音響シミュレータは、会議用マイクロホン104に関する情報の登録処理を実行する。ここでの情報は、中央演算装置203による処理が可能なように、マウス208、キーボード209その他の入力装置を通じて入力される。CADデータが存在しないため、登録(設定)作業は手作業で行われる。他の音響機器の位置情報の登録についても同様である。
In the
なお、会議用マイクロホン104の情報には、テレビ会議システム設置環境101内の設置場所、マイクロホンの指向特性、マイクロホンの向き等が含まれる。
The information of the
図4に、会議用マイクロホン104の情報の登録例を示す。なお、後述するように、図4に示す登録項目は、測定用マイクロホンの情報の場合にも共通である。ただし、会議用の情報と測定用の情報は別テーブルで管理される。
FIG. 4 shows an example of registration of information of the
図4の各行が、各マイクロホンの情報に対応する。図4の場合、3台のマイクロホンの使用が想定されている。各行には、マイクロホンを一意に特定するマイクロホンIDが付与されている。また、各行には、マイクロホンの三次元的な位置(x,y,z)及び向きが記憶されている。単位に一貫性があれば、任意の単位系を使用できる。座標系は絶対座標とし、テレビ会議システム設置環境101毎に同じ座標系を使用することを想定する。
Each row in FIG. 4 corresponds to information on each microphone. In the case of FIG. 4, the use of three microphones is assumed. Each row is given a microphone ID that uniquely identifies the microphone. Each row stores the three-dimensional position (x, y, z) and orientation of the microphone. Any unit system can be used as long as the units are consistent. It is assumed that the coordinate system is absolute, and the same coordinate system is used for each video conference
なお、会議用マイクロホン104が未設定の場合、設置予定の座標値を入力しても良い。会議用マイクロホン104の場所を指定する座標値には、例えば実測値を入力する。設置位置に関する情報を参照可能な場合には、その情報を手入力しても良い。この形態例の場合、会議用マイクロホン104は既設であり、測定用マイクロホンアレイ106や測定用スピーカアレイ107の設置位置を実測する際の基準点として使用する。
If the
この他、各行には、マイクロホンの指向特性の情報が付与されている。指向特性の情報から、正面に対する方位角毎の音圧レベルが一意に定まる。指向特性は、一般的には、マイクロホンのカタログ等から知ることができる。 In addition, information on the directivity of the microphone is given to each row. From the information on the directivity, the sound pressure level for each azimuth angle with respect to the front is uniquely determined. The directivity characteristic can be generally known from a microphone catalog or the like.
処理302において、音響シミュレータは、会議用スピーカ103に関する情報の登録処理を実行する。ここでの情報も、中央演算装置203におる処理が可能なように、マウス208、キーボード209その他の入力装置を通じて入力される。
In
会議用スピーカ103の情報には、テレビ会議システム設置環境101内の設置場所、スピーカの放射特性、スピーカの向き等が含まれる。
The information of the
図5に、会議用スピーカ103の情報の登録例を示す。なお、後述するように、図5に示す登録項目は、測定用スピーカアレイの情報の登録にも使用できる。ただし、会議用の情報と測定用の情報とは別テーブルで管理される。
FIG. 5 shows a registration example of information of the
図5の各行が、各スピーカの情報に対応する。図5の場合、3台のスピーカの使用が想定されている。各行には、スピーカを一意に特定するスピーカIDが付与されている。また、各行には、スピーカの三次元的な位置(x,y,z)及び向きが記憶される。単位系は任意であるが、マイクロホンと同じ座標系を使用する。 Each row in FIG. 5 corresponds to information of each speaker. In the case of FIG. 5, the use of three speakers is assumed. Each row is given a speaker ID that uniquely identifies the speaker. Each row stores a three-dimensional position (x, y, z) and orientation of the speaker. The unit system is arbitrary, but the same coordinate system as the microphone is used.
なお、会議用スピーカ103が未設の場合には設置予定の座標値を入力しても良い。会議用スピーカ103の場所を指定する座標値には、例えば実測値を入力する。設置位置に関する情報を参照可能な場合には、その情報を手入力しても良い。なお、会議用スピーカ103が既設の場合には、当該設定位置を、測定用マイクロホンアレイ106や測定用スピーカアレイ107の設置位置を実測する際の基準点に使用しても良い。
If the
この他、各行には、スピーカの放射特性の情報が付与されている。放射特性の情報から、正面に対する方位角ごとの音圧レベルが一意に定まる。放射特性は、一般的には、スピーカのカタログ等から知ることができる。 In addition, information on the radiation characteristics of the speaker is given to each row. From the information on the radiation characteristics, the sound pressure level for each azimuth angle with respect to the front is uniquely determined. The radiation characteristics can be generally known from a catalog of speakers or the like.
処理303において、音響シミュレータは、想定話者位置に関する情報の登録処理を実行する。想定話者位置とは、テレビ会議の参加者の着席位置として想定される範囲を指定する情報である。ここでの情報も、中央演算装置203におる処理が可能なように、マウス208、キーボード209その他の入力装置を通じて入力される。
In
図6に、想定話者位置の登録例を示す。図6の各行が、想定話者位置の情報に対応する。想定話者位置が複数であれば、複数の話者位置が設定される。図6は想定話者位置が3つの場合を表している。各行には、想定話者位置を一意に特定する想定話者位置IDが付与されている。また、各行には、想定話者位置の中心位置を与える三次元的な位置(x,y,z)と当該中心位置に対する範囲を与える半径Rが記憶されている。座標系は絶対座標であり、マイクロホンと同じ座標系を使用する。 FIG. 6 shows a registration example of the assumed speaker position. Each line in FIG. 6 corresponds to information on the assumed speaker position. If there are a plurality of assumed speaker positions, a plurality of speaker positions are set. FIG. 6 shows a case where there are three assumed speaker positions. Each row is given an assumed speaker position ID that uniquely identifies the assumed speaker position. Each row stores a three-dimensional position (x, y, z) that gives the center position of the assumed speaker position and a radius R that gives a range for the center position. The coordinate system is absolute and uses the same coordinate system as the microphone.
次に、音響シミュレータは、処理304〜処理305において、テレビ会議システム設置環境101の音響特性を測定するための計測機器(音響機器)の位置情報等を設定する。処理304と処理305の実行順序は一例であり、いずれが先に実行されても構わない。
Next, in processing 304 to processing 305, the acoustic simulator sets position information and the like of a measuring device (acoustic device) for measuring acoustic characteristics of the video conference
処理304において、音響シミュレータは、測定用マイクロホン106に関する情報の登録処理を実行する。ここでの情報は、中央演算装置203による処理が可能なように、マウス208、キーボード209その他の入力装置を通じて入力される。
In
測定用マイクロホン106の情報には、テレビ会議システム設置環境101内の設置場所、マイクロホンの指向特性、マイクロホンの向き等が含まれる。前述の通り、測定用マイクロホン106に関する情報は、会議用マイクロホン104に関する情報とは別のテーブルに記録される。なお、座標系は絶対座標であり、マイクロホンと同じ座標系を使用する。ここで、測定用マイクロホン106の座標値は、テレビ会議システム設置環境101内に設定された基準点(例えば会議用マイクロホン104)に対する相対的な位置情報として入力しても良い。この入力手法を採用する場合、中央演算装置203によって絶対座標に変換する処理が実行される。
The information of the
処理305において、音響シミュレータは、測定用スピーカアレイ107に関する情報の登録処理を実行する。ここでの情報は、中央演算装置203による処理が可能なように、マウス208、キーボード209その他の入力装置を通じて入力される。
In
測定用スピーカアレイ107の情報には、テレビ会議システム設置環境101内の設置場所、スピーカの放射特性、スピーカの向き等が含まれる。前述の通り、測定用スピーカアレイ107に関する情報は、会議用スピーカ103に関する情報とは別のテーブルに記録される。なお、座標系は絶対座標であり、マイクロホンと同じ座標系を使用する。やはり、測定用スピーカアレイ107の座標値は、テレビ会議システム設置環境101内に設定された基準点(例えば会議用マイクロホン104)に対する相対的な位置情報として入力しても良い。この入力手法を採用する場合、中央演算装置203によって絶対座標に変換する処理が実行される。
The information of the
処理306において、音響シミュレータは、テレビ会議システム設置環境101内に設置された測定用マイクロホンアレイ106と測定用スピーカアレイ107を用い、テレビ会議システム設定環境101に固有の音響特性を計測する。処理306において、音響シミュレータは、測定用スピーカアレイ107と測定用マイクロホンアレイ106間の伝達特性(インパルス応答)の測定と周囲雑音の測定を実行する。
In the
図7に、処理306に対応する処理機能を実現するプログラムの機能ブロック構成を示す。以下の説明では、当該プログラムを音響特性計測部701と呼ぶ。音響特性計測部701は、インパルス応答測定部702と周囲雑音測定部703で構成される。
FIG. 7 shows a functional block configuration of a program that realizes a processing function corresponding to the
インパルス応答測定部702は、テレビ会議システム設定環境101におけるインパルス応答を、例えばTSP法(例えば特許文献1参照)を用いて測定する。この他、測定用スピーカアレイ107から白色雑音などの全周波数成分を含んだ音を放射して測定用マイクロホンアレイ106で収録し、マイクロホンで収録された信号と放射音の原信号の相関係数を調べることでインパルス応答を測定しても良い。
The impulse
図7に示すように、インパルス応答の測定時には、測定用マイクロホンアレイ106に接続された多チャンネルAD変換装置202と、測定用スピーカアレイ107に接続された多チャンネルDA変換装置206を使用する。
As shown in FIG. 7, when measuring the impulse response, a
多チャンネルDA変換装置206は、インパルス応答測定に用いる白色信号やTSP信号(音響信号S3)をインパルス応答測定部702から入力し、当該音響信号S3をデジタル信号からアナログ信号に変換する。多チャンネルAD変換装置202は、多チャンネルDA変換装置206と同期制御され、インパルス応答測定中の音声信号をアナログ信号からデジタル信号(音響信号S1、S2)に変換する。変換後のデジタル信号は、インパルス応答測定部702及び周囲雑音測定部703に与える。
The
インパルス応答測定部702は、与えられた信号に相関係数推定処理やTSP(Time Stretched Pulse)逆変換処理を適用し、インパルス応答S4を得る。これらの処理自体は既知であるため、詳細な説明は省略する。
The impulse
一方、周囲雑音測定部703は、与えられた信号からテレビ会議システム設置環境101内の周囲雑音を測定する。周囲雑音の収録は、実際のテレビ会議中の雑音にできる限り近い雑音が生じるように、テレビ会議システム設置環境101の機器を制御する。例えばテレビ会議システム設置環境101に空調機やプロジェクタが配備されている場合、それら機器を動作させた状態で周囲雑音を収録する。勿論、周囲雑音の収録時には、測定用スピーカアレイ107から音は出力されない。同じく、周囲雑音の収録時には、話者音も誤って収録されないように注意する。ただし、周囲雑音として紙が擦れる音や卓上をたたく音等を想定する場合には、これらの音が収録中に生じるように収録環境を工夫しても良い。
On the other hand, the ambient
図8に、周囲雑音測定部703の詳細ブロック構成を示す。周囲雑音測定部703は、測定用マイクロホンアレイ106で集音された音響信号S2を音源毎の信号S11、S12、…、S1Nに分離する音源分離部802と、音源毎の信号から各音源の音量と空間的な場所を推定する音源定位部803−1、803−2、…、803−Nとで構成される。ここで、音源定位部803−1、803−2、…、803−Nは、各音源の音量と音源位置の情報S5(S21、S22、…S2N)を出力する。
FIG. 8 shows a detailed block configuration of the ambient
音源分離部802は、独立成分分析や最小分散ビームフォーマ、非負行列分解その他の一般的な音源分離処理技術を用い、複数チャンネルのマイクロホン入力信号を各音源に対応する信号S11、S12、…、S1Nに分離する。
The sound
音源定位部803−1、803−2、…、803−Nは、位相差に基づいたSRP-PHAT(Steered Response Power-Phase Transform)方式等を使用して各音源の位置を求める。この他、測定用マイクロホンアレイ106を分散的に配置する場合には、マイクロホン間の振幅比から音源位置を推定する方式を用いても良い。
The sound source localization units 803-1, 803-2,..., 803-N obtain the position of each sound source using an SRP-PHAT (Steered Response Power-Phase Transform) method based on the phase difference. In addition, when the
処理307において、音響シミュレータは、音響シミュレーションのための会議用マイクロホン104と会議用スピーカ103に関する仮想情報の登録処理を実行する。この処理で登録された情報に基づいて、音響シミュレータは、音響シミュレーションを実行する。ユーザーは、会議用マイクロホン104と会議用スピーカ103について登録されている情報に対し、仮想値をそれぞれ登録することができる。すなわち、設置位置、向き及び性能等に関する仮想値をそれぞれ登録することができる。例えば、処理301及び302で登録された位置と向きの情報をそのまま使用し、会議用マイクロホン104の指向特性だけを仮想的に変更しても良い。
In the
この形態例の場合、ユーザーは、これら情報の登録(設定)を、例えばGUI(Graphical User Interface)を用いて実行する。情報の登録は、数値等の直接入力することにより行っても良いし、予め定義されたリストの中から選択する方式を採用しても良い。 In the case of this embodiment, the user performs registration (setting) of these pieces of information using, for example, a GUI (Graphical User Interface). Information registration may be performed by directly inputting a numerical value or the like, or a method of selecting from a predefined list may be employed.
処理308において、音響シミュレータは、テレビ会議システム設定環境101について実測された音響特性と、仮想的に設定された会議用マイクロホン104や会議用スピーカ103に関する情報とに基づいて音響シミュレーションを実行し、シミュレーション結果を出力して処理を終了する。
In
図9に、処理308に対応する処理機能を実現するプログラムの機能ブロック構成を示す。以下の説明では、当該プログラムを音響シミュレーション部901と呼ぶ。音響シミュレーション部901は、会議参加者の発話のインパルス応答を推定する機能と、会議用スピーカ104において集音される残留エコー量を推定する機能と、シミュレーション上仮想的に設定されたマイクロホン位置における騒音をシミュレーションする機能を有している。
FIG. 9 shows a functional block configuration of a program that realizes a processing function corresponding to the
音響シミュレーション部901は、直接音/残響音分割部902、想定話者位置のインパルス応答推定部903、残留エコー推定部904、想定マイク位置の騒音シミュレーション部905で構成される。
The
直接音/残響音分割部902は、インパルス応答測定部702で測定されたインパルス応答S4を直接音成分と残響音成分とに分割する。図10に、インパルス応答S4の一例を示す。図中上段は、測定用スピーカ107と測定用マイクロホン106の距離が1mの場合に取得されるインパルス応答の波形であり、図中下段は、同距離が3mの場合に取得されるインパルス応答の波形である。ここで、横軸は時間であり、縦軸は信号強度である。
The direct sound /
図に破線で囲んで示すように、インパルス応答の先頭付近に出現する波形が直接音成分に対応し、それ以後に出現する波形が残響成分に対応する。2つの波形を見比べて分かるように、直接音成分は明らかに距離の影響を受けている。直接音成分のピーク値は、1mの方が3mの場合よりも大きいことが分かる。一方、残響成分については音量が大きくは変化しないことが分かる。 As shown in the figure surrounded by a broken line, the waveform appearing near the head of the impulse response corresponds to the direct sound component, and the waveform appearing thereafter corresponds to the reverberation component. As can be seen by comparing the two waveforms, the direct sound component is clearly affected by the distance. It can be seen that the peak value of the direct sound component is larger at 1 m than at 3 m. On the other hand, it can be seen that the reverberation component does not change greatly.
本例の場合、距離が1mと3mにおける直接音の比率は約9.5dB、残響音の比率は約2dBであった。距離が1mから3mに3倍変化した場合に、約9.5dBだけ音量が小さくなっているので、直接音成分は距離の2乗に反比例して音量が変化していると考えることができる。一方、残響の音量は、距離の変化に対してほぼ無関係に決まると考えられる。 In the case of this example, the ratio of direct sound at a distance of 1 m and 3 m was about 9.5 dB, and the ratio of reverberant sound was about 2 dB. When the distance changes 3 times from 1 m to 3 m, the volume is reduced by about 9.5 dB. Therefore, it can be considered that the volume of the direct sound component changes in inverse proportion to the square of the distance. On the other hand, the volume of reverberation is considered to be determined almost independently of changes in distance.
まず、直接音/残響音分割部902は、インパルス応答S4の直接音の開始ポイントsmaxを、以下の式を用いて求める。
First, the direct sound /
なお、直接音の終了ポイントは、smax+wで与えられる。ここで、wは窓幅であり、固定値に設定する。 The end point of the direct sound is given by s max + w. Here, w is the window width, and is set to a fixed value.
次に、直接音/残響音分割部902は、開始ポイントSmaxを用い、インパルス応答の直接音成分hdirectを、以下の関係式を用いて求める。
Next, the direct sound / reverberation
一方、直接音/残響音分割部902は、残響成分hreverbを、以下の式を用いて求める。
想定話者位置のインパルス応答推定部903は、インパルス応答の直接音成分hdirectと残響成分hreverbを使用し、想定話者位置からの発話を仮想的に配置された会議用マイクロホンで受音する場合におけるインパルス応答を推定する。なお、インパルス応答推定部903には、想定話者位置の情報と想定する会議マイクロホンの情報が与えられている。図9では、これらの情報をS41で示す。インパルス応答hsynthは次式で与えられる。
The assumed speaker position impulse
ここで、αは直接音成分の減衰率とし、次式で与えられる。
ここで、rpreは、インパルス応答を測定した際に用いた測定用スピーカアレイ107と測定用マイクロホンアレイ106間の距離とする。rpostは、想定話者位置と会議用マイクロホン104間の距離とする。想定話者位置は、一点ではなく大きさを持っている。このため、設定された想定話者位置の範囲の中で最も大きなrpostを与えるrpostを設定する。
Here, r pre is a distance between the
βpreはインパルス応答の測定に用いた測定用マイクロホンアレイ106の指向特性に依存して決まる係数とする。この形態例の場合、測定用マイクロホンアレイ106が向いている方向を基準方向とし、当該方向に対する測定用スピーカアレイ107の相対的な方向に対応する測定用マイクロホンアレイ106の指向特性をβpreとする。
β pre is a coefficient determined depending on the directivity of the
βpostは、仮想的に配置した会議用マイクロホンの指向特性に依存して決まる係数とする。この形態例の場合、会議用マイクロホンの向いた方向を基準方向とし、当該方向に対する相対話者位置の相対的な方向に対応する測定用マイクロホンアレイ106の指向特性をβpostとする。
β post is a coefficient determined depending on the directivity characteristics of the virtually arranged conference microphone. In the case of this embodiment, the direction in which the conference microphone is directed is the reference direction, and the directivity characteristic of the
γpreはインパルス応答の測定に使用した測定用スピーカアレイ107の放射特性に依存して決まる係数とする。この形態例の場合、測定用スピーカアレイ107の向いた方向を基準方向とし、当該方向に対する測定用マイクロホンアレイ106の相対的な方向に対応する測定用スピーカアレイ107の放射特性をγpreとする。
γ pre is a coefficient determined depending on the radiation characteristics of the speaker array for
γpostは仮想的に配置した想定話者位置の放射特性に依存して決まる係数とする。この形態例の場合、想定話者の向いている方向を基準方向とし、当該方向に対する会議用マイクロホンの相対的な方向に対応する想定話者の放射特性をγpostとする。 γ post is a coefficient determined depending on the radiation characteristics of the assumed speaker position virtually arranged. In this example, the direction in which the assumed speaker is facing is set as the reference direction, and the radiation characteristic of the assumed speaker corresponding to the relative direction of the conference microphone with respect to the direction is set as γ post .
一般に、想定話者は、会議室内に設置されたディスプレイを目視できる方向に向いていると考えられる。このため、この形態例の場合、想定話者位置を、ディスプレイの対面位置に設定する。また、想定話者の放射特性は、予めダミーヘッド等で測定し、データベースに保持しておくことが望ましい。 In general, it is considered that an assumed speaker is facing a direction in which a display installed in a conference room can be seen. Therefore, in the case of this embodiment, the assumed speaker position is set to the facing position of the display. Further, it is desirable that the radiation characteristics of the assumed speaker are measured in advance with a dummy head or the like and stored in a database.
想定話者位置のインパルス応答推定部903は、想定話者位置毎に生成したインパルス応答hsynthを出力して処理を終了する。測定されたインパルス応答が複数存在する場合、インパルス応答推定部903は、rpreとrpostの差が最小となるようなインパルス応答を選択する。
The assumed speaker position impulse
残留エコー推定部904は、仮想的に配置した会議用マイクロホンの位置における残留エコーを推定する。この前処理として、残留エコー推定部904は、仮想的に配置した会議用スピーカから仮想的に配置した会議用マイクロホンまでのインパルス応答を、インパルス応答S4の直接音成分と残響成分に基づいて生成する。この残留エコー推定部904によるインパルス応答の生成は、想定話者位置のインパルス応答推定部903と同様の処理手順により行う。生成したインパルス応答をhechoとする。なお、残留エコー推定部904には、想定話者位置、想定する会議用マイクロホンと会議用スピーカの情報が与えられている。図9では、これらの情報をS42で示す。
The residual
次に、残留エコー推定部904は、残留エコーのインパルス応答hresidualを次式より算出する。
Next, the residual
ここで、λ及びtspecは、使用するエコーキャンセラの仕様に基づいて決まるパラメータである。例えばエコー消去時間T秒、20dBという性能を有するエコーキャンセラの場合、λは0.1、tspecはT秒に相当する。これらの情報を図9ではS43で示す。残留エコー推定部904は、hechoとhresidualを出力して処理を終了する。
Here, λ and t spec are parameters determined based on the specifications of the echo canceller to be used. For example, in the case of an echo canceller having a performance of echo cancellation time T seconds and 20 dB, λ corresponds to 0.1 and t spec corresponds to T seconds. Such information is indicated by S43 in FIG. The residual
想定マイク位置の騒音シミュレーション部905は、音源分離により分離された音源の音量と位置の情報S21〜S2Nを利用し、想定マイク位置の騒音レベルPnoiseを推定する。
The
ここで、Nは音源の数とする。Pobserved(i)は、音源分離により分離されたi番目の音源の音量とする。rpre(i)は、i番目の音源位置と音響特性測定用マイクロホンまでの距離とし、rpost(i)は、i番目の音源位置と仮想的に配置した会議用マイクロホンまでの距離とする。なお、図9では、想定する会議用マイクロホンの情報をS44で示す。騒音シミュレーション部905は、推定した騒音レベルPnoiseを出力して処理を終了する。
Here, N is the number of sound sources. P observed (i) is the volume of the i-th sound source separated by sound source separation. r pre (i) is the distance from the i-th sound source position to the acoustic characteristic measurement microphone, and r post (i) is the distance from the i-th sound source position to the virtually arranged conference microphone. In FIG. 9, information on the assumed conference microphone is indicated by S44. The
なお、必要に応じ、音響シミュレータは、シミュレーションの結果として算出されたインパルス応答hsynth、hecho、hresidual及び騒音レベルPnoiseを文字や図形によりディスプレイ210上に表示する。ユーザーは、この画面表示の内容を確認することにより、会議用マイクロホン104や会議用スピーカ103をシミュレーションの対象となった仮想位置で使用した場合にどのような音響特性が得られるかを事前に判断することができる。
If necessary, the acoustic simulator displays the impulse responses h synth , h echo, h residual and noise level P noise calculated as a result of the simulation on the
このように、本形態例に係る音響シミュレータは、設置位置の仮想的な調整によりシミュレーションを実行する点において、音声信号処理のパラメータを調整する従来技術とは明らかに異なっている。 As described above, the acoustic simulator according to the present embodiment is clearly different from the prior art that adjusts the parameters of the audio signal processing in that the simulation is executed by virtual adjustment of the installation position.
(音響コンサルティング装置としての処理1)
続いて、本形態例に係る音響コンサルティング装置としての処理動作を説明する。ここでは、ユーザーにより仮想的に入力された会議用マイクロホンとスピーカの使用条件が所望の性能を満たしているか否かを入力の都度判定し、判定結果をユーザーに通知する場合について説明する。
(
Next, the processing operation as the acoustic consulting apparatus according to this embodiment will be described. Here, a case will be described in which whether or not the use conditions of the conference microphone and the speaker virtually input by the user satisfy the desired performance is determined every time the input is performed, and the determination result is notified to the user.
音響コンサルティング装置は、前述した音響シミュレーションの処理結果(すなわち、推定音響信号)を評価し、テレビ会議システム設定環境101に適した会議用マイクロホン104や会議用スピーカ103の最適な配置であるか否かの評価結果を出力する。勿論、形態例に係る音響コンサルティング装置では、テレビ会議システム設定環境101に関するCADデータを使用できないことが前提である。
The acoustic consulting apparatus evaluates the processing result of the acoustic simulation described above (that is, the estimated acoustic signal) and determines whether or not the
図11に、音響コンサルティング装置の処理手順の概略を示す。なお、図11には、図3との対応部分に同一符号を付して示している。図11と図3の違いは、処理309、処理310及び処理311である。
FIG. 11 shows an outline of the processing procedure of the acoustic consulting apparatus. In FIG. 11, the same reference numerals are given to the portions corresponding to those in FIG. 3. The difference between FIG. 11 and FIG. 3 is processing 309, processing 310, and
処理309では、音響シミュレーションの結果を評価するための評価性能の設定が実行される。ここでの所望性能の入力も、ユーザーが、マウス208、キーボード209その他の入力装置の操作を通じて入力する。図12に、所望性能の一例を示す。図12においては、会議用マイクロホン104で集音される話者発話の残響比量、環境雑音比量、音響エコーキャンセラ後の残留エコー比量が定義されている。いずれもSNR(Signal To Noise Ratio)の形式で定義されている。
In
なお、図11の場合、処理309は、音響特性の計測処理(処理306)とマイクロホン及びスピーカの仮想情報の設定処理(処理307)の間に配置されているが、シミュレーション結果の判定処理(処理310)を実行する前であれば、どの時点に配置しても良い。
In the case of FIG. 11, the
また、図11に示す音響コンサルティング装置の場合、処理307で登録される会議用マイクロホン104と会議用スピーカ103の仮想情報は、シミュレーション結果を評価するための初期条件を与えているのに過ぎない。このため、本形態例の場合には、処理301と処理302で登録された情報をそのまま読み出して仮想情報として登録しても良い。
In the case of the acoustic consulting apparatus shown in FIG. 11, the virtual information of the
処理310において、音響コンサルティング装置は、仮想的な会議用マイクロホンと会議用スピーカについて実行された音響環境のシミュレーション結果が、ユーザーが予め設定した所望の性能を満たしているか否か判定する。
In
ここで、性能を満たすと判定された場合、音響コンサルティング装置は、会議用マイクロホン103と会議用スピーカ104について仮想的に設定されている情報を、所望の性能を満たす条件として出力し、処理を終了する。例えば所望の性能が得られる会議用マイクロホン104と会議用スピーカ103の位置と向き情報を出力する。
If it is determined that the performance is satisfied, the acoustic consulting apparatus outputs information virtually set for the
これに対し、性能を満たさないと判定された場合、音響コンサルティング装置は、処理311に進む。当該処理311において、音響コンサルティング装置は、シミュレーション用に仮想的に登録された会議用マイクロホン104と会議用スピーカ103の情報に対する変更を受付ける処理を実行する。登録情報に対する変更の入力には、処理307で用いたユーザーインターフェースを用いる。なお、登録情報の変更の入力は、ユーザーが個別に手入力する方法と自動設定する方法が考えられる。自動設定については後述する。いずれにしても、設定情報の変更の完了がユーザーから指示入力されると、音響コンサルティング装置は、処理308に戻り、変更後の情報に基づいて音響シミュレーションを実行する。
On the other hand, when it is determined that the performance is not satisfied, the acoustic consulting apparatus proceeds to
図13に、音響シミュレーション結果が所望の性能を満たしているか否かを判定するために使用するプログラムの機能ブロック構成を示す。以下の説明では、当該プログラムを性能評価部1301と呼ぶ。性能評価部1301は、以下に示す3つの評価部と1つの比較部で構成される。
FIG. 13 shows a functional block configuration of a program used for determining whether or not an acoustic simulation result satisfies a desired performance. In the following description, the program is referred to as a
直接音/残響音比率評価部1302は、想定話者位置のインパルス応答hsynthから直接音成分hdirectと残響音成分hreverbの比率を評価する。まず、音響コンサルティング装置は、入力のあったインパルス応答hsynthを式2と式3を用いて直接音成分hdirect(t)と残響音成分hreverb(t)に分離する。これらの成分が得られると、直接音/残響音比率評価部1302は、次式に基いて直接音成分と残響音性分の比率Preverbを算出する。
The direct sound / reverberation sound
直接音/残響音比率評価部1302は、算出した比率Preverbのうち最小値を出力する。
話者発話/残留エコー比率評価部1303は、想定話者位置毎に式9に基づいて比率Pechoを推定する。
The direct sound / reverberation sound
The speaker utterance / residual echo
ここでのρは、式10で求める。
なお、h1,directは、仮想的に設定された会議用マイクロホンの位置と想定話者位置の距離が1mの場合におけるインパルス応答を表している。また、Aは1mの距離における想定話者音量である。μは、式11により求められる。
Here, h 1, direct represents an impulse response when the distance between the virtually set conference microphone position and the assumed speaker position is 1 m. A is the assumed speaker volume at a distance of 1 m. μ is determined by
ここで、hspは、仮想的に設定された会議用スピーカの位置から想定話者位置までのインパルス応答を表している。Bは、想定話者位置におけるスピーカ出力信号の音圧レベルである。 Here, h sp represents an impulse response from the position of the conference speaker virtually set to the assumed speaker position. B is the sound pressure level of the speaker output signal at the assumed speaker position.
話者発話/残留エコー比率評価部1303は、Pechoの最小値を求めて出力する。
話者発話/騒音比率評価部1304は、想定話者位置毎に式12で定義されるPnを求め、Pnの最小値を求めて出力する。
The speaker utterance / residual echo
Speaker speech / noise
所望性能比較部1305は、ユーザーにより設定された所望性能S51と、前段の各部で算出されたPreverb、Pecho及びPnとを比較して、各値が所望性能に収まっているか否かを判定する。各値についての比較結果が判定結果S52として出力される。
The desired
音響コンサルティング装置は、当該判定結果を文字や図形によりディスプレイ210上に表示する。ユーザーは、この画面表示の内容を確認することにより、仮想的に指定した条件を満たす会議用マイクロホン104や会議用スピーカ103の使用が所望の性能を満たすか否かの判定結果を知ることができる。また、所望の性能を満たさない場合には、新たな候補の指定を繰り返すことで、所望の性能が得られる条件を検索することができる。
The acoustic consulting apparatus displays the determination result on the
(音響コンサルティング装置としての処理2)
ここでも、本形態例に係る音響コンサルティング装置の処理動作例を説明する。ここでは、音響コンサルティング装置が、会議用マイクロホンとスピーカの仮想条件が所望の性能を満たすように自動的に修正する機能を搭載する場合について説明する。
(
Here, an example of the processing operation of the acoustic consulting apparatus according to this embodiment will be described. Here, a case will be described in which the acoustic consulting apparatus is equipped with a function for automatically correcting the conference microphone and speaker so that the virtual conditions satisfy the desired performance.
図14に、音響コンサルティング装置の処理手順の概略を示す。なお、図14には、図11との対応部分に同一符号を付して示しており、処理308までの処理内容は図11と同様である。従って、以下では、処理308の音響シミュレーションが実行された後の時点から説明を開始する。
FIG. 14 shows an outline of the processing procedure of the acoustic consulting apparatus. In FIG. 14, the same reference numerals are given to corresponding parts to those in FIG. 11, and the processing content up to processing 308 is the same as in FIG. 11. Therefore, in the following, the description will be started from the time point after the acoustic simulation of the
処理311において、音響コンサルティング装置は、予めユーザーが設定した所望性能とシミュレーション結果との誤差を確認する。この処理は、図13に示す所望性能比較部1305において実行される。この処理311の後、音響コンサルティング装置は、処理312に進む。
In
処理312において、音響コンサルティング装置は、1つ前のシミュレーション実行回における誤差と今回のシミュレーション実行回における誤差との差分が、所定の閾値以下か否か(すなわち、収束条件を満たすか否か)判定する。この処理312において否定結果が得られた場合、音響コンサルティング装置は、処理313に進む。
In
処理313において、音響コンサルティング装置は、例えば式13に定義する評価関数Cが最小勾配方向に遷移するように、会議用マイクロホンとスピーカの仮想情報を変更する。
In the
ここで、a,b,cはそれぞれ性能評価尺度の重みを表している。
なお、本明細書の場合、マイクロホンの位置とスピーカの位置をそれぞれ微小方向だけずらした場合におけるコスト関数Cの変化値をΔCとする。また、最小勾配方向に動かす場合の微小方向をそれぞれΔM及びΔSとする。
Here, a, b, and c represent weights of the performance evaluation scale, respectively.
In this specification, the change value of the cost function C when the position of the microphone and the position of the speaker are shifted by a minute direction is ΔC. In addition, the minute directions when moving in the minimum gradient direction are denoted by ΔM and ΔS, respectively.
ΔMは三次元ベクトルで与えられ、会議用マイクロホンの位置を特定する座標値x,y,zそれぞれの変化量を表している。ΔSは同様に三次元ベクトルで与えられ、会議用スピーカの位置を特定する座標値x,y,zそれぞれの変化量を表している。 ΔM is given as a three-dimensional vector and represents the amount of change in each of the coordinate values x, y, z that specify the position of the conference microphone. Similarly, ΔS is given as a three-dimensional vector, and represents the amount of change in each of the coordinate values x, y, z specifying the position of the conference speaker.
また、行列[M S]newは、次式に示すように、最小勾配方向に動かした後の仮想的な会議用マイクロホンの配置とスピーカの配置を示し、行列[M S]oldは、最小勾配方向に動かす前の仮想的な会議用マイクロホンの配置及びスピーカの配置を示している。 The matrix [MS] new indicates the virtual conference microphone placement and speaker placement after moving in the minimum gradient direction, as shown in the following equation, and the matrix [MS] old is in the minimum gradient direction. The arrangement of the virtual conference microphone and the arrangement of the speakers before moving is shown.
このように仮想情報を自動的に変更した後、音響コンサルティング装置は、処理308の音響シミュレーションの実行に戻る。
After the virtual information is automatically changed in this way, the acoustic consulting apparatus returns to the execution of the acoustic simulation in the
なお、処理312において肯定結果が得られた場合(誤差が所定の閾値より小さく、収束条件を満たす場合)、音響コンサルティング装置は、処理310に進む。すなわち、音響コンサルティング装置は、シミュレーション結果が所望の性能を満たすか否かを判定する。この判定処理自体は、図11の場合と同様である。なお、シミュレーション結果が所望の性能を満たしている場合、音響コンサルティング装置は、その時点で処理を終了する。
If a positive result is obtained in the process 312 (when the error is smaller than a predetermined threshold and the convergence condition is satisfied), the acoustic consulting apparatus proceeds to the
一方、否定結果が得られた場合、音響コンサルティング装置は、処理314において会議用マイクロホンの数を一つ増やし、その後、処理308の音響シミュレーションの実行に戻る。
On the other hand, if a negative result is obtained, the acoustic consulting apparatus increases the number of conference microphones by one in
このように、本形態例の場合に、音響コンサルティング装置が、自動的にテレビ会議に最適な会議用マイクロホンの位置と会議用マイクロホンの位置(必要に応じて会議用マイクロホンの数)を設定することができる。勿論、当該判定結果は、文字や図形によりディスプレイ210上に表示される。このため、ユーザーは、テレビ会議システム設置環境101のCADデータを有していない場合でも、会議用マイクロホンとスピーカの最適な数と位置に関する情報を自動的に得ることができる。
As described above, in the case of this embodiment, the acoustic consulting apparatus automatically sets the position of the conference microphone and the position of the conference microphone (the number of conference microphones as necessary) that are optimal for the video conference. Can do. Of course, the determination result is displayed on the
なお、前述の形態例においては、所望の性能を満たす条件が発見された時点でその情報を出力し、仮想情報の変更処理と変更後の情報に基づくシミュレーションの実行及び評価を停止しているが、ユーザーによって予め設定された可変範囲内で仮想情報の変更と変更後の情報に基づくシミュレーションの実行及び評価を繰り返し、可変可能な範囲のうちで所望の性能を満たす空間配置やその他の条件を画面上に表示しても良い。この場合、所望の性能を満たす範囲内でもユーザーの希望を反映した配置を選択的に導入することができ、使い勝手を向上することができる。 In the above-described embodiment, the information is output when a condition that satisfies the desired performance is found, and the execution and evaluation of the simulation based on the virtual information change process and the changed information are stopped. , Repeats the execution and evaluation of simulation based on the change of virtual information and the information after the change within the variable range set in advance by the user, and displays the spatial arrangement and other conditions that satisfy the desired performance within the variable range It may be displayed above. In this case, an arrangement reflecting the user's desire can be selectively introduced even within a range satisfying the desired performance, and the usability can be improved.
(他の形態例)
なお、本発明は上述した形態例に限定されるものでなく、様々な変形例が含まれる。例えば、上述した形態例は、本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある形態例の一部を他の形態例の構成に置き換えることが可能であり、また、ある形態例の構成に他の形態例の構成を加えることも可能である。また、各形態例の構成の一部について、他の構成を追加、削除又は置換することも可能である。
(Other examples)
In addition, this invention is not limited to the form example mentioned above, Various modifications are included. For example, the above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described. Moreover, it is possible to replace a part of a certain form example with the structure of another form example, and it is also possible to add the structure of another form example to the structure of a certain form example. Moreover, it is also possible to add, delete, or replace another structure with respect to a part of structure of each form example.
また、上述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路その他のハードウェアとして実現しても良い。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することにより実現しても良い。すなわち、ソフトウェアとして実現しても良い。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記憶装置、ICカード、SDカード、DVD等の記憶媒体に格納することができる。 Moreover, you may implement | achieve some or all of each structure, a function, a process part, a process means, etc. which were mentioned above as an integrated circuit or other hardware, for example. Each of the above-described configurations, functions, and the like may be realized by the processor interpreting and executing a program that realizes each function. That is, it may be realized as software. Information such as programs, tables, and files for realizing each function can be stored in a memory, a hard disk, a storage device such as an SSD (Solid State Drive), or a storage medium such as an IC card, an SD card, or a DVD.
また、制御線や情報線は、説明上必要と考えられるものを示すものであり、製品上必要な全ての制御線や情報線を表すものでない。実際にはほとんど全ての構成が相互に接続されていると考えて良い。 Control lines and information lines indicate what is considered necessary for the description, and do not represent all control lines and information lines necessary for the product. In practice, it can be considered that almost all components are connected to each other.
101…テレビ会議システム設置環境、102…机、103…会議用スピーカ、104…会議用マイクロホン、105−1…想定話者位置、105−2…想定話者位置、106…測定用マイクロホンアレイ、107…測定用スピーカアレイ、202…多チャンネルAD変換装置、203…中央演算装置、204…不揮発性メモリ、205…揮発性メモリ、206…多チャンネルDA変換装置、208…マウス、209…キーボード、210…ディスプレイ、701…音響特性計測部、702…インパルス応答測定部、703…周囲雑音測定部、802…音源分離部、803−1、803−2、803−N…音源定位部、901…音響シミュレーション部、902…直接音/残響音分割部、903…想定話者位置のインパルス応答推定部、904…残留エコー推定部、905…想定マイク位置の騒音シミュレーション部、1301…性能評価部、1302…直接音/残響音比率評価部、1303…話者発話/残留エコー比率評価部、1304…話者発話/騒音比率評価部、1305…所望性能比較部
DESCRIPTION OF
Claims (11)
前記音響データの収録時に使用した第1のマイクロホン及び第1のスピーカの性能及び前記音響システム内の実測位置に関する第1の情報を格納する第2の記憶装置と、
音響システム構築時に想定される音源の位置に関する第2の情報を格納する第3の記憶装置と、
音響システム構築時に使用する第2のマイクロホン及び第2のスピーカの位置及び性能に関する第3の情報の設定を受付ける第1の設定受付部と、
前記第3の情報を格納する第4の記憶装置と、
前記音響データと前記第1、第2及び第3の情報に基づいて、前記第2のマイクロホンを前記音響システムで使用する際の音響特性を推定するシミュレーション部と
を有する音響シミュレータ。 A first storage device for storing acoustic data actually recorded in a space for constructing an acoustic system;
A second storage device for storing first information about the performance of the first microphone and the first speaker used at the time of recording the acoustic data and the actually measured position in the acoustic system;
A third storage device for storing second information regarding the position of the sound source assumed when the acoustic system is constructed;
A first setting receiving unit that receives a setting of third information related to the position and performance of the second microphone and the second speaker used when the acoustic system is constructed;
A fourth storage device for storing the third information;
An acoustic simulator comprising: a simulation unit configured to estimate an acoustic characteristic when the second microphone is used in the acoustic system based on the acoustic data and the first, second, and third information.
前記第1のマイクロホン及び前記第1のスピーカによる前記音響データの測定を実行する音響特性計測部と、
前記第1及び第2の情報の設定を受け付ける第2の設定受付部と、
前記第3の情報の設定の変更を受け付ける変更受付部と
を有することを特徴とする音響シミュレータ。 The acoustic simulator according to claim 1,
An acoustic characteristic measurement unit that performs measurement of the acoustic data by the first microphone and the first speaker;
A second setting accepting unit for accepting settings of the first and second information;
An acoustic simulator comprising: a change receiving unit that receives a change in the setting of the third information.
前記第1の設定受付部は、第2のマイクロホンの数に対する仮想的な変更を受け付ける
ことを特徴とする音響シミュレータ。 In the acoustic simulator according to claim 2,
The first setting receiving unit receives a virtual change with respect to the number of second microphones.
前記第1の設定受付部は、第2のマイクロホンの位置に対する仮想的な変更を受け付ける
ことを特徴とする音響シミュレータ。 In the acoustic simulator according to claim 2,
The acoustic simulator according to claim 1, wherein the first setting reception unit receives a virtual change with respect to a position of the second microphone.
前記音響システムは、テレビ会議システムである
ことを特徴とする音響シミュレータ。 The acoustic simulator according to claim 1,
The acoustic simulator is a video conference system.
前記音響データの収録時に使用した第1のマイクロホン及び第1のスピーカの性能及び前記音響システム内の実測位置に関する第1の情報を格納する第2の記憶装置と、
音響システム構築時に想定される音源の位置に関する第2の情報を格納する第3の記憶装置と、
音響システム構築時に使用する第2のマイクロホン及び第2のスピーカの位置及び性能に関する第3の情報を格納する第4の記憶装置と、
前記音響データと前記第1、第2及び第3の情報に基づいて、前記第2のマイクロホンを前記音響システムで使用する際の音響特性を推定するシミュレーション部と、
推定された前記音響特性が所望の性能を満たすか否か判定する判定部と、
前記判定部の判定結果をユーザーインターフェースに出力する提示部と
を有する音響コンサルティング装置。 A first storage device for storing acoustic data actually recorded in a space for constructing an acoustic system;
A second storage device for storing first information about the performance of the first microphone and the first speaker used at the time of recording the acoustic data and the actually measured position in the acoustic system;
A third storage device for storing second information regarding the position of the sound source assumed when the acoustic system is constructed;
A fourth storage device for storing third information on the position and performance of the second microphone and the second speaker used when the acoustic system is constructed;
A simulation unit for estimating acoustic characteristics when the second microphone is used in the acoustic system based on the acoustic data and the first, second, and third information;
A determination unit that determines whether or not the estimated acoustic characteristics satisfy a desired performance;
An acoustic consulting apparatus comprising: a presentation unit that outputs a determination result of the determination unit to a user interface.
前記判定部において、推定された前記音響特性が所望の性能を満たしていないと判定された場合に、前記第3の情報の少なくとも一部を自動的に変更する設定変更部を有し、
前記シミュレーション部は、変更後の前記第3の情報と使用して、前記第2のマイクロホンを前記音響システムで使用する際の音響特性を新たに推定する
ことを特徴とする音響コンサルティング装置。 The acoustic consulting apparatus according to claim 6,
The determination unit includes a setting change unit that automatically changes at least a part of the third information when it is determined that the estimated acoustic characteristics do not satisfy a desired performance.
The said simulation part uses the said 3rd information after a change, and newly estimates the acoustic characteristic at the time of using a said 2nd microphone with the said acoustic system. The acoustic consulting apparatus characterized by the above-mentioned.
前記設定変更部は、第2のマイクロホンの数を変更する
ことを特徴とする音響コンサルティング装置。 The acoustic consulting apparatus according to claim 7,
The setting changer changes the number of second microphones. An acoustic consulting apparatus, wherein:
前記設定変更部は、第2のマイクロホンの位置を変更する
ことを特徴とする音響コンサルティング装置。 The acoustic consulting apparatus according to claim 7,
The setting change unit changes the position of the second microphone.
前記音響データの収録時に使用した第1のマイクロホン及び第1のスピーカの性能及び前記音響システム内の実測位置に関する第1の情報の設定を、入力装置を通じて受け付ける処理と、
音響システム構築時に想定される音源の位置に関する第2の情報の設定を、前記入力装置を通じて受け付ける処理と、
音響システム構築時に使用する第2のマイクロホン及び第2のスピーカの位置及び性能に関する第3の情報の設定を、前記入力装置を通じて受け付ける処理と、
前記音響データと前記第1、第2及び第3の情報に基づいて、前記第2のマイクロホンを前記音響システムで使用する際の音響特性を推定する処理と
を有する音響シミュレーション方法。 Processing to store the acoustic data actually recorded in the space for constructing the acoustic system in a storage device;
A process of accepting, through an input device, the setting of the first information regarding the performance of the first microphone and the first speaker used at the time of recording the acoustic data and the actually measured position in the acoustic system;
A process of accepting the setting of the second information related to the position of the sound source assumed at the time of constructing the sound system through the input device;
A process of accepting the setting of the third information related to the position and performance of the second microphone and the second speaker used at the time of constructing the acoustic system through the input device;
An acoustic simulation method comprising: processing for estimating an acoustic characteristic when the second microphone is used in the acoustic system based on the acoustic data and the first, second, and third information.
前記音響データの収録時に使用した第1のマイクロホン及び第1のスピーカの性能及び前記音響システム内の実測位置に関する第1の情報の設定を、入力装置を通じて受け付ける処理と、
音響システム構築時に想定される音源の位置に関する第2の情報の設定を、前記入力装置を通じて受け付ける処理と、
音響システム構築時に使用する第2のマイクロホン及び第2のスピーカの位置及び性能に関する第3の情報と、前記音響データと、前記第1及び第2の情報とに基づいて、前記第2のマイクロホンを前記音響システムで使用する際の音響特性を推定する処理と、
推定された前記音響特性が所望の性能を満たすか否か判定する処理と、
前記判定部の判定結果をユーザーインターフェースに出力する処理と
を有する音響コンサルティング方法。 Processing to store the acoustic data actually recorded in the space for constructing the acoustic system in a storage device;
A process of accepting, through an input device, the setting of the first information regarding the performance of the first microphone and the first speaker used at the time of recording the acoustic data and the actually measured position in the acoustic system;
A process of accepting the setting of the second information related to the position of the sound source assumed at the time of constructing the sound system through the input device;
Based on the third information on the position and performance of the second microphone and the second speaker used at the time of constructing the acoustic system, the acoustic data, and the first and second information, the second microphone is A process of estimating acoustic characteristics when used in the acoustic system;
A process of determining whether or not the estimated acoustic characteristics satisfy a desired performance;
And a process of outputting a determination result of the determination unit to a user interface.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011112427A JP5611119B2 (en) | 2011-05-19 | 2011-05-19 | Acoustic simulator, acoustic consulting apparatus, and processing method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011112427A JP5611119B2 (en) | 2011-05-19 | 2011-05-19 | Acoustic simulator, acoustic consulting apparatus, and processing method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012242597A JP2012242597A (en) | 2012-12-10 |
JP5611119B2 true JP5611119B2 (en) | 2014-10-22 |
Family
ID=47464377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011112427A Expired - Fee Related JP5611119B2 (en) | 2011-05-19 | 2011-05-19 | Acoustic simulator, acoustic consulting apparatus, and processing method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5611119B2 (en) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6201440B2 (en) * | 2013-06-11 | 2017-09-27 | 株式会社リコー | Arrangement calculation method and program |
US9602923B2 (en) * | 2013-12-05 | 2017-03-21 | Microsoft Technology Licensing, Llc | Estimating a room impulse response |
JP6167062B2 (en) * | 2014-04-09 | 2017-07-19 | 日本電信電話株式会社 | Classification device, classification method, and program |
KR102197230B1 (en) | 2014-10-06 | 2020-12-31 | 한국전자통신연구원 | Audio system and method for predicting acoustic feature |
KR102340202B1 (en) | 2015-06-25 | 2021-12-17 | 한국전자통신연구원 | Audio system and method for extracting reflection characteristics |
JP6945393B2 (en) * | 2017-09-04 | 2021-10-06 | 株式会社北川鉄工所 | Water jet processing equipment and water jet processing method |
JPWO2022220036A1 (en) | 2021-04-12 | 2022-10-20 | ||
WO2023199673A1 (en) | 2022-04-14 | 2023-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Stereophonic sound processing method, stereophonic sound processing device, and program |
EP4325824A1 (en) * | 2022-08-19 | 2024-02-21 | GN Audio A/S | Speakerphone and server device for environment acoustics determination and related methods |
EP4325823A1 (en) * | 2022-08-19 | 2024-02-21 | GN Audio A/S | Speakerphone with environment acoustics characterization and related methods |
WO2024225428A1 (en) * | 2023-04-28 | 2024-10-31 | ヤマハ株式会社 | Layout design assistance method for acoustic equipment, information processing device, and program |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03194599A (en) * | 1989-12-25 | 1991-08-26 | Fujita Corp | Room acoustic simulation system |
JP2928693B2 (en) * | 1992-12-25 | 1999-08-03 | 株式会社ケンウッド | Karaoke equipment |
JP3380088B2 (en) * | 1995-06-06 | 2003-02-24 | 松下電器産業株式会社 | Sound image localization simulation device |
JP2002123262A (en) * | 2000-10-18 | 2002-04-26 | Matsushita Electric Ind Co Ltd | Device and method for simulating interactive sound field, and recording medium with recorded program thereof |
JP4186783B2 (en) * | 2003-10-10 | 2008-11-26 | ヤマハ株式会社 | Audio equipment placement support apparatus, program, and audio system |
JP4231817B2 (en) * | 2004-05-27 | 2009-03-04 | クラリオン株式会社 | Acoustic simulation apparatus, acoustic simulation program, and recording medium |
JP2006047523A (en) * | 2004-08-03 | 2006-02-16 | Sony Corp | Information processing apparatus and method, and program |
JP4962107B2 (en) * | 2007-04-16 | 2012-06-27 | ヤマハ株式会社 | Acoustic characteristic correction system |
JP2010181824A (en) * | 2009-02-09 | 2010-08-19 | Yamaha Corp | Sound simulation apparatus and sound simulation program |
JP2011053481A (en) * | 2009-09-02 | 2011-03-17 | Panahome Corp | Optimal listening position proposing system and method in house room |
-
2011
- 2011-05-19 JP JP2011112427A patent/JP5611119B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012242597A (en) | 2012-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5611119B2 (en) | Acoustic simulator, acoustic consulting apparatus, and processing method thereof | |
JP7367785B2 (en) | Audio processing device and method, and program | |
JP5229053B2 (en) | Signal processing apparatus, signal processing method, and program | |
JP2023517720A (en) | Reverb rendering | |
JP2011217068A (en) | Sound field controller | |
KR20210037748A (en) | Generating binaural audio in response to multi-channel audio using at least one feedback delay network | |
Pelegrín-García | Comment on “Increase in voice level and speaker comfort in lecture rooms”[J. Acoust. Soc. Am. 125, 2072–2082 (2009)](L) | |
JP4234103B2 (en) | Apparatus and method for determining impulse response and apparatus and method for providing speech | |
US11830471B1 (en) | Surface augmented ray-based acoustic modeling | |
Arend et al. | A reactive virtual acoustic environment for interactive immersive audio | |
Barron | Auditorium acoustic modelling now | |
Bassuet | New acoustical parameters and visualization techniques to analyze the spatial distribution of sound in music spaces | |
JP4464064B2 (en) | Reverberation imparting device and reverberation imparting program | |
DiPassio et al. | Audio capture using structural sensors on vibrating panel surfaces | |
Arend et al. | Binaural reproduction of self-generated sound in virtual acoustic environments | |
Guthrie | Stage acoustics for musicians: A multidimensional approach using 3D ambisonic technology | |
JP6056842B2 (en) | Sound field control device | |
JP5286739B2 (en) | Sound image localization parameter calculation device, sound image localization control device, sound image localization device, and program | |
US12035128B2 (en) | Signal processing device and signal processing method | |
Ziemer | A psychoacoustic approach to wave field synthesis | |
Piquet et al. | TWO DATASETS OF ROOM IMPULSE RESPONSES FOR NAVIGATION IN SIX DEGREES-OF-FREEDOM: A SYMPHONIC CONCERT HALL AND A FORMER PLANETARIUM | |
JP2012058370A (en) | Sound adjustment support method, sound adjustment support device, and program | |
JP6388551B2 (en) | Multi-region sound field reproduction system and method | |
WO2021241421A1 (en) | Sound processing method, sound processing device, and sound processing program | |
Grimm et al. | Implementation and perceptual evaluation of a simulation method for coupled rooms in higher order ambisonics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140826 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140902 |
|
LAPS | Cancellation because of no payment of annual fees |