[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6742216B2 - 音響処理システム、音響処理方法、プログラム - Google Patents

音響処理システム、音響処理方法、プログラム Download PDF

Info

Publication number
JP6742216B2
JP6742216B2 JP2016208844A JP2016208844A JP6742216B2 JP 6742216 B2 JP6742216 B2 JP 6742216B2 JP 2016208844 A JP2016208844 A JP 2016208844A JP 2016208844 A JP2016208844 A JP 2016208844A JP 6742216 B2 JP6742216 B2 JP 6742216B2
Authority
JP
Japan
Prior art keywords
sound
area
unit
processing
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016208844A
Other languages
English (en)
Other versions
JP2018074251A5 (ja
JP2018074251A (ja
Inventor
恭平 北澤
恭平 北澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016208844A priority Critical patent/JP6742216B2/ja
Priority to US15/724,996 priority patent/US10511927B2/en
Publication of JP2018074251A publication Critical patent/JP2018074251A/ja
Publication of JP2018074251A5 publication Critical patent/JP2018074251A5/ja
Application granted granted Critical
Publication of JP6742216B2 publication Critical patent/JP6742216B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • H04R29/002Loudspeaker arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Studio Devices (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Stereophonic System (AREA)

Description

本発明は音響システム及びその制御方法、信号生成装置、コンピュータプログラムに関する。
空間を複数のエリアに分割してエリアごとの音声を取得することが知られている(特許文献1)。
特開2014−72708号公報
しかしながら、複数のエリアに分割した音声をリアルタイム処理し、放送しようとすると、処理や伝送が間に合わずデータが欠損し、音声が途切れてしまう可能性があった。
本発明は上記課題に鑑みなされたものであり、空間を分割した複数のエリアから音声を取得して再生用信号を生成する構成において、処理を効率化する技術を提供することを目的とする。
上記目的を達成するため、本発明による音響システムは以下の構成を備える。即ち、
制御装置と複数の信号処理装置とを有する音響処理システムであって、
前記複数の信号処理装置は、
仮想聴取点の位置に応じた再生用音響信号の生成に用いられる複数のエリア音響信号であって、収音領域内の複数の部分エリアにそれぞれ対応する複数のエリア音響信号を、1以上のマイクにより前記収音領域の音を収音することで得られる1以上の収音信号に基づいて生成し、
前記制御装置は、
前記仮想聴取点の位置を示す聴取点情報を取得する情報取得手段と、
前記複数のエリア音響信号を生成する処理の前記複数の信号処理装置への割り当てを、前記情報取得手段により取得された前記聴取点情報に基づいて決定する決定手段と、を有する。
本発明によれば、空間を分割した複数のエリアから音声を取得して再生用信号を生成する構成において、処理を効率化する技術を提供することができる。
音響システムの構成を示すブロック図。 収音処理部の構成を示すブロック図。 再生信号生成部の構成を示すブロック図。 担当空間制御の説明図。 再生信号生成部のハードウェア構成例を示すブロック図。 音響システムの処理を示すフローチャート。 担当空間を設定するためのUIを示す図。 撮影システムの構成を示すブロック図。 撮影処理部の構成を示すブロック図。 再生信号生成部の構成を示すブロック図。 処理分担制御の説明図。 撮影システムの処理を示すフローチャート。 処理分担を示す表示の一例を示す図。
以下、本発明の実施形態について、図面を参照して説明する。なお、以下の実施形態は本発明を限定するものではなく、また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、同一の構成については、同じ符号を付して説明する。
<実施形態1>
本実施形態では、聴取点に基づき各マイクアレイに割り当てる担当空間を調整することで処理を平滑化し、リアルタイム処理を確実に行うことが可能な構成を説明する。
(音響システム)
図1は本発明の一実施形態(実施形態1)に係る音響システム100の構成を示すブロック図である。音響システム100は、複数の収音処理部110および再生信号生成部120を備える。複数の収音処理部110と再生信号生成部120は互いに有線もしくは無線の伝送経路を通じてデータの送受信を行うことができる。収音処理部110は、マイクアレイにより担当する空間エリアから音声を収集する装置である。再生信号生成部120は、各収音処理部110が担当する空間エリアを制御するとともに、各収音処理部110から音声を受信し、ミキシングを行って再生用信号を生成する装置である。
本実施形態の音響システム100は複数の収音処理部110A、110B、・・・を備えるところ、本明細書では、これらの収音処理部110A、110B、・・・を総称して収音処理部110と表記する。また、収音処理部110の後述する構成要素の参照番号にA、B、・・・を付して、その構成要素がどの収音処理部110A、110B、・・・に属するかを識別する。例えば、マイクアレイ111Aは収音処理部110Aの構成要素であり、音源分離部112Bは収音処理部110Bの構成要素である。なお、収音処理部110と再生信号生成部120との間の伝送経路はLAN等の専用の通信経路により実現されるが、インターネット等の公衆通信網を経由してもよい。
収音処理部110の収音可能な空間(空間的範囲)が別の収音処理部110の収音可能な空間と少なくとも一部が重複するように、複数の収音処理部は配置される。ここで収音可能な空間は、後述するマイクアレイの指向性や感度によって決まる。例えば、所定のS/N以上で音声が収音できる範囲を収音可能な空間とすることができる。
(収音処理部)
図2は収音処理部110の構成を示すブロック図である。収音処理部110は、マイクアレイ111、音源分離部112、信号処理部113、第1送受信部114、第1記憶部115、及び、音源分離エリア制御部116を備える。
マイクアレイ111は複数のマイクロホンからなる。マイクアレイ111は、その収音処理部110が担当する空間の音声をマイクロホンで収音する。マイクアレイ111を構成する各マイクロホンがそれぞれ収音するため、マイクアレイ111が収集する音声は、全体として、各マイクロホンが収集した複数の音声からなるマルチチャネルの信号となる。マイクアレイ111は、収音した信号をA/D変換(アナログ/デジタル変換)したのち、音源分離部112および第1記憶部115へ出力する。
音源分離部112はCPU(中央演算処理装置)などの処理装置を備える。音源分離部112は、収音処理部110が収音を担当する空間をN(N>1)個のエリア(以下、「分割エリア」と称する)に分割した場合に、マイクアレイ111から入力された信号を各分割エリアにおける音声に分離する音源分離処理を行う。前述のように、マイクアレイ111から入力される信号は各マイクロホンが収集した複数の音声からなるマルチチャネルの信号である。そのため、マイクアレイ111を構成する各マイクロホンと集音したい分割エリアとの位置関係に基づき、マイクロホンが収集した音声信号に位相制御および重みづけをして加算することで、任意の分割エリアの音声を再現することができる。
分離処理は処理フレームごと、つまり所定の時間間隔ごとに行われる。例えば、所定の時間ごとにビームフォーミング処理を行う。音源分離の処理結果は信号処理部113および第1記憶部115へ出力される。ここで担当空間、分割数N、処理の順番は後述する音源分離エリア制御部116から入力される制御信号に基づいて設定される。設定された分割数Nが所定の数Mを超えた場合、予め設定された処理の順番に基づいて、所定の数Mを超えた分割エリアの分離処理は行わず、処理を行えなかったフレームの番号と分割エリアを未分離リストとして管理する。未分離リストに登録された音声は、分割数Nが所定の数Mより小さく設定されたフレームにおいて処理を行っていく。処理が行われた項目は未分離リストから削除する。このように、各分割エリアに優先順位を付与し、分割数Nが所定の数Mを超えたときは優先順位の低い分割エリアの処理を保留することで、処理のリアルタイム性を保障することができる。さらに、優先順位の高い分割エリアから順に処理を行うことで、重要な音声をリアルタイムに再現することができる。
信号処理部113は、例えばCPUなどの処理装置からなる。信号処理部113は、時間、分割エリアごとの音声信号に対して、入力された音声信号の処理順序の制御信号に従って処理を行う。信号処理部113で行われる処理は、例えば分割エリアとその収音処理部110との距離による影響を補正するための遅延補正処理、ゲイン補正処理や、エコー除去などである。処理を行った信号は、第1送受信部114および第1記憶部115へ出力される。
第1送受信部114は入力された処理済みの分割エリアごとの音声信号を送信する。さらに第1送受信部114は、再生信号生成部120から担当空間の割当てを受信し、その割当てを音源分離エリア制御部116へ出力する。担当空間の割当てについては後で詳しく説明する。
第1記憶部115は入力された各段階での音声信号をすべて記録する。第1記憶部115は、例えばHDDやSSD、メモリのような記憶装置により実現される。
音源分離エリア制御部116は入力される担当空間の割当ておよび聴取点などの情報に基づき、音源分離を行う分割エリア、そして処理順序などを制御する信号を出力する。
(再生信号生成部)
図3は再生信号生成部120の構成を示すブロック図である。再生信号生成部120は第2送受信部121、リアルタイム再生用信号生成部122、第2記憶部123、リプレイ再生用信号生成部124、及び、担当空間制御部125を備える。
第2送受信部121は、収音処理部110の第1送受信部114から出力された音声信号を受信し、リアルタイム再生用信号生成部122および第2記憶部123へ出力する。さらに第2送受信部121は、後述する担当空間制御部125から担当空間の割当てを受け取って、複数の収音処理部110へ出力する。
リアルタイム再生用信号生成部122では、分割エリアごとの音声を収音から所定の時間内にミキシングすることでリアルタイム再生用の信号を生成し出力する。例えば外部から時間に応じて変化する空間内の仮想聴取点と仮想の聴取者の向き(以下単に聴取点と聴取者の向きとする)と、再生環境の情報を取得し、音源のミキシングを行う。ここで再生環境とはリアルタイム再生用信号生成部122で生成した信号を再生する再生装置がスピーカ(ステレオ、サラウンド、その他マルチチャンネル)か、あるはヘッドホンかといった環境である。すなわち、音源のミキシングにおいては、各分割エリアの音声信号を、再生装置のチャンネル数等の環境に合わせて合成・変換する処理を行う。また、聴取点と聴取者の向きの情報を担当空間制御部125へ出力する。
第2記憶部123は例えばHDDやSSD、メモリのような記憶装置であり、第2送受信部121が受信した分割エリアごとの音声信号を、分割エリアと時刻情報とともに記録する。
リプレイ再生用信号生成部124は、リプレイ再生が要求された場合に、該当する時刻のデータを第2記憶部123から取得し、リアルタイム再生用信号生成部122と同様の処理を行い出力する。
担当空間制御部125は、複数の収音処理部110の担当空間を制御する。図4に担当空間の制御の例を示す。図4は、担当空間制御の説明図である。
例えば図4(A)に示すように聴取点401が収音空間の外にある場合、それぞれのマイクアレイ111Aから111Dの担当空間はそれぞれ402Aから402Dのように均等に割り当てられる。マイクアレイ111Aから111Dは収音処理部110Aから110Dの構成要素であり、担当空間402Aから402Dは収音処理部110Aから110Dに割り当てられる空間である。
ここで担当空間402の中の複数の小さな枠は分割エリア403を表している。図4は、収音対象の空間全体が6×6個に区分されるように分割エリア403の配置が予め定められており、その分割エリア403を各収音処理部110A〜110Dに割り当てることで各収音処理部110が担当する分割エリアを決定する例を示している。ただし、分割エリアの配置は予め定められている必要はなく、例えば、担当空間402の決定の後にその担当空間を適宜複数の分割エリアに区分するようにしてもよい。
続いて図4(B)に示すように聴取点401が収音空間内にある場合、聴取点近傍の音声はリアルタイム再生用信号を生成する際に重要になる。そこで、聴取点近傍の分割エリアを均等に複数の収音処理部110に割り振るために、担当空間402は図に示すように聴取点を中心に分割される。担当空間制御部125は、各分割エリアを担当する収音処理部110に担当エリアを通知するための情報を送信する。また、聴取点401からの距離に応じて処理の順番を設定し、その順番を示す情報も併せて送信する。例えば、聴取点401からの距離が近いものから順に処理の順番を設定することができる。図4(C)、図4(D)については後述する。
このように本実施形態では、聴取点の位置に基づき収音対象の空間全体を分割して、各収音処理部110に担当空間402を割り当てるため、音声の発生状況等に応じて各収音処理部110に割り当てる処理の負荷を平滑化することができる。また、聴取点を起点として複数のマイクアレイにより収音される空間の全体を区分して、複数のマイクアレイがそれぞれ担当する空間を制御するため、立体的な音声の再現が可能である。さらに、各収音処理部110に割り当てられた担当空間402を分割エリアに分割し、各収音処理部110において聴取点401の近傍の分割エリアから順に音源分離及び信号処理を行う。そのため、リアルタイム性を損なうことなく、聴取点の近傍の優先度の高い分割エリアの音声を確実に再生信号生成部120へ送ることができる。
図5は、再生信号生成部120のハードウェア構成例を示すブロック図である。再生信号生成部120は、例えば、パーソナルコンピュータ(PC)や組込みシステム、タブレット端末、スマートフォン等により実現される。
図5において、CPU990は中央演算処理装置であり、コンピュータプログラムに基づいて他の構成要素と協働し、再生信号生成部120全体の動作を制御する。ROM991は読出し専用メモリであり、基本プログラムや基本処理に使用するデータ等を記憶する。RAM992は書込み可能メモリであり、CPU990のワークエリア等として機能する。
外部記憶ドライブ993は記録媒体へのアクセスを実現し、USBメモリ等のメディア(記録媒体)994に記憶されたコンピュータプログラムやデータを本システムにロードすることができる。ストレージ995はSSD(ソリッドステートドライブ)等の大容量メモリとして機能する装置である。ストレージ995には、各種コンピュータプログラムやデータが格納される。
操作部996はユーザからの指示やコマンドの入力を受け付ける装置であり、キーボードやポインティングデバイス、タッチパネル等がこれに相当する。ディスプレイ997は、操作部996から入力されたコマンドや、それに対する再生信号生成部120の応答出力等を表示する表示装置である。インターフェイス(I/F)998は外部装置とのデータのやり取りを中継する装置である。システムバス999は、再生信号生成部120内のデータの流れを司るデータバスである。
なお、以上の各装置と同等の機能を実現するソフトウェアにより、ハードウェア装置の代替として構成することもできる。
(信号生成処理)
続いて図6(A)から図6(B)は、本実施形態に係る音響システム100が実行する処理の手順を示すフローチャートである。図6(A)は、収音からリアルタイム再生用信号を生成する処理(信号生成処理)の処理手順を示すフローチャートである。これらの処理はフレームごとに順次行われる。
はじめに再生信号生成部120のリアルタイム再生用信号生成部122において聴取点が設定される(S101)。設定された聴取点は再生信号生成部120の担当空間制御部125へ出力される。聴取点の設定は、例えば、ユーザの指示入力や、外部機器からの設定信号に基づき行うことができる。
続いて担当空間制御部125において、複数の収音処理部110がどの空間を担当するのか、及び、どの分割エリアから順に処理をするのかが決定される(S102)。担当空間の決定や処理の順序は、前述のように、聴取点の位置に基づいて決定することができる。決められた空間とその分割数N、エリア処理順序の制御情報(以下、これらの情報をまとめて「担当空間制御情報」という)は第2送受信部121へ出力される。
続いて再生信号生成部120の第2送受信部121から担当空間制御情報が出力され(S103)、収音処理部110の第1送受信部114において受信される(S104)。受信された担当空間制御情報は音源分離エリア制御部116へ出力される。
続いてマイクアレイ111において収音が行われる(S105)。前述のように、ここで収集される音声信号はマイクアレイ111を構成する各マイクロホンが収集した複数の音声からなるマルチチャネルの信号である。A/D変換された音声信号は第1記憶部115および音源分離部112へ出力される。
続いて第1記憶部115において、マイクアレイ111から入力された音声の記録が行われる(S106)。
続いて音源分離エリア制御部116に入力された分割数Nとあらかじめ決められた処理エリア数の制限値であるMとの大小を比較する(S107)。N>Mである場合(S107でNO)、収音処理部110の音源分離部112において未分離リストが作成される(S117)。分割エリアの処理の順番設定においてM+1番目以降のエリアは今回のフレーム処理の中では処理が行われず、未分離リストにフレーム番号とエリア番号が記録される。
一方、N≦Mである場合(S107でYES)、続いて音源分離部112で管理されている未分離リストに未分離の音声があるか判定される(S108)。未分離リストに未分離の音声の記録がない場合(S108でNO)はS109へ進む。未分離リストに記録がある場合(S108でYES)、音源分離部112では第1記憶部115から、未分離リストに記載のフレームの音声を取得する(S118)。
続いて音源分離部112において音源分離が行われる(S109)。すなわち、S105で集音したマルチチャネルの信号をもとに、担当空間制御情報により通知された分割エリアの順に各分割エリアにおける音声を分離する。前述のように、分割エリアの音声は、マイクアレイ111を構成するマイクロホンと、分割エリアの位置との関係に基づき、各マイクロホンが収集した音声信号に位相制御および重みづけをして加算することで再現することができる。分離された分割エリアの音声信号は、第1記憶部115および信号処理部113へ出力される。
続いて第1記憶部115において音源分離された分割エリアごとの音声が記録される(S110)。
続いて信号処理部113において、各分割エリアの音声に対して処理がされる(S111)。信号処理部113による処理は、前述のように、例えば、分割エリアとその収音処理部110との距離による影響を補正するための遅延補正処理、ゲイン補正処理や、エコー除去による雑音処理などである。処理された音声は第1記憶部115および第1送受信部114へ出力される。
続いて信号処理部113において信号処理された音声が第1記憶部115に記録される(S112)。
続いて、収音処理部110の第1送受信部114から再生信号生成部120へ、分割エリアごとの処理された音声信号が送信される(S113)。送信された音声信号は信号伝送経路を通って再生信号生成部120まで送られる。
続いて再生信号生成部120の第2送受信部121において分割エリアごとの音声信号が受信される(S114)。受信された音声信号はリアルタイム再生用信号生成部122および第2記憶部123へ出力される。
続いてリアルタイム再生用信号生成部122においてリアルタイム再生用の音声のミキシングが行われる(S115)。ミキシングにおいては、再生機器の仕様(例えば、チャンネル数等)に合わせて再生できるように信号を合成・変換したりする。リアルタイム再生用にミキシングされた音声は外部の再生機器あるいは放送用信号として出力される。
続いて第2記憶部123において各分割エリアの音声の記録が行われる(S116)。リプレイ再生用の音声信号は第2記憶部123の分割エリアごとの音声を用いて作成される。そして、処理を終了する。
(リプレイ処理)
次に、図2Bを用いてリプレイが要求された場合の処理フローを説明する。ユーザや外部装置によりリプレイが要求されると、リプレイ再生用信号生成部124は第2記憶部123からリプレイ時間に対応した分割エリアごとの音声信号を読み出す(S121)。
続いてリプレイ再生用信号生成部124においてリプレイ再生用の音声のミキシングが行われる(S122)。リプレイ再生用にミキシングされた音声は外部の再生機器あるいは放送用信号として出力される。そして、処理を終了する。
以上説明したように、聴取点の位置等に応じて複数の収音処理部110の担当空間を制御することで、聴取点近傍エリアの音声をリアルタイム再生用信号生成に間に合わせることができる。
本実施形態においては、マイクアレイ111がマイクロホンからなる例を説明したが、反射板などの構造物とセットであってもよい。また、マイクアレイ111で使用するマイクロホンは無指向性であってもよいし、指向性マイクであってもよく、それらの混合でもよい。
本実施形態において第1記憶部115はマイクアレイ111から入力された音声、音源分離部112で音源分離された音声、信号処理部113で信号処理された音声を全て記録する例を説明した。しかし、例えば実際の装置では、記録できる音声のデータサイズが限定されている可能性がある。そこで、音源分離エリア制御部116においてN>Mとなった時のみマイクアレイ111の音声を記録するようにしてもよい。さらに未分離リストから削除されたことに応じて、記録していたフレームの音声データを削除するようにしてもよい。これにより、記憶装置の容量が限られている場合にも各マイクアレイの処理を平滑化することが可能となる。
また、本実施形態では、収音エリアの分割数Nと所定のエリア数Mとの大小に応じて音源分離処理を行うか否かを決定する例を説明したが、CPUの信号処理量や信号伝送経路の伝送量を監視し、これらの量を考慮して処理するエリア数を決定してもよい。また、音源分離(S109)はN個の分割エリア全てに対して行い、信号処理(S111)をM個の分割エリアまでにとどめるようにしてもよい。あるいは、N個の分割エリア全てに対して信号処理まで行い、送信(S113)をM個の分割エリアまでにとどめるようにしてもよい。これにより、システムを構成する装置の特性に応じて柔軟に処理を平滑化することが可能となる。
本実施形態において担当空間制御部125は聴取点401を中心に空間を分割する例を説明した。もっとも、マイクアレイ111が収音可能な距離には限度があるため、各収音処理部110が収音可能な空間は必ずしも収音空間の全領域にわたって重複するとは限らない。例えば、図4は、6×6個の分割エリアからなる収音空間の例を示しているところ、各マイクアレイ111は4×4個の分割エリアが占める領域の範囲しか収音することができない場合を考える。そして、図4において、マイクアレイ111Aは、紙面左上の角の分割エリアを含む4×4個の分割エリアが占める領域から収音可能であるとする。この場合、マイクアレイ111Aは、紙面右2列又は紙面下2列に存在する分割エリアからは収音することができない。同様に、マイクアレイ111Bは紙面右上の角の分割エリアを含む領域から、マイクアレイ111Cは紙面左下の角の分割エリアを含む領域から、及び、マイクアレイ111Dは紙面右下の角の分割エリアを含む領域から収音可能であるとする。この場合、紙面左上の角の分割エリアを含む2×2個の分割エリアが占める領域から収音することができるのはマイクアレイ111Aのみである。そのため、この領域においては、マイクアレイ111Aが収音可能な空間と他の収音処理部110が収音可能な空間とは重複しない。同様に、紙面の右上、左下、右下の角の分割エリアを含む2×2個の分割エリアが占める領域においても、収音処理部110が収音可能な空間は重複しない。
そこで、例えば図4(C)に示すように聴取点があるマイクアレイ111(図の例では111A、111C)から収音できない距離に存在するときは、その聴取点401を取り囲むように小さく区切られた担当空間402Dを設定するようにしてもよい。このように、聴取点近傍に十分なリソースを有する収音処理部を割り当てることで、聴取点近傍の音声を確実に精度よく取得して忠実に再現することができる。また、担当エリアが少なく設定された収音処理部110Dでは処理量が少ないため、処理を短時間で終わらせて、高速に処理を進めることができる。さらに、このような場合、収音処理部110Dと再生信号生成部120との間のデータ伝送の優先度を高く設定することで、他の収音処理部110に対して短時間でデータを転送し、重要度の高い音声を優先的に再生することができる。
また、本実施形態において担当空間制御部125は聴取点401を中心に空間を分割する例を説明した。上述した通り、すべての収音処理部110が全ての分割エリアの音声を収音できるわけではないため、担当空間の大きさには限界が設定されるようにすることができる。音声信号の強度は音源と収音装置との間の距離の拡がりに応じて減衰するため、収音処理部110のマイクアレイ111で収音できる範囲は限られている。また、マイクアレイ111から距離が離れるほど分割エリアの分解能が低下してしまう。そこで、担当空間の大きさに上限を設けることで、収音レベルおよび分割エリアの分解能を維持・保障することが可能となる。
また、聴取者の向きに応じて担当空間を決定するように制御するようにしてもよい。例えば、聴取者の前方の音声は一般に重要であるため、聴取者の前方にはより小さな担当空間を設定して処理を優先させるようにしてもよい。
本実施形態において担当空間制御部125は聴取点401を基準に空間を分割する例を説明したが、空間を分割する起点は分割エリアもしくは位置の重要度などから決定するようにしてもよい。例えば、分割エリアごとの直前数フレームにおける音声のレベルなどから分割エリアの重要度を設定する重要度設定部を設け、重要度の高い分割エリアが各収音処理部110にできるだけ均等に割り振られるように空間を分割するようにしてもよい。これにより重要度の高い領域についての処理が複数の収音処理部110に均等に割り当てられるため、処理の負荷を平滑化するとともに、立体的な音響を忠実に再現することが可能である。
また、連続音源に対して途中で担当する収音処理部110が変更されると音質や背景音が変わってしまい、違和感につながる可能性がある。そのため、音声の連続性に応じて収音処理部110が変わらないようにしてもよい。また、複数の収音処理部110の収音空間全体をカバーするような撮影範囲を持つ撮影装置を備え、撮影装置で撮影した画像から人物検知を行い、重要度を設定するようにしてもよい。例えば、その人物の周囲はより重要度の高い領域と判定することができる。またさらに、事前に音声や映像を学習し、学習に基づいて重要度が設定されるようにしてもよい。
本実施形態において音源分離部112はビームフォーミングを用いて分割エリアごとの音声の取得を行う例を説明したが、その他の音源分離を用いてもよい。例えば分割エリアごとのパワースペクトル密度(PSD:Power Spectral Density)を推定し、推定したPSDに基づいてウィナーフィルタによる分離を行ってもよい。
本実施形態においてリプレイ再生用信号生成部124とリアルタイム再生用信号生成部122は同様の処理を行う例を説明した。ただし、リプレイ再生用信号生成部124とリアルタイム再生用信号生成部122では異なるミキシングをしてもよい。例えば、リアルタイム再生時とリプレイ再生時では仮想の聴取点が異なるため異なるミキシングになってもよい。
本実施形態において全ての収音処理部110が同じ構成を有する例を説明したが、異なる構成であってもよい。例えばマイクアレイのマイクの数などが違っていてもよい。また例えば再生信号生成部120はいずれか1つ又は複数の収音処理部110と同一のコンピュータにより実現してもよい。
さらに、例えば、収音処理部110の処理装置のスペックが異なるようになっていてもよい。このようなスペックとしては、CPUの処理速度や、メモリ・ストレージの容量、音声信号処理チップのスペック等が含まれうる。あらかじめ聴取点が生成されやすい空間Xを担当する収音処理部110Xの処理装置のスペックを高く設定し、収音処理部110Xは空間Xに付近に聴取点がない場合に他の収音処理部110と比べて広い空間を担当するようになっていてもよい。
また本実施形態では再生信号生成部120は一つとしたが、少なくとも1つ以上備えていればよく、複数の再生信号生成部120に対してそれぞれ聴取点が設定されてもよい。その場合、例えば図4(D)に示すように可能な限り聴取点近傍の分割エリアが複数の収音処理部110に割り当てられるように空間を分割する。図4(D)の例では、聴取点401Aには担当空間402A、402B、402Cが隣接し、聴取点401Bには担当空間402B、402C、402Dが隣接するように、担当空間が割り当てられている。
また本実施形態では説明の都合上、担当空間制御部125は分割エリア403があらかじめ決まっていてその分割エリアをどのように分配するかを制御したが、担当空間制御部125はあらかじめ設定された分割エリアとは異なる境界で空間を分割してもよい。その場合、音源分離エリア制御部116は割り当てられた空間内をどのように分割エリア分けするか決定し、音源分離部112に出力するようになっていればよい。
また本実施形態では特に設けなかったが、担当空間を示す表示装置などを備えていてもよく、表示装置には時間ごとの担当空間の変化が分かるようにすることができる。さらに未分離の分割エリアが分かるような表示を行ってもよい。さらに未分離の分割エリアを選択し、その分割エリアの音声の分離を指示するユーザインターフェイス(UI)を備えていてもよい。また、担当空間制御部125に対して担当空間をユーザが設定できるようなUIを備えていてもよい。例えば図7の(A)(B)に示すように、担当空間の境界を選択して移動させることで任意の時間の担当空間をユーザが指定できるようにしてもよい。
図7は、ユーザが担当空間を選択するためのUIの一例を示す図である。図7において、450は表示装置に表示された収音空間である。451は担当空間の割当てを決定するための基準となる指標であり、ユーザはポインティング装置のポインタやタッチパネルにより指標451を選択することができる。ユーザが指標451を選択すると、音響システム100は、指標451を通過する水平線及び垂直線により収音空間450を4つの担当空間402A、402B、402C、402Dに分割する(図7(A))。ユーザが指標451をある方向(例えば、453)に移動させると、それに応じて音響システム100は指標451を通過する水平線及び垂直線を移動させ、担当空間402A、402B、402C、402Dの占める領域も変化させる(図7(B))。したがって、ユーザは、指標451を選択するだけで容易に収音空間を所望の領域に分割することが可能である。
<実施形態2>
実施形態1では、聴取点に基づき各マイクアレイ(収音処理部)に割り当てる担当空間を調整する例を説明した。本実施形態では、撮影情報に基づき音声を再現する上で重要なエリアを判定して、各マイクアレイに割り当てる担当空間を調整する例を説明する。
(撮影システム)
図8は撮影システム200の構成を示すブロック図である。撮影システム200は複数の撮影処理部210、再生信号生成部120、及び、視点生成部230を備える。複数の撮影処理部210と再生信号生成部120および視点生成部230は互いに有線もしくは無線の伝送経路を通じてデータの送受信を行うことができる。
(撮影処理部)
図9は撮影処理部210の構成を示すブロック図である。撮影処理部210はマイクアレイ111、音源分離部112、信号処理制御部217、信号処理部113、第1送受信部114、及び、撮影部218を備える。
マイクアレイ111、音源分離部112および第1送受信部114は、実施形態1において図2を参照して説明した構成と同様のため、詳細な説明を省略する。信号処理部113は、実施形態1の音声信号処理に加え、撮影部218で撮影した画像データに対する処理を行う。例えば、雑音除去処理などを行う。
信号処理制御部217は第1送受信部114から入力される処理分担の情報に基づいて分割エリアごとの音声信号を信号処理部113あるいは第1送受信部114に出力する。撮影部218はビデオカメラなどの画像を撮影する撮影装置であり、少なくとも各撮影処理部210が担当する空間を含む画像を撮影する。撮影した画像を信号処理部113へ出力する。
(再生信号生成部)
図10は再生信号生成部120の構成を示すブロック図である。再生信号生成部120は第2送受信部121、リアルタイム再生用信号生成部122、第2記憶部123、リプレイ再生用信号生成部124、エリア重要度設定部226、及び、処理分担制御部227を備える。
本実施形態において第2送受信部121、第2記憶部123は、実施形態1において図3を参照して説明した処理に加えて、各撮影処理部210で撮影された画像の送信、記録も行う。その他、基本的には実施形態1と同様のため詳細な構成の説明は省略する。
リアルタイム再生用信号生成部122では、後述する視点生成部230において生成された視点に応じて、複数の撮影処理部210から送信される画像を切り替えてリアルタイム再生用の映像信号を生成する。さらに視点を聴取点として音源のミキシングを行う。生成された映像と音声が出力される。
リプレイ再生用信号生成部124では、リプレイ再生が要求された場合に、該当する時刻のデータを第2記憶部123から取得し、リアルタイム再生用信号生成部122と同様の処理を行い出力する。
エリア重要度設定部226は、各撮影処理部210から送信された画像を第2送受信部121から取得する。エリア重要度設定部226ではそれらの画像から音源となりうる被写体を検出し、各分割エリアの被写体数に基づいてエリア重要度を設定する。例えば人物検知を行い、特定の被写体(例えば、人物)の多い分割エリアは重要度を高く設定する。設定された分割エリアごとの重要度は処理分担制御部227へ出力される。
処理分担制御部227では入力された分割エリアごとの重要度に基づき、撮影処理部210ごとの処理分担を決定する。例えば担当する空間のエリア重要度が高く設定された撮影処理部210に対しては、処理する分割エリアの音声を減らし、担当空間内のあまり重要度の高くない分割エリアの処理を他の撮影処理部210に担当させるように分担を決定する。
例えば図11(A)に示すように、2台の撮影処理部210Aおよび210Bのマイクアレイ111Aおよび111Bの担当空間が402Aおよび402Bと定められていて、それぞれ分割エリアが11〜19および21〜29と定められているとする。ここでエリア重要度設定部226において分割エリア17が重要エリアとして設定された場合、処理分担制御部227では、分割エリア17を担当する撮影処理部210Aの処理量を低減するための分割エリアの割当てを行う。具体的には、撮影処理部210Aに当初割り当てられていた分割エリアの一部他の撮影処理部210が担当するように設定する。例えば図11(B)に示すように分割エリア13に対応する音声の信号処理を撮影処理部210Bが担当するように設定する。つまり、撮影処理部210Aが担当する分割エリアは404A、撮影処理部210Bが処理を担当する分割エリアは404Bとなる。
このように重要度が高い分割エリアが多い撮影処理部210の一部の信号処理を重要度が高い分割エリアの少ない撮影処理部210に分担させる。また処理分担制御部227は処理が一部の撮影処理部210に偏らないように処理を割り振る。例えば連続して処理を割り振る場合、フレームごとに異なる撮影処理部210に処理を割り振る。これにより、重要度が高い分割エリアを担当する撮影処理部210の処理負担を軽減することができ、重要な分割エリアにおける音声の再生を確実に行うことが可能となる。
視点生成部230は、例えばカメラの映像切替器(スイッチャー)および受信画像表示装置を備え、ユーザは、複数の撮影処理部210の撮影部218からの映像を見ながら使用する映像を選択することができる。選択した映像を撮影した撮影部218の位置および向きが視点となる。視点生成部230は生成した視点、及び、その視点と対応する時刻を出力する。ここで時刻情報は視点がどのタイミングでそこにあったかを示す情報であり、映像と音声の時刻情報と同一であることが望ましい。
(信号生成処理)
続いて図12(A)は本実施形態の収音からリアルタイム再生用信号を生成する処理(信号生成処理)の処理手順を示すフローチャートである。
収音(S201)および分離(S202)は実施形態1のS105およびS109と同様のため、詳細な説明は省略する。
続いて撮影処理部210の撮影部218において空間の撮影が行われる(S203)。撮影された画像は信号処理部113へ出力される。
続いて信号処理部113において画像処理が行われる(S204)。具体的には、分割エリアとその収音処理部110との位置関係に基づき光学補正等を行う。処理された画像は第1送受信部114に送られる。
続いて第1送受信部114から画像データが送信され、再生信号生成部120の第2送受信部121および視点生成部230において画像データが受信される(S205)。再生信号生成部120の第2送受信部121において受信された画像データは、エリア重要度設定部226およびリアルタイム再生用信号生成部122、第2記憶部123に出力される。また視点生成部230において受信された画像データはそれぞれ受信画像表示装置に表示される。
続いてエリア重要度設定部226において分割エリアごとの重要度が設定される(S206)。前述のように、分割エリアの重要度は、分割エリアの撮影画像を解析し、その分割エリアに写り込んでいる人物の数に基づき決定する。設定された分割エリアごとの重要度は処理分担制御部227へ送られる。
続いて処理分担制御部227において、各撮影処理部210の音声信号処理の処理分担を決定する(S207)。決められた処理分担を示す制御情報は第2送受信部121へ出力される。
続いて処理分担の制御情報は第2送受信部121から送信され、各撮影処理部210の第1送受信部114において受信される(S208)。第1送受信部114で受信された処理分担の制御情報は信号処理制御部217へ出力される。
続いて信号処理制御部217において入力された制御情報に基づき、各分割エリアの信号が本撮影処理部210の信号処理部113において処理する信号か、他の撮影処理部210において処理される信号かを判定する(S209)。本撮影処理部210において処理する信号の場合(S209でYES)はS210へ進む。
他の撮影処理部210で処理する信号の場合(S209NO)は、本撮影処理部210の第1送受信部114から、その信号を担当の撮影処理部210の第1送受信部114へ送信する(S216)。受信された分割エリアの音声信号は信号処理制御部217へ出力される。
続いて信号処理部113において音声信号の処理が行われる(S210)。S210では、図6(A)のS111と同様に、例えば、分割エリアとその収音処理部110との距離による影響を補正するための遅延補正処理、ゲイン補正処理や、エコー除去による雑音処理などである。信号処理された音声信号は第1送受信部114へ出力される。
続いて第1送受信部114から第2送受信部121へ処理された分割エリアごとの音声信号が送られる(S211)。第2送受信部121において受信された分割エリアごとの音声信号はリアルタイム再生用信号生成部122および第2記憶部123へ出力される。
続いて視点生成部230において視点が生成される(S212)。生成された視点および時刻情報は再生信号生成部120に送られる。
続いて第2送受信部121において前記視点と対応する時刻情報を受信する(S213)。受信した視点と時刻情報はリアルタイム再生用信号生成部122へ出力される。
続いてリアルタイム再生用信号生成部122においてリアルタイム再生用信号生成が行われる。視点生成部230で生成された視点情報に基づいて、複数の視点の映像から1つを選択し、またその視点に応じた音源のミキシングを行う(S214)。映像と音声は時間同期を行い音声付映像情報として出力される。
最後に第2記憶部123において第2送受信部121で受信した全ての画像と、音声信号を記録する(S215)。そして、処理を終了する。
(リプレイ処理)
図12(B)はリプレイ再生用信号生成時のフローを示すフローチャートである。はじめに、視点生成部230において撮影中あるいは撮影後にリプレイ用に過去の時刻の視点が生成される(S221)。
生成された視点と、その視点と対応する時刻情報は第2送受信部121へ送られる(S222)。第2送受信部121で受信された視点と時刻の情報はリプレイ再生用信号生成部124へ送られる。
続いてリプレイ再生用信号生成部124は、前記時刻および視点に対応した映像と、前記時刻に対応した音声を第2記憶部123から読み出す(S223)。
続いてリプレイ再生用信号生成部124においてリプレイ信号が生成される(S224)。S224の処理はS214とほぼ同様のため説明を省略する。
以上説明したように、分割エリアごとの重要度を判定し、重要度に基づいて各撮影処理部210が処理を担当する空間(分割エリア)を制御する。そのため、より重要な分割エリアを優先して処理することができ、リアルタイム再生に間に合わせることができる。
本実施形態において、複数の撮影処理部210は同様の機能を有する場合の例を説明したが、それぞれ異なる性能であってもよい。例えば撮影部218の性能が異なっていてもよい。
本実施形態において、視点生成部230および再生信号生成部120が一つずつの例を示したが、複数あってもよい。もっとも、その場合、撮影システム200の中の複数のエリア重要度設定部226および処理分担制御部227のうちいずれか一つが機能するようにする。
本実施形態において音声の信号処理のみを別の撮影処理部210で行うように制御する例を説明したが、撮影した画像に対する信号処理も合わせて行うように制御してもよい。本実施形態において分割エリアごとの音声の収音にはマイクアレイ111および音源分離部112を用いたが、無指向性のマイクロホンを設定した分割エリアそれぞれの略中心に配置して音声を取得するようにしてもよい。本実施形態において信号処理部113処理順序などは特に設定しなかったが、エリア重要度設定部226で設定されたエリア重要度に基づいてエリア重要度の高い分割エリアから処理を行うようにしてもよい。
本実施形態では、エリア重要度設定部226は画像から得た分割エリア内の被写体の数に応じてエリア重要度を設定したが、その他の情報を用いてもよい。例えば音声から判断してもよく、分割エリアごとの音量や音声認識結果などを用いて重要度を設定してもよい。また事前にユーザの操作により設定されるようにしてもよいし、過去の画像と音声のデータを事前に学習して入力された画像と音声から自動で重要度を決定するような処理を行ってもよい。あるいは被写体の動きを予測する装置を備え、予測した被写体の場所に応じて分割エリア重要度が設定されるようになっていてもよい。
本実施形態において処理分担制御部227はエリア重要度に基づいて処理分担を行ったが、例えば撮影処理部210の処理負荷を監視する負荷検出装置を備え、処理負荷に応じて各撮影処理部210の処理が平滑化されるように処理分担を割り振ってもよい。また、処理分担を行うとデータを他の撮影処理部210に送る必要が出てくる。そのため信号伝送経路の負荷が高くなる可能性がある。そこで信号伝送経路の伝送負荷を監視し、負荷状況に応じて処理分担を調整し、データ送信量を減らすようにしてもよい。
本実施形態において撮影処理部210には記憶装置を設けなかったが、処理分担により処理が間に合わなくなった場合、そのデータを記憶する記憶装置を設けるようにしてもよい。
本実施形態において処理分担制御部227はエリア重要度に基づいて処理分担を行ったが、重要度は分割エリアで指定されなくてもよい。例えば空間内のある点の座標で指定されるようにしてもよい。撮影処理部210ごとの担当の空間ごとに重要度が設定され、それらに基づいて処理分担を制御してもよい。
本実施形態では視点生成部230はカメラの映像切替器としたが、空間内のカメラの向きと軌跡を入力するようなものであってもよい。例えば映像切替えの場合、カメラの軌跡はカメラの位置に依存した離散的な値をとるが、連続的に変化するような空間内の自由視点を生成するようなものであってもよい。
本実施形態では視点を仮想聴取点としたが、ユーザが仮想聴取点を指定する仮想聴取点指定装置を備え、その入力に応じて処理を行ってもよい。
また、本実施形態では省略したが、処理分担の実施状況が分かる画像を表示装置に表示させる表示制御を行うようにしてもよい。図13は表示装置に表示される画面の例を示す。例えば図13(A)において表示画面には、担当空間を表す402Aから402Dとその内部の分割エリアが表示される。ここでタイムバー601は現在までの録音時間を表すバーで、タイムカーソル602の位置が表示画面の時間を表す。分割エリアそれぞれその分割エリアの音声がどの撮影処理部210で処理されるのか表示される。この例では担当空間402Aから402Dを担当する撮影処理部210をそれぞれ210Aから210Dとし、処理の割り振りが分かるような表示をする。この表示は例えば色分けして行ってもよい。さらに、この表示画面の分割エリアを選択し、どこの処理装置に処理を割り振るかをユーザが指定できるようなユーザインターフェイスを備えるようにしていてもよい。
あるいはより簡易に図13(B)に示すように、担当空間402Aから402Dに対してそれぞれいくつの分割エリアの信号処理がどの撮影処理部210へ割り振られたかが分かるようなものでもよい。その場合、ユーザに各撮影処理部210に対していくつの分割エリアを割り振るかの数字を調整できるようになっているとよい。また表示画面にはリアルタイム時の視点やリプレイ時の視点、被写体の位置などを重ねて表示するようにしてもよい。また、全エリア表示は実際の空間の画像に重ねて表示してもよい。
上記のように、本発明の各実施形態によれば、再生までの時間が限られているリアルタイム再生においてもエリア収音をする収音装置の分担を制御することで重要な音声を欠損することなく再生することができる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100:音響システム、110:収音処理部、111:マイクアレイ、112:音源分離部113:信号処理部、114:第1送受信部、115:第1記憶部、116:音源分離エリア制御部、120:再生信号生成部、121:第2送受信部、122:リアルタイム再生用信号生成部、123:第2記憶部、124:リプレイ再生用信号生成部、125:担当空間制御部

Claims (19)

  1. 制御装置と複数の信号処理装置とを有する音響処理システムであって、
    前記複数の信号処理装置は、
    仮想聴取点の位置に応じた再生用音響信号の生成に用いられる複数のエリア音響信号であって、収音領域内の複数の部分エリアにそれぞれ対応する複数のエリア音響信号を、1以上のマイクにより前記収音領域の音を収音することで得られる1以上の収音信号に基づいて生成し、
    前記制御装置は、
    前記仮想聴取点の位置を示す聴取点情報を取得する情報取得手段と、
    前記複数のエリア音響信号を生成する処理の前記複数の信号処理装置への割り当てを、前記情報取得手段により取得された前記聴取点情報に基づいて決定する決定手段と、を有する
    ことを特徴とする音響処理システム。
  2. 前記複数の信号処理装置により生成される前記複数のエリア音響信号に対応する部分エリアの数は、前記複数の信号処理装置の数より多いことを特徴とする請求項1に記載の音響処理システム。
  3. 前記複数の信号処理装置は、前記複数の信号処理装置にそれぞれ対応する複数のマイクアレイによって取得された収音信号に基づいて、前記複数のエリア音響信号を生成し、
    前記複数のマイクアレイのそれぞれは、少なくとも1つのマイクを有することを特徴とする請求項1又は2に記載の音響処理システム。
  4. 前記複数のマイクアレイに含まれる第1のマイクアレイに対応する第1の収音領域と、前記複数のマイクアレイに含まれる第2のマイクアレイに対応する第2の収音領域とが、少なくとも一部重なることを特徴とする請求項3に記載の音響処理システム。
  5. 前記制御装置は、
    前記複数の部分エリアに含まれる部分エリアに対して優先度を設定する優先度設定手段と有し、
    前記決定手段は、前記優先度設定手段により設定された優先度に基づいて、前記複数のエリア音響信号の生成の順序を決定することを特徴とする請求項1乃至4の何れか1項に記載の音響処理システム。
  6. 前記決定手段は、前記聴取点情報が示す前記仮想聴取点の位置の近傍に位置する複数の部分エリアに対応する複数のエリア音響信号それぞれの生成処理が、異なる信号処理装置に割り当てられるように、前記割り当てを決定することを特徴とする請求項1乃至5の何れか1項に記載の音響処理システム。
  7. 前記情報取得手段により取得される前記聴取点情報は、前記仮想聴取点の位置及び聴取方向を示し、
    前記決定手段は、前記仮想聴取点の位置及び聴取方向に基づいて前記割り当てを決定することを特徴とする請求項1乃至6の何れか1項に記載の音響処理システム。
  8. 前記制御装置は、
    前記複数の部分エリアに含まれる部分エリアに対して評価値を設定する評価値設定手段を有し、
    前記決定手段は、前記評価値設定手段により設定された評価値に基づいて前記割り当てを決定することを特徴とする請求項1乃至7の何れか1項に記載の音響処理システム。
  9. 前記評価値設定手段は、前記収音領域の少なくとも一部を撮像することで得られる撮像画像における特定のオブジェクトの位置に基づいて、前記評価値を設定することを特徴とする請求項8に記載の音響処理システム。
  10. 前記評価値設定手段は、機械学習処理の結果に基づいて、または、ユーザの操作に基づいて、前記評価値を決定することを特徴とする請求項8に記載の音響処理システム。
  11. 前記決定手段は、前記1以上の収音信号に含まれる収音信号の連続性に応じて決まるタイミングで前記割り当てを変更することを特徴とする請求項1乃至10の何れか1項に記載の音響処理システム。
  12. 前記決定手段は、前記複数の信号処理装置に含まれる信号処理装置の処理負荷に基づいて前記割り当てを決定することを特徴とする請求項1乃至11の何れか1項に記載の音響処理システム。
  13. 前記決定手段により決定された前記割り当てを示す画像を表示部に表示させる表示制御手段を有することを特徴とする請求項1乃至12の何れか1項に記載の音響処理システム。
  14. 前記決定手段により決定された割り当てに応じて前記複数の信号処理装置によって生成された前記複数のエリア音響信号の少なくとも一部と、前記仮想聴取点の位置とに基づいて、前記再生用音響信号を生成する生成手段を有することを特徴とする請求項1乃至13の何れか1項に記載の音響処理システム。
  15. 前記複数の信号処理装置は、前記1以上の収音信号に対して、ビームフォーミング処理またはウィーナーフィルタを用いた処理を実行することにより、前記複数のエリア音響信号を生成することを特徴とする請求項1乃至14の何れか1項に記載の音響処理システム。
  16. 前記制御装置は、信号処理装置に割り当てられるエリア音響信号に対応する部分エリアを当該信号処理装置に通知する通知手段を有することを特徴とする請求項1乃至15の何れか1項に記載の音響処理システム。
  17. 制御装置と複数の信号処理装置とを有する音響処理システムにより実行される音響処理方法であって、
    前記複数の信号処理装置において、
    仮想聴取点の位置に応じた再生用音響信号の生成に用いられる複数のエリア音響信号であって、収音領域内の複数の部分エリアにそれぞれ対応する複数のエリア音響信号を、1以上のマイクにより前記収音領域の音を収音することで得られる1以上の収音信号に基づいて生成し、
    前記制御装置において、
    前記仮想聴取点の位置を示す聴取点情報を取得し、
    前記複数のエリア音響信号を生成する処理の前記複数の信号処理装置への割り当てを、前記聴取点情報に基づいて決定する
    ことを特徴とする音響処理方法。
  18. 前記複数の信号処理装置により生成される前記複数のエリア音響信号に対応する部分エリアの数は、前記複数の信号処理装置の数より多いことを特徴とする請求項17に記載の音響処理方法。
  19. コンピュータを、請求項1乃至16の何れか1項に記載の制御装置として機能させるためのプログラム。
JP2016208844A 2016-10-25 2016-10-25 音響処理システム、音響処理方法、プログラム Active JP6742216B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016208844A JP6742216B2 (ja) 2016-10-25 2016-10-25 音響処理システム、音響処理方法、プログラム
US15/724,996 US10511927B2 (en) 2016-10-25 2017-10-04 Sound system, control method of sound system, control apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016208844A JP6742216B2 (ja) 2016-10-25 2016-10-25 音響処理システム、音響処理方法、プログラム

Publications (3)

Publication Number Publication Date
JP2018074251A JP2018074251A (ja) 2018-05-10
JP2018074251A5 JP2018074251A5 (ja) 2019-11-28
JP6742216B2 true JP6742216B2 (ja) 2020-08-19

Family

ID=61970033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016208844A Active JP6742216B2 (ja) 2016-10-25 2016-10-25 音響処理システム、音響処理方法、プログラム

Country Status (2)

Country Link
US (1) US10511927B2 (ja)
JP (1) JP6742216B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10649060B2 (en) * 2017-07-24 2020-05-12 Microsoft Technology Licensing, Llc Sound source localization confidence estimation using machine learning
FR3079706B1 (fr) * 2018-03-29 2021-06-04 Inst Mines Telecom Procede et systeme de diffusion d'un flux audio multicanal a des terminaux de spectateurs assistant a un evenement sportif
US11776539B2 (en) 2019-01-08 2023-10-03 Universal Electronics Inc. Voice assistant with sound metering capabilities

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5714997A (en) * 1995-01-06 1998-02-03 Anderson; David P. Virtual reality television system
US7085387B1 (en) * 1996-11-20 2006-08-01 Metcalf Randall B Sound system and method for capturing and reproducing sounds originating from a plurality of sound sources
US6192134B1 (en) * 1997-11-20 2001-02-20 Conexant Systems, Inc. System and method for a monolithic directional microphone array
US20020131580A1 (en) * 2001-03-16 2002-09-19 Shure Incorporated Solid angle cross-talk cancellation for beamforming arrays
JP2004201097A (ja) * 2002-12-19 2004-07-15 Matsushita Electric Ind Co Ltd マイクロホン装置
JP4181511B2 (ja) * 2004-02-09 2008-11-19 日本放送協会 サラウンド音声ミキシング装置およびサラウンド音声ミキシングプログラム
WO2010109918A1 (ja) * 2009-03-26 2010-09-30 パナソニック株式会社 復号化装置、符号化復号化装置および復号化方法
JP4945675B2 (ja) * 2010-11-12 2012-06-06 株式会社東芝 音響信号処理装置、テレビジョン装置及びプログラム
TW201225689A (en) * 2010-12-03 2012-06-16 Yare Technologies Inc Conference system capable of independently adjusting audio input
JP5289517B2 (ja) * 2011-07-28 2013-09-11 株式会社半導体理工学研究センター センサネットワークシステムとその通信方法
WO2013144417A1 (en) * 2012-03-29 2013-10-03 Nokia Corporation A method, an apparatus and a computer program for modification of a composite audio signal
JP5482854B2 (ja) 2012-09-28 2014-05-07 沖電気工業株式会社 収音装置及びプログラム
JP6149818B2 (ja) * 2014-07-18 2017-06-21 沖電気工業株式会社 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム
JP6504539B2 (ja) * 2015-02-18 2019-04-24 パナソニックIpマネジメント株式会社 収音システム及び収音設定方法

Also Published As

Publication number Publication date
US10511927B2 (en) 2019-12-17
JP2018074251A (ja) 2018-05-10
US20180115848A1 (en) 2018-04-26

Similar Documents

Publication Publication Date Title
CN112165590B (zh) 视频的录制实现方法、装置及电子设备
JP6149818B2 (ja) 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム
US8218033B2 (en) Sound corrector, sound recording device, sound reproducing device, and sound correcting method
JP6289121B2 (ja) 音響信号処理装置、動画撮影装置およびそれらの制御方法
JP2020068465A (ja) アレイマイクロフォンおよび収音方法
JP6742216B2 (ja) 音響処理システム、音響処理方法、プログラム
US10547961B2 (en) Signal processing apparatus, signal processing method, and storage medium
JP2020068466A (ja) 音信号処理装置、ミキサ、および音信号処理方法
JP2019079468A (ja) 画像処理システム、画像処理システムの制御方法及びプログラム
US10375499B2 (en) Sound signal processing apparatus, sound signal processing method, and storage medium
JP6818445B2 (ja) 音データ処理装置および音データ処理方法
CN116095254B (zh) 音频处理方法和装置
CN113707165B (zh) 音频处理方法、装置及电子设备和存储介质
JP6821390B2 (ja) 音響処理装置、音響処理方法及びプログラム
WO2019002676A1 (en) RECORDING AND RENDERING SOUND SPACES
JP6274244B2 (ja) 収音再生装置、収音再生プログラム、収音装置及び再生装置
WO2023054047A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP7111202B2 (ja) 収音制御システム及び収音制御システムの制御方法
KR101740569B1 (ko) 영상의 객체 크기 비율에 따른 입체 음향 서비스 제공방법
JP7541964B2 (ja) 信号処理装置、信号処理方法
EP3706432A1 (en) Processing multiple spatial audio signals which have a spatial overlap
US10873806B2 (en) Acoustic processing apparatus, acoustic processing system, acoustic processing method, and storage medium
KR20170105727A (ko) 음성분석을 통해 화자를 추적하여 빌딩의 보안을 증강하는 방법 그를 이용한 시스템
CN115967877A (zh) 波束成形麦克风系统、其设定方法和存储介质
JP2023167168A (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191015

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191015

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200728

R151 Written notification of patent or utility model registration

Ref document number: 6742216

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151