[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2008072541A - Audio device - Google Patents

Audio device Download PDF

Info

Publication number
JP2008072541A
JP2008072541A JP2006250305A JP2006250305A JP2008072541A JP 2008072541 A JP2008072541 A JP 2008072541A JP 2006250305 A JP2006250305 A JP 2006250305A JP 2006250305 A JP2006250305 A JP 2006250305A JP 2008072541 A JP2008072541 A JP 2008072541A
Authority
JP
Japan
Prior art keywords
audio
signal
audio signal
camera
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006250305A
Other languages
Japanese (ja)
Inventor
Yutaka Takase
裕 高瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
D&M Holdings Inc
Original Assignee
D&M Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by D&M Holdings Inc filed Critical D&M Holdings Inc
Priority to JP2006250305A priority Critical patent/JP2008072541A/en
Publication of JP2008072541A publication Critical patent/JP2008072541A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an audio device by which a burden to an operation part is alleviated, a listening sound is detected from an image photographed by a camera and sound field adjustment is automatically performed based on a detection result by a simple configuration. <P>SOLUTION: The audio device is provided with: a signal processing part which performs signal processing for increasing and decreasing a signal level of an audio signal to adjust a delay time when the audio signal is outputted; an amplification part which amplifies the audio signal; an output part which outputs the audio signals to a plurality of speakers; a plurality of cameras provided at a casing; a dynamic body detection part which detects a dynamic body based on the variation of pixels of the image information of the plurality of cameras to output dynamic body information indicating that the dynamic body is detected and a control part which specifies a position of the dynamic body after movement from the dynamic body information, calculates a difference with a preset listening position to increase and decrease the signal level of the audio signal and to adjust the delay time to be added to the audio signal in the signal processing part based on the difference. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、複数個のスピーカからオーディオ信号を出力させるためのオーディオ装置に関する。   The present invention relates to an audio device for outputting audio signals from a plurality of speakers.

従来、複数個のスピーカからオーディオ信号を出力させるためのオーディオ装置においては、聴取位置(リスニングポイント)と各スピーカとの間の距離が異なると、聴取位置における各スピーカからの音量や各スピーカから聴取位置にオーディオ信号が達するまでの時間が異なり、聴取位置において最適な音場を得ることができない場合がある。このため、聴取位置における各スピーカからのオーディオ信号の信号レベルや、各スピーカから聴取位置までのオーディオ信号の到達時間を測定し、聴取位置において最適な音場が得られるよう各スピーカから出力されるオーディオ信号を調整する自動音場調整機能を備えたものが普及している。   Conventionally, in an audio apparatus for outputting audio signals from a plurality of speakers, if the distance between the listening position (listening point) and each speaker is different, the volume from each speaker at the listening position and the listening from each speaker are different. The time until the audio signal reaches the position differs, and an optimal sound field may not be obtained at the listening position. For this reason, the signal level of the audio signal from each speaker at the listening position and the arrival time of the audio signal from each speaker to the listening position are measured and output from each speaker so as to obtain an optimum sound field at the listening position. Those equipped with an automatic sound field adjustment function for adjusting an audio signal have become widespread.

このような自動音場調整機能として、スピーカと聞き手との相対位置を反映するように音響発生源にカメラを設置し、カメラで撮影した画像により聴取者の位置を特定し、当該聴取者の位置と各スピーカとの位置に基づいて自動的に音を調整するスピーカへの音配給調整システムが特許文献1に開示されている。   As such an automatic sound field adjustment function, a camera is installed at the sound source so as to reflect the relative position between the speaker and the listener, and the position of the listener is specified by the image captured by the camera, and the position of the listener Patent Document 1 discloses a sound distribution adjustment system for speakers that automatically adjusts sound based on the position of each speaker.

特開2001−54200JP 2001-54200 A

特許文献1に開示されている技術においては、カメラで撮影した画像からターゲット(聴取者)を獲得及び追跡する技術、3次元撮影及び表示技術などの複雑な演算により、聴取者を判別し聴取者の位置を特定しているため、カメラで撮影した画像が高解像度であることが要求される。しかし、聴取者と人間と類似する物(例えば、人形など)とを区別することが困難である。例えば、カメラが室内にいる聴取者と、窓から室外を歩いている人を撮影した場合、聴取者と室外を歩いている人との区別をしたり、室内に置かれている人形と聴取者とを区別することが困難である。   In the technique disclosed in Patent Document 1, the listener is identified by a complicated calculation such as a technique for acquiring and tracking a target (listener) from an image photographed by a camera, a three-dimensional photographing and display technique, and the like. Therefore, the image taken by the camera is required to have a high resolution. However, it is difficult to distinguish a listener from an object similar to a human (for example, a doll). For example, if you have taken a picture of a listener whose camera is indoors and a person walking outdoors from a window, he can distinguish between a listener and a person walking outdoors, or a doll and listener placed indoors. Is difficult to distinguish.

また、このような人形や聴取者以外の人を撮影した画像から聴取者を特定するため、ターゲットの獲得及び追跡技術、3次元撮影及び表示技術などの高度な画像認識処理により、カメラが撮影した画像から聴取者のみを検出しているため、装置の構成が複雑になると共に、装置内の演算部にも負担がかかる。   In addition, in order to identify the listener from images taken of people other than dolls and listeners, the camera was shot by advanced image recognition processing such as target acquisition and tracking technology, three-dimensional imaging and display technology. Since only the listener is detected from the image, the configuration of the apparatus is complicated, and a burden is imposed on the calculation unit in the apparatus.

本発明は、簡単な構成で、演算部への負担を軽減し、且つ、カメラで撮影した画像から聴取者を検出し、検出結果に基づいて自動的に音場調整をすることができるオーディオ装置を提供することを目的とする。   The present invention is an audio device that can reduce a burden on a calculation unit with a simple configuration, detect a listener from an image captured by a camera, and automatically adjust a sound field based on the detection result. The purpose is to provide.

本願発明は、オーディオ信号の信号レベルを増減し、オーディオ信号を出力する際の遅延時間を調整する信号処理を行う信号処理部と、前記信号処理部から出力されたオーディオ信号を増幅する増幅部と、増幅部から出力されたオーディオ信号を複数のスピーカに出力する出力部と、筐体に備えられた複数のカメラと、前記複数のカメラの画像情報の画素の変化に基づいて動体を検出し動体を検出したことを示す動体情報を出力する動体検出部と、前記動体検出部からの動体情報から動体の移動後の位置を特定し、予め設定されている聴取位置との差分を求め、当該差分に基づいて前記信号処理部におけるオーディオ信号の信号レベルの増減及びオーディオ信号を出力する際の遅延時間を調整する制御を行う制御部とを備えたことを特徴とする。   The present invention relates to a signal processing unit that performs signal processing for adjusting a delay time when outputting an audio signal by increasing / decreasing the signal level of the audio signal, and an amplifying unit that amplifies the audio signal output from the signal processing unit. An output unit that outputs audio signals output from the amplification unit to a plurality of speakers; a plurality of cameras provided in a housing; and a moving object that detects a moving object based on a change in pixels of image information of the plurality of cameras A moving body detection unit that outputs moving body information indicating that the moving body is detected, a position after movement of the moving body is specified from the moving body information from the moving body detection unit, and a difference from a preset listening position is obtained. And a control unit that performs control to adjust the signal signal level of the audio signal in the signal processing unit and to adjust the delay time when the audio signal is output. .

本発明によれば、オーディオ装置において、簡単な構成で、演算部への負担を軽減し、且つ、カメラで撮影した画像から聴取者を検出し、検出結果に基づいて自動的に音場調整をすることができる。   According to the present invention, in the audio device, the burden on the calculation unit is reduced with a simple configuration, and the listener is detected from the image captured by the camera, and the sound field is automatically adjusted based on the detection result. can do.

図1は、本発明のオーディオ装置における一実施形態の構成を示すブロック図である。
オーディオ装置は、例えば、オーディオ・ビジュアル(Audio Visual : AV)アンプなどであり、デジタル・バーサタイル・ディスク(Digital Versatile Disc:DVD)プレーヤなどの外部機器から出力されるビデオ信号・オーディオ信号を入力し、ビデオ信号をモニタやディスプレイなどに出力し、オーディオ信号をスピーカに出力する。本実施形態においては、ビデオ信号についての説明は省略する。
FIG. 1 is a block diagram showing the configuration of an embodiment of the audio apparatus of the present invention.
The audio device is, for example, an audio visual (AV) amplifier, and inputs a video signal / audio signal output from an external device such as a digital versatile disc (DVD) player, The video signal is output to a monitor or display, and the audio signal is output to a speaker. In the present embodiment, description of the video signal is omitted.

図1において、オーディオ装置1は、入力部2、信号処理部3、増幅部4、出力部5、動体検出部6、制御部7とを備える。   In FIG. 1, the audio apparatus 1 includes an input unit 2, a signal processing unit 3, an amplification unit 4, an output unit 5, a moving object detection unit 6, and a control unit 7.

入力部2は、DVDプレーヤなどの外部機器から入力したオーディオ信号を後段の信号処理部3に出力する。   The input unit 2 outputs an audio signal input from an external device such as a DVD player to the signal processing unit 3 at the subsequent stage.

信号処理部3は、例えば、デジタル・シグナル・プロセッサなどであり、入力部2から入力した圧縮オーディオ信号を伸長するデコードや、デコードされたオーディオ信号にサラウンド信号処理や各チャンネルのオーディオ信号に対する信号レベルの調整やオーディオ信号を出力する際の遅延時間の調整などの信号処理を行う。   The signal processing unit 3 is a digital signal processor, for example, and decodes the compressed audio signal input from the input unit 2, surround signal processing on the decoded audio signal, and signal level for the audio signal of each channel Signal processing such as adjustment of delay time and adjustment of delay time when audio signals are output.

増幅部4は、信号処理部3から出力されたオーディオ信号に対しオーディオ信号を増幅する。   The amplifying unit 4 amplifies the audio signal with respect to the audio signal output from the signal processing unit 3.

出力部5には、フロントレフトチャンネルスピーカ(FLスピーカ)8、フロントライトチャンネルスピーカ(FRスピーカ)9、サラウンドレフトスピーカ(SLスピーカ)10、サラウンドライトスピーカ(SRスピーカ)11などの複数のスピーカが接続されている。出力部5は、増幅部4から出力されたオーディオ信号を各チャンネルに対応したスピーカに出力する。   A plurality of speakers such as a front left channel speaker (FL speaker) 8, a front right channel speaker (FR speaker) 9, a surround left speaker (SL speaker) 10, and a surround right speaker (SR speaker) 11 are connected to the output unit 5. Has been. The output unit 5 outputs the audio signal output from the amplification unit 4 to a speaker corresponding to each channel.

動体検出部6は、レフトカメラ(Lカメラ)12、ライトカメラ(Rカメラ)13を備える。Lカメラ12及びRカメラ13は、例えば、CCD(Charge Coupled Device)カメラであり、予め定められた間隔で配置される。Lカメラ12及びRカメラ13は、例えば、オーディオ装置1のフロントパネルの左右の両端に設置されている。   The moving object detection unit 6 includes a left camera (L camera) 12 and a right camera (R camera) 13. The L camera 12 and the R camera 13 are, for example, CCD (Charge Coupled Device) cameras, and are arranged at predetermined intervals. The L camera 12 and the R camera 13 are installed at the left and right ends of the front panel of the audio device 1, for example.

動体検出部6は、Lカメラ12及びRカメラ13が撮影した画像情報を記憶する画像メモリ(図示せず)を備える。動体検出部6は、予め定めた時間毎にLカメラ12及びRカメラ13から画像情報を取得し、それらの画像情報を画像メモリに記憶する。動体検出部6は、Lカメラ12及びRカメラ13が撮影した画像情報について、それぞれ先の画像情報と現在の画像情報とを比較し、先の画像情報と現在の画像情報とに差分があった場合に動体が存在すると判断する。   The moving object detection unit 6 includes an image memory (not shown) that stores image information captured by the L camera 12 and the R camera 13. The moving object detection unit 6 acquires image information from the L camera 12 and the R camera 13 every predetermined time, and stores the image information in the image memory. The moving object detection unit 6 compares the previous image information with the current image information for the image information captured by the L camera 12 and the R camera 13, and there is a difference between the previous image information and the current image information. In this case, it is determined that a moving object exists.

図2は、本実施形態のオーディオ装置における動体検出部の動作を説明するための図である。
オーディオ装置1は、室内などの閉ざされた空間で使用される。その空間においては、常に動いている物体がある場合は少なく、この空間を異なる時刻にカメラで撮影した場合、時刻Tに撮影した画像と時刻T1に撮影した画像との差は小さい。しかし、図2(a)に示すように、聴取者が位置Rから位置Aに移動した場合、時刻Tに撮影した画像と時刻T1に撮影した画像とに差が生じる。
FIG. 2 is a diagram for explaining the operation of the moving object detection unit in the audio apparatus according to the present embodiment.
The audio apparatus 1 is used in a closed space such as a room. In that space, there are few objects that are constantly moving, and when this space is taken with a camera at different times, the difference between the image taken at time T and the image taken at time T1 is small. However, as shown in FIG. 2A, when the listener moves from position R to position A, there is a difference between the image captured at time T and the image captured at time T1.

聴取者が位置Rから位置Aに移動した場合、Lカメラ12では図2(b)に示すように画像が撮影され、Rカメラ13では図2(c)に示すように画像が撮影される。聴取者が移動した場合(動体があった場合)、Lカメラ12又はRカメラ13においては、画素に変化が生じる。画素の変化は、聴取者の体に対応する範囲となる。動体検出部6では、その変化があった画素の範囲の中心を移動基準点とし、聴取者の移動後の位置を算出する。   When the listener moves from position R to position A, the L camera 12 captures an image as shown in FIG. 2B, and the R camera 13 captures an image as shown in FIG. When the listener moves (when there is a moving object), the pixel is changed in the L camera 12 or the R camera 13. The change in pixel is in a range corresponding to the listener's body. The moving object detection unit 6 calculates the position of the listener after the movement using the center of the range of the pixel where the change has occurred as a movement reference point.

図3は、本実施形態のオーディオ装置における位置検出部の動作を説明する図である。
図3(a)において、Lカメラ12及びRカメラ13のそれぞれの画素数をMとし、Lカメラ12の撮影範囲をθmaxL、Rカメラ13撮影範囲をθmaxRとする。また、Lカメラ12及びRカメラ13は、予め定められた間隔Lで配置されている。動体である聴取者がLカメラ12の撮影範囲に入り、聴取位置(位置A)で静止した時の位置(移動基準点の位置)が、Lカメラ12の中心からN1画素の位置であった場合、当該角度は、Lカメラ12の正面から
θα=N1/(M/2)×θmaxL (1)
となる。
FIG. 3 is a diagram for explaining the operation of the position detection unit in the audio apparatus according to the present embodiment.
In FIG. 3A, the number of pixels of the L camera 12 and the R camera 13 is M, the shooting range of the L camera 12 is θmaxL, and the shooting range of the R camera 13 is θmaxR. Further, the L camera 12 and the R camera 13 are arranged at a predetermined interval L. When the moving listener enters the shooting range of the L camera 12 and stops at the listening position (position A) (the position of the movement reference point) is the position of the N1 pixel from the center of the L camera 12 The angle is θα = N1 / (M / 2) × θmaxL (1) from the front of the L camera 12.
It becomes.

同様に、Rチャンネルカメラでの位置が中心からN2画素分であった場合、当該角度は、Rチャンネルカメラの正面から
θβ=(2×N2/M)×θmaxR (2)
となる。
Similarly, when the position on the R channel camera is N2 pixels from the center, the angle is θβ = (2 × N2 / M) × θmaxR (2) from the front of the R channel camera.
It becomes.

Lチャンネルカメラ及びRチャンネルカメラから動体までの距離をL3とすると、
L3=L1/tan(θα) (3)
L3=L2/tan(θβ) (4)
となり、
L1/tan(θα)=L2/tan(θβ) (5)
となる。
If the distance from the L channel camera and R channel camera to the moving object is L3,
L3 = L1 / tan (θα) (3)
L3 = L2 / tan (θβ) (4)
And
L1 / tan (θα) = L2 / tan (θβ) (5)
It becomes.

また、Lカメラ15とRカメラ16の距離がLであることから、
L=L1+L2=L2{tan(θα)/tan(θβ)}+L2 (6)
となり
L2=L[tan(θβ)/{tan(θα)+tan(θβ)} (7)
L1=L-L2=L[tan(θα)/{tan(θα)+tan(θβ)} (8)
であり、上記式より動体(聴取者)の位置を算出することができる。
Since the distance between the L camera 15 and the R camera 16 is L,
L = L1 + L2 = L2 {tan (θα) / tan (θβ)} + L2 (6)
Next
L2 = L [tan (θβ) / {tan (θα) + tan (θβ)} (7)
L1 = L-L2 = L [tan (θα) / {tan (θα) + tan (θβ)} (8)
Therefore, the position of the moving object (listener) can be calculated from the above formula.

また、図3(b)に示すように、聴取者が前方向(Lカメラ12及びRカメラ13の方向)に移動した場合、Lカメラ12のθαが一定の場合でも、Rカメラ13のθβはθβ’に変化する。Lカメラ12とRカメラ13との距離L、θα、θβ’により、前記(6)(7)(8)の式を用いてL1’又はL2’を求めることができ、聴取者の位置を算出することができる。L1’又はL2’が求まることにより、前記(3)又は(4)のいずれかによりL3’を算出することができる。   Further, as shown in FIG. 3B, when the listener moves forward (in the direction of the L camera 12 and the R camera 13), even when θα of the L camera 12 is constant, θβ of the R camera 13 is changes to θβ ′. L1 ′ or L2 ′ can be obtained from the distances L, θα, θβ ′ between the L camera 12 and the R camera 13 using the equations (6), (7), and (8), and the position of the listener is calculated. can do. By obtaining L1 'or L2', L3 'can be calculated by either (3) or (4).

制御部7は、オーディオ装置1の全体を制御する。制御部7は、操作部(図示せず)から入力する指示信号に基づいて、オーディオ信号の音量の調整、オーディオ信号を出力する形態(ステレオ出力、サラウンド出力)などを制御する。オーディオ装置1は、オートセットアップなどによる音場自動調整機能を有し、制御部7は、当該オーディオ装置1に接続された複数のスピーカの周波数特性、位置などを測定し、基準聴取位置において最適な音響が得られるよう信号処理部3において各チャンネルのオーディオ信号に信号レベルの設定、遅延時間の付加する制御を行う。   The control unit 7 controls the entire audio apparatus 1. The control unit 7 controls the volume adjustment of the audio signal, the form of outputting the audio signal (stereo output, surround output), and the like based on the instruction signal input from the operation unit (not shown). The audio device 1 has a sound field automatic adjustment function by auto setup or the like, and the control unit 7 measures frequency characteristics, positions, and the like of a plurality of speakers connected to the audio device 1 and is optimal at the reference listening position. In order to obtain sound, the signal processing unit 3 performs control for setting a signal level and adding a delay time to the audio signal of each channel.

制御部7は、動体検出部6からの動体情報に基づいて、予め設定されている聴取位置と、動体情報に基づいて動体位置との差を演算により求め、その差に応じて信号処理部3を制御し、各チャンネルのオーディオ信号の信号レベルの増減やオーディオ信号を出力する際の遅延時間の調整などの制御を行う。すなわち、動体検出部6からの動体情報に基づいて聴取位置を変更するようオーディオ信号の信号レベルを増減したり、オーディオ信号を出力する際に出力するタイミングがずれるよう遅延時間を調整する制御を行う。   The control unit 7 obtains a difference between the listening position set in advance based on the moving body information from the moving body detection unit 6 and the moving body position based on the moving body information, and the signal processing unit 3 according to the difference. To control the increase / decrease of the signal level of the audio signal of each channel and the adjustment of the delay time when outputting the audio signal. That is, control is performed to increase / decrease the signal level of the audio signal so as to change the listening position based on the moving object information from the moving object detection unit 6, or adjust the delay time so that the output timing is shifted when outputting the audio signal. .

位置検出部6は、上記の方法により求めた聴取者の位置を求め、求めた位置情報を補正制御部7に出力する。補正制御部7は、位置検出部6からの位置情報と各スピーカの位置情報とに基づいて、各スピーカの位置から定まる聴取位置と、前記位置情報に基づく聴取者の位置との差分を求め、その差に対応するようアンプ部3の信号処理部9における各チャンネルのオーディオ信号の信号レベルや遅延時間の調整を行う。   The position detection unit 6 obtains the position of the listener obtained by the above method, and outputs the obtained position information to the correction control unit 7. The correction control unit 7 obtains a difference between the listening position determined from the position of each speaker and the position of the listener based on the position information based on the position information from the position detection unit 6 and the position information of each speaker. The signal level of the audio signal of each channel and the delay time are adjusted in the signal processing unit 9 of the amplifier unit 3 so as to correspond to the difference.

オーディオ装置1の動作について説明する。
オーディオ装置1において、自動音響調整機能が作動すると、聴取者により入力されたスピーカ数、各スピーカ間の距離、また、各スピーカから音を発生し、聴取位置に設置されたマイクで収音した結果に基づいて、聴取位置において最適な音響となるよう各スピーカから出力されるオーディオ信号に対し、信号レベルや遅延時間等の調整を行う。この時点で、聴取位置において、最適な音響が得られるよう各スピーカから出力されるオーディオ信号が調整される。
The operation of the audio device 1 will be described.
In the audio apparatus 1, when the automatic sound adjustment function is activated, the number of speakers input by the listener, the distance between the speakers, and the sound generated from each speaker and collected by a microphone installed at the listening position Based on the above, the signal level, the delay time, etc. are adjusted with respect to the audio signal output from each speaker so as to obtain the optimum sound at the listening position. At this point, the audio signal output from each speaker is adjusted so as to obtain optimum sound at the listening position.

この後、動体検出部6が作動し、動体検出を開始する。Lカメラ12及びRカメラ13は、予め定めた時間毎に動体の有無を検出する。動体があった場合、動体検出部6は、動体情報を制御部7に出力する。   Thereafter, the moving object detection unit 6 operates to start moving object detection. The L camera 12 and the R camera 13 detect the presence or absence of a moving object at predetermined time intervals. When there is a moving object, the moving object detection unit 6 outputs the moving object information to the control unit 7.

制御部7は、動体検出部6から動体情報の入力があると、動体情報に基づいて現在設定されている聴取位置と動体情報に基づく聴取位置との差分を演算により求める。そして、制御部7は、その差分に基づいて、動体が移動した位置が最適な音響が得られる聴取位置になるよう各チャンネルのオーディオ信号に設定されている信号レベルや付加する遅延時間を変更する。   When the moving body information is input from the moving body detection unit 6, the control unit 7 calculates the difference between the listening position currently set based on the moving body information and the listening position based on the moving body information. Based on the difference, the control unit 7 changes the signal level set for the audio signal of each channel and the delay time to be added so that the position where the moving object moves becomes the listening position where the optimum sound is obtained. .

このことにより、聴取者が移動した場合に、自動的に、移動後の位置が最適な音響となるように設定される。したがって、聴取者が聴取位置を変更する毎に、聴取位置の設定を変更する必要がなく、聴取者にとって使い勝手が良い。   As a result, when the listener moves, the position after the movement is automatically set to be the optimum sound. Therefore, every time the listener changes the listening position, it is not necessary to change the setting of the listening position, which is convenient for the listener.

そして、これを実現するに際して、オーディオ装置1は、2つのカメラを備え、移動検出部6が2つのカメラにおける画素の変化により動体の受けを検出し、動体の移動後の位置を特定することができるため、複雑な演算を要する動体認識処理を行う必要がない。また、精度の高い動体認識処理に基づいて聴取位置を変更することが無いため、聴取者以外の動体を誤検出することがなく、誤った位置に聴取位置が設定されることがない。   In realizing this, the audio apparatus 1 includes two cameras, and the movement detection unit 6 detects the reception of the moving object by the change of the pixels in the two cameras, and specifies the position after the movement of the moving object. Therefore, it is not necessary to perform a moving object recognition process that requires complicated calculations. In addition, since the listening position is not changed based on a highly accurate moving object recognition process, moving objects other than the listener are not erroneously detected, and the listening position is not set at an incorrect position.

本発明のオーディオ装置における一実施形態の構成を示すブロック図。The block diagram which shows the structure of one Embodiment in the audio apparatus of this invention. 本実施形態のオーディオ装置における動体検出部の動作を説明するための図。The figure for demonstrating operation | movement of the moving body detection part in the audio apparatus of this embodiment. 本実施形態のオーディオ装置における位置検出部の動作を説明する図。The figure explaining operation | movement of the position detection part in the audio apparatus of this embodiment.

符号の説明Explanation of symbols

1・・・オーディオ装置、2・・・入力部、3・・・信号処理部、4・・・増幅部、5・・・出力部、6・・・動体検出部、7・・・制御部、8・・・FLスピーカ、9・・・FRスピーカ、10・・・SLスピーカ、11・・・SRスピーカ、12・・・Lカメラ、13・・・Rカメラ   DESCRIPTION OF SYMBOLS 1 ... Audio apparatus, 2 ... Input part, 3 ... Signal processing part, 4 ... Amplification part, 5 ... Output part, 6 ... Moving object detection part, 7 ... Control part 8 ... FL speaker, 9 ... FR speaker, 10 ... SL speaker, 11 ... SR speaker, 12 ... L camera, 13 ... R camera

Claims (1)

オーディオ信号の信号レベルを増減し、オーディオ信号を出力する際の遅延時間を調整する信号処理を行う信号処理部と、前記信号処理部から出力されたオーディオ信号を増幅する増幅部と、増幅部から出力されたオーディオ信号を複数のスピーカに出力する出力部と、筐体に備えられた複数のカメラと、前記複数のカメラの画像情報の画素の変化に基づいて動体を検出し動体を検出したことを示す動体情報を出力する動体検出部と、前記動体検出部からの動体情報から動体の移動後の位置を特定し、予め設定されている聴取位置との差分を求め、当該差分に基づいて前記信号処理部におけるオーディオ信号の信号レベルの増減及びオーディオ信号を出力する際の遅延時間を調整する制御を行う制御部とを備えたことを特徴とするオーディオ装置。   From a signal processing unit that performs signal processing to increase / decrease a signal level of an audio signal and adjust a delay time when outputting the audio signal, an amplification unit that amplifies the audio signal output from the signal processing unit, and an amplification unit An output unit that outputs output audio signals to a plurality of speakers, a plurality of cameras provided in a housing, and a moving object is detected based on a change in pixels of image information of the plurality of cameras. A moving body detection unit that outputs moving body information indicating the position of the moving body after moving from the moving body information from the moving body detection unit, obtaining a difference from a preset listening position, and based on the difference An audio comprising: a control unit that performs control to adjust the signal signal level of the audio signal in the signal processing unit and to adjust a delay time when the audio signal is output. Location.
JP2006250305A 2006-09-15 2006-09-15 Audio device Pending JP2008072541A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006250305A JP2008072541A (en) 2006-09-15 2006-09-15 Audio device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006250305A JP2008072541A (en) 2006-09-15 2006-09-15 Audio device

Publications (1)

Publication Number Publication Date
JP2008072541A true JP2008072541A (en) 2008-03-27

Family

ID=39293709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006250305A Pending JP2008072541A (en) 2006-09-15 2006-09-15 Audio device

Country Status (1)

Country Link
JP (1) JP2008072541A (en)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009300576A (en) * 2008-06-11 2009-12-24 Yamaha Corp Speech synthesizer and program
JP2011188248A (en) * 2010-03-09 2011-09-22 Yamaha Corp Audio amplifier
KR101095132B1 (en) 2009-10-06 2011-12-16 삼성전기주식회사 Audio system with a camera module
WO2012105254A1 (en) * 2011-02-01 2012-08-09 Necカシオモバイルコミュニケーションズ株式会社 Electronic device
JP2013098824A (en) * 2011-11-02 2013-05-20 Mitsubishi Electric Corp Sound reproducer, sound reproduction system, sound reproduction method and video display device
JP2014072871A (en) * 2012-10-02 2014-04-21 Sony Corp Sound processing device, method, program, and recording medium
EP2741523A1 (en) * 2012-12-04 2014-06-11 Dolby Laboratories Licensing Corporation Object based audio rendering using visual tracking of at least one listener
WO2019041178A1 (en) * 2017-08-30 2019-03-07 深圳魔耳智能声学科技有限公司 Sound playback method and device, and readable storage medium
CN110996217A (en) * 2019-11-28 2020-04-10 歌尔科技有限公司 Sound channel selection method and device for sound box and sound box
JP2020156108A (en) * 2014-01-16 2020-09-24 ソニー株式会社 Sound processing device and method, and program
CN112689193A (en) * 2019-10-18 2021-04-20 惠州迪芬尼声学科技股份有限公司 Music playing method for judging whether to play music according to image information and corresponding music playing system

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009300576A (en) * 2008-06-11 2009-12-24 Yamaha Corp Speech synthesizer and program
KR101095132B1 (en) 2009-10-06 2011-12-16 삼성전기주식회사 Audio system with a camera module
JP2011188248A (en) * 2010-03-09 2011-09-22 Yamaha Corp Audio amplifier
EP2672726A4 (en) * 2011-02-01 2015-04-08 Nec Casio Mobile Comm Ltd Electronic device
WO2012105254A1 (en) * 2011-02-01 2012-08-09 Necカシオモバイルコミュニケーションズ株式会社 Electronic device
JP2012160959A (en) * 2011-02-01 2012-08-23 Nec Casio Mobile Communications Ltd Electronic apparatus
CN103339963A (en) * 2011-02-01 2013-10-02 Nec卡西欧移动通信株式会社 Electronic device
EP2672726A1 (en) * 2011-02-01 2013-12-11 NEC CASIO Mobile Communications, Ltd. Electronic device
US9241123B2 (en) 2011-02-01 2016-01-19 Nec Corporation Electronic device
JP2013098824A (en) * 2011-11-02 2013-05-20 Mitsubishi Electric Corp Sound reproducer, sound reproduction system, sound reproduction method and video display device
JP2014072871A (en) * 2012-10-02 2014-04-21 Sony Corp Sound processing device, method, program, and recording medium
EP2741523A1 (en) * 2012-12-04 2014-06-11 Dolby Laboratories Licensing Corporation Object based audio rendering using visual tracking of at least one listener
JP2020156108A (en) * 2014-01-16 2020-09-24 ソニー株式会社 Sound processing device and method, and program
US11223921B2 (en) 2014-01-16 2022-01-11 Sony Corporation Audio processing device and method therefor
JP7010334B2 (en) 2014-01-16 2022-01-26 ソニーグループ株式会社 Speech processing equipment and methods, as well as programs
US11778406B2 (en) 2014-01-16 2023-10-03 Sony Group Corporation Audio processing device and method therefor
US12096201B2 (en) 2014-01-16 2024-09-17 Sony Group Corporation Audio processing device and method therefor
WO2019041178A1 (en) * 2017-08-30 2019-03-07 深圳魔耳智能声学科技有限公司 Sound playback method and device, and readable storage medium
CN112689193A (en) * 2019-10-18 2021-04-20 惠州迪芬尼声学科技股份有限公司 Music playing method for judging whether to play music according to image information and corresponding music playing system
CN112689193B (en) * 2019-10-18 2023-04-18 惠州迪芬尼声学科技股份有限公司 Method and system for judging whether to play music according to image information
CN110996217A (en) * 2019-11-28 2020-04-10 歌尔科技有限公司 Sound channel selection method and device for sound box and sound box
CN110996217B (en) * 2019-11-28 2021-08-24 荣成歌尔科技有限公司 Sound channel selection method and device for sound box and sound box

Similar Documents

Publication Publication Date Title
JP2008072541A (en) Audio device
US20100302401A1 (en) Image Audio Processing Apparatus And Image Sensing Apparatus
US20110211035A1 (en) Voice communication apparatus and voice communication method
US20110085061A1 (en) Image photographing apparatus and method of controlling the same
JP2006005608A (en) Imaging device
JP2011223549A (en) Sound output device
US11234074B2 (en) Sound pickup device, sound pickup system, sound pickup method, program, and calibration method
CN106998425B (en) Vibration detection apparatus, vibration detection method, and image pickup apparatus
JP2012002951A (en) Imaging device, method for detecting in-focus position and in-focus position detection program
JP4934968B2 (en) Camera device, camera control program, and recorded voice control method
EP3560193A1 (en) Method and device for synchronizing audio and video when recording using a zoom function
KR20160098649A (en) Sweet spot setting device for speaker and method thereof
KR20090022718A (en) Sound processing apparatus and sound processing method
US9232146B2 (en) Imaging device with processing to change sound data
WO2020059447A1 (en) Sound signal processor, sound signal processing method, sound signal processing program, sound signal processing system, and imaging device
JP2008301363A (en) Loudspeaker
US9686511B1 (en) Positioning system and method for image capturing devices
CN110225247B (en) Image processing method and electronic equipment
JP6176073B2 (en) Imaging system and program
JP2000152109A (en) Television receiver
JP2008066773A (en) Audio system
KR20170043880A (en) Face tracking camera module and method
JP2015104091A (en) Voice processing device with wind noise reduction device, and imaging apparatus with the same
JP6631166B2 (en) Imaging device, program, and imaging method
JP2013141090A (en) Imaging apparatus and processing method of the same