JP6220236B2 - Sound image display device, sound image display system, and sound image display method - Google Patents
Sound image display device, sound image display system, and sound image display method Download PDFInfo
- Publication number
- JP6220236B2 JP6220236B2 JP2013233284A JP2013233284A JP6220236B2 JP 6220236 B2 JP6220236 B2 JP 6220236B2 JP 2013233284 A JP2013233284 A JP 2013233284A JP 2013233284 A JP2013233284 A JP 2013233284A JP 6220236 B2 JP6220236 B2 JP 6220236B2
- Authority
- JP
- Japan
- Prior art keywords
- channels
- sound
- data
- curve
- ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 32
- 230000000694 effects Effects 0.000 claims description 9
- 108091006146 Channels Proteins 0.000 description 137
- 238000001514 detection method Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 11
- 239000003086 colorant Substances 0.000 description 5
- 238000005452 bending Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000004040 coloring Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000052343 Dares Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Stereophonic System (AREA)
Description
本発明は、音像表示装置、音像表示システム、および音像表示方法に関するものである。より詳細には、本発明は、複数チャンネルの音声をサラウンド再生する際の音像を視覚的に表示する描画データを出力する音像表示装置、このような音像を表示する音像表示システム、および、そのような音像表示装置の音像表示方法に関するものである。 The present invention relates to a sound image display device, a sound image display system, and a sound image display method. More specifically, the present invention relates to a sound image display device that outputs drawing data for visually displaying a sound image when surround sound of a plurality of channels is reproduced, a sound image display system that displays such a sound image, and such The present invention relates to a sound image display method for a simple sound image display device.
従来、ステレオ音声の再生においては、オーディオレベルメータ等を使用して、L/R信号それぞれに基づく各チャンネルの音声のレベル管理を行っている。また、位相メータを使用してチャンネル間の位相監視を行うことにより、音の広がりを監視したり、音が逆相になっていないか等を判定したりしている。 Conventionally, in stereo sound reproduction, an audio level meter or the like is used to manage the sound level of each channel based on each L / R signal. In addition, by using a phase meter to monitor the phase between channels, the spread of sound is monitored, and it is determined whether the sound is out of phase or the like.
一方、音声のサラウンド再生においては、上述したような各チャンネルの音声のレベル管理、およびチャンネル間の位相監視を行うことに加え、さらに、平面空間への音の広がり(音像)についても管理する必要がある。 On the other hand, in audio surround playback, in addition to performing audio level management of each channel as described above and phase monitoring between channels, it is also necessary to manage the spread of sound (sound image) into a planar space. There is.
しかしながら、音声をサラウンド再生する際の多種多様な情報を収集するために、様々なツールを使用して監視しようとすると、複雑な構成の機器類が必要になる。また、このような情報は、音声の再生に伴って、リアルタイムで動的に監視できるようにするのが望ましい。そこで、このような多種多様な情報を集約するのみならず、視覚に訴える表現により直感的に把握することを可能にする計測ツールがあれば、極めて利便性が高い。 However, in order to collect a wide variety of information when sound is reproduced in surround, monitoring with various tools requires a complicated configuration of equipment. In addition, it is desirable that such information can be dynamically monitored in real time as the audio is reproduced. Therefore, if there is a measurement tool that not only aggregates such a wide variety of information but also makes it possible to grasp intuitively by visually appealing expressions, it is extremely convenient.
したがって、本発明の目的は、サラウンド再生のように複数チャンネルで再生される音声の音像を視覚的に表現することができる音像表示装置、音像表示システム、および音像表示方法を提供することにある。 Accordingly, an object of the present invention is to provide a sound image display device, a sound image display system, and a sound image display method capable of visually expressing a sound image of sound reproduced by a plurality of channels like surround reproduction.
上記目的を達成する第1の観点に係る音像表示装置の発明は、
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出し、当該逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じた色の曲線を描画する描画データを出力することを特徴とする。
The invention of the sound image display device according to the first aspect of achieving the above object,
Based on the audio data of two channels among a plurality of channels, a curve is obtained by calculating the ratio of the reverse phase component of the sound between the two channels and changing the curvature according to the ratio of the negative phase component. Drawing data for drawing a curve of a color corresponding to the ratio of the reverse phase component is output.
また、前記2つのチャンネルの音声データに基づいて、当該2つのチャンネルそれぞれにおける音声のレベルを検出し、当該音声のレベルおよび前記逆相成分の比率に応じて曲率を変化させた前記曲線を描画する描画データを出力してもよい。 Further, based on the sound data of the two channels, the sound level in each of the two channels is detected, and the curve in which the curvature is changed according to the sound level and the ratio of the antiphase component is drawn. Drawing data may be output.
また、前記2つのチャンネルの音声データに基づいて、当該2つのチャンネルそれぞれにおける音声レベルを検出し、当該2つのチャンネルそれぞれにおける音声レベルを表す線分の長さに対応する2つの座標を両端の点とし、前記逆相成分の比率に対応する座標を制御点とする2次ベジェ曲線を描画する描画データを出力してもよい。 Also, based on the audio data of the two channels, the audio level in each of the two channels is detected, and two coordinates corresponding to the length of a line segment representing the audio level in each of the two channels are displayed at both ends. And drawing data for drawing a quadratic Bezier curve having a coordinate corresponding to the ratio of the anti-phase component as a control point may be output.
また、前記2つのチャンネル間における音声の逆相成分の比率が所定の閾値以上または所定の閾値以下である時は、所定の色の前記曲線を描画する描画データを出力してもよい。 In addition, when the ratio of the reverse phase component of the audio between the two channels is equal to or higher than a predetermined threshold value or lower than the predetermined threshold value, drawing data for drawing the curve of a predetermined color may be output.
また、前記2つのチャンネル間における音声の逆相成分の比率が、完全に同相と完全に逆相との間における第2の範囲内にある時は、前記逆相成分の比率に応じて所定の色の間で徐々に変化する色の前記曲線を描画する描画データを出力してもよい。 Further, when the ratio of the reverse phase component of the audio between the two channels is within the second range between the completely in phase and the completely reverse phase, a predetermined value is set according to the ratio of the reverse phase component. You may output the drawing data which draws the said curve of the color which changes gradually between colors.
また、前記複数のチャンネルのうち低域効果音用チャンネルの音声データに基づいて、当該低域効果音用チャンネルにおける音声のレベルを検出し、当該音声のレベルに応じて半径および色の少なくとも一方を変化させた円形を描画する描画データをさらに出力してもよい。 Further, based on the audio data of the low-frequency effect sound channel among the plurality of channels, the audio level in the low-frequency effect sound channel is detected, and at least one of the radius and the color is determined according to the audio level. The drawing data for drawing the changed circle may be further output.
上記目的を達成する第2の観点に係る音像表示システムの発明は、
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出し、当該逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じた色の曲線を描画する描画データを出力する制御部と、
前記制御部により出力された描画データに基づく曲線を表示する表示部と、
を備えることを特徴とする。
The invention of the sound image display system according to the second aspect of achieving the above object,
Based on the audio data of two channels among a plurality of channels, a curve is obtained by calculating the ratio of the reverse phase component of the sound between the two channels and changing the curvature according to the ratio of the negative phase component. A control unit that outputs drawing data for drawing a color curve according to the ratio of the reversed-phase component;
A display unit for displaying a curve based on the drawing data output by the control unit;
It is characterized by providing.
上記目的を達成する第3の観点に係る音像表示装置の音像表示方法の発明は、
複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出するステップと、
前記逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じて変化させた色の曲線を描画する描画データを出力するステップと、
を含むことを特徴とする。
The invention of the sound image display method of the sound image display device according to the third aspect of achieving the above object,
Calculating the ratio of the reverse phase component of the sound between the two channels based on the sound data of two channels of the plurality of channels;
A step of outputting drawing data for drawing a curve in which the curvature is changed according to the ratio of the reverse phase component and the color is changed according to the ratio of the reverse phase component;
It is characterized by including.
本発明によれば、サラウンド再生のように複数チャンネルで再生される音声の音像を視覚的に表現することができる音像表示装置、音像表示システム、および音像表示方法を提供することができる。 According to the present invention, it is possible to provide a sound image display device, a sound image display system, and a sound image display method that can visually represent a sound image of sound reproduced by a plurality of channels like surround reproduction.
以下、本発明の実施形態について、図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明の実施形態に係る音像表示装置およびシステムの概略構成を説明する機能ブロック図である。 FIG. 1 is a functional block diagram illustrating a schematic configuration of a sound image display apparatus and system according to an embodiment of the present invention.
図1に示すように、本実施形態に係る音像表示装置1は、制御部10、および記憶部20を備えている。制御部10は、複数のチャンネルの音声データが入力されると、当該音声データに対応する描画データを出力する。また、制御部10から出力された描画データは、表示部30に表示することができる。
As shown in FIG. 1, the sound
以下、制御部10および記憶部20を含んで本発明に係る音像表示装置1を構成し、さらに表示部30を含んで本発明に係る音像表示システムを構成するものとして説明する。しかしながら、本発明はこのような実施形態に限定されるものではなく、例えば音像表示装置1が自ら表示部を有するような構成としてもよい。
Hereinafter, description will be made assuming that the sound
制御部10は、例えばプロセッサまたはマイコンなどの任意の処理装置を含んで構成することができる。本実施形態において、制御部10は、各種のデータの入力に基づいて、当該データを解析したり、各種の演算処理を施したりする。制御部10は、このような演算処理の結果を、2次元空間上に描画する描画データとして出力することができる。また、制御部10は、必要に応じて各種の解析結果を記憶部20に記憶させたり、必要に応じて記憶部20に記憶された各種情報を読み出したりすることができる。
The
記憶部20は、任意のメモリ装置を含んで構成することができる。記憶部20は、制御部10が上述したようなデータ解析および各種の演算処理などを行う際のアルゴリズム、およびルックアップテーブル(LUT)のような各種の参照テーブルなども記憶する。
The
表示部30は、例えばLCDまたは有機ELディスプレイなどの任意の表示装置により構成することができる。表示部30は、描画データが入力されると、その表示画面に描画データに基づく表示を行う。この描画データは、表示部30の仕様に応じて、任意の規格のアナログまたはデジタルの出力とすることができる。本実施形態においては、音像を視覚的に把握容易にするような表示を行うため、表示部30はカラー表示可能であることが望ましい。しかしながら、例えばグレースケールなど単色を諧調表示することにより、カラー表示の代用とすることもできる。以下の説明においては、表示部30は、少なくともいくつかの色を用いたカラー表示を行うことができるものとする。
The
本実施形態に係る音像表示装置1は、複数のチャンネルの音声データの入力に基づいて、当該音声データに対応する描画データを出力する。ここで、音像表示装置1が扱う音声データの複数のチャンネル数は特に限定されるものではなく、任意の複数のチャンネルとすることができる。以下の説明においては、例として、一般的に用いられる5.1chサラウンドの場合について述べる。
The sound
すなわち、以下の説明で用いる5.1chの音声データを再生する際には、次のような基本システムを用いて再生することを想定する。
まず、聴く人の位置(リスニングポジション(O))を中心として、リスニングポジションの前方正面の中央にセンタースピーカ(C)を配置する。
次に、前方正面から左30°の位置に左フロントスピーカ(L)を、また前方正面から右30°の位置に右フロントスピーカ(R)を配置する。
さらに、センタースピーカより左110°方向に左サラウンドスピーカ(Ls)を、またセンタースピーカより右110°方向に右サラウンドスピーカ(Rs)を配置する。
これに低音域専用のサブウーファ(LFE)を加える。
That is, it is assumed that 5.1 ch audio data used in the following description is reproduced using the following basic system.
First, the center speaker (C) is arranged in the center of the front front of the listening position with the listener's position (listening position (O)) as the center.
Next, the left front speaker (L) is arranged at a
Further, a left surround speaker (Ls) is arranged in the direction of 110 ° to the left of the center speaker, and a right surround speaker (Rs) is arranged in the direction of 110 ° to the right of the center speaker.
A subwoofer (LFE) dedicated to the low range is added to this.
次に、本実施形態に係る音像表示装置1において、音声データの入力に基づいて、描画データを出力する際の処理について説明する。
Next, in the sound
まず、5.1chの各チャンネルのレベルを検出することにより、各チャンネルのレベルをオーディオレベルバーとして描画する描画データを出力する際の処理について説明する。 First, a process for outputting drawing data for drawing the level of each channel as an audio level bar by detecting the level of each channel of 5.1ch will be described.
図2は、各チャンネルにおける音声のレベル検出処理から座標変換処理までを説明する図である。 FIG. 2 is a diagram for explaining the audio level detection process to the coordinate conversion process in each channel.
図2に示す処理が開始すると、制御部10は、音像表示装置1に入力された音声データに基づいて、当該音声データが再生されるチャンネルの音声のレベルを検出する(ステップS11)。ステップS11においては、制御部10は、入力される音声データのビット深度を24bitの数値として、各チャンネルごとにレベルを検出する。このため、5.1chの音声データにおいては、上述したC,L,R,Ls,Rs,LFEの各スピーカによって再生されるそれぞれのチャンネルについて、図2に示す処理を行う。
When the process shown in FIG. 2 starts, the
ステップS11では、制御部10は、例えば、音声サンプリングレートを48kHzとし、その音声サンプル数(パラメータN)を16384として、以下の式(1)に示すような二乗平均平方根を用いた数値処理を行うものとする。式(1)においては、あるチャンネルの24bitの音声データをxとして示してある。したがって、xiは、パラメータNを総数とする各サンプルにおける24bitの値を表す。制御部10は、このようにしてレベルを検出した結果を、23bitのデータとして出力するものとする。
In step S11, for example, the
ステップS11において各チャンネルにおける音声のレベルが検出されたら、制御部10は、当該レベルをdB値に変換する(ステップS12)。ステップS12においては、制御部10は、例えば以下の式(2)に基づいて、23bitのデータを0.0〜−80.0dBの値に変換することができる。なお、式(2)においては、ステップS11において得られた23bitの値をxとして示してある。
20*log10(x/8388607) (2)
When the audio level in each channel is detected in step S11, the
20 * log 10 (x / 8388607) (2)
ステップS12において音声レベルがdB値に変換されたら、制御部10は、この値をXY平面において各チャンネルに対応する座標に変換する(ステップS13)。本実施形態においては、各チャンネルにおける音声を再生するスピーカが配置される位置と、当該チャンネルにおける音声のレベルとの対応関係を、一見して把握し易いように表示部30に表示する。このため、表示部30に表示されるXY平面と、リスニングポジションをとり囲むスピーカの配置とを対応させる。すなわち、上述したC,L,R,Ls,Rsの各スピーカの配置される位置を、表示部30に表示されるXY平面上の位置に対応させる。この際、例えば、表示部30に表示されるXY平面上の原点Oにリスニングポジションを対応させることができる。
When the sound level is converted into a dB value in step S12, the
このようして、本実施形態においては、各チャンネルにおける音声のレベルが、表示部30においてスピーカが配置される方向を示すそれぞれの軸の長さが表すようにする。このため、ステップS13において、制御部10は、ステップS12において算出されたdB値が、表示部30において対応するスピーカの配置される方向を示す線分の原点からの長さを表すように、線分の終点の座標を算出する。
Thus, in the present embodiment, the audio level in each channel is represented by the length of each axis indicating the direction in which the speaker is arranged in the
図3は、各チャンネルにおける音声のレベル検出処理から座標変換処理までの結果を例示する図である。 FIG. 3 is a diagram illustrating the results from the sound level detection process to the coordinate conversion process in each channel.
図3(A)に示すように、ステップS13において、制御部10は、センタースピーカが再生する音声のレベル(dB値)が線分OCの長さに対応するように、座標Cを求める。
また、図3(B)に示すように、制御部10は、左フロントスピーカが再生する音声のレベルが線分OLの長さに対応するように、座標Lを求める。
また、図3(C)に示すように、制御部10は、右フロントスピーカが再生する音声のレベルが線分ORの長さに対応するように、座標Rを求める。
また、図3(D)に示すように、制御部10は、左サラウンドスピーカが再生する音声のレベルが線分OLsの長さに対応するように、座標Lsを求める。
また、図3(E)に示すように、制御部10は、右サラウンドスピーカが再生する音声のレベルが線分ORsの長さに対応するように、座標Rsを求める。
As shown in FIG. 3A, in step S13, the
Further, as shown in FIG. 3B, the
Further, as shown in FIG. 3C, the
Further, as illustrated in FIG. 3D, the
Further, as shown in FIG. 3E, the
また、低音域専用のサブウーファは無指向性であるため、本実施形態において、サブウーファはが再生する音声のレベルは、表示部30においてリスニングポジションを中心とする円形の大きさによって表すようにする。このため、図3(F)に示すように、ステップS13において、制御部10は、サブウーファが再生する音声のレベルが円形の半径に対応するように、座標LFEを求める。
In addition, since the subwoofer dedicated to the low sound range is omnidirectional, in the present embodiment, the sound level reproduced by the subwoofer is represented by the size of a circle around the listening position on the
このように、ステップS13において各チャンネルに対応する座標データ(LFEの場合は円の半径のデータ)が求まると、制御部10は、各チャンネルのレベルを表す描画データを生成して出力することができる。このようにして出力された描画データに基づいて、表示部30は、各チャンネルのレベルを、各チャンネルの音声を再生するスピーカの方向に対応したオーディオレベルメータとして表示することができる。
Thus, when coordinate data corresponding to each channel (in the case of LFE, circle radius data) is obtained in step S13, the
図4は、各チャンネルにおける音声のレベル検出処理から座標変換処理までの結果を合成した図である。図4においては、上述したC,L,R,Ls,Rs,LFEの各スピーカによって再生されるそれぞれのチャンネルについて図2に示す処理を行った結果を全て合成して示してある。なお、LFEのレベルを表す円形の図形は、その円周のみを表示するようにしてもよいし、円周の内部も含めて円盤全体として表示してもよい。しかしながら、円盤全体として表示する場合、他のチャンネルのレベル表示などが見にくくなるのを防ぐため、例えば半透明の色で他の表示が透過するように表示するのが好適である。このように各チャンネルにおける音声のレベルを表示することにより、各チャンネルにおける音声を再生するスピーカが配置される位置と、当該チャンネルにおける音声のレベルとの対応関係を、一見して容易に把握することができる。このように各チャンネルにおける音声のレベルを表示することで、例えば各チャンネルのピークレベルと当該チャンネルの音声が出力されるスピーカの位置との対応関係を、視覚的に容易に把握することができる。 FIG. 4 is a diagram in which the results from the audio level detection process to the coordinate conversion process in each channel are synthesized. In FIG. 4, the results of performing the processing shown in FIG. 2 for each channel reproduced by each of the above-described C, L, R, Ls, Rs, and LFE speakers are combined and shown. Note that the circular graphic representing the LFE level may be displayed only on the circumference of the circle, or may be displayed as the entire disk including the inside of the circumference. However, when displaying the whole disk, in order to prevent the level display of other channels from being difficult to see, for example, it is preferable to display the other display in a translucent color. By displaying the sound level in each channel in this way, it is possible to easily grasp at a glance the correspondence between the position where the speaker for reproducing the sound in each channel is arranged and the sound level in the channel. Can do. By displaying the audio level in each channel in this way, for example, the correspondence between the peak level of each channel and the position of the speaker from which the audio of that channel is output can be easily grasped visually.
図4に示すような表示を行う際に、あるチャンネルにおける音声のレベルが所定の閾値以上となるような場合、警告を示唆するような色(例えば赤色)に変化させて表示する描画データを出力してもよい。この場合、例えば図4に示す線分および/またはLFEのレベルを示す円形の図形の一部または全部の色を変化させて表示することができる。 When the display as shown in FIG. 4 is performed, if the sound level in a certain channel is equal to or higher than a predetermined threshold, the drawing data to be displayed is changed to a color that suggests a warning (for example, red). May be. In this case, for example, it is possible to change and display the color of a part or all of the circular figure indicating the level of the line segment and / or LFE shown in FIG.
このように、本実施形態では、制御部10は、複数のチャンネルのうち少なくとも1つの音声データに基づいて、当該少なくとも1つのチャンネルにおける音声のレベルを検出し、当該音声のレベルに応じて長さを変化させた線分を描画する描画データを出力する。
As described above, in the present embodiment, the
また、上述のように、制御部10は、複数のチャンネルのうち低域効果音用チャンネルの音声データに基づいて、当該低域効果音用チャンネルにおける音声のレベルを検出し、当該音声のレベルに応じて半径を変化させた円形を描画する描画データを出力する。この場合、制御部10は、低域効果音用チャンネルにおける音声のレベルが所定の閾値以上である時は、当該音声のレベルに応じて変化させた色の前記円形を描画する描画データを出力してもよい。
Further, as described above, the
次に、5.1chのうち2つのチャンネルのレベルを検出することにより、2つのチャンネルにおける音声の相関関係に基づく曲線を描画する描画データを出力する際の処理について説明する。 Next, a process when outputting drawing data for drawing a curve based on the correlation of sound in two channels by detecting the level of two channels in 5.1ch will be described.
図5は、2つのチャンネルにおける音声の相関検出処理から描画データ出力処理までを説明する図である。 FIG. 5 is a diagram for explaining the process from the voice correlation detection process to the drawing data output process in two channels.
以下の説明においては、音声の相関検出処理から描画データ出力処理までを行う2つのチャンネルの音声データを、便宜上、「第1音声データ」および「第2音声データ」と記す。そして、例えば「L−R」のような表記は、図5に示す処理において、第1音声データをチャンネルLの音声データとして、また第2音声データをチャンネルRの音声データとして処理を行うことを意味する。このようにして、L−Rについて図5に示す処理を行うと、これらチャンネルLおよびチャンネルRの2つのチャンネル間における音声の逆相成分の比率に応じた曲線を描画する描画データを出力することができる。 In the following description, the audio data of two channels for performing the audio correlation detection process to the drawing data output process will be referred to as “first audio data” and “second audio data” for convenience. For example, a notation such as “LR” indicates that in the processing shown in FIG. 5, the first audio data is processed as channel L audio data and the second audio data is processed as channel R audio data. means. In this way, when the processing shown in FIG. 5 is performed on LR, drawing data for drawing a curve corresponding to the ratio of the reverse phase component of the sound between the two channels L and R is output. Can do.
図5に示す処理が開始すると、制御部10は、音像表示装置1に入力された音声データに基づいて、複数のチャンネルのうち2つのチャンネルの音声データの相関係数を算出する(ステップS21)。ステップS21においては、ステップS11と同様に、入力される音声データのビット深度を24bitの数値とする。また、ステップS21においては、複数のチャンネルのうち2つのチャンネルの音声データの相関係数を算出する。このため、5.1chの音声データにおいては、L−R,C−L,C−R,L−Ls,R−Rs,Ls−Rsのように、2つのチャンネルについて、それぞれ図5に示す処理を行う。ここで、複数のチャンネルのうち2つのチャンネルとは、スピーカが配置される位置において隣接する2つのチャンネルとするのが好適であるが、例えばCを無視してL−Rの相関を求める場合のように、隣接する2つのチャンネルにはならない場合もある。
When the processing shown in FIG. 5 starts, the
ステップS21では、制御部10は、例えば、パラメータnを2048として、以下の式(3)に示すような相関計算式を用いた数式処理を行うものとする。式(3)においては、第1音声データ(24bit)をxとして示し、第2音声データ(24bit)をyとして示してある。したがって、xi,yiは、それぞれ、パラメータnを総数とする各サンプルにおける24bitの値を表す。制御部10は、このようにして算出した結果を、−1〜+1の範囲の相関係数として出力するものとする。
In step S <b> 21, for example, the
本実施形態において、制御部10が出力する描画データが描画する曲線は2次ベジェ曲線(Bezier Curve)とする。そこで、ステップS21において2つのチャンネルにおける相関係数が算出されたら、制御部10は、以下の式(4)を用いて、当該相関係数から、出力する描画データに基づいて描画される曲線の曲げ係数を算出する(ステップS22)。
128×(相関係数+1)×(補正値) (4)
In the present embodiment, the curve drawn by the drawing data output by the
128 × (correlation coefficient + 1) × (correction value) (4)
ここで、上記(補正値)とは、例えば、L−R,L−C,R−Cの変換においては0.83とし、L−Ls,R−Rsの変換においては0.90とし、Ls−Rsの変換においては0.68とするのが好適である。この補正値を乗じることにより、描画されるベジェ曲線は、ステップS21で算出した相関係数がゼロの時、近似円になる。また、ハードウェアに実装する際に整数化する必要があるため、式(4)に示すように値を128倍して8bit化するのが好適である。このようにして、制御部10は、ステップS22で算出した結果を8bitのデータとして出力する。
Here, the above (correction value) is, for example, 0.83 in the conversion of LR, LC, RC, 0.90 in the conversion of L-Ls, R-Rs, and Ls In the conversion of -Rs, 0.68 is preferable. By multiplying this correction value, the drawn Bezier curve becomes an approximate circle when the correlation coefficient calculated in step S21 is zero. Further, since it is necessary to convert to an integer when mounted on hardware, it is preferable to multiply the value by 128 to 8 bits as shown in Equation (4). In this way, the
ステップS22において曲げ係数が算出されたら、制御部10は、当該曲げ係数ならびに第1および第2音声データの座標に基づいて、ベジェ曲線を生成する(ステップS23)。
When the bending coefficient is calculated in step S22, the
ステップS23においては、制御部10は、3点の座標に基づいて、2次ベジェ曲線を生成する。ここで、2点の座標として、第1音声データおよび第2音声データから算出した座標データを用いる。この2点の座標データは、図2に示した処理に従って、第1音声データおよび第2音声データから求めたそれぞれの座標データを用いることができる。
In step S23, the
本実施形態では、これら2点の座標データの他に、上述した曲げ曲線に基づく1点の制御点を用いて、2次ベジェ曲線を生成する。この制御点をQ(x3,y3)とすると、例えば以下のようにして2次ベジェ曲線を生成することができる。 In the present embodiment, a secondary Bezier curve is generated using one control point based on the above-described bending curve in addition to the coordinate data of these two points. When this control point is Q (x3, y3), for example, a quadratic Bezier curve can be generated as follows.
XY座標平面上に、原点O(0,0)、第1音声データから求めた座標A(x1,y1)、および第2音声データから求めた座標B(x2,y2)を規定する。また、A(x1,y1)とB(x2,y2)との中点をM(Xm,Ym)とし、前述の相関係数(−1〜+1)をkとする。ここで、k=0の時に、Qを制御点として点A,Bを通るベジェ曲線は近似円となり、−1<k<0のときベジェ曲線の曲率が大きくなり、0<k<+1のときベジェ曲線の曲率が小さくなり、k=+1のときベジェ曲線はABを結ぶ線分となる。 On the XY coordinate plane, an origin O (0, 0), coordinates A (x1, y1) obtained from the first audio data, and coordinates B (x2, y2) obtained from the second audio data are defined. Further, the midpoint between A (x1, y1) and B (x2, y2) is M (Xm, Ym), and the correlation coefficient (−1 to +1) is k. Here, when k = 0, the Bezier curve passing through points A and B with Q as the control point is an approximate circle. When −1 <k <0, the curvature of the Bezier curve increases, and when 0 <k <+1. The curvature of the Bezier curve becomes small, and when k = + 1, the Bezier curve is a line segment connecting AB.
制御点Qの座標(x3,y3)は、M(Xm,Ym)を基準にして、以下の式(5)のように求めることができる。ただし、(X*,Y*)は、線分ABに垂直な方向ベクトルを意味する。
(x3,y3)=(Xm,Ym)+k(X*,Y*) (5)
The coordinates (x3, y3) of the control point Q can be obtained as in the following equation (5) with M (Xm, Ym) as a reference. However, (X *, Y *) means a direction vector perpendicular to the line segment AB.
(X3, y3) = (Xm, Ym) + k (X *, Y *) (5)
式(5)においてk=0とき、(X*,Y*)はA,Bによって一意に決定する。なお、k=0のときに描画される近似円の精度は角AOBに依存して変化する。その整合性をとるため、上述した式(4)においては相関係数に補正値を乗じる。 In equation (5), when k = 0, (X *, Y *) is uniquely determined by A and B. Note that the accuracy of the approximate circle drawn when k = 0 changes depending on the angle AOB. In order to maintain this consistency, the correlation coefficient is multiplied by the correction value in the above-described equation (4).
ステップS23においては、以上のようにして、A(x1,y1)、B(x2,y2)、およびQ(x3,y3)の3点の座標が算出されたら、制御部10は、これら3点に基づく2次ベジェ曲線を生成する。この場合、ベジェ曲線の定義に基づいて点と点を結ぶ曲線を生成する。具体的には、値t=0〜1(tは1/1024ステップ)として、以下の式(6)および式(7)を用いて、ベジェ曲線を生成する。
x=x(t)=t^2*x2+2*t*(1−t)*x3+(1−t)^2*x1 (6)
y=y(t)=t^2*y2+2*t*(1−t)*y3+(1−t)^2*x1 (7)
In step S23, when the coordinates of the three points A (x1, y1), B (x2, y2), and Q (x3, y3) are calculated as described above, the
x = x (t) = t ^ 2 * x2 + 2 * t * (1-t) * x3 + (1-t) ^ 2 * x1 (6)
y = y (t) = t ^ 2 * y2 + 2 * t * (1-t) * y3 + (1-t) ^ 2 * x1 (7)
ステップ23においてベジェ曲線が生成されたら、制御部10は、生成された曲線をXY平面上に表示する描画データを生成して(ステップS24)出力する。ここで、生成された曲線をカラー表示するために、色データとともに描画データを生成して出力することになるが、曲線の着色については後述する。
When the Bezier curve is generated in
図6は、2つのチャンネルにおける音声の相関検出から描画データ出力までの結果を例示する図である。 FIG. 6 is a diagram exemplifying the results from the correlation detection of voice in two channels to the output of drawing data.
図6(A)に示すように、ステップS23において、制御部10は、L−Rの2つのチャンネルについてベジェ曲線LRを生成する。
また、図6(B)に示すように、制御部10は、C−Lの2つのチャンネルについてベジェ曲線CLを生成する。
また、図6(C)に示すように、制御部10は、C−Rの2つのチャンネルについてベジェ曲線CRを生成する。
また、図6(D)に示すように、制御部10は、L−Lsの2つのチャンネルについてベジェ曲線LLsを生成する。
また、図6(E)に示すように、制御部10は、R−Rsの2つのチャンネルについてベジェ曲線RRsを生成する。
また、図6(F)に示すように、制御部10は、Ls−Rsの2つのチャンネルについてベジェ曲線LsRsを生成する。
As shown in FIG. 6A, in step S23, the
Further, as illustrated in FIG. 6B, the
Further, as illustrated in FIG. 6C, the
Further, as illustrated in FIG. 6D, the
Further, as illustrated in FIG. 6E, the
Further, as illustrated in FIG. 6F, the
図7は、2つのチャンネルにおける音声の相関検出から描画データ出力までの結果を合成した図である。図7においては、図6に示したようにL−R,C−L,C−R,L−Ls,R−Rs,Ls−Rsのそれぞれ2つのチャンネルについて描画したベジェ曲線を全て合成して示してある。 FIG. 7 is a diagram in which results from audio correlation detection to drawing data output in two channels are combined. In FIG. 7, as shown in FIG. 6, all the Bezier curves drawn for each of two channels LR, CL, CR, L-Ls, R-Rs, and Ls-Rs are synthesized. It is shown.
図7において、曲線αは、C−L,C−R,L−Ls,R−Rs,Ls−Rsのそれぞれ2つのチャンネルについて描画したベジェ曲線を全て合成して示してある。また、曲線βは、曲線αにおけるC−LおよびC−Rの代わりに、L−Rを用いて描画したベジェ曲線を全て合成したものである。例えば音楽を再生する際など、Cを含めて音像を表示する場合、C−LおよびC−Rを主として監視を行うため、曲線αのようなベジェ曲線を表示するのが好適である。一方、例えばドラマにて再生される音声などのように、Cには主としてセリフのみが含まれているような場合、Cを考慮せずに、L−Rを主として監視できるようにするため、曲線βのようなベジェ曲線を表示するのが好適である。 In FIG. 7, a curve α is shown by synthesizing all Bezier curves drawn for two channels of CL, CR, L-Ls, R-Rs, and Ls-Rs. The curve β is a combination of all Bezier curves drawn using LR instead of CL and CR in the curve α. For example, when displaying a sound image including C, such as when playing music, it is preferable to display a Bezier curve such as curve α in order to mainly monitor CL and CR. On the other hand, in the case where C mainly includes only words, such as voice played in a drama, for example, a curve is used so that LR can be mainly monitored without considering C. It is preferable to display a Bezier curve such as β.
図7に示すように、曲線αと曲線βとを同時に表示すると紛らわしくなることが懸念されるため、制御部10は、曲線αまたは曲線βのいずれかを選択的に表示可能とする描画データを出力するのが好適である。また、制御部10は、曲線αおよび曲線βを同時に表示する場合には、互いに曲線の太さ、色、線種、表示態様などを変化させることにより、互いに識別可能にして描画データを出力するのが好適である。
As shown in FIG. 7, since it is feared that the display of the curve α and the curve β at the same time is confusing, the
このように、本実施形態において、制御部10は、複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出する。そして、制御部10は、当該逆相成分の比率に応じて曲率を変化させた曲線を描画する描画データを出力する。また、上述したように、制御部10は、前記2つのチャンネルの音声データに基づいて、当該2つのチャンネルそれぞれにおける音声のレベルを検出する。そして、制御部10は、当該音声のレベルおよび前記逆相成分の比率に応じて曲率を変化させた前記曲線を描画する描画データを出力するのが好適である。この場合、制御部10は、当該2つのチャンネルそれぞれにおける音声レベルを表す線分の長さに対応する2つの座標を両端の点とし、前記逆相成分の比率に対応する座標を制御点とする2次ベジェ曲線を描画する描画データを出力する。
As described above, in the present embodiment, the
次に、本実施形態に係る音像表示装置1が生成する曲線の着色について説明する。
Next, coloring of a curve generated by the sound
図8は、本実施形態に係る音像表示装置1が行う色データ変換処理を説明する図である。本実施形態においては、図6に示したような各部のベジェ曲線には、それぞれの相関係数に応じた色データを付した状態で、制御部10から出力するのが好適である。以下、このように、ベジェ曲線に色データを付加する処理を説明する。
FIG. 8 is a diagram for explaining color data conversion processing performed by the sound
図5において説明したように、制御部10は、ステップ21において2つのチャンネルにおける音声の相関係数を算出した。本実施形態において、制御部10は、このように算出された相関係数に基づいて色データを生成して(ステップS25)、ステップS23において生成された曲線を、ステップS24において着色した描画データを生成して出力する。
As described with reference to FIG. 5, the
図5のステップ21において説明したように、制御部10は、−1〜+1の範囲の相関係数を算出する。そこで、制御部10は、当該相関係数に基づいて、図8(A)に示すような色のデータを生成する(ステップS25)。このようにステップS25において相関係数に基づいて色データが生成されると、ステップS23で生成された曲線は、当該色データに基づく着色が施されることになる。
As described in
図8(A)に示す範囲<A>のように、相関係数が−1付近となるとき、チャンネル間は完全な逆相に近くなる。この場合、制御部10は、警告を示唆するような例えば赤色の色データを生成する。実際の音声の再生においては、チャンネル間が完全な逆相になることは想定し難いため、相関係数が−1に極近くなる範囲で曲線を赤色にするのが好適である。
As shown in the range <A> shown in FIG. 8A, when the correlation coefficient is in the vicinity of −1, the channels are nearly in reverse phase. In this case, the
また、図8(A)に示す範囲<D>のように、相関係数が+1付近となるとき、チャンネル間は完全な同相に近くなる。この場合、音の広がりがない状態を意味することになるが、音声表現によっては意図的にこのような音声の再生状態が望まれることもある。このため、相関係数が+1付近である範囲<D>においては、制御部10は、注意を促すために例えば青色の色データを生成する。また、この場合、範囲<D>は、上述した範囲<A>よりは若干広い範囲とするのが好適である。
Also, as shown in the range <D> shown in FIG. 8A, when the correlation coefficient is near +1, the channels are nearly in phase. In this case, it means a state where there is no spread of sound, but depending on the speech expression, such a sound reproduction state may be intentionally desired. For this reason, in the range <D> where the correlation coefficient is near +1, the
また、図8(A)に示す範囲<C>のように、相関係数が0付近から+1付近までとなるとき、チャンネル間の逆相成分の比率は適度になる。したがって、この場合、制御部10は、他の表示と特に区別のない標準的な色の色データを生成する。ここで、標準的な色とは、例えば黒色の画面においては白色とするなど、他の表示に比べて特に強調されることのないような色とするのが好適である。
Further, as shown in the range <C> shown in FIG. 8A, when the correlation coefficient is from near 0 to
また、図8(A)に示す範囲<B>のように、相関係数が−1付近から0付近までとなるとき、チャンネル間の逆相成分の比率は比較的高めになる。したがって、この場合、制御部10は、注意喚起のために、他の表示とは区別可能な色の色データを生成する。
Further, as in the range <B> shown in FIG. 8A, when the correlation coefficient is from about −1 to about 0, the ratio of the reverse phase components between the channels is relatively high. Therefore, in this case, the
範囲<B>においては、チャンネル間の逆相成分の比率および当該比率の変化を容易に視覚的に認識できるようにするため、制御部10は、0付近から−1付近までの相関係数の値に応じて異なる色の色データを生成する。すなわち、本実施形態において、制御部10は、相関係数が0付近から−1付近まで変化するにつれて青および赤の成分を減少させて、黄色がかった色から徐々に緑色に変化するような色データを出力する。したがって、本実施形態に係る音像表示装置1によれば、チャンネル間の逆相成分の比率および当該比率の変化を容易に視覚的に認識することを可能にする。図8(A)においては、相関係数が0付近から−1付近まで変化するにつれて出力される色データが徐々に黄色がかった色から徐々に緑色になる様子を概略的に表している。
In the range <B>, in order to make it easy to visually recognize the ratio of the antiphase component between the channels and the change in the ratio, the
また、このように相関係数が変化するにつれて出力される色データを徐々に変化させる際、当該色の変化をリニアな変化としてしまうと人間の感覚にそぐわないものとなる。したがって、本実施形態では、制御部10は、後述のように、ガンマカーブを変えることにより当該色の変化を調整する。
Further, when the color data to be output is gradually changed as the correlation coefficient changes in this way, if the color change is a linear change, it is not suitable for human senses. Therefore, in the present embodiment, the
以上のように相関係数から生成すべき色データを算出するには、以下のように規定したLUTを用いることができる。以下、相関係数から生成すべき色データを算出するためのLUTについて説明する。まず、以下のように規定する。
(1)相関係数=−1.0のとき、R(赤)100%、G(緑)0%、B(青)0%で固定する。
(2)相関係数=−0.9〜0のとき、G(緑)100%で固定する。
(3)相関係数=0〜1.0のとき、B(青)100%で固定する。
In order to calculate the color data to be generated from the correlation coefficient as described above, an LUT defined as follows can be used. Hereinafter, an LUT for calculating color data to be generated from the correlation coefficient will be described. First, it is defined as follows.
(1) When correlation coefficient = −1.0, R (red) is fixed at 100%, G (green) is 0%, and B (blue) is 0%.
(2) When correlation coefficient = −0.9 to 0, G (green) is fixed at 100%.
(3) When correlation coefficient = 0 to 1.0, B (blue) is fixed at 100%.
次に、以下のような各値を用意する。すなわち、
(1)閾値Gpは、相関係数=0〜1.0(0.1ステップ)のどこから緑色を減色させるかを設定する(本例では設定値=0.9とする)。
(2)閾値Rpは、相関係数=0〜1.0(0.1ステップ)のどこから赤色を減色させるかを設定する(本例では設定値=0.9とする)。
(3)設定値Gγpは、上記緑色のガンマカーブ(0.05ステップ)を設定する(本例では設定値=3.00とする)。
(4)設定値Rγpは、上記赤色のガンマカーブ(0.05ステップ)を設定する(本例では設定値=3.00とする)。
(5)閾値Bnは、相関係数=0〜−0.9(0.1ステップ)のどこから青色を減色させるかを設定する(本例では設定値=0.0とする)。
(6)閾値Rnは、相関係数=0〜−0.9(0.1ステップ)のどこから赤色を減色させるかを設定する。(本例では設定値=0.0とする)。
(7)設定値Bγnは、上記青色のガンマカーブ(0.05ステップ)を設定する(本例では設定値=0.10とする)。
(8)設定値Rγnは、上記赤色のガンマカーブ(0.05ステップ)を設定する(本例では設定値=1.00とする)。
Next, the following values are prepared. That is,
(1) The threshold Gp is set from where the correlation coefficient = 0 to 1.0 (0.1 step) from which the green color is reduced (in this example, the setting value = 0.9).
(2) The threshold value Rp is set from where the correlation coefficient = 0 to 1.0 (0.1 step) to reduce the red color (in this example, set value = 0.9).
(3) The set value Gγp sets the green gamma curve (0.05 step) (set value = 3.00 in this example).
(4) As the set value Rγp, the red gamma curve (0.05 step) is set (in this example, set value = 3.00).
(5) The threshold value Bn is set from where correlation coefficient = 0 to −0.9 (0.1 step) from which blue is to be reduced (in this example, set value = 0.0).
(6) The threshold value Rn is set from where correlation coefficient = 0 to −0.9 (0.1 step) from which red is reduced. (In this example, set value = 0.0).
(7) The set value Bγn sets the blue gamma curve (0.05 step) (set value = 0.10 in this example).
(8) As the set value Rγn, the red gamma curve (0.05 step) is set (in this example, the set value = 1.00).
次に、上述のような規定に基づいて緑色(G)を算出する方法の例を説明する。
(1)相関係数=−1.0〜−0.9のとき、
G=255×((1+相関係数)/(1−0.9))とする。
(2)相関係数=−0.9〜閾値Gp(本例では0.9)のとき、
G=255とする。
(3)相関係数=閾値Gp(本例では0.9)〜1.0、かつ、閾値Gp(本例では0.9)<1.0のとき、
G=255×(設定値Gγp(本例では3.00)を指数として(1−相関係数)/(1−閾値Gp(本例では0.9))を基数とした累乗)とする。
Next, an example of a method for calculating green (G) based on the above-described rules will be described.
(1) When the correlation coefficient is −1.0 to −0.9,
G = 255 × ((1 + correlation coefficient) / (1−0.9)).
(2) When correlation coefficient = −0.9 to threshold Gp (0.9 in this example),
Let G = 255.
(3) When correlation coefficient = threshold Gp (0.9 in this example) to 1.0 and threshold Gp (0.9 in this example) <1.0,
G = 255 × (the set value Gγp (3.00 in this example) is an exponent and (1−correlation coefficient) / (1−threshold Gp (0.9 in this example)) is a power of the base).
次に、上述のような規定に基づいて青色(B)を算出する方法の例を説明する。
(1)相関係数=−1.0のとき、
B=0とする。
(2)相関係数=−0.9〜閾値Bn(本例では0.0)、かつ、閾値Bn(本例では0.0)>−0.9のとき、
B=255×(設定値Bγn(本例では0.10)を指数として(1+相関係数)/(1+閾値Bn(本例では0.0))を基数とした累乗)とする。
(3)相関係数=閾値Bn(本例では0.0)〜1.0のとき、
B=255とする。
Next, an example of a method for calculating blue (B) based on the above-described rules will be described.
(1) When the correlation coefficient = −1.0,
Let B = 0.
(2) When correlation coefficient = −0.9 to threshold value Bn (0.0 in this example) and threshold value Bn (0.0 in this example)> − 0.9,
B = 255 × (the set value Bγn (0.10 in this example) is an exponent and (1 + correlation coefficient) / (1 + threshold Bn (0.0 in this example)) is a power of the base).
(3) When correlation coefficient = threshold value Bn (0.0 in this example) to 1.0,
Let B = 255.
次に、上述のような規定に基づいて赤色(R)を算出する方法の例を説明する。
(1)相関係数=−1.0〜−0.9のとき、
R=255−255×((1+相関係数)/(1−0.9))とする。
(2)相関係数=−0.9〜閾値Rn(本例では0.0)、かつ、閾値Rn(本例では0.0)>−0.9のとき、
R=255×(設定値Rγn(本例で1.00)を指数として(1+相関係数)/(1+閾値Rn(本例では0.0))を基数とした累乗)とする。
(3)相関係数=閾値Rn(本例では0.0)〜閾値Rp(本例では0.9)のとき、
R=255とする。
(4)相関係数=閾値Rn(本例では0.0)〜1.0、かつ、閾値Rn(本例では0.0)<1.0のとき、
R=255×(設定値Rγp(本例では3.00)を指数として(1−相関係数)/(1−閾値Rp(本例では0.9))を基数とした累乗)とする。
Next, an example of a method for calculating red (R) based on the above-described rules will be described.
(1) When the correlation coefficient is −1.0 to −0.9,
R = 255-255 × ((1 + correlation coefficient) / (1-0.9)).
(2) When correlation coefficient = −0.9 to threshold value Rn (0.0 in this example) and threshold value Rn (0.0 in this example)> − 0.9,
R = 255 × (the set value Rγn (1.00 in this example) is an exponent and (1 + correlation coefficient) / (1 + threshold Rn (0.0 in this example)) is a power of the base).
(3) When correlation coefficient = threshold value Rn (0.0 in this example) to threshold value Rp (0.9 in this example),
Let R = 255.
(4) When correlation coefficient = threshold value Rn (0.0 in this example) to 1.0 and threshold value Rn (0.0 in this example) <1.0,
R = 255 × (set value Rγp (3.00 in this example) is an exponent, and (1−correlation coefficient) / (1−threshold Rp (0.9 in this example)) is a power of the base).
以上説明したようなLUTに従うことにより、制御部10は、図5のステップS25において、例えばRGB24bitの色データを生成して出力することができる。
By following the LUT as described above, the
図8(B)は、上述のようなLUTに従って、相関係数と当該相関係数に基づいて出力される色データの緑色(G)成分との対応を示した図である。また、図8(C)は、上述のようなLUTに従って、相関係数と当該相関係数に基づいて出力される色データの青色(B)成分との対応を示した図である。また、図8(D)は、上述のようなLUTに従って、相関係数と当該相関係数に基づいて出力される色データの赤色(R)成分との対応を示した図である。 FIG. 8B is a diagram showing the correspondence between the correlation coefficient and the green (G) component of the color data output based on the correlation coefficient in accordance with the LUT as described above. FIG. 8C is a diagram showing the correspondence between the correlation coefficient and the blue (B) component of the color data output based on the correlation coefficient in accordance with the LUT as described above. FIG. 8D is a diagram showing the correspondence between the correlation coefficient and the red (R) component of the color data output based on the correlation coefficient in accordance with the LUT as described above.
図9は、2つのチャンネルにおける音声の相関検出および色データ生成に基づく描画の結果を例示する図である。 FIG. 9 is a diagram exemplifying a drawing result based on audio correlation detection and color data generation in two channels.
図5において説明したように、制御部10は、ステップS23において2つのチャンネルについてベジェ曲線を生成した(図6参照)。また、図5において説明したように、制御部10は、ステップS25において当該2つのチャンネルについてベジェ曲線の色データを生成した(図8参照)。このように、図5におけるステップS23およびステップS25に示した処理の結果、制御部10は、図9に示すような曲率および色のベジェ曲線の描画データを生成して(ステップS24)出力する。
As described in FIG. 5, the
図9は、図6(C)に示したようにC−Rの2つのチャンネルについて生成したベジェ曲線CRの曲率および色を変更した例をいくつか示したものである。 FIG. 9 shows some examples in which the curvature and color of the Bezier curve CR generated for the two channels CR are changed as shown in FIG.
図9(A)は、図8(A)に示した相関係数が範囲<A>のときに生成されるベジェ曲線CRの曲率および色を示している。図9(A)に示すように、相関係数が範囲<A>のときには、通常の場合とは異なる色のベジェ曲線が生成されることになり、ユーザに警告を示唆することができる。 FIG. 9A shows the curvature and color of the Bezier curve CR generated when the correlation coefficient shown in FIG. 8A is in the range <A>. As shown in FIG. 9A, when the correlation coefficient is in the range <A>, a Bezier curve having a color different from the normal case is generated, and a warning can be suggested to the user.
図9(B)は、図8(A)に示した相関係数が範囲<B>のときに生成されるベジェ曲線CRの曲率および色を示している。図9(B)に示すように、相関係数が範囲<B>のときには、2つのチャンネルの逆相成分の比率に対応する音の広がりのイメージに合わせて曲率が変化したベジェ曲線が生成される。また、相関係数が範囲<B>のときには、相関係数に応じて徐々に変化する色のベジェ曲線が生成されることになり、ユーザに注意を促すことができる。 FIG. 9B shows the curvature and color of the Bezier curve CR generated when the correlation coefficient shown in FIG. 8A is in the range <B>. As shown in FIG. 9B, when the correlation coefficient is in the range <B>, a Bezier curve having a curvature that changes in accordance with the sound spread image corresponding to the ratio of the antiphase components of the two channels is generated. The When the correlation coefficient is in the range <B>, a Bezier curve of a color that gradually changes according to the correlation coefficient is generated, and the user can be alerted.
図9(C)は、図8(A)に示した相関係数が範囲<C>のときに生成されるベジェ曲線CRの曲率および色を示している。図9(C)に示すように、相関係数が範囲<C>のときにも、2つのチャンネルの逆相成分の比率に対応する音の広がりのイメージに合わせて曲率が変化したベジェ曲線が生成される。また、相関係数が範囲<C>のときには、逆相成分の比率は適度であるため、他の表示と比べて格別目立つことのない色のベジェ曲線が生成されることになり、あえてユーザに注意を促さないようにできる。 FIG. 9C shows the curvature and color of the Bezier curve CR generated when the correlation coefficient shown in FIG. 8A is in the range <C>. As shown in FIG. 9C, even when the correlation coefficient is in the range <C>, a Bezier curve whose curvature changes in accordance with the sound spread image corresponding to the ratio of the antiphase components of the two channels is obtained. Generated. In addition, when the correlation coefficient is in the range <C>, the ratio of the antiphase component is appropriate, so that a Bezier curve of a color that is not particularly conspicuous compared to other displays is generated, and the user dares to You can avoid caution.
図9(D)は、図8(A)に示した相関係数が範囲<D>のときに生成されるベジェ曲線CRの曲率および色を示している。図9(D)に示すように、相関係数が範囲<D>のときには2つのチャンネルがほぼ完全に同相に近くなるため、この場合も通常の場合とは異なる曲率(直線に近い)および色のベジェ曲線が生成されることになり、ユーザに注意を促すことができる。 FIG. 9D shows the curvature and color of the Bezier curve CR generated when the correlation coefficient shown in FIG. 8A is in the range <D>. As shown in FIG. 9D, since the two channels are almost completely in phase when the correlation coefficient is in the range <D>, the curvature (close to a straight line) and the color are different from those in the normal case. The Bezier curve is generated, and the user can be alerted.
このように、本実施形態において、制御部10は、複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出する。そして、制御部10は、当該逆相成分の比率に応じた色の曲線を描画する描画データを出力する。
As described above, in the present embodiment, the
また、制御部10は、2つのチャンネル間における音声の逆相成分の比率が第1の閾値以上である時は、警告を示唆する例えば赤などの所定の色の前記曲線を描画する描画データを出力する。また、制御部10は、2つのチャンネル間における音声の逆相成分の比率が第2の閾値以下である時は、例えば青などの所定の色の前記曲線を描画する描画データを出力する。また、制御部10は、2つのチャンネル間における音声の逆相成分の比率が、完全に同相と完全に逆相との間における第1の範囲内にある時は、例えば白などの所定の色の前記曲線を描画する描画データを出力する。また、制御部10は、2つのチャンネル間における音声の逆相成分の比率が、完全に同相と完全に逆相との間における第2の範囲内にある時は、逆相成分の比率に応じて例えば黄色から緑色など所定の色の間で徐々に変化する色の前記曲線を描画する描画データを出力する。
In addition, when the ratio of the reverse phase component of the sound between the two channels is equal to or higher than the first threshold, the
図9においては、C−Rの2つのチャンネルについてのみ、曲率および色を設定したベジェ曲線CRを生成したが、本実施形態においては、制御部10は、同様の処理を、他の2つのチャンネルL−R,C−L,L−Ls,R−Rs,Ls−Rsについても行う。このようにして、上述した2つのチャンネルそれぞれについて曲率および色が設定されたベジェ曲線が生成されると、図10に示すような描画を行う描画データが出力される。
In FIG. 9, the Bezier curve CR in which the curvature and color are set is generated only for the two channels of CR, but in this embodiment, the
図10は、2つのチャンネルにおける音声の相関検出および色データ生成に基づく描画の結果を合成した図である。すなわち、図10は、本実施形態に係る音像表示装置1による処理を行うことにより、図4、図6、図9に示した結果を全て合成した状態を示す図である。本実施形態に係る音像表示装置1は、上述した処理の一部のみの結果を表示部30に表示してもよいが、音像など音響に係る種々の情報を一度に把握できるよう、図10に示すように、上述した処理の全ての結果を同時に表示するのが好適である。
FIG. 10 is a diagram in which the drawing results based on the correlation detection and color data generation of the audio in the two channels are combined. That is, FIG. 10 is a diagram illustrating a state in which all the results illustrated in FIGS. 4, 6, and 9 are synthesized by performing processing by the sound
図10において、Oはリスニングポジションを表す。また、Cはセンタースピーカの位置を表し、Lは左フロントスピーカの位置を表し、Rは右フロントスピーカの位置を表し、Lsは左サラウンドスピーカの位置を表し、Rsは右サラウンドスピーカの位置を表す。これらの位置は、予め理想的な位置を規定して、固定された表示とするのが好適である。 In FIG. 10, O represents the listening position. C represents the position of the center speaker, L represents the position of the left front speaker, R represents the position of the right front speaker, Ls represents the position of the left surround speaker, and Rs represents the position of the right surround speaker. . These positions are preferably defined in advance by defining ideal positions.
以下、図10において、各符号が表す意味を記す。
Lv(C):センタースピーカCから再生される音声のレベル
Lv(L):左フロントスピーカLから再生される音声のレベル
Lv(R):右フロントスピーカRから再生される音声のレベル
Lv(Ls):左サラウンドスピーカLsから再生される音声のレベル
Lv(Rs):右サラウンドスピーカRsから再生される音声のレベル
Lv(LFE):サブウーファから再生される音声のレベル
B(LR):左フロントスピーカLから再生される音声および右フロントスピーカRから再生される音声に基づくベジェ曲線(センタースピーカCから再生される音声は無視)
B(LC):左フロントスピーカLから再生される音声およびセンタースピーカCから再生される音声に基づくベジェ曲線
B(CR):センタースピーカCから再生される音声および右フロントスピーカRから再生される音声に基づくベジェ曲線
B(LLs):左フロントスピーカLから再生される音声および左サラウンドスピーカLsから再生される音声に基づくベジェ曲線
B(RRs):右フロントスピーカRから再生される音声および右サラウンドスピーカRsから再生される音声に基づくベジェ曲線
B(LsRs):左サラウンドスピーカLsから再生される音声および右サラウンドスピーカRsから再生される音声に基づくベジェ曲線
Hereinafter, in FIG. 10, the meanings represented by the respective symbols are described.
Lv (C): level of sound reproduced from the center speaker C Lv (L): level of sound reproduced from the left front speaker L Lv (R): level of sound reproduced from the right front speaker R Lv (Ls ): Level of sound reproduced from the left surround speaker Ls Lv (Rs): level of sound reproduced from the right surround speaker Rs Lv (LFE): level of sound reproduced from the subwoofer B (LR): left front speaker Bezier curve based on the sound reproduced from L and the sound reproduced from the right front speaker R (the sound reproduced from the center speaker C is ignored)
B (LC): Bezier curve based on the sound reproduced from the left front speaker L and the sound reproduced from the center speaker C B (CR): The sound reproduced from the center speaker C and the sound reproduced from the right front speaker R Bezier curve B (LLs): Bezier curve based on audio reproduced from the left front speaker L and audio reproduced from the left surround speaker Ls B (RRs): Audio reproduced from the right front speaker R and right surround speaker Bezier curve based on sound reproduced from Rs B (LsRs): Bezier curve based on sound reproduced from left surround speaker Ls and sound reproduced from right surround speaker Rs
図10に示すLFEは、図3(F)で説明したように無指向性であるため、点0を中心としてレベルに応じて半径を増大させた円形として、例えば半透明にして表示する。この場合、通常の番組における音声としては大き過ぎると思われるレベルから徐々にLFEの表示を色変化させることにより、観測者に注意喚起することができる。また、このようにLFEのレベルが変化するにつれて出力される色データを徐々に変化させる際、当該色の変化をリニアな変化としてしまうと人間の感覚にそぐわないものとなる。したがって、本実施形態では、制御部10は、上述したように、ガンマカーブを変えることにより当該色の変化を調整するのが好適である。
Since the LFE shown in FIG. 10 is non-directional as described with reference to FIG. 3F, the LFE is displayed as a circle having a radius increased according to the level around the
このようにして、本実施形態において、LFE信号についても同時に監視できるようにしてもよい。LFEを大音量で再生するとウーファーが歪んで不具合の原因になり得るため、通常LFE信号は小さいレベルで運用されることが多い。したがって、LFEのレベルが大きくなり過ぎる場合は、赤系の色に変化させて注意喚起を促すのが好適である。 In this manner, in the present embodiment, the LFE signal may be monitored simultaneously. When the LFE is played back at a high volume, the woofer may be distorted and cause a problem, so that the LFE signal is usually operated at a low level in many cases. Therefore, when the LFE level becomes too high, it is preferable to change the color to a red color to prompt attention.
本発明によれば、複数のスピーカの配置を模した二次元空間上に、ベジェ曲線を用いて音像を表現することができる。本発明においては、このベジェ曲線による図形の大きさが音声全体の大きさを表し、ベジェ曲線による図形の形状が音像の定位感を表す。 According to the present invention, a sound image can be expressed using a Bezier curve on a two-dimensional space simulating the arrangement of a plurality of speakers. In the present invention, the size of the figure by the Bezier curve represents the size of the entire voice, and the shape of the figure by the Bezier curve represents the sense of localization of the sound image.
以上説明したように、本発明によれば、音声をサラウンド再生する際の多種多様な情報を収集する際に、複雑な構成の機器類は必要なくなる。また、このような情報は、本発明によれば、音声の再生に伴って、リアルタイムで動的に監視することができる。さらに、本発明によれば、このような多種多様な情報を集約するのみならず、視覚に訴える表現により一画面で直感的に把握することができ、極めて利便性が高い。 As described above, according to the present invention, devices having a complicated configuration are not necessary when collecting a wide variety of information when surround sound is reproduced. Further, according to the present invention, such information can be dynamically monitored in real time as the audio is reproduced. Furthermore, according to the present invention, not only such a wide variety of information can be aggregated, but also intuitively grasped on a single screen using expressions that appeal to the eye, which is extremely convenient.
以下、本発明による効果について、さらに述べる。 Hereinafter, the effects of the present invention will be further described.
本発明によれば、リスニングポジションから各スピーカ配置に向かって各チャンネルのオーディオレベルバーが配置されるため、このレベルバーの振れによって各チャンネルのレベル管理を行うことが可能になる。また、本発明によれば、例えば隣接するような2つのチャンネル間における音声の逆相成分の比率を、ベジェ曲線の曲率および色変化で表現し、各チャンネルのレベル、音像の確認と同時に、位相監視も行うことが可能になる。音響効果として音声にある程度の広がり感を持たせるには逆相成分が必要である。本発明によれば、適正なバランスのサラウンド信号が入力されれば、ベジェ曲線は全体としてほぼ正円のように表示されるため、サラウンド信号全体の適正なバランスをひと目で感覚的に把握することができる。 According to the present invention, since the audio level bar of each channel is arranged from the listening position toward each speaker arrangement, the level management of each channel can be performed by the swing of the level bar. Further, according to the present invention, for example, the ratio of the anti-phase component of audio between two adjacent channels is expressed by the curvature and color change of the Bezier curve, and simultaneously with the confirmation of the level and sound image of each channel, the phase Monitoring can also be performed. As an acoustic effect, a reverse phase component is required to give the sound a certain degree of spread. According to the present invention, if a surround signal with an appropriate balance is input, the Bezier curve is displayed as a substantially circular circle as a whole, so that the appropriate balance of the entire surround signal can be grasped at a glance. Can do.
また、本発明によれば、逆相の成分が多くなるにつれて、ベジェ曲線の曲率が高くなるとともに色が変化する。この場合、逆相成分が適正レベルでなくなるまで徐々に色が変化するだけであるが、逆相成分が異常なレベルになると赤い色に変わるため、警告の通知であることを容易に認識することができる。さらに、システムチェックでOSCなどの基準信号によりレベル合わせをする際は、逆相成分がゼロになるはずなので、ベジェ曲線は直線で青色になる。したがって、正しくシステムが構築できたかどうかの判断を容易に下すことができる。 Further, according to the present invention, the curvature of the Bezier curve increases and the color changes as the anti-phase components increase. In this case, the color changes only gradually until the anti-phase component is not at an appropriate level, but when the anti-phase component becomes an abnormal level, it changes to a red color, so it is easy to recognize that it is a warning notification. Can do. Furthermore, when level adjustment is performed using a reference signal such as OSC in the system check, the anti-phase component should be zero, so the Bezier curve is straight and blue. Therefore, it can be easily determined whether the system has been correctly constructed.
本発明を諸図面および実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。したがって、これらの変形および修正は本発明の範囲に含まれることに留意されたい。例えば、各機能部、各手段、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の機能部やステップなどを1つに組み合わせたり、あるいは分割したりすることが可能である。また、上述した本発明の実施形態は、それぞれ説明した実施形態に忠実に実施することに限定されるものではなく、適宜、各特徴を組み合わせて実施することもできる。 Although the present invention has been described based on the drawings and examples, it should be noted that those skilled in the art can easily make various changes and modifications based on the present disclosure. Therefore, it should be noted that these variations and modifications are included in the scope of the present invention. For example, the functions included in each functional unit, each means, each step, etc. can be rearranged so that there is no logical contradiction, and a plurality of functional units, steps, etc. are combined or divided into one. It is possible. Further, the above-described embodiments of the present invention are not limited to being performed faithfully to the respective embodiments described above, and can be implemented by appropriately combining the features.
上述した実施形態は、音像表示装置1および音像表示システムの発明として説明した。この場合、本発明による音像表示システムは、上述したような種々の制御を行う制御部10と、制御部10により出力された描画データに基づく曲線を表示する表示部20と、を備えることを特徴とする。
The embodiment described above has been described as the invention of the sound
また、本発明は、音像表示装置1または音像表示システムにおける音像表示方法とすることもできる。この場合、本発明による音像表示方法は、複数のチャンネルのうち2つのチャンネルの音声データに基づいて、当該2つのチャンネル間における音声の逆相成分の比率を算出するステップと、前記逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じて変化させた色の曲線を描画する描画データを出力するステップと、を含むことを特徴とする。
The present invention can also be a sound image display method in the sound
1 音像表示装置
10 制御部
20 記憶部
30 表示部
DESCRIPTION OF
Claims (8)
前記制御部により出力された描画データに基づく曲線を表示する表示部と、
を備える、音像表示システム。 Based on the audio data of two channels among a plurality of channels, a curve is obtained by calculating the ratio of the reverse phase component of the sound between the two channels and changing the curvature according to the ratio of the negative phase component. A control unit that outputs drawing data for drawing a color curve according to the ratio of the reversed-phase component;
A display unit for displaying a curve based on the drawing data output by the control unit;
A sound image display system comprising:
前記逆相成分の比率に応じて曲率を変化させた曲線であって当該逆相成分の比率に応じて変化させた色の曲線を描画する描画データを出力するステップと、
を含む、音像表示装置の音像表示方法。
Calculating the ratio of the reverse phase component of the sound between the two channels based on the sound data of two channels of the plurality of channels;
A step of outputting drawing data for drawing a curve in which the curvature is changed according to the ratio of the reverse phase component and the color is changed according to the ratio of the reverse phase component;
A sound image display method for a sound image display device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013233284A JP6220236B2 (en) | 2013-11-11 | 2013-11-11 | Sound image display device, sound image display system, and sound image display method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013233284A JP6220236B2 (en) | 2013-11-11 | 2013-11-11 | Sound image display device, sound image display system, and sound image display method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015095719A JP2015095719A (en) | 2015-05-18 |
JP6220236B2 true JP6220236B2 (en) | 2017-10-25 |
Family
ID=53197863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013233284A Active JP6220236B2 (en) | 2013-11-11 | 2013-11-11 | Sound image display device, sound image display system, and sound image display method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6220236B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5098701U (en) * | 1974-01-10 | 1975-08-16 | ||
JPS60135790U (en) * | 1984-02-18 | 1985-09-09 | 富士通テン株式会社 | level display device |
GB2319346B (en) * | 1996-11-13 | 2001-03-21 | Sony Uk Ltd | Analysis of audio signals |
US6977653B1 (en) * | 2000-03-08 | 2005-12-20 | Tektronix, Inc. | Surround sound display |
JP2007243318A (en) * | 2006-03-06 | 2007-09-20 | Toshiba Corp | Sound monitoring method and sound monitoring apparatus |
-
2013
- 2013-11-11 JP JP2013233284A patent/JP6220236B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015095719A (en) | 2015-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104205878B (en) | Method and system for head-related transfer function generation by linear mixing of head-related transfer functions | |
CN106664490B (en) | Monophonic or multichannel audio control interface | |
KR100736434B1 (en) | Method and apparatus for harmonizing colors by harmonic sound and converting sound into colors mutually | |
US6829361B2 (en) | Headphones with integrated microphones | |
RU2009109125A (en) | APPARATUS AND METHOD OF MULTI-CHANNEL PARAMETRIC CONVERSION | |
CN104240695A (en) | Optimized virtual sound synthesis method based on headphone replay | |
JP2011211312A (en) | Sound image localization processing apparatus and sound image localization processing method | |
KR100813272B1 (en) | Apparatus and method for bass enhancement using stereo speaker | |
JP5459556B2 (en) | Acoustic characteristic adjusting device, acoustic characteristic adjusting method, and computer program | |
JP2017163555A (en) | Channel number converting device | |
JP6220236B2 (en) | Sound image display device, sound image display system, and sound image display method | |
WO2020036077A1 (en) | Signal processing device, signal processing method, and program | |
CN107172568B (en) | Stereo sound field calibration equipment and calibration method | |
JP2016134769A (en) | Audio signal processor | |
JP2013172231A (en) | Audio mixing device | |
TW201409992A (en) | Electronic apparatus and method for recognizing applications through vocal element | |
US7949420B2 (en) | Methods and graphical user interfaces for displaying balance and correlation information of signals | |
JP2008011342A (en) | Apparatus for measuring acoustic characteristics and acoustic device | |
US12010493B1 (en) | Visualizing spatial audio | |
JP6285790B2 (en) | Channel number converter | |
WO2023189075A1 (en) | Signal processing device, acoustic output device, and signal processing method | |
JP5972116B2 (en) | Effector | |
JP6510757B2 (en) | Loudness measuring apparatus and loudness measuring program | |
JP3613110B2 (en) | Automatic sound source adjustment circuit | |
JP2015046663A (en) | Hearing aid fitting device and hearing aid fitting method using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170929 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6220236 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |