JP7132027B2 - Sound processing device and program - Google Patents
Sound processing device and program Download PDFInfo
- Publication number
- JP7132027B2 JP7132027B2 JP2018152853A JP2018152853A JP7132027B2 JP 7132027 B2 JP7132027 B2 JP 7132027B2 JP 2018152853 A JP2018152853 A JP 2018152853A JP 2018152853 A JP2018152853 A JP 2018152853A JP 7132027 B2 JP7132027 B2 JP 7132027B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- conversion
- degrees
- destination
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
本発明は、マルチチャンネル音響信号のチャンネル数及びチャンネル配置を変換する音響処理装置及びプログラムに関する。 The present invention relates to an audio processing apparatus and program for converting the number of channels and channel arrangement of multichannel audio signals.
複数音声チャンネルの音響信号からなる番組音声を、制作時におけるチャンネル数よりも少ないチャンネル数に変換(ダウンミックス)して聴取することがある。その際、制作時における各音声チャンネルの変換元音響信号に、それぞれダウンミックス係数(チャンネル数変換係数)を乗じて得られる音響信号を加算して、再生時における各音声チャンネルの変換先音響信号を生成する。ダウンミックス係数として、所定の音響システムの標準規格(例えば、非特許文献1参照)で規定されているものと、番組ごとに音響信号に付加したメタデータに基づいて指定されるものがある(例えば、非特許文献2参照)。 In some cases, program audio consisting of audio signals of multiple audio channels is converted (down-mixed) to a number of channels that is smaller than the number of channels at the time of production, and listened to. At that time, the audio signals obtained by multiplying the down-mix coefficients (channel number conversion coefficients) are added to the original audio signals of each audio channel during production, and the converted audio signals of each audio channel during playback are added. Generate. As downmix coefficients, there are those specified by the standard specifications of a predetermined audio system (see, for example, Non-Patent Document 1) and those specified based on metadata added to the audio signal for each program (for example, , Non-Patent Document 2).
例えば、非特許文献2には、式(1)に示す関係を用いて5.1chサラウンドの音響信号からステレオ2chの音響信号へダウンミックス処理することが記載されている。
For example, Non-Patent
式(1)において、Lt、Rtは、変換先であるステレオ2chのうち、それぞれ左チャンネル、右チャンネルの音響信号を示す。L,R,C,LFE,Ls,Rsは、変換元である5.1chサラウンドのうち、それぞれ前方左チャンネル、前方右チャンネル、前方中央チャンネル、低域効果音チャンネル、サラウンド左チャンネル、サラウンド右チャンネルそれぞれの音響信号を示す。したがって、式(1)の第1項の2行6列の行列の各要素がダウンミックス係数に相当する。kは、サラウンド左チャンネルLs、サラウンド右チャンネルRsのレベルを規定する係数を示す。kは、例えば、1/√2、1/2、0である。メタデータが音響信号に付随して伝送されない場合、テレビジョン受信機では、kとして1/√2が用いられる。 In equation (1), Lt and Rt indicate left-channel and right-channel acoustic signals, respectively, of the two stereo channels that are conversion destinations. L, R, C, LFE, Ls, and Rs are the front left channel, front right channel, front center channel, low frequency effect sound channel, surround left channel, and surround right channel, respectively, of the 5.1ch surround that is the conversion source. Each acoustic signal is shown. Therefore, each element of the matrix of 2 rows and 6 columns in the first term of Equation (1) corresponds to the downmix coefficient. k represents a coefficient that defines the levels of the surround left channel Ls and the surround right channel Rs. k is 1/√2, 1/2, 0, for example. If no metadata is transmitted along with the audio signal, 1/√2 is used as k in the television receiver.
また、昨今では4K/8K放送などの超高精細度テレビジョン放送において、22.2マルチチャンネル音響(以下、「22.2ch音響」という。)などのマルチチャンネル音響システムが導入されている。一方、昨今、5.1chサラウンドや7.1chサラウンドに上方2chや上方4chを追加したマルチチャンネル音響が提案され、22.2ch音響で制作された番組音声を7.1ch(5.1+2ch)や9.1ch(5.1+4ch)、11.1ch(7.1+4ch)などで再生することが考えられる。 In addition, in recent years, a multi-channel sound system such as 22.2 multi-channel sound (hereinafter referred to as "22.2 ch sound") has been introduced in ultra-high definition television broadcasting such as 4K/8K broadcasting. On the other hand, recently, multi-channel sound, which adds upper 2ch or upper 4ch to 5.1ch surround or 7.1ch surround, has been proposed. .1ch (5.1+4ch), 11.1ch (7.1+4ch), etc. may be used for reproduction.
また、音の到来方向の再現を重視して、ベクトル合成による周囲のスピーカへの振幅配分を行う3次元パンニング法(例えば、非特許文献3参照)をチャンネル数変換にも応用する手法が提案されている。 In addition, a method has been proposed in which a three-dimensional panning method (for example, see Non-Patent Document 3), which distributes amplitude to surrounding speakers by vector synthesis, is applied to channel number conversion, with an emphasis on reproducing the direction of arrival of sound. ing.
しかしながら、現状は、22.2ch音響から、7.1ch(5.1+2ch)、9.1ch(5.1+4ch)、11.1ch(7.1+4ch)などに変換するチャンネル数変換係数は決まっていない。また、今後も様々なチャンネル数の音響方式や同じチャンネル数でも配置の異なる音響方式が提案され、多いチャンネル数のチャンネル配置から少ないチャンネル数のチャンネル配置に変換する場合だけではなく、チャンネル数が同じでもあるチャンネル配置から別のチャンネル配置へ変換する場合や、少ないチャンネル数のチャンネル配置から多いチャンネル数のチャンネル配置に変換するチャンネル数変換係数を規定する必要が生じる可能性もあるが、逐次チャンネル数変換係数を決めていくのは困難である。 However, at present, channel number conversion coefficients for converting from 22.2ch sound to 7.1ch (5.1+2ch), 9.1ch (5.1+4ch), 11.1ch (7.1+4ch), etc. have not been determined. In the future, sound systems with various numbers of channels and sound systems with different arrangements even with the same number of channels will be proposed. However, when converting from one channel arrangement to another, or when converting from a channel arrangement with a small number of channels to a channel arrangement with a large number of channels, it may be necessary to specify a channel number conversion factor. Determining the conversion coefficients is difficult.
また、非特許文献3に記載の手法を応用したチャンネル数変換は、変換先チャンネルとは異なる再生位置にある変換元チャンネルの数が多いと仮想音源で表現する音が多くなり、全体の音がぼけて音色が劣化しうるという問題がある。 In addition, in the channel number conversion that applies the method described in Non-Patent Document 3, if the number of conversion source channels at different playback positions from the conversion destination channel is large, the number of sounds expressed by the virtual sound source increases, and the overall sound becomes There is a problem that the timbre may deteriorate due to blurring.
かかる事情に鑑みてなされた本発明の目的は、上下方向に複数の層を持つ任意のチャンネル配置を持つ音響方式で制作された番組音声の音響信号を、制作者の意図を大きく損なうことなく、別のチャンネル配置を持つ音響方式で再生するためのチャンネル数変換係数行列を導出可能な音響処理装置及びプログラムを提供することにある。 It is an object of the present invention, which has been made in view of such circumstances, to produce an audio signal of program audio produced by an audio system having an arbitrary channel arrangement with a plurality of layers in the vertical direction, without significantly impairing the intention of the producer. An object of the present invention is to provide an audio processing device and a program capable of deriving a channel number conversion coefficient matrix for reproduction in an audio system having another channel arrangement.
上記課題を解決するため、本発明に係る音響処理装置は、マルチチャンネル音響信号のチャンネル数及びチャンネル配置を変換する音響処理装置であって、変換先マルチチャンネル音響信号の再生位置を仰角方向の複数層に分割する変換先チャンネル分割部と、変換元マルチチャンネル音響信号の再生位置を、前記変換先チャンネル分割部により分割された各分割層上に決定する変換元チャンネル再生位置決定部と、前記変換先マルチチャンネル音響信号の再生位置と、前記変換元チャンネル再生位置決定部により決定された前記変換元マルチチャンネル音響信号の再生位置とに基づいて、チャンネル数変換係数を決定するチャンネル数変換係数決定部と、前記チャンネル数変換係数決定部により決定されたチャンネル数変換係数を各要素とするチャンネル数変換係数行列を用いて、前記変換元マルチチャンネル音響信号から前記変換先マルチチャンネル音響信号を生成する出力信号生成部と、を備えることを特徴とする。 In order to solve the above problems, an acoustic processing apparatus according to the present invention is an acoustic processing apparatus that converts the number of channels and channel arrangement of a multi-channel acoustic signal, wherein the reproduction positions of the converted multi-channel acoustic signal are set to a plurality of positions in the elevation direction. a conversion destination channel division unit that divides into layers; a conversion source channel reproduction position determination unit that determines a reproduction position of a conversion source multi-channel audio signal on each divided layer divided by the conversion destination channel division unit; A channel number conversion coefficient determination unit that determines a channel number conversion coefficient based on the reproduction position of the destination multi-channel acoustic signal and the reproduction position of the original multi-channel acoustic signal determined by the original channel reproduction position determination unit. and an output for generating the destination multi-channel acoustic signal from the source multi-channel acoustic signal using a channel number transform coefficient matrix whose elements are the channel number transform coefficients determined by the channel count transform coefficient determination unit and a signal generator.
さらに、本発明に係る音響処理装置において、前記変換先チャンネル分割部は、少なくとも、仰角を足元(仰角-90度)、床面層(仰角-90~-45度)、下層(仰角-45度~0度)、中層(仰角0度)、上層(仰角0~45度)、天井層(仰角45度~90度)、頭上(仰角90度)の7層に分類し、これらの隣り合う層を任意の組合せで統合した複数層に、前記変換先マルチチャンネル音響信号の再生位置を分割することを特徴とする。 Further, in the sound processing device according to the present invention, the conversion destination channel dividing unit can set the elevation angle at least to the foot (-90 degrees elevation), the floor layer (-90 to -45 degrees elevation), the lower layer (-45 degrees elevation) ~ 0 degrees), middle layer (0 degrees elevation), upper layer (0 to 45 degrees elevation), ceiling layer (45 degrees to 90 degrees elevation), overhead (90 degrees elevation), and these adjacent layers are divided into a plurality of layers in which the multi-channel acoustic signals to be converted are integrated in an arbitrary combination.
さらに、本発明に係る音響処理装置において、前記変換先チャンネル分割部は、前記変換先マルチチャンネル音響信号の再生位置を仰角方向の複数層に分割し、さらに分割した各分割層を方位角方向の複数の範囲に分割することを特徴とする。 Further, in the sound processing apparatus according to the present invention, the destination channel division unit divides the reproduction position of the destination multi-channel acoustic signal into a plurality of layers in the elevation direction, and divides each divided layer in the azimuth direction. It is characterized by dividing into a plurality of ranges.
さらに、本発明に係る音響処理装置において、前記変換先チャンネル分割部は、前記変換先マルチチャンネル音響信号の再生位置を前記方位角方向の複数の範囲に分割したときに、変換先マルチチャンネル音響信号の再生位置が存在しない再生位置欠落範囲を含む再生位置欠落層については、隣接する層の前記再生位置欠落範囲に対応する範囲に存在する変換先マルチチャンネル音響信号の再生位置を、仮想的に前記再生位置欠落範囲の変換先マルチチャンネル音響信号の再生位置とすることを特徴とする。 Further, in the sound processing device according to the present invention, the conversion destination channel dividing unit divides the reproduction position of the conversion destination multichannel sound signal into a plurality of ranges in the azimuth direction, dividing the conversion destination multichannel sound signal into For a playback position missing layer that includes a playback position missing range in which the playback position of The reproduction position of the converted multi-channel audio signal in the reproduction position missing range is characterized.
さらに、本発明に係る音響処理装置において、前記変換元チャンネル再生位置決定部は、前記変換元マルチチャンネル音響信号の再生位置の2点以上の基準点と前記変換先マルチチャンネル音響信号の再生位置の2点以上の基準点が一致するように、前記変換元マルチチャンネル音響信号のサラウンドサークルを回転及び変倍させ、2点の基準点の間に存在する前記変換元マルチチャンネル音響信号の再生位置を前記変換先マルチチャンネル音響信号のサラウンドサークル上に再配置することを特徴とする。 Further, in the sound processing device according to the present invention, the source channel reproduction position determining unit may determine two or more reference points of the reproduction position of the source multi-channel acoustic signal and the reproduction position of the destination multi-channel sound signal. Rotating and scaling the surround circle of the original multi-channel acoustic signal so that two or more reference points coincide, and determining the reproduction position of the original multi-channel acoustic signal existing between the two reference points. It is characterized by rearranging on the surround circle of the conversion target multi-channel audio signal.
さらに、本発明に係る音響処理装置において、前記変換先チャンネル分割部は、前記各分割層を、前後左右の4範囲に分割し、前記変換元チャンネル再生位置決定部は、変換元マルチチャンネル音響信号の再生位置と変換先チャンネルの再生位置の基準点を、前記変換先チャンネル分割部により分割された画面の両端に相当する左前、右前の2点、4分割した左前、右前、左後ろ、右後ろの4範囲の四隅の4点、該4点に左右側方90度を加えた6点のいずれかにそれぞれ最も近くに存在する変換元マルチチャンネル音響信号の再生位置とすることを特徴とする。 Further, in the sound processing device according to the present invention, the conversion destination channel dividing unit divides each of the divided layers into four ranges of front, back, left, and right, and the conversion source channel reproduction position determination unit divides the conversion source multi-channel audio signal into four ranges. The reference points for the playback position of and the playback position of the conversion destination channel are set to the left front and right front two points corresponding to both ends of the screen divided by the conversion destination channel dividing unit, and the left front, right front, left rear, and right rear points that are divided into four. , or 6 points obtained by adding 90 degrees to the left and right sides to the four points in the four corners of the four ranges, respectively.
さらに、本発明に係る音響処理装置において、前記変換元チャンネル再生位置決定部は、前記基準点を、予め定められた位置、ユーザによって指定された位置、メタデータによって指定された位置、又は変換元チャンネル及び変換先チャンネルの名称若しくは位置の類似度に基づいて決定することを特徴とする。 Further, in the sound processing apparatus according to the present invention, the conversion-source channel reproduction position determination unit sets the reference point to a predetermined position, a position specified by a user, a position specified by metadata, or a conversion-source channel playback position determination unit. It is characterized by determining based on the degree of similarity in the names or positions of the channel and the destination channel.
さらに、本発明に係る音響処理装置において、前記チャンネル数変換係数決定部は、隣接する2個の変換先マルチチャンネル音響信号の再生位置と、該再生位置の間に挟まれる、前記変換元チャンネル再生位置決定部により決定された変換元マルチチャンネル音響信号の再生位置の数に基づいて、前記チャンネル数変換係数を算出することを特徴とする。 Further, in the sound processing device according to the present invention, the number-of-channels conversion coefficient determination unit reproduces the reproduction positions of two adjacent conversion target multi-channel acoustic signals and the conversion source channel sandwiched between the reproduction positions. The number-of-channels conversion coefficient is calculated based on the number of reproduction positions of the original multi-channel acoustic signal determined by the position determining unit.
さらに、本発明に係る音響処理装置において、前記チャンネル数変換係数決定部は、算出したチャンネル数変換係数が、予め定められた範囲に含まれる場合、予め定められた代表値に置き換えることを特徴とする。 Further, in the sound processing apparatus according to the present invention, the channel number conversion coefficient determining unit replaces the calculated channel number conversion coefficient with a predetermined representative value when the calculated channel number conversion coefficient is included in a predetermined range. do.
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記音響処理装置として機能させることを特徴とする。 Further, in order to solve the above problems, a program according to the present invention causes a computer to function as the above sound processing device.
本発明によれば、上下方向に複数の層を持つ任意のチャンネル配置の音響方式で制作された音響を、制作者の意図を大きく損なうことなく、別のチャンネル配置の音響方式用の再生装置で聴取するためのチャンネル数変換係数行列を生成することが可能となる。 According to the present invention, sound produced in an audio system with an arbitrary channel arrangement having a plurality of layers in the vertical direction can be reproduced by a playback device for an audio system with a different channel arrangement without significantly impairing the intention of the producer. It is possible to generate a channel number transform coefficient matrix for listening.
以下、図面を参照しながら本発明の実施形態について詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本実施形態に係る音響処理装置1の構成例を示すブロック図である。図1に示す音響処理装置1は、変換先チャンネル分割部11と、変換元チャンネル再生位置決定部12と、チャンネル数変換係数決定部13と、チャンネル数変換係数行列記憶部14と、出力信号生成部15とを備える。
FIG. 1 is a block diagram showing a configuration example of a
音響処理装置1は、任意のM個のチャンネル数からなる変換元マルチチャンネル音響信号を任意のN個のチャンネル数からなる変換先マルチチャンネル音響信号にチャンネル数とその配置を変換する。
The
変換先チャンネル分割部11は、変換元チャンネル及び変換先チャンネルのチャンネル数を含む変換元・変換先チャンネル位置情報を取得する。また、変換先チャンネル分割部11は、N個の変換先マルチチャンネル音響信号の再生位置をどのように分割するかを示す変換先チャンネル分割情報を入力する。そして、変換先チャンネル分割部11は、変換先チャンネル分割情報に基づいて、変換先チャンネルの再生位置を分割する。例えば、変換先チャンネルの再生位置を仰角方向(高さ方向、垂直軸方向)に3分割し、3分割した各層について、さらに方位角方向に4範囲に分割する。詳細については後述する。以下、「変換元マルチチャンネル音響信号の再生位置」を「変換元チャンネルの再生位置」といい、「変換先マルチチャンネル音響信号の再生位置」を「変換先チャンネルの再生位置」という。
The conversion destination
変換元チャンネル再生位置決定部12は、変換元チャンネルの再生位置を、絶対位置にするのか(絶対位置モード)、ある基準位置に対する相対位置に変更するのか(相対位置モード)を指定する変換位置算出モード選択情報を入力する。そして、変換元チャンネル再生位置決定部12は、変換位置算出モード選択情報に基づいて、変換元チャンネルの再生位置を、変換先チャンネル分割部11により分割された変換先チャンネルの各分割層上に決定する。詳細については後述する。
A conversion source channel reproduction
チャンネル数変換係数決定部13は、分配係数を2個の変換先チャンネルの再生位置と変換元チャンネルの再生位置との位置関係によって規定するのか(位置モード)、2個の変換先チャンネルの再生位置に挟まれる変換元チャンネルの数によって規定するのか(数モード)を指定する分配係数算出モード選択情報を取得する。そして、チャンネル数変換係数決定部13は、分配係数算出モード選択情報に基づいて分配係数を算出した後、チャンネル数変換係数を決定し、チャンネル数変換係数行列記憶部14に記憶する。
The number-of-channels conversion
チャンネル数変換係数行列記憶部14は、チャンネル数変換に必要なチャンネル数変換係数行列を記憶する。例えば、後述する22.2ch音響から11.1ch音響(7.1+4ch)、9.1ch音響(5.1+4ch)、7.1ch音響(5.1+2ch)に変換するチャンネル数変換係数行列を記憶する。なお、チャンネル数変換係数行列記憶部14は必須の構成ではなく、チャンネル数変換係数行列記憶部14を備えていない場合や、チャンネル数変換係数行列記憶部14にチャンネル数変換係数が記憶されていない場合には、チャンネル数変換係数行列をその都度導出してもよい。
The channel number conversion coefficient
出力信号生成部15は、変換元マルチチャンネル音響信号を入力する。そして、出力信号生成部15は、チャンネル数変換係数決定部13により決定されたチャンネル数変換係数を各要素とするチャンネル数変換係数行列を用いて、変換元マルチチャンネル音響信号のチャンネル数とその配置を変換して変換先マルチチャンネル音響信号を生成し、外部に出力する。
The
具体的には、出力信号生成部15は、チャンネル数変換係数行列記憶部14からN×M個のチャンネル数変換係数からなるチャンネル数変換行列を読み出し、式(2)に従い、M個の変換元マルチチャンネル音響信号にチャンネル数変換係数を乗じて加算することによって、N個の変換先マルチチャンネル音響信号を生成する。
Specifically, the output
図2は、音響処理装置1における、変換元チャンネルから変換先チャンネルにチャンネル数変換するときに用いるチャンネル数変換係数を導出する手順を示すフローチャートである。任意のMチャンネルのマルチチャンネル音響信号からNチャンネルのマルチチャンネル音響信号に変換する場合は、まず、変換先チャンネル分割部11により、N個の変換先チャンネルの再生位置を仰角方向の複数層に分割する(ステップS11)。
FIG. 2 is a flow chart showing a procedure for deriving channel number conversion coefficients used when channel number conversion is performed from conversion source channels to conversion target channels in the
立方体の試聴室を仮定した音響再生空間に設置されているスピーカ(変換先チャンネルの実際の再生位置)を床面、側壁の下方、中間、上方、天井と分類し、特異点である足元(仰角-90度)、頭上(仰角+90度)を含めて多層構造とすると、足元(仰角-90度)、床面層(仰角-90~-45度)、下層(仰角-45度~0度)、中層(仰角0度:耳の高さ)、上層(仰角0~45度)、天井層(仰角45度~90度)、頭上(仰角90度)の7層に分類できる。変換先チャンネル分割部11は、仰角を少なくともこの7層に分類し、これらの隣り合う層を任意の組合せで統合した複数層に、変換先チャンネルの再生位置を分割する。実際にはスピーカはある限られた範囲にしか設置されていないため、例えば上層と天井層は一つに統合されて上層(仰角0~90度)となる場合がある。22.2chの場合は、下層、中層、上層、頭上の4層、11.1chの場合は、中層、上層の2層となる。もし、より詳細に仰角によって層が規定されている場合には、7層よりも多い層を用いてもよい。
The speakers (actual playback positions of the conversion destination channels) installed in the sound reproduction space, which is assumed to be a cubic listening room, are categorized as floor, lower, middle, upper, and ceiling of the side walls, and the singular point of the feet (elevation angle -90 degrees), overhead (+90 degrees elevation), and a multi-layered structure including feet (-90 degrees elevation), floor layer (-90 to -45 degrees elevation), lower layer (-45 degrees to 0 degrees elevation) , middle layer (
次に、変換先チャンネル分割部11により、変換先チャンネルの各分割層を方位角方向に左右の2範囲に分割するか(ステップS12)、前後左右(横断面、正中面)の4範囲に分割するか(ステップS13)、前中後左右の6範囲に分割する(ステップS14)。ステップS12~14の切り替えは、デフォルト設定であらかじめ決めておいてもよいし、ユーザが決定してもよい。
Next, the conversion destination
ステップS12~14において、方位角方向に分割された範囲に変換先チャンネルの再生位置が存在しない場合がある。以下、変換先チャンネルの再生位置が存在しない範囲を再生位置欠落範囲といい、再生位置欠落範囲を含む層を再生位置欠落層という。変換先チャンネル分割部11は、再生位置欠落範囲を含む再生位置欠落層については、隣接する層の再生位置欠落範囲に対応する範囲に存在する変換先チャンネルの再生位置を、仮想的に再生位置欠落範囲の変換先チャンネルの再生位置とする(ステップS15)。ただし、頭上(仰角90度)といった1点のみで構成される層に関しては除外する。
In steps S12 to S14, the reproduction position of the conversion destination channel may not exist in the range divided in the azimuth direction. Hereinafter, the range where the reproduction position of the conversion destination channel does not exist will be referred to as the reproduction position missing range, and the layer including the reproduction position missing range will be referred to as the playback position missing layer. The conversion destination
図3に、7.1ch(中層5chと上層に2ch)と11.1ch(中層7chと上層に4ch)の変換先チャンネルの再生位置を2層に分割し、各分割層を前後左右に4分割した例を示す。図3(a)に示した7.1ch音響において、上層は後方の範囲に変換先チャンネルの再生位置が存在しない再生位置欠落層である。そこで、隣接する中層の後方チャンネルを上層の再生にも用いることとする。 In FIG. 3, the playback positions of the conversion destination channels of 7.1ch (5ch in the middle layer and 2ch in the upper layer) and 11.1ch (7ch in the middle layer and 4ch in the upper layer) are divided into 2 layers, and each divided layer is divided into 4 parts in the front, back, left and right. example. In the 7.1ch sound shown in FIG. 3A, the upper layer is a reproduction position missing layer in which the reproduction position of the conversion destination channel does not exist in the rear range. Therefore, the rear channel of the adjacent middle layer is also used for reproduction of the upper layer.
ステップS15において、再生位置欠落層に隣接する層として、仰角90度の1点のみで構成される頭上、及び-90度の1点のみで構成される足元は除外される。また、変換先チャンネル分割部11は、再生位置欠落層の上下に、隣接する両方の層の再生位置欠落範囲に対応する範囲に変換先チャンネルの再生位置が存在する場合には、仰角0度から離れた方の層の対応する範囲の変換先チャンネルの再生位置を、仮想的に欠落範囲の変換先チャンネルの再生位置とする。例えば、上層が再生位置欠落層であり、上層の上下に隣接する天井層及び中層の再生位置欠落範囲に対応する範囲に変換先チャンネルの再生位置が存在する場合には、仰角0度から離れた方の天井層の変換先チャンネルの再生位置を再生位置欠落範囲の変換先チャンネルの再生位置とする。これにより、制作時の上下感を保持することができる。
In step S15, as layers adjacent to the reproduction position missing layer, the overhead layer composed of only one point with an elevation angle of 90 degrees and the foot layer composed of only one point with an elevation angle of -90 degrees are excluded. Further, the conversion destination
ここで、変換先チャンネルがステレオの場合などであって、再生位置欠落層に隣接する層の再生位置欠落範囲に対応する範囲に変換先チャンネルの再生位置が存在しない場合には、再生位置欠落層内で変換先チャンネルの再生位置を前後に反転させることにより、変換先チャンネルの再生位置を仮想的に創出してもよい。また、上層と天井層がさらに細かく複数層に分割されている場合や、ある層に隣接する層の仰角差が小さい場合などは、隣接する両方の層の変換先チャンネルの再生位置を当該層の再生位置として、両チャンネルに変換元マルチチャンネル音響信号を分配してもよい。 Here, if the conversion destination channel is stereo, etc., and the playback position of the conversion destination channel does not exist in the range corresponding to the playback position missing range of the layer adjacent to the playback position missing layer, the playback position missing layer The playback position of the destination channel may be virtually created by reversing the playback position of the destination channel back and forth within. Also, if the upper layer and ceiling layer are further divided into multiple layers, or if the elevation angle difference between layers adjacent to a certain layer is small, the playback position of the conversion destination channel on both adjacent layers will be changed to the corresponding layer. As the playback position, the original multi-channel acoustic signal may be distributed to both channels.
図3では各分割層を4分割する例を示しているが、左前、左横、左後、右前、右横、右後と6分割してもよい。また、0度又は180度に再生位置が存在するチャンネルは、左前、右前、又は左後、右後に再生位置が存在するチャンネルがない場合にのみ、等分に分配して例えば左前、右前(±1度など)又は左後、右後(±179度)に再生位置が存在するチャンネルとみなしてもよい。また、側方±90度に再生位置が存在するチャンネルは、通常、左後、右後の範囲に再生位置が存在するチャンネルとみなすが、左前、右前に再生位置が存在するチャンネルがない場合にのみ、左前、右前の範囲に再生位置が存在するチャンネルとみなしてもよい。 Although FIG. 3 shows an example in which each divided layer is divided into four layers, it may be divided into six layers such as left front, left horizontal, left rear, right front, right horizontal, and right rear. Only when there is no channel whose playback position exists at the front left, front right, rear left, or rear right, the channel whose playback position exists at 0 degrees or 180 degrees is equally distributed, for example, front left, front right (± 1 degree, etc.), or a channel in which the playback position exists in the rear left or rear right (±179 degrees). Also, a channel whose playback position exists at ±90 degrees laterally is normally regarded as a channel whose playback position exists in the range of rear left and rear right. may be regarded as a channel in which the playback position exists in the range of front left and front right.
このようにして、変換先チャンネルの再生位置を仰角方向の複数層に分割することにより、上下方向に複数の層を持つ任意のチャンネル配置の音響方式で制作された音響を、制作者の意図を大きく損なうことなく、別のチャンネル配置の音響方式用の再生装置で聴取するためのチャンネル数変換係数行列を生成することが可能となる。 In this way, by dividing the playback position of the conversion destination channel into multiple layers in the elevation direction, it is possible to reproduce the sound produced by an arbitrary channel arrangement audio system with multiple layers in the vertical direction according to the intention of the producer. It is possible to generate a number-of-channels transform coefficient matrix for listening on a playback device for an audio system with a different channel arrangement without significant loss.
次に、図2に示すように、変換元チャンネル再生位置決定部12により、仰角±90度の1点に変換先チャンネルの再生位置が存在しない場合の、仰角±90度にあった変換元チャンネルの再生位置を規定する(ステップS16)。なお、仰角±90度の1点に変換先チャンネルの再生位置が存在する場合には、該再生位置を変更しない。
Next, as shown in FIG. 2, the conversion-source channel playback
仰角±90度の1点に変換先チャンネルの再生位置が存在しない場合、第1の例では、頭上(仰角90度)又は足元(仰角-90度)の変換元チャンネルの再生位置を、仰角±90度に隣接する層の各分割範囲の中央に最も近い変換先チャンネルの再生位置とし、該分割範囲に中央から同程度離れた複数の変換先チャンネルの再生位置が存在する場合には、該複数の変換先チャンネルの再生位置とする。 If the playback position of the conversion destination channel does not exist at one point with an elevation angle of ±90 degrees, in the first example, the playback position of the conversion source channel above the head (elevation angle of 90 degrees) or at the foot (elevation angle of −90 degrees) is set to the elevation angle of ±90 degrees. The playback position of the conversion destination channel closest to the center of each divided range on the layer adjacent to 90 degrees, and if there are multiple playback positions of the conversion destination channel that are equally distant from the center in the divided range, the multiple is the playback position of the conversion destination channel.
図4に、仰角±90度の1点に変換先チャンネルの再生位置が存在しない場合の、仰角±90度の変換元チャンネルの再生位置の第1の例を示す。各分割層を4範囲に分割した場合は、隣接する層の前後左右4範囲の変換先チャンネルのうち、それぞれ四隅(方位角45度と135度)付近に再生位置が存在する変換先チャンネルの再生位置各1点を使用する。例えば、図4(a)に示すように、変換先チャンネルが5chの場合、黒丸で示した四隅付近に存在する4chを再生位置と規定し、図4(b)に示すように、変換先チャンネルが7chの場合、黒丸で示した四隅付近に存在する4chを再生位置と規定する。また、方位角30度と60度など四隅から同程度離れた再生位置に変換先チャンネルが2個存在する場合には、両方を使用する。例えば、図4(c)に示すように、変換先チャンネルが10chの場合、方位角30度と60度を共に使用し、黒丸で示した6chを再生位置と規定する。 FIG. 4 shows a first example of the reproduction position of the conversion source channel with an elevation angle of ±90 degrees when the reproduction position of the conversion destination channel does not exist at one point with an elevation angle of ±90 degrees. When each divided layer is divided into four ranges, among the four ranges of conversion destination channels in the adjacent layers, the conversion destination channels whose playback positions are near the four corners (azimuth angles of 45 degrees and 135 degrees) are reproduced. Use one point for each position. For example, as shown in FIG. 4(a), if the conversion destination channel is 5ch, 4ch existing near the four corners indicated by the black circles is defined as the playback position, and as shown in FIG. 4(b), the conversion destination channel is 7ch, 4ch present near the four corners indicated by black circles is defined as the playback position. Also, if there are two conversion destination channels at playback positions that are equally distant from the four corners, such as azimuth angles of 30 degrees and 60 degrees, both are used. For example, as shown in FIG. 4(c), when the conversion destination channel is 10ch, both azimuth angles of 30 degrees and 60 degrees are used, and 6ch indicated by a black circle is defined as the playback position.
変換元チャンネルの再生位置を規定すると、規定されたチャンネル数に応じて、音響信号のレベルを規定する。4範囲から各1点を選出した場合、チャンネル数変換係数は√(1/4)=0.500であり、4範囲から各2点を選出した場合、チャンネル数変換係数は√(1/8)=0.354となる。この例では、エネルギーが保存されることを想定したが、上層で再生されるべき音響信号が中層等で再生されるとき、元々中層で再生される音響信号が聞こえにくくなる可能性がある。そこで、全体のエネルギーを-1.5dBするなどの補正係数を乗じてもよい。このとき、4範囲から各1点を選出する場合の各要素は0.421となり、4範囲から各2点を選出する場合の各要素は0.297となる。 Once the reproduction position of the conversion source channel is defined, the level of the acoustic signal is defined according to the defined number of channels. When one point is selected from four ranges, the channel number conversion factor is √(1/4)=0.500, and when two points are selected from four ranges, the channel number conversion factor is √(1/8 )=0.354. In this example, it is assumed that energy is conserved. However, when an acoustic signal that should be reproduced in the upper layer is reproduced in the middle layer, etc., the sound signal originally reproduced in the middle layer may become difficult to hear. Therefore, a correction coefficient such as −1.5 dB may be applied to the overall energy. At this time, each element is 0.421 when one point is selected from four ranges, and each element is 0.297 when two points are selected from four ranges.
第2の例では、頭上(仰角90度)又は足元(仰角-90度)の変換元チャンネルの再生位置を、仰角±90度に隣接する層の後方の左右分割範囲の中央にそれぞれ最も近い変換先チャンネルの再生位置、及び前方中央の変換先チャンネルの再生位置とする。前方中央に変換先チャンネルの再生位置が存在しない場合には、代わりに前方の左右分割範囲の中央にそれぞれ最も近い変換先チャンネルの再生位置を変換元チャンネルの再生位置とする。 In the second example, the playback position of the conversion source channel above the head (90 degrees elevation angle) or at the feet (−90 degrees elevation angle) is converted to the center of the left and right divided range behind the layer adjacent to the ±90 degrees elevation angle, respectively. The playback position of the destination channel and the playback position of the conversion destination channel in the front center. If the reproduction position of the conversion destination channel does not exist in the front center, instead, the reproduction position of the conversion destination channel closest to the center of the front left and right divided ranges is set as the reproduction position of the conversion source channel.
図5に、仰角±90度の1点に変換先チャンネルの再生位置が存在しない場合の仰角±90度の変換元チャンネルの再生位置の第2の例を示す。例えば、図5(a)に示すように、変換先チャンネルが5chの場合、黒丸で示した後方二隅付近に存在する2ch及び前方中央の1chを再生位置と規定し、図5(b)に示すように、変換先チャンネルが7chの場合、黒丸で示した後方二隅付近に存在する2ch及び前方中央の1chを再生位置と規定する。また、前方中央に変換先チャンネルが存在しない場合には、前方左右に再生位置が存在する変換先チャンネルの再生位置を使用してもよい。例えば、図5(c)に示すように、変換先チャンネルが4chの場合、黒丸で示した後方二隅付近に存在する2ch及び前方左右の2chを再生位置と規定する。 FIG. 5 shows a second example of the reproduction position of the conversion source channel with an elevation angle of ±90 degrees when the reproduction position of the conversion destination channel does not exist at one point with an elevation angle of ±90 degrees. For example, as shown in FIG. 5(a), when the conversion destination channel is 5ch, 2ch existing near the rear two corners indicated by black circles and 1ch in the front center are defined as the playback position, and FIG. As shown, when the conversion destination channel is 7ch, 2ch near the rear two corners and 1ch in the front center indicated by the black circles are defined as the playback position. Also, if the conversion destination channel does not exist in the front center, the reproduction positions of the conversion destination channels that exist in the front left and right positions may be used. For example, as shown in FIG. 5(c), when the conversion destination channel is 4ch, 2ch near the rear two corners and the front left and right 2ch indicated by the black circles are defined as the playback positions.
後方二隅付近及び前方中央を再生位置とした場合、チャンネル数変換係数行列の各要素は√(1/3)=0.577となる。後方二隅付近及び前方左右を再生位置とした場合、前方左右のチャンネル数変換係数行列の各要素は√(1/6)=0.408となる。また、上述したように、上層で再生されるべき音響信号が中層等で再生されることで、元々中層で再生される音響信号が聞こえにくくなることを防止するために、補正係数を乗じて全体のエネルギーを低減させてもよい。 When the two rear corners and the front center are the reproduction positions, each element of the channel number conversion coefficient matrix is √(1/3)=0.577. When the vicinity of the two rear corners and the front left and right are the reproduction positions, each element of the front left and right channel number conversion coefficient matrix is √(1/6)=0.408. In addition, as described above, in order to prevent the sound signal originally reproduced in the middle layer from being difficult to hear due to the sound signal that should be reproduced in the upper layer being reproduced in the middle layer, etc., the correction coefficient is multiplied and the overall energy may be reduced.
次に、図2に示すように、仰角±90度を除く変換元チャンネルの再生位置を変換先チャンネルの各分割層上に配置する。このとき、変換元チャンネルの再生位置をそのまま配置する絶対位置モード(ステップS17)と、変換元/変換先チャンネルの基準点を指定し、基準点に対する相対関係が一致するように配置する相対位置モード(ステップS18)とで、変換元チャンネルの再生位置の配置先を切り替える。ステップS17~18の切り替えは、デフォルト設定であらかじめ決めておいてもよいし、ユーザが決定してもよい。 Next, as shown in FIG. 2, the reproduction positions of the conversion-source channel excluding the elevation angles of ±90 degrees are arranged on each divided layer of the conversion-destination channel. At this time, there is an absolute position mode (step S17) in which the reproduction position of the conversion source channel is arranged as it is, and a relative position mode in which a reference point is specified for the conversion source/conversion destination channel and arranged so that the relative relationship with respect to the reference point matches. (Step S18), the arrangement destination of the reproduction position of the conversion source channel is switched. The switching in steps S17 and S18 may be determined in advance by default settings, or may be determined by the user.
絶対位置モード(ステップS17)では、変換元チャンネル(M個)の再生位置を変えないで、そのまま再生位置とする。すなわち、あらかじめ規格で定められている再生位置をそのまま用いる。 In the absolute position mode (step S17), the reproduction positions of the conversion source channels (M) are set as they are without being changed. In other words, the reproduction position defined in advance by the standard is used as it is.
図6に、絶対位置モードの場合における、変換元チャンネル及び変換先チャンネルの再生位置を示す。ここで、内側の白丸が変換元チャンネルの再生位置であり、外側の黒丸が変換先チャンネルの再生位置である。図6(a)は10chから5chへの変換であり、図6(b)は10chから7chへの変換であり、図6(c)(d)は8chから4chへの変換である。図6の(c)と(d)では、変換先チャンネルの4chの配置が異なる。絶対位置モードにおいては、変換先チャンネルの配置にかかわらず、変換元チャンネルの再生位置を変更しない。 FIG. 6 shows the playback positions of the conversion-source channel and the conversion-destination channel in the absolute position mode. Here, the inner white circle is the reproduction position of the conversion source channel, and the outer black circle is the reproduction position of the conversion destination channel. FIG. 6(a) is conversion from 10ch to 5ch, FIG. 6(b) is conversion from 10ch to 7ch, and FIGS. 6(c) and 6(d) are conversion from 8ch to 4ch. In (c) and (d) of FIG. 6, the arrangement of 4 channels of conversion destination channels is different. In the absolute position mode, the playback position of the conversion source channel is not changed regardless of the placement of the conversion destination channel.
相対位置モード(ステップS18)では、変換元チャンネル再生位置決定部12により、変換元チャンネル(M個)の再生位置を、基準点に対する相対位置を保持するように変更する。具体的には、変換元チャンネルの再生位置の2点の基準点と変換先チャンネルの再生位置の2点の基準点が一致するように変換元チャンネルのサラウンドサークルを回転、及び変倍(拡大・縮小)させ、2点の基準点の間に存在する変換元チャンネルの再生位置を変換先チャンネルのサラウンドサークル上に再配置した再生位置を変換元チャンネルの再生位置とする。
In the relative position mode (step S18), the conversion-source channel reproduction
ここで、基準点は画面の両端に相当する左前、右前の2点、各分割層を方位角方向に分割した左前、左後、右前、右後の4範囲の四隅の4点(±45度と±135度)、該4点に左右側方90度を加えた6点のいずれかにそれぞれ最も近くに存在する変換元チャンネルの再生位置でもよい。より音が聞こえてくる方向を指定したい場合は、基準点を8点などに増やすこともできる。基準点が3点以上存在する場合は、隣り合う2点の基準点を選択し、当該2点の基準点が作るサラウンドサークルの弧上に再生位置が含まれる変換元チャンネルの変換先チャンネルの再生位置を規定する。この作業を繰り返し、変換元の隣り合う2点の基準点が作る弧を変換元のサラウンドサークル上で一周させ、全ての変換元チャンネルの変換先での再生位置を決定する。 Here, the reference points are the left front and right front points corresponding to both ends of the screen, and the left front, left rear, right front and right rear four points (±45° and ±135 degrees), or the reproduction position of the conversion-source channel that exists closest to any of the six points obtained by adding 90 degrees to the left and right sides to the four points. If you want to specify the direction from which the sound is heard, you can increase the number of reference points to, for example, 8 points. If there are three or more reference points, select two adjacent reference points, and reproduce the conversion destination channel of the conversion source channel whose playback position is on the arc of the surround circle formed by the two reference points. Define the position. By repeating this operation, the arc formed by two adjacent reference points of the conversion source goes around the surround circle of the conversion source, and the reproduction positions of all the conversion source channels at the conversion destination are determined.
2点の基準点は、変換元チャンネル及び変換先チャンネルの再生位置に限定されず、任意の位置を指定できる。例えば、聴取者の真横となる±90度を基準点とすることで、90度方向を固定して聴取者の前方と後方で再生位置を変化させる割合を変えることも可能である。この基準点の位置の情報は変換位置算出モード選択情報にメタデータとして含めてもよいし、予め決められていてもよいし、Left・Rightといったチャンネルの名称の類似性から規定されてもよい。すなわち、変換元チャンネル再生位置決定部12は、基準点を、予め定められた位置、ユーザによって指定された位置、メタデータによって指定された位置、又は変換元チャンネル及び変換先チャンネルの名称若しくは位置の類似度に基づいて決定する。
The two reference points are not limited to the playback positions of the conversion-source channel and the conversion-destination channel, and arbitrary positions can be specified. For example, by setting ±90 degrees right beside the listener as a reference point, it is possible to fix the direction of 90 degrees and change the ratio of changing the playback position in front of and behind the listener. Information on the position of this reference point may be included as metadata in the conversion position calculation mode selection information, may be determined in advance, or may be defined based on the similarity of channel names such as Left and Right. That is, the conversion-source channel reproduction
図7に、基準点によって変換元チャンネルの再生位置を変更する例として、前後左右の4点の基準位置の内、左前と左後の2点に挟まれた側方の変換元チャンネルの再生位置を変更する例を示す。この例では、変換先の基準点は30度と110度で、変換元の基準点は60度と135度を想定している。ここで、変換元の60度(θin1)を変換先の30度(θout1)、変換元の135度(θin2)を変換先の110度(θout2)に変換する場合、変換元チャンネルの再生位置θinは、式(3)に示す変換先チャンネルの再生位置θoutに変換される。
FIG. 7 shows an example of changing the reproduction position of the conversion-source channel according to the reference point. Of the four reference positions on the front, back, left, and right, the reproduction position of the conversion-source channel on the side sandwiched between the left front and left rear points is shown in FIG. Here is an example of changing . In this example, it is assumed that the conversion destination reference points are 30 degrees and 110 degrees, and the conversion source reference points are 60 degrees and 135 degrees. Here, when converting the
また、図8に、左右前方の2点を基準点として、前方と後方の変換元チャンネルの再生位置を変更する例を示す。 Also, FIG. 8 shows an example of changing the reproduction positions of the front and rear conversion source channels with two points on the left and right front as reference points.
図9に、±30度の変換先チャンネルの再生位置と±60度の変換元チャンネルの再生位置とを基準点とする場合(相対位置60度)において、変換元チャンネルの再生位置を変更する例を示す。ここで、内側の白丸が変換元チャンネルの再生位置、外側の黒丸が変換先チャンネルの再生位置であり、星印は基準点を示している。図9(a)(b)は10chから5chへの変換であり、図9(c)は10chから7chへの変換であり、図9(d)(e)(f)は8chから4chへの変換である。図9(b)(c)(e)においては、側方90度にも基準点を追加している。 FIG. 9 shows an example of changing the playback position of the conversion source channel when the playback position of the conversion destination channel of ±30 degrees and the playback position of the conversion source channel of ±60 degrees are used as reference points (relative position of 60 degrees). indicates Here, the inner white circle is the reproduction position of the conversion source channel, the outer black circle is the reproduction position of the conversion destination channel, and the asterisk indicates the reference point. 9(a) and 9(b) are conversion from 10ch to 5ch, FIG. 9(c) is conversion from 10ch to 7ch, and FIGS. 9(d)(e)(f) are conversion from 8ch to 4ch. is a conversion. In FIGS. 9B, 9C, and 9E, a reference point is also added at 90 degrees to the side.
図9では前方2chに加え、後方と側方にも基準点が存在する。四隅から1点を基準点とした場合、図9(a)に示すように変換先チャンネルの再生位置が5.1chとすると、側方のチャンネルが少し前に移動する。そこで、図9(b)に示すように側方90度には変換先チャンネルは存在しないが、基準点とすることで、後方チャンネルの再生位置によらず、側方チャンネルの再生位置を固定することができる。 In FIG. 9, in addition to the two front channels, there are also reference points on the rear and sides. If one point from the four corners is used as a reference point, and the playback position of the conversion destination channel is 5.1 ch as shown in FIG. 9A, the side channels move slightly forward. Therefore, as shown in FIG. 9B, although there is no conversion destination channel at 90 degrees to the side, by using it as a reference point, the playback position of the side channel is fixed regardless of the playback position of the rear channel. be able to.
また、図10に、±30度の変換先チャンネルの再生位置と±30度の変換元チャンネルの再生位置とを基準点とする場合(相対位置30度)において、変換元チャンネルの再生位置を変更する例を示す。変換元チャンネル及び変換先チャンネルのチャンネル数は図9と同じである。 Also, in FIG. 10, when the playback position of the conversion destination channel of ±30 degrees and the playback position of the conversion source channel of ±30 degrees are used as reference points (relative position of 30 degrees), the playback position of the conversion source channel is changed. Here is an example of The numbers of conversion source channels and conversion destination channels are the same as in FIG.
基準点をもとに再生位置を変更した後、基準点に対応する変換元・変換先チャンネル以外の、対象となる変換先チャンネルの近くに存在する変換元チャンネルの再生位置を変換先チャンネルと同位置に変更する。この際、再生位置を変更する変換元チャンネルの候補が複数ある場合、シンプルに角度差でもってより近い位置の変換元チャンネルを変更する角度差モードか(ステップS19)、角度比でみて最も偏っている変換元チャンネルを変更する角度比モード(ステップS20)を切り替える。ステップS19,20の切り替えは、デフォルト設定であらかじめ決めておいてもよいし、ユーザが決定してもよい。 After changing the playback position based on the reference point, the playback position of the conversion-source channel that exists near the target conversion-destination channel other than the conversion-source/conversion-destination channel corresponding to the reference point is changed to the same playback position as the conversion-destination channel. change to position. At this time, if there are a plurality of conversion-source channel candidates whose playback position is to be changed, either the angle-difference mode in which the conversion-source channel at a closer position is simply changed by the angle difference (step S19), or the conversion-source channel that is the most biased in terms of the angle ratio is selected. The angle ratio mode (step S20) for changing the conversion source channel is switched. Switching between steps S19 and S20 may be determined in advance by default settings, or may be determined by the user.
角度比モード(ステップS20)の場合、具体的には、対象となる変換先チャンネルに最も偏った位置に存在する変換元チャンネルの再生位置を変更する。まず、各変換元チャンネルの再生位置に対して、変換元チャンネルに隣接する2つの変換先チャンネルの再生位置となす角度の比を求める。この比は、対象となる変換元チャンネルが、隣接する2つの変換先チャンネルの間で、片側にどのくらい偏った位置に存在するかを示している。隣接する2つの変換先チャンネルの再生位置の一方への偏りが大きい変換元チャンネルの再生位置を、近接する変換先チャンネルの再生位置に変更する。 In the case of the angle ratio mode (step S20), specifically, the reproduction position of the conversion-source channel that exists at the position most skewed to the target conversion-destination channel is changed. First, the ratio of the angle between the reproduction position of each conversion-source channel and the reproduction positions of two conversion-destination channels adjacent to the conversion-source channel is obtained. This ratio indicates to what extent the conversion source channel of interest exists in a biased position to one side between two adjacent conversion destination channels. The reproduction position of the conversion source channel, which is largely biased toward one of the reproduction positions of the two adjacent conversion destination channels, is changed to the reproduction position of the adjacent conversion destination channel.
図11に、角度比モードの場合の再生位置の変換を行う例を示す。図11(a)に示すように、10chから5chに変換する場合、変換元チャンネルの90度の位置に存在するチャンネルに対しては、変換先チャンネルの30度と110度の位置に存在するチャンネルが隣接する。これらのチャンネルのなす角度の比は20度対60度である。また、変換元チャンネルの135度の位置に存在するチャンネルに対しては、変換先チャンネルの110度と250度の位置に存在するチャンネルが隣接する。これらのチャンネルのなす角度の比は25度対115度である。すなわち、変換元チャンネルの135度の位置に存在するチャンネルのほうが、変換元チャンネルの90度の位置に存在するチャンネルよりも、隣接する2つの変換先チャンネルの間における偏りが大きい。したがって、変換元チャンネルの±135度の位置に存在するチャンネルの再生位置を±110度に変換する。変換元チャンネルの残りのチャンネルについては変更しない。 FIG. 11 shows an example of converting the reproduction position in the angle ratio mode. As shown in FIG. 11(a), when converting from 10ch to 5ch, the channels present at 30 and 110 degrees from the conversion destination channel correspond to the channels present at 90 degrees from the source channel. is adjacent to The ratio of angles between these channels is 20 degrees to 60 degrees. Channels existing at positions of 110 degrees and 250 degrees of the conversion destination channel are adjacent to the channel existing at the position of 135 degrees from the conversion source channel. The angle ratio between these channels is 25 degrees to 115 degrees. That is, the channel existing at the 135-degree position of the conversion-source channel has a greater bias between the two adjacent conversion-destination channels than the channel existing at the 90-degree position of the conversion-source channel. Therefore, the reproduction position of the channel existing at the position of ±135 degrees from the conversion source channel is converted to ±110 degrees. The remaining channels of the conversion source channel are not changed.
同様に、図11(b)に示すように8chから4chに変換する場合、変換元チャンネルの±45度の位置に存在するチャンネルの再生位置を±30度に変換し、変換元チャンネルの±135度の位置に存在するチャンネルの再生位置を±110度に変換する。変換元チャンネルの残りのチャンネルについては変更しない。 Similarly, when converting from 8ch to 4ch as shown in FIG. The playback position of the channel existing at the position of degrees is converted to ±110 degrees. The remaining channels of the conversion source channel are not changed.
上記の例では、変換元チャンネルの再生位置と変換先チャンネルの再生位置の差の大小によらず、変換元チャンネルの再生位置を規定したが、ステップS17~18において、変換元チャンネルの再生位置と変換先チャンネルの再生位置の差が閾値以下である場合には、変換元チャンネルの再生位置を当該の変換先チャンネルの再生位置に変更してもよい。なお、この閾値は、前後左右の4範囲において異なる数値を用いてもよい。例えば、前方の閾値が15度で、後方の閾値が25度である場合、22.2ch音響の45度の前方チャンネルは5.1ch音響の30度、90度、135度の後方チャンネルは、ともに5.1ch音響の110度で再生されることになる。 In the above example, the reproduction position of the conversion-source channel is defined regardless of the difference between the reproduction position of the conversion-source channel and the reproduction position of the conversion-destination channel. If the difference in the playback position of the conversion destination channel is equal to or less than the threshold, the playback position of the conversion source channel may be changed to the playback position of the conversion destination channel. It should be noted that different numerical values may be used for this threshold in the four ranges of front, rear, left, and right. For example, if the front threshold is 15 degrees and the rear threshold is 25 degrees, the front channel of 45 degrees for 22.2 ch sound and the rear channels of 30 degrees, 90 degrees and 135 degrees for 5.1 ch sound are both It will be reproduced at 110 degrees of 5.1ch sound.
次に、図2に示すように、変更した変換元チャンネルの再生位置と変換先チャンネルの再生位置に基づいて、変換元チャンネルから再生される変換元マルチチャンネル音響信号の分配係数を規定する。2個の変換先チャンネルの再生位置に挟まれた変換元チャンネルは、該2個の変換先チャンネルに変換元マルチチャンネル音響信号を分配する。その際の係数を分配係数という。このとき、2個の変換先チャンネルの再生位置と変換元チャンネルの再生位置との位置関係(例えば、角度又は距離比)によって分配係数を規定する位置モード(ステップS21)と、2個の変換先チャンネルの再生位置に挟まれる変換元チャンネルの数によって分配係数を規定する数モード(ステップS22)とに動作モードを切り替える。ステップS21,22の切り替えは、デフォルト設定であらかじめ決めておいてもよいし、ユーザが決定してもよい。 Next, as shown in FIG. 2, the distribution coefficients of the original multi-channel acoustic signals reproduced from the original channels are defined based on the changed reproduction positions of the original channels and the changed reproduction positions of the destination channels. A source channel sandwiched between reproduction positions of two destination channels distributes a source multi-channel audio signal to the two destination channels. The coefficient at that time is called the distribution coefficient. At this time, a position mode (step S21) that defines distribution coefficients according to the positional relationship (for example, angle or distance ratio) between the reproduction positions of the two conversion destination channels and the reproduction position of the conversion source channel, and the two conversion destination The operation mode is switched to the number mode (step S22) in which the distribution coefficient is defined by the number of conversion source channels sandwiched between the reproduction positions of the channels. Switching between steps S21 and S22 may be determined in advance by default settings, or may be determined by the user.
図12は、位置モード(ステップS21)の場合の、分配係数の求め方の一例を説明する図である。位置モードでは、例えば、2個の変換先チャンネルのなす角(2θ0)とその中心から変換元チャンネルのなす角(θ1)によって、変換先チャンネルに配分する係数を算出する。係数の算出方法としては、Tan則や非特許文献3に記載されたVBAPなどの方法があるが、その方法は問わない。例えば、式(4)により分配係数wO1,wO2を決定する。 FIG. 12 is a diagram illustrating an example of how to obtain distribution coefficients in the position mode (step S21). In the position mode, for example, the coefficients to be distributed to the conversion destination channels are calculated from the angle (2θ 0 ) formed by the two conversion destination channels and the angle (θ 1 ) formed by the conversion source channel from its center. Methods for calculating coefficients include methods such as Tan's rule and VBAP described in Non-Patent Document 3, but any method may be used. For example, the distribution coefficients w 01 and w 02 are determined by equation (4).
一方、数モード(ステップS22)の場合には、2つの変換先チャンネルの再生位置に挟まれる変換元チャンネルの数がn個である場合、分母をn+1とし、分子を分配先の変換先チャンネルと逆側の変換先チャンネルから数えた変換元チャンネルの順番kとし、この分数の平方根である√(k/(n+1))を分配係数とする。 On the other hand, in the case of the number mode (step S22), when the number of conversion source channels sandwiched between the reproduction positions of two conversion destination channels is n, the denominator is n+1 and the numerator is the distribution destination conversion channel. Let k be the order of the conversion source channels counted from the conversion destination channel on the reverse side, and the square root of this fraction √(k/(n+1)) be the distribution coefficient.
図13は、数モードの場合の、チャンネル分配係数の求め方の一例を説明する図である。図13(a)に示すように、2つの変換先チャンネルO1,O2の再生位置に挟まれる変換元チャンネルの数が1個である場合、変換元チャンネルI1は変換先チャンネルO1、O2にそれぞれ√(1/2)=0.707の分配係数で割り振られる。 FIG. 13 is a diagram for explaining an example of how to obtain channel distribution coefficients in the case of the number mode. As shown in FIG. 13(a), when the number of source channels sandwiched between the playback positions of two destination channels O 1 and O 2 is one, the source channel I 1 is the destination channel O 1 , O 2 are each allocated with a partition coefficient of √(1/2)=0.707.
ここで、変換元チャンネルI1が変換先チャンネルO1,O2のいずれか一方に極端に偏っている場合には、変換元チャンネルI1と偏っていないほうの変換先チャンネルとの間に1個以上のダミーチャンネルを追加することで、2個以上の変換元チャンネルがある場合と同等の係数としてもよい。 Here, if the conversion source channel I 1 is extremely biased toward either one of the conversion destination channels O 1 and O 2 , 1 is between the conversion source channel I 1 and the conversion destination channel that is not biased. By adding 1 or more dummy channels, the coefficients may be the same as when there are 2 or more conversion source channels.
図13(b)に示すように、2つの変換先チャンネルO1,O2の再生位置に挟まれる変換元チャンネルの数が2個である場合、変換元チャンネルI3は変換先チャンネルO1、O2にそれぞれ√(2/3)=0.816(-1.76dB)、√(1/3)=0.577(-4.77dB)の係数で割り振られる。なお、変換先チャンネルI2の再生位置と変換元チャンネルO1の再生位置のように両者の位置が一致している場合には、分配係数を1.00とし、再生位置が一致している変換先チャンネルに割り振る。 As shown in FIG. 13(b), when the number of source channels sandwiched between the playback positions of the two destination channels O 1 and O 2 is two, the source channel I 3 is the destination channel O 1 , are allocated to O 2 by factors of √(2/3)=0.816 (-1.76 dB) and √(1/3)=0.577 (-4.77 dB), respectively. Note that when the positions of the conversion destination channel I2 and the conversion source channel O1 match , as in the case of the reproduction position of the conversion destination channel I2 and the conversion source channel O1, the distribution coefficient is set to 1.00, and the conversion Allocate to the destination channel.
いずれの場合においても、エネルギーを保存させるため、音響信号の分配係数の自乗和が1となるように係数を規定しているが、この係数に対して、変換先マルチチャンネル音響信号同士の再生位置の角度による総エネルギーの補正係数、変換元マルチチャンネル音響信号と変換先マルチチャンネル音響信号のチャンネル再生位置の層が異なることによる総エネルギーの補正係数、変換元マルチチャンネル音響信号と変換先マルチチャンネル音響信号の再生位置の前後が異なることによる総エネルギーの補正係数、変換元マルチチャンネル音響信号同士の類似性による総エネルギーの補正係数のうち、少なくとも一つを乗じるようにしてもよい。本実施例における変換元マルチチャンネル音響信号同士の類似性とは、同じ変換先チャンネルCに分配される変換元チャンネルAの音響信号と変換元チャンネルBの音響信号の相関などであり、変換前のAの音響信号とBの音響信号のエネルギーの和と、変換後のCの音響信号に含まれるAの音響信号とBの音響信号のエネルギーが等しくなるように補正係数を乗じることになる。 In either case, the coefficients are defined so that the sum of the squares of the distribution coefficients of the acoustic signals is 1 in order to conserve energy. Correction coefficient for total energy due to the angle of conversion, correction coefficient for total energy due to different layers of channel playback positions of source multichannel sound signal and destination multichannel sound signal, source multichannel sound signal and destination multichannel sound At least one of the total energy correction coefficient based on the difference between the signal reproduction positions before and after the signal reproduction position and the total energy correction coefficient based on the similarity between the original multi-channel acoustic signals may be multiplied. The similarity between the conversion source multi-channel acoustic signals in this embodiment is the correlation between the conversion source channel A acoustic signal and the conversion source channel B acoustic signal distributed to the same conversion destination channel C. The sum of the energies of the A and B acoustic signals is multiplied by a correction coefficient so that the energies of the A and B acoustic signals included in the converted C acoustic signal are equal.
例えば、変換先のチャンネル同士の再生位置が近い場合など、変換先チャンネルの再生位置によっては、エネルギーを保存しない方が聞いた印象が保持されることがある。そこで、変換元のチャンネルを等分配する場合には-1.5dB(係数0.841)となり、片側に大きく分配する場合には-0.75dB(係数0.917)となるように、補正係数を乗じてもよい。このとき、等分配するときの分配係数は-4.5dB(係数0.595(0.707×0.841))となり、変換先チャンネルO1に大きく割り振る場合はO1、O2それぞれ-2.5dB(係数0.749(0.816×0.917))、-5.5dB(係数0.530(0.577×0.917))となる。この他、上層や下層の変換元チャンネルを中層の変換先チャンネルで再生する場合において、後方の変換元チャンネルを前方の変換先チャンネルで再生するときに、総エネルギーを-1.5dBや-3.0dBとするなどの補正係数を乗じてもよい。また、LFE(低域効果音チャンネル)など相関が高い信号が含まれる可能性が高い複数の変換元チャンネルを同一の変換先チャンネルに統合する場合に、-3.0dB、-4.5dB、-6.0dBなどの補正係数を乗じてもよい。 For example, depending on the playback positions of the conversion destination channels, such as when the playback positions of the conversion destination channels are close to each other, the listening impression may be preserved if the energy is not preserved. Therefore, the correction coefficient is -1.5 dB (coefficient of 0.841) when the conversion source channels are equally distributed, and -0.75 dB (coefficient of 0.917) when distributed largely to one side. can be multiplied by At this time, the distribution coefficient for equal distribution is −4.5 dB (coefficient 0.595 (0.707×0.841)), and when a large allocation is made to conversion destination channel O 1 , −2 for each of O 1 and O 2 . 0.5 dB (coefficient 0.749 (0.816×0.917)) and −5.5 dB (coefficient 0.530 (0.577×0.917)). In addition, when the conversion source channels in the upper and lower layers are reproduced by the conversion destination channels in the middle layer, when the rear conversion source channels are reproduced by the front conversion destination channels, the total energy is -1.5 dB or -3. A correction coefficient such as 0 dB may be multiplied. Also, when integrating multiple conversion source channels that are likely to contain highly correlated signals such as LFE (low frequency effect channel) into the same conversion destination channel, -3.0 dB, -4.5 dB, - A correction factor such as 6.0 dB may be multiplied.
最後に、図2に示すように、各チャンネル数変換係数がある範囲に含まれる数値であった場合、代表値に置き換える丸め込みを行う(ステップS23)。出力信号生成部15は、このようにして導出されたチャンネル数変換係数からなるチャンネル数変換係数行列を用いて、チャンネル数変換処理を行う。分配係数に、上述した補正係数の乗算や丸め込みを行ったものをチャンネル数変換係数という。
Finally, as shown in FIG. 2, when each channel number conversion coefficient is a numerical value included in a certain range, rounding is performed to replace it with a representative value (step S23). The
図14に、音響信号の分配係数をデシベル表記したときにきりのよい数字となるように置き換える例を示す。例えば、√(1/2)=√(3/6)=0.707は0.1dB刻みで丸め込むと-3.0dBに相当し、√(1/4)=0.500は-6.0dBに相当する。このように代表値に置き換えることによって、精確な方向再現は失われるが、計算コストが軽くなると共に、変換先チャンネルの再生位置が少々異なっても同じ数値を使うことで汎用性が高くなる。 FIG. 14 shows an example of replacement so that the distribution coefficients of the acoustic signal are expressed in decibels so as to give a clear number. For example, √(1/2)=√(3/6)=0.707 is -3.0 dB when rounded in 0.1 dB steps, and √(1/4)=0.500 is -6.0 dB. corresponds to By replacing with the representative value in this way, accurate directional reproduction is lost, but the calculation cost is reduced, and versatility is increased by using the same numerical value even if the reproduction position of the conversion destination channel is slightly different.
以下、22.2ch音響(中層10ch、上層8ch、天井1ch、下層3ch)から、11.1ch(中層7ch、上層4ch)、9.1ch(中層5ch、上層4ch)、7.1ch音響(中層5ch、上層2ch)へのチャンネル数変換係数行列の導出例を示す。22.2ch音響の再生位置の例は、表1に示すとおりであり、変換元チャンネルのチャンネル順は式(5)のとおりになる(M=24)。
Below, from 22.2ch sound (middle layer 10ch, upper layer 8ch, ceiling 1ch, lower layer 3ch), 11.1ch (middle layer 7ch, upper layer 4ch), 9.1ch (middle layer 5ch, upper layer 4ch), 7.1ch sound (middle layer 5ch) ,
変換先チャンネルの再生位置の例を表2,3,4に示す。7.1ch音響の上層後方のチャンネルが存在しないため、中層の後方チャンネルが使用される。また、どの変換先チャンネル配置にも天井チャンネルが存在しないため、上層の四隅のチャンネルが使用される。また、下層チャンネルが存在しないため、下層の再生には中層チャンネルがそのまま使用される。 Tables 2, 3 and 4 show examples of the playback position of the destination channel. Since there is no upper layer rear channel for 7.1ch sound, the middle layer rear channel is used. Also, since there are no ceiling channels in any of the destination channel arrangements, the four corner channels on the top layer are used. Also, since there is no lower layer channel, the middle layer channel is used as it is for reproducing the lower layer.
7.1ch音響の変換先チャンネル順は、式(6)のとおりであり(N=8)、9.1ch音響の変換先チャンネル順は、式(7)のとおりであり(N=10)、11.1ch音響の変換先チャンネル順は、式(8)のとおりである(N=12)。 The conversion destination channel order of 7.1ch sound is as shown in formula (6) (N=8), the conversion destination channel order of 9.1ch sound is as shown in formula (7) (N=10), The conversion destination channel order of 11.1ch sound is as shown in Equation (8) (N=12).
次に、変換元チャンネルの再生位置の変換を行う。変換元チャンネルの再生位置をそのまま用いる場合は、上記表1のとおりである。ここでは、基準点に合わせて再生位置を変更する例を説明する。ここでは、四方にあるスピーカ位置を一致させる例を考える。 Next, the reproduction position of the conversion source channel is converted. When the playback position of the conversion source channel is used as it is, it is as shown in Table 1 above. Here, an example of changing the playback position in accordance with the reference point will be described. Here, consider an example in which the positions of four speakers are matched.
22.2ch音響を7.1ch(5.1+2ch)に変換する例を、表5に示す。変換元の中層60度を変換先30度へ変換する場合と中層30度を変換先30度へ変換する場合がある。また、変換元の上層45度を変換先30度、45度、90度へ変換する場合がある。上層の後方には変換先チャンネルが存在しないため、中層後方の変換先チャンネルの再生位置110度が用いられる。ただし、変換先の上層チャンネルが側方90度だった場合、前方、後方とも90度の再生位置が用いられる。 Table 5 shows an example of converting 22.2ch sound to 7.1ch (5.1+2ch). There are cases where the middle layer of 60 degrees of the conversion source is converted to the conversion destination of 30 degrees, and the middle layer of 30 degrees is converted to the conversion destination of 30 degrees. Also, the upper 45 degrees of the conversion source may be converted to the conversion destination of 30 degrees, 45 degrees, and 90 degrees. Since there is no conversion destination channel behind the upper layer, the reproduction position 110 degrees of the conversion destination channel behind the middle layer is used. However, if the upper layer channel of the conversion destination is 90 degrees to the side, the playback position of 90 degrees is used for both forward and backward.
22.2ch音響を9.1ch(5.1+4ch)に変換する例を、表6に示す。変換元の中層60度を変換先30度へ変換する場合と中層30度を変換先30度へ変換する場合がある。また、変換元の上層45度を変換先30度、45度へ変換する場合、変換元の上層135度を変換先の上層110度と135度に変換する場合がある。 Table 6 shows an example of converting 22.2ch sound to 9.1ch (5.1+4ch). There are cases where the middle layer of 60 degrees of the conversion source is converted to the conversion destination of 30 degrees, and the middle layer of 30 degrees is converted to the conversion destination of 30 degrees. Further, when the upper layer of 45 degrees of the conversion source is converted to the destination of 30 degrees and 45 degrees, the upper layer of 135 degrees of the conversion source may be converted to the upper layers of 110 degrees and 135 degrees of the conversion destination.
22.2ch音響を11.1ch(7.1+4ch)に変換する例を、表7に示す。変換元の中層60度を変換先30度へ変換する場合と中層30度を変換先30度へ変換する場合がある。また、変換元の上層45度を変換先30度、45度へ変換する場合、変換元の上層135度を変換先の上層110度と135度に変換する場合がある。 Table 7 shows an example of converting 22.2ch sound to 11.1ch (7.1+4ch). There are cases where the middle layer of 60 degrees of the conversion source is converted to the conversion destination of 30 degrees, and the middle layer of 30 degrees is converted to the conversion destination of 30 degrees. Further, when the upper layer of 45 degrees of the conversion source is converted to the destination of 30 degrees and 45 degrees, the upper layer of 135 degrees of the conversion source may be converted to the upper layers of 110 degrees and 135 degrees of the conversion destination.
また、四方4点の基準点に加え、側方90度を基準点として6点を基準点としたときの、22.2ch音響から7.1ch音響に変換する場合の例を表8に示し、22.2ch音響から9.1ch音響に変換する場合の例を表9に示し、22.2ch音響から11.1ch音響に変換する場合の例を表10に示す。 Table 8 shows an example of conversion from 22.2 ch sound to 7.1 ch sound when 6 points are used as reference points with 90 degrees on the side as reference points in addition to the four reference points in all four directions. Table 9 shows an example of conversion from 22.2ch sound to 9.1ch sound, and Table 10 shows an example of conversion from 22.2ch sound to 11.1ch sound.
次に、絶対位置、相対位置に対するチャンネル数変換係数行列の各要素を変換元チャンネル数に基づく場合と、変換先チャンネルの再生位置と変換元チャンネルの再生位置の角度に基づく場合とで導出する。ここで、角度に基づく係数は、Tan則を用いて算出した例である。 Next, each element of the channel number conversion coefficient matrix for absolute position and relative position is derived based on the number of conversion source channels and based on the angle between the reproduction position of the conversion destination channel and the reproduction position of the conversion source channel. Here, the angle-based coefficient is an example calculated using the Tan rule.
22.2ch音響から7.1ch音響へ変換する際のチャンネル数変換係数の例を、表11,12に示す。ここで、各列の上段は変換元である22.2ch音響のチャンネルの番号であり、各行の左端は変換先である7.1ch音響のチャンネルの番号である。 Tables 11 and 12 show examples of channel number conversion coefficients when converting from 22.2ch sound to 7.1ch sound. Here, the upper part of each column is the channel number of the 22.2 ch sound that is the conversion source, and the left end of each row is the number of the 7.1 ch sound that is the conversion destination.
22.2ch音響から7.1ch音響へ変換する際のチャンネル数変換係数の例を表13~16に示す。ここで、Oは絶対位置を意味し、R1は相対位置30度を30度へ,135度を110度へを意味し、R2は相対位置30度を30度へ,90度固定,135度を110度へを意味し、R3は相対位置60度を30度へ,135度を110度へを意味し、R4は相対位置60度を30度へ,90度固定,135度を110度へを意味する。また、上層について、Aは30度と110度を意味し、OAは絶対位置を意味し、RA1は相対位置45度を30度へ,135度を110度へを意味し、RA2は相対位置45度を30度へ,90度固定,135度を110度へを意味し、Bは45度と110度を、OBは絶対位置を、RB1は相対位置45度を45度へ,135度を110度へを意味し、RB2は相対位置45度を45度へ,90度固定,135度を110度へを意味し、Cは90度を意味し、OCは絶対位置を意味し、RC1は相対位置45度を90度へ,135度を90度へを意味し、Nは変換元チャンネル数意味しを、Pは再生位置を意味する。また、例えば「O,N」はチャンネル数変換係数を決めるときに、変換元と変換先の位置を絶対位置で決め、分配係数を変換元のチャンネル数で決めるという条件で算出したことを意味する。
Tables 13 to 16 show examples of channel number conversion coefficients when converting from 22.2ch sound to 7.1ch sound. Here, O means absolute position, R1 means relative position 30 degrees to 30 degrees, 135 degrees to 110 degrees, R2 means relative position 30 degrees to 30 degrees, 90 degrees fixed, 135 degrees R3 means
また、22.2ch音響から9.1ch音響へ変換する際のチャンネル数変換係数の例を表17に示す。各列の上段は変換元である22.2ch音響のチャンネルの番号であり、各行の左端は変換先である。 Table 17 shows an example of channel number conversion coefficients when converting from 22.2ch sound to 9.1ch sound. The upper part of each column is the channel number of the 22.2 ch sound that is the conversion source, and the left end of each row is the conversion destination.
22.2ch音響の中層、下層から9.1ch音響へのチャンネル数変換係数は、7.1chの場合(表13、表16)と同じである。22.2ch音響の上層から9.1ch音響へ変換する際のチャンネル数変換係数の例を表18に示す。ここで、Aは30度と110度を意味し、OAは絶対位置を意味し、RA1は相対位置45度を30度へ,135度を110度へを意味し、RA2は相対位置45度を30度へ,90度固定,135度を110度へを意味し、Bは45度と110度を意味し、OBは絶対位置を意味し、RB1は相対位置45度を45度へ,135度を110度へを意味し、RB2は相対位置45度を45度へ,90度固定,135度を110度へを意味し、Dは45度と135度を意味し、ODは絶対位置=相対位置45度を45度へ,135度を135度へを意味し、Nは変換元チャンネル数を意味し、Pは再生位置を意味する。
The channel number conversion coefficients from middle and lower layers of 22.2 ch sound to 9.1 ch sound are the same as in the case of 7.1 ch (Tables 13 and 16). Table 18 shows an example of channel number conversion coefficients when converting from the upper layer of 22.2ch sound to 9.1ch sound. where A means 30 degrees and 110 degrees, O A means absolute position,
22.2ch音響から11.1ch音響へのチャンネル数変換係数の例を表19に示す。ここで、各列の上段は変換元である22.2ch音響のチャンネルの番号であり、各行の左端は変換先である11.1ch音響のチャンネルの番号である。 Table 19 shows an example of channel number conversion coefficients from 22.2ch sound to 11.1ch sound. Here, the upper part of each column is the channel number of the 22.2 ch sound that is the conversion source, and the left end of each row is the number of the 11.1 ch sound that is the conversion destination.
22.2ch音響の上層から11.1ch音響へのチャンネル数変換係数は、9.1chの場合(表18)と同じである。ここで、Oは絶対位置を意味し、R5は相対位置30度を30度へを意味し、R6は相対位置30度を30度へ,90度固定を意味し、R7は相対位置60度を30度へを意味し、R8は相対位置60度を30度へ,90度固定を意味し、Nは変換元チャンネル数を意味し、Pは再生位置を意味する。また、添え字のBtは、下層(ボトム層)だけを抜き出していることを意味する。
The channel number conversion coefficient from the upper layer of 22.2ch sound to 11.1ch sound is the same as in the case of 9.1ch (Table 18). Here, O means absolute position, R5 means relative position 30 degrees to 30 degrees, R6 means relative position 30 degrees to 30 degrees, 90 degrees fixed, R7 means
チャンネル数変換を実施するとき、精緻な角度を保存するよりも係数の簡略化が望まれる場合がある。そこで、ある一定範囲の係数を代表値に置き換えることで、チャンネル数変換の簡略化が可能である。そこで、表22に、0.5dB単位で段階的にチャンネル数変換係数を導出する例を示す。0.5dB単位でチャンネル数変換係数を乗じた場合(上段)に、対応するチャンネルにエネルギーを保存するように乗じる必要があるチャンネル数変換係数を示す(下段)。 When performing a channel number transform, simplification of coefficients may be desired rather than preserving precise angles. Therefore, it is possible to simplify the conversion of the number of channels by replacing coefficients in a certain range with representative values. Therefore, Table 22 shows an example of deriving channel number conversion coefficients step by step in units of 0.5 dB. When multiplied by the channel number conversion factor in units of 0.5 dB (top), the channel number conversion factor that needs to be multiplied to conserve energy in the corresponding channel is shown (bottom).
表23に1.5dBなどのきりのよい数値で代表値を指定した場合のチャンネル数変換係数を示す。この数値はある空間を7分割した場合の中央5段階で代表値を量子化した数値に近い。 Table 23 shows channel number conversion coefficients when a representative value is specified with a good numerical value such as 1.5 dB. This numerical value is close to the numerical value obtained by quantizing the representative value in the central five steps when a certain space is divided into seven.
1.5dB単位のチャンネル数変換係数の代表値を指定した場合、表13~16,18,20,21で示した各チャンネル数変換係数の値は、それぞれ表24~30のようになる。 When the representative values of the channel number conversion coefficients in units of 1.5 dB are specified, the values of the channel number conversion coefficients shown in Tables 13-16, 18, 20 and 21 are as shown in Tables 24-30, respectively.
ここでは、5段階の代表値の例を示したが、表31に示すように代表値を細分化してもよい。 Here, an example of five levels of representative values is shown, but the representative values may be subdivided as shown in Table 31.
また、本実施形態では、エネルギーを保存するように信号を分配したが、音響信号を分配した場合に元の信号よりも大きく知覚される場合があるため、エネルギーを減少させてもよい。例えば、等分に分配する場合に-1.5dBし、片側に近づくと元のエネルギーに戻るとする。その場合、表23の代表値は例えば表32のようになる。 Also, in this embodiment, the signal is distributed so as to conserve energy, but when the acoustic signal is distributed, it may be perceived as being louder than the original signal, so the energy may be reduced. For example, assume that the energy is -1.5 dB when distributed equally, and returns to the original energy when approaching one side. In that case, the representative values of Table 23 are as shown in Table 32, for example.
(実施例1)
次に、図2において、変換先チャンネルの各分割層を前後左右の4範囲に分割するステップS13を選択し、FL/FR/BL/BRを四隅の基準点として指定した後、各基準点に対する相対関係が一致するように配置するステップS18(相対位置モード)を選択し、さらに2個の変換先チャンネルの再生位置に挟まれる変換元チャンネル数によって係数を規定するステップS22(数モード)を選択した場合を実施例1として、実施例1に係る音響処理装置1の動作について説明する。
(Example 1)
Next, in FIG. 2, select step S13 for dividing each divided layer of the conversion destination channel into four ranges of front, rear, left, and right. Select step S18 (relative position mode) for arranging so that the relative relationships match, and further select step S22 (number mode) for prescribing coefficients according to the number of conversion source channels sandwiched between the reproduction positions of two conversion destination channels. The operation of the
図15は、実施例1に係る音響処理装置1によるチャンネル数変換係数を導出する手順を示すフローチャートである。
FIG. 15 is a flow chart showing a procedure for deriving channel number conversion coefficients by the
まず、変換元と変換先のチャンネル数及びスピーカ配置(再生位置)を比較し(ステップS101)、伝送されたチャンネル数変換係数があるか否かを判定する(ステップS102)。伝送されたチャンネル数変換係数がある場合には、このチャンネル数変換係数を用いるため、処理を終了する。次に、音響処理装置1のシステム内部に保存されたチャンネル数変換係数値があるか否かを判定する(ステップS103)。システム内部に保存されたチャンネル数変換係数値がある場合にも、この処理を終了する。 First, the number of channels and speaker arrangement (playback position) of the conversion source and the conversion destination are compared (step S101), and it is determined whether or not there is a transmitted channel number conversion coefficient (step S102). If there is a transmitted channel number conversion coefficient, this channel number conversion coefficient is used, so the process ends. Next, it is determined whether or not there is a channel number conversion coefficient value stored inside the system of the sound processing device 1 (step S103). This process is also terminated if there are channel number transform coefficient values stored inside the system.
すなわち、チャンネル数変換係数は、他から事前に得られた係数値がない場合に用いられるものであり、変換元マルチチャンネル音響信号と合わせて受信したチャンネル数変換係数や、音響処理装置1の内部に記憶されたチャンネル数変換係数がある場合には、それらの値がチャンネル数の変換に用いられる。 That is, the channel number conversion coefficient is used when there is no other coefficient value obtained in advance, and the channel number conversion coefficient received together with the conversion source multichannel sound signal, the internal If there are channel number conversion coefficients stored in , their values are used for the channel number conversion.
チャンネル数変換係数を導出するには、まず変換先チャンネルの再生位置を仰角方向の複数層に分割する(ステップS104)。例えば、22.2ch音響では下層、中層、上層、頭上(仰角90度)の4層とし、7.1ch音響A(音声モード2/0/0-3/0/2)や9.1ch音響(音声モード2/0/2-3/0/2)、11.1ch音響(音声モード2/0/2-3/2/2)では中層、上層の2層とする。
To derive the channel number conversion coefficient, first, the reproduction position of the conversion destination channel is divided into a plurality of layers in the elevation direction (step S104). For example, for 22.2 ch sound, there are four layers: lower layer, middle layer, upper layer, and overhead (elevation angle 90 degrees). In
その後、変換元チャンネルの各分割層を前後左右(横断面、正中面)4つの範囲に分割する(ステップS105)。ここで、4分割した範囲に変換先チャンネルの再生位置が存在しない場合には、隣接する層の変換先チャンネルの再生位置を当該層の再生位置と定める(ステップS106)。ただし、頭上(仰角90度)といった1点のみで構成される層に関しては除外する。例えば、7.1ch音響では、変換先チャンネル配置の上層後方にチャンネルがないため、中層の後方チャンネルが上層の再生にも用いられる。また、7.1ch音響Aや9.1ch音響、11.1ch音響は下層を持たないため、変換元チャンネルが下層のチャンネルを持つ場合には、それらのチャンネルの再生には中層を用いる。 After that, each divided layer of the conversion source channel is divided into four ranges in the front, rear, left, and right (cross plane, median plane) (step S105). Here, if the reproduction position of the conversion destination channel does not exist in the four-divided range, the reproduction position of the conversion destination channel in the adjacent layer is determined as the reproduction position of the layer (step S106). However, a layer composed of only one point such as overhead (90 degrees elevation angle) is excluded. For example, in 7.1ch sound, since there is no channel in the upper rear layer of the conversion destination channel arrangement, the rear channel in the middle layer is also used for reproduction of the upper layer. Also, since 7.1ch sound A, 9.1ch sound, and 11.1ch sound do not have a lower layer, if the conversion source channel has a lower layer channel, the middle layer is used for reproduction of those channels.
次に、変換元チャンネルの再生位置を変換先チャンネルの各分割層上に配置する(ステップS107)。 Next, the reproduction position of the conversion source channel is arranged on each divided layer of the conversion destination channel (step S107).
頭上(仰角90度)といった1点のみの層に関して、変換先チャンネルに再生位置が存在しない場合には、前後左右4範囲の変換先チャンネルのうち、それぞれ4隅(方位角45度と135度)の基準点となる変換先チャンネルの再生位置各1点を使用する(ステップS108)。例えば、22.2ch音響の頭上(仰角90度)にあるTpCは、変換先である7.1ch音響Aや9.1ch音響、11.1ch音響に再生位置を持たない。よって変換先のそれぞれ4隅(方位角45度と135度)付近にある変換先チャンネルの再生位置を利用することになり、9.1ch音響や11.1ch音響では上層の4チャンネル、7.1ch音響Aでは上層の2チャンネル及び中層後方の2チャンネルに分配する。 For a layer with only one point such as overhead (90 degrees elevation angle), if there is no playback position in the conversion destination channel, the four corners (azimuth angles 45 degrees and 135 degrees) of the four conversion destination channels in the front, back, left and right One point for each reproduction position of the conversion destination channel is used as a reference point for the conversion destination channel (step S108). For example, TpC located above the 22.2ch sound (90 degrees elevation angle) does not have a reproduction position in the conversion destination 7.1ch sound A, 9.1ch sound, or 11.1ch sound. Therefore, the playback positions of the conversion destination channels near the four corners (azimuth angles of 45 degrees and 135 degrees) of the conversion destination are used. The sound A is distributed to two channels in the upper layer and two channels in the rear middle layer.
基準点の決定方法は、まず、変換元・変換先の同じ位置にチャンネルが存在する場合は、当該チャンネルを基準点と定める(ステップS109)。例えば、22.2ch音響から7.1ch音響A、あるいは9.1ch音響へ変換する場合、変換先である7.1ch音響A、9.1ch音響では、中層の方位角0度及び±30度にあるチャンネルが基準点と定まる。このままでは上層の4範囲、及び中層の後方2範囲に基準点がないので、変換元及び変換先チャンネルの残る基準点を定める。 As for the method of determining the reference point, first, if a channel exists at the same position of the conversion source and the conversion destination, the channel is determined as the reference point (step S109). For example, when converting from 22.2 ch sound to 7.1 ch sound A or 9.1 ch sound, the 7.1 ch sound A and 9.1 ch sound, which are conversion destinations, are converted to azimuth angles of 0 degrees and ±30 degrees in the middle layer. A certain channel is defined as a reference point. Since there are no reference points in the upper 4 ranges and the lower 2 ranges in the middle layer, the remaining reference points of the conversion source and conversion destination channels are determined.
横断面、正中面のチャンネルを除く各分割層の4範囲それぞれの中で同じ位置にチャンネルが一つも存在しない場合には、前方の2範囲は前面(0<再生位置≦60度)、後方の2範囲は側面(90度<再生位置≦135度)に近いチャンネルを基準点と定める(ステップS109)。例えば、変換元の22.2ch音響では、上層前方は45度の位置、後方は135度の位置のチャンネルが基準点となる。一方、変換先チャンネルでは、上層前方2範囲の基準点(0度<再生位置≦60度のうち45度に最も近い点)としては30度の位置、上層及び中層の後方2範囲の基準点(90度<再生位置≦135度のうち135度に最も近い点)としては110度の位置のチャンネルが該当する。
If there is no channel at the same position in each of the four regions of each divided layer except for the channels in the transverse plane and the median plane, the front two ranges are the front (0 < playback position ≤ 60 degrees) and the rear For
なお、45度に対して30度と60度など、同じ近さに複数のチャンネルが存在する場合は、元の角度が小さい方(30度)のチャンネルを基準点とする(ステップS109)。なお、この前方は前面、後方は側面という基準点の取り方は、人間の聴覚上の特性、及びそれを考慮してスピーカ配置が決定された5.1ch音響、及び22.2ch音響の考えに基づいている。 If a plurality of channels exist in the same proximity such as 30 degrees and 60 degrees to 45 degrees, the channel with the smaller original angle (30 degrees) is set as the reference point (step S109). It should be noted that the method of taking the reference points of the front as the front and the side as the rear is based on the characteristics of human hearing, and the concept of 5.1ch sound and 22.2ch sound, in which the speaker placement was determined in consideration of these characteristics. Based on
基準点を定めるにあたって、前方基準点指定情報がある場合には、これをもとに前方2範囲の基準点にあたるチャンネルをステップS109で求めた基準点から別の基準点に切り替える(ステップS110)。例えば、画面の両端に対応するチャンネルの示す情報を前方基準点指定情報とする場合、位置情報とは関係なく、変換元と変換先の画面の両端に対応するチャンネルをそれぞれ、前方2範囲の基準点と差し替える。変換元が22.2ch音響の場合は、中層の±60度のチャンネルを基準点にとりたいケースが主に考えられる。 When determining the reference point, if there is forward reference point designation information, the channels corresponding to the reference points in the two front ranges are switched from the reference point obtained in step S109 to another reference point (step S110). For example, if the information indicated by the channels corresponding to both ends of the screen is used as the front reference point designation information, the channels corresponding to both ends of the conversion source and conversion destination screens are used as the reference points of the two front ranges, respectively, regardless of the position information. replace the points. When the conversion source is 22.2 ch sound, it is mainly considered that the channel of ±60 degrees in the middle layer is desired to be used as the reference point.
基準点が定まったところで、定まった変換元と変換先の基準点の再生位置が一致するよう、変換元基準点の再生位置を変更する(ステップS111)。例えば、22.2ch音響の基準点となるチャンネルの再生位置をそれぞれ、45度を30度に、135度を110度に変更する。前方基準点切り換え情報によって変換元である22.2ch音響の中層前方の基準点を±60度のチャンネルに変更していた場合、60度を30度に変更し、合わせて22.2ch音響の30度にあったチャンネルの再生位置を15度に変更する。 When the reference point is determined, the reproduction position of the conversion-source reference point is changed so that the reproduction positions of the determined conversion-source and conversion-destination reference points match (step S111). For example, the playback positions of the channels that are the reference points of the 22.2ch sound are changed from 45 degrees to 30 degrees and from 135 degrees to 110 degrees. If the reference point in the middle layer front of the 22.2 ch sound, which is the conversion source, has been changed to a channel of ±60 degrees by the front reference point switching information, 60 degrees is changed to 30 degrees, and the total of 30 degrees of the 22.2 ch sound is changed. Change the playback position of the channel that was at the same time to 15 degrees.
また、横断面、正中面のチャンネルを除く各分割層内4範囲の中で基準点とならなかった変換元チャンネルに関しても、元のスピーカ間の距離比が保たれるよう、基準点が変化した割合に従って同様に再生位置を変更する。変換先の7.1ch音響Aや9.1ch音響、11.1ch音響はすべてのチャンネルが基準点となり、このステップで再生位置が変更されるチャンネルはない。このように、現在提案されている多くのフォーマットではほぼすべてのチャンネルが基準点となり、この段階で再生位置を変更するケースは少ないと考えられる。 In addition, the reference point was changed so that the original distance ratio between the speakers was maintained even for the conversion source channel that did not become the reference point in the four ranges in each divided layer except for the channel on the cross section and the median plane. Similarly change the playback position according to the ratio. All channels of the 7.1ch audio A, 9.1ch audio, and 11.1ch audio of the conversion destination are reference points, and there is no channel whose reproduction position is changed in this step. In this way, in most of the currently proposed formats, almost all channels serve as reference points, and it is thought that there are few cases where the playback position is changed at this stage.
次に、横断面、正中面のチャンネルを除く各分割層内4範囲の中で、変換先チャンネルの再生位置それぞれにつき、最も角度差の小さい変換元チャンネルの再生位置を変更(ロック)する(ステップS112)。なお、基準点として定めたチャンネルはすでに再生位置が一致しているので、ここで再生位置が変更されるのは、4範囲の中にあり、かつ基準点とならなかった変換元チャンネルのみとなる。 Next, among the four regions within each divided layer excluding the channels of the transverse plane and median plane, the reproduction position of the conversion source channel with the smallest angle difference is changed (locked) for each of the reproduction positions of the conversion destination channel (step S112). Since the playback positions of the channels set as the reference points already match, the playback positions are changed here only for the conversion source channels that are within the four ranges and that did not become the reference points. .
仮想音源で表現するチャンネルが決定した後、具体的な係数値を規定する。各チャンネルの識別性を上げるため、再生する変換先チャンネル間に存在する変換元チャンネルの数によって係数値を決定し、再生する変換先チャンネルの間に均等に配置し直す(ステップS113)。変換元チャンネルのエネルギーと変換先チャンネルのエネルギーを一致させるよう、音響信号の分配係数の自乗和が1となるように係数を規定すると、下記の表33のようになる。 After the channel to be represented by the virtual sound source is determined, specific coefficient values are specified. In order to increase the identifiability of each channel, the coefficient values are determined according to the number of conversion source channels existing between the conversion destination channels to be reproduced, and are evenly re-arranged between the conversion destination channels to be reproduced (step S113). If the coefficients are defined so that the sum of the squares of the distribution coefficients of the acoustic signals is 1 so that the energy of the source channel and the energy of the destination channel are matched, the coefficients are as shown in Table 33 below.
本手法で得られた真数値を、デシベル表記した際にきりのよい値となるよう丸め込みを行ってもよい(ステップS114)。例えば、MPEG-4 AACで22.2chの音響信号を伝送する場合は1.5dB刻みの値を用いるため、1/√2は-3dB、1/√3は-4.5dB、√(2/3)は-1.5dBに丸め込む。デシベル表記した際の丸め込みの度合いにより、本手法の計算によって得られた真数値、あるいは例示した丸め込み例の値とは完全には一致しなくなることが考えられるが、例えば±0.05程度の範囲のような、ある程度の数値のズレは本式に規定する関係に含まれるものとする。 The antilogarithmic value obtained by this method may be rounded so that it becomes a good value when expressed in decibels (step S114). For example, when transmitting 22.2 ch audio signals in MPEG-4 AAC, values are used in increments of 1.5 dB, so 1/√2 is -3 dB, 1/√3 is -4.5 dB, 3) rounds to -1.5 dB. Depending on the degree of rounding when expressed in decibels, it is conceivable that the exact numerical value obtained by the calculation of this method or the value of the rounding example shown in the example may not match completely, but within a range of about ±0.05, for example. A certain amount of deviation in numerical values such as is included in the relationship defined in this formula.
次に、音声モードがマルチチャンネルステレオ(3/3/3-5/2/3-3/0/0.2)であり、マルチチャンネルステレオ(3/2.1)を超えたマルチチャンネルステレオで出力する場合の、復号後のマルチチャンネルステレオの音響信号に対して乗じるチャンネル数変換係数を、図15に示した手順で導出したときの値を、表35~46に示す。表35~46中の記号a~jに入る値を、表34に示す。dmix_pos_adj_idxは前述の前方基準点指定情報の例であり、表34はこの前方基準点指定情報によって基準点が切り替わったことによるチャンネル数変換係数の変化を表している。dmix_pos_adj_idxが初めて送出されるまではdmix_pos_adj_idx=0と同様の値を用いる。 Next, the audio mode is multi-channel stereo (3/3/3-5/2/3-3/0/0.2), and in multi-channel stereo beyond multi-channel stereo (3/2.1) Tables 35 to 46 show the values of the conversion coefficients for the number of channels to be multiplied by the decoded multi-channel stereo sound signal for output, derived according to the procedure shown in FIG. Table 34 shows the values that fall within symbols a through j in Tables 35-46. dmix_pos_adj_idx is an example of the front reference point designation information described above, and Table 34 shows changes in channel number conversion coefficients due to switching of reference points according to this front reference point designation information. Use a value similar to dmix_pos_adj_idx=0 until dmix_pos_adj_idx is sent for the first time.
表35は、マルチチャンネルステレオ(2/0/0-3/0/2-0.1)、ITU-R BS.2051に記載のsound system C、ISO/IEC 23008-3に記載のChannel configuration 14で出力する場合のチャンネル数変換係数である。
Table 35 shows multi-channel stereo (2/0/0-3/0/2-0.1), sound system C according to ITU-R BS.2051,
表36は、マルチチャンネルステレオ(3/2/2.1)、ITU-R BS.2051に記載のsound system I、ISO/IEC 23008-3に記載のChannel configuration 12で出力する場合のチャンネル数変換係数である。
Table 36 shows channel number conversion when outputting with multichannel stereo (3/2/2.1), sound system I described in ITU-R BS.2051, and
表37は、マルチチャンネルステレオ(3/3.1)、ISO/IEC 23008-3に記載のChannel configuration 11で出力する場合のチャンネル数変換係数である。
Table 37 shows channel number conversion coefficients when outputting in multichannel stereo (3/3.1),
表38は、マルチチャンネルステレオ(5/2.1)、ISO/IEC 23008-3に記載のChannel configuration 7で出力する場合のチャンネル数変換係数である。
Table 38 shows channel number conversion coefficients when outputting in multichannel stereo (5/2.1),
表39は、ITU-R勧告BS.2051に記載のsound system D、ISO/IEC 23008-3に記載のChannel configuration 16で出力する場合のチャンネル数変換係数である。 Table 39 shows channel number conversion coefficients when outputting with sound system D described in ITU-R Recommendation BS.2051 and Channel configuration 16 described in ISO/IEC 23008-3.
表40は、ITU-R勧告BS.2051に記載のsound system Eで出力する場合のチャンネル数変換係数である。 Table 40 shows channel number conversion coefficients when outputting with sound system E described in ITU-R recommendation BS.2051.
表41は、ITU-R勧告BS.2051に記載のsound system F、ISO/IEC 23008-3に記載のChannel configuration 15で出力する場合のチャンネル数変換係数である。
Table 41 shows channel number conversion coefficients when outputting with sound system F described in ITU-R Recommendation BS.2051 and
表42は、ITU-R勧告BS.2051に記載のsound system G 、ISO/IEC 23008-3に記載のChannel configuration 20で出力する場合(ただし、ディスプレイがLRの内側にあるとき)のチャンネル数変換係数である。 Table 42 shows channel number conversion when outputting with sound system G described in ITU-R recommendation BS.2051 and Channel configuration 20 described in ISO/IEC 23008-3 (when the display is inside LR) is the coefficient.
表43は、ITU-R勧告BS.2051に記載のsound system J、ISO/IEC 23008-3に記載のChannel configuration 19で出力する場合のチャンネル数変換係数である。 Table 43 shows channel number conversion coefficients when outputting with sound system J described in ITU-R Recommendation BS.2051 and Channel configuration 19 described in ISO/IEC 23008-3.
表44は、ISO/IEC 23008-3に記載のChannel configuration 17で出力する場合のチャンネル数変換係数である。 Table 44 shows channel number conversion coefficients when outputting with Channel configuration 17 described in ISO/IEC 23008-3.
表45は、ISO/IEC 23008-3に記載のChannel configuration 18で出力する場合のチャンネル数変換係数である。 Table 45 shows channel number conversion coefficients when outputting with Channel configuration 18 described in ISO/IEC 23008-3.
表46は、マルチチャンネルステレオ(2/0/0-3/2/2-0.1)で出力する場合のチャンネル数変換係数である。 Table 46 shows channel number conversion coefficients when outputting in multichannel stereo (2/0/0-3/2/2-0.1).
(実施例2)
次に、図2において、変換先チャンネルの各分割層を前後左右の4範囲に分割するステップS13を選択し、FL/FRを基準点として指定した後、基準点に対応する変換元・変換先チャンネル以外の対象となる変換先チャンネルに最も偏った位置に存在する変換元チャンネルの再生位置を変換先チャンネルと同位置に変更するステップS18(相対位置モード)を選択し、さらに2個の変換先チャンネルの再生位置に挟まれる変換元チャンネル数によって係数を規定するステップS22(数モード)を選択した場合を実施例2として、実施例2に係る音響処理装置1の動作について説明する。
(Example 2)
Next, in FIG. 2, select step S13 for dividing each divided layer of the conversion destination channel into four ranges of front, back, left, and right, specify FL/FR as the reference point, and then Select step S18 (relative position mode) for changing the reproduction position of the conversion source channel, which is located at the most biased position to the target conversion destination channel other than the channel, to the same position as the conversion destination channel (relative position mode), and select two conversion destinations. The operation of the
図16は、実施例2に係る音響処理装置1によるチャンネル数変換係数を導出する手順を示すフローチャートである。ステップS201~208,212,213は、それぞれ実施例1で説明したステップS101~108,113,114と同じであるため説明を省略し、ステップS209~211についてのみ説明する。
FIG. 16 is a flow chart showing a procedure for deriving channel number conversion coefficients by the
ステップS209では、前方基準点指定情報がある場合、この情報によって前方両端にあたる基準点を指定する。ステップS210では、変換元と変換先の基準点の再生位置が一致するよう、変換元基準点の再生位置を変更する。つまり、変換先の前方両端となるチャンネルの再生位置に変換元の前方両端のチャンネルの再生位置を変更し、その間に挟まれる変換元チャンネルも、もともとのチャンネル間の距離比を保つよう再生位置を変更する。例えば、22.2ch音響から7.1ch音響に変換する場合、22.2ch音響の前方両端は方位角±60度の位置のFL、FRであり、7.1ch音響は±30度のL、Rである。この場合FL、FRの再生位置を30度に変更し、その間にあったFLc、FRcは距離比を保ったまま再生位置を変更し、15度の位置に置き直す。 In step S209, if there is front reference point designation information, the front end reference points are designated by this information. In step S210, the reproduction position of the conversion-source reference point is changed so that the reproduction positions of the conversion-source and conversion-destination reference points match. In other words, the playback positions of the front end channels of the conversion source are changed to the playback positions of the channels at the front ends of the conversion destination. change. For example, when converting from 22.2ch sound to 7.1ch sound, both front ends of 22.2ch sound are FL and FR at azimuth angles of ±60 degrees, and 7.1ch sound is L and R at ±30 degrees. is. In this case, the playback positions of FL and FR are changed to 30 degrees, and the playback positions of FLc and FRc between them are changed while maintaining the distance ratio, and repositioned to the position of 15 degrees.
ステップS211では、各分割層内の変換先チャンネルの再生位置に角度比で最も偏った変換元チャンネルの再生位置を変更(ロック)する。例えば、22.2ch音響から7.1ch音響(5.1+2ch)、あるいは9.1ch音響(5.1+4ch)へ変換する場合、変換先である7.1ch音響、9.1ch音響では中層後方に、聴取者正面を0度として110度の位置にチャンネルがあり、変換元である22.2ch音響はその近傍では90度と135度の位置にチャンネルを持つ。ここで変換元の90度と135度のどちらのチャンネルを、変換先110度の位置に再生位置を変更するかを求める。90度の位置にある変換元チャンネルに隣接する2つの変換先チャンネルは30度、110度の位置にあり、変換元チャンネルとなす角度はそれぞれ60度と20度である。これは比率でみると3:1となり、90度の変換元チャンネルは、30度と110度の変換先チャンネルの間で、3:1だけ偏っていると言える。同様に135度のチャンネルは、隣接する110度と250度の変換先チャンネルの間で、4.8:1で偏っていると言える。これにより、110度の変換先チャンネルにより偏っており、再生位置を変更すべき変換元チャンネルは、135度のチャンネルと決まる。このとき、物理的に110度により近い位置にあるのは90度のスピーカであるが、仮に90度のチャンネルの位置を変更し135度のチャンネルを仮想音源として表現すると定めると、110度と250度という大きく開いた変換先チャンネルの中で大きく偏った位置にある仮想音源を表現することになり、聴感上135度のチャンネルの音像や定位感が大きく劣化し得る。より偏りの少ないチャンネルを再生位置を変更するチャンネルとして選択しているのは、このように各チャンネルの全体的な印象の劣化を抑えるためである。 In step S211, the reproduction position of the conversion-source channel that is most biased in angle ratio to the reproduction position of the conversion-destination channel in each divided layer is changed (locked). For example, when converting from 22.2ch sound to 7.1ch sound (5.1+2ch) or 9.1ch sound (5.1+4ch), in the conversion destination 7.1ch sound and 9.1ch sound, A channel is located at a position of 110 degrees with the front of the listener being 0 degrees, and the 22.2ch sound that is the conversion source has channels at a position of 90 degrees and 135 degrees in the vicinity thereof. Here, it is determined which of the 90-degree and 135-degree channels of the conversion source is to be changed to the 110-degree position of the conversion destination. The two destination channels adjacent to the source channel positioned at 90 degrees are positioned at 30 degrees and 110 degrees, and the angles formed with the source channel are 60 degrees and 20 degrees, respectively. The ratio is 3:1, and it can be said that the 90-degree source channel is biased by 3:1 between the 30-degree and 110-degree destination channels. Similarly, the 135-degree channel can be said to be skewed 4.8:1 between the adjacent 110-degree and 250-degree destination channels. As a result, the 135-degree channel is determined as the conversion-source channel whose reproduction position is to be changed because the conversion destination channel is biased toward the 110-degree conversion destination channel. At this time, the 90-degree speaker is physically closer to 110 degrees. A virtual sound source at a position that is greatly biased in the conversion destination channel, which is wide open at 135 degrees, is expressed, and the sound image and localization of the 135-degree channel can be greatly degraded. The reason why the channel with less bias is selected as the channel for changing the reproduction position is to suppress deterioration of the overall impression of each channel.
音声モードがマルチチャンネルステレオ(3/3/3-5/2/3-3/0/0.2)であり、マルチチャンネルステレオ(3/2.1)を超えたマルチチャンネルステレオで出力する場合の、復号後のマルチチャンネルステレオの音響信号に対して乗じるチャンネル数変換係数を、図16に示した手順で導出したときの値は、実施例1の図15に示した手順で導出したときの値と同一となる場合ことも多い。 When the audio mode is multi-channel stereo (3/3/3-5/2/3-3/0/0.2) and output in multi-channel stereo exceeding multi-channel stereo (3/2.1) , the value obtained by deriving the number-of-channels conversion coefficient by which the decoded multichannel stereo sound signal is multiplied by the procedure shown in FIG. It is often the same as the value.
マルチチャンネルステレオ(2/0/0-3/0/2-0.1)、ITU-R BS.2051に記載のsound system C、ISO/IEC 23008-3に記載のChannel configuration 14で出力する場合のチャンネル数変換係数は、表35に示したとおりである。マルチチャンネルステレオ(3/2/2.1)、ITU-R BS.2051に記載のsound system I、ISO/IEC 23008-3に記載のChannel configuration 12で出力する場合のチャンネル数変換係数は、表36に示したとおりである。マルチチャンネルステレオ(5/2.1)、ISO/IEC 23008-3に記載のChannel configuration 7で出力する場合のチャンネル数変換係数は、表38に示したとおりである。ITU-R勧告BS.2051に記載のsound system D、ISO/IEC 23008-3に記載のChannel configuration 16で出力する場合のチャンネル数変換係数は、表39に示したとおりである。ITU-R勧告BS.2051に記載のsound system Eで出力する場合のチャンネル数変換係数は、表40に示したとおりである。ITU-R勧告BS.2051に記載のsound system F、ISO/IEC 23008-3に記載のChannel configuration 15で出力する場合のチャンネル数変換係数は、表41に示したとおりである。ITU-R勧告BS.2051に記載のsound system G 、ISO/IEC 23008-3に記載のChannel configuration 20で出力する場合(ただし、ディスプレイがLRの内側にあるとき)のチャンネル数変換係数は、表42に示したとおりである。ITU-R勧告BS.2051に記載のsound system J、ISO/IEC 23008-3に記載のChannel configuration 19で出力する場合のチャンネル数変換係数は、表43に示したとおりである。ISO/IEC 23008-3に記載のChannel configuration 17で出力する場合のチャンネル数変換係数は、表44に示したとおりである。マルチチャンネルステレオ(2/0/0-3/2/2-0.1)で出力する場合のチャンネル数変換係数は、表46に示したとおりである。
When outputting in multi-channel stereo (2/0/0-3/0/2-0.1), sound system C according to ITU-R BS.2051, and
マルチチャンネルステレオ(3/3.1)、ISO/IEC 23008-3に記載のChannel configuration 11で出力する場合のチャンネル数変換係数は、実施例1と異なるため、表47に示す。なお、表47の記号に入る値は、表34に示したとおりである。
Table 47 shows the channel number conversion coefficients when outputting in multichannel stereo (3/3.1),
また、ISO/IEC 23008-3に記載のChannel configuration 18で出力する場合のチャンネル数変換係数も、実施例1と異なるため、表48に示す。なお、表48の記号に入る値は、表34に示したとおりである。 Table 48 also shows the channel number conversion coefficients when outputting in Channel configuration 18 described in ISO/IEC 23008-3, because they differ from those in the first embodiment. The values entered for the symbols in Table 48 are as shown in Table 34.
なお、上述した音響処理装置1として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、音響処理装置1の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
A computer can be suitably used to function as the
また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROMなどの記録媒体であってもよい。 Also, the program may be recorded on a computer-readable medium. It can be installed on a computer using a computer readable medium. Here, the computer-readable medium on which the program is recorded may be a non-transitory recording medium. The non-transitory recording medium is not particularly limited, but may be, for example, a recording medium such as CD-ROM or DVD-ROM.
本発明のチャンネル数変換係数の導出手法によれば、以下の効果を有する。第1に、任意のチャンネル数、チャンネル配置に対応することができる。すなわち、本導出手法は、変換元チャンネルの再生位置を適切に変更することで、変換元チャンネルの左右前方・左右後方の特徴的なチャンネルの聞こえる方向を規定した上で、仮想音源を用いることによる音色や音像の劣化を抑え、全体としての印象の変化を小さくすることができる。 The method of deriving the number of channels conversion coefficients of the present invention has the following effects. First, it can correspond to any number of channels and any channel arrangement. In other words, in this derivation method, by appropriately changing the playback position of the conversion source channel, the listening direction of the characteristic channels in the left and right front and left and right rear of the conversion source channel is specified, and then by using the virtual sound source It is possible to suppress the deterioration of tone and sound image, and reduce the change in impression as a whole.
第2に、変換元フォーマットとの印象(音色)の劣化を抑えることができる。すなわち、前方左右・後方左右以外の位置に、再生位置が一致する変換元チャンネルを持たない変換先チャンネルがある場合、最も近傍にある変換先のチャンネルの再生位置に、変換元チャンネルの再生位置を変更することにより、仮想音源の数の増加による全体的な印象の劣化を抑えることができる。 Secondly, it is possible to suppress the deterioration of the impression (timbre) of the conversion source format. In other words, if there is a conversion destination channel that does not have a conversion source channel with a matching playback position at a position other than the front left, right, or rear left, right, the playback position of the conversion source channel is moved to the playback position of the nearest conversion destination channel. By changing it, it is possible to suppress deterioration of the overall impression due to an increase in the number of virtual sound sources.
第3に、相対位置モードを採用し、四隅の基準点を指定した場合には、基準となる前方左右・後方左右のチャンネルの組み合わせを保つことができる。すなわち、各フォーマットの主要なチャンネルである前方左右・後方左右にあるチャンネルの組み合わせが、変換元及び変換先フォーマットのスピーカ密度の差によって変化しないよう、変換元及び変換先チャンネルの前方左右・後方左右を揃える基準点を定め、この基準点をもとに変換元チャンネルの再生位置を変更することができる。また、前方2範囲の基準点にあたるチャンネルを切り替え可能としてもよい。これにより、多くのフォーマットで主要なチャンネルとなる聴取者前方のチャンネルに関して、その視聴環境に応じて再生位置を選択できるようになる。 Thirdly, when the relative position mode is adopted and the reference points at the four corners are designated, the combination of the reference front left, right, rear left, and right channels can be maintained. In other words, the front left, right, rear left, right channels of the conversion source and conversion destination channels are adjusted so that the combination of the front left, right, rear left, and right channels, which are the main channels of each format, does not change due to the difference in speaker density between the conversion source and conversion destination formats. , and based on this reference point, the reproduction position of the conversion source channel can be changed. Also, the channels corresponding to the reference points of the front two ranges may be switchable. This makes it possible to select the playback position according to the viewing environment for the channel in front of the listener, which is the main channel in many formats.
第4に、相対位置モードを採用し、基準点に対応する変換元・変換先チャンネル以外の対象となる変換先チャンネルに最も偏った位置に存在する変換元チャンネルの再生位置を変換先チャンネルと同位置に変更した場合には、大きく開いたスピーカ間において、どちらかに偏った位置で仮想音源を配置することで生じ得る音像のぼけや、それに伴う方向感の劣化を抑えることができる。 Fourthly, by adopting the relative position mode, the playback position of the conversion-source channel that exists at the most biased position in the target conversion-destination channel other than the conversion-source/conversion-destination channel corresponding to the reference point will be the same as the conversion-destination channel. When the position is changed, it is possible to suppress the blurring of the sound image and the accompanying deterioration of the sense of direction that may occur when the virtual sound source is placed at a position biased to either side between the wide-open speakers.
第5に、変換元フォーマットの表現・演出を大きく損なわないでチャンネル数変換を実現することができる。すなわち、同じ高さ(層)にあった変換元チャンネルのうち、各変換先チャンネルの再生位置に変更するのは1チャンネルのみとし、残りのチャンネルは仮想音源で表現することにより、3次元マルチチャンネル音響ならではの表現・演出を大きく損なわないようにすることが可能となる。また、仮想音源で表現する変換元チャンネルを、その再生位置を挟む2つの変換先チャンネルの間に均等に配置しなおすことにより、各変換元チャンネルの方向を識別することが容易となる。 Fifthly, the number of channels can be converted without greatly impairing the expression/performance of the conversion source format. In other words, among the conversion source channels at the same height (layer), only one channel is changed to the playback position of each conversion destination channel. It is possible to avoid greatly impairing the expression and performance unique to sound. Further, by evenly rearranging the conversion source channels represented by the virtual sound sources between the two conversion destination channels sandwiching the reproduction position thereof, it becomes easy to identify the direction of each conversion source channel.
第6に、チャンネル数変換係数に利用しやすい数値を用いることができる。すなわち、本手法によって計算されたチャンネル数変換係数を実際に用いるにあたっては、その簡便さから導かれた分配係数をデシベル表記した際にきりのよい値となるようあらかじめ置き換えることができる。 Sixth, it is possible to use numerical values that are easy to use for the channel number conversion coefficients. In other words, when actually using the channel number conversion coefficients calculated by this method, the distribution coefficients derived from its simplicity can be replaced in advance so that they are decibel-expressed values.
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 Although the above embodiments have been described as representative examples, it will be apparent to those skilled in the art that many modifications and substitutions may be made within the spirit and scope of the invention. Therefore, the present invention should not be construed as limited by the embodiments described above, and various modifications and changes are possible without departing from the scope of the appended claims. For example, it is possible to combine a plurality of configuration blocks described in the configuration diagrams of the embodiments into one, or divide one configuration block.
1 音響処理装置
11 変換先チャンネル分割部
12 変換元チャンネル再生位置決定部
13 チャンネル数変換係数決定部
14 チャンネル数変換係数行列記憶部
15 出力信号生成部
REFERENCE SIGNS
Claims (10)
変換先マルチチャンネル音響信号の再生位置を仰角方向の複数層に分割する変換先チャンネル分割部と、
変換元マルチチャンネル音響信号の再生位置を、前記変換先チャンネル分割部により分割された各分割層上に決定する変換元チャンネル再生位置決定部と、
前記変換先マルチチャンネル音響信号の再生位置と、前記変換元チャンネル再生位置決定部により決定された前記変換元マルチチャンネル音響信号の再生位置とに基づいて、チャンネル数変換係数を決定するチャンネル数変換係数決定部と、
前記チャンネル数変換係数決定部により決定されたチャンネル数変換係数を各要素とするチャンネル数変換係数行列を用いて、前記変換元マルチチャンネル音響信号から前記変換先マルチチャンネル音響信号を生成する出力信号生成部と、
を備えることを特徴とする音響処理装置。 An audio processing device that converts the number of channels and channel arrangement of a multichannel audio signal,
a conversion destination channel division unit that divides the reproduction position of the conversion destination multi-channel acoustic signal into multiple layers in the elevation direction;
a source channel playback position determination unit that determines a playback position of the source multichannel audio signal on each divided layer divided by the destination channel division unit;
A channel number conversion factor for determining a channel number conversion factor based on the reproduction position of the conversion destination multichannel acoustic signal and the reproduction position of the conversion source multichannel sound signal determined by the conversion source channel reproduction position determination unit. a decision unit;
Output signal generation for generating the destination multi-channel acoustic signal from the source multi-channel acoustic signal using a channel number conversion coefficient matrix having each element the channel number conversion coefficient determined by the channel count conversion coefficient determination unit. Department and
A sound processing device comprising:
前記変換元チャンネル再生位置決定部は、変換元マルチチャンネル音響信号の再生位置と変換先チャンネルの再生位置の基準点を、前記変換先チャンネル分割部により分割された画面の両端に相当する左前、右前の2点、4分割した左前、左後、右前、右後の4範囲の四隅の4点、該4点に左右側方90度を加えた6点のいずれかにそれぞれ最も近くに存在する変換元マルチチャンネル音響信号の再生位置とすることを特徴とする、請求項5に記載の音響処理装置。 The conversion destination channel dividing unit divides each divided layer into four ranges of front, back, left, and right,
The conversion source channel reproduction position determining unit sets the reference points of the reproduction position of the conversion source multi-channel audio signal and the reproduction position of the conversion destination channel to the front left and front right corresponding to both ends of the screen divided by the conversion destination channel dividing unit. 2 points, 4 points at the four corners of the 4 ranges divided into 4, left front, left rear, right front, and right rear, and 6 points obtained by adding 90 degrees to the left and right sides to the 4 points. 6. The sound processing device according to claim 5, wherein the reproduction position of the original multi-channel sound signal is set.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017157229 | 2017-08-16 | ||
JP2017157229 | 2017-08-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019036961A JP2019036961A (en) | 2019-03-07 |
JP7132027B2 true JP7132027B2 (en) | 2022-09-06 |
Family
ID=65636041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018152853A Active JP7132027B2 (en) | 2017-08-16 | 2018-08-15 | Sound processing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7132027B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009077379A (en) | 2007-08-30 | 2009-04-09 | Victor Co Of Japan Ltd | Stereoscopic sound reproduction equipment, stereophonic sound reproduction method, and computer program |
JP2012049967A (en) | 2010-08-30 | 2012-03-08 | Nippon Hoso Kyokai <Nhk> | Acoustic signal conversion device and program thereof and 3-dimensional acoustic panning device and program thereof |
JP2014222859A (en) | 2013-05-14 | 2014-11-27 | 日本放送協会 | Acoustic signal reproduction device and acoustic signal preparation device |
US20170086005A1 (en) | 2014-03-25 | 2017-03-23 | Intellectual Discovery Co., Ltd. | System and method for processing audio signal |
-
2018
- 2018-08-15 JP JP2018152853A patent/JP7132027B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009077379A (en) | 2007-08-30 | 2009-04-09 | Victor Co Of Japan Ltd | Stereoscopic sound reproduction equipment, stereophonic sound reproduction method, and computer program |
JP2012049967A (en) | 2010-08-30 | 2012-03-08 | Nippon Hoso Kyokai <Nhk> | Acoustic signal conversion device and program thereof and 3-dimensional acoustic panning device and program thereof |
JP2014222859A (en) | 2013-05-14 | 2014-11-27 | 日本放送協会 | Acoustic signal reproduction device and acoustic signal preparation device |
US20170086005A1 (en) | 2014-03-25 | 2017-03-23 | Intellectual Discovery Co., Ltd. | System and method for processing audio signal |
Also Published As
Publication number | Publication date |
---|---|
JP2019036961A (en) | 2019-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11785407B2 (en) | Method and apparatus for rendering sound signal, and computer-readable recording medium | |
KR102160254B1 (en) | Method and apparatus for 3D sound reproducing using active downmix | |
US10271156B2 (en) | Audio signal processing method | |
UA124570C2 (en) | SYSTEM AND METHOD FOR GENERATING, CODING AND PRESENTING ADAPTIVE SOUND SIGNAL DATA | |
CN108834038B (en) | Method and apparatus for rendering acoustic signals | |
JP2011066868A (en) | Audio signal encoding method, encoding device, decoding method, and decoding device | |
ES2952212T3 (en) | Stereophonic sound reproduction method and apparatus | |
US11483669B2 (en) | Spatial audio parameters | |
JP7222668B2 (en) | Sound processing device and program | |
JP7132027B2 (en) | Sound processing device and program | |
JP2020120377A (en) | Audio authoring device, audio rendering device, transmission device, reception device, and method | |
KR102608824B1 (en) | Method and apparatus for 3D sound reproducing | |
CN112513982B (en) | Spatial audio parameters | |
JP2017212731A (en) | Acoustic processing apparatus, acoustic processing method, and program | |
KR102058619B1 (en) | Rendering for exception channel signal | |
Frank et al. | Evaluation of Compressed Higher-Order Ambisonics at Off-Center Listening Positions | |
KR20210034564A (en) | Method and apparatus for 3D sound reproducing | |
JP2020202488A (en) | Multi-channel acoustic optimizer and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210715 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220825 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7132027 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |