CN107180639B - 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 - Google Patents
对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 Download PDFInfo
- Publication number
- CN107180639B CN107180639B CN201710583292.XA CN201710583292A CN107180639B CN 107180639 B CN107180639 B CN 107180639B CN 201710583292 A CN201710583292 A CN 201710583292A CN 107180639 B CN107180639 B CN 107180639B
- Authority
- CN
- China
- Prior art keywords
- directional
- frame
- hoa
- signals
- directional signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000013598 vector Substances 0.000 claims description 16
- 238000007906 compression Methods 0.000 abstract description 17
- 230000006835 compression Effects 0.000 abstract description 15
- 238000012545 processing Methods 0.000 abstract description 5
- 230000005540 biological transmission Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 22
- 238000009826 distribution Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 12
- 230000009466 transformation Effects 0.000 description 12
- 230000006837 decompression Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 230000000873 masking effect Effects 0.000 description 9
- 238000001745 non-dispersive infrared spectroscopy Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 230000005428 wave function Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/13—Application of wave-field synthesis in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本公开涉及对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置。更高阶高保真度立体声响复制表示独立于具体扬声器设置的三维声音。然而,HOA表示的传输导致非常高的比特率。因此,使用具有固定数量的信道的压缩,其中有区别地处理定向和环境信号分量。环境HOA分量由最小数量的HOA系数序列表示。剩余的信道包含定向信号或者环境HOA分量的另外的系数序列,取决于什么将导致最佳的感知质量。该处理可以基于逐个帧地改变。
Description
本申请是申请号为201480023877.0、申请日为2014年4月24日、发明名称为“对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置”的发明专利申请的分案申请。
技术领域
本发明涉及通过有区别地处理定向和环境信号分量对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置。
背景技术
更高阶高保真度立体声响复制(HOA)连同像波长合成(WFS)这样的其他技术或者像22.2这样的基于信道的方法一起提供表示三维声音的一种可能性。然而,相对于基于信道的方法,HOA表示提供独立于具体扬声器设置的优点。然而,这个灵活性以HOA表示在特殊的扬声器设置上回放所必需的解码处理为代价。与必需的扬声器的数量通常非常大的WFS方法相比,HOA还可以被呈现给包括仅几个扬声器的设置。HOA的另外的优点在于,对于到头戴耳机的双耳呈现,也可以使用相同的表示而不用做任何修改。
HOA基于按照截断的球谐(Spherical Harmonics,SH)扩展的复谐平面波(complexharmonic plane wave)幅度的空间密度的表示。每个扩展系数是角频率的函数,其可以由时域函数等同地表示。因此,在不失一般性的情况下,完整的HOA声场表示实际上可以被假设为包括O个时域函数,其中O标记扩展系数的数量。这些时域函数将等同地被称作HOA系数序列或者称作HOA信道。
HOA表示的空间分辨率随着扩展的最大阶N的增长而提高。不幸地,扩展系数的数量O随着阶N二次方地增长,具体地,O=(N+1)2。例如,使用阶N=4的典型的HOA表示需要O=25个HOA(扩展)系数。根据先前做出的考虑,给定期望的单信道采样率fS和每个样本的位数Nb,用于传输HOA表示的总比特率由O·fS·Nb确定。因此,以fS=48kHz的采样率并且使用每个样本Nb=16位来传输阶N=4的HOA表示导致19.2MBits/s的比特率,这对于许多实际的应用(例如对于流传输)非常高。
HOA声场表示的压缩在专利申请EP 12306569.0和EP 12305537.8中提出。代替单独地对HOA系数序列中的每一个进行感知编码,例如像在E.Hellerud、I.Burnett、A.Solvang和U.P.Svensson的“Encoding Higher Order Ambisonics with AAC”(第124届AES会议,阿姆斯特丹,2008年)中执行的那样,具体通过执行声场分析并且将给定的HOA表示分解成定向和残余环境分量来试图减少被感知编码的信号的数量。定向分量通常应当由可以被视为一般平面波函数的少量的支配定向信号来表示。残余环境HOA分量的阶减小,因为假设在提取支配定向信号之后,更低阶的HOA系数承载大部分相关信息。
发明内容
总之,通过这样的操作,要被感知编码的HOA系数序列的初始数量(N+1)2被减少至固定数量的D个支配定向信号以及表示具有截断的阶NRED<N的残余环境HOA分量的数量(NRED+1)2个HOA系数序列,从而要编码的信号的数量是固定的,亦即D+(NRED+1)2。特别地,该数量独立于在时帧(time frame)k中的活动的支配(dominant)定向声源的实际检测到的数量DACT(k)≤D。这意味着,在时帧k中,其中活动的支配定向声源的实际检测到的数量DACT(k)小于定向信号的最大允许数量D,要被感知编码的支配定向信号中的一些或者甚至是全部为零。最后,这意味着这些信道根本不用于捕捉声场的相关信息。
在该背景下,EP 12306569.0和EP 12305537.8会议录中的另外可能的弱点是用于在每个时帧中确定活动的支配定向信号的数量的标准,因为不试图确定关于声场的相继感知编码的活动的支配定向信号的最佳数量。例如,在EP 12305537.8中,使用简单的功率标准,也就是通过确定属于最大特征值的系数间相关矩阵的子空间的维度,来估计支配声源的量。在EP 12306569.0中,提出对支配定向声源的递增检测,其中如果来自各自方向的平面波函数的功率关于第一定向信号足够高,则定向声源被认为是支配的。使用像在EP12306569.0和EP 12305537.8中那样的基于功率的标准可能导致关于声场的感知编码是次优的定向环境分解(directional-ambient decomposition)。
本发明所要解决的问题是通过对当前的HOA音频信号内容确定如何分配到预先确定的减少数量的信道、定向信号以及环境HOA分量的系数来改进HOA压缩。该问题由在权利要求1和3中公开的方法来解决。使用这些方法的装置在权利要求2和4中公开。
本发明在两个方面改进在EP 12306569.0中提出的压缩处理。第一,更好地利用由将被感知编码的给定数量的信道提供的带宽。在没有检测到支配声源信号的时帧中,最初被保留用于支配定向信号的信道被用于以残余环境HOA分量的另外的HOA系数序列的形式来捕捉关于环境分量的另外的信息。第二,考虑到利用给定数量的信道对给定HOA声场表示进行感知编码的目标,关于该目的,适配用于确定要从HOA表示中提取的定向信号的量的标准。确定定向信号的数量,使得经解码和重构的HOA表示提供最低的感知误差。该标准比较由提取定向信号并且使用更少的HOA系数序列来描述残余环境HOA分量而引起的建模误差,或者由不提取定向信号并且代替地使用另外的HOA系数序列来描述残余环境HOA分量而引起的建模误差。该标准进一步针对两种情况考虑由定向信号和残余环境HOA分量的HOA系数序列的感知编码引入的量化噪声的空间功率分布。
为了实现上述处理,在开始HOA压缩之前,指定总数量I个信号(信道),与其相比,HOA系数序列的最初数量O减少。假设环境HOA分量由最小数量ORED个HOA系数序列来表示。在一些情况下,该最小数量可以是零。剩余的D=I-ORED个信道应当包含定向信号或者环境HOA分量的另外的系数序列,取决于定向信号提取处理决定什么在感知上更有意义。假设定向信号或者环境HOA分量系数序列到剩余的D个通道的分配可基于逐个帧(on frame-by-frame basis)地改变。为了在接收侧重构声场,将关于分配的信息作为额外的边信息(sideinformation)来传输。
原则上,本发明的压缩方法适合于使用固定数量的感知编码对被标记为HOA的声场的更高阶高保真度立体声响复制表示进行压缩,其使用HOA系数序列的输入时帧,所述方法包括基于逐个帧地执行的下面的步骤:
-对当前帧估计支配方向的集合以及检测到的定向信号的索引的对应数据集;
-将所述当前帧的HOA系数序列分解成非固定数量的定向信号,其具有包含在支配方向估计的所述集合中的各自方向并且具有所述定向信号的索引的各自数据集,其中所述非固定数量小于所述固定数量,
以及由减少的数量的HOA系数序列以及所述减少的数量的残余环境HOA系数序列的索引的对应数据集表示的残余环境HOA分量,所述减少的数量对应于所述固定数量与所述非固定数量之间的差值;
-将所述定向信号以及所述残余环境HOA分量的HOA系数序列分配给数量对应于所述固定数量的信道,其中对于所述分配,使用所述定向信号的索引的数据集以及所述减少的数量的残余环境HOA系数序列的索引的数据集;
-对相关帧的信道进行感知编码,以便提供经编码的压缩帧。
原则上,本发明的压缩装置适合于使用固定数量的感知编码对被标记为HOA的声场的更高阶高保真度立体声响复制表示进行压缩,其使用HOA系数序列的输入时帧,所述装置执行基于逐个帧的处理并且包括:
-适合于进行如下处理的部件:对当前帧估计支配方向的集合以及检测到的定向信号的索引的对应数据集;
-适合于进行如下处理的部件:将所述当前帧的HOA系数序列分解成非固定数量的定向信号,其具有包含在支配方向估计的所述集合中的各自方向并且具有所述定向信号的索引的各自数据集,其中所述非固定数量小于所述固定数量,
以及由减少的数量的HOA系数序列以及所述减少的数量的残余环境HOA系数序列的索引的对应数据集表示的残余环境HOA分量,所述减少的数量对应于所述固定数量与所述非固定数量之间的差值;
-适合于进行如下处理的部件:将所述定向信号以及所述残余环境HOA分量的HOA系数序列分配给数量对应于所述固定数量的信道,其中对于所述分配,使用所述定向信号的索引的数据集以及所述减少的数量的残余环境HOA系数序列的索引的数据集;
-适合于进行如下处理的部件:对相关帧的信道进行感知编码,以便提供经编码的压缩帧。
原则上,本发明的解压缩方法适合于对根据上面的压缩方法压缩的更高阶高保真度立体声响复制表示进行解压缩,所述解压缩包括步骤:
-对当前的经编码的压缩帧进行感知解码,以便提供信道的经感知解码的帧;
-使用检测到的定向信号的索引的数据集以及所选择的环境HOA系数序列的索引的数据集,重新分布信道的经感知解码的帧,以便重新创建定向信号的对应帧以及残余环境HOA分量的对应帧;
-使用检测到的定向信号的索引的数据集以及支配方向估计的集合,从定向信号的所述帧以及从残余环境HOA分量的所述帧,重新组成HOA表示的当前经解压缩的帧,
其中根据所述定向信号预测关于均匀分布的方向的定向信号,并且此后从定向信号的所述帧、所述预测的信号以及所述残余环境HOA分量重新组成所述当前经解压缩的帧。
原则上,本发明的解压缩装置适合于对根据上面的压缩方法压缩的更高阶高保真度立体声响复制表示进行解压缩,所述装置包括:
-适合于进行如下处理的部件:对当前的经编码的压缩帧进行感知解码,以便提供信道的经感知解码的帧;
-适合于进行如下处理的部件:使用检测到的定向信号的索引的数据集以及所选择的环境HOA系数序列的索引的数据集,重新分布信道的经感知解码的帧,以便重新创建定向信号的对应帧以及残余环境HOA分量的对应帧;
-适合于进行如下处理的部件:使用检测到的定向信号的索引的数据集以及支配方向估计的集合,从定向信号的所述帧以及从残余环境HOA分量的所述帧,重新组成HOA表示的当前经解压缩的帧,
其中根据所述定向信号预测关于均匀分布的方向的定向信号,并且此后从定向信号的所述帧、所述预测的信号以及所述残余环境HOA分量重新组成所述当前经解压缩的帧。
在相应的从属权利要求中公开本发明的有利的另外的实施例。
附图说明
参考附图描述本发明的示例性实施例,其中:
图1示出HOA压缩的框图;
图2示出支配声源方向的估计;
图3示出HOA解压缩的框图;
图4示出球面坐标系;
图5示出对于不同的高保真度立体声响复制阶N以及对于角度θ∈[0,π]的规一化分散函数vN(Θ)。
具体实施方式
A.改进的HOA压缩
在图1中例示根据本发明的基于EP 12306569.0的压缩处理,其中使用粗体框显示与EP 12306569.0相比较已经修改或者新引入的信号处理块,并且其中本申请中的′g′(如这样的方向估计)和′C′分别对应于EP12306569.0中的′A′(方向估计的矩阵)和′D′。对于HOA压缩,使用长度L的HOA系数序列的不重叠的输入帧C(k)的逐帧(frame-wise)的处理被使用,其中k标记帧索引。关于在等式(45)中指定的HOA系数序列将帧定义为:
C(k):=[c((kL+1)Ts) c((kL+2)Ts) c((k+1)LTs)], (1)
其中TS指示采样周期。
该长帧与相邻的长帧50%重叠,并且该长帧被相继地用于支配声源方向的估计。与的标记法类似,在下面的描述中使用波浪符号来指示相应的量指代长的重叠的帧。如果步骤/阶段11/12不存在,则波浪符号没有具体含意。
原则上,如在EP 13305156.5中所提出的那样地执行支配声源的估计步骤或阶段13,但是具有重要的修改。修改涉及确定要检测的方向的量,亦即应当从HOA表示中提取多少定向引号。这通过只有在与替代地使用另外的HOA系数序列进行环境HOA分量的更好的近似相比其在感知上更相关的情况下才激发提取定向信号来实现。在部分A.2中给出对该技术的详细描述。
在步骤或阶段14中,将HOA系数序列的当前(长)帧分解(如在EP 13305156.5中提出的那样)成属于集合中包含的方向的许多定向信号XDIR(k-2)以及残余环境HOA分量CAMB(k-2)。作为重叠添加处理的结果引入两个帧的延迟,以便获得平滑信号。假设XDIR(k-2)包含总共D个信道,然而其中只有与活动的定向信号相对应的那些是非零的。指定这些信道的索引假设在数据集中输出。另外,步骤/阶段14中的分解提供在解压缩侧被用于根据定向信号预测原始HOA表示的部分的一些参数ζ(k-2)(更多细节参看EP13305156.5)。
在步骤或阶段15中,智能地减少环境HOA分量CAMB(k-2)的系数的数量,以仅包含ORED+D-NDIR,ACT(k-2)个非零的HOA系数序列,其中指示数据集的基数,亦即帧k-2中的活动的定向信号的数量。因为假设环境HOA分量总是由最小数量ORED个HOA系数序列表示,所以这个问题实际上可以简化成从可能的O-ORED个HOA系数序列中选择剩余的D-NDIR,ACT(k-2)个HOA系数序列。为了获得平滑的减少的环境HOA表示,将该选择实现为使得与在前一帧k-3时进行的选择相比较,尽可能少的变化将发生。
具体地,将区别下面三种情况:
a)NDIR,ACT(k-2)=NDIR,ACT(k-3):在这种情况下,假设选择与在帧k-3中相同的HOA系数序列。
b)NDIR,ACT(k-2)<NDIR,ACT(k-3):在这种情况下,可以使用比在最后的帧k-3中更多的HOA系数序列来表示在当前帧中的环境HOA分量。假设在k-3中被选择的那些HOA系数序列也在当前帧中被选择。可以根据不同的标准来选择另外的HOA系数序列。例如,选择CAMB(k-2)中具有最高平均功率的那些HOA系数序列,或者关于它们的感知重要性选择HOA系数序列。
c)NDIR,ACT(k-2)>NDIR,ACT(k-3):在这种情况下,可以使用比在最后的帧k-3中更少的HOA系数序列来表示在当前帧中的环境HOA分量。这里需要回答的问题是必须使先前选择的HOA系数序列中的哪些不活动(deactivate)。合理的解决方案是使在帧k-3时在信号分配步骤或阶段16分配给信道的那些序列不活动。
为了避免在使另外的HOA系数序列活动或不活动时在帧边界处的不连续性,使得各个信号平滑地淡入(fade in)或淡出(fade out)是有利的。
在步骤/阶段16中,XDIR(k-2)中包含的活动的定向信号和CAMB,RED(k-2)中包含的HOA系数序列被分配给I个信道的帧Y(k-2)以便进行个体的感知编码。为了更详细地描述信号分配,假设帧XDIR(k-2)、Y(k-2)和CAMB,RED(k-2)包括各个信号xDIR,d(k-2),d∈{1,...,D}、yi(k-2),i∈{1,...,I}和cAMB,RED,o(k-2),o∈{1,...,O},如下:
分配活动的定向信号,使得它们保存(keep)它们的信道索引以便获得连续的信号用于相继的感知编码。这可以表示为:
环境分量的HOA系数序列被分配为使得最小数量的ORED个系数序列总是包含在Y(k-2)的最后的ORED个信号中,亦即
yD+o(k-2)=cAMB,RED,o(k-2)对于1≤o≤ORED。 (5)
对于环境分量的另外D-NDIR,ACT(k-2)个HOA系数序列,它们是否也在前一个帧中被选择是有区别的:
a)如果它们也被选择在前一个帧中传输,亦即,如果各自的索引也包含在数据集中,则这些系数序列到Y(k-2)中的信号的分配与对于前一帧的相同。该操作保证平滑的信号yi(k-2),这对于步骤或阶段17中的相继的感知编码是有利的。
这个具体的分配提供如下优点:在HOA解压缩处理期间,可以在不知道哪个环境HOA系数序列包含在Y(k-2)的哪个信道的情况下执行信号的重新分布和组成。代替地,可以在HOA解压缩期间仅使用数据集和的知识来重构分配。
有利地,该分配操作还提供分配矢量其元素γo(k)(o=1,...,D-NDIR,ACT(k-2))标记环境分量的另外D-NDIR,ACT(k-2)个HOA系数序列中的每一个的索引。换句话说,分配矢量γ(k)的元素提供关于环境HOA分量的另外的O-ORED个HOA系数序列中的哪些被分配到具有不活动的定向信号的D-NDIR,ACT(k-2)个信道中的信息。该矢量可以另外地传输,但是相比于按照帧速率不太频繁,以便允许初始化针对HOA解压缩而执行的重新分布过程(参看部分B)。感知编码步骤/阶段17对于帧Y(k-2)的I个信道进行编码,并且输出经编码的帧
A.1支配声源方向的估计
在图2中更详细地图示图1的支配声源方向的估计步骤/阶段13。其基本上根据EP13305156.5来执行,但是具有决定性的差异,即确定与要从给定的HOA表示中提取的定向信号的数量相对应的支配声源的数量的方式。这个数量是重要的,因为它用于控制给定的HOA表示是通过使用更多的定向信号还是代替地通过使用更多的HOA系数序列来更好地表示,以对环境HOA分量更好地建模。
支配声源方向的估计在步骤或阶段21中开始,使用输入的HOA系数序列的长帧对支配声源方向进行初步检索。与初步的方向估计(1≤d≤D)一起,如在EP13305156.5中所描述的那样地计算应当由各个声源创建的对应定向信号和HOA声场分量
A.2被提取的定向信号的数量的确定
为了在步骤/阶段22中确定定向信号的数量,假设存在将被用于捕捉在感知上最相关的声场信息的给定总量的I个信道的情况。因此,确定要提取的定向信号的数量,由如下问题激发:对于整体的HOA压缩/解压缩质量,当前的HOA表示是通过使用更多的定向信号还是更多的HOA系数序列来更好地表示以对环境HOA分量更好地建模。
为了在步骤/阶段22中导出用于确定要提取的定向声源的数量的标准(该标准与人类感知相关),考虑具体通过下面的两个运算来实现HOA压缩:
-用于表示环境HOA分量的HOA系数序列的减少(这意味着相关信道的数量的减少);
-定向信号的感知编码以及用于表示环境HOA分量的HOA系数序列的感知编码。
取决于所提取的定向信号的数量M(0≤M≤D),第一个运算近似地得到
来自第二个运算的近似可以表示为:
标准的公式化
其中关于人类感知尽可能地不显著。为了保证这一点,在预先定义的数量Q个测试方向Ωq(q=1,...,Q)上考虑各个巴克标度(Bark scale)临界带的总误差的定向功率分布,其在单位球面上几乎均匀地分布。更具体地,第b个(b=1,...,B)临界带的定向功率分布由下面的矢量表示:
执行′1′与相继最大值运算的减法以确保感知级别为零,只要误差功率低于掩蔽阈值。
应当注意,替代地,能够在等式(15)中用平均运算替换最大值。
定向感知掩蔽功率分布的计算
到空间域的变换由下面的运算来表达
其中Ξ标记关于测试方向Ωq(q=1,...,Q)的模式矩阵,被定义为
其中Sq:=
定向功率分布的计算
a.一种可能性是通过计算在部分A.2的开始提及的两个运算来实际地计算期望的HOA表示的近似然后,根据等式(11)来计算总的近似误差接下来,将总的近似误差变换到空间域,以便由从测试方向Ωq(q=1,...,Q)碰撞的一般平面波表示。以矩阵将一般平面波信号布置为
到空间域的变换由下面的运算表示:
b.替代的解决方案是仅计算近似值而不是该方法提供如下优点:不需要直接执行各个信号的复杂的感知编码。代替地,知道各个巴克标度临界带内的感知量化误差的功率就足够了。为此目的,在等式(11)中定义的总的近似误差可以被写作三个下面的近似误差的总和:
下面描述如何计算各个巴克标度临界带的三个误差的定向功率分布:
b.为了计算误差的定向功率分布考虑到该误差通过对定向信号(1≤d≤M)进行感知编码而被引入到定向HOA分量中。另外,考虑定向HOA分量由等式(8)给出。于是,为了简单,假设HOA分量在空间域中由O个一般平面波函数等同地表示,其通过仅仅缩放根据定向信号来创建,亦即
因此,真实的定向HOA分量
与按照
而表示为
c.为了计算由环境HOA分量的HOA系数序列的感知编码造成的误差的定向功率分布假设每个HOA系数序列被独立地编码。因此,可以假设被引入到每个巴克标度临界带内的各个HOA系数序列中的误差是不相关的。这意味着关于每个巴克标度临界带的误差的系数间相关矩阵是对角线的,亦即
元素(o=1,...,O)应当表示中的第o个经编码的HOA系数序列中的第b个临界带内的感知量化误差的功率。可以假设它们对应于第o个HOA系数序列的感知掩蔽功率。因此,感知编码误差的定向功率分布通过下式计算
B.改进的HOA解压缩
对应的HOA解压缩处理在图3中图示并且包括下面的步骤或阶段。
在信号重新分布步骤或阶段32中,重新分布中的经感知解码的信号,以便重新创建定向信号的帧和环境HOA分量的帧通过使用索引数据集和再现对HOA压缩执行的分配操作,获得关于如何重新分布信号的信息。因为这是递归的过程(参看部分A),所以可以使用另外传输的分配矢量γ(k),以便允许例如在传输发生故障的情况下初始化重新分布过程。
在组成步骤或阶段33中,使用定向信号的帧活动的定向信号索引的集合以及对应方向的集合用于根据定向信号来预测HOA表示的部分的参数ζ(k-2)以及减少的环境HOA分量的HOA系数序列的帧根据结合EP12306569.0的图2b和图4描述的处理,重新组成期望的总的HOA表示的当前帧 对应于EP12306569.0中的分量并且和对应于EP12306569.0中的其中活动的定向信号索引在的矩阵元素中标明。亦即,根据定向信号来预测关于均匀分布的方向的定向信号,其中使用用于这样的预测的所接收的参数(ζ(k-2)),并且此后从定向信号的帧预测部分以及减少的环境HOA分量重新组成当前的经解压缩的帧
C.更高阶高保真度立体声响复制的基础
更高阶高保真度立体声响复制(HOA)基于补充假设为没有声源的所关注的紧密区域(compact area)内的声场的描述。在该情况下,在所关注的区域内、在时间t时和位置x处的声压p(t,x)的时空行为在物理上由齐性波等式(homogeneous wave equation)充分确定。下面,假设如图4中示出的球面坐标系。在使用的坐标系中,x轴指向前面位置,y轴指向左边并且z轴指向顶部。空间x=(r,θ,φ)T中的位置由半径r>0(亦即,到坐标原点的距离)、从极轴z测量的倾角θ∈[0,π]以及在x-y平面中从x轴逆时针地测量的方位角φ∈[0,2π[来表示。另外,(·)T标记转置。
可以示出(参看E.G.Williams,“Fourier Acoustics”,AppliedMathematicalSciences的93卷,Academic Press,1999年),由标记的关于时间的声压的傅里叶变换,亦即
(其中ω标记角频率并且i指示虚数单位)可以根据下式来扩展成球谐函数的级数:
在等式(40)中,cs标记声速,并且k标记角波数(angular wave number),其按照与角频率ω相关。另外,jn(·)标记第一类球贝塞尔函数(spherical Besselfunctions of the first kind),并且标记阶n和度数m的实值球谐函数,其在下面的部分C.1中定义。扩展系数仅取决于角波数k。在上文,已经隐含地假设声压在空间上是带限的(band limited)。因此,球谐函数的级数关于在被称作HOA表示的阶的上限N处的阶索引n而被截断。
如果声场由从角度元组(θ,φ)指定的所有可能方向到达的不同角频率ω的无限数量的平面谐波的叠加来表示,则可以示出(参看B.Rafaely,“Plane-wave Decompositionof the Sound Field on a Sphere by Spherical Convolution”,Journal of theAcoustical Society of America,第4卷(116),2149-2157页,2004年),各个平面波复数幅度函数C(ω,θ,φ)可以由下面的球谐函数扩展来表示
最终的高保真度立体声响复制格式将使用采样频率fs的c(t)的采样版本提供为
C.1实值球谐函数的定义
给出,其中
相关联的勒让德函数(Legendre functions)Pn,m(x)使用勒让德多项式Pn(x)定义为
并且不像上面提及的Williams的文章,没有康登-肖特莱相位项(Condon-Shortley phase term)(-1)m。
C.2更高阶高保真度立体声响复制的空间分辨率
从方向Ω0=(θ0,φ0)T到达的一般平面波函数x(t)在HOA中由下式表示
从等式(51)中可以看出,其是一般平面波函数x(t)与空间分散函数vN(Θ)的乘积,其可以显示为仅取决于Ω与Ω0之间的角度Θ,具有如下性质
cosΘ=cosθcosθ0+cos(φ-φ0)sinθsinθ0. (52)
如预期的那样,在无限阶的极限下,亦即N→∞,空间分散函数变成狄拉克德尔塔(Dirac delta)δ(·),亦即
然而,在有限阶N的情况下,来自方向Ω0的一般平面波的贡献被抹去到邻近方向,其中模糊的程度随着增加的阶而减小。在图5中示出N的不同值的规一化函数vN(Θ)的图表。
应当指出,对于任何方向Ω,平面波幅度的空间密度的时域行为是它在任何其他方向上的行为的倍数。特别地,一些固定的方向Ω1和Ω2的函数c(t,Ω1)和c(t,Ω2)关于时间t彼此高度相关。
C.3球谐函数变换
如果平面波幅度的空间密度在几乎均匀分布在单位球面上的数量O个空间方向Ωo(1≤o≤O)上是离散的,则获得O个定向信号c(t,Ωo)。通过使用等式(50)将这些信号收集到矢量中,作为
cSPAT(t):=[c(t,Ω1)...c(t,ΩO)]T, (54),
可以验证可以通过简单的矩阵乘法根据在等式(44)中定义的连续的高保真度立体声响复制表示d(t)将该矢量计算为
cSPAT(t)=ΨHc(t), (55)
其中(·)H指示联合点转置和结合(joint transposition and conjugation),并且Ψ标记由下式定义的模式矩阵
Ψ:=[S1 .... SO] (56)
其中
因为方向Ωo几乎均匀分布在单位球面上,所以模式矩阵一般是可逆的。因此,可以按照下式根据定向信号c(t,Ωo)来计算连续的高保真度立体声响复制表示
c(t)=Ψ-HcSPAT(t). (58)
两个等式构成高保真度立体声响复制表示与空间域之间的变换和逆变换。这些变换在这里被称作球谐函数变换和逆球谐函数变换。
应当注意,因为方向Ωo几乎均匀分布在单位球面上,近似
ΨH≈Ψ-1 (59)
是可用的,这证明在等式(55)中使用Ψ-1来替代ΨH是正当的。
有利地,所有所提及的关系对于离散的时域也是有效的。
本发明的处理可以由单个处理器或电子电路或者由并行操作和/或在本发明的处理的几个部分上操作的若干处理器或电子电路来执行。
Claims (4)
1.一种对压缩的更高阶高保真度立体声响复制表示进行解压缩的方法,所述解压缩包括:
-对当前的经编码的压缩帧进行感知解码,以便提供信道的经感知解码的帧;
-基于分配矢量重新分布信道的所述经感知解码的帧,所述分配矢量至少指示包含的环境HOA分量的系数序列的索引以及定向信号的索引的数据集,以便确定环境HOA分量的对应帧;
-基于检测到的定向信号的索引的数据集以及支配方向估计的集合,从定向信号的重新创建的帧以及从环境HOA分量的重新创建的帧,重新组成HOA表示的当前经解压缩的帧,
其中,根据所述定向信号预测关于均匀分布的方向的定向信号,此后,从定向信号的重新创建的帧、所述预测的信号以及所述环境HOA分量重新组成所述当前经解压缩的帧,
其中,关于均匀分布的方向的定向信号的所述预测使用用于所述预测的所接收到的参数根据所述定向信号来执行。
2.一种对更高阶高保真度立体声响复制表示进行解压缩的装置,所述装置包括:
-适于对当前的经编码的压缩帧进行感知解码以便提供信道的经感知解码的帧的部件;
-适于进行如下处理的部件:基于分配矢量重新分布信道的所述经感知解码的帧,所述分配矢量至少指示包含的环境HOA分量的系数序列的索引以及定向信号的索引的数据集,以便确定环境HOA分量的对应帧;
-适于进行如下处理的部件:基于检测到的定向信号的索引的数据集以及支配方向估计的集合,从定向信号的重新创建的帧以及从环境HOA分量的重新创建的帧,重新组成HOA表示的当前经解压缩的帧,
其中,根据所述定向信号预测关于均匀分布的方向的定向信号,此后,从定向信号的重新创建的帧、所述预测的信号以及所述环境HOA分量重新组成所述当前经解压缩的帧,
其中,关于均匀分布的方向的定向信号的所述预测使用用于所述预测的所接收到的参数根据所述定向信号来执行。
3.一种对压缩的更高阶高保真度立体声响复制表示进行解压缩的设备,包括:
一个或多个处理器,以及
一个或多个存储介质,存储有指令,所述指令在被所述一个或多个处理器执行时使得执行根据权利要求1所述的方法。
4.一种存储介质,存储有可执行指令,所述可执行指令在被处理器执行时使得执行根据权利要求1所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13305558.2 | 2013-04-29 | ||
EP13305558.2A EP2800401A1 (en) | 2013-04-29 | 2013-04-29 | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
CN201480023877.0A CN105144752B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480023877.0A Division CN105144752B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107180639A CN107180639A (zh) | 2017-09-19 |
CN107180639B true CN107180639B (zh) | 2021-01-05 |
Family
ID=48607176
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710583301.5A Active CN107293304B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN201710583285.XA Active CN107146626B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN201480023877.0A Active CN105144752B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN201710583291.5A Active CN107146627B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN201710583292.XA Active CN107180639B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710583301.5A Active CN107293304B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN201710583285.XA Active CN107146626B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN201480023877.0A Active CN105144752B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN201710583291.5A Active CN107146627B (zh) | 2013-04-29 | 2014-04-24 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
Country Status (10)
Country | Link |
---|---|
US (9) | US9736607B2 (zh) |
EP (6) | EP2800401A1 (zh) |
JP (7) | JP6395811B2 (zh) |
KR (5) | KR102232486B1 (zh) |
CN (5) | CN107293304B (zh) |
CA (8) | CA3168916A1 (zh) |
MX (5) | MX347283B (zh) |
MY (2) | MY176454A (zh) |
RU (1) | RU2668060C2 (zh) |
WO (1) | WO2014177455A1 (zh) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US9412385B2 (en) * | 2013-05-28 | 2016-08-09 | Qualcomm Incorporated | Performing spatial masking with respect to spherical harmonic coefficients |
US9716959B2 (en) | 2013-05-29 | 2017-07-25 | Qualcomm Incorporated | Compensating for error in decomposed representations of sound fields |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
EP2824661A1 (en) | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
US9922656B2 (en) * | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
KR101846484B1 (ko) | 2014-03-21 | 2018-04-10 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치 |
CN117253494A (zh) | 2014-03-21 | 2023-12-19 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
EP2922057A1 (en) | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
CN110415712B (zh) | 2014-06-27 | 2023-12-12 | 杜比国际公司 | 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法 |
EP2960903A1 (en) | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
KR102410307B1 (ko) | 2014-06-27 | 2022-06-20 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 데이터 프레임들 중 특정 데이터 프레임들의 채널 신호들과 연관된 비차분 이득 값들을 포함하는 코딩된 hoa 데이터 프레임 표현 |
EP3161821B1 (en) | 2014-06-27 | 2018-09-26 | Dolby International AB | Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values |
US9794714B2 (en) | 2014-07-02 | 2017-10-17 | Dolby Laboratories Licensing Corporation | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
EP3164866A1 (en) | 2014-07-02 | 2017-05-10 | Dolby International AB | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation |
WO2016001355A1 (en) | 2014-07-02 | 2016-01-07 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation |
EP2963949A1 (en) | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
EP2963948A1 (en) | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
US9736606B2 (en) * | 2014-08-01 | 2017-08-15 | Qualcomm Incorporated | Editing of higher-order ambisonic audio data |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
EP3007167A1 (en) | 2014-10-10 | 2016-04-13 | Thomson Licensing | Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field |
US10468037B2 (en) | 2015-07-30 | 2019-11-05 | Dolby Laboratories Licensing Corporation | Method and apparatus for generating from an HOA signal representation a mezzanine HOA signal representation |
US12087311B2 (en) | 2015-07-30 | 2024-09-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding an HOA representation |
US10257632B2 (en) | 2015-08-31 | 2019-04-09 | Dolby Laboratories Licensing Corporation | Method for frame-wise combined decoding and rendering of a compressed HOA signal and apparatus for frame-wise combined decoding and rendering of a compressed HOA signal |
US9881628B2 (en) * | 2016-01-05 | 2018-01-30 | Qualcomm Incorporated | Mixed domain coding of audio |
KR102063307B1 (ko) | 2016-03-15 | 2020-01-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 음장 기술을 생성하기 위한 장치, 방법, 또는 컴퓨터 프로그램 |
US10332530B2 (en) | 2017-01-27 | 2019-06-25 | Google Llc | Coding of a soundfield representation |
JP6811312B2 (ja) * | 2017-05-01 | 2021-01-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置及び符号化方法 |
US10405126B2 (en) * | 2017-06-30 | 2019-09-03 | Qualcomm Incorporated | Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems |
EP3818730A4 (en) * | 2018-07-03 | 2022-08-31 | Nokia Technologies Oy | SIGNALING AND ENERGY REPORT SUMMARY |
CN110113119A (zh) * | 2019-04-26 | 2019-08-09 | 国家无线电监测中心 | 一种基于人工智能算法的无线信道建模方法 |
CN114582357A (zh) * | 2020-11-30 | 2022-06-03 | 华为技术有限公司 | 一种音频编解码方法和装置 |
US11743670B2 (en) | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
CN115938388A (zh) * | 2021-05-31 | 2023-04-07 | 华为技术有限公司 | 一种三维音频信号的处理方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5757927A (en) * | 1992-03-02 | 1998-05-26 | Trifield Productions Ltd. | Surround sound apparatus |
US6628787B1 (en) * | 1998-03-31 | 2003-09-30 | Lake Technology Ltd | Wavelet conversion of 3-D audio signals |
CN1477490A (zh) * | 2002-05-14 | 2004-02-25 | 陈长城 | 一种新型可用于电脑输入的多自由度信号输入装置 |
JP3700254B2 (ja) * | 1996-05-31 | 2005-09-28 | 日本ビクター株式会社 | 映像音声再生装置 |
EP1841284A1 (en) * | 2006-03-29 | 2007-10-03 | Phonak AG | Hearing instrument for storing encoded audio data, method of operating and manufacturing thereof |
CN102396024A (zh) * | 2009-02-16 | 2012-03-28 | 韩国电子通信研究院 | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US6931370B1 (en) * | 1999-11-02 | 2005-08-16 | Digital Theater Systems, Inc. | System and method for providing interactive audio in a multi-channel audio environment |
CA2443837C (en) * | 2001-04-13 | 2012-06-19 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
AUPR647501A0 (en) * | 2001-07-19 | 2001-08-09 | Vast Audio Pty Ltd | Recording a three dimensional auditory scene and reproducing it for the individual listener |
US7752052B2 (en) * | 2002-04-26 | 2010-07-06 | Panasonic Corporation | Scalable coder and decoder performing amplitude flattening for error spectrum estimation |
CN1677490A (zh) | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US8370134B2 (en) * | 2006-03-15 | 2013-02-05 | France Telecom | Device and method for encoding by principal component analysis a multichannel audio signal |
EP2094032A1 (en) * | 2008-02-19 | 2009-08-26 | Deutsche Thomson OHG | Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
PT2553947E (pt) * | 2010-03-26 | 2014-06-24 | Thomson Licensing | Método e dispositivo para descodificar uma representação de um campo sonoro de áudio para a reprodução de áudio |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
CN102903366A (zh) * | 2012-09-18 | 2013-01-30 | 重庆大学 | 一种基于g729语音压缩编码算法的dsp优化方法 |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2765791A1 (en) | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
-
2013
- 2013-04-29 EP EP13305558.2A patent/EP2800401A1/en not_active Withdrawn
-
2014
- 2014-04-24 CA CA3168916A patent/CA3168916A1/en active Pending
- 2014-04-24 KR KR1020157030836A patent/KR102232486B1/ko active IP Right Grant
- 2014-04-24 WO PCT/EP2014/058380 patent/WO2014177455A1/en active Application Filing
- 2014-04-24 KR KR1020227030177A patent/KR102672762B1/ko active IP Right Grant
- 2014-04-24 CA CA3190346A patent/CA3190346A1/en active Pending
- 2014-04-24 CN CN201710583301.5A patent/CN107293304B/zh active Active
- 2014-04-24 KR KR1020227009114A patent/KR102440104B1/ko active IP Right Grant
- 2014-04-24 EP EP24203714.1A patent/EP4462430A2/en active Pending
- 2014-04-24 CA CA3168921A patent/CA3168921A1/en active Pending
- 2014-04-24 US US14/787,978 patent/US9736607B2/en active Active
- 2014-04-24 CA CA3168901A patent/CA3168901A1/en active Pending
- 2014-04-24 CN CN201710583285.XA patent/CN107146626B/zh active Active
- 2014-04-24 CA CA3110057A patent/CA3110057C/en active Active
- 2014-04-24 KR KR1020247018485A patent/KR20240096662A/ko unknown
- 2014-04-24 EP EP17169936.6A patent/EP3232687B1/en active Active
- 2014-04-24 EP EP14723023.9A patent/EP2992689B1/en active Active
- 2014-04-24 EP EP21190296.0A patent/EP3926984B1/en active Active
- 2014-04-24 CA CA3190353A patent/CA3190353A1/en active Pending
- 2014-04-24 KR KR1020217008387A patent/KR102377798B1/ko active IP Right Grant
- 2014-04-24 CN CN201480023877.0A patent/CN105144752B/zh active Active
- 2014-04-24 CN CN201710583291.5A patent/CN107146627B/zh active Active
- 2014-04-24 CN CN201710583292.XA patent/CN107180639B/zh active Active
- 2014-04-24 CA CA3168906A patent/CA3168906A1/en active Pending
- 2014-04-24 CA CA2907595A patent/CA2907595C/en active Active
- 2014-04-24 MX MX2015015016A patent/MX347283B/es active IP Right Grant
- 2014-04-24 RU RU2015150988A patent/RU2668060C2/ru active
- 2014-04-24 EP EP19190807.8A patent/EP3598779B1/en active Active
- 2014-04-24 MY MYPI2015703265A patent/MY176454A/en unknown
- 2014-04-24 JP JP2016509473A patent/JP6395811B2/ja active Active
-
2015
- 2015-10-27 MX MX2020002786A patent/MX2020002786A/es unknown
- 2015-10-27 MX MX2022012179A patent/MX2022012179A/es unknown
- 2015-10-27 MX MX2022012180A patent/MX2022012180A/es unknown
- 2015-10-27 MX MX2022012186A patent/MX2022012186A/es unknown
-
2017
- 2017-07-14 US US15/650,674 patent/US9913063B2/en active Active
-
2018
- 2018-01-22 US US15/876,442 patent/US10264382B2/en active Active
- 2018-08-28 JP JP2018158976A patent/JP6606241B2/ja active Active
-
2019
- 2019-01-11 MY MYPI2019000036A patent/MY195690A/en unknown
- 2019-04-09 US US16/379,091 patent/US10623878B2/en active Active
- 2019-10-17 JP JP2019190235A patent/JP6818838B2/ja active Active
-
2020
- 2020-04-06 US US16/841,203 patent/US10999688B2/en active Active
- 2020-12-28 JP JP2020218142A patent/JP7023342B2/ja active Active
-
2021
- 2021-04-29 US US17/244,746 patent/US11284210B2/en active Active
-
2022
- 2022-02-08 JP JP2022017626A patent/JP7270788B2/ja active Active
- 2022-03-21 US US17/700,228 patent/US11758344B2/en active Active
- 2022-03-21 US US17/700,390 patent/US11895477B2/en active Active
-
2023
- 2023-04-25 JP JP2023071244A patent/JP7511707B2/ja active Active
-
2024
- 2024-02-02 US US18/431,580 patent/US20240259743A1/en active Pending
- 2024-06-25 JP JP2024101601A patent/JP2024123190A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5757927A (en) * | 1992-03-02 | 1998-05-26 | Trifield Productions Ltd. | Surround sound apparatus |
JP3700254B2 (ja) * | 1996-05-31 | 2005-09-28 | 日本ビクター株式会社 | 映像音声再生装置 |
US6628787B1 (en) * | 1998-03-31 | 2003-09-30 | Lake Technology Ltd | Wavelet conversion of 3-D audio signals |
CN1477490A (zh) * | 2002-05-14 | 2004-02-25 | 陈长城 | 一种新型可用于电脑输入的多自由度信号输入装置 |
EP1841284A1 (en) * | 2006-03-29 | 2007-10-03 | Phonak AG | Hearing instrument for storing encoded audio data, method of operating and manufacturing thereof |
CN102396024A (zh) * | 2009-02-16 | 2012-03-28 | 韩国电子通信研究院 | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
JP2012133366A (ja) * | 2010-12-21 | 2012-07-12 | Thomson Licensing | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 |
Non-Patent Citations (3)
Title |
---|
"Optimal Higher Order Ambisonics Encoding With Predefined Constraints";Haohai Sun 等;《IEEE Transaction On Audio,Speech And Language Processing》;20120301;第3卷(第2期);第742-754页 * |
"Spatial redundancy in Higher Order Ambisonics and its use for lowdelay lossless compression";Erik Hellerud 等;《 2009 IEEE International Conference on Acoustics, Speech and Signal Processing》;20090526;第269-272页 * |
"音频感知编码模型及关键技术的研究";李琳;《CNKI中国博士学位论文全文数据库信息科技辑》;20090615;第I136-11页 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107180639B (zh) | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 | |
US11546712B2 (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field | |
RU2776307C2 (ru) | Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1238788 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |