CN101283401A - 信号处理的方法和装置以及编码和解码方法及其装置 - Google Patents
信号处理的方法和装置以及编码和解码方法及其装置 Download PDFInfo
- Publication number
- CN101283401A CN101283401A CNA2006800372614A CN200680037261A CN101283401A CN 101283401 A CN101283401 A CN 101283401A CN A2006800372614 A CNA2006800372614 A CN A2006800372614A CN 200680037261 A CN200680037261 A CN 200680037261A CN 101283401 A CN101283401 A CN 101283401A
- Authority
- CN
- China
- Prior art keywords
- data
- decoding
- entropy
- guiding
- marshalling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
公开了用于处理信号的装置及其方法。互相结合地执行数据译码和熵译码,且通过编组提高译码效率。本发明包括以下步骤:获取数据译码标识信息,以及根据该数据译码标识信息所指示的数据译码方案解码数据。数据译码方案至少包括导引译码方案,其中导引译码方案利用对应于多个数据的导引基准值和导引差分值解码数据,并且其中导引差分值是利用这些数据和导引基准值生成的。
Description
技术领域
本发明涉及处理信号的装置及其方法,尤其涉及译码数据的装置及其方法。
背景技术
一般而言,迄今为止已引入了许多用于信号压缩和恢复的技术。并且,相应的技术的适用目标是包括音频数据、视频数据等的各种数据。此外,信号压缩或恢复技术朝着以高压缩比提高音频或视频质量的方向演进。另外,在提高适应各种通信环境的传输效率方面已经做了大量工作。
然而,相信仍存在提高传输效率的余地。所以,需要做大量的工作来通过新的信号处理方案的开发使信号在非常复杂的通信环境中的传输效率最大化。
发明内容
因此,本发明涉及一种基本上消除了一个或多个由于有关技术的局限和缺点引起的问题的处理信号的装置及其方法。
本发明的一个目的是提供一种用于处理信号的装置及其方法,藉之可优化信号的传输效率。
本发明的另一个目的是提供一种译码数据的装置及其方法,藉之可有效率地译码数据。
本发明的另一个目的是提供一种用于编码/解码数据的装置及其方法,藉之可使用于音频恢复的控制数据的传输效率最大化。
本发明的另一个目的是提供一种包括经编码的数据的介质。
本发明的另一个目的是提供一种数据结构,藉之可有效率地传输经编码的数据。
本发明的又一个目的是提供一种包括解码装置的系统。
为了实现这些或其它优势并根据本发明的目的,如具体表达并广泛描述的,根据本发明的一个实施例的处理信号的方法包括以下步骤:获取数据译码标识信息,以及根据该数据译码标识信息所指示的数据译码方案解码数据。数据译码方案至少包括导引译码方案,其中导引译码方案利用对应于多个数据的导引基准值和导引差分值解码数据,并且其中导引差分值是利用数据和导引基准值生成的。
数据译码方案还包括差分译码方案,其中所述差分译码方案包括频率差分译码方案和时间差分译码方案之一,并且其中所述时间差分译码方案包括前向时间差分译码方案和后向时间差分译码方案之一。
该方法还包括以下步骤:获取熵译码标识信息,以及利用由熵译码标识信息所指示的熵译码方案熵解码数据。在数据解码步骤中,经熵解码的数据是通过所述数据译码方案来解码的。熵解码方案包括一维译码方案和多维译码方案之一,其中多维译码方案包括频率对译码方案和时间对译码方案中的一个。
该方法还包括利用数据作为参数解码音频信号的步骤。
为实现这些及其它优点并根据本发明的目的,一种处理信号的装置包括获取数据译码标识信息的标识信息获取部件,以及根据所述数据译码标识信息所指示的数据译码方案解码数据的解码部件。数据译码方案至少包括导引译码方案,其中导引译码方案利用对应于多个数据的导引基准值和导引差分值解码数据,并且其中导引差分值是利用这些数据和导引基准值生成的。
为实现这些及其它优点并根据本发明的目的,一种处理信号的方法包括以下步骤:根据数据译码方案编码数据,以及生成以传输指示数据译码方案的数据译码标识信息。数据译码方案至少包括导引译码方案,导引译码方案利用对应于多个数据的导引基准值和导引差分值编码数据,并且其中导引差分值是利用这些数据和导引基准值生成的。
为了实现这些及其它优点并根据本发明的目的,一种处理信号的装置包括:根据数据译码方案编码数据的编码部件,以及生成以传输指示此数据译码方案的数据译码标识信息的输出部件。数据译码方案至少包括导引译码方案,导引译码方案利用对应于多个数据的导引基准值和导引差分值编码数据,并且其中导引差分值是利用这些数据和导引基准值生成的。
有益效果
因此,本发明可实现高效数据译码和熵译码,从而实现具有高传输效率的数据压缩和恢复。
附图简述
图1和图2是根据本发明的系统的框图;
图3和图4是解释根据本发明的PBC译码的图;
图5是解释根据本发明的DIFF译码的图;
图6至8是应用DIFF译码方案的例子的图;
图9是解释根据本发明的选择至少三种译码方案中的一种时的关系的框图;
图10是解释根据相关技术的选择至少三种译码方案中的一种时的关系的框图;
图11和图12分别是根据本发明的数据译码选择方案的流程图;
图13是解释根据本发明的内部编组的图;
图14是解释根据本发明的外部编组的图;
图15是解释根据本发明的内部多重编组的图;
图16和图17分别是解释根据本发明的另一个实施例的混合编组的图示;
图18是根据本发明的1D和2D熵表的示例图;
图19是根据本发明的用于2D熵译码的两种方法的示例图;
图20是根据本发明的用于PBC译码结果的熵译码方案的图;
图21是根据本发明的用于DIFF译码结果的熵译码方案的图;
图22是解释根据本发明的用于选择熵表的方法的图;
图23是根据本发明的数据结构的分层图;
图24是根据本发明的一个实施例的用于音频压缩和恢复的装置的框图;
图25是根据本发明的一个实施例的空间信息编码部件的详细框图;以及
图26是根据本发明的一个实施例的空间信息解码部件的详细框图。
具体实施方式
现在将详细参考本发明的较佳实施例,其例子在附图中示出。
当前且普遍使用的一般术语被选作本发明中使用的术语。并且,还有申请人为特殊情况任意性地选择的术语,其详细的含义在本发明的较佳实施例的描述中详细解释。因此,不应从术语的字面来理解本发明,而应以术语的含义来理解。
在本发明中,“译码”的含义包括编码过程和解码过程。然而,对本领域的技术人员显而易见的是,特定的译码过程仅适用于编码过程或解码过程,这将在以下对相应部件的描述中区别。并且,“译码”也可被称为“编解码”。
在本发明中,译码信号的步骤应通过分成数据译码和熵译码来解释。然而,在数据译码和熵译码之间存在相关性,这将在稍后详细解释。
在本发明中,将解释为了高效率地执行数据译码和熵译码而对数据进行编组的各种方法。编组方法具有与具体数据或熵译码方案无关的独立有效的技术思想。
在本发明中,将解释具有空间信息的音频译码方案(例如,“ISO/IEC 23003,MPEG Surround”)作为采用数据译码和熵译码的详细例子。
图1和图2是根据本发明的系统的图。图1示出编码装置1,而图2示出解码装置2。
参考图1,根据本发明的编码装置1包括数据编组部件10、第一数据编码部件20、第二数据编码部件31、第三数据编码部件32、熵编码部件40、和比特流多路复用部件50中的至少一个。
可任选地,第二和第三数据编码部件31和32可整合为一个数据编码部件30。例如,由熵编码部件40对经第二和第三数据编码部件31和32编码的数据执行可变长度编码。上述元件将详细解释如下。
数据编组部件10按照指定单位捆绑输入信号以提高数据处理效率。
例如,数据编组部件10根据数据类型区分数据。并且,区分出的数据由数据编码部件20、31和32中的一个来编码。为了数据处理效率起见,数据编组部件10将数据中的一部分区分成至少一个组。并且,编组后的数据由数据编码部件20、31和32中的一个来编码。除此之外,将在稍后参考图13至17详细解释其中包括了数据编组部件10的操作的根据本发明的编组方法。
数据编码部件20、31和32各自都根据相应的编码方案来编码输入数据。数据编码部件20、31和32各自采用PCM(脉码调制)方案和差分译码方案中的至少一个。具体地,例如,第一数据编码部件20采用PCM方案,而第二数据编码部件31采用利用导引基准值的第一差分译码方案,而第三数据编码部件32采用利用相邻数据的差分的第二差分译码方案。
在下文中,为了便于解释,将第一差分译码方案称为“基于导引的译码(PBC)”,并将第二差分译码方案称为“差分译码(DIFF)”。并且,数据编码部件20、31和32的操作将在稍后参考图3至8详细解释。
同时,熵编码部件40根据数据的统计学特性参考熵表41执行可变长度编码。并且,稍后将参考图18至22详细解释熵编码部件40的操作。
比特流多路复用部件50编排和/或转换经译码的数据以使之对应于传输规范,然后将经编排/转换的数据以比特流的形式传输。然而,如果应用本发明的具体的系统不使用比特流多路复用部件50,则对本领域的技术人员显见的是可以将该系统配置成不带有比特流多路复用部件50。
同时,解码装置2被配置成对应于以上解释的编码装置1。
例如,参考图2,比特流多路分解部件60接收输入的比特流,并根据预置格式对包括在所接收的比特流中的各种信息进行翻译和分类。
熵解码部件70利用熵表71将数据恢复成熵编码之前的原始数据。在这种情况下,显然熵表71与前面图1所示的编码装置1的熵表41配置相同。
第一数据解码部件80、第二数据解码部件91和第三数据解码部件92分别执行与上述的第一至第三数据编码部件20、31和32相对应的解码。
具体地,在第二和第三数据解码部件91和92执行差分解码的情形中,能够将重叠的解码过程整合为在一个解码过程中处理。
数据重建部件95将经数据解码部件80、91和92解码的数据恢复或重建成数据编码前的原始数据。有时,经解码的数据可被恢复成通过转换或修改原始数据得到的数据。
顺便说一句,为了数据译码的高效执行,本发明至少将两种译码方案一起使用,并旨在利用译码方案之间的相关性提供高效译码方案。
并且,本发明旨在提供用于数据译码的高效执行的各种数据编组方案。
此外,本发明旨在提供包括本发明的特征的数据结构。
在将本发明的技术思想应用于各种系统时,对本领域的技术人员显而易的是,应当在使用图1和图2所示的元件的同时使用各种其它配置。例如,需要执行数据量化或者需要控制上述过程的控制器。
[数据译码]
可用作本发明的数据译码方案的PCM(脉码调制)、PBC(基于导引的译码)以及DIFF(差分译码)将详细解释如下。除此之外,随后还将解释数据译码方案的高效选择和相关性。
1.PCM(脉码调制)
PCM是一种将模拟信号转换成数字信号的译码方案。PCM以预置间隔采样模拟信号然后量化相应的结果。PCM在译码效率方面是不利的,但可有效地用于不适合PBC或DIFF译码方案的数据,这将在稍后解释。
在本发明中,PCM在执行数据译码中与PBC或DIFF译码方案一起使用,这将在稍后参考图9至12解释。
2.PBC(基于导引的译码)
2-1.PBC的概念
PBC是一种在区分出的数据组中确定具体基准,并对作为译码目标的数据与所确定的基准之间的关系加以利用的译码方案。
可将成为应用PBC的基准的值定义为“基准值”、“导引”、“导引基准值”或“导引值”。在下文中,为了便于解释,将其称为“导引基准值”。
并且,可将导引基准值和一个组内的数据之间的差分值定义为“差分”或“导引差分”。
此外,作为应用PBC的单位的数据组指示由上述数据编组部件10应用了具体编组方案的最终的组。数据编组可按各种方式执行,这将在稍后详细解释。
在本发明中,按以上方式编组以具有特定含义的数据被定义为“参数”来解释。这仅仅是为了便于解释,可用不同的术语来替换。
根据本发明的PBC过程包括如下的至少两个步骤。
首先,选择对应于多个参数的导引基准值。在这种情况下,导引基准值是参考成为PBC目标的参数来确定的。
例如,导引基准值被设置为从成为PBC目标的参数的平均值、成为目标的参数的平均值的近似值、对应于成为目标的参数的中间水平的中间值、以及成为目标的参数中最常使用的值中选出的值。并且导引基准值也可被设置为预置缺省值。此外,导引值可通过在预置表中选择来确定。
或者,在本发明中,将临时导引基准值设置为通过多种导引基准值选择方法中的至少两种选择的导引基准值,计算每种情况的译码效率,对应于具有最佳译码效率的情况的临时导引基准值于是被选择作为最终导引基准值。
当平均值是P时,平均值的近似值是Ceil[P]或Floor[P]。在这种情况下,Ceil[x]是不超过“x”的最大整数,而Floor[x]是超过“x”的最小整数。
然而,也可选择任意性的固定的缺省值而不参考成为PBC目标的参数。
再例如,如以上描述所提及的,在随机地并且多重地选择了若干可选作导引的值之后,可将表现出最佳译码效率的值选作最优导引。
其次,得出所选导引和一个组内的参数之间的差分值。例如,差分值可通过从成为PBC目标的参数值中减去导引基准值来计算。这将参考图2值图4解释如下。
图3和图4是解释根据本发明的PBC译码的图。
例如,假设一个组内存在多个参数(例如,10个参数),分别具有以下的参数值,X[n]={11,12,9,12,10,8,12,9,10,9}。
如果选择PBC方案用于编码该组中的参数,则首先应选择导引基准值。在本例子中,可看到在图4中将导引基准值设为“10”。
如以上描述所提及的,可通过各种选择导引基准值的方法来选择导引基准值。
根据公式1计算PBC的差分值。
[公式1]
d[n]=x[n]-P,其中n=0,1,...,9。
在这种情况下,“P”指示导引基准值(=10),而x[n]是数据译码的目标参数。根据公式1的PBC的结果对应于d[n]={1,2,-1,2,0,-2,2,-1,0,-1}。即,PBC译码的结果包括所选的导引基准值和计算出的d[n]。并且,这些值将成为稍后将要解释的熵译码的目标。此外,PBC在目标参数值的偏差总体上较小的情形中是比较有效的。
2-2.PBC对象
PBC译码的目标未被规定为一个。可通过PBC译码各种信号的数字数据。例如,它可适用于稍后将要解释的音频译码。在本发明中,将与音频数据一起处理的附加控制数据作为PBC译码目标进行详细解释。
控制数据在传输声道缩减混音音频信号之余予以传输,然后将其用于重建该音频。在以下的描述中,将控制数据定义为“空间信息或空间参数”。
空间信息包括各种空间参数,诸如声道电平差(在下文中简称为CLD)、声道间相干性(在下文中简称为ICC)、声道预测系数(在下文中简称为CPC)等。
具体地,CLD是指示两个不同声道之间能量差的参数。例如,CLD具有介于-15和+15之间的范围的值。ICC是指示两个不同声道之间相关性的参数。例如,ICC具有介于0和7之间的范围的值。而CPC是指示用于从两个声道生成三个声道的预测系数的参数。例如,CPC具有介于-20和30之间的范围的值。
作为PBC译码的目标,可以包括一个用于调节信号增益的增益值,例如,ADG(任意性声道缩减混音增益)。
并且,应用于声道缩减混音信号的任意性声道转换框的ATD(任意性树数据)可成为PBC译码目标。具体地,ADG是与CLD、ICC或CPC不同的参数。即,ADG对应于调节音频增益的参数,不同于诸如CLD、ICC CPC等从音频信号声道中提取的空间信息。然而,对于应用示例而言,可通过与上述CLD相同的方式处理ADG或ATD以提高音频译码的效率。
作为PBC译码的另一个目标,可以考虑“部分参数”。在本发明中,“部分参数”表示参数的一部分。
例如,假设将特定参数表示为n比特,将n比特分成至少两部分。并且,可将两个部分分别定义为第一和第二部分参数。在尝试执行PBC译码的情况下,可得出第一部分参数值和导引基准值之间的差分值。然而,排除在差分值计算之外的第二部分参数值应作为单独值传输。
更具体地,例如,在由n比特指示参数值的情况下,将最低有效位(LSB)定义为第二部分参数,并将以其余(n-1)个高位构建的参数值定义为第一部分参数。在该情况下,可仅对第一部分参数执行PBC。这是因为由于各个以(n-1)个高位构建的第一部分参数值之间的偏差小而使译码效率提高。
排除在差分计算之外的第二部分参数被单独传输,然后在由解码部件重构最终参数时考虑。或者,还可通过预定方案来获取第二部分参数而不是单独地传输该第二部分参数。
根据目标参数的特性限制性地使用利用部分参数的特性的PBC译码。
例如,如以上描述中提及的,各个第一部分参数之间的偏差应当较小。如果该偏差大,则没有必要使用部分参数。它甚至可能降低译码效率。
根据实验结果,上述空间信息的CPC参数适合于PBC方案的应用。然而,将CPC应用于粗略量化方案则并非首选。在量化方案粗略的情况下,第一部分参数之间的偏差增加。
此外,利用部分参数的数据译码可适用于DIFF方案以及PBC方案。
在将部分参数概念应用于CPC参数的情况下,用于重建的信号处理方法和装置解释如下。
例如,根据本发明的利用部分参数处理信号的方法包括以下步骤:利用对应于第一部分参数的基准值和对应于该基准值的差分值获取第一部分参数,以及利用该第一部分参数和第二部分参数确定一参数。
在这种情况下,基准值或者是导引基准值或者是差分基准值。并且,第一部分参数包括参数的部分位,而第二部分参数包括参数的其余位。此外,第二部分参数包括参数的最低有效位。
该信号处理方法还包括利用所确定的参数重建音频信号的步骤。
该参数是包括CLD、ICC、CPC和ADG中的至少一个的空间信息。
如果参数是CPC、且如果参数的量化比例不是粗略的,则可获取第二部分参数。
并且,最终参数通过将此部分参数倍乘以二并将该倍乘结果与第二部分参数相加来确定。
根据本发明的利用部分参数处理信号的装置包括利用对应于第一部分参数的基准值和对应于该基准值的差分值获取第一部分参数的第一部分参数获取部件、以及利用第一部分参数和第二部分参数确定一参数的参数确定部件。
该信号处理装置还包括通过接收第二部分参数获取第二部分参数的第二参数获取部件。
并且,第一参数获取部件、参数确定部件和第二部分参数获取部件包括在上述数据解码部件91或92之中。
根据本发明的一种利用部分参数的信号处理方法包括以下步骤:将一参数分成第一部分参数和第二部分参数,以及利用对应于第一部分参数的基准值和第一部分参数生成差分值。
并且,该信号处理方法还包括传输该差分值和第二部分参数的步骤。
根据本发明的利用部分参数处理信号的装置包括将一参数分成第一部分参数和第二部分参数的参数分割部件、以及利用对应于第一部分参数的基准值和该第一部分参数生成差分值的差分值生成部件。
并且,该信号处理装置还包括传输该差分值和第二部分参数的参数输出部件。
此外,参数分割部件和差分值生成部件被包括在上述数据编码部件31或32之内。
2-3.PBC条件
在本发明的PBC译码选择单独的导引基准值、然后将所选的导引基准值包括在比特流中的方面,PBC译码的传输效率很可能低于稍后将要解释的DIFF译码方案。
所以,本发明旨在提供执行PBC译码的最优条件。
如果在一个组内实验上成为数据译码目标的数据的数目至少是3或更多,则PBC译码是适用的。这对应于考虑到数据译码效率的结果。这意味着如果一个组内仅存在两个数据则DIFF或PCM译码比PBC译码更高效。
尽管PBC译码适用于至少三个数据或更多数据,但较佳的是将PBC译码应用于一个组内存在至少5个数据的情况。换言之,最高效适用PBC译码的情况是存在至少五个成为数据译码目标的数据、并且这至少五个数据之间的偏差小的情况。并且,适用于执行PBC译码的最小的数据数目将根据系统和译码环境来确定。
针对每一个数据频带给出成为数据译码目标的数据。这将通过稍后将要描述的编组过程来解释。所以,例如,本发明提议,要在稍后将要解释的MPEG音频环绕译码中应用PBC译码需要有至少五个数据频带。
在下文中,利用PBC执行条件的信号处理方法和装置解释如下。
在根据本发明的一个实施例的信号处理方法中,如果获取了对应于导引基准值的数据的数目、并且如果数据频带的数目满足了预置的条件,则获取导引基准值和对应于该导引基准值的导引差分值。随后,利用该导引基准值和导引差分值获取数据。具体地,数据的数目利用其中包括有数据的数据频带数目来获取。
在根据本发明的另一个实施例的信号处理方法中,利用数据的数目来决定多个数据译码方案中的一个,且根据所确定的数据译码方案解码该数据。多个数据译码方案至少包括导引译码方案。如果数据的数目满足预置的条件,则将数据译码方案确定为导引译码方案。
并且,数据解码过程包括以下步骤:获取对应于多个数据的导引基准值和对应于该导引基准值的导引差分值,以及利用该导引基准值和导引差分值获取数据。
此外,在该信号处理方法中,数据是参数。并且,音频信号利用这些参数来恢复。在该信号处理方法中,接收对应于参数数目的标识信息,并利用所接收的标识信息生成此数目的参数。通过考虑数据数目,指示多个数据译码方案的标识信息被分层提取。
在提取标识信息的步骤中,提取指示第一数据译码方案的第一标识信息,然后利用第一标识信息和数据的数目提取指示第二数据译码方案的第二标识信息。在这种情况下,第一标识信息指示是否是DIFF译码方案。并且,第二标识信息指示是导引译码方案还是PCM编组方案。
在根据本发明的另一个实施例的信号处理方法中,如果多个数据的数目满足预置的条件,则利用对应于多个数据的导引基准值和这些数据生成导引差分值。然后传输所生成的导引差分值。在该信号处理方法中,传输的是导引基准值。
在根据本发明的又一个实施例的信号处理方法中,根据多个数据的数目确定数据译码方案。然后根据所确定的数据译码方案对数据进行编码。在这种情况下,多个数据译码方案至少包括导引译码方案。如果数据的数目满足预置的条件,则数据译码方案确定为导引译码方案。
一种根据本发明的一个实施例用于处理信号的装置包括获取对应于导引基准值的数据的数目的数目获取部件、在数据的数目满足预置的条件时获取导引基准值和对应于该导引基准值的导引差分值的值获取部件、以及利用该导引基准值和导引差分值获取数据的数据获取部件。在这种情况下,数目获取部件、值获取部件以及数据获取部件被包括在上述的数据解码部件91或92之中。
一种根据本发明的另一个实施例用于处理信号的装置包括根据多个数据的数目确定多个数据译码方案中的一个的方案确定部件、以及根据所确定的数据译码方案对数据进行解码的解码部件。在这种情况下,多个数据译码方案至少包括导引译码方案。
一种根据本发明的又一个实施例处理信号的装置包括在多个数据的数目满足预置的条件时利用对应于多个数据的导引基准值和这些数据生成导引差分值的值生成部件、以及传输所生成的导引差分值的输出部件。在这种情况下,将值生成部件包括在上述的数据编码部件31或32之内。
一种根据本发明的再一个实施例用于处理信号的装置包括根据多个数据的数目确定数据译码方案的方案确定部件、以及根据确定的数据译码方案对数据进行编码的编码部件。在这种情况下,多个数据译码方案至少包括导引译码方案。
2-4.PBC信号处理方法
根据本发明的利用PBC译码特征的信号处理方法和装置解释如下。
在根据本发明的一个实施例的信号处理方法中,获取对应于多个数据的导引基准值和对应于该导引基准值的导引差分值。随后,利用该导引基准值和导引差分值获取数据。并且,该方法还包括对导引差分值和导引基准值中的至少一个进行解码的步骤。在这种情况下,应用PBC的数据是参数。并且,该方法还可包括利用所获取的参数重建音频信号的步骤。
一种根据本发明的一个实施例处理信号的装置包括对应于多个数据的导引基准值和对应于该导引基准值的导引差分值、以及利用该导引基准值和导引差分值获取数据的数据获取部件。在这种情况下,值获取部件和数据获取部件被包括在上述的数据译码部件91或92之中。
根据本发明的另一个实施例的一种信号处理方法包括以下步骤:利用对应于多个数据的导引基准值和这些数据生成导引差分值、以及输出生成的导引差分值。
一种根据本发明的另一个实施例的信号处理装置包括利用对应于多个数据的导引基准值和这些数据生成导引差分值的值生成部件、以及输出所生成的导引差分值的输出部件。
根据本发明的又一个实施例的信号处理方法包括以下步骤:获取对应于多个增益的导引基准值和对应于该导引基准值的导引差分值,以及利用该导引基准值和导引差分值获取增益。并且,该方法还包括对导引差分值和导引基准值中的至少一个进行解码的步骤。此外,该方法还包括利用获取的增益重建音频信号的步骤。
在这种情况下,导引基准值可以是多个增益的平均值、多个增益的平均中间值、多个增益中最常使用的值、设置为缺省的值、或从表中提取的一个值。并且,该方法还可包括将在对多个增益中的每一个设置导引基准值后具有最高编码效率的那个增益选择作为最终导引基准值的步骤。
一种根据本发明的又一个实施例用于处理信号的装置包括获取对应于多个增益的导引基准值和对应于导引基准值的导引差分值的值获取部件、以及利用该导引基准值和导引差分值获取增益的增益获取部件。
一种根据本发明的又一个实施例的信号处理方法包括以下步骤:利用对应于多个增益的导引基准值和这多个增益生成导引差分值,以及输出所生成的导引差分值。
并且,根据本发明的再一个实施例的信号处理装置包括利用对应于多个增益的导引基准值和多个增益生成导引差分值的值计算部件、以及输出所生成的导引差分值的输出部件。
3.DIFF(差分译码)
DIFF译码是一种利用存在于区分出的数据组中的多个数据之间的关系的译码方案,它也可被称为“差分译码”。在这种情况下,作为应用DIFF的单位的数据组是指由上述数据编组部件10应用了特定编组方案的最终的组。在本发明中,以上面的方式编组的具有特定含义的数据被定义为待解释的“参数”。并且这与针对PBC的解释相同。
具体地,DIFF译码方案是利用存在于同一个组中的参数之间的差分值、更具体地是相邻参数之间的差分值的译码方案。
参考图5至8详细解释DIFF译码方案的类型和详细应用示例如下。
3-1.DIFF类型
图5是根据本发明解释DIFF译码类型的图。DIFF译码根据从相邻参数得出差分值的方向来区分。
例如,DIFF译码类型可被分类为频率方向上的DIFF(在下文中简称为“DIFF_FREQ”或“DF”)和时间方向上的DIFF(在下文中简称为“DIFF_TIME”或“DT”)。
参考图5,组-1指示在频率轴上计算差分值的DIFF(DF),而组-2或组-3在时间轴上计算差分值。
从图5中可以看到,根据在时间轴上得出差分值的方向再次区分在时间轴上计算差分值的DIFF(DT)。
例如,应用于组-2的DIFF(DT)对应于在当前时刻的参数值和前一时刻的参数值(例如,组-1)之间得出差分值的方案。这被称为后向时间DIFF(DT)(在下文中简称为“DT-BACKWARD”)。
例如,应用于组-3的DIFF(DT)对应于在当前时刻的参数值和下一时刻的参数值(例如,组-4)之间得出差分值的方案。这被称为前向时间DIFF(DT)(在下文中简称为“DT-FORWARD”)。
因此,如图5所示,组-1是DIFF(DF)译码方案,而组-2是DIFF(DT-BACKWARD)译码方案,而组-3是DIFF(DT-FORWARD)译码方案。然而,组-4的译码方案未确定。
在本发明中,尽管在频率轴上的DIFF被仅定义为一个译码方案(例如,DIFF(DF)),但也可以做出定义将其区分为“DIFF(DF-TOP)”和“DIFF(DF-BOTTOM)”。
3-2.DIFF应用的例子
图6至8是应用DIFF译码方案的例子的图。
在图6中,为了便于解释,将图5中示出的组-1和组-2作为例子。组-1遵循DIFF(DF)译码方案,且其参数值是x[n]={11,12,9,12,10,8,12,9,10,9}。组-2遵循DIFF(DF-BACKWARD)译码方案,且其参数值是y[n]={10,13,8,11,10,7,14,8,10,8}。
图7示出计算组-1的差分值的结果。因为组-1是通过DIFF(DF)译码方案进行译码,所以可由公式2来计算差分值。公式2表示在频率轴上得出的与前一参数的差分值。
[公式2]
d[0]=x[0]
d[n]=x[n]-x[n-1],其中n=1,2,...,9。
具体地,通过公式2获得的组-1的DIFF(DF)结果是d[n]={-11,1,-3,3,-2,-2,4,-3,1,-1}。
图8示出计算组-2的差分值的结果。因为组-2通过DIFF(DF-BACKWARD)译码方案进行译码,所以可由公式3来计算差分值。公式3表示在时间轴上得出与前一参数的差分值。
[公式3]
d[n]=y[n]-x[n],其中n=1,2,...,9。
具体地,通过公式3获得的组-2的DIFF(DF-BACKWARD)结果是d[n]={-1,1,-1,-1,0,01,2,-1,0,-1}。
4.数据译码方案的选择
本发明的特征在于通过混合各种数据译码方案来压缩或重建数据。所以,在译码特定组时,需要从至少三种或更多中数据译码方案中选择一种译码方案。并且,应将所选的译码方案的标识信息通过比特流传递到解码部件。
根据本发明的选择数据译码方案的方法以及利用该方法的译码方法和装置解释如下。
根据本发明的一个实施例处理信号的方法包括以下步骤:获取数据译码标识信息,以及根据数据译码标识信息指示的数据译码方案对数据进行数据解码。
在这种情况下,数据译码方案至少包括PBC译码方案。并且,PBC译码方案利用对应于多个数据的导引基准值和导引差分值对数据进行解码。并且,导引差分值利用所述数据和导引基准值来生成。
数据译码方案还包括DIFF译码方案。DIFF译码方案对应于DIFF-DF方案和DIFF-DT方案之一。并且,DIFF-DT方案对应于前向时间DIFF-DT(FORWARD)方案和后向时间DIFF-DT(BACKWARD)之一。
该信号处理方法还包括以下步骤:获取熵译码标识信息,以及利用该熵译码标识信息指示的熵译码方案对数据进行熵解码。
在数据解码步骤中,经熵解码的数据是通过数据译码方案进行数据解码的。
并且,该数据处理方法还包括将所述数据用作参数来解码音频信号的步骤。
根据本发明的一个实施例用于处理信号的装置包括:
获取数据译码标识信息的标识信息获取部件、以及根据由数据译码标识信息指示的数据译码方案对数据进行数据解码的解码部件。
在这种情况下,数据译码方案至少包括PBC译码方案。并且,PBC译码方案利用对应于多个数据的导引基准值和导引差分值对数据进行解码。并且,导引差分值利用所述数据和导引基准值来生成。
根据本发明的另一个实施例处理信号的方法包括以下步骤:根据数据译码方案对数据进行数据编码,以及生成以传输指示数据译码方案的数据译码标识信息。
在这种情况下,数据译码方案至少包括PBC译码方案。PBC译码方案利用对应于多个数据的导引基准值和导引差分值对数据进行编码。并且,导引差分值利用所述数据和导引基准值来生成。
一种根据本发明的另一个实施例用于处理信号的装置包括根据数据译码方案对数据进行数据编码的编码部件、以及生成以传输指示数据译码方案的数据译码标识信息的输出部件。
在这种情况下,数据译码方案至少包括PBC译码方案。PBC译码方案利用对应于多个数据的导引基准值和导引差分值对数据进行编码。并且,导引差分值利用所述数据和导引基准值来生成。
通过最优传输效率来选择数据译码方案的方法和传输译码选择标识信息的方法解释如下。
4-1.考虑使用频度的数据译码标识方法
图9是解释根据本发明在选择至少三种译码方案之一时的关系的框图。
参考图9,假设:存在第一至第三数据编码部件53、52和51,其中第一数据编码部件53的使用频度最低,而第三数据编码部件51的使用频度最高。
为了便于解释,对于总数“100”,假设第一数据解码部件53的使用频度是“10”,第二数据编码部件52的使用频度是“30”,而第三数据编码部件51的使用频度是“60”。具体地,对于100个数据组,可认为PCM方案被应用10次,PBC方案被应用30次而DIFF方案被应用60次。
基于以上的假设,标识三种译码方案的标识信息所需的比特数按以下方式计算。
例如,根据图9,因为使用1比特的第一信息,所以使用100比特作为标识总共100组的译码方案的第一信息。因为具有最高使用频度的第三数据编码部件51通过这100比特来标识,所以其余1比特的第二信息可仅利用40比特来区分第一数据编码部件53和第二数据编码部件52。
因此,作为“第一信息(100比特)+第二信息(40比特)”的结果,为总共100个数据组选择每组的译码类型的标识信息需要总共140比特。
图10是解释根据相关技术选择至少三种译码方案中的一种时的关系的框图。
如图9那样,为了便于解释,对于总数“100”,假设第一数据解码部件53的使用频度是“10”,第二数据编码部件52的使用频度是“30”,而第三数据编码部件51的使用频度是“60”。
在图10中,标识三种译码方案类型的标识信息所需的比特数按以下方式计算。
首先,根据图10,因为使用1比特的第一信息,所以使用100比特作为标识总共100组的译码方案的第一信息。
具有最低使用频度的第一数据编码部件53被优先地通过这100比特来标识。所以,其余1比特的第二信息需要总共90比特以上来区分第二数据编码部件52和第三数据编码部件51。
因此,作为“第一信息(100比特)+第二信息(90比特)”的结果,为总共100个数据组选择每组的译码类型的标识信息需要总共190比特。
将图9所示的情况和图10所示的情况进行比较,可看出图9所示的数据译码选择标识信息在传输效率方面更有优势。
即,在存在至少三种或更多种数据译码方案的情况下,本发明的特征在于利用不同的标识信息、而不是通过同一标识信息区分在使用频度方面彼此相似的两种译码方案类型。
例如,如图10所示,在第一编码部件51和第二编码部件52被归类成同一标识信息的情况下,数据传输比特增加,从而降低传输效率。
在存在至少三种数据译码类型的情况下,本发明的特征在于通过第一信息区分具有最高使用频度的数据译码方案。所以,通过第二信息,具有低使用频度的其余两种译码方案分别被区分。
图11和图12分别是根据本发明的数据译码选择方案的流程图。
在图11中,假设DIFF译码是具有最高使用频度的数据译码方案。在图12中,假设PBC译码是具有最高使用频度的数据译码方案。
参考图11,检查具有最低使用频度的PCM译码存在还是不存在(S10)。如上所述,该检查根据用于标识的第一信息执行。
作为检查的结果,如果是PCM译码,则检查是否是PBC译码(S20)。这根据用于标识的第二信息执行。
在DIFF译码的使用频度在总共100次中是60次的情形中,对于相同的100个数据组用于每组的译码类型选择的标识信息需要总共140比特,即“第一信息(100比特)+第二信息(40比特)”。
参考图12,类似于图11,检查具有最低使用频度的PCM译码存在还是不存在(S30)。如上所述,该检查根据用于标识的第一信息执行。
作为检查的结果,如果是PCM译码,则检查是否是DIFF译码(S40)。这由用于标识的第二信息执行。
在DIFF译码的使用频度在总共100次中是80次的情形中,对于相同的100个数据组用于每组的译码类型选择的标识信息需要总共120比特,即“第一信息(100比特)+第二信息(20比特)”。
根据本发明的标识多个数据译码方案的方法和利用该方法的信号处理方法和装置解释如下。
根据本发明的一个实施例处理信号的方法包括以下步骤:分层提取指示多个数据译码方案的标识信息、以及根据对应于标识信息的数据译码方案对数据进行解码。
在这种情况下,指示包括在多个数据译码方案中的PBC译码方案和DIFF译码方案的标识信息是从不同的层中提取的。
在解码步骤中,根据数据译码方案利用对应于多个数据的基准值和利用该数据生成的差分值获取数据。在这种情况下,基准值是导引基准值或差分基准值。
根据本发明的另一个实施例处理信号的方法包括分层提取指示至少三个或更多数据译码方案的标识信息的步骤。在这种情况下,指示标识信息中具有高使用频度的两种译码方案的标识信息是从不同的层中提取的。
根据本发明的又一个实施例处理信号的方法包括以下步骤:根据指示数据译码方案的标识信息的使用频度分层提取标识信息,以及根据对应于标识信息的数据解码方案对数据进行解码。
在这种情况下,以分层提取第一标识信息和第二标识信息的方式提取标识信息。第一标识信息指示是否是第一数据译码方案,而第二标识信息指示是否是第二数据译码方案。
第一标识信息指示是否是DIFF译码方案。并且,第二标识信息指示是导引译码方案还是PCM编组方案。
第一数据译码方案可以是PCM译码方案。并且第二数据译码方案可以是PBC译码方案或DIFF译码方案。
所述数据是参数,且该数据处理方案还包括利用诸参数重建音频信号的步骤。
根据本发明的一个实施例处理信号的装置包括分层提取区分多个数据译码方案的标识信息的标识符提取部件(例如,图13中的“710”)、和根据对应于该标识信息的数据译码方案对数据进行解码的解码部件。
根据本发明的另一个实施例处理信号的方法包括以下步骤:根据数据译码方案对数据进行编码,以及生成区分在对数据进行编码时使用的使用频度互不相同的数据译码方案的标识信息。
在这种情况下,标识信息将PCM译码方案与PBC译码方案互相区分。具体地,标识信息区分PCM译码方案和DIFF译码方案。
并且,根据本发明的又一个实施例的处理信号的装置包括根据数据译码方案对数据进行编码的编码部件、以及生成区分在对数据进行编码时使用的使用频度互不相同的数据译码方案的标识信息的标识信息生成部件(例如,图11中的“400”)。
4-2.数据译码间的关系
首先,在本发明的PCM、PBC和DIFF之间存在相互独立和/或相关的关系。例如,可自由地为成为数据译码目标的每一个组选择三种译码类型中的一种。所以,总体数据译码带来了将三种译码方案类型彼此结合使用的结果。然而,通过考虑三种译码的使用频度,首先选择具有最优使用频度的DIFF译码方案和其余两种译码方案(例如,PCM和PBC)中的一种。随后,其次选择PCM和PBC中的一种。然而,如上所述,这是要考虑标识信息的传输效率,而不归结于实际译码方案的相似性。
在译码方案的相似性方面,PBC和DIFF在计算差分值方面彼此相似。所以,PBC和DIFF的译码过程彼此显著重叠。具体地,在解码时由差分值重建原始参数的步骤被定义为“Δ解码”,并可设计成在同一步骤中处理。
在执行PBC或DIFF译码的过程中,可能存在偏离其范围的参数。在这种情况下,需要通过单独的PCM译码并传输对应的参数。
[编组]
1.编组的概念
本发明提出通过将指定的数据捆绑在一起来处理数据用以高效译码的“编组”。具体地,在PBC译码的情况下,因为导引基准值按组为单位来选择,所以编组过程必须是在执行PBC译码之前要完成的步骤。将编组以相同的方式应用于DIFF译码。并且,根据本发明的编组方案中有一部分也适用于熵译码,这将在后面的相应描述部分中解释。
可参考编组的执行方法将本发明的编组类型归类成“外部编组”和“内部编组”。
或者,可参考编组目标将本发明的编组类型归类成“域编组”、“数据编组”和“声道编组”。
或者,可参考编组执行顺序将本发明的编组类型归类成“第一编组”、“第二编组”和“第三编组”。
或者,可参考编组执行计数将本发明的编组类型归类成“单次编组”和“多次编组”。
然而,以上的编组归类是为了便于传达本发明的概念而进行的,并不对其使用的术语进行限制。
根据本发明的编组是以各种编组方案互相重叠地使用或互相结合使用的方式来完成的。
在以下的描述中,通过将编组区分成内部编组和外部编组来解释根据本发明的编组。随后,将解释其中多种编组类型共存的多重编组。并且将解释域编组和数据编组的概念。
2.内部编组
内部编组是指编组的执行是在内部实施的。如果在总体上执行内部编组,则先前的组内部地重新编组,以生成新组或分割组。
图13是根据本发明解释内部编组的图。
参考图13,例如,根据本发明的内部编组是按频域单位(在下文中称为“频带”)来实施的。所以,内部编组方案有时可对应于一类域编组。
如果采样数据通过特定滤波器,例如,QMF(正交镜像滤波器),则生成多个子带。在子带模式中,执行第一频率编组以生成可称为参数频带的第一组频带。第一频率编组能够通过将子带不规则地捆绑在一起来生成参数频带。所以,能够配置大小不等的参数频带。然而,根据译码目的,能够同等地配置参数频带。并且,生成子带的步骤可被归类为一类编组。
随后,在所生成的参数频带上执行第二频率编组,以生成可称为数据频带的第二组频带。第二频率编组能够通过将一致数目(uniform number)的参数频带统一来生成数据频带。
在完成编组后根据译码的目的,能够按对应于第一组频带的参数频带单位或按对应于第二组频带的数据频带单位来执行译码。
例如,在应用上述PBC译码时,能够通过将编组的参数频带作为一个组或通过将编组的数据频带作为一个组来选择导引基准值(一类组基准值)。PBC是利用所选的导引基准值来实现的,PBC的详细操作与以上描述中所解释的相同。
又例如,在应用上述的DIFF译码时,通过将编组的参数频带作为一个组来确定组基准值,然后计算差分值。或者,还可通过将编组的数据频带作为一个组来确定组基准值并计算差分值。并且,DIFF的详细操作与以上描述中所解释的相同。
如果将第一和/或频率编组应用与实际译码,则必须传输对应的信息,稍后将参考图23解释。
3.外部编组
外部编组是指编组的执行在外部实施的情况。如果总体上实施外部编组,则先前的组外部地重新编组,以生成新组或组合组。
图14是根据本发明解释外部编组的图示。
参考图14,例如,根据本发明的外部编组按时域单位(在下文中称为“时隙”)来实施。所以,外部编组方案有时可对应于一类域编组。
对包括采样数据的帧执行第一时间编组,以生成第一组时隙。图14示例性地示出生成八个时隙。第一时间编组还具有将一个帧分成大小相等的多个时隙的意思。
选择通过第一时间编组生成的时隙中的至少一个。图14示出选择时隙1、4、5和8的情况。根据译码方案,在选择步骤中能选择全部时隙。
然后将所选时隙1、4、5和8重新编排成时隙1、2、3和4。然而,根据译码的目标,可部分地重新编排所选时隙1、4、5和8。在这种情况下,因为排除在重新编排之外的时隙被排除在最终的组形成之外,所以被从PBC或DIFF译码目标中排除。
对所选的时隙执行第二时间编组,以构成在最终的时间轴上一起处理的组。
例如,时隙1和2、或时隙3和4可构成一个组,该组被称为时隙对。又例如,时隙1、2和3可构成一个组,该组被称为时隙三重组(timeslot triple)。并且不与其它时隙构成组的单个时隙可以存在。
在第一和第二时间编组被应用于实际译码的情况下,需要传输相应的信息,稍后将参考图23解释。
4.多重编组
多重编组是指将内部编组、外部编组以及各种其它编组混合在一起来生成最终的组的编组方案。如在以上的描述中所提及的,根据本发明的各个编组方案可通过互相重叠或互相结合来应用。并且,将多重编组用作一种提高各种译码方案的效率的方案。
4-1.混合内部编组和外部编组
图15是解释根据本发明的多重编组的图,其中将内部编组和外部编组混合。
参考图15,最终编组的频带64是在频域中完成内部编组后生成的。并且,最终时隙61、62和63是在时域中完成外部编组后生成的。
在编组完成后得到的一个单个的时隙被称为数据集。在图15中,附图标记61a、61b、61a、62b和63分别指示数据集。
特别地,两个数据集61a和61b或另两个数据集62a和62b可通过外部编组构成一对。一对数据集被称为“数据对”。
在多重编组完成后,执行PBC或DIFF译码应用。
例如,在执行PBC译码的情况下,导引基准值P1、P2或P3被选择用于最终完成的数据对61或62或未构成数据对的每个数据集63。然后利用所选的导引基准值执行PBC译码。
例如,在执行DIFF译码的情况下,为数据集61a、61b、62a、62b、63各自确定DIFF译码类型。如以上描述所提及的,应为其中每一个数据集确定一个DIFF方向,并可将其确定为“DIFF-DF”和“DIFF-DT”之一。根据所确定的DIFF译码方案执行DIFF译码的过程与以上描述中所提及的相同。
在多重编组中为了通过执行外部编组来构成数据对,应对构成数据对的每一个数据集执行等同的内部编组。
例如,构成数据对的数据集61a和61b各自具有相同的数据频带数目。并且,构成数据对的数据集62a和62b各自具有相同的数据频带数目。然而,分别属于不同的数据对的数据集(例如,61a和62a)的数据频带数目互不相同是没有问题的。这意味着可将不同的内部编组应用于每一个数据对。
在配置数据对的情况下,可通过内部编组执行第一编组并可通过外部编组执行第二编组。
例如,在第二编组之后得到的数据频带数目对应于在第一编组之后得到的数据频带数目作指定倍乘。这是因为构成数据对的每一个数据集具有相同的数据频带数目。
4-2.混合内部编组和内部编组
图16和图17分别是解释根据本发明的另一个实施例的混合编组的图。具体地,图16和图17集中地示出内部编组的混合。所以,显然在图16或图17中执行了或可执行外部编组。
例如,图16示出在第二频率编组完成后生成数据频带的情况下再次执行内部编组的情况。具体地,通过第二频率编组生成的数据频带被分为低频带和高频带。在特定译码的情况下,必须分开地利用低频带或高频带。具体地,分开利用低频带和高频带的情况被称为“双模”。
所以,在双模的情况下,数据译码是通过将最终生成的低或高频带作为一个组来执行的。例如,分别为低和高频带生成导引基准值P1和P2,然后在相对应的频带内执行PBC译码。
双模可根据每声道的特性来应用。所以,可将其称为“声道编组”。并且,也可根据数据类型有差别地应用双模。
例如,图17示出了在上述的第二频率编组完成后生成数据频带的情况下再次执行内部编组的情况。即,通过第二频率编组所生成的数据频带被分为低频带和高频带。在特定译码的情况下,仅利用低频带,而且需要丢弃高频带。具体的,仅编组利用低频带的情况被称为“低频声道(LFE)模式”。
在低频声道(LFE)模式中,通过将最终生成的低频带作为一个组来执行数据译码。
例如,为低频带生成导引基准值P1,然后在相对应的低频带中执行PBC译码。然而,可通过在所选的低频带上执行内部编组来生成新的数据频带。这是为了集中地编组要表现的低频带。
并且,低频声道(LFE)模式根据低频声道特性来应用,并可将其称为“声道编组”。
5.域编组和数据编组
可参考编组的目标将编组归类成域编组和数据编组。
域编组是指在特定域(例如,频域或时域)上编组域单位的方案。并且,可通过上述的内部编组和/或外部编组执行域编组。
并且,数据编组是指编组数据本身的方案。数据编组可通过上述的内部编组和/或外部编组来执行。
在数据编组的特殊情况下,可执行编组,以使其在熵译码中可用。例如,数据编组可以在图15所示的最终完成的编组状态下用于对实际数据的熵译码。即,数据被处理的方式是使在频率方向上或者时间方向之一上彼此相邻的两个数据被捆绑在一起。
然而,在以上述方式实施数据编组的情况下,在最终的组内的数据被部分地重新编组。所以,PBC或DIFF不仅仅应用于经数据编组的组(例如,两个数据)。此外,稍后将解释对应于数据编组的熵译码方案。
6.使用编组的信号处理方法
6-1.至少使用内部编组的信号处理方法
一种根据本发明的使用上述编组方案的信号处理方法和装置解释如下。
根据本发明的一个实施例的处理信号的方法包括以下步骤:获取对应于通过第一编组和用于该第一编组的内部编组包括在一个组中的多个数据对应的组基准值和与该组基准值对应的差分值,以及利用该组基准值和差分值获取数据。
本发明的特征在于通过第一编组处理而编组的数据数目大于通过内部编组而编组的数据数目。在这种情况下组基准值可以是导引基准值或差分基准值。
根据本发明的一个实施例的方法还包括对组基准值和差分值中的至少一个进行解码的步骤。在这种情况下,导引基准值是按组确定的。
并且,分别预先设定通过内部编组包括在内部组中的数据的数目。在这种情况下,包括在内部组中的数据的数目互不相同。
在频域上对数据执行第一编组和内部编组。在这种情况下,频域可对应于混合域、参数频带域、数据频带域和声道域中的一个。
并且,本发明的特征在于经由第一编组得到的第一组包括经由内部编组得到的内部组。
本发明的频域按频带来区分。频带通过内部编组变成子频带。子频带通过内部编组变成参数频带。参数频带通过内部编组变成数据频带。在这种情况下,可将参数频带的数目限于最大28。并且,可将参数频带按2个、5个或10个编组成一个数据频带。
根据本发明的一个实施例的处理信号的装置包括获取与通过第一编组和用于该第一编组的内部编组包括在一个组中的多个数据对应的组基准值和与该组基准值对应的差分值的值获取部件,以及利用该组基准值和差分值获取数据的数据获取部件。
根据本发明的另一个实施例的处理信号的方法包括以下步骤:利用对应于通过第一编组和用于该第一编组的内部编组包括在一个组中的多个数据的组基准值和这些数据生成一差分值,以及传输所生成的差分值。
并且,根据本发明的另一个实施例的处理信号的装置包括利用对应于通过第一编组和用于该第一编组的内部编组包括在一个组中的多个数据的组基准值和这些数据来生成一差分值的值生成部件,以及传输所生成的差分值的输出部件。
6-2.利用多重编组的信号处理方法
一种根据本发明的上述编组方案的信号处理方法和装置解释如下。
一种根据本发明的一个实施例的处理信号的方法包括以下步骤:获取与通过编组包括在一个组中的多个数据相对应的组基准值和对应于该组基准值的差分值,以及利用组基准值和差分值获取数据。
在这种情况下,组基准值可以是导引基准值和差分基准值之一。
并且,编组可对应于外部编组和内部编组之一。
此外,编组可对应于域编组和数据编组之一。
数据编组可在域组上执行。并且,包括在域编组处理中的时域包括时隙域、参数集域和数据集域中的至少一个。
包括在域编组处理中的频域可包括采样域、子带域、混合域、参数频带域、数据频带域和声道域中的至少一个。
可从包括在组中的多个数据来设定一个差分基准值。并且,要确定编组计数、编组范围、和编组存在与否中的至少一个。
一种根据本发明的一个实施例的处理信号的装置包括获取与通过编组包括在一个组中的多个数据相对应的组基准值和对应于该组基准值的差分值的值获取部件,以及利用组基准值和差分值获取数据的数据获取部件。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:利用与通过编组包括在一个组中的多个数据相对应的组基准值和这些数据生成一差分值,以及传输所生成的差分值。
一种根据本发明的另一个实施例的处理信号的装置包括利用与通过编组包括在一个组中的多个数据相对应的组基准值和这些数据生成一差分值的值生成部件,以及传输所生成的差分值的输出部件。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:获取与通过包括第一编组和第二编组在内的编组包括在一个组中的多个数据相对应的组基准值和对应于该组基准值的第一差分值,以及利用组基准值和第一差分值获取数据。
在这种情况下,组基准值可包括导引基准值或差分基准值。
该方法还包括对组基准值和第一差分值中的至少一个进行解码的步骤。并且,第一导引基准值是按组确定的。
该方法还包括以下步骤:获取对应于多个第一导引基准值的第二导引基准值和对应于第二导引基准值的第二差分值,以及利用第二导引基准值和第二差分值获取第一导引基准值。
在这种情况下,第二编组可包括用于第一编组的外部或内部编组。
在时域和频域中的至少一个上对数据进行编组。具体地,编组是对时域和频域中的至少一个进行编组的域编组。
时域可包括时隙域、参数集域或数据集域。
频域可包括采样域、子带域、混合域、参数频带域、数据频带域或声道域。并且,编组的数据(grouped data)是索引或参数。
利用通过第一编组包括在一个组中的索引所指示的熵表对第一差分值进行熵解码。并且,利用组基准值和经熵解码的第一差分值获取数据。
利用通过第一编组包括在一个组中的索引所指示的熵表对第一差分值和组基准值进行熵解码。并且,利用经熵解码的组基准值和经熵解码的第一差分值获取数据。
一种根据本发明的另一个实施例的处理信号的装置包括获取与通过包括第一编组和第二编组在内的编组包括在一个组中的多个数据相对应的组基准值和对应于该组基准值的差分值的值获取部件,以及利用组基准值和差分值获取数据的数据获取部件。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:利用与通过包括第一编组和第二编组在内的编组包括在一个组中的多个数据相对应的组基准值和这些数据生成一差分值,以及传输所生成的差分值。
一种根据本发明的另一个实施例的处理信号的装置包括利用与通过包括第一编组和第二编组在内的编组包括在一个组中的多个数据相对应的组基准值和这些数据生成一差分值的值生成部件,以及传输所生成的差分值的输出部件。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:获取与通过第一编组和用于该第一编组的外部编组包括在一个组中的多个数据相对应的组基准值和对应于该组基准值的差分值,以及利用组基准值和差分值获取数据。
在这种情况下,与通过第一编组处理而编组的数据的数目相对应的第一数据数目小于与通过外部编组处理而编组的数据的数目相对应的第二数数目。并且,第一数据数目和第二数据数目之间存在倍乘关系。
组基准值可包括导引基准值或差分基准值。
该方法还包括对组基准值和差分值中的至少一个进行解码的步骤。
按组对导引基准值进行解码。
在时域和频域中的至少一个上对数据进行编组。时域可包括时隙域、参数集域或数据集域。并且,频域可包括采样域、子带域、混合域、参数频带域、数据频带域或声道域。
该方法还包括将所获取的数据作为参数重建音频信号的步骤。并且,外部编组可包括成对参数。
一种根据本发明的另一个实施例的处理信号的装置包括获取与通过第一编组和用于该第一编组的外部编组包括在一个组中的多个数据相对应的组基准值和对应于该组基准值的差分值的值获取部件,以及利用组基准值和差分值获取数据的数据获取部件。
一种根据本发明的又一个实施例的处理信号的方法包括以下步骤:利用与通过第一编组和用于该第一编组的外部编组包括在一个组中的多个数据相对应的组基准值和这些数据生成差分值,并传输所生成的差分值。
并且,据本发明的又一个实施例处理信号的装置包括:利用与通过第一编组和用于该第一编组的外部编组包括在一个组中的多个数据相对应的组基准值和这些数据生成一差分值的值生成部件,以及传输所生成的差分值的输出部件。
6.3.至少使用数据编组的信号处理方法
一种根据本发明的上述编组方案的信号处理方法和装置解释如下。
一种根据本发明的一个实施例的处理信号的方法包括以下步骤:获取与通过数据编组和用于数据编组的内部编组包括在一个组中的多个数据相对应的组基准值和对应于该组基准值的差分值,以及利用组基准值和差分值获取数据。
在这种情况下,包括在内部编组中的数据的数目小于包括在数据编组中的数据的数目。并且,数据对应于参数。
内部编组是完整地在多个经数据编组的数据上执行的。在这种情况下,可按参数频带执行内部编组。
内部编组可部分地在多个经数据编组的数据上执行。在这种情况下,可按多个经数据编组的数据中的每一个的声道执行内部编组。
组基准值可包括导引基准值或差分基准值。
该方法还包括对组基准值和差分值中的至少一个进行解码的步骤。在这种情况下,导引基准值是按组确定的。
可在频域上对数据执行数据编组和内部编组。
频域可包括采样域、子带域、混合域、参数频带域、数据频带域、和声道域中的一个。在获取数据时,使用数据编组和内部编组中的至少一个的编组信息。
编组信息包括各组的位置、各组的号码、按组应用组基准值的存在与否、组基准值的数目、组基准值的编解码方案、以及获取组基准值的存在与否中的至少一个。
一种根据本发明的一个实施例的处理信号的装置包括获取与通过数据编组和用于数据编组的内部编组包括在一个组中的多个数据相对应的组基准值和对应于该组基准值的差分值的值获取部件,以及利用组基准值和差分值获取数据的数据获取部件。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:利用与通过数据编组和用于数据编组的内部编组包括在一个组中的多个数据相对应的组基准值和这些数据生成一差分值,以及传输所生成的差分值。
并且,根据本发明的另一个实施例处理信号的装置包括利用与通过数据编组和用于数据编组的内部编组包括在一个组中的多个数据相对应的组基准值和这些数据生成一差分值的值生成部件,以及传输所生成的差分值的输出部件。
[熵译码]
1.熵译码的概念
根据本发明的熵译码是指在数据译码的结果上执行可变长度译码的过程。
一般而言,熵译码以统计方式处理具体数据的出现概率。例如,通过向在概率上具有高出现频率的数据分配较少比特而向在概率上具有低出现频率的数据分配较多的比特可整体上提高传输效率。
并且,本发明旨在提出一种与一般熵译码不同的、与PBC译码和DIFF译码互相联系的高效率熵译码方法。
1-1.熵表
首先,预定的熵表对于熵译码是必须的。熵表被定义为码本。并且,编码部件和解码部件使用同一熵表。
本发明提出一种熵译码方法和唯一性熵表以高效率地处理各种数据译码结果。
1-2.熵译码类型(1D/2D)
本发明的熵译码被归类为两种类型。一种类型是通过一个熵表导出一个索引(索引1),而另一个类型是通过一个熵表导出两个相继的索引(索引1和索引2)。前者被称为“1D(一维)熵译码”而后者被称为“2D(两维)熵译码”。
图18是根据本发明的1D和2D熵表的示例图。参考图18,本发明的熵表基本包括索引字段、长度字段和码字字段。
例如,如果具体数据(例如,导引基准值、差分值等)是通过上述的数据译码计算的,则相对应的数据(对应于“索引”)具有通过熵表指定的码字。码字转变成比特流然后传输到解码部件。
接收了码字的熵解码部件确定用于相对应的数据的熵表,然后利用相对应的码字和所确定的表中配置该码字的比特长度导出索引值。在这种情况下,本发明将码字表示成十六进制。
由1D或2D熵译码导出的索引值的正号(+)或负号(-)被省略。所以,需要在1D或2D熵译码完成后赋上正负号。
在本发明中,根据1D或2D有差别地赋予正负符号。
例如,在1D熵译码的情况下,如果相对应的索引不是“0”,则分配并传输单独的1比特符号位(例如,“bsSign”)。
在2D熵译码的情况下,因为相继提取两个索引,所以是通过编程两个所提取的索引之间的关系的方式来确定是否分配正负符号位。在这种情况下,该程序使用两个提取的索引的和值、两个提取的索引之间的差值、和对应于熵表内的最大绝对值(lav)。与在简单2D的情形中将正负符号位分配给每一个索引的情况相比,这可减小传输比特数。
在其中索引是一个接一个地导出的1D熵表可用于所有的数据译码结果。然而,在其中每次导出两个索引2D熵表对于特定情况使用受限。
例如,如果数据译码不是通过上述的编组过程得到的对(pair),则2D熵表部分使用受限。并且,2D熵表的使用被限于作为PBC译码结果计算出的导引基准值。
因此,如在以上描述中所述,本发明的熵译码的特征在于以将熵译码与数据译码的结果相互联系的方式利用最高效的熵译码方案。详释如下。
1-3.2D方法(时间配对/频率配对)
图19是根据本发明用于2D熵译码的两种方法的示例图。2D熵译码是用于导出两个彼此相邻的索引的过程。所以,可根据这两个相继索引的方向区分2D熵译码。
例如,将两个索引在频率方向上彼此相邻的情况称为“2D频率配对(在下文中简称为2D-FP)”。并且,将两个索引在时间方向上彼此相邻的情况称为“2D时间配对(在下文中简称为2D-TP)”。
参考图19,2D-FP和2D-TP可分别配置不同的索引表。编码器必须根据数据解码的结果来确定最有效率的熵译码方案。
在以下的描述中解释高效地与数据译码相互联系地确定熵译码的方法。
1-4.熵译码信号处理方法
一种根据本发明利用熵译码处理信号的方法解释如下。
在一种根据本发明的一个实施例的处理信号的方法中,获取对应于多个数据的基准值和对应于该基准值的差分值。随后,对差分值进行熵解码。然后使用基准值和经熵解码的差分值获取数据。
该方法还包括对基准值进行熵解码的步骤。并且,该方法还可包括使用经熵解码的基准值和经熵解码的差分值获取数据的步骤。
该方法还包括获取熵译码标识信息的步骤。并且,熵译码是根据由熵译码标识信息所指示的熵译码方案来执行。
在这种情况下,熵译码方案是1D译码方案和多维译码方案(例如,2D译码方案)中的一种。并且,多维译码方案是频率对(FP)译码方案和时间对(TP)译码方案中的一种。
基准值可包括导引基准值和差分基准值之一。
并且,该信号处理方法还可包括利用数据作为参数来重建音频信号的步骤。
一种根据本发明的一个实施例的用于处理信号的装置包括获取对应于多个数据的基准值和对应于该基准值的差分值的值获取部件、对差分值进行熵解码的熵解码部件、以及利用基准值和经熵解码的差分值获取数据的数据获取部件。
在这种情况下,值获取部件包括在上述的比特流多路分解部件60中,而数据获取部件包括在上述的数据解码部件91或92中。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:使用对应于多个数据的基准值和这些数据生成一差分值,对所生成的差分值进行熵编码,并输出经熵编码的差分值。
在这种情况下,对基准值进行熵编码。传输经熵编码的基准值。
该方法还包括生成用于熵编码的熵译码方案的步骤。并且,传输所生成的熵译码方案。
一种根据本发明的另一个实施例的用于处理信号的装置包括使用对应于多个数据的基准值和这些数据生成一差分值的值生成部件、对所生成的差分值进行熵编码的熵编码部件、以及输出经熵编码的差分值的输出部件。
在这种情况下,值生成部件包括在上述的数据编码部件31或32中。并且,输出部件包括在上述的比特流多路复用部件50中。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:获取对应于多个数据译码方案的数据,使用对于数据译码方案唯一性的熵表标识符确定包括在此数据中的导引基准值和导引差分值中的至少一个所用的熵表,并使用该熵表对导引基准值和导引差分值中的至少一个进行熵解码。
在这种情况下,熵表标识符对于导引译码方案、频率差分译码方案和时间差分译码方案中的一个是唯一性的。
并且,熵表标识符对于导引基准值和导引差分值中的每一个都是唯一性的。
熵表对于熵表标识符是唯一性的,并包括导引表、频率差分表和时间差分表中的一个。
或者,熵表对于熵表标识符不是唯一性的,且频率差分表和时间差分表中的一个可以被共享。
对应于导引基准值的熵表可使用频率差分表。在这种情况下,通过1D熵译码方案对导引基准值进行熵解码。
熵译码方案包括1D熵译码方案和2D熵译码方案。具体地,2D熵译码方案包括频率对(2D-FP)译码方案和时间对(2D-TP)译码方案。
并且,本方法可使用数据作为参数来重建音频信号。
一种根据本发明的另一个实施例的处理信号的装置包括获取对应于多个数据的导引基准值和对应于该导引基准值的导引差分值的值获取部件、以及对导引差分值进行熵解码的熵解码部件。并且,该装置还包括使用导引基准值和经熵解码的导引差分值获取数据的数据获取部件。
一种根据本发明的又一个实施例的处理信号的方法包括以下步骤:使用对应于多个数据的导引基准值和这些数据生成导引差分值,对所生成的导引差分值进行熵编码,以及传输经熵编码的导引差分值。
在这种情况下,用于熵编码的表可包括导引专用表。
该方法还包括对导引基准值进行熵编码的步骤。并且,传输经熵编码的导引基准值。
该方法还包括生成用于熵编码的熵译码方案。并且,传输所生成的熵译码方案。
一种根据本发明的又一个实施例的处理信号的装置包括使用对应于多个数据的导引基准值和这些数据生成导引差分值的值生成部件、对所生成的导引差分值进行熵编码的熵编码部件、以及传输经熵编码的导引差分值的输出部件。
2.与数据译码的关系
如以上说明所述,本发明提出了三种数据译码方案。然而,对于根据PCM方案的数据不执行熵译码。在以下的描述中分别解释PBC译码和熵译码之间的关系及DIF译码和熵译码之间的关系。
2-1.PBC译码和熵译码
图20是根据本发明的用于PBC译码结果的熵译码方案的图。
如上所述,在完成PBC译码后,计算一个导引基准值和多个差分值。并且,导引基准值和差分值全部成为熵译码的目标。
例如,根据上述的编组方法,确定要应用PBC译码的组。在图20中,为了便于解释,将时间轴上的成对组(pair)的情况和时间轴上的不成对组(non-pair)的情况作为例子。在PBC译码完成后的熵译码解释如下。
首先,解释在不成对组上执行PBC译码的情况83。对成为熵译码目标的一个导引基准值执行1D熵译码,且可对其余的差分值执行1D熵译码或2D熵译码。
具体地,因为在不成对组的情形中,对于时间轴上的一个数据集就存在一组,所以不能执行2D-TP熵译码。即使执行2D-FP,也应对在导出索引对(pairs of indexes)后未能构成一个对的最后频带81a中的参数值执行1D熵译码。一确定每数据的熵译码方案后,即使用相对应的熵表生成码字。
因为本发明涉及例如为一个组生成一个导引基准值的情况,所以应执行1D熵译码。然而,在本发明的另一个实施例中,如果从一个组中生成至少两个导引基准值,则可对相继导引基准值执行2D熵译码。
其次,在成对组上执行PBC译码的情况84解释如下。
对成为熵译码目标的一个导引基准值执行1D熵译码,可对其余的差分值执行1D熵译码、2D-FP熵译码或2D-TP熵译码。
具体地,因为在成对组(pair)的情形中,对于时间轴上彼此相邻的两个数据集存在一个组,所以能够执行2D-TP熵译码。即使执行2D-FP,也应对在导出索引对后未能构成一个对的最后频带81b或81c中的参数值执行1D熵译码。然而,如图20中所证实,在应用2D-TP熵译码的情形中,不存在有最后频带未能构成一个对的情况。
2-2.DIFF译码和熵译码
图21是根据本发明的用于DIFF译码结果的熵译码方案的图。
如上所述,在完成DIFF译码后,计算了一个导引基准值和多个差分值。并且,导引基准值和差分值全部成为熵译码的目标。然而,在DIFF-DT的情形中,基准值可能不存在。
例如,根据上述的编组方法,确定将要应用DIFF译码的组。在图21中,为了便于解释,将时间轴上的成对组(pair)的情况和时间轴上的不成对组(non-pair)的情况作为例子。并且,图21示出根据DIFF译码方向将作为数据译码单位的数据集区分为时间轴方向上的DIFF-DT和频率轴方向上的DIFF-DF的情况。
在DIFF译码完成后的熵译码解释如下。
首先,解释在不成对组上执行DIFF译码的情况。在不成对组的情况下,一个数据集存在于时间轴上。并且,该数据集可根据DIF译码方向成为DIFF-DF或DIFF-DT。
例如,如果不成对组的一个数据集是DIFF-DF(85),则基准值成为第一频带82a中的参数值。对基准值执行1D熵译码,且可对其余的差分值执行1D熵译码或2D-FP熵译码。
即,在DIFF-DF及不成对组的情况下,在时间轴上对于一个数据集存在一个组。所以,不能执行2D-TP熵译码。即使执行2D-FP,在导出索引对后,也应对未能构成一个对的最后频带83a中的参数值执行1D熵译码。一为每一数据确定了译码方案,则使用相对应的熵表生成码字。
例如,在不成对组的一个数据集是DIFF-DT(86)的情况下,因为在相对应的数据集中不存在基准值,所以不执行“第一频带”处理。所以,可对差分值执行1D熵译码或2D-FP熵译码。
在DIFF-DT并且是不成对组的情况下,要得出差分值的数据集可能是未能构成一个数据对的相邻数据集或在另一个音频帧内的数据集。
即,在DIFF-DT并且是不成对组(86)的情况下,在时间轴上对于一个数据集存在一个组。所以,不能执行2D-TP熵译码。即使执行2D-FP,在导出索引对后,也应对未能构成一个对的最后参数频带中的参数值执行1D熵译码。然而,图21恰好示出例如不存在未能构成一个对的最后频带的情况。
一但为每一数据确定了译码方案,则使用相对应的熵表生成码字。
其次,解释在成对组(pair)上执行DIFF译码的情况。在成对组上执行数据译码的情况下,在时间轴上两个数据集构成一个组。并且,每一组内的数据集各自根据DIFF译码方向成为DIFF-DF或DIFF-DT。所以,可将其归类为构成一对的两个数据集都是DIFF-DF(87)的情况、构成一对的两个数据集都是DIFF-DT的情况、以及构成一对的两个数据集分别具有不同的译码方向(例如,DIFF-DF/DT或DIFF-DT/DF)(88)的情况。
例如,在构成一对的两个数据集都是DIFF-DF(即DIFF-DF/DF)(87)的情况下,如果数据集中的每一个都不被配对(non-paired)且是DIFF-DF,则所有可用的熵译码方案都可执行。
例如,在相对应的数据集中的每一个基准值成为第一频带82b或82c中的参数值,且对基准值执行1D熵译码。并且,可对其余的差分值执行1D熵译码或2D-FP熵译码。
即使在相对应的数据集内执行2D-FP,在导出索引对后,也应对未能构成一个对的最后频带83b或83c中的参数值执行1D熵译码。因为两个数据集构成一个对,所以可执行2D-TP熵译码。在这种情况下,在从相对应的数据集内不包括第一频带82b或82c的下一频带至最后频带的范围内的频带上顺序地执行2D-TP熵译码。
如果执行2D-TP熵译码,则不生成未能构成一个对的最后频带。
一确定每数据的熵译码方案,即使用相对应的熵表生成码字。
例如,在构成一个对的两个数据集都是DIFF-DT(即,DIFF-DT/DT)的情况下(89),因为相对应的数据集内不存在基准值,所以不执行第一频带处理。并且,可在每一个数据集内的所有差分值上执行1D熵译码或2D-FP熵译码。
即使在相对应的数据集内执行2D-FP,在导出索引对后,也应对未能构成一个对的最后频带内的参数值进行1D熵译码。然而,图21示出的是一个不存在未能构成一个对的最后频带的例子。
因为两个数据集构成一个对,所以2D-TP熵译码是可执行的。在这种情况下,在相对应的参数集内从第一频带至最后频带范围内的频带上顺序执行2D-TP熵译码。
如果执行2D-TP熵译码,则不生成未能构成一个对的最后频带。
一确定每数据的熵译码方案,即使用相对应的熵表生成码字。
例如,可能会存在构成一个对的两个数据集分别具有不同的译码方向的情况(即,DIFF-DF/DT或DIFF-DT/DF)(88)。图21示出DIFF-DF/DT的例子。在这种情况下,可基本地对每一个数据集执行根据相对应的译码类型适用的所有熵译码方案。
例如,在构成一个对的两个数据集当中的DIFF-DF数据集之中,用相对应的数据集(DIFF-DF)内的基准值对第一频带82d内的参数值执行1D熵译码。并且,可对其余的差分值执行1D熵译码或2D-FP熵译码。
即使在相对应的数据集(DIFF-DF)内执行2D-FP,在导出索引对后,也应对未能构成一个对的最后频带83d内的参数值执行1D熵译码。
例如,在构成一个对的两个数据集当中的DIFF-DT数据组之中,因为基准值不存在,所以不执行第一频带处理。并且,可对相对应的数据集(DIFF-DT)内的所有差分值执行1D熵译码或2D-FP熵译码。
即使在相对应的数据集(DIFF-DT)内执行2D-FP,在导出索引对后,也应对未能构成一个对的最后频带内的参数值执行1D熵译码。然而,图21示出的是一个不存在未能构成一个对的最后频带的例子。
因为构成一个对的两个数据集分别具有互不相同的译码方向,所以可执行2D-TP熵译码。在这种情况下,在从排除包括第一频带82d在内的第一频带后的下一频带至最后频带的频带范围内的频带上顺序地执行2D-TP熵译码。
如果执行2D-TP熵译码,则不生成未能构成一个对的最后频带。
一确定每数据的熵译码方案,即使用相对应的熵表生成码字。
2-3.熵译码和编组
如上所述,在2D-FP或2D-TP的情况下,使用一个码字提取两个索引。所以,这意味着为熵译码执行编组方案。并且,可将其称为“时间编组”或“频率编组”。
例如,编码部件将数据译码步骤中提取的两个索引在频率或时间方向上编组。
随后,编码部件使用熵表选择代表两个编组的索引(grouped indexes)的一个码字,然后通过将其包括在比特流中来传输所选的码字。
解码部件接收通过编组包括在比特流中的两个索引得到的一个码字,并使用所应用的熵表提取两个索引值。
2-4.通过数据译码和熵译码之间关系的信号处理方法
根据本发明的通过PBC译码和熵译码之间的关系和DIFF译码和熵译码之间的关系的信号处理方法的特征解释如下。
一种根据本发明的一个实施例的处理信号的方法包括以下步骤:获取差分信息,根据包括时间编组和频率编组在内的熵译码方案对该差分信息进行熵解码,以及根据包括导引差分、时间差分和频率差分在内的数据解码方案对差分信息进行数据解码。并且,数据译码和熵译码之间的详细关系与以上描述中解释的相同。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:获取数字信号,根据熵译码方案对该数字信号进行熵解码,以及根据至少包括导引译码方案的多个数据译码方案之一对经熵解码的数字信号进行数据解码。在这种情况下,熵译码方案可根据数据译码方案确定。
一种根据本发明的另一个实施例的处理信号的装置包括获取数字信号的信号获取部件、根据熵译码方案对该数字信号进行熵解码的熵解码部件、以及根据至少包括导引译码方案的多个数据译码方案之一对经熵解码的数字信号进行数据解码的数据解码部件。
一种根据本发明的又一个实施例的处理信号的方法包括以下步骤:通过数据译码方案对数字信号进行数据编码,通过熵译码方案对经数据编码的数字信号进行熵编码,以及传输经熵编码的数字信号。在这种情况下,熵译码方案可根据数据译码方案确定。
并且,根据本发明的又一个实施例处理信号的装置包括通过数据译码方案对数字信号进行数据编码的数据编码部件、通过熵译码方案对经数据编码的数字信号进行熵编码的熵编码部件。并且,该装置还包括传输经熵编码的数字信号的输出部件。
3.熵表的选择
用于熵译码的熵表根据数据译码方案和成为熵译码目标的数据类型自动确定。
例如,如果数据类型是CLD参数且如果熵译码目标是导引基准值,则将表名称为“hcodPilot_CLD”的1D熵表用于熵译码。
例如,如果数据类型是CPC参数,如果数据译码是DIFF-DF,且如果熵译码目标是第一频带值,则将表名称为“hcodFirstband_CPC”的1D熵表用于熵译码。
例如,如果数据类型是ICC参数,如果数据译码方案是PBC,且如果熵译码由2D-TP执行,则将表名称为“hcod2D_ICC_PC_TP_LL”的2D-PC/TP熵表用于熵译码。在这种情况下,2D表名称中的“LL”指示表中的最大绝对值(在下文中简称为“LAV”)。并且,稍后将解释最大绝对值(LAV)。
例如,如果数据类型是ICC参数,如果数据译码方案是DIF-DF,且如果熵译码由2D-FP执行,则将表名称为“hcod2D_ICC_DF_FP_LL”的2D-FP熵表用于熵译码。
即,确定使用多个熵表中的哪一个执行熵译码是非常重要的。并且,较佳的是将对于成为每一个熵目标的每一个数据的特性而言合适的熵表配置成独立的。
然而,用于具有彼此类似的属性的数据的熵表可共享使用。举一个代表性的例子,如果数据类型是“ADG”或“ATD”,则能够应用CLD熵表。并且,可将“第一频带”熵表应用于PBC译码的导引基准值。
以下详细解释使用最大绝对值(LAV)选择熵表的方法。
3-1.熵表的最大绝对值(LAV)
图22是解释根据本发明的选择熵表的方法的图。
图22的(a)中示出多个熵表,在图22的(b)中示出选择熵表的表。
如上所述,根据数据译码和数据类型存在多个熵表。
例如,熵表可包括适用于数据类型是“xxx”的情况的熵表(例如,表1至4)、适用于数据类型是“yyy”的情况的熵表(例如,表5至8)、PBC专用熵表(例如,表k至k+1)、逸出熵表(例如,表n-2~n-1)以及LAV索引熵表(例如,表n)。
具体地,尽管较佳的是通过向相对应的数据中可能出现的每一个索引给予一码字来配置表,但如果是这样的话,表的大小显著增加。并且,管理不需要的或几乎不出现的索引是不方便的。在2D熵表的情况下,由于太多的索引可能出现,这些问题带来了更多的不便。为了解决这些问题,将使用最大绝对值(LAV)。
例如,如果特定数据类型的索引值的范围在“-X~+X”(X=15)之间,则在该范围内选择至少一个在概率上具有高出现频率的LAV,并将其配置到单独的表中。
例如,在配置CLD熵表时,可提供“LAV=3”的表、“LAV=5”的表、“LAV=7”的表或“LAV=9”的表。
例如,在图22的(a)中,可将表-1 91a设置成“LAV=3”的CLD表,将表-2 91b设置成“LAV=5”的CLD表,将表-3 91c设置成“LAV=7”的CLD表,表-4 91d设置至“LAV=9”的CLD表。
偏离LAV表中的LAV范围的索引由逸出熵表(例如,表n-2~n-1)来处理。
例如,在使用“LAV=7”的CLD表91c执行译码时,如果出现偏离最大值“7”的索引(例如,8、9、...、15),则相对应的索引单独地由逸出熵表(例如表n-2~n-1)处理。
同样,可按与CLD表相同的方式为另一个数据类型(例如,ICC、CPC等)设置LAV表。然而,每一个数据的LAV具有不同的值,因为每一个数据类型的范围不同。
例如,在配置ICC熵表时,例如,可提供“LAV=1”的表、“LAV=3”的表、“LAV=5”的表或“LAV=7”的表。在配置CPC熵表时,例如,可提供“LAV=3”表、“LAV=6”的表、“LAV=9”的表和“LAV=12”的表。
3-2.用于LAV索引的熵表
本发明采用LAV索引以利用LAV选择熵表。即,如图22的(b)所示,每个数据类型的LAV值通过LAV索引来区分。
具体地,为了选择最后使用的熵表,确认每一个相对应的数据类型的LAV索引然后确认对应于LAV索引的LAV。最终确认的LAV值对应于上述熵表名称的构成中的“LL”。
例如,如果数据类型是CLD参数,如果数据译码方案是DIFF-DF,如果熵译码由2D-FP执行,且如果“LAV=3”,则将表名称为“hcod2D_CLD_DF_FP_03的熵表用于熵译码。”
在确认每一数据类型的LAV索引时,本发明的特征在于对LAV索引单独地使用熵表。这意味着LAV索引自身作为熵译码的目标来处理。
例如,图22的(a)中的表-n用作LAV索引熵表91e。将其表示为表1。
[表1]
LavIdx | 比特长度 | 码字[十六进制/二进制] |
0 | 1 | 0x0(0b) |
1 | 2 | 0x2(10b) |
2 | 3 | 0x6(110b) |
3 | 3 | 0x7(111b) |
该表表示LAV索引值本身从统计学上看在使用频度方面有所不同。
例如,因为“LAV Index=0”具有最高的使用频度,所以给它分配1比特。并且,给具有第二高使用频度的“LAV Index=1”分配2比特。最后,给具有低使用频度的“LAV=2或3”分配3比特。
在不使用LAV索引熵表91e的情形中,应传输2比特标识信息,以在每次使用LAV熵表时区分四种LAV索引。
然而,如果使用本发明的LAV索引熵表91e,则例如为具有至少60%的使用频度的“LAV Index=0情况传输_1比特码字就足够了。所以,本发明能够使传输效率高于相关技术方法的传输效率。
在这种情况下,将表1中的LAV索引熵表91e应用于四种LAV索引的情况。并且,显然如果有更多的LAV索引则传输效率将更高。
3-3.使用熵表选择的信号处理方法
以下解释利用上述熵表选择的信号处理方法和装置。
根据本发明的一个实施例处理信号的方法包括以下步骤:获取索引信息,对索引信息进行熵解码,以及标识对应于经熵解码的索引信息的内容。
在这种情况下,索引信息是关于具有使用频度概率特性的索引的信息。
如上所述,使用索引专用熵表91e对索引信息进行熵解码。
内容是根据数据类型归类的,并且用于数据解码。并且,内容可成为编组信息(grouping information)。
编组信息是关于将多个数据编组的信息。
并且,熵表的索引是包括在熵表中的索引中的最大绝对值(LAV)。
此外,熵表在对参数执行2D熵解码时使用。
一种根据本发明的一个实施例的处理信号的装置包括获取索引信息的信息获取部件、对索引信息进行熵解码的解码部件、以及标识对应于经熵解码的索引信息的内容的标识部件。
一种根据本发明的另一个实施例处理信号的方法包括以下步骤:生成索引信息以标识内容,对索引信息进行熵编码,以及传输经熵编码的索引信息。
一种根据本发明的另一个实施例的处理信号的装置包括生成索引信息以标识内容的信息生成部件、对索引信息进行熵编码编码部件、以及传输经熵编码的索引信息的信息输出部件。
一种根据本发明的另一个实施例的处理信号的方法包括以下步骤:获取差分值及索引信息,对索引信息进行熵解码,标识对应于经熵解码的索引信息的熵表,以及利用所标识出的熵表对差分值进行熵解码。
随后,将对应于多个数据的基准值和经解码的差分值用于获取数据。在这种情况下,基准值可包括导引基准值和差分基准值。
使用索引专用熵表对索引信息进行熵解码。并且,根据多个数据中的每一个的类型将熵表归类。
数据即参数,且该方法还包括利用参数重建音频信号的步骤。
在对差分值进行熵解码的情况下,使用熵表对差分值进行2D熵解码。
此外,该方法还包括以下步骤:获取基准值,以及使用专用于该基准值的熵表对基准值进行熵解码。
一种根据本发明的另一个实施例的处理信号的装置包括获取差分值及索引信息的输入部件、对索引信息进行熵解码的索引解码部件、标识对应于经熵解码的索引信息的熵表的表标识部件、以及使用所标识出的熵表对差分值进行熵解码的数据解码部件。
该装置还包括使用对应于多个数据的基准值和经解码的差分值获取数据的数据获取部件。
一种根据本发明的又一个实施例的处理信号的方法包括以下步骤:使用对应于多个数据的基准值及这些数据生成一差分值,使用熵表对差分值进行熵编码,以及生成索引信息以标识该熵表。
并且,本方法还包括以下步骤:对索引信息进行熵编码,以及传输经熵编码的索引信息及差分值。
并且,根据本发明的又一个实施例的处理信号的装置包括:使用对应于多个数据的基准值及这些数据生成一差分值的值生成部件,使用熵表对差分值进行熵编码的值编码部件,生成索引信息以标识该熵表的信息生成部件,以及对索引信息进行熵编码的索引编码部件。并且,该装置还包括传输熵编码索引信息及差分值的信息输出部件。
[数据结构]
以下解释根据本发明的包括与上述数据译码、编组和熵译码相关联的各种信息的数据结构。
图23是根据本发明的数据结构的分层图。
参考图23,根据本发明的数据结构包括头部100和多个帧101和102。通用于下级帧101和102的配置信息包括在头部100中。并且,配置信息包括用于上述编组的编组信息。
例如,编组信息包括第一时间编组信息100a、第一频率编组信息100b和声道编组信息100c。
此外,头部100内的配置信息被称为“主配置信息”,而记录在帧中的信息部分被称为“净荷(payload)”。
具体地,例如在以下的描述中解释将本发明的数据结构应用于音频空间信息的情况。
首先,头部100内的第一时间编组信息100a成为指定一帧内的时隙数的“bsFrameLength”字段。
第一频率编组信息100b成为指定一帧内参数频带数的“bsFreqRes”字段。
声道编组信息100c表示“OttmodeLFE-bsOttBands”字段和“bsTttDualrnode-bsTttBandsLow”字段。“OttmodeLFE-bsOttBands”字段是指定应用于LFE声道的参数频带数的信息。并且,“bsTttDualmode-bsTttBandsLow”字段是指定具有低频带和高频带的双模中低频带的参数频带数的信息。然而,也可不将“bsTttDualmode-bsTttBandsLow”字段归类为声道编组信息而是归类为频率编组信息。
帧101和102中各自包括通用于帧内的所有组的帧信息(Frame Info)101a和多个组101b和101c。
帧信息101a包括时间选择信息103a、第二时间编组信息103b和第二频率编组信息103c。此外,帧信息101a被称为应用于每一个帧的“子配置信息”。
详细地,例如,在以下描述中解释将本发明的数据结构应用于音频空间信息的情况。
帧信息101a内的时间选择信息103a包括“bsNumParamset”字段、“bsParamslot”字段和“bsDataMode”字段。
“bsNumParamset”字段是指示存在于整个帧内的参数集的数目的信息。
并且,“bsParamslot”字段是指定存在参数集的时隙的位置的信息。
此外,“bsDataMode”字段是指定每一个参数集的编码和解码处理方法的信息。
例如,在具体参数集的“bsDataMode=0”(例如,缺省模式)的情况下,解码部件用缺省值替换相应的参数集。
在具体参数集的“bsDataMode=1”(例如,先前模式)的情况下,解码部件维持先前参数集的解码值。
在具体参数集的“bsDataMode=2”(例如,内插模式)的情况下,解码部件通过在参数集之间的内插来计算相对应的参数集。
最后,在具体参数集的“bsDataMode=3_(例如,读取模式)的情况下,表示传输了用于相对应的参数集的译码数据。所以,一帧内的多个组101b和101c是配置成在“bsDataMode=3”(例如,读取模式)的情况下传输数据的组。因此,编码部件参考每一个组内的译码类型信息对数据进行解码
以下详细解释根据本发明的一个实施例的使用“bsDataMode”字段的信号处理方法和装置。
一种根据本发明的一个实施例的使用“bsDataMode”字段的信号处理方法包括以下步骤:获取模式信息、根据由模式信息指示的数据属性获取对应于多个数据的导引基准值及和对应于该导引基准值的导引差分值,以及使用导引基准值及导引差分值获取数据。
在这种情况下,数据是参数,且该方法还包括使用参数重建音频信号的步骤。
如果模式信息指示读取模式,则获取导引差分值。
模式信息还包括缺省模式、先前模式和内插模式中的至少一个。
并且,导引差分值是按组频带获取的。
此外,该信号处理方法使用第一参数(例如,dataset)标识读取模式的数目、并使用第二参数(例如,setidx)基于第一变量获取导引差分值。
一种根据本发明的一个实施例的使用“bsDataMode”字段的信号处理装置包括获取模式信息的信息获取部件、根据由模式信息指示的数据属性获取对应于多个数据的导引基准值及对应于导引基准值的导引差分值的值获取部件、以及使用导引基准值及导引差分值获取数据的数据获取部件。
并且,将信息获取部件、值获取部件和数据获取部件设置在上述数据解码部件91或92中。
一种根据本发明的另一个实施例的使用“bsDataMode”字段的信号处理方法包括以下步骤:生成指示数据属性的模式信息、使用对应于多个数据的导引基准值及这些数据生成导引差分值、以及传输所生成的差分值。并且,该方法还包括对所生成的差分值进行编码的步骤。
一种根据本发明的另一个实施例的使用“bsDataMode”字段的信号处理装置包括生成指示数据属性的模式信息的信息生成部件、使用对应于多个数据的导引基准值及这些数据生成导引差分值的值生成部件、以及传输所生成的差分值的输出部件。并且,值生成部件设置在上述的数据编码部件31或32中。
帧信息101a中的第二时间编组信息103b包括“bsDatapair”字段。“bsDatapair”字段是指定由“bsDataMode=3”指定的数据集之间是否存在数据集对的信息。具体地,两个数据集由“bsDatapair”字段编组成一个组。
帧信息101a内的第二频率编组信息包括“bsFreqResStride”字段。“bsFreqResStride”字段是对已由作为第一频率编组信息100b的“bsFreqRes”字段首先编组了的参数做第二次编组的信息。即,数据频带通过捆绑合计等于由“bsFreqResStride”字段指定的跨距的参数来生成。所以,按数据频带给出参数值。
组101b和101c各自包括数据译码类型信息104a、熵译码类型信息104b、码字104和辅助数据104d。
详细地,例如,以下解释将本发明的数据结构用于音频空间信息的情况。
首先,组101b和101c中的每一个内的数据译码类型信息104a包括“bsPCMCoding”字段、“bsPilotCoding”字段、“bsDiffType”字段和“bdDifftimeDirection”字段。
“bsPCMCoding”字段是标识相对应的组的数据译码是PCM方案还是DIFF方案的信息。
只有当“bsPCMCoding”字段指定PCM方案时,才由“bsPilotCoding”字段指定PBC方案是否存在。
“bsDiffType”字段是在应用DIFF方案的情况下指定译码方向的信息。并且,“bsDiffType”字段指定“DF:DIFF-FREQ”或“DT:DIFF-TIME”。
并且,“bdDifftimeDirection”字段是在“bsDiffType”字段是“DT”的情况下指定时间轴上的译码方向是“FORWARD”还是“BACKWARD”的信息。
组101b和101c中的每一个内的熵译码类型信息104b包括“bsCodingScheme”字段和“bsPairing”字段。
“bsCodingScheme”字段是指定熵编码是1D还是2D的信息。
并且,“bsPairing”字段是在“bsCodingScheme”字段指定“2D”的情况下提取两个索引的方向是频率方向(FP:频率配对)还是时间方向(TP:时间配对)的信息。
组101b和101c中的每一个内的码字104c包括“bsCodeW”字段。并且,“bsCodeW”字段指定应用于熵译码的表上的码字。所以,上述数据的大部分成为熵译码的目标。在这种情况下,它们可通过“bsCodeW”字段来传输。例如,成为熵译码的目标的导引基准值及PBC译码的LAV索引值通过“bsCodeW”字段传输。
组101b和101c中的每一个内的辅助数据104d包括“bsLsb”字段和“bsSign”字段。具体地,辅助数据104d包括“bsLsb”字段和“bsSign”字段,以及被熵译码成不通过“bsCodeW”字段传输的其它数据。
“bsLsb”字段是应用于上述部分参数的字段,并且是只有在数据类型是“CPC”且属于非粗略量化的情况下才传输的辅助信息。
并且,“bsSign”字段是指定在应用1D熵译码的情况下所提取的索引的正负符号的信息。
此外,通过PCM方案传输的数据包括在辅助数据104d中。
以下解释根据本发明的信号处理数据结构的特征。
首先,根据本发明的信号处理数据结构包括:具有包括至少按帧计的导引译码信息在内的数据译码信息和熵译码信息中的至少一个的净荷部分,以及具有用于净荷部分的主配置信息的头部部分。
主配置信息包括具有用于所有帧的时间信息的第一时间信息部分和具有用于所有帧的频率信息的第一频率信息部分。
并且,主配置信息还包括具有用于按帧对包括多个数据的随机组进行内部编组的信息的第一内部编组信息部分。
帧包括具有数据译码信息和熵译码信息中的至少一个的第一数据部分和具有用于第一数据部分的子配置信息的帧信息部分。
子配置信息包括具有用于所有组的时间信息的第二时间信息部分。并且,子配置信息还包括外部编组信息部分,它具有按组对包括多个数据的随机组进行外部编组的信息。此外,子配置信息还包括第二内部编组信息部分,它具有对包括多个数据的随机组进行内部编组的信息。
最后,组包括具有关于数据译码方案的信息的数据译码信息、具有关于熵译码方案的信息的熵译码信息、,对应于多个数据的基准值、以及具有使用基准值及这些数据生成的差分值的第二数据部分。
[对音频译码(MPEG环绕)的应用]
以下解释统一本发明的概念和特征的例子。
图24是根据本发明的一个实施例的用于音频压缩和恢复的装置的框图。
参考图24,根据本发明的一个实施例的用于音频压缩和恢复的装置包括音频压缩部件105~400和音频恢复部件500~800。
音频压缩部件105~400包括缩减混音部件105、核心译码部件200、空间信息译码部件300和多路复用部件400。
并且,缩减混音部件105包括声道缩减混音部件110和空间信息生成部件120。
在缩减混音部件105中,声道缩减混音部件110的输入是有N声道的多声道X1、X2、...、XN)的音频信号和该音频信号。
声道缩减混音部件110的输出是缩减混音至声道数目小于输入声道的数目的信号。
缩减混音部件105的输出被缩减混音至一个或两个声道、根据单独的缩减混音命令的具体数目的声道、或根据系统实现预置的具体数目的声道。
核心译码部件200在声道缩减混音部件110的输出——即缩减混音音频信号上执行核心译码。在这种情况下,以使用各种变换方案如离散变换方案等压缩输入的方式实现核心译码。
空间信息生成部件120从多声道音频信号中提取空间信息。空间信息生成部件120然后将所提取的空间信息传输给空间信息译码部件300。
空间信息译码部件300对输入的空间信息执行数据译码和熵译码。空间信息译码部件300执行PCM、PBC和DIFF中的至少一种。在某些情况下,空间信息译码部件300还执行熵译码。空间信息解码部件700的解码方案可根据空间信息译码部件300使用了哪一种数据译码方案来确定。并且,稍后将参考图25详细解释空间信息译码部件300。
核心译码部件200的输出及空间信息译码部件300的输出被输入多路复用部件400。
多路复用部件400将这两个输入多路复用成比特流,然后将比特流传输到音频恢复部件500至800。
音频恢复部件500至800包括多路分解部件500、核心解码部件600、空间信息解码部件700和多声道生成部件800。
多路分解部件500将所接收的比特流多路分解成音频部分和空间信息部分。在这种情况下,音频部分是压缩的音频信号,而空间信息部分是压缩的空间信息。
核心解码部件600从多路分解部件500接收经压缩的音频信号。核心解码部件600通过对经压缩的音频信号进行解码来生成声道缩减混音音频信号。
空间信息解码部件700从多路分解部件500接收经压缩的空间信息。空间信息解码部件700通过对经压缩的空间信息进行解码来生成空间信息。
这样做后,从接收的比特流中提取指示包括在图23所示的数据结构中的各种编组信息和译码信息的标识信息。根据标识信息从至少一个或多个解码方案中选出具体的解码方案。并且,根据所选的解码方案通过解码空间信息来生成空间信息。在这种情况下,空间信息解码部件700的解码方案可根据空间信息译码部件300使用什么数据译码方案来确定。并且,稍后将参考图26详细解释空间信息解码部件700。
多声道生成部件800接收核心译码部件600的输出和空间信息解码部件700的输出。多声道生成部件800由接收的两个输出生成有N个声道的多声道Y1、Y2、...、YN的音频信号。
同时,音频压缩部件105~400向音频恢复部件500~800提供指示空间信息译码部件300使用了什么译码方案的标识符。为了对以上解释的情况作好准备,音频恢复部件500~800包括用于语法分析标识信息的装置。
所以,空间信息解码部件700参考由音频压缩部件105~400提供的标识信息确定解码方案。较佳地,用于语法分析指示译码方案的标识信息的装置被提供给空间信息译码部件700。
图25是根据本发明的一个实施例的空间信息编码部件的详细框图,其中将空间信息称为空间参数。
参考图25,根据本发明的一个实施例的译码部件包括PCM译码部件310、DIFF(差分译码)部件320和Huffman译码部件330。Huffman译码部件330对应于执行上述熵译码的一个实施例。
PCM译码部件310包括编组PCM译码部件311和PCB部件312。编组PCM译码部件311对空间参数进行PCM译码。在某些情况下,编组PCM译码部件311可按组部分(group part)对空间参数进行PCM译码。并且,PBC部件312对空间参数执行上述的PBC。
DIFF部件320对空间参数执行上述的DIFF。
具体地,在本发明中,编组PCM译码部件311、PBC部件312和DIFF部件320中的一个有选择地用于空间参数的译码。并且,在附图中没有单独示出其控制装置。
在以上的描述中已经详细解释了由PBC部件312执行的PBC,所以在以下的描述中将省略其解释。
作为PBC的另一个例子,PBC在空间参数上执行一次。并且,PBC还可在第一PBC的结果上执行N次(N>1)。具体地,在作为执行第一PBC的结果的导引值和差分值上实施至少一次PBC。在某些情况下,较佳的是从第二PBC起仅在差分值上而不在导引值上实施PBC。
DIFF部件320包括对空间参数执行DIFF_FREQ的DIFF_FREQ译码部件321和对空间参数执行DIFF_TIME的DIFF_TIME译码部件322和323。
在DIFF部件320中,从由DIFF_FREQ译码部件321和DIFF_TIME的DIFF_TIME译码部件322和323组成的组中选出的一个实施对输入空间参数的处理。
在这种情况下,可将DIFF_TIME译码部件分为对空间参数执行DIFF_TIME_FORWARD的DIFF_TIME_FORWARD部件322和对空间参数执行DIFF_TIME_BACKWARD的DIFF_TIME_BACKWARD部件323。
在DIFF_TIME译码部件322和323中,DIFF_TIME_FORWARD部件322和DIFF_TIME_BACKWARD部件323中选出的一个对输入的空间参数实施数据译码处理。此外,在以上的描述中已详细描述了由DIFF部件320的内部元件321、322和323中的每一个执行的DIFF译码,所以在以下的描述中将省略其解释。
Huffman译码部件330对PBC部件312的输出和DIF部件320的输出中的至少一个执行Huffman译码。
Huffman译码部件330包括逐一地处理待译码并传输的数据的1维Huffman译码部件(在下文中简称为HUFF_1D部件)331和按两个组合数据为单位处理待译码并传输的数据的2维HUFF译码部件(在下文中简称为HUFF_2D部件)332和333。
在Huffman译码部件330中的HUFF_1D部件331和HUFF_2D部件332和333中选出的一个对输入执行Huffman译码处理。
在这种情况下,HUFF_2D部件332和333被分成对基于频率捆绑在一起的数据对执行Huffman译码的频率对2-维Huffman译码部件(在下文中简称为HUFF_2D_FREQ_PAIR部件)332和对基于时间捆绑在一起的数据对执行Huffman译码的时间对2-维Huffman译码部件(在下文中简称为HUFF_2D_TIME_PAIR部件)333。
在HUFF_2D部件332和333中,从HUFF_2D_FREQ_PAIR部件332和HUFF_2D_TIME_PAIR部件333中选出的一个对输入执行Huffman译码处理。
在以下的描述中将详细解释由Huffman译码部件330的内部元件331、332和333中的每一个所执行的Huffman译码。
之后,Huffman译码部件330的输出与编组PCM译码部件311的输出多路复用以便传输。
在根据本发明的空间信息译码部件中,从数据译码和熵译码生成的各种的标识信息被插入传输比特流中。并将传输比特流传输到图26所示的空间信息解码部件。
图26是根据本发明的一个实施例的空间信息解码部件的详细框图。
参考图26,空间信息解码部件接收包括空间信息的传输比特流,然后通过对所接收的传输比特流进行解码来生成空间信息。
空间信息解码部件700包括标识符提取部件(标志语法分析部件)710、PCM解码部件720、Huffman解码部件730和差分解码部件740。
空间信息解码部件的标识符语法分析部件710从传输比特流提取各种标识符,然后语法分析所提取的标识符。这意味着提取了在图23的以上描述中所述的各种信息。
空间信息解码部件能够使用标识符语法分析部件710的输出而知晓对空间参数使用了哪种译码方案,然后确定对应于所识别出的译码方案的解码方案。此外,标识符语法分析部件710的执行也可由上述的多路分解部件500来完成。
PCM解码部件720包括编组PCM解码部件721和基于导引的解码部件722。
编组PCM解码部件721通过在传输比特流上执行PCM解码来生成空间参数。在某些情况下,编组PCM解码部件721通过解码传输比特流生成一个组部分的空间参数。
基于导引的解码部件722通过对Huffman解码部件730的输出执行基于导引的解码来生成空间参数值。这对应于导引值包括在Huffman解码部件730的输出中的情况。作为特例,基于导引的解码部件722可包括一个导引提取部件(图中未示出)以直接从传输比特流中提取导引值。所以,使用由导引提取部件提取的导引值及由Huffman解码部件730的输出构成的差分值生成空间参数值。
Huffman解码部件730对传输比特流执行Huffman解码。Huffman解码部件730包括通过在传输比特流上执行一维Huffman解码逐一地输出数据值的一维Huffman解码部件(在下文中简称为HUFF_1D解码部件)731和通过在传输比特流上执行二维Huffman解码每次输出一对数据值的二维Huffman解码部件(在下文中简称为HUFF_2D解码部件)732和733。
标识符语法分析部件710从传输比特流中提取指示Huffman解码方案是指示HUFF_1D还是指示HUFF_2D的标识符(例如,“bsCodingScheme”),然后通过语法分析所提取的标识符来标识所使用的Huffman译码方案。所以,对应于每一情况的HUFF_1D或HUFF_2D解码被确定为Huffman解码方案。
HUFF_1D解码部件731执行HUFF_1D解码,而HUFF_2D解码部件732和733各自执行HUFF_2D解码。
在传输比特流中的Huffman译码方案是HUFF_2D的情况下,标识符语法分析部件710还提取指示HUFF_2D方案是HUFF_2D_FREQ_PAIR还是HUFF_2D_TIME_PAIR的标识符(例如,“bsParsing”),然后对所提取的标识符做语法分析。所以,标识符语法分析部件710能够识别构成一个对的两个数据是基于频率还是时间捆绑在一起的。并且,将对应于相应情况的频率对二维Huffman解码(在下文中简称为HUFF_2D_FREQ_PAIR解码)和时间对二维Huffman解码(在下文中简称为HUFF_2D_TIME_PAIR解码)之一确定为Huffman解码方案。
在HUFF_2D解码部件732和733中,HUFF_2D_FREQ_PAIR部件732执行HUFF_2D_FREQ_PAIR解码,而HUFF_2D_TIME_PAIR部件733执行HUFF_2D_FREQ_TIME解码。
Huffman解码部件730的输出基于标识符语法分析部件710的输出而传输到基于导引的解码部件722或差分解码部件740。
差分解码部件740通过对Huffman解码部件730的输出执行差分解码来生成空间参数值。
标识符语法分析部件710从传输比特流中提取指示DIFF方案是DIF_FREQ还是DIF_TIME的标识符(例如,“bsDiffType”),然后通过对所提取的标识符进行语法分析来标识所使用的DIFF方案。所以,将对应于相应情况的DIFF_FREQ解码和DIFF_TIME解码中的一个确定为差分解码方案。
DIFF_FREQ解码部件741执行DIFF_FREQ解码,而DIFF_TIME解码部件742和743中的每一个执行DIF_TIME解码。
在DIFF方案是DIFF_TIME的情况下,标识符语法分析部件710还从传输比特流中提取指示DIFF_TIME是DIFF_TIME_FORWARD还是DIFF_TIME_BACKWARD的标识符(例如,“bsDiffTimeDirection”),然后对所提取的标识符进行语法分析。
所以,能够标识Huffman解码部件730的输出是当前数据与前一数据之间的差分值还是当前数据与下一数据之间的差分值。将对应于相应情况的DIFF_TIME_FORWARD解码和DIFF_TIME_BACKWARD解码中的一种确定为DIFF_TIME方案。
在DIFF_TIME解码部件742和743中,DIFF_TIME_FORWARD部件742执行DIFF_TIME_FORWARD解码,而DIFF_TIME_BACKWARD部件743执行DIFF_TIME_BACKWARD解码。
以下解释基于空间信息解码部件中的标识符语法分析部件710的输出确定Huffman解码方案和数据解码方案的过程。
例如,标识符语法分析部件710读取指示在译码空间数据之时使用的是PCM和DIFF中的哪一个的第一标识符(例如,“bsPCMCoding”)。
如果第一标识符对应于指示PCM的值,则标识符语法分析部件710还读取指示PCM和PBC中的哪一个被用于空间参数的译码的第二标识符(例如,“bsPilotCoding”)。
如果第二标识符对应于指示PBC的值,则空间信息解码部件执行对应于PBC的解码。
如果第二标识符对应于指示PCM的值,则空间信息解码部件执行对应于PCM的解码。
另一方面,如果第一标识符对应于指示DIFF的值,则空间信息解码部件执行对应于DIFF的解码处理。
用于发明的模式
因此,结合上述最佳模式的实施例解释了本发明的各种实施例。
工业实用性
因此,本发明的编组、数据译码和熵译码适用于各种领域和产品。
并且,本发明适用于存储了在其上应用了本发明的至少一个特征的数据的介质。
尽管已参考本发明的较佳实施例描述并说明了本发明,但本领域内技术人员可以理解,可对本发明作出各种修改和变化而不脱离本发明的精神或范围。因此,本发明旨在涵盖所附权利要求书及其等价技术方案的范围内的本发明的所有这些修改和变化。
Claims (9)
1.一种处理信号的方法,包括以下步骤:
从所述信号获取数据译码标识信息;以及
根据所述数据译码标识信息所指示的数据译码方案解码数据,
其中所述数据译码方案至少包括导引译码方案,其中所述导引译码方案利用对应于所述数据的导引基准值和导引差分值来解码所述数据,并且其中所述导引差分值是利用所述数据和所述导引基准值生成的。
2.如权利要求1所述的方法,其特征在于,所述数据译码方案还包括差分译码方案,其中所述差分译码方案包括频率差分译码方案和时间差分译码方案中的一个,且其中所述时间差分译码方案包括前向时间差分译码方案和后向时间差分译码方案中的一个。
3.如权利要求1所述的方法,其特征在于,还包括以下步骤:
获取熵译码标识信息;以及
利用由所述熵译码标识信息所指示的熵译码方案来熵解码所述数据。
4.如权利要求3所述的方法,其特征在于,在所述数据解码步骤中,所述经熵解码的数据是通过所述数据译码方案来解码的。
5.如权利要求3所述的方法,其特征在于,所述熵解码方案包括一维译码方案和多维译码方案中的一个,且其中所述多维译码方案包括频率对译码方案和时间对译码方案中的一个。
6.如权利要求1所述的方法,其特征在于,还包括利用所述数据作为参数解码音频信号的步骤。
7.一种用于处理信号的装置,包括:
配置成从所述信号中获取数据译码标识信息的标识信息获取部件;以及
配置成根据所述数据译码标识信息所指示的数据译码方案解码数据的解码部件,
其中所述数据译码方案至少包括导引译码方案,其中所述导引译码方案利用对应于所述数据的导引基准值和导引差分值解码所述数据,并且其中所述导引差分值是利用所述数据和所述导引基准值生成的。
8.一种处理信号的方法,包括以下步骤:
根据数据译码方案编码数据;以及
生成指示所述数据译码方案的数据译码标识信息,
其中所述数据译码方案至少包括导引译码方案,所述导引译码方案利用对应于所述数据的导引基准值和导引差分值编码所述数据,并且其中所述导引差分值是利用所述数据和所述导引基准值生成的。
9.一种用于处理信号的装置,包括:
配置成根据数据译码方案对从所述信号获取的数据进行编码的编码部件;以及
配置成生成指示所述数据译码方案的数据译码标识信息的输出部件,
其中所述数据译码方案至少包括导引译码方案,所述导引译码方案利用对应于所述数据的导引基准值和导引差分值编码所述数据,并且其中所述导引差分值是利用所述数据和所述导引基准值生成的。
Applications Claiming Priority (18)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US72363105P | 2005-10-05 | 2005-10-05 | |
US60/723,631 | 2005-10-05 | ||
US60/725,654 | 2005-10-13 | ||
US60/726,228 | 2005-10-14 | ||
US60/729,713 | 2005-10-25 | ||
US60/730,393 | 2005-10-27 | ||
US60/730,394 | 2005-10-27 | ||
US60/737,760 | 2005-11-18 | ||
US60/752,911 | 2005-12-23 | ||
US60/753,408 | 2005-12-27 | ||
US60/758,238 | 2006-01-12 | ||
US60/758,231 | 2006-01-12 | ||
KR10-2006-0004049 | 2006-01-13 | ||
KR10-2006-0004050 | 2006-01-13 | ||
KR10-2006-0030651 | 2006-04-04 | ||
KR10-2006-0079837 | 2006-08-23 | ||
KR10-2006-0079836 | 2006-08-23 | ||
KR10-2006-0079838 | 2006-08-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101283401A true CN101283401A (zh) | 2008-10-08 |
Family
ID=40014917
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800372614A Pending CN101283401A (zh) | 2005-10-05 | 2006-10-04 | 信号处理的方法和装置以及编码和解码方法及其装置 |
CNA2006800449071A Pending CN101317214A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
CNA200680044918XA Pending CN101317215A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
CNA2006800449264A Pending CN101317216A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800449071A Pending CN101317214A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
CNA200680044918XA Pending CN101317215A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
CNA2006800449264A Pending CN101317216A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (4) | CN101283401A (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3614671B1 (en) * | 2013-07-15 | 2023-06-07 | GE Video Compression, LLC | Low delay concept in multi-layered video coding |
CN114040028B (zh) * | 2021-10-29 | 2023-11-24 | 深圳智慧林网络科技有限公司 | 一种基于三种模式的数据压缩方法和数据解压方法 |
CN114040172B (zh) * | 2021-11-22 | 2024-04-12 | 富盛科技股份有限公司 | 一种基于视频监控系统的车辆卡口数据融合传输方法及系统 |
-
2006
- 2006-10-04 CN CNA2006800372614A patent/CN101283401A/zh active Pending
- 2006-10-04 CN CNA2006800449071A patent/CN101317214A/zh active Pending
- 2006-10-04 CN CNA200680044918XA patent/CN101317215A/zh active Pending
- 2006-10-04 CN CNA2006800449264A patent/CN101317216A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN101317214A (zh) | 2008-12-03 |
CN101317215A (zh) | 2008-12-03 |
CN101317216A (zh) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101283251B (zh) | 信号处理的方法和装置以及编码和解码方法及其装置 | |
CN101283256B (zh) | 信号处理的方法和装置以及编码和解码方法及其装置 | |
CN101283254B (zh) | 信号处理的方法和装置以及编码和解码方法及其装置 | |
CN101283401A (zh) | 信号处理的方法和装置以及编码和解码方法及其装置 | |
CN101283404B (zh) | 信号处理的方法和装置以及编码和解码方法及其装置 | |
CN101283406B (zh) | 信号处理的方法和装置以及编码和解码方法及其装置 | |
KR20080031559A (ko) | 신호 처리 방법 및 장치와, 인코딩 및 디코딩 방법과 그를위한 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20081008 |