CN104380377B - 用于可缩放低复杂度编码/解码的方法和装置 - Google Patents
用于可缩放低复杂度编码/解码的方法和装置 Download PDFInfo
- Publication number
- CN104380377B CN104380377B CN201280073888.0A CN201280073888A CN104380377B CN 104380377 B CN104380377 B CN 104380377B CN 201280073888 A CN201280073888 A CN 201280073888A CN 104380377 B CN104380377 B CN 104380377B
- Authority
- CN
- China
- Prior art keywords
- excitation signal
- unit
- audio signal
- signal
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000013139 quantization Methods 0.000 claims abstract description 78
- 238000004891 communication Methods 0.000 claims abstract description 17
- 230000008707 rearrangement Effects 0.000 claims abstract description 9
- 230000005284 excitation Effects 0.000 claims description 199
- 230000005236 sound signal Effects 0.000 claims description 129
- 230000003595 spectral effect Effects 0.000 claims description 49
- 238000007493 shaping process Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000005086 pumping Methods 0.000 abstract 7
- 238000010586 diagram Methods 0.000 description 18
- 238000005070 sampling Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008450 motivation Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在通信系统中用于量化接收到的激励信号的量化方法中,执行以下步骤:重排S301接收到的激励信号的元素,以提供重排的激励信号;利用可变比特率算法对重排的激励信号进行编码S302,以提供编码的激励信号;以及如果所使用的比特的数目超过预定的固定比特率要求,则重新分配S303编码的激励信号的码字,以提供量化的激励信号。
Description
技术领域
所提议的技术总体涉及编码/解码,以及具体地涉及固定比特率编解码器中对信号的改进编码和解码。
背景技术
通常,语音/音频编解码器利用不同的压缩方案对音频信号的低频和高频分量进行处理。大部分可用比特预算被LB(低频带)编码器所消耗(由于人的听觉系统在这些频率处的较高灵敏度)。除此之外,大部分可用计算复杂度也被LB编解码器所消耗,例如,合成-分解ACELP(代数码激励线性预测)。这导致对HB(高频带)编解码器可用的复杂度的严格要求。
由于上述约束,通常通过参数BWE(带宽扩展)算法来重构信号的HB部分。该解决方案处理比特预算受到约束和复杂度受限的问题,但其完全缺乏可缩放性,这意味着质量快速饱和,且不能跟上比特率提高。
可变比特率方案(例如熵编码方案)呈现出用于以较低平均比特率对源进行编码的高效方式。然而,很多应用依赖于编码信号的固定比特率,例如,移动通信信道。在熵编码完成之前,对于一段给定输入信号,所消耗的比特的数目是未知的。一个通常的解决方案是运行熵编码器的若干次迭代,直到已经到达固定比特预算内的良好压缩率。
因此,存在对这样的方法和装置的需求:其使得可对音频信号的高频带部分进行低复杂度和可缩放编码,且使得可以在固定比特率的框架内利用可变比特率量化方案。
运行熵编码器的多次迭代的解决方案是计算上复杂的解决方案,其在具有有限处理功率的设备上的实时通信的情况下可能是不适合的。
发明内容
所提议的技术的总体目的是音频信号的改进编码和解码。
实施例的第一方案涉及用于在通信系统中量化接收到的激励信号的方法。该方法包括以下步骤:重排激励信号的元素,以提供重排的激励信号;对重排的激励信号进行编码;以及如果所使用的比特的数目超过预定的固定比特率要求,则重新分配编码的激励信号的码字,以提供量化的激励信号。
实施例的第二方案涉及用于在通信系统中重构激励信号的方法。该方法包括以下步骤:对接收到的量化的激励信号进行熵解码;以及对熵解码的激励信号进行SQ解码,以提供重构的激励信号。
实施例的第三方案涉及通信系统中的编码方法。该方法包括以下步骤:提取音频信号的频谱包络的表示,以及至少基于所述表示和所述音频信号来提供和量化激励信号,所述量化是根据之前所述的量化器方法执行的。此外,该方法包括以下步骤:至少基于激励信号、所提供的表示以及音频信号来提供和量化音频信号的增益;以及最后向解码器单元发送至少针对量化的增益和量化的激励信号的量化索引。
实施例的第四方案涉及通信系统中的解码方法。该方法包括以下步骤:基于接收到的针对激励信号的量化索引来生成音频信号的重构的激励信号。针对激励信号的量化索引是根据上述量化器方法提供的。此外,该方法包括以下步骤:至少基于所生成的重构信号和接收到的音频信号的频谱包络的量化表示,生成音频信号的频谱包络的重构表示并对其进行频谱成形,以提供合成的音频信号。最后,该方法包括以下步骤:基于接收到的针对增益的量化索引,对合成的音频信号进行放大,以提供解码的音频信号。
实施例的第五方案涉及用于在通信系统中量化接收到的激励信号的量化器单元。量化器单元包括:重排单元,被配置为重排激励信号的元素,以提供重排的激励信号;编码单元,被配置为对重排的激励信号进行编码,以提供编码的激励信号;以及重新分配单元,被配置为重新分配编码的激励信号的码字。
实施例的第六方案涉及用于在通信系统中重构激励信号的解量化器单元。解量化器单元包括:熵解码单元,被配置为对接收到的量化的激励信号进行熵解码;以及SQ解码单元,被配置为对熵解码的激励信号进行SQ解码。此外,解量化器单元包括:反重排单元,被配置为对重构的激励信号的元素进行反重排。
实施例的第七方案涉及编码器单元。编码器单元包括上述的量化器单元,以及还包括:提取单元,被配置为提取音频信号的频谱包络的表示;量化器单元被配置为至少基于所述表示和所述音频信号来提供和量化激励信号。此外,编码器包括:增益单元,被配置为至少基于激励信号、所提供的表示以及音频信号来提供和量化增益;以及发送单元,被配置为向解码器单元发送至少针对量化的增益和量化的激励信号的量化索引。
实施例的第八方案涉及解码器单元。解码器单元包括:解量化器单元,用于基于接收到的针对音频信号的激励信号的量化索引来生成重构的激励信号;以及合成器单元,被配置为至少基于所生成的重构的激励信号和接收到的频谱包络的量化表示来生成音频信号的频谱包络的重构表示并对其进行频谱成形,以提供合成的音频信号。最后,解码器单元包括缩放单元,被配置为基于接收到针对增益的量化索引来放大合成的音频信号,以提供解码的音频信号。
所提议的技术还涉及包括至少一个这种量化器单元、解量化器单元、编码器单元或解码器单元的用户设备和/或基站终端。
所提议技术的优点是对高频带音频信号进行可缩放的低复杂度编码。
附图说明
通过结合附图来参考以下的描述,可以最好地理解所提议的技术的实施例及其进一步的目的和优势,在附图中:
图1是时域中的音频编码的实施例的流程图;
图2是频域中的音频编码的另一实施例的流程图;
图3是量化器中方法的实施例的流程图;
图4是量化器中方法的另一实施例的流程图;
图5是解量化器中方法的实施例的流程图;
图6是编码器中方法的实施例的流程图;
图7是解码器中方法的实施例的流程图;
图8是编码器中基于时域的方法的实施例的流程图;
图9是解码器中基于时域的方法的实施例的流程图;
图10是编码器中基于频域的方法的实施例的流程图;
图11是解码器中基于频域的方法的实施例的流程图;
图12是示出量化器单元、解量化器单元、编码器和解码器的示例实施例的框图;
图13是示出量化器单元的示例实施例的框图;
图14是示出与图13的量化器一起使用的解量化器单元的示例实施例的框图;
图15是示出量化器单元和解量化器单元的示例实施例的框图;
图16是示出编码器单元的示例实施例的框图;
图17是示出与图16的编码器一起使用的解码器单元的示例实施例的框图;
图18是示出用于在时域使用的编码器单元的示例实施例的框图;
图19是示出与图18的编码器一起使用的解码器单元的示例实施例的框图;
图20是示出频域中的编码器单元的示例实施例的框图;
图21是示出与图19的编码器一起使用的解码器单元的示例实施例的框图。
缩写
ACELP:代数码激励线性预测
AR:自回归
BWE:带宽扩展
DFT:离散傅里叶变换
HB:高频带
LB:低频带
MDCT:修正离散余弦变换
PCM:脉冲编码调制
SQ:标量量化器
VQ:矢量量化器
具体实施方式
所提议的技术属于音频编码领域,然而也可以应用于其他类型的信号。其描述了要在固定速率音频编解码器中使用的可变比特率编码方案的低复杂度适配的技术。其还描述了用于在固定比特率编解码器内利用可变比特率编码方案来编码和解码音频信号的HB(高频带)部分的方法和装置的实施例。虽然实施例主要涉及高频带音频信号的编码和解码,其同样可用于任何信号(例如音频或图像)以及应用固定比特率的任何频率范围。
在整个说明书中,可交换使用术语激励、激励信号、残差矢量和残差。
实施例提供了用于固定比特率编解码器中的可变比特率编码的轻量且可缩放的结构,并且特别适用于(但不限于)HB音频编码和频域编码方案。实施例的一个关键方面包括联合设计的有损和无损压缩模块,该有损和无损压缩模块与码字重新分配逻辑一起以固定比特率工作。通过该方式,系统以相对低的比特率具有SQ(标量量化)的复杂度和可缩放性优点(SQ技术通常不可应用于相对低的比特率)。
在固定比特率方案中利用可变比特率方案的已知方法包括多次执行量化步骤,直到实现预定固定比特率。
本发明的一个主要的构思是将熵编码方案与对固定比特率操作的低复杂度适配相结合。在此,首先在时域音频编解码器的环境下,稍后在频域音频编解码器的环境下对其进行呈现。
图1中呈现了时域中音频编解码器的实施例的高级框图,编码器和解码器都被示出。以32kHz对输入信号s采样,且输入信号s具有16kHz的音频带宽。分解滤波器组输出以16kHz采样的两个信号,其中,sLB表示原始音频带宽的0-8kHz,以及sHB表示原始音频带宽的8-16kHz。该实施例描述了用于处理接收信号(图1中由虚线框指示)的高频带部分sHB的算法,同时假设要对LB进行ACELP编码(或其他某个传统的编解码器)。在该方案中,LB编码器和解码器可与HB编码器和解码器独立工作或协同工作。LB编码可使用任何适合的方案来进行,并产生可被LB解码器用来形成对应的LB合成的索引ILB的集合。此外,实施例不限于具体的频率间隔,而是可被用于任何频率间隔。然而,出于示意目的,实施例主要描述与高频带信号有关的方法和装置。
实时音频编码通常按帧(块)进行,帧(块)在编码器中被压缩,并通过网络作为比特流向解码器发送。解码器根据接收到的比特流重构这些块,并生成输出音频流。实施例中的算法按相同方式工作。通常按20ms的块来处理HB音频信号。在16kHz的采样频率处,这对应于在给定时刻时处理的320个采样。然而,可以将相同的方法应用于任何大小的块,并用于任何采样频率。
虽然本公开大部分显式地处理时域中的量化,其同样可应用于频域中,特别是应用于MDCT环境下。图2中示出了频域内的编码/解码的对应高层框图。令大写字母表示信号的频域表示,例如,S(k)表示通过波形s(n)的频域变换获得的变换系数的集合。图1和图2的主要区别在于,替代针对全局增益的量化索引IG和针对AR系数的量化索引Ia,频域编码器发送针对频带增益的集合的索引IBG。这些频带增益BG表示频率或频谱包络,该频率或频谱包络在时域中是通过AR系数和一个全局增益来建模的。频带增益是通过组合8、16、32等个变换系数并计算针对这些组(带)的均方根能量来计算的。
频域方案的一些优点是:A)可以避免下采样和上采样(可以直接选择编码矢量的低/高频分量),以及(B)更容易选择具有较低感知重要性的区域,例如在存在较强音调的情况下屏蔽弱音调的效果要求频域处理。
为了针对激励信号提供必需的量化索引(针对时域方案或频域方案),发明人已经开发出新的量化方法和装置,其使得可在固定比特率方案中利用可变比特率算法。可以利用相同的量化方法,而与量化发生在基于频域的编码器/解码器中还是发生在基于时域的编码器/解码器中无关。
根据当前公开的一个方案,将参考图3和图4描述针对后续要编码的信号(音频或其他信号)来量化激励信号的新的量化器装置和方法。
参考图3,将描述在编码器中使用的量化器单元300及其方法的实施例。量化器单元300执行激励信号的量化,并重新分配量化编码的激励信号的码字,以降低激励所消耗的比特率。
量化器方法在下面的描述中将被表示为Qe,且在图4中更详细地给出。一开始,在步骤S301中,例如为了防止产生在时间上集中的误差,对例如音频信号的激励矢量的元素进行重排(re-shuffle)。之后,利用可变比特率算法编码S302重排的激励矢量(例如,重排的激励信号),以提供编码的激励信号。根据具体的实施例,在步骤S302’中利用统一的SQ,例如使用5级水平-中点(相同数目的正级和负级)SQ,对激励矢量进行PCM编码,并在之后在步骤S302”中对其进行熵编码。
可以以任何顺序执行重排步骤S301和编码步骤S302,而不影响最终结果。因此,可以将编码步骤S302应用于接收到的激励信号,之后可以对编码的激励的元素进行重排S301。
最后,如果针对编码的信号使用的比特的数目超过预定的固定比特率要求,则在步骤S303中重新分配编码的激励信号的码字,下面对其原因进行进一步解释。
根据另一实施例,量化器单元和方法可选地包括用于执行步骤S304的单元,步骤S304对码字重新分配的元素进行反重排,以重建激励信号的元素的原始顺序。
因为SQ方案在低比特率处一般并不高效,为了更高效地使用可用比特,使用熵编码(例如Huffman编码或类似方案)。Huffman码的概念是:将较短的码字分配给更频繁出现的符号;参见下面的表1,其呈现了针对5级量化器的Huffman码。每个重构等级附有码字(对于较可能的幅度(也对应于较低的幅度)的码字较短)。
表1
由于Huffman编码是可变比特率算法,使用根据本实施例的特殊码字重新分配算法来使HB编码适合于固定比特率要求。当在熵编码或Huffman编码之后实际使用比特的数目B超过所允许的限制BTOT时,激活图4中的“码字重新分配”模块。为了简洁,假设激励矢量的元素映射到表1中表示的5级中的一个。基于所分配的幅度等级,将各元素聚集为3组:组0(所有元素都被映射到零等级幅度)、组1(全部+/-1幅度等级)和组2(全部+/-2)。本实施例的算法的一般性概念是将元素从组1迭代地移动到组0,以将元素从较长码字重新分配到较短码字。随着每一元素移动,所消耗的比特的总数降低,因为组0中的元素具有最短的码字,参见表1。只要所消耗的比特的总量大于比特预算,该过程便继续。当所消耗的比特的量小于等于所设置的比特预算时,该过程终止。如果组1不再包含元素且比特率目标仍未满足,将来自组2的元素逐一传到组0。该过程保证只要比特率目标大于1比特/元素,该比特率目标将会被满足。组的总数取决于SQ中等级的数目,以使得每个幅度等级或一组类似的幅度等级对应于一个组。
虽然以上描述主要处理Huffman编码,同样可以利用具有取决于幅度概率的可变码字长度的任何其他编解码器(优选地,向较高概率的幅度分配较短码字的编解码器)。还可以包括提供多个Huffman表(或其他码)并执行最优或优选表的选择的步骤。另一可能性是使用多个所提供的码中的一个或多个码(Huffman或其他码)。针对码的主要标准是在幅度概率和码字长度之间存在关联。
该过程背后的动机是首先将最低幅度设置为零,这导致重构信号中较低的误差。因为激励矢量的元素被重排或随机选择,从组1提取元素的序列并将其幅度设为零不产生在时间上集中的误差(误差被扩散到整个矢量上)。替代执行激励矢量的实际重排并然后按序列从组1提取元素,可以直接随机化提取步骤。
激励量化消耗多数的可用比特。通过增加SQ的重构等级的数目,容易以增加比特率进行缩放。
在对应的方式中,量化的激励信号需要在接收单元(例如,解码器中的解码器或解量化器单元)中重构,以使得能够重构原始音频信号。
因此,参考图5,将描述用于重构激励信号的解量化或重构方法的实施例。一开始,在步骤S401中对接收到的量化的激励信号进行熵解码。之后,在步骤S402中对熵解码的激励信号进行SQ解码,以提供重构的激励信号。此外,如果重构的激励信号的元素之前在量化器单元或编码器中已被重排,则在步骤S403中,对重构的激励信号的元素进行反重排。
参考图6,将描述通信网络中的编码器单元中的方法的实施例。
一开始,在步骤S1中提取音频信号的频谱包络的表示。对于时域应用,频谱包络的表示可以包括自回归系数;对于频域应用,频谱包络的表示可以包括音频信号的频带增益集合。之后,在步骤S2中,提供并量化音频信号的激励信号。根据之前描述的量化方法的实施例来执行量化。此外,在步骤S3中,至少基于所提取的激励信号、所提供的频谱包络的表示以及音频信号自身来针对音频信号提供并量化增益。最后,在步骤S4中,向解码器单元发送或在解码器单元处提供至少针对量化的增益和量化的激励信号的量化索引。
参考图7,对应的解码方法包括重构S10接收到的音频信号的激励信号的步骤,该激励信号是根据之前描述的量化器方法来量化的。之后,在步骤S20中,重构音频信号的频谱包络,并应用频谱成形。最后,在步骤S30中,重构音频信号的增益,并应用增益放大,以最终合成音频信号。
参考图8,将描述时域中的编码方法的实施例。一开始,在步骤S1中,如虚线框所指示的,接收信号(例如,音频信号的高频带部分),且提取和量化自回归(AR)系数的集合(包括频谱包络的表示),以及在之后在网络中向解码器发送其相应量化索引Ia。然后,至少基于量化的AR系数和接收信号,在步骤S2中,如虚线框所指示的,提供并量化激励信号。还向解码器发送针对激励的量化索引Ie。最后,至少基于激励信号、量化的AR系数和接收到的音频信号,在步骤S3中,如虚线框所指示的,提供并量化增益G。还向解码器发送针对增益的量化索引IG。
下面是对上述各个步骤和装置的更详细的描述。
图8中示出了HB编码器操作的实施例。一开始,对HB信号执行AR分解,以提取AR系数a的集合。系数a被量化(20比特范围内的SQ或VQ(矢量量化))为量化的AR系数并被作为对应的量化器索引Ia发送给解码器。之后的编码器操作都是利用这些量化的AR系数来执行的,从而匹配将在解码器中使用的滤波器。如下面的等式1所示,通过基于量化的AR系数将波形(例如,高频带信号)sHB(n)通过白化滤波器,生成激励信号或残差e(n)。
e(n)=A(z)sHB(n), (1)
其中,是阶数M=10的AR模型。
将激励信号或残差下采样到8kHz,其对应于长度为N=160个采样的矢量。该下采样的激励信号包含音频输入s的原始带宽的8-12kHz频率分量。该操作背后的动机是聚焦于可用比特,并精确地编码感知上更重要的信号分量(8-12kHz)。12kHz以上的频谱区域通常相对不可听,并可被容易地构建而无需花费附加比特。然而,其同样可应用于执行对音频输入信号s的部分或全部高频带频谱的任何其他程度的下采样。
应该注意到的是,该下采样是可选的,并且如果可用比特预算允许编码整个频率范围,该下采样可以不是必需的。另一方面,如果比特预算甚至更加严格,可能需要下采样到甚至更窄频带,例如,表示8-10kHz频带、或某个其他频带。
在量化之前,根据下面的等式2将被可选地下采样的激励信号或残差矢量e’归一化为单位能量。该缩放便于对量化操作进行成形(即,量化器不必捕捉信号中的全局能量变化)。
实际残差量化在图8中的Qe框中执行,且之前参考图3对其进行了描述。稍后还将描述对应的量化器单元300。
为了计算和发送HB信号的适当能量电平,编码器执行合成波形的步骤(以和解码器中相同的方式)。首先,通过具有频谱折叠的上采样,根据编码的残差(8-12kHz残差)来重构e″′带宽8-16kHz的残差。然后,使重构的激励通过全极点自回归滤波器来合成波形,以形成合成的高频带信号s′HB。将合成波形s′HR的能量调整为目标波形sHB的能量。可在对数域中利用6比特SQ来高效地量化等式3中定义的对应增益G。
总而言之,时域中的编码器的实施例逐帧地针对接收信号量化AR系数集合、一个全局增益以及激励信号并发送针对AR系数集合的量化索引Ia、针对一个全局增益的量化索引IG以及针对激励信号的量化索引Ie。
参考图9,下面将描述解码器单元200以及解码器单元200中的方法的实施例。参考图7描述的方法的时域中的具体实施例还包括以下步骤:基于接收到的针对音频信号的激励信号的量化索引Ie来生成S10重构信号以及基于所生成的重构信号并基于接收到的量化的自回归系数Ia来生成音频信号的频谱包络的重构表示并对其进行频谱成形S20,来作为频谱包络的表示,以提供合成的音频信号s′HB。最后,该方法包括以下步骤:基于接收到的针对增益的量化索引IX对合成的音频信号s′HB进行缩放S30,以提供解码的音频信号
根据本公开的解码器200通过从比特流提取针对全局增益的量化索引IG、针对AR系数的量化索引Ia和针对激励矢量的量化索引Ie来重构HB信号,该比特流是从编码器单元100接收的。
图5中示出了解码器200中的激励重构算法或解量化器单元400的实施例。可选的重排操作是在解码器中使用的重排操作的反操作,以使得可恢复时域信息。根据具体实施例,如图3和图4中的虚线框所指示的,反重排操作可以发生在编码器中,并由此降低解码器单元200的计算复杂度。
图9中示出了HB解码器的实施例的处理步骤的概述。一开始,在步骤S10中,如虚线框所指示的,在解码器处接收针对激励信号的量化索引Ie,并生成重构的激励信号之后,对重构的激励信号进行上采样,以提供上采样的重构激励信号e″′。此外,在步骤S20中,如虚线框所指示的,接收针对量化的AR系数的量化索引Ia并用于对上采样的重构激励信号进行滤波和合成。根据下面的等式4,发送上采样的激励信号e″′通过合成滤波器,生成合成波形
s′HB(n)=A(z)-1e″′(n), (4)
最后,在步骤S30中,如虚线框所指示的,利用接收到的增益G(由接收到的针对增益G的量化索引IG来表示)来放大波形,以匹配目标HB波形的能量,从而提供音频信号的输出高频带部分,如下面的等式5所示。
如前所述,也可以对被变换为某个频域表示(例如,DFT、MDCT等)的信号实现所描述的用于时域中HB编码的方案的实施例。在该情况下,可以将AR包络替换为类似频谱包络的频带增益,以及可以在利用这些频带增益的归一化之后获得激励或残差信号。在这种实施例中,可以进行重排操作,以使得在感知上较不重要的元素将被首先移除。一个可能的这种重排是在频率中简单地反转残差,因为低频通常在感知上更加相关。
参考图10,下面将描述频域中的编码方法的实施例。在该情况下,提取步骤S1包括提取音频信号的频带增益集合,其中,频带增益包括音频信号的频谱包络的表示。此外,激励提供和量化步骤S2包括至少基于所提取的频带增益和音频信号来提供和量化激励信号。激励信号的量化是根据之前所述的量化方法来执行的,且在图10中表示为Qe。之后,增益提供和量化步骤S3包括至少基于激励信号、所提取的频带增益和音频信号来量化频带增益的集合,以及发送步骤S4包括向解码器单元发送针对频带增益系数和激励信号的量化索引。
通过与参考图7描述的解码方法相对应的方式,在频域中解码音频信号的方法中,接收到的针对激励信号的量化索引Ie在步骤S10中被接收,并在图11中的框中根据之前所述的解量化方法被解量化。对于这样重构的激励信号低频分量被拷贝到高频位置,以重构频谱包络并应用频谱成形来提供合成的音频信号。最后,在步骤S30中,重构频带增益,并将其应用于合成的音频信号,以提供解码的音频信号。
在图10中示出了频域编码器中的处理步骤,该处理步骤是图8的时域处理的备选。在频域方案中,通过利用频带增益BG对变换系数S进行缩放来计算激励信号E(该步骤对应于时域方案中将波形通过白化滤波器)。不需要下采样和上采样操作,因为可以直接选择激励矢量的低频分量。
作为图9的备选,在图11中示出了频域解码器中的处理步骤。类似于时域方案,在解码器处仅接收激励矢量的低频部分的量化索引。在该情况下,通过拷贝低频系数来生成高频系数。
要注意到,图3和图4在时域和频域实现上保持相同,因为量化/解量化方案的新逻辑对于两个实现而言是相同的。
下面将参考图12-图21描述根据本公开的装置以及与时域和频域中的MDCT和量化有关的实施例的计算机实现的一些示例。
图12示出了根据本公开的编码器单元100,编码器单元100被配置为在将信号(例如,音频信号)发送到解码器单元200之前对其进行编码,解码器单元200被配置为解码接收到的信号,以提供解码的信号(例如,解码的音频信号)。每个单元都被配置为执行如前所述的相应编码或解码方法。编码器装置或单元101包括提取单元101、量化器单元102、303、301、302、303、增益单元103以及发送单元104。解码器单元200包括解量化器单元201、400、401、402、403、合成器单元202和缩放单元203,其功能将在下面描述。相应的装置100、200可位于用户终端或基站装置中。相应的解码器100和编码器200装置可各自被配置为在时域或频域中工作。对于时域和频域,量化器单元或装置102、300、301、302、303以及解量化器单元或装置201、400、401、402、403以相同方式工作。因此,可以在要求激励信号的量化或解量化的任何类型的单元中实现量化器和解量化器的实施例,而与其发生在哪个具体单元或环境或情形中无关。然而,编码器100的其余功能单元101、103、104以及解码器单元200的其余功能单元202、203在其功能上有所不同,但仍分别在之前所述的总的编码和解码方法之内。
参考图13,将描述通信系统中用于量化接收到的激励信号的量化器单元102、300的实施例。量化器单元102、300包括:重排单元301,被配置为重排接收到的激励信号的元素,以提供重排的激励信号;以及编码单元302,被配置为利用可变比特率算法来编码重排的激励信号,以提供编码的激励信号。最后,量化器102、300包括:重新分配单元303,被配置为,如果所使用的比特的数目超过预定的固定比特率要求,则重新分配编码的激励信号的码字。根据另一实施例,编码单元302被配置为并包括:单元302’,被配置为对重排的激励信号进行SQ编码;以及单元302”,被配置为对SQ编码的重排的激励信号进行熵编码。在另一可选实施例中,量化器102、300包括:反重排单元304,被配置为在码字重新分配之后对编码的激励信号的元素进行反重排。
参考图14,将描述通信系统中用于重构激励信号的解量化器单元201、400。解量化器201、400被配置为对已经根据之前所述的量化器单元102、300量化的激励信号进行重构。因此,解量化器装置或单元201、401包括解码单元,该解码单元被配置为并进一步包括:解码器单元401,被配置为对接收到的量化的激励信号进行熵解码;以及SQ解码单元402,被配置为对熵解码的激励信号进行SQ解码,以提供重构的激励信号。此外,解码器单元包括反重排单元403,被配置为:如果之前在编码器100中的量化器单元102、300中已经对重构的激励信号的元素进行了重排,则对重构的激励信号的元素进行反重排。
图15中示出了根据本技术的量化器单元300和解量化器单元400的其他实施例。
如前所述,上述量化器单元102、300有利地在编码器单元中实现,将参考图16、17和19对其实施例进行进一步描述。
编码器单元100的总体实施例包括之前所述的量化器102、300,还包括:提取单元101,被配置为提取音频信号的频谱包络的表示;以及量化器单元300,被配置为至少基于音频信号的频谱包络的表示来提供和量化激励信号。此外,编码器100包括:增益单元103,被配置为至少基于激励信号、所提供的表示以及音频信号来提供和量化S3增益;以及发送单元104,被配置为向解码器单元发送S4至少针对量化的增益和量化的激励信号的量化索引。
根据图18,编码器被配置为在时域工作,提取单元101被配置为提取和量化AR系数,作为音频信号的频谱包络的表示,量化器单元102、300被配置为至少基于量化的自回归系数和接收到的音频信号来提供和量化激励信号。此外,增益单元103被配置为至少基于激励信号、量化的自回归系数和接收到的音频信号来提供和量化增益,以及发送单元104被配置为向解码器单元200发送针对自回归系数、激励信号和增益的量化索引。
根据图18,编码器单元100的实施例被配置为在频域工作,以及提取单元101被配置为提取频带增益的集合,作为音频信号的频谱包络的表示。此外,量化器单元102、300被配置为至少基于所提取的频带增益和接收到的音频信号来提供和量化激励信号。此外,增益单元103被配置为至少基于激励信号、所提取的频带增益以及接收到的音频信号来量化所提取的频带增益集合。最后,发送单元104被配置为向解码器单元200发送针对频带增益系数和激励信号的量化索引。
如前所述,上述解量化器单元201、400有利地在解码器单元200中实现,将参考图17、18和20对其实施例进行进一步描述。
解码器单元200的总体实施例包括之前所述的解量化器单元201、400。此外,解量化器单元400、201被配置为基于接收到的针对激励信号的量化索引来生成重构的激励信号。解码器200还包括:合成器单元202,被配置为基于所生成的重构信号和接收到的音频信号的频谱包络的量化表示来生成音频信号的频谱包络的重构表示并对其进行频谱成形,以提供合成的音频信号。此外,解码器400包括缩放单元203,被配置为基于接收到针对增益的量化索引来放大合成的音频信号,以提供解码的音频信号。
参考图19,将描述被配置为在时域工作的解码器200的实施例。合成器单元202被配置为基于所生成的重构的激励信号和接收到的量化的自回归系数来生成频谱包络的重构表示并对其进行频谱成形,作为频谱包络的表示,以及缩放单元203被配置为基于接收到的针对增益的量化索引对合成的音频信号进行放大,以提供解码的音频信号。
参考图21,将描述被配置为在频域工作的解码器200的实施例。因此,合成器单元202被配置为基于所生成的重构的激励信号来生成频谱包络的重构表示并对其进行频谱成形,以及缩放单元203被配置为基于接收到的针对频带增益的量化索引对合成的音频信号进行放大,以提供解码的音频信号。
下面将参考图13对编码器单元100中的量化器单元300的实施例的示例进行描述。该实施例基于处理器310,例如微处理器,处理器310执行:软件组件301,用于重排接收到的激励信号的元素;软件组件302,用于对重排的激励信号进行SQ编码和熵编码;以及软件组件303,用于重新分配编码的重排的激励信号的码字。可选地,量化器单元300包括另一软件组件304,用于在码字重新分配之后对激励信号进行反重排。这些软件组件被存储在存储器320中。处理器310通过系统总线与存储器通信。由对处理器310和存储器320所连接到的I/O总线进行控制的输入/输出(I/O)控制器330接收音频信号。在本实施例中,将I/O控制器320接收到的音频信号存储在存储器330中,在存储器330中,由软件组件来处理音频信号。软件组件301可以实现以上参考图3和图4描述的实施例中的重排步骤S301的功能。软件组件302可以实现以上参考图3和图4描述的实施例中的编码步骤S302的功能,编码步骤S302包括可选的SQ编码步骤S302’和熵编码步骤302”。软件组件303可以实现以上参考图3和图4描述的实施例中的码字重新分配循环S303的功能。
I/O单元330可以经由I/O总线与处理器310和/或存储器320互连,以实现相关数据(例如,输入参数和/或得到的输出参数)的输入和/或输出。
下面将参考图14对解码器200中的解量化器单元400的实施例的示例进行描述。该实施例基于处理器410,例如微处理器,处理器410执行:软件组件401,用于对接收到的激励信号进行熵解码;软件组件402,用于对熵解码的激励信号进行SQ解码;以及可选软件组件403,用于对解码的激励信号的元素进行反重排。这些软件组件被存储在存储器420中。处理器410通过系统总线与存储器通信。由对处理器410和存储器420所连接到的I/O总线进行控制的输入/输出(I/O)控制器430接收音频信号。在本实施例中,将I/O控制器420接收到的音频信号存储在存储器430中,在存储器330中,由软件组件来处理音频信号。软件组件401可以实现以上参考图5描述的实施例中的熵解码步骤S401的功能。软件组件402可以实现以上参考图5描述的实施例中的SQ解码步骤S402的功能。可选软件组件403可以实现以上参考图5描述的实施例中的可选的反重排步骤S403的功能。
I/O单元430可以经由I/O总线与处理器410和/或存储器420互连,以实现相关数据(例如,输入参数和/或得到的输出参数)的输入和/或输出。
下面参考图15、图18和图20描述编码器单元100的实施例的示例。该实施例基于处理器110,例如微处理器,处理器110执行:软件组件101,用于提取和量化音频信号的标量包络的表示(例如,滤波后的接收音频信号的自回归系数或频带增益系数);软件组件102,用于基于频谱包络的量化表示(例如,自回归系数)和滤波后的接收音频信号来提供和量化激励信号;以及软件组件103,用于基于激励信号、频谱包络的量化表示(例如,自回归系数)和滤波后的接收音频信号来提供和量化增益。这些软件组件被存储在存储器120中。处理器110通过系统总线与存储器通信。由对处理器110和存储器120所连接到的I/O总线进行控制的输入/输出(I/O)控制器130接收音频信号。在本实施例中,将I/O控制器120接收到的音频信号存储在存储器130中,在存储器330中,由软件组件来处理音频信号。软件组件101可以实现以上参考图6、图8和图10描述的实施例中的步骤S1的功能。软件组件102可以实现以上参考图6、图8和图10描述的实施例中的步骤S2的功能。软件组件103可以实现以上参考图6、图8和图10描述的实施例中的步骤S3的功能。
I/O单元130可以经由I/O总线与处理器110和/或存储器120互连,以实现相关数据(例如,输入参数和/或得到的输出参数)的输入和/或输出。
下面参考图17、图19和图21描述解码器单元200的实施例的示例。该实施例基于处理器210,例如微处理器,处理器210执行:软件组件201,用于生成或重构接收到的激励信号;软件组件202,用于合成重构的激励信号;以及软件组件203,用于放大合成的音频信号。这些软件组件被存储在存储器220中。处理器210通过系统总线与存储器通信。由对处理器210和存储器220所连接到的I/O总线进行控制的输入/输出(I/O)控制器230接收音频信号。在本实施例中,将I/O控制器220接收到的音频信号存储在存储器230中,在存储器330中,由软件组件来处理音频信号。软件组件201可以实现以上参考图5描述的实施例中的步骤S10的功能。软件组件102可以实现以上参考图5描述的实施例中的步骤S20的功能。软件组件103可以实现以上参考图5描述的实施例中的步骤S30的功能。
I/O单元230可以经由I/O总线与处理器210和/或存储器220互连,以实现相关数据(例如,输入参数和/或得到的输出参数)的输入和/或输出。
可以在供合适的处理设备执行的软件中实现此处描述的步骤、功能、过程和/或框中的至少一些,所述处理设备例如是微处理器、数字信号处理器(DSP)、和/或任何合适的可编程逻辑器件,如现场可编程门阵列(FPGA)器件。
还应该理解,重复使用网络节点的通用处理能力是可能的。例如,这可以通过对现有软件重新编程或者通过添加新的软件组件来执行。
可以将软件实现为计算机程序产品,计算机程序产品通常在计算机可读介质上执行。从而,可以将软件加载到计算机的操作存储器中,以由计算机的处理器来执行。计算机/处理器不是必须专用于仅执行上述步骤、功能、过程和/或块,而是还可以执行其他的软件任务。
上述技术旨在用于音频编码器和解码器中,该音频编码器和解码器可用在移动设备(例如,移动电话、膝上型设备)或固定PC中。然而,其同样适于在图像编码器和解码器中使用。
所呈现的量化方案允许对接收到的信号(具体是,但不限于HB音频信号)进行低复杂度可缩放编码。具体地,其使得可以在固定比特率框架内高效且低成本地利用可变比特率方案。通过该方式,其克服了例如时域中的传统BWE方案以及频域中的MDCT方案中的量化限制。
要将上述实施例理解为一些示意性的示例。本领域技术人员将会理解,在不背离实施例的范围的情况下,可以对该实施例进行各种修改、合并和改变。具体地,只要技术上可能,可以通过其他配置来合并不同实施例中的不同部分解决方案。然而,本发明的范围由所附权利要求限定。
Claims (24)
1.一种用于在通信系统中量化接收到的激励信号的量化方法,所述激励信号具有元素的原始顺序,所述方法包括以下步骤:
重排(S301)所述接收到的激励信号的元素,以提供重排的激励信号;
利用具有取决于幅度概率的可变码字长度的编解码器,利用可变比特率算法对重排的激励信号进行编码(S302),以提供编码的激励信号,其中所述编解码器使得向较高幅度概率分配较短码字;
如果所使用的比特的数目超过预定的固定比特率要求,则重新分配(S303)所述编码的激励信号的码字,以提供量化的激励信号。
2.根据权利要求1所述的量化方法,其中,所述编码步骤(S302)还包括标量量化SQ编码(S302’)。
3.根据权利要求2所述的量化方法,还包括:在所述码字重新分配的步骤(S303)之后,对编码的激励信号进行反重排的步骤(S304)。
4.一种通信系统中用于量化接收到的激励信号的量化器单元(300),所述激励信号具有元素的原始顺序,所述量化器单元包括:
重排单元(301),被配置为重排所述接收到的激励信号的元素,以提供重排的激励信号;
编码单元(302),被配置为利用具有取决于幅度概率的可变码字长度的编解码器,利用可变比特率算法对重排的激励信号进行编码,以提供编码的激励信号,其中所述编解码器使得向较高幅度概率分配较短码字;
重新分配单元(303),被配置为:如果所使用的比特的数目超过预定的固定比特率要求,则重新分配所述编码的激励信号的码字。
5.根据权利要求4所述的量化器单元(300),其中,所述编码单元(302)还包括:被配置为对重排的激励信号进行标量量化SQ编码的单元(302’),以及被配置为对SQ编码后的重排的激励信号进行熵编码的单元(302”)。
6.根据权利要求5所述的量化器单元,还包括:反重排单元(304),被配置为在码字重新分配之后对所述编码的激励信号的元素进行反重排。
7.一种用于在通信系统中重构激励信号的解量化方法,包括以下步骤:
对接收到的量化的激励信号进行熵解码(S401),所述量化的激励信号是利用具有取决于幅度概率的可变码字长度的编解码器、利用可变比特率算法来编码以提供编码的激励信号,其中所述编解码器使得向较高幅度概率分配较短码字,其中如果所使用的比特的数目超过预定的固定比特率要求,则将所述编码的激励信号的码字从较长码字重新分配至较短码字;
对熵解码的激励信号进行SQ解码(S402),以提供所述重构的激励信号;以及
对所述重构的激励信号的元素进行反重排(S403)。
8.根据权利要求7所述的方法,其中,如果之前在量化器单元中已经对所述重构的激励信号的元素进行了重排,则执行所述反重排步骤(S403)。
9.一种通信系统中用于重构激励信号的解量化单元(400),包括:
解码器单元(401),被配置为对接收到的量化的激励信号进行熵解码,所述量化的激励信号是利用具有取决于幅度概率的可变码字长度的编解码器、利用可变比特率算法来编码以提供编码的激励信号,其中所述编解码器使得向较高幅度概率分配较短码字,其中如果所使用的比特的数目超过预定的固定比特率要求,则将所述编码的激励信号的码字从较长码字重新分配至较短码字;
SQ解码单元(402),被配置为对熵解码的激励信号进行SQ解码,以提供重构的激励信号;
反重排单元(403),被配置为对所述重构的激励信号的元素进行反重排。
10.根据权利要求9所述的单元,其中,所述反重排单元(403)被配置为:如果之前在编码器中已经对所述重构的激励信号的元素进行了重排,则对所述重构的激励信号的元素进行反重排。
11.一种通信系统中的编码方法,包括以下步骤:
提取(S1)音频信号的频谱包络的表示;
至少基于所述表示和所述音频信号来提供和量化(S2)激励信号,所述量化是根据权利要求1-3中任一项执行的;
至少基于所述激励信号、所述提供的表示以及所述音频信号来提供和量化(S3)所述音频信号的增益;
向解码器单元发送(S4)至少针对所述量化的增益和所述量化的激励信号的量化索引。
12.根据权利要求11所述的编码方法,其中,所述编码在时域中进行,以及
所述提取步骤(S1)包括:提取和量化音频信号的自回归系数的集合,其中,所述自回归系数的集合包括所述音频信号的频谱包络的所述表示;
所述激励信号提供和量化步骤(S2)包括:至少基于所述量化的自回归系数和所述音频信号来提供和量化激励信号;
所述增益提供和量化步骤(S3)包括:至少基于激励信号、量化的自回归系数和音频信号来提供和量化增益;
所述发送步骤(S4)包括:向解码器单元发送针对所述自回归系数、所述激励信号和所述增益的量化索引。
13.根据权利要求11所述的编码方法,其中,所述编码在频域中进行,以及
所述提取步骤(S1)包括:提取音频信号的频带增益的集合,其中,所述频带增益包括所述音频信号的频谱包络的所述表示;
所述激励信号提供和量化步骤(S2)包括:至少基于所述提取的频带增益和所述音频信号来提供和量化激励信号;
所述增益提供和量化步骤(S3)包括:至少基于激励信号、提取的频带增益和音频信号来量化所述频带增益的集合;
所述发送步骤(S4)包括:向解码器单元发送针对所述频带增益系数和所述激励信号的量化索引。
14.一种编码器单元(100),包括根据权利要求4的量化器单元(300),所述编码器单元(100)还包括:
提取单元(101),被配置为提取音频信号的频谱包络的表示;
其中,所述量化器单元(300)被配置为至少基于所述表示和所述音频信号来提供和量化激励信号;
增益单元(103),被配置为至少基于激励信号、提供的表示和音频信号来提供和量化增益;
发送单元(104),被配置为向解码器单元发送至少针对所述量化的增益和所述量化的激励信号的量化索引。
15.根据权利要求14所述的编码器单元,其中,所述编码器单元被配置为在时域工作,以及
所述提取单元(101)被配置为提取和量化自回归系数,作为所述音频信号的所述频谱包络的所述表示;
所述量化器单元(300)被配置为至少基于所述量化的自回归系数和所述接收到的音频信号来提供和量化激励信号;
所述增益单元(103)被配置为至少基于所述激励信号、所述量化的自回归系数和所述接收到的音频信号来提供和量化增益;
所述发送单元(104)被配置为向解码器单元发送针对所述自回归系数、所述激励信号和所述增益的量化索引。
16.根据权利要求14所述的编码器单元,其中,所述编码器单元被配置为在频域工作,以及
所述提取单元(101)被配置为提取频带增益的集合,作为所述音频信号的所述频谱包络的所述表示;
所述量化器单元(300)被配置为至少基于所述提取的频带增益和所述接收到的音频信号来提供和量化激励信号;
所述增益单元(103)被配置为至少基于激励信号、提取的频带增益以及接收到的音频信号来量化所述频带增益的集合;
所述发送单元(104)被配置为向解码器单元发送针对所述频带增益系数和所述激励信号的量化索引。
17.一种通信系统中的解码方法,包括:
根据权利要求7,基于接收到的针对激励信号的量化索引来生成(S10)音频信号的重构的激励信号;
至少基于所生成的重构信号和接收到的所述音频信号的频谱包络的量化表示,生成所述音频信号的频谱包络的重构表示并对其进行频谱成形,以提供合成的音频信号;
基于接收到的针对增益的量化索引,对所述合成的音频信号进行缩放,以提供解码的音频信号。
18.根据权利要求17所述的解码方法,其中,所述方法在时域中操作,以及
所述生成和频谱成形步骤(S20)包括:基于重构的激励信号以及接收到的量化的自回归系数,生成频谱包络的重构表示并对其进行频谱成形,所述接收到的量化的自回归系数作为所述频谱包络的所述表示;以及
所述缩放步骤(S30)包括:基于接收到的针对增益的量化索引对所述合成的音频信号进行缩放,以提供解码的音频信号。
19.根据权利要求17所述的解码方法,其中,所述方法在频域中操作,以及
所述生成和频谱成形步骤(S20)包括:基于所生成的重构的激励信号生成频谱包络的重构表示并对其进行频谱成形;以及
所述缩放步骤(S30)包括:基于接收到的针对频带增益的量化索引对所述合成的音频信号进行缩放,以提供解码的音频信号。
20.一种解码器单元(200),包括根据权利要求9所述的解量化单元(400、201),所述解码器单元包括:
其中,所述解量化器单元400、201还被配置为基于接收到的针对所述激励信号的量化索引来生成重构的激励信号;
合成器单元(202),被配置为:至少基于所生成的重构的激励信号和接收到的音频信号的频谱包络的量化表示,生成所述音频信号的频谱包络的重构表示并对其进行频谱成形,以提供合成的音频信号;
缩放单元(203),被配置为基于接收到的针对增益的量化索引对所述合成的音频信号进行缩放,以提供解码的音频信号。
21.根据权利要求20所述的解码器单元,其中,所述解码器单元被配置为在时域工作,以及
所述合成器单元(202)被配置为:基于所生成的重构的激励信号和接收到的量化的自回归系数,生成频谱包络的所述重构表示并对其进行频谱成形,所述接收到的量化的自回归系数作为所述频谱包络的所述表示;以及
所述缩放单元(203)被配置为基于接收到的针对增益的量化索引对所述合成的音频信号进行缩放,以提供所述解码的音频信号。
22.根据权利要求20所述的解码器单元,其中,所述解码器单元被配置为在频域工作,以及
所述合成器单元(202)被配置为基于所生成的重构的激励信号生成频谱包络的所述重构表示并对其进行频谱成形;以及
所述缩放单元(203)被配置为基于接收到的针对频带增益的量化索引对所述合成的音频信号进行缩放,以提供所述解码的音频信号。
23.一种用户终端,包括根据权利要求4-6所述的量化器单元、根据权利要求9-10所述的解量化器单元、根据权利要求14-16所述的编码器单元、根据权利要求20-22所述的解码器单元中的至少一个。
24.一种基站终端,包括根据权利要求4-6所述的量化器单元、根据权利要求9-10所述的解量化器单元、根据权利要求14-16所述的编码器单元、根据权利要求20-22所述的解码器单元中的至少一个。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261659605P | 2012-06-14 | 2012-06-14 | |
US61/659,605 | 2012-06-14 | ||
PCT/EP2012/072491 WO2013185857A1 (en) | 2012-06-14 | 2012-11-13 | Method and arrangement for scalable low-complexity coding/decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104380377A CN104380377A (zh) | 2015-02-25 |
CN104380377B true CN104380377B (zh) | 2017-06-06 |
Family
ID=47221377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280073888.0A Expired - Fee Related CN104380377B (zh) | 2012-06-14 | 2012-11-13 | 用于可缩放低复杂度编码/解码的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9524727B2 (zh) |
EP (1) | EP2862167B1 (zh) |
CN (1) | CN104380377B (zh) |
WO (1) | WO2013185857A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2559200A (en) | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
GB2559199A (en) * | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
CN115050377B (zh) * | 2021-02-26 | 2024-09-27 | 腾讯科技(深圳)有限公司 | 音频转码方法、装置、音频转码器、设备以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1151491C (zh) * | 1996-05-29 | 2004-05-26 | 三菱电机株式会社 | 音频编码装置和音频编码译码装置 |
CN1265355C (zh) * | 1999-03-05 | 2006-07-19 | 松下电器产业株式会社 | 音源矢量生成装置及语音编码/解码装置 |
GB2463974A (en) * | 2008-10-01 | 2010-04-07 | Peter Graham Craven | Improved lossy coding of signals |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2956473B2 (ja) * | 1994-04-21 | 1999-10-04 | 日本電気株式会社 | ベクトル量子化装置 |
JP3273455B2 (ja) * | 1994-10-07 | 2002-04-08 | 日本電信電話株式会社 | ベクトル量子化方法及びその復号化器 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US8160874B2 (en) * | 2005-12-27 | 2012-04-17 | Panasonic Corporation | Speech frame loss compensation using non-cyclic-pulse-suppressed version of previous frame excitation as synthesis filter source |
US8386271B2 (en) * | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
US8406307B2 (en) * | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
WO2011048094A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec and celp coding adapted therefore |
-
2012
- 2012-11-13 CN CN201280073888.0A patent/CN104380377B/zh not_active Expired - Fee Related
- 2012-11-13 EP EP12790512.3A patent/EP2862167B1/en not_active Not-in-force
- 2012-11-13 WO PCT/EP2012/072491 patent/WO2013185857A1/en active Application Filing
- 2012-11-13 US US14/405,707 patent/US9524727B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1151491C (zh) * | 1996-05-29 | 2004-05-26 | 三菱电机株式会社 | 音频编码装置和音频编码译码装置 |
CN1265355C (zh) * | 1999-03-05 | 2006-07-19 | 松下电器产业株式会社 | 音源矢量生成装置及语音编码/解码装置 |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
GB2463974A (en) * | 2008-10-01 | 2010-04-07 | Peter Graham Craven | Improved lossy coding of signals |
Also Published As
Publication number | Publication date |
---|---|
WO2013185857A1 (en) | 2013-12-19 |
EP2862167A1 (en) | 2015-04-22 |
EP2862167B1 (en) | 2018-08-29 |
US9524727B2 (en) | 2016-12-20 |
CN104380377A (zh) | 2015-02-25 |
US20150149161A1 (en) | 2015-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100859881B1 (ko) | 음성 신호 코딩 | |
CN106941003B (zh) | 能量无损编码方法和设备以及能量无损解码方法和设备 | |
JP5719941B2 (ja) | オーディオ信号の効率的なエンコーディング/デコーディング | |
EP2625688B1 (en) | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac) | |
JP5404412B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP5241701B2 (ja) | 符号化装置および符号化方法 | |
CA2877161C (en) | Linear prediction based audio coding using improved probability distribution estimation | |
EP3217398B1 (en) | Advanced quantizer | |
WO2007088853A1 (ja) | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 | |
JP6027538B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 | |
KR102512359B1 (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 | |
JP2016508618A (ja) | 周波数領域におけるlpc系符号化のための低周波数エンファシス | |
DK3040988T3 (en) | AUDIO DECODING BASED ON AN EFFECTIVE REPRESENTATION OF AUTOREGRESSIVE COEFFICIENTS | |
JP2021005086A (ja) | 最下位ビットの符号化および復号に適合するオーディオ符号化器、オーディオ復号器、方法、およびコンピュータプログラム | |
WO2012004998A1 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
CN104380377B (zh) | 用于可缩放低复杂度编码/解码的方法和装置 | |
CN112970063B (zh) | 用于利用生成模型的码率质量可分级编码的方法及设备 | |
JPWO2009125588A1 (ja) | 符号化装置および符号化方法 | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
WO2021256082A1 (ja) | 符号化装置、復号装置、符号化方法、及び、復号方法 | |
US8924202B2 (en) | Audio signal coding system and method using speech signal rotation prior to lattice vector quantization | |
KR102546098B1 (ko) | 블록 기반의 오디오 부호화/복호화 장치 및 그 방법 | |
CN105336334B (zh) | 多声道声音信号编码方法、解码方法及装置 | |
CN116631418A (zh) | 语音编码、解码方法、装置、计算机设备和存储介质 | |
KR20160098597A (ko) | 통신 시스템에서 신호 코덱 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170606 |