[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN100585699C - 一种音频解码的方法和装置 - Google Patents

一种音频解码的方法和装置 Download PDF

Info

Publication number
CN100585699C
CN100585699C CN200810084725A CN200810084725A CN100585699C CN 100585699 C CN100585699 C CN 100585699C CN 200810084725 A CN200810084725 A CN 200810084725A CN 200810084725 A CN200810084725 A CN 200810084725A CN 100585699 C CN100585699 C CN 100585699C
Authority
CN
China
Prior art keywords
band
signal
component
switching
coding parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200810084725A
Other languages
English (en)
Other versions
CN101335002A (zh
Inventor
陈喆
殷福亮
张小羽
代金良
张立斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN200810084725A priority Critical patent/CN100585699C/zh
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to EP08845741.1A priority patent/EP2207166B1/en
Priority to KR1020107011060A priority patent/KR101290622B1/ko
Priority to BRPI0818927-7A priority patent/BRPI0818927A2/pt
Priority to PCT/CN2008/072756 priority patent/WO2009056027A1/zh
Priority to JP2010532409A priority patent/JP5547081B2/ja
Priority to EP13168293.2A priority patent/EP2629293A3/en
Publication of CN101335002A publication Critical patent/CN101335002A/zh
Application granted granted Critical
Publication of CN100585699C publication Critical patent/CN100585699C/zh
Priority to US12/772,197 priority patent/US8473301B2/en
Priority to JP2013141872A priority patent/JP2013235284A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供一种音频信号的解码方法,包括以下步骤:当接收到的编码码流对应的音频信号由较宽带宽向较窄带宽切换时,获取所述音频信号的低带信号分量,扩展出高带信息;将所述扩展出的高带信息进行时变渐出处理,得到处理后的高带信号分量;将所述处理后的高带信号分量和所述获取的低带信号分量进行合成。通过本发明实施例提供的方法,当音频信号发生了宽带到窄带的切换时,可以利用带宽检测、人工频带扩展、时变渐出处理、以及带宽合成等一系列的处理,以实现切换能够平滑地从宽带信号过渡到窄带信号,从而使人耳获得较为舒适的听觉感受。

Description

一种音频解码的方法和装置
技术领域
本发明涉及语音通信领域,尤其涉及一种音频解码的方法和装置。
背景技术
G.729.1是ITU(International Telecommunication Union,国际电信联盟)最新发布的新一代语音编解码标准,这种嵌入式语音编解码标准最大的特点是具有分层编码的特性,能够提供码率范围在8kb/s~32kb/s的窄带到宽带的音频质量,允许在传输过程中,根据信道状况丢弃外层码流,具有良好的信道自适应性。
在G.729.1标准中,通过将码流构造成嵌入式的分层结构来达到分级性,是一种新型的嵌入式可分层的多速率语音编解码器。输入为20ms的超帧,当采样率为16000Hz,帧长为320点。图1为G.729.1各层编码器系统框图,语音编解码器编码的具体过程为:输入信号sWB(n)首先经过QMF(QuadratureMirror Filterbank,正交镜像滤波器)滤波分成(H1(z),H2(z))两个子带,低子带信号sLB qmf(n)经过50Hz截止频率的高通滤波器进行预处理,输出信号sLB(n)使用8kb/s~12kb/s的窄带嵌入式CELP(Code-Excited Linear-Prediction,码激励线性预测)编码器进行编码,sLB(n)和12Kb/s码率下CELP编码器的本地合成信号
Figure C20081008472500051
之间的差值信号dLB(n)经过知觉加权滤波(WLB(z))后的信号dLB w(n)通过MDCT(Modified Discrete Cosine Transform,修正的离散余弦变换)变换到频域。加权滤波器WLB(z)包含了增益补偿,用来保持滤波器输出dLB w(n)与高子带输入信号sHB(n)之间的谱连续性。加权后的差值信号要变换到频域内。
高子带分量乘上(-1)n进行谱反转之后的信号sHB fold(n)通过截止频率为3000HZ的低通滤波器进行预处理,滤波后的信号sHB(n)使用TDBWE(Time-Domain BandWidth Extension,时域带宽扩展编码算法)编码器进行编码。进入TDAC(Time Domain Alias Cancellation,时域混叠消除)编码模块的sHB(n)也要先使用MDCT变换到频域上。
两组MDCT系数DLB w(k)和SHB(k)最后使用TDAC编码算法进行编码。另外,还有一些参数用FEC(Frame Erasure Concealment,帧差错隐藏)编码器进行传输,用以改进在传输中出现丢帧时造成的错误。
图2为G.729.1各层解码器系统框图,解码器的实际工作模式由接收到的码流层数决定,也等价于由接收到的码率决定。根据接收端接收到的不同码率各情况分述如下:
1、如果接收到的码率为8kb/s或12kb/s(即仅接收到第一层或者前两层):第一层或者前两层的码流由嵌入式CELP解码器进行解码,得到解码后的信号
Figure C20081008472500061
再进行后滤波得到
Figure C20081008472500062
经过高通滤波之后进入QMF滤波器组合成16kHz的宽带信号,其中高带信号分量置0。
2、如果接收到的码率为14kb/s(即接收到前三层):除了CELP解码器解码出窄带分量以外,TDBWE解码器也解码出高带信号分量
Figure C20081008472500064
进行MDCT变换,把高子带分量谱中3000Hz以上(对应于16kHz采样率中7000Hz以上)频率分量置0,然后进行逆MDCT变换,迭加之后并进行谱翻转,然后在QMF滤波器组中与CELP解码器解出的低带分量一起合成采样率为16kHz的宽带信号。
3、如果接收到14kb/s以上速率的码流(对应于前四层或者更多层):除了CELP解码器解码出低子带分量
Figure C20081008472500066
TDBWE解码器解码出高子带分量
Figure C20081008472500067
以外,还要使用TDAC解码器解码出低子带加权差分信号和高子带增强信号,对全频带信号进行增强,最终也在QMF滤波器组中合成采样率为16kHz的宽带信号。
G729.1的码流具有分层结构,允许在传输的过程中根据信道的传输能力从外向内丢弃外层码流,以达到对信道状况的自适应。由编解码的算法描述中可以看出,如果信道容量随时间较快的进行变化时,在解码器可能时而收到窄带码流(等于或者低于12kb/s),此时解码出的信号仅包含4000Hz以下分量;时而收到宽带码流(等于或者高于14kb/s),此时解码出的信号则包含0~7000Hz的宽带信号。这种带宽的突然变化,我们称之为带宽切换,由于高低带对人耳感受的贡献并不相同,因此这样的频繁切换会给人耳带来明显的不舒适感。特别地,当频繁出现由宽带向窄带的切换时,人耳将能频繁地明显感觉到听到的声音从清脆跃变为沉闷,因此需要使用一种技术来减轻这种频繁切换对人耳听觉带来的不舒适感。
发明内容
本发明实施例提供一种音频解码的方法和装置,目的是要改善语音信号带宽切换时人耳感受的舒适度。
为达到上述目的,本发明实施例提供一种音频解码的方法,包括以下步骤:
当接收到的编码码流对应的音频信号由较宽带宽向较窄带宽切换时,获取所述音频信号的低带信号分量;
扩展出高带信息,将所述扩展出的高带信息进行时变渐出处理,得到处理后的高带信号分量,所述时变渐出处理包括对所述扩展出的高带信息进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到高带信号分量;
将所述处理后的高带信号分量和所述获取的低带信号分量进行合成。
本发明实施例还提供一种音频解码的装置,包括:
获取单元,用于当接收到的编码码流对应的音频信号由较宽带宽向较窄带宽切换时,获取所述音频信号的低带信号分量;
扩展单元,用于扩展出高带信息,并将所述扩展出的高带信息发送给时变渐出处理单元;
时变渐出处理单元,用于对所述扩展出的高带信息进行时变渐出处理,得到处理后的高带信号分量,并将所述处理后的高带信号分量发送给合成单元,所述时变渐出处理包括对所述扩展出的高带信息进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到高带信号分量;
合成单元,用于将接收到的所述处理后的高带信号分量和所述获取单元获取的低带信号分量进行合成。
本发明实施例具有以下有益效果:
通过本发明实施例提供的方法,当音频信号发生了宽带到窄带的切换的时,可以利用带宽检测、人工频带扩展、时变渐出处理、以及带宽合成等一系列的处理,以实现切换能够平滑地从宽带信号过渡到窄带信号,从而使人耳获得较为舒适的听觉感受。
附图说明
图1为现有技术中G.729.1编码器系统框图;
图2为现有技术中G.729.1解码器系统框图;
图3为本发明实施例一的一种音频信号的解码方法流程图;
图4为本发明实施例二的一种音频信号的解码方法流程图;
图5为本发明实施例二中时变增益因子变化曲线;
图6为本发明实施例二中时变滤波器极点变化示意图;
图7为本发明实施例三的一种音频信号的解码方法流程图;
图8为本发明实施例四的一种音频信号的解码方法流程图;
图9为本发明实施例五的一种音频信号的解码方法流程图;
图10为本发明实施例六的一种音频信号的解码方法流程图;
图11为本发明实施例七的一种音频信号的解码方法流程图;
图12为本发明实施例八的一种音频信号的解码方法流程图;
图13为本发明实施例九的一种音频信号的解码装置示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明的实施例一中,一种音频信号的解码方法如图3所示,具体步骤如下:
步骤S301、确定接收到的编码码流的帧结构。
步骤S302、根据编码码流的帧结构检测编码码流对应的音频信号是否发生了由较宽带宽向较窄带宽的切换,如果发生了切换,转步骤S303,否则,按照正常的解码流程对编码码流进行解码并输出重建后的音频信号。
一般来说,在语音编解码领域,窄带信号是指频带0~4000Hz的信号,宽带信号是指频带在0~8000Hz的信号,超宽带信号是指频带在0~16000Hz的信号。频带较宽的信号又可以分解为低带信号分量和高带信号分量。当然,这里的定义只是一般意义上的,实际应用时可以不限于此。为了便于描述,本发明的实施例中的高带信号分量是指切换后相对于切换前带宽增加的部分,窄带信号分量是切换前和切换后的音频信号都具有的带宽部分。例如,频带在0~8000Hz的信号向频带0~4000Hz的信号切换时,低带信号分量指的是0~4000Hz的信号,高带信号分量指的是4000~8000Hz的信号。
步骤S303、检测到编码码流对应的音频信号由较宽带宽向较窄带宽切换时,利用接收到的低带编码参数解码出低带信号分量。
本发明实施例中,只要切换前的带宽比切换前的带宽较宽即可应用本发明实施例的方案,而不局限在一般意义上的宽带向窄带切换。
步骤S304、利用人工频带扩展技术,将低带信号分量扩展出高带信息。
具体的,所述高带信息可以为高带信号分量或高带编码参数。利用人工频带扩展技术,在编码码流对应的音频信号由较宽带宽向较窄带宽切换的最初一段时间内,将低带信号分量扩展出高带信息的方法可以为以下两种:利用切换前接收到的高带编码参数将低带信号分量扩展出高带信息;或利用切换后当前音频帧解码出的低带信号分量扩展出高带信息。
利用切换前接收到的高带编码参数将低带信号分量扩展出高带信息的方法具体为:缓存切换前接收到的高带编码参数(例如TDBWE(Time-DomainBandwidth Extension,时域带宽扩展)编码算法中的时域、频域包络或者TDAC编码算法中的MDCT系数),在切换后利用外插估算出当前音频帧的高带编码参数,进一步,可以根据高带编码参数利用相应的宽带解码算法即可扩展出高带信号分量。
利用切换后当前音频帧解码出的低带信号分量扩展出高带信息的方法具体为:对切换后当前音频帧解码出的低带信号分量进行FFT变换(Fast FourierTransform,快速傅立叶变换),然后在FFT域对低带信号分量的FFT系数进行延拓和整形,整形后的FFT系数作为高带信息的FFT系数,再进行反FFT变换即可扩展出高带信号分量。当然,使用前一种方法计算复杂度要远远低于后一种方法,以下实施例中均采用前一种方法为例对本发明进行描述。
步骤S305、将扩展出的高带信息进行时变渐出处理。
具体的,利用人工频带扩展技术扩展出高带信息后,并不进行QMF滤波将高带信息和低带信号分量合成宽带信号,而是对扩展出的高带信息进行时变渐出处理。渐出处理即音频信号由较宽带宽向较窄带宽过渡。将高带信息进行时变渐出处理的方法具体包括:分离时变渐出处理和混合时变渐出处理。
分离时变渐出处理具体为:方法一、利用时域增益因子对扩展出的高带信息进行时域整形,进一步可以对时域整形后的高带信息利用时变滤波进行频域整形;或方法二、对扩展出的高带信息利用时变滤波进行频域整形,进一步可以对频域整形后的高带信息利用时域增益因子进行时域整形。
混合时变渐出处理具体为:方法三、利用频域高带参数时变加权方法对扩展出的高带信息进行频域整形,得到时变渐出的频谱包络,解码得到处理后的高带信号分量;或方法四、对扩展出的高带信息划分子带,对各个子带编码参数进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到处理后的高带信号分量。
步骤S306、将处理后的高带信号分量和解码出的低带信号分量进行合成。
上述步骤中,解码器对扩展出的高带信息有多种时变渐出的处理方法,下面对不同的时变渐出的处理方法分别以具体实施例的方式进行详细描述。
以下实施例中,解码器接收到的编码码流可以为语音段,语音段是指解码器连续接收到的一段语音帧,语音帧可以是全速率语音帧,也可以是全速率语音帧的若干层。解码器接收到的编码码流也可以为噪音段,噪音段是指解码器连续接收到的一段噪音帧,噪音帧可以是全速率噪音帧,也可以是全速率噪音帧的若干层。
本发明的实施例二中,以解码器接收到的编码码流为语音段,且时变渐出处理采用方法一,即利用时域增益因子对扩展出的高带信息进行时域整形,进一步可以对时域整形后的高带信息利用时变滤波进行频域整形为例,一种音频信号的解码方法如图4所示,具体步骤如下:
步骤S401、解码器接收到编码器发送的编码码流,确定接收到的编码码流的帧结构。
具体的,编码器采用图1所示系统框图的流程对音频信号进行编码,将编码码流发送给解码器,解码器接收到编码码流,如果编码码流对应的音频信号未发生由宽带到窄带的切换,解码器采用图2所示的系统框图的流程对接收到的编码码流进行正常解码,在此不再赘述。解码器接收到的编码码流为一个语音段,语音段中的语音帧可以是全速率语音帧,也可以是全速率语音帧的若干层。本实施例中采用全速率语音帧,其帧结构如表1所示:
步骤S402、解码器根据编码码流的帧结构检测是否发生了由宽带向窄带的切换,如果发生了切换,转步骤S403,否则,按照正常的解码流程对编码码流进行解码并输出重建后的音频信号。
如果接收到的是语音帧,则根据当前帧的数据长度或解码速率即可确定是否发生了由宽带向窄带的切换,例如如果当前帧的数据仅为层1和层2,则当前帧的长度为160比特(即解码速率为8kb/s)或者240比特(即解码速率为12kb/s),当前帧为窄带,否则,如果当前帧的数据除了包含前两层以外还有更高层,即当前帧的长度等于或者大于280比特(即解码速率为14kb/s),则当前帧为宽带。
具体的,根据当前帧及前一帧或前几帧判断出的语音信号的带宽即可检测出当前语音段是否发生了宽带向窄带的切换。
步骤S403、当接收到的编码码流对应的语音信号由宽带向窄带的切换时,解码器对接收到的低带编码参数利用嵌入式CELP解码,解码出低带信号分量
Figure C20081008472500121
步骤S404、利用切换前接收到的高带信号分量的编码参数,将低带信号分量
Figure C20081008472500122
扩展出高带信号分量
Figure C20081008472500123
具体的,解码器接收到高带编码参数的语音帧后,每次缓存切换前接收到的M个语音帧的TDBWE编码参数(包括时域包络和频域包络),在检测到由宽带到窄带的切换后,解码器首先根据缓存区中存储的切换前接收到的语音帧的时域包络和频域包络,外插出当前帧的时域包络和频域包络,然后利用外插出的时域包络和频域包络进行TDBWE解码即可扩展出高带信号分量。解码器也可以缓存切换前接收到的M个语音帧的TDAC编码参数(即MDCT系数),外插出当前帧的MDCT系数,然后利用外插出的MDCT系数进行TDAC解码即可扩展出高带信号分量。
在检测到由宽带向窄带的切换之后,对于缺失高带编码参数的语音帧,采用镜像插值法估算出高带信号分量的合成参数,即以缓存区中缓存的最近M个语音帧的高带编码参数为镜像源,从当前语音帧开始,进行分段线性插值,分段线线性插值的公式为:
Figure C20081008472500131
其中Pk表示从切换位置开始重建出的第k个语音帧高带信号分量的合成参数,其中k=0,…,N-1,N为渐出处理的持续语音帧数;P-i表示缓存区中存储的切换位置之前第i个语音帧接收的高带编码参数,其中i=1,…,M,M为渐出处理需要缓存的帧数;(a)mod(b)表示a对b取余操作;
Figure C20081008472500132
表示向下取整操作。公式(1)所述的实现过程作用是利用缓存的切换前M个语音帧的高带编码参数估计出切换后N个语音帧的高带编码参数,通过TDBWE或TDAC解码算法重建出切换后N个语音帧的高带信号分量,根据实际应用的需求,M可以为小于N的任意值。
步骤S405、对扩展出的高带信号分量
Figure C20081008472500133
进行时域整形,得到处理后的高带信号分量
Figure C20081008472500134
具体的,在进行时域整形时,可以引入一个时变的增益因子g(k),该时变因子的变化曲线如图5所示,时变增益因子在对数域上为线性衰减的曲线。对于发生切换后的第k个语音帧,将扩展出的高带信号分量乘以该时变增益因子,如公式(2)所示:
s ^ ts HB ( n ) = g ( k ) · s ^ HB ( n ) - - - ( 2 )
其中n=0,…,L-1 k=0,…,N-1,L表示帧长。
步骤S406、可选地,可以采用时变滤波器法对时域整形后的高带信号分量
Figure C20081008472500136
进行频域整形,得到频域整形后的高带信号分量
Figure C20081008472500137
具体的,将经过时域整形的高带信号分量
Figure C20081008472500138
通过时变滤波器,使高带信号分量的频带随着时间缓慢变窄。本实施例中所使用的时变滤波器为时变二阶巴特沃兹滤波器,其零点固定为-1,极点在不断变化,图6为时变二阶巴特沃兹滤波器极点变化示意图,时变滤波器极点沿顺时针方向运动,也就是说,滤波器通带将不断减小直至0。
当解码器处理14kb/s或更高的语音信号时,宽带窄带切换标志位fad_out_flag置0,滤波点数计数器fad_out_count置0,当从某一时刻开始,当解码器开始处理8kb/s或12kb/s的语音信号时,窄带宽带切换标志位fad_out_flag置1,并启动时变滤波器开始对重建的高带信号分量进行滤波,当滤波点数fad_out_count满足fad_out_count<FAD_OUT_COUNT_MAX条件时持续进行时变滤波,否则停止时变滤波过程,其中FAD_OUT_COUNT_MAX=N×L为过渡点数(例如FAD_OUT_COUNT_MAX=8000)。
设i时刻,时变滤波器的一个精确极点为rel(i)+img(i)×j;m时刻,该极点精确运动到rel(m)+img(m)×j。若插值点数为N,则其间k时刻的插值结果为:
rel(k)=rel(i)×(N-k)/N+rel(m)×k/N
img(k)=img(i)×(N-k)/N+img(m)×k/N
由插值极点可以恢复出k时刻的滤波器系数,得到转移函数:
H ( z ) = 1 + 2 z - 1 + z - 2 1 - 2 rel ( k ) z - 1 + [ rel 2 ( k ) + img 2 ( k ) ] z - 2
当解码器接收到宽带语音信号时,滤波点数计数器fad_out_count被置为0,当解码器接收到的语音信号从宽带切换到窄带时,时变滤波器开始启动,滤波计数器按下式进行更新:
fad_out_count=min(fad_out_count+1,FAD_OUT_COUNT_MAX)其中FAD_OUT_COUNT_MAX为过渡阶段持续采样点数。
设a1=2rel(k),a2=-[rel2(k)+img2(k)],经过时域整形的重建高带信号分量
Figure C20081008472500142
为时变滤波器的输入信号,
Figure C20081008472500143
为时变滤波器的输出信号,则有:
s ^ HB fad ( n ) = gain _ filter × [ a 1 × s ^ HB fad ( n - 1 ) + a 2 × s ^ HB fad ( n - 2 ) + s ^ HB ts ( n ) + 2.0 × s ^ HB ts ( n - 1 ) + s ^ HB ts ( n - 2 ) ]
其中,gain_filter为滤波器增益,计算公式为:
gain _ filter = 1 - a 1 - a 2 4
步骤S407、利用QMF滤波器组将解码的低带信号分量
Figure C20081008472500146
和处理后的高带信号分量
Figure C20081008472500147
(如果不执行步骤S406则为高带信号分量
Figure C20081008472500148
)进行合成滤波,即可重建出时变渐出的信号,满足从宽带平滑过渡到窄带的特性。
将经过时变渐出处理后的高带信号分量
Figure C20081008472500149
和重建出的低带信号分量
Figure C200810084725001410
一起,输入QMF滤波器组进行合成滤波,得到全频带的重建信号,即使解码时出现频繁的宽带向窄带的切换,经过本发明处理后的重建信号依然能够给人耳提供相对较好的听觉质量。
本实施例中,以语音段的时变渐出处理采用方法一,即利用时域增益因子对扩展出的高带信息进行时域整形,并对时域整形后的高带信息利用时变滤波进行频域整形对本发明进行描述,可以理解的是,时变渐出处理还可以采用其他方法。本发明的实施例三中,以解码器接收到的编码码流为语音段,且时变渐出处理采用方法三,即利用频域高带参数时变加权方法对扩展出的高带信息进行频域整形为例,一种音频信号的解码方法如图7所示,具体步骤如下:
步骤S701~步骤S703与实施例二中步骤S401~步骤S403一致,在此不再赘述。
步骤S704、利用切换前接收到的高带信号分量的编码参数,将低带信号分量
Figure C20081008472500151
扩展出高带编码参数。
该过程是利用解码器缓存的切换前M个语音帧的高带编码参数估计出切换后N个语音帧的高带编码参数(频域包络以及高带谱包络),具体为:解码器接收到包含高带编码参数的帧后,每次缓存切换前接收到的M个语音帧的TDBWE编码参数,包括时域包络以及频域包络编码参数,在检测到宽带到窄带的切换后,解码器首先根据缓存区中存储的切换前接收到的时域包络和频域包络,外插出当前帧的时域包络和频域包络。解码器也可以缓存切换前接收到的M个语音帧的TDAC编码参数(即MDCT系数),根据语音帧的MDCT系数扩展出高带编码参数。
在检测到宽带向窄带的切换之后,对于缺失高带编码参数的帧,采用镜像插值法估算出高带信号分量的合成参数,即以缓存区中缓存的最近M个(例如M=5)语音帧的高带编码参数(频域包络和高带谱包络)为镜像源,从当前语音帧开始,进行分段线性插值,可以采用实施例二中的分段线性插值公式(1)实现,其中持续帧数为N(例如N=50),该过程的作用是利用缓存的切换前M个帧的高带编码参数估计出切换后N个帧的高带编码参数(频域包络和高带谱包络)。
步骤S705、采用频域高带参数时变加权法对扩展出的高带编码参数进行频域整形。
具体的,将高带信号从频域上划分多个子带,再将各子带高带编码参数按不同的增益进行频域加权,使高带信号分量的频带缓慢变窄。由于宽带的编码参数不管是14kb/s时的TDBWE编码算法中的频域包络还是14kb/s以上速率的TDAC编码算法中的高带包络,都隐含着把高带划分成一定数量的子带的过程,因此,如果直接对接收到的高带编码参数在频域进行时变渐出处理,将会比在时域上使用滤波的方法节省很多计算量。当解码器处理14kb/s或更高速率的语音信号时,窄带宽带切换标志位fad_out_flag置为0,过渡帧数计数器fad_out_frame_count置0,当从某一时刻开始,当解码器开始处理8kb/s、12kb/s的语音信号时,窄带宽带切换标志位fad_out_flag为置为1,当过渡帧数fad_out_frame_count同时满足fad_out_frame_count<N条件时便对频域的编码参数进行加权,且加权因子随时间发生变化。
如果发生切换前语音帧速率高于14kb/s时,则接收到并缓存至缓存区里的高带信号分量的编码参数包括MDCT域的高带包络和TDBWE算法中的频域包络,否则接收到并缓存至缓存区里的高带信号编码参数仅包括TDBWE算法中的频域包络。对发生切换后的第k个语音帧(k=1,…,N),使用缓存区里的高带编码参数重建出当前帧的相应高带编码参数,频域包络或者MDCT域的高带包络。这些频域上的包络将整个高带分成多个子带,这些谱包络用
Figure C20081008472500161
(j=0,…,J-1,J为划分的子带数,例如G.729.1中对于TDBWE算法中的频域包络来说J=12,对于MDCT域的高带包络来说J=18)表示,将每个子带按时变渐出的增益因子gain(k,j)进行加权,即
Figure C20081008472500162
即可得到频域上时变渐出的频谱包络。gain(k,j)的计算公式为:
gain ( k , j ) = max ( 0 , ( J - j ) × N - J × k ) J × N , k = 1 , . . . , N , j = 0 , . . . , J - 1
对处理后的TDBWE频域包络和MDCT域的高带包络,分别使用TDBWE解码算法和TDAC解码算法进行解码即可获得时变渐出的高带信号分量
Figure C20081008472500164
步骤S706、利用QMF滤波器组将处理后的高带信号分量
Figure C20081008472500165
和解码出的低带信号分量
Figure C20081008472500166
进行合成滤波,即可重建出时变渐出的信号。
音频信号包括语音信号和噪音信号,实施例二和实施例三中,以语音段由宽带向窄带的切换为例对本发明进行描述,可以理解的是,噪音段也可能由宽带向窄带切换。本发明实施例四中,以解码器接收到的编码码流为噪音段,且时变渐出处理采用方法二,即对扩展出的高带信息利用时变滤波进行频域整形,进一步可以对频域整形后的高带信息利用时域增益因子进行时域整形为例,一种音频信号的解码方法如图8所示,具体步骤如下:
步骤S801、解码器接收到编码器发送的编码码流,确定接收到的编码码流的帧结构。
具体的,编码器采用图1所示系统框图的流程对音频信号进行编码,将编码码流发送给解码器,解码器接收到编码码流,如果编码码流对应的音频信号未发生由宽带到窄带的切换,解码器采用图2所示的系统框图的流程对接收到的编码码流进行正常解码,在此不再赘述。解码器接收到的编码码流为一个噪音段,噪音段中的噪音帧可以是全速率噪音帧,也可以是全速率噪音帧的若干层。噪音帧可以是连续编码并传输,也可以是采用非连续传输的技术,本实施例中的噪音段和噪音帧使用相同的定义,且本实施例中解码器接收到的噪音帧为全速率噪音帧,本实施例中使用的噪音帧编码结构如表2所示。
Figure C20081008472500181
步骤S802、解码器根据编码码流的帧结构检测是否发生了由宽带向窄带的切换,如果发生了切换,转步骤S803,否则,按照正常的解码流程对编码码流进行解码并输出重建后的噪音信号。
如果接收到的是噪音帧,解码器则根据当前帧的数据长度即可确定是否发生了由宽带向窄带的切换,例如如果当前帧的数据仅为窄带核心层或窄带核心层+窄带增强层,即当前帧的长度为15比特或者24比特时,则当前帧为窄带,否则,如果当前帧的数据还包含宽带核心层,即当前帧的长度为43比特,则当前帧为宽带。
根据当前帧及前一帧或前几帧判断出的噪音信号的带宽即可检测出当前是否发生了宽带向窄带的切换。
如果解码器接收到的SID(Silence Insertion Descriptor,静音插入帧)帧中包含高带编码参数(即宽带核心层),则用该SID帧对缓存区中的高带编码参数进行更新。从噪音段的某一时刻开始,解码器接收到的SID帧中不再含宽带核心层,则解码器判定发生了由宽带向窄带的切换。
步骤S803、当接收到的编码码流对应的噪音信号由宽带向窄带的切换时,解码器对接收到的低带编码参数利用嵌入式CELP解码,解码出低带信号分量
步骤S804、利用切换前接收到的高带信号分量的编码参数,将低带信号分量
Figure C20081008472500183
扩展出高带信号分量
Figure C20081008472500184
对于缺失高带编码参数的噪音帧,采用镜像插值法估算出高带信号分量的合成参数。如果噪音帧采用连续编码传输技术,则以缓存区中缓存的最近M个噪音帧(例如M=5)的高带编码参数(频域包络以及高带谱包络)为镜像源,利用实施例二中的公式(1)对发生了由宽带到窄带的切换后第k个噪音帧的高带编码参数进行重建;如果噪音帧采用非连续传输的技术,则以缓存区中缓存的最近2个噪音帧包含高带编码参数(频域包络)的SID帧为镜像源,从当前帧开始,进行分段线性插值。用公式(3)对发生宽带到窄带的切换后第k个帧高带编码参数进行重建:
P k = k N - 1 P sid _ past + ( 1 - k N - 1 ) P sid _ p _ past - - - ( 3 )
持续帧数为N(例如N=50),其中Psid_past表示缓存区中存储的最近包含宽带核心层的SID帧的高带编码参数,Psid_p_past表示缓存区中存储的次近包含宽带核心层的SID帧的高带编码参数。该过程利用缓存的切换前2个噪音帧的高带编码参数估计出切换后N个噪音帧的高带编码参数(频域包络),以恢复出切换后N个噪音帧的高带信号分量。利用公式(3)重建出的高带编码参数通过TDBWE或TDAC解码扩展出高带信号分量
Figure C20081008472500192
步骤S805、采用时变滤波法对扩展出的高带信号分量
Figure C20081008472500193
进行频域整形,得到频域整形后的高带信号分量
Figure C20081008472500194
具体的,在进行频域整形时,将扩展出的高带信号分量
Figure C20081008472500195
通过时变滤波器,使高带信号分量的频带随着时间缓慢变窄,该滤波器的极点变化曲线如图6所示。每次解码器接收到含有宽带核心层的SID帧时,宽带窄带切换标志位fad_out_flag置0,滤波点数计数器fad_out_flag置0,当从某一时刻开始,当解码器接收到不包含宽带核心层的SID帧时,窄带宽带切换标志位fad_out_flag置1,并启动时变滤波器开始对重建的高带信号分量进行滤波,当滤波点数fad_out_count满足fad_out_count<FAD_OUT_COUNT_MAX条件时持续进行时变滤波,否则停止时变滤波过程,其中FAD_OUT_COUNT_MAX=N×L为过渡点数(例如FAD_OUT_COUNT_MAX=8000)。
设i时刻,时变滤波器的一个精确极点为rel(i)+img(i)×j;m时刻,该极点精确运动到rel(m)+img(m)×j。若插值点数为N,则其间k时刻的插值结果为:
rel(k)=rel(i)×(N-k)/N+rel(m)×k/N
img(k)=img(i)×(N-k)/N+img(m)×k/N
由插值极点可以恢复出k时刻的滤波器系数,得到转移函数:
H ( z ) = 1 + 2 z - 1 + z - 2 1 - 2 rel ( k ) z - 1 + [ rel 2 ( k ) + img 2 ( k ) ] z - 2
当解码器接收到宽带噪音信号时,滤波计数器fad_out_count被置为0,当解码器接收到的噪音信号由宽带切换到窄带时,时变滤波器开始启动,滤波计数器按下式进行更新:
fad_out_count=min(fad_out_count+1,FAD_OUT_COUNT_MAX)
其中FAD_OUT_COUNT_MAX为过渡阶段持续采样点数。
设a1=2rel(k),a2=-[rel2(k)+img2(k)],扩展出的高带信号分量
Figure C20081008472500201
为时变滤波器的输入信号,为时变滤波器的输出信号,则有:
s ^ HB fad ( n ) = gain _ filter × [ a 1 × s ^ HB fad ( n - 1 ) + a 2 × s ^ HB fad ( n - 2 ) + s ^ HB ( n ) + 2.0 × s ^ HB ( n - 1 ) + s ^ HB ( n - 2 ) ]
其中,gain_filter为滤波器增益,计算公式为:
gain _ filter = 1 - a 1 - a 2 4
步骤S806、可选地,可以对频域整形后的高带信号分量
Figure C20081008472500205
进行时域整形,得到时域整形后的高带信号分量
Figure C20081008472500206
具体的,时域整形可引入一个时变的增益因子g(k),该时变因子的变化曲线如图5所示。对于发生切换后的第k个帧,将经过TDBWE或TDAC解码之后扩展出的高带信号分量乘以时变增益因子,如公式(2)所示,其实现过程与实施例二中对高带信号分量进行时域整形的过程一致,在此不再赘述。也可以将该步骤中的时变的增益因子在步骤S805中乘到滤波器增益上,这两种方法将得到同样的结果。
步骤S807、利用QMF滤波器组将解码出的低带信号分量
Figure C20081008472500207
和整形后的高带信号分量
Figure C20081008472500208
(如果不执行步骤S806则为高带信号分量
Figure C20081008472500209
)进行合成滤波,即可重建出时变渐出的信号,满足从宽带平滑过渡到窄带的特性。
本实施例中,以噪音段的时变渐出处理采用方法二,即对扩展出的高带信息利用时变滤波进行频域整形,进一步可以对频域整形后的高带信息利用时域增益因子进行时域整形为例对本发明进行描述,可以理解的是,时变渐出处理还可以采用其他方法。本发明的实施例五中,以解码器接收到的编码码流为噪音段,且时变渐出处理采用方法四,即对扩展出的高带信息划分子带,对各个子带编码参数进行频域高带参数时变加权为例,一种音频解码的方法如图9所示,具体步骤如下:
步骤S901~步骤S903与实施例四中步骤S801~步骤S803一致,在此不再赘述。
步骤S904、利用切换前接收到的高带信号分量的编码参数(包括但不限于频域包络)扩展出高带编码参数。
对于缺失高带编码参数的噪音帧,采用镜像插值法估算出高带信号分量的合成参数。如果噪音帧采用连续编码传输技术,则以缓存区中缓存的最近M个帧(例如M=5)的高带编码参数(频域包络以及高带谱包络)为镜像源,可以利用公式(1)对发生宽带到窄带的切换后第k个帧高带编码参数进行重建;如果噪音帧采用非连续传输的技术,则以缓存区中缓存的最近2个帧包含高带编码参数(频域包络)的SID帧为镜像源,从当前帧开始,进行分段线性插值,可以利用式公式(3)对发生宽带到窄带的切换后第k个帧高带编码参数进行重建。
由于不同的编码算法中音频信号的高带编码参数的类型不同,上述扩展出的高带编码参数可能无法划分子带,此时需要对扩展出的高带编码参数解码扩展出高带信号分量,对扩展出的高带信号分量重新提取高带编码参数,进行频域整形。
步骤S905、对扩展出的高带编码参数解码扩展出高带信号分量。
步骤S906、对扩展出的高带信号分量利用TDBWE算法提取出频域包络,这些频域包络将整个高带信号分量划分成一系列互相没有交叠的子带。
步骤S907、采用频域高带参数时变加权法对提取出的频域包络进行频域整形,对频域整形后的频域包络解码得到处理后的高带信号分量。
具体的,利用提取出的频域包络进行时变加权处理,因为频域包络等效于将高带信号分量从频域上划分多个子带,将各个频域包络按不同的增益进行频域加权,从而可以使信号的频带缓慢变窄。解码器连续接收到含有高带编码参数的SID帧时,认为目前正处在宽带噪音信号阶段,宽带窄带切换标志位fad_out_flag置0,过渡帧数计数器fad_out_frame_count置0,当从某一时刻开始,解码器接收到的SID帧不包含宽带核心层,则解码器认为发生了宽带到窄带的切换,则宽带窄带切换标志位fad_out_flag置为1,当过渡帧数计数器fad_out_frame_count同时满足fad_out_frame_count<N条件时,则通过对频域的编码参数加权进行时变渐出处理,且加权因子随时间发生变化,其中N为过渡帧数(例如N=50)。
用公式(3)对发生宽带到窄带的切换后第k(k=0,…,N-1)个帧的高带编码参数进行重建,并将重建出的高带编码参数解码扩展出高带信号分量,对扩展出的高带信号分量利用TDBWE算法提取出频域包络
Figure C20081008472500221
(j=0,…,J-1,J为划分的子带数),将每个子带的频域包络按时变渐出的增益因子gain(k,j)进行加权,即
Figure C20081008472500222
即可得到频域上时变渐出的频谱包络。gain(k,j)的计算公式为:
gain ( k , j ) = max ( 0 , ( J - j ) × N - J × k ) J × N , k = 1 , . . . , N , j = 0 , . . . , J - 1
对时变渐出的TDBWE频域包络使用TDBWE解码算法进行解码即可获得处理后的时变渐出的高带信号分量。
步骤S908、利用QMF滤波器组将处理后的高带信号分量和解码出的低带信号分量
Figure C20081008472500224
进行合成滤波,可重建出时变渐出的信号。
以上实施例以解码器接收到的编码码流对应的语音段或噪音段由宽带向窄带切换为例对本发明进行描述,可以理解的是,也可能会有以下两种情况:解码器接收到的编码码流对应的语音段由宽带向窄带切换,且切换后解码器仍然能够接收到编码码流对应的噪音段;或解码器接收到的编码码流对应的噪音段由宽带向窄带切换,且切换后解码器仍然能够接收到编码码流对应的语音段。
本发明实施例六中,以解码器接收到的编码码流对应的语音段由宽带向窄带切换,切换后解码器仍然能够接收到编码码流对应的噪音段,且时变渐出处理采用方法三,即利用频域高带参数时变加权方法对扩展出的高带信息进行频域整形为例,一种音频解码的方法如图10所示,具体步骤如下:
步骤S1001、解码器接收到编码器发送的编码码流,确定接收到的编码码流的帧结构。
具体的,编码器采用图1所示系统框图的流程对音频信号进行编码,将编码码流发送给解码器,解码器接收到编码码流,如果编码码流对应的音频信号未发生由宽带到窄带的切换,解码器采用图2所示的系统框图的流程对接收到的编码码流进行正常解码,在此不再赘述。本实施例中解码器接收到的编码码流包括语音段和噪音段,其中语音段中的语音帧采用表1所示的全速率语音帧的帧结构,噪音段中的噪音帧采用表2所示的全速率噪音帧结构。
步骤S1002、解码器根据编码码流的帧结构检测是否发生了由宽带向窄带的切换,如果发生了切换,转步骤S1003,否则,按照正常的解码流程对编码码流进行解码并输出重建后的音频信号。
步骤S1003、当接收到的编码码流对应的语音信号由宽带向窄带的切换时,解码器对接收到的低带编码参数利用嵌入式CELP解码,解码出低带信号分量
Figure C20081008472500231
步骤S1004、利用人工频带扩展技术,将低带信号分量
Figure C20081008472500232
扩展出高带编码参数。
在发生宽带到窄带的切换时,缓存区中存储的音频信号可能与切换后接收到的音频信号的类型相同或不同,可能存在以下五种情况:
(1)缓存区中存储的都是噪音帧的高带编码参数(即只有TDBWE的频域包络,而没有TDAC的高带包络),发生切换后接收到的帧都是语音帧;
(2)缓存区中存储的都是噪音帧的高带编码参数(即只有TDBWE的频域包络,而没有TDAC的高带包络),发生切换后接收到的帧都是噪音帧;
(3)缓存区中存储的都是语音帧的高带编码参数(既有TDBWE的频域包络,也有TDAC的高带包络),发生切换后接收到的帧都是语音帧;
(5)缓存区中存储的都是语音帧的高带编码参数(既有TDBWE的频域包络,也有TDAC的高带包络),发生切换后接收到的帧都是噪音帧;
(6)缓存区中存储的既有语音帧的高带编码参数(既有TDBWE的频域包络,也有TDAC的高带包络),也有噪音帧的高带编码参数(只有TDBWE的频域包络,而没有TDAC的高带包络),发生切换后接收到的帧既有噪音帧也有语音帧。
其中情况(2)和情况(3),已经在上述实施例中进行了详细的描述,对于其余的三种情况,发生切换后,均可以按照公式(1)的方法重建高带编码参数。但是由于噪音帧的高带编码参数中没有TDAC的高带包络,因此,对于在语音段发生切换后却接收到噪音段的情况,不再重建高带编码参数,即均不再重建TDAC的高带包络,因为TDAC编码算法只是对TDBWE编码的一种增强,只用TDBWE的频域包络已经可以完全恢复出高带信号分量。换句话说,就是在启动本实施例方案的阶段(即切换发生后N帧内),对于语音帧均降速为14kb/s进行解码,直至完成整个时变渐出操作之后。对于发生切换后的第个k帧(k=1,…,N),重建出高带编码参数的频域包络
Figure C20081008472500241
(j=0,…,J-1,J=12)。
步骤S1005、采用频域高带参数时变加权方法对扩展出的高带编码参数进行频域整形,对整形后的高带编码参数解码,获得处理后的高带信号分量。
具体的,在频域整形时,将高带信号从频域上划分多个子带,再将各子带或表征各个子带的高带编码参数按不同的增益进行频域加权,使信号的频带缓慢变窄。语音帧中使用的TDBWE编码算法中的频域包络或者对于噪音帧宽带核心层中的频域包络,都隐含着把高带划分成一定数量的子带的过程。解码器接收到含有高带编码参数的音频信号(包括含有宽带核心层的SID帧和14kb/s及更高速率的语音帧),宽带窄带切换标志位fad_out_flag置0,过渡帧数计数器fad_out_frame_count置0,当从某一时刻开始,解码器接收到的音频信号不包含高带编码参数(即SID帧中没有宽带核心层或者低于14kb/s的语音帧),则解码器认为发生了宽带到窄带的切换,则宽带窄带切换标志位fad_out_flag置为1,当过渡帧数计数器fad_out_frame_count同时满足fad_out_frame_count<N条件时,则通过对频域的编码参数加权进行时变渐出处理,且加权因子随时间发生变化,其中N为过渡帧数(例如N=50)。
J个频域包络将高带信号分量分成J个子带,将每个频域包络按时变的增益因子gain(k,j)进行加权,即
Figure C20081008472500242
即可得到频域上时变渐出的频谱包络,其中gain(k,j)的计算公式为:
gain ( k , j ) = max ( 0 , ( J - j ) × N - J × k ) J × N , k = 1 , . . . , N , j = 0 , . . . , J - 1
对处理后的TDBWE频域包络使用TDBWE解码算法进行解码即可获得处理后的时变渐出的高带信号分量。
步骤S1006、利用QMF滤波器组将处理后的高带信号分量和解码出的低带信号分量
Figure C20081008472500251
进行合成滤波,可重建出时变渐出的信号。
本发明实施例七中,以解码器接收到的编码码流对应的噪音段由宽带向窄带切换,切换后解码器仍然能够接收到编码码流对应的语音段,且时变渐出处理采用方法三,即利用频域高带参数时变加权方法对扩展出的高带信息进行频域整形为例,一种音频解码的方法如图11所示,具体步骤如下:
步骤S1101~步骤S1102与实施例六中步骤S1001~步骤S1002一致,在此不再赘述。
步骤S1103、当接收到的编码码流对应的噪音信号由宽带向窄带的切换时,解码器对接收到的低带编码参数利用嵌入式CELP解码,解码出低带信号分量
Figure C20081008472500252
步骤S1104、利用人工频带扩展技术,将低带信号分量
Figure C20081008472500253
扩展出高带编码参数。
步骤S1105、采用频域高带参数时变加权方法对扩展出的高带编码参数进行频域整形,对整形后的高带编码参数解码,获得处理后的高带信号分量。
具体的,在频域整形时,将代表各个子带的高带编码参数按不同的增益进行频域加权,使信号的频带缓慢变宽。解码器接收到含有宽带编码参数的音频信号(包括含有宽带核心层的SID帧和14kb/s及更高速率的语音帧),宽带窄带切换标志位fad_out_flag置0,过渡帧数计数器fad_out_frame_count置0,当从某一时刻开始,解码器接收到的音频信号不包含宽带编码参数(即SID帧中没有宽带核心层或者低于14kb/s的语音帧),则解码器认为发生了宽带到窄带的切换,则宽带窄带切换标志位fad_out_flag置为1,当过渡帧数计数器fad_out_frame_count同时满足fad_out_frame_count<N条件时,则通过对频域的编码参数加权进行时变渐出处理,且加权因子随时间发生变化,其中N为过渡帧数(例如N=50)。
在本实施例中,发生切换时,缓存区中存储的都是噪音帧的宽带编码参数(即只有TDBWE的频域包络,而没有TDAC的高带包络),发生切换后收到的帧既有噪音帧也有语音帧。发生切换后,需要按照式(1)的方法重建实施本实施例的方案持续时间内的高带编码参数,但是由于噪声的高带编码参数中没有语音帧中需要的TDAC的高带包络参数,因此对于接收到的语音帧在重建高带编码参数时,均不再重建TDAC的高带包络,因为TDAC编码算法只是对TDBWE编码的一种增强,只用TDBWE的频域包络已经可以完全恢复出高带信号分量。换句话说,就是在启动本实施例方案的阶段(即切换发生后N帧内),对于语音帧均降速为14kb/s进行解码,直至完成整个时变渐出操作之后。对于发生切换后的第个k帧(k=1,…,N),重建出的高宽带编码参数是频域包络(j=0,…,J-1,J=12)将高带分量分成J个子带,将每个子带按时变渐出的增益因子gain(k,j)进行加权,即
Figure C20081008472500262
即可得到频域上时变渐出的频谱包络,其中gain(k,j)的计算公式为:
gain ( k , j ) = max ( 0 , ( J - j ) × N - J × k ) J × N , k = 1 , . . . , N , j = 0 , . . . , J - 1
对处理后的TDBWE频域包络使用TDBWE解码算法进行解码即可获得时变渐出的高带信号分量。
步骤S1106、利用QMF滤波器组将处理后的高带信号分量和解码出的窄带信号分量
Figure C20081008472500264
进行合成滤波,即可重建出时变渐出的信号。
本发明实施例八中,以解码器接收到的编码码流对应的语音段由宽带向窄带切换,切换后解码器仍然能够接收到编码码流对应的噪音段,且时变渐出处理采用方法三的简化方法,一种音频解码的方法如图12所示,具体步骤如下:
步骤S1201~步骤S1202与实施例六中步骤S1001~步骤S1002一致,在此不再赘述。
步骤S1203、当接收到的语音信号由宽带向窄带的切换时,解码器对接收到的低带编码参数利用嵌入式CELP解码,解码出低带信号分量
Figure C20081008472500265
步骤S1204、利用人工频带扩展技术,将低带信号分量
Figure C20081008472500266
扩展出高带编码参数。
在发生宽带到窄带的切换时,缓存区中存储的音频信号可能与切换后接收到的音频信号的类型相同或不同,包括如实施例六中所述五种情况,其中情况(2)和情况(3),已经在上述实施例中进行了详细的描述,对于其余的三种情况,发生切换后,均可以按照公式(1)的方法重建高带编码参数。但是由于噪音的高带编码参数中没有TDAC的高带包络,因此对于重建的编码参数,均不再重建TDAC的高带包络,而只是重建TDBWE算法中的频域包络因为TDAC编码算法只是对TDBWE编码的一种增强,只用TDBWE的频域包络已经可以完全恢复出高带信号分量。换句话说,就是在启动本发明方案的阶段(即切换发生后COUNTfad_out帧内),对于语音帧均降速为14kb/s进行解码,直至完成整个时变渐出操作之后。对于发生切换后的第k帧(k=0,…,COUNTfad_out-1),重建出的高带编码参数是频域包络
Figure C20081008472500272
(j=0,…,J-1)将高带信号分量分成J个子带。
步骤S 1205、利用简化的方法对扩展出的高带编码参数进行频域整形,对整形后的高带编码参数解码,获得处理后的高带信号分量。
在频域整形时,重建出的频域包络
Figure C20081008472500273
将高带信号从频域上划分J个子带。当宽带窄带切换标志位fad_out_flag为1,并且过渡帧数计数器fad_out_frame_count同时满足fad_out_frame_count<COUNTfad_out条件时,则对于切换后第k个帧重建出的频域包络按照公式(4)或公式(5)或公式(6)进行时变渐出处理:
Figure C20081008472500274
Figure C20081008472500275
Figure C20081008472500281
其中
Figure C20081008472500282
表示不超过x的最大整数。对处理后的TDBWE频域包络使用TDBWE解码算法即可获得时变渐出的高带信号分量。LOW_LEVEL是频域包络在量化表中可能的最小值,例如:频域包络(j=0,…3)采用分级量化技术,第一级码本为:
Figure C20081008472500284
第二级量化码本为:
Figure C20081008472500285
Figure C20081008472500291
F ^ env ( j ) = l 1 ( j ) + l 2 ( j ) , 其中l1(j)为第一级的量化矢量,l2(j)为第二级的量化矢量。因此,在本实施例中,
Figure C20081008472500293
的最小值为-3.0000+(-12.95541)=-15.95541。进一步,在实际使用时,该最小值可以简化为选择一个足够小的值即可。
但需要进一步指出的是,上述
Figure C20081008472500294
的确定方法为本发明的优选实施例,在实际应用中,可以根据技术需要,将数值进行简化或用其他符合技术要求的数值代替,以上的变化同样属于本发明的保护范围。
步骤S1206、利用QMF滤波器组将处理后的高带信号分量和已经解码重建出的低带信号分量进行合成滤波,即可重建出时变渐出的信号。
本发明不仅适用于较宽带到较窄带的切换,还适用于超宽带到宽带的切换,以上描述的实施例中,对高带信号分量采用TDBWE或TDAC解码算法进行解码,需要说明的是,本发明也适用于除了TDBWE和TDAC解码算法以外的其他宽带编码算法;另外,对发生切换后扩展高带信号分量及高带编码参数的方法,也有不同的实现方法,在此不再赘述。
通过本发明实施例提供的方法,当音频信号发生了宽带到窄带的切换的时,可以利用带宽检测、人工频带扩展、时变渐出处理、以及带宽合成等一系列的处理,以实现切换能够平滑地从宽带信号过渡到窄带信号,从而使人耳获得较为舒适的听觉感受。
本发明的实施例九中,一种音频解码的装置如图12所示,包括:
获取单元10,用于当接收到的编码码流对应的音频信号由较宽带宽向较窄带宽切换时,获取音频信号的低带信号分量,并发送给扩展单元20。扩展单元20,用于将低带信号分量扩展出高带信息,并将扩展出的高带信息发送给时变渐出处理单元30。时变渐出处理单元30,用于对扩展出的高带信息进行时变渐出处理,得到处理后的高带信号分量,并将处理后的高带信号分量发送给合成单元40。合成单元40,用于将接收到的处理后的高带信号分量和获取单元10获取的低带信号分量进行合成。
本装置还包括:处理单元50,用于确定接收到的编码码流的帧结构,并将编码码流的帧结构发送给检测单元60。检测单元60,用于根据处理单元50发送的编码码流的帧结构检测是否发生了由较宽带宽向较窄带宽的切换,如果发生了由较宽带宽向较窄带宽的切换,将编码码流发送给获取单元10。
具体的,扩展单元20进一步包括下列子单元中的至少一个:第一扩展子单元21、第二扩展子单元22、第三扩展子单元23。第一扩展子单元21,用于利用切换前接收到的高带信号分量的编码参数将低带信号分量扩展出高带编码参数。第二扩展子单元22,用于利用切换前接收到的高带信号分量的编码参数将低带信号分量扩展出高带信号分量。第三扩展子单元23,用于利用切换后当前音频帧解码出的低带信号分量扩展出高带信号分量。
时变渐出处理单元30进一步包括下列子单元中的至少一个:分离处理子单元31、混合处理子单元32。分离处理子单元31,用于当扩展出的高带信息为高带信号分量时,对扩展出的高带信号分量进行时域整形和/或频域整形,并将处理后的高带信号分量发送给合成单元40。混合处理子单元32,用于当扩展出的高带信息为高带编码参数时,对扩展出的高带编码参数进行频域整形;或当扩展出的高带信息为高带信号分量时,对扩展出的高带信号分量划分子带,对各个子带编码参数进行频域整形,并将处理后的高带信号分量发送给合成单元50。
分离处理子单元31进一步包括下列子单元中的至少一个:第一子单元311、第二子单元312、第三子单元313、第四子单元314。第一子单元311,用于对扩展出的高带信号分量利用时域增益因子进行时域整形,将处理后的高带信号分量发送给合成单元40。第二子单元312,用于对扩展出的高带信号分量利用时变滤波进行频域整形,将处理后的高带信号分量发送给合成单元40。第三子单元313,用于对扩展出的高带信号分量利用时域增益因子进行时域整形,并对时域整形后的高带信号分量利用时变滤波进行频域整形,将处理后的高带信号分量发送给合成单元40。第四子单元314,用于对扩展出的高带信号分量利用时变滤波进行频域整形,并对频域整形后的高带信号分量利用时域增益因子进行时域整形,将处理后的高带信号分量发送给合成单元40。
混合处理子单元32进一步包括下列子单元中的至少一个:第五子单元321、第六子单元322。第五子单元321,用于当扩展出的高带信息为高带编码参数时,利用频域高带参数时变加权方法对扩展出的高带编码参数进行频域整形,得到时变渐出的频谱包络,解码得到高带信号分量,并将处理后的高带信号分量发送给合成单元40。第六子单元322,用于当扩展出的高带信息为高带信号分量时,对扩展出的高带信号分量划分子带,对各个子带编码参数进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到高带信号分量,并将处理后的高带信号分量发送给合成单元40。
通过上述实施例提供的装置,当音频信号发生了宽带到窄带的切换的时,可以利用带宽检测、人工频带扩展、时变渐出处理、以及带宽合成等一系列的处理,以实现切换能够平滑地从宽带信号过渡到窄带信号,从而使人耳获得较为舒适的听觉感受。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该获取机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (12)

1、一种音频信号的解码方法,其特征在于,包括以下步骤:
当接收到的编码码流对应的音频信号由较宽带宽向较窄带宽切换时,获取所述音频信号的低带信号分量;
扩展出高带信息,将所述扩展出的高带信息进行时变渐出处理,得到处理后的高带信号分量,所述时变渐出处理包括对所述扩展出的高带信息进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到高带信号分量;
将所述处理后的高带信号分量和所述获取的低带信号分量进行合成。
2、如权利要求1所述音频信号的解码方法,其特征在于,所述当接收到的编码码流对应的音频信号由较宽带宽向较窄带宽切换时,获取所述音频信号的低带信号分量之前还包括:
确定接收到的所述编码码流的帧结构,根据所述帧结构检测是否发生了由较宽带宽向较窄带宽的切换。
3、如权利要求1所述音频信号的解码方法,其特征在于,所述扩展出高带信息的方法具体为:
利用切换前接收到的高带信号分量的编码参数扩展出高带信息;或
利用切换后当前音频帧解码出的低带信号分量扩展出高带信号分量。
4、如权利要求3所述音频信号的解码方法,其特征在于,利用切换前接收到的高带信号分量的编码参数扩展出的高带信息为高带编码参数或高带信号分量。
5、如权利要求3所述音频信号的解码方法,其特征在于,所述利用切换前接收到的高带信号分量的编码参数扩展出高带信息的方法具体为:
缓存切换前接收到的音频帧的高带编码参数,切换后利用外插估算出当前音频帧的高带编码参数。
6、如权利要求3所述音频信号的解码方法,其特征在于,所述利用切换前接收到的高带信号分量的编码参数扩展出高带信息的方法具体为:
缓存切换前接收到的音频帧的高带编码参数,切换后利用外插估算出当前音频帧的高带编码参数,对所述外插出的高带编码参数利用相应的宽带解码算法扩展出高带信号分量。
7、如权利要求1所述音频信号的解码方法,其特征在于,所述扩展出的高带信息进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到高带信号分量包括:
所述高带信息为高带编码参数时,利用频域高带参数时变加权方法对所述扩展出的高带编码参数进行频域整形,得到时变渐出的频谱包络,解码得到高带信号分量;或
所述高带信息为高带信号分量时,对所述扩展出的高带信号分量划分子带,对各个子带编码参数进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到高带信号分量。
8、一种音频信号的解码装置,其特征在于,包括:
获取单元,用于当接收到的编码码流对应的音频信号由较宽带宽向较窄带宽切换时,获取所述音频信号的低带信号分量;
扩展单元,用于扩展出高带信息,并将所述扩展出的高带信息发送给时变渐出处理单元;
时变渐出处理单元,用于对所述扩展出的高带信息进行时变渐出处理,得到处理后的高带信号分量,并将所述处理后的高带信号分量发送给合成单元,所述时变渐出处理包括对所述扩展出的高带信息进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到高带信号分量;
合成单元,用于将接收到的所述处理后的高带信号分量和所述获取单元获取的低带信号分量进行合成。
9、如权利要求8所述音频信号的解码装置,其特征在于,还包括:
处理单元,用于确定所述接收到的编码码流的帧结构,并将所述编码码流的帧结构发送给检测单元;
检测单元,用于根据所述处理单元发送的所述编码码流的帧结构检测是否发生了由较宽带宽向较窄带宽的切换,如果发生了由较宽带宽向较窄带宽的切换,将所述编码码流发送给所述获取单元。
10、如权利要求8所述音频信号的解码装置,其特征在于,所述扩展单元进一步包括第一扩展子单元、第二扩展子单元、第三扩展子单元中的至少一个,
所述第一扩展子单元,用于利用切换前接收到的高带信号分量的编码参数扩展出高带编码参数;
所述第二扩展子单元,用于利用切换前接收到的高带信号分量的编码参数扩展出高带信号分量;
所述第三扩展子单元,用于利用切换后当前音频帧解码出的低带信号分量扩展出高带信号分量。
11、如权利要求8所述音频信号的解码装置,其特征在于,所述时变渐出处理单元进一步包括混合处理子单元,
所述混合处理子单元,用于当所述扩展出的高带信息为高带编码参数时,对所述扩展出的高带编码参数进行频域整形;或当所述扩展出的高带信息为高带信号分量时,对所述扩展出的高带信号分量划分子带,对各个子带编码参数进行频域整形,并将处理后的高带信号分量发送给所述合成单元。
12、如权利要求11所述音频信号的解码装置,其特征在于,所述混合处理子单元进一步包括第五子单元、第六子单元中的至少一个,
所述第五子单元,用于当所述扩展出的高带信息为高带编码参数时,利用频域高带参数时变加权方法对所述扩展出的高带编码参数进行频域整形,得到时变渐出的频谱包络,解码得到高带信号分量,并将处理后的高带信号分量发送给所述合成单元;
所述第六子单元,用于当所述扩展出的高带信息为高带信号分量时,对所述扩展出的高带信号分量划分子带,对各个子带编码参数进行频域高带参数时变加权,得到时变渐出的频谱包络,解码得到高带信号分量,并将处理后的高带信号分量发送给所述合成单元。
CN200810084725A 2007-11-02 2008-03-14 一种音频解码的方法和装置 Active CN100585699C (zh)

Priority Applications (9)

Application Number Priority Date Filing Date Title
CN200810084725A CN100585699C (zh) 2007-11-02 2008-03-14 一种音频解码的方法和装置
KR1020107011060A KR101290622B1 (ko) 2007-11-02 2008-10-20 오디오 복호화 방법 및 장치
BRPI0818927-7A BRPI0818927A2 (pt) 2007-11-02 2008-10-20 Método e aparelho para a decodificação de áudio
PCT/CN2008/072756 WO2009056027A1 (fr) 2007-11-02 2008-10-20 Procédé et dispositif de décodage audio
EP08845741.1A EP2207166B1 (en) 2007-11-02 2008-10-20 An audio decoding method and device
JP2010532409A JP5547081B2 (ja) 2007-11-02 2008-10-20 音声復号化方法及び装置
EP13168293.2A EP2629293A3 (en) 2007-11-02 2008-10-20 Method and apparatus for audio decoding
US12/772,197 US8473301B2 (en) 2007-11-02 2010-05-01 Method and apparatus for audio decoding
JP2013141872A JP2013235284A (ja) 2007-11-02 2013-07-05 音声復号化方法及び装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN200710166745 2007-11-02
CN200710166745.5 2007-11-02
CN200710187437.0 2007-11-23
CN200810084725A CN100585699C (zh) 2007-11-02 2008-03-14 一种音频解码的方法和装置

Publications (2)

Publication Number Publication Date
CN101335002A CN101335002A (zh) 2008-12-31
CN100585699C true CN100585699C (zh) 2010-01-27

Family

ID=40197559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810084725A Active CN100585699C (zh) 2007-11-02 2008-03-14 一种音频解码的方法和装置

Country Status (1)

Country Link
CN (1) CN100585699C (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763859A (zh) * 2009-12-16 2010-06-30 深圳华为通信技术有限公司 音频数据处理方法、装置和多点控制单元
US8000968B1 (en) 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
CN101964189B (zh) 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
CN103209053B (zh) * 2010-09-08 2016-08-03 华为技术有限公司 一种信息比特发送方法、装置和系统
CN102404072B (zh) 2010-09-08 2013-03-20 华为技术有限公司 一种信息比特发送方法、装置和系统
HUE050600T2 (hu) * 2011-11-03 2021-01-28 Voiceage Evs Llc A nem-beszéd tartalom javítása alacsony sebességû CELP számára
CN105469805B (zh) * 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
CN105933030B (zh) * 2013-04-05 2018-09-28 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
CN105378831B (zh) 2013-06-21 2019-05-31 弗朗霍夫应用科学研究促进协会 针对切换式音频编码系统在错误隐藏过程中的改善信号衰落的装置及方法
CN104282308B (zh) 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
KR101864122B1 (ko) * 2014-02-20 2018-06-05 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법

Also Published As

Publication number Publication date
CN101335002A (zh) 2008-12-31

Similar Documents

Publication Publication Date Title
CN100585699C (zh) 一种音频解码的方法和装置
KR101290622B1 (ko) 오디오 복호화 방법 및 장치
CN101425292B (zh) 一种音频信号的解码方法及装置
JP6346322B2 (ja) フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
JP5551814B2 (ja) 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム
CN1957398B (zh) 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备
CN101390159B (zh) 识别和衰减变换编码生成的数字信号中回声的方法和设备
US8532998B2 (en) Selective bandwidth extension for encoding/decoding audio/speech signal
US8463603B2 (en) Spectral envelope coding of energy attack signal
KR101423737B1 (ko) 오디오 신호의 디코딩 방법 및 장치
CN101458930B (zh) 带宽扩展中激励信号的生成及信号重建方法和装置
KR20200062132A (ko) 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
CN101430880A (zh) 一种背景噪声的编解码方法和装置
CN109155133B (zh) 音频帧丢失隐藏的错误隐藏单元、音频解码器及相关方法
CN101622661A (zh) 一种数字语音信号的改进编解码方法
CN101379551A (zh) 在语音编解码器中用于有效帧擦除隐蔽的方法和装置
CN102934163A (zh) 用于宽带语音编码的系统、方法、设备和计算机程序产品
EP1141946A1 (en) Coded enhancement feature for improved performance in coding communication signals
US9589570B2 (en) Audio classification based on perceptual quality for low or medium bit rates
CN100555414C (zh) 一种dtx判决方法和装置
CN106575505A (zh) Fd/lpd转换环境中的帧丢失管理
CN102460574A (zh) 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备
US20090299755A1 (en) Method for Post-Processing a Signal in an Audio Decoder

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant