CN101178898B

CN101178898B - 频带扩展装置及方法、播放装置及方法

Info

Publication number: CN101178898B
Application number: CN2007101662536A
Authority: CN
Inventors: 光藤祐基; 知念徹; 本间弘幸; 牧野坚一
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2006-11-09
Filing date: 2007-11-07
Publication date: 2011-11-02
Anticipated expiration: 2027-11-07
Also published as: CN101178898A; JP2012083790A; JP2008139844A; KR101430221B1; TWI377563B; JP5429309B2; JP5141180B2; TW200832358A; KR20080042696A

Abstract

一种用于在对输入信号进行带扩展之后播放该输入信号的播放装置包括：扩展控制器，用于根据与输入信号相关的信息来确定输入信号的扩展开始带；以及带划分器，用于将输入信号划分为多个子带信号。在通过带划分器对输入信号进行带划分而得到的多个子带信号之中，基于低于扩展开始带一侧上的多个子带信号扩展频带。

Description

频带扩展装置及方法、播放装置及方法

相关申请的交叉参考

本申请包含与2006年11月9日向日本专利局提交的日本专利申请JP 2006-304501和2007年10月22日提交的JP 2007-274091相关的主题，其全部内容结合于此作为参考。

技术领域

本发明涉及频带扩展装置、频带扩展方法、播放装置、播放方法、用于使计算机执行再生处理的程序、以及其上记录有程序的记录介质，它们都能够以较高音质播放在删除高频带之后对其进行编码的编码数据。

背景技术

近年来，提供诸如MP3(国际标准ISO/IEC 11172-3，MPEG音频层3)的编码数据的音乐分发服务日益流行。在大多数这些服务中，分配其比特率降低的编码数据，从而不会浪费下载数据的时间。

通常通过删除属于人耳几乎听不到的15kHz或更高的高频带的信号分量来对低比特率的编码数据进行编码。结果，使文件大小变小。然而，高频带信号的删除导致诸如由原始信号另外提供的“真实性”损失和消音的问题。

为了解决这些问题，在诸如HE-AAC(国际标准ISO/IEC14496-3，高效MPEG4 AAC)的编码系统中，带扩展技术用于生成属于约15kHz或更高的较高频带的信号分量，从而再生接近于原始信号的较高频率分量。此外，近年来，后处理带扩展技术等用于再生接近于原始信号的较高频率分量。在这种技术中，输入通过使数据经过解码处理而获得的信号，并内插较高频带，其中，通过删除属于较高频带的信号分量来对该数据进行编码。

例如，在日本专利申请公开第JP 2004-184472号(专利参考文献1)所提出的技术中，通过将输入信号与局部振荡信号混合产生高频带信号，并通过添加输入信号和利用取决于编码系统或音乐类型的通带特性过滤的较高频率分量来内插频带。在日本专利申请公开第JP 2002-175092号(专利参考文献2)所提出的技术中，为了附加较高频带信号分量，通过傅立叶变换将输入信号变换到频域，根据低频带的频谱估计较高频带的包络，调整低频带的频谱增益以适合该包络。

发明内容

然而，在专利参考文献1所提出的技术中，存在对预先了解的高通滤波器的通带特性类型的限制，使得不能获得对于较高频带的增益调整的灵活性。此外，在专利参考文献2所提出的技术中，对输入信号进行傅立叶变换以在频域中对其幅值进行调整，然后，对合成信号进行傅立叶逆变换以获得时域信号。然而，该技术产生了取决于傅立叶变换长度的时域图形失真的问题。

此外，在日本专利第3538122号(专利参考文献3)中，通过使用带划分滤波器来避免这些问题。图10是在专利参考文献3中提出的现有技术的播放装置的框图。在该技术中，在带划分部101中，将输入的PCM(脉冲编码调制)信号分解成多个子带信号。随后，在包络估计部102中，估计基于帧的频率包络，以及在高频带生成部103中，生成属于较高频带的子带信号。最后，将经带扩展的子带信号提供给带合成部104，并输出经带扩展的PCM信号。

然而，在专利参考文献3中提出的上述技术产生了三个问题。第一，由于以特定数量的帧为单位进行处理，所以不生成遵循在输入信号的单个帧内的时间波动的较高频带信号。第二，当输入极大的信号时，相应地，计算得到的较高频带信号也非常大，使得来自带合成滤波器的输出可能溢出。第三，在后处理带扩展技术中(其中，输入通过对编码数据进行解码而得到的信号并内插高频带)，用于带扩展的扩展开始频带是未知的。

考虑到上述及其它问题，期望提供一种频带扩展装置、频带扩展方法、播放装置、播放方法、用于使计算机执行再生处理的程序、以及在其上记录程序的记录介质，它们都能够以更高音质播放通过删除属于较高频带的信号分量来对其进行编码的编码数据。

在本发明的一个实施例中，提供了一种用于扩展输入信号频带的频带扩展装置。该装置包括：扩展控制装置，用于确定输入信号的扩展开始带；以及带划分装置，用于将输入信号划分为多个子带信号。在频带扩展装置中，基于由带划分装置对输入信号进行带划分所得到的多个子带信号中低于扩展开始带一侧上的多个子带信号来扩展频带。

在本发明的另一实施例中，提供了一种用于扩展输入信号频带的频带扩展方法。该方法包括：根据与输入信号相关的信息来确定输入信号的扩展开始带；将输入信号划分为多个子带信号；以及基于在带划分步骤中对输入信号进行带划分所得到的多个子带信号之中低于扩展开始带一侧上的多个子带信号来扩展频带。

在本发明的另一实施例中，提供了一种用于在对输入信号进行带扩展之后播放输入信号的播放装置。该播放装置包括：扩展控制装置，用于根据与输入信号相关的信息来确定输入信号的扩展开始带；以及带划分装置，用于将输入信号划分为多个子带信号。在播放装置中，基于由带划分装置对输入信号进行带划分所得到的多个子带信号中低于扩展开始带一侧上的多个子带信号来扩展频带。

在本发明的另一实施例中，提供了一种用于在对输入信号进行带扩展之后播放输入信号的播放方法。该方法包括：根据与输入信号相关的信息来确定输入信号的扩展开始带；将输入信号划分为多个子带信号；以及基于在带划分步骤中对输入信号进行带划分所得到的多个子带信号中低于扩展开始带一侧上的多个子带信号来扩展频带。

在本发明的另一实施例中，提供了一种用于使计算机执行在对输入信号进行带扩展之后播放输入信号的处理的程序。该程序包括：扩展控制步骤，根据与输入信号相关的信息来确定输入信号的扩展开始带；带划分步骤，将输入信号划分为多个子带信号；以及频带扩展步骤，基于在带划分步骤中对输入信号进行带划分所得到的多个子带信号中低于扩展开始带一侧上的多个子带信号来扩展频带。

在本发明的另一实施例中，提供了一种在其上记录用于使计算机执行在对输入信号进行带扩展之后播放输入信号的处理的程序的记录介质。该程序包括：扩展控制步骤，确定输入信号的扩展开始带；带划分步骤，将输入信号划分为多个子带信号；以及频带扩展步骤，基于在带划分步骤中对输入信号进行带划分所得到的多个子带信号中低于扩展开始带一侧上的多个子带信号来扩展频带。

根据本发明的上述实施例，可以确定输入信号的扩展开始带，并可基于低于扩展开始带一侧上的多个子带信号扩展频带。从而，可以再生较高音质的输入信号。

附图说明

图1是示出了根据实施例的频带扩展装置配置的框图；

图2是示出了辅助信息(side information)和扩展开始频带“sb”之间关系的图表；

图3是示出了在代码严重劣化的情况下频率-振幅特性的示图；

图4是示出了用于确定用于过渡检测的子带的处理流程的流程图；

图5A和图5B是分别示出了基于不同平均方法的包络基准值的示意图；

图6是示出了用于计算基于加权平均的包络基准值的处理流程的流程图；

图7是示出了用于限制包络基准值的处理流程的流程图；

图8A和图8B是均示出了如何限制包络基准值的示意图；

图9是示出了如何对低域子带信号和高域子带信号进行相位调整的示意图；以及

图10是示出了根据现有技术的频带扩展装置配置的框图。

具体实施方式

以下，将参照附图详细描述本发明的具体实施例。这些实施例能够播放具有较高音质的输入信号。

图1是示出了根据实施例的频带扩展装置10的配置的框图。频带扩展装置10包括扩展控制部11、带划分部12、时间分类部13、包络估计部14、带内插部15、高频生成部16、相位调整部17、以及带合成部18。

将与输入信号相关的辅助信息(例如，编码系统的类型、采样率、和比特率)提供给扩展控制部11，该扩展控制部11基于该辅助信息确定扩展开始频带，并将确定的扩展开始频带提供给带划分部12。可选地，辅助信息可以是根据输入信号的编码系统类型而预先设定的值，或者可以是用户指定的任意值。

带划分部12将输入信号划分为多个子带信号。随后，带划分部12将在生成的多个子带信号中的低于扩展开始频带一侧上的多个子带信号(在下文中，称为“低域子带信号”)提供给带合成部18。此外，带划分部12将在多个低域子带信号中接近扩展开始频带一侧上的多个子带信号(在下文中，称为扩展低域子带信号)提供给时间分类部13和高频生成部16。

时间分类部13在时间方向上对扩展低域子带信号执行过渡检测，在时间方向上将扩展低域子带信号分组，为每组扩展低域子带信号生成平均采样功率，并将平均采样功率提供给包络估计部14。

包络估计部14从在时间分类部13处生成的平均采样功率的总和中获得每个组的组功率，并计算全部扩展低域子带信号的组功率的平均值。随后，利用作为开始点的组功率平均值，估计等于扩展开始频带或在高于扩展开始频带一侧的子带的包络值，并将估计的包络值提供给带内插部15。

带内插部15根据高域侧上子带的包络值和低域侧上子带的包络值来计算从扩展低域子带信号到高域侧上子带信号的增益调整值，并将计算的增益调整值提供给高频生成部16。

高频生成部16将高域侧上子带信号的增益调整值与扩展低域子带信号相乘以生成高域侧上的子带信号，并将高域侧上的生成的子带信号提供给相位调整部17。

相位调整部17移动由高频生成部16生成的高域侧上的子带信号的相位，并将相移后的高域侧上的子带信号提供给带合成部18。

带合成部18将从相位调整部17向其提供的高域侧上的子带信号的带与从带划分部向其提供的低域子带信号进行合成，并输出合成的带扩展信号。

通过以这种方式使用与输入信号相关的辅助信息，可以非常准确地确定带扩展的扩展开始频带。此外，由于基于接近扩展开始频带的扩展低域子带信号生成了在高于扩展开始频带一侧上的子带信号，所以可以以较高音质扩展频带。此外，通过移动所生成的高域侧上子带信号的相位，可以防止溢出。

以下，将更详细地描述上述频带扩展装置的各个部件。

扩展控制部

扩展控制部11基于与输入信号相关的辅助信息确定扩展开始频带。辅助信息包括编码系统的类型、采样率、和比特率。可选地，辅助信息可以是根据输入信号的编码系统类型预先设定的值，或者可以是用户指定的任意值。

通常，输入信号所属的频带与各种辅助信息(例如，编码系统的类型、采样率、和比特率)相关。因此，在本实施例中，通过使用该辅助信息估计输入信号所属的频带，并确定用于内插频带的扩展开始频带sb。将确定的扩展开始频带sb提供给带划分部12。

图2是示出了辅助信息和扩展开始频带sb之间关系的图表。图2所示的实例是将输入信号所属的频带划分为十六个子带的情况。根据编码系统、采样率、和比特率确定扩展开始频带sb(sb是从0到15范围内的任一常数)。例如，假定辅助信息表示编码系统为B，采样率为44100Hz，以及比特率为64～96kps，则确定扩展开始频带sb为9。用于确定辅助信息的因素可以包括立体声/单声道、CBR/VBR等之间的差别。

带划分部

带划分部12将输入信号x(n)划分为十六个子带信号x(ib，n)(ib＝0～15，其中，较大的ib表示较高域的子带信号)。在这十六个子带信号x(ib，n)中，带划分部12将属于从子带0到子带sb-1的范围内的子带(其是在扩展开始频带(在下文中称作“sb”)之前的一个子带)的子带信号x(ib，n)提供给带合成部18，并且也将属于从sb-4到sb-1的子带的子带信号x(ib，n)提供给时间分类部13和高频生成部16。

在本实施例中描述了将输入信号x(n)划分为十六个子带信号x(ib，n)。然而，输入信号被划分成的子带数量不限于此。

时间分类部

时间分类部13每当其在时间方向上检测到诸如声音升高或降低的过渡时就将信号分成不同组，并对每个组内插高频带。利用这种布置，可以防止具有不稳定状态和稳定状态以及具有不同的增益和频率特性的自然环境中声音信号的音质恶化。同时，在专利参考文献3所公开的技术中，执行帧处理，并以帧为单位执行处理以内插高频带。即，利用该技术，在没有将自然环境中的声音信号从自然环境中分离出来也没有考虑时间波动的情况下，也可以内插高频带。因此，这可能使音质恶化。

·时间划分和功率包络的计算

将由带划分部12提供的低域侧上的从sb-4到sb-1的子带信号x(ib，n)用作输入。将子带信号x(ib，n)中的每一个都划分为十六个段，每一段都是被称为时隙(slot)的单位。随后，对每个时隙计算每次采样的平均采样功率power(ib，islot)。将每个时隙的采样数设定为八。

[公式1]

power (ib, islot) = \frac{1}{8} Σ_{n = 0}^{n < 8} (x (ib, islot * 8 + n) * x (ib, islot * 8 + n)) - - - (1)

islot＝0，1，2…15 (islot：当前时隙)

·通过过渡检测进行分组

在低域侧上从sb-4到sb-1的子带信号中，在时间方向上(沿着时间轴前后)比较所有十六个时隙中的每一个的平均采样功率power(ib，islot)，以执行用于检测升高或降低的过渡检测。本文中所使用的术语“过渡检测”是指平均采样功率在时间方向上出现较大波动的位置的检测。

计算搜索中时隙的平均采样功率与在搜索中时隙之前的时隙的平均采样功率power(ib，islot-1)的比率。随后，通过将比率大于等于16倍的情况判断为升高，以及将比率小于等于1/16(＝0.0625)倍的情况判断为降低，从过去时间检测到过渡的时隙开始到与检测到当前过渡的时隙紧接的时隙的时隙形成为单个组。

当在某个子带ib中检测到上升或降低时，假设在低域侧上从sb-4到sb-1的所有子带信号中都检测到上升或降低。

[公式2]

ratio (ib, islot) = \frac{power (ib, islot)}{power (ib, islot - 1)} - - - (2)

(islot：当前时隙)

结果，在考虑到时间波动的情况下进行分组，使得可以生成更接近于自然环境中的声音信号的高频带分量，因此产生较高质量的声音。

在该实施例中，在时间方向上将由带划分部提供的低域侧上从sb-4到sb-1的子带信号x(ib，n)中的每一个划分为十六个段，每个段是被称为时隙的单位。然而，在时间方向上的划分数量不限于此。此外，尽管单个时隙包括八个采样，但是时间方向上的划分数量和单个时隙中的采样数量不限于此。此外，虽然将过渡检测的比率大于等于16倍的情况判断为升高，以及将比率小于等于1/16(＝0.0625)倍的情况判断为降低，但可以响应于带划分的数量、时间方向上的划分数量等，来改变用于检测上升或降低的阈值16和1/16(＝0.0625)。

·确定过渡检测的子带

在遭受代码劣化的编码信号的组中，时间波动的精确性取决于经过过渡检测的低域子带信号的劣化程度。图3是示出了在代码严重劣化的情况下的频率-振幅特性的示图。如图3所示，严重代码劣化“a”被视作在频率轴上的孔，并且时间分类部13将孔解释为信号的衰减状态。因此，存在即使在不存在过渡现象的原始信号中的位置处，时间分类部13也能错误地检测到过渡现象的问题。结果，由于分组的精确性的降低而使音质降低，另外，由于这种过渡检测而使计算量增加。

考虑到这些问题，在本实施例中，比较每个子频带的平均采样功率的最大值，以判断是否需要对子带进行过渡检测。此后，执行实际的过渡检测。另外，在所有子带都包括极小的信号的情况下，不执行过渡检测，以防止由于拾取了不可听范围内的时间波动而增加计算量。

图4是示出了用于确定过渡检测的子带的处理流程的流程图。

在步骤S41至S43中，在低域侧上从sb-4到sb-1的四个子带信号中的每一个中，搜索其全部十六个时隙的平均采样功率power(ib，islot)的最大值，并将该最大值设定为该子带的代表值maxpower(ib)。

在步骤S44中，在分别对低域侧上的四个子带获得的四个代表值max power(ib)(ib＝sb-4，sb-3，sb-2，sb-1)中，将具有最大值的子带设定为父子带pb，并将剩余的子带设定为子子带cb(0)、 cb(1)、cb(2)。将父子带的代表值设定为max power(pb)(步骤S45)。

如果在步骤S46中判断父子带的代表值max power(pb)等于其不小于基于16位全标度基准(full scale reference)的-80[dBFs]的等级，则过程前进至步骤S47。

另一方面，如果父子带的代表值max power(pb)等于其小于基于16位全标度基准的-80[dBFs]的等级，则不对低域侧上四个子带中的任一个执行在时间方向上基于过渡检测的分组。这意味着不存在用于过渡检测的子带(步骤S48)。因此，跳过对任何小信号的过渡检测，从而防止了不必要的计算量的增加。

如果在步骤S47中判断max power(ib)等于或大于-80[dBFs]，以及相对于父子带pb的代表值max power(pb)来说，某个子子带cb(m)的代表值max power(cb(m))等于该值的小于0.0015625倍，则过程前进至步骤S49，其中，完全不对该子带执行过渡检测。

另一方面，如果max power(ib)等于或大于-80[dBFs]，以及相对于父子带pb的代表值max power(pb)来说，某个子子带cb(m)的代表值max power(cb(m))等于或大于0.001 5625倍，则处理前进至步骤S50，以对该子带执行过渡检测。在用于过渡检测的目标子带中也包括父子带pb。

[公式3]

ratio = \frac{power (cb (m))}{power (pb)} - - - (3)

结果，通过防止代码劣化引起的时间波动的错误检测以及通过再生更接近于自然声音信号的时间包络，可以再生较高质量的声音。在时间分类部13中所生成的低域侧sb-4至sb-1上的四个子带ib的平均采样功率power(ib，islot)被提供给包络估计部14。

应该注意，在本实施例中，不对具有低于0.0015625倍的过渡检测率的子带执行过渡检测。然而，可以响应于带划分数量、时间方向上的划分数量等，来改变过渡检测的阈值0.0015625。包络估计部

包络估计部14首先根据在时间分类部13生成的平均采样功率power(ib，islot)的总和中获得每组的组功率，并计算低域侧上从sb-4到sb-1的子带信号的组功率的平均值。随后，利用低域侧上这些子带的组功率平均值作为开始点，通过基于一阶直线的外插法估计高域侧上从sb到15的子带的包络值。当将包络值的一阶直线表示为ax+b时，通过基于后述的加权平均计算的包络基准值来获得基准点b，并通过后述的包络斜率值a_lev来获得斜率a。

·组功率的计算

包络估计部14将从时间分类部13向其提供的低域侧的四个子带ib(sb-4到sb-1)上的平均采样功率power(ib，islot)用作输入。在每个子频带ib中，对每组计算在每组中存在的与时隙nslot(ig)的数量一样多的平均采样功率power(ib，islot)的总和，并将该总和设定为组功率tpow(ib，ig)，其中，ig表示当前组，并且最多存在16个组。

[公式4]

tpow (ib, ig) = Σ_{islot = 0}^{islot < nslot (ig)} power (ib, islot) - - - (4)

·通过加权平均计算包络基准值

从通过公式4得到的各个组中的组功率tpow(ib，ig)，获得在低域侧上从sb-4到sb-1的全部子带信号的平均值。这里，通过使用加权平均以获得平均值从而将较大的权重分配给更接近于sb的子带，本实施例使得低域侧上的包络能够更平滑地连接到高域侧上的包络。

图5A和5B是分别示出了基于不同平均方法的包络基准值的示意图。这里，将描述对于于与剩余的子带的组功率相比，邻近sb的子带sb-1的组功率tpow(sb-1，ig)较小的情况，根据不同的平均方法得到的差值，如图5A和5B中所示。

如图5A所示，由于远离sb的剩余三个子带的组功率tpow(ib，ig)的大小的影响，使用每个均具有相等加权值的平均值，将根据平均值计算的基准点b计算成大值。结果，子带sb-1和子带sb并没有平滑连接，从而导致音质劣化。

另一方面，在本实施例中，图5B中所示，通过将较大权重分配给更接近于sb的子带来计算平均值，使得可以平滑地连接频率包络。

图6是示出了用于通过加权平均来计算包络基准值的处理流程的流程图。在步骤S61至步骤S63中，分别计算低域侧上从sb-4到sb-1的四个子带信号的组功率tpow(ib，ig)。随后，按照较接近于sb的子带的顺序以例如8∶4∶2∶1的比率对组功率tpow(ib，ig)执行加权平均(步骤S64)，以获得加权平均值w_avg(ig)(步骤S65)。

[公式5]

w_avg(ig)＝1/15*(8*tpow(sb-1，ig)

+4*tpow(sb-2，ig) (5)

+2*tpow(sb-3，ig)

+1*tpow(sb-4，ig))

(w_avg：加权平均值)

随后，利用低域侧上从sb-4至sb-1的四个子带信号中获得的加权平均值w_avg(ig)，估计子带sb的组功率。该值等于基准值b，并被称为“包络基准值fenv(ig)”。在本实施例中，通过与用户指示的包络基准调整值b_lev相乘来确定该值。即，不仅唯一地确定包络基准值，而且还提供用户可控制的包络基准调整功能。

[公式6]

fenv(ig)＝w_avg(ig)*b_lev (6)

在本实施例中，包络基准调整值b_lev的范围为从0.25到1.0(这两个值包括在该范围内)，或者可以由用户将其设定为该范围内任意值。在本实施例中，基于通过静态分析典型音乐数据而获得的频率包络，将包络基准调整值b_lev设定为0.5来作为推荐值。然而，可以响应于带划分数量、扩展开始频带sb等，来改变包络基准调整值b_lev的范围。

·包络基准值的限制

根据加权平均值w_avg(ig)或扩展强度e_lev，包络基准值fenv(ig)可为极其大的值。因此，当带合成部合成子带信号时，所得到的带合成输出信号很可能溢出。考虑到这种情况，在本实施例中，通过将限幅器应用于包络基准值fenv(ig)来防止输出信号的溢出，使得该值达不到极大值。

图7是示出了用于限制包络基准值的处理流程的流程图。同样，图8A和8B都示出了如何限制包络基准值的示意图。

在步骤S71中，如果包络基准值fenv(ig)大于阈值-6[dBFs](＝16384^2*nslot(ig))，则过程前进至步骤S72，以强制地将该值衰减到等于如图8B所示的阈值的等级。

另一方面，如果在步骤S71中判断包络基准值fenv(ig)小于等于阈值-6[dBFs](＝16384^2*nslot(ig))，则过程前进至步骤S73，以直接使用如图8A所示的包络基准值fenv(ig)。

应该注意，在本实施例中，将用于限制包络基准值fenv(ig)的阈值设定为-6[dBFs]。可选地，可影响应于带划分数量、扩展开始频带sb等来改变该值。

公式7

fenv(ig)＞16384^2*nslot(ig)…fenv(ig)＝16384^2*nslot(ig) (7)

fenv(ig)≤16384^2*nslot(ig)…fenv(ig)＝fenv(ig) (8)

·高域侧上包络值的确定

通过将斜率a与包络基准值fenv(ig)相乘来计算高域侧上从sb至15的子带的包络值env(ib，ig)。通过包络斜率值a_lev来确定斜率a。在本实施例中，不仅唯一地确定斜率，而且还提供了用户可控的包络斜率调整功能。

[公式8]

env(ib+1，ig)＝env(ib，ig)*a_lev(env(sb，ig)＝fenv(ig)) (9)

(a_lev：包络斜率值)

在本实施例中，包络斜率值a_lev的范围为从0.25至1.0(这两个值均包括在该范围内)，并可以由用户将其设定为该范围内的任意值。在本实施例中，基于通过静态分析典型音乐数据获得的频率包络，将包络斜率值a_lev设定为0.5来作为推荐值。然而，可以响应于带划分数量、扩展开始频带sb等，来改变包络斜率值a_lev的范围。

在低域子带中的包络值env(ib，ig)与组功率tpow(ib，ig)同义，并且将在低域侧上扩展带的组功率设定为低域侧上的包络值。

[公式9]

env(ib，ig)＝tpow(ib，ig) (ib＜sb) (10)

从时间分类部13提供的低域侧上从sb-4到sb-1的子带信号的包络值env(ib，ig)和从上述处理获得的高域侧上从sb到15的子带的包络值env(ib，ig)被提供给带内插部15。

带内插部

在带内插部15处，调整低域侧上从sb-4到sb-1的子带信号的增益，以内插高域侧上从sb到15的子带信号。由sb唯一地确定每对子带的映射图案。

[公式10]

sb_map (ib) = ib - 4 * INT (\frac{ib - sb}{4} + 1) - - - (11)

ib＝sb，sb+1，sb+2…15

通过找到由包络估计部14提供的高域侧上从sb到15中每个子带的包络值env(ib，ig)除以包含子带ib的源信号的从sb-4到sb-1的低域侧上每个子带sb_map(ib)的包络值env(sb_map(ib)，ig)所获得的商的平方根，来获得高域侧上从sb到15的子带的增益调整系数gain(ib，ig)。

[公式11]

gain (ib, ig) = \sqrt{\frac{env (ib, ig)}{env (sb_map (ib), ig)}} - - - (12)

(gain：增益调整系数)

随后，将从公式(12)获得的高域侧上从sb到15的子带的增益调整系数gain(ib，ig)提供给高频生成部16。

高频生成部

将来自带划分部12的低域侧上从sb-4到sb-1的子带信号x(ib，n)作为输入提供给高频生成部16，并且也将来自带内插部15的高域侧上从sb到15的子带的增益调整系数gain(ib，ig)提供给高频生成部16。通过将高域侧上从sb到15的子带的增益调整系数gain(ib，ig)与用作源信号的低域侧上从sb-4到sb-1的子带信号x(sb_map(ib)，n)相乘，获得高域侧上从sb到15的子带信号x(ib，n)。

[公式12]

x(ib，n)＝gain(ib，ig)*x(sb_map(ib)，n) (13)

随后，将从公式(13)获得的从sb到15的高域侧上的子带信号x(ib，n)提供给相位调整部17。

相位调整部

根据低域侧上从sb-4到sb-1的四个子带信号x(sb_map(ib)，n)生成由带内插部15提供的高域侧上从sb到15的子带信号x(ib，n)。因此，时域信号峰值在相同时刻出现在低域子带信号和高域子带信号中。如果通过具有在相同时刻出现的峰值的位置处进行合成来将所有子带加到一起，则在一些情况下可能在所得到的带合成输出信号中发生溢出。

考虑到上述原因，相位调整部17在移动其峰值之后将低域子带信号和高域子带信号提供给带合成部18，以防止这种溢出。

图9是示出了如何对低域子带信号和高域子带信号进行相位调整的示意图。这里，将高域侧上从sb到15的子带信号x(ib，n)沿时间轴向后移动了四个采样。即，在本实施例中，通过利用人的听觉系统中观察到的后向时间掩蔽(backward tempral masking)特性，在听不见的范围内将子带信号x(ib，n)在沿时间方向进行了延迟。

[公式13]

x(ib，n)＝x(ib，n-4) (14)

应该注意，这里，执行四个采样的延迟。然而，可以响应于带分划数量、扩展开始频带sb、采样频率等，来改变四个采样的延迟。

相位调整部17将通过采样移动获得的从sb到15的高域侧上的子带信号x(ib，n)提供给带合成部18。

带合成部

带合成部18通过滤波器组将由相位调整部17向其提供的高域侧上从sb到15的子带信号x(ib，n)与由带划分部12向其提供的低域侧上从0到sb-1的子带信号x(ib，n)进行带合成，以获得带合成输出信号y(n)。

如上所述，在本实施例中，根据辅助信息确定sb，然后基于低于sb一侧上的多个子带信号扩展频带。因此，可以更高音质播放删除了属于较高频带的信号分量的信号。此外，检测低域侧上从sb-4到sb-1的子带信号中的代码劣化，然后根据劣化检测结果对低域侧上sb-4到sb-1的子带信号执行过渡检测。从而，可以防止用于过渡检测的计算量的增加。此外，通过将较大权重分配给更接近于高域侧的低域侧上从sb-4到sb-1的子带信号来求频带包络的平均值，可以将低域侧的频率包络更平滑地连接至高域侧的频率包络。此外，通过在将限幅器应用于根据低域侧上从sb-4到sb-1的子带信号计算的包络基准值的同时执行带合成，可以防止带合成输出信号的溢出。此外，通过相对于带合成的从0到sb-1的低域侧上的多个子带信号对属于从sb到15的子带的多个信号进行相移，可以防止频带合成输出信号的溢出。

应该注意，本发明并不仅限于上述实施例，而在没有背离本发明的范围的情况下可以进行各种修改。在本实施例中，已经描述了用于在解码处理之后处理信号的频带扩展装置来作为实例。可选地，也可将本发明应用于设置有解码装置的播放装置。此外，在上述实施例中，公开了硬件配置，但本发明并不限于此。可以通过使CPU(中央处理单元)执行作为计算机程序的任意处理来实现本发明。在这种情况下，可以提供记录在记录介质上的计算机程序，或者可选地，通过经由互联网传输或其它传输介质提供该计算机程序。

Claims

1.一种用于扩展输入信号的频带的频带扩展装置，包括：

扩展控制装置，用于确定所述输入信号的扩展开始带；

带划分装置，用于将所述输入信号划分为多个子带信号；

以及

带合成装置，通过移动低于所述扩展开始带一侧上的所述多个子带信号的相位和大于等于所述扩展开始带的所述多个所述子带信号的相位，对低于所述扩展开始带一侧上的所述多个子带信号和大于等于所述扩展开始带的所述多个所述子带信号进行合成，

其中，基于由所述带划分装置对所述输入信号进行带划分而得到的所述多个子带信号中低于所述扩展开始带一侧上的多个子带信号来扩展所述频带。

2.根据权利要求1所述的频带扩展装置，其中

所述扩展控制装置通过使用与所述输入信号相关的信息作为辅助信息来确定所述输入信号的所述扩展开始带。

3.根据权利要求1所述的频带扩展装置，包括：

过渡检测装置，用于对由所述带划分装置对所述输入信号进行带划分而得到的低于所述扩展开始带一侧上的所述多个子带信号中与所述扩展开始带相连的预定数量的子带信号中的每一个，在时间方向上进行过渡检测；以及

组划分装置，用于基于所述过渡检测装置中的过渡检测结果，在所述时间方向上将所述预定数量的子带信号划分为多个组。

4.根据权利要求3所述的频带扩展装置，包括：

功率平均值计算装置，用于基于由所述组划分装置对所述预定数量的子带信号进行划分而得到的所述组的组功率的平均值，来计算所述预定数量的子带信号的功率的平均值；包络估计装置，用于以由所述功率平均值计算装置算出的所述平均值作为起点，外推大于等于所述扩展开始带的所述多个子带信号的包络直线；以及

带内插装置，用于基于所述包络直线内插大于等于所述扩展开始带的所述多个子带信号。

5.根据权利要求3所述的频带扩展装置，其中

所述过渡检测装置检测所述预定数量的子带信号的代码劣化，并响应于代码劣化检测结果，对所述预定数量的子带信号执行过渡检测。

6.根据权利要求4所述的频带扩展装置，其中

功率平均值计算装置通过将较大权重分配给更接近于高域侧的所述预定数量的子带信号来计算所述预定数量的子带信号的功率的平均值。

7.根据权利要求4所述的频带扩展装置，其中

如果通过所述功率平均值计算装置算出的所述平均值大于阈值，则所述包络估计装置将所述阈值作为起点来外推所述包络直线。

8.一种用于扩展输入信号的频带的频带扩展方法，包括：

根据与所述输入信号相关的信息来确定所述输入信号的扩展开始带；

将所述输入信号划分为多个子带信号；

通过移动低于所述扩展开始带一侧上的所述多个子带信号的相位和大于等于所述扩展开始带的所述多个所述子带信号的相位，对低于所述扩展开始带一侧上的所述多个子带信号和大于等于所述扩展开始带的所述多个所述子带信号进行合成；以及

基于在所述带划分步骤中对所述输入信号进行带划分而得到的所述多个子带信号中低于所述扩展开始带一侧上的多个子带信号来扩展所述频带。

9.一种用于在对输入信号进行带扩展之后播放所述输入信号的播放装置，包括：

扩展控制装置，用于根据与所述输入信号相关的信息来确定所述输入信号的扩展开始带；

带划分装置，用于将所述输入信号划分为多个子带信号；以及

10.根据权利要求9所述的播放装置，其中

所述输入信号是通过对被编码的编码数据执行解码处理而获得的信号。

11.一种用于在对输入信号进行带扩展之后播放所述输入信号的播放方法，包括：

将所述输入信号划分为多个子带信号；通过移动低于所述扩展开始带一侧上的所述多个子带信号的相位和大于等于所述扩展开始带的所述多个所述子带信号的相位，对低于所述扩展开始带一侧上的所述多个子带信号和大于等于所述扩展开始带的所述多个所述子带信号进行合成；以及

基于在对所述输入信号进行带划分而得到的所述多个子带信号中低于所述扩展开始带一侧上的多个子带信号来扩展所述频带。

12.一种用于扩展输入信号的频带的频带扩展装置，包括：

带划分装置，用于将所述输入信号划分为多个子带信号；过渡检测装置，用于对由所述带划分装置对所述输入信号进行带划分而得到的低于所述扩展开始带一侧上的多个子带信号中与所述扩展开始带相连的预定数量的子带信号，在时间方向上进行过渡检测；

组划分装置，用于基于所述过渡检测装置中的过渡检测结果，在所述时间方向上将所述预定数量的子带信号划分为多个组；

功率平均值计算装置，用于基于由所述组划分装置对所述预定数量的子带信号进行划分而得到的所述组的组功率的平均值，来计算所述预定数量的子带信号的功率的平均值；

包络估计装置，用于以由所述功率平均值计算装置算出的所述平均值作为起点，外推大于等于所述扩展开始带的多个子带信号的包络直线；

带内插装置，用于基于所述包络直线内插大于等于所述扩展开始带的所述多个子带信号；以及

带合成装置，用于将低于所述扩展开始带一侧上的所述多个子带信号与大于等于所述扩展开始带的所述多个子带信号进行合成，