CN106847297B - 高频带信号的预测方法、编/解码设备 - Google Patents
高频带信号的预测方法、编/解码设备 Download PDFInfo
- Publication number
- CN106847297B CN106847297B CN201710076995.3A CN201710076995A CN106847297B CN 106847297 B CN106847297 B CN 106847297B CN 201710076995 A CN201710076995 A CN 201710076995A CN 106847297 B CN106847297 B CN 106847297B
- Authority
- CN
- China
- Prior art keywords
- signal
- frequency band
- frequency
- band signal
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 230000005284 excitation Effects 0.000 claims abstract description 203
- 230000005236 sound signal Effects 0.000 claims abstract description 152
- 238000012545 processing Methods 0.000 claims description 65
- 230000003595 spectral effect Effects 0.000 claims description 29
- 238000013139 quantization Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 238000011084 recovery Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例提供一种高频带信号的预测方法、编/解码设备。该方法包括:获取音频信号的信号类型和低频带信号;所述音频信号包括低频带信号和高频带信号;根据所述信号类型获取高频带信号的频域包络;根据所述低频带信号预测高频带信号的激励信号;根据所述高频带信号的频域包络和所述高频带信号的激励信号恢复高频带信号。本发明实施例的技术方案,能够有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差,提高预测的高频带信号的准确率。
Description
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种高频带信号的预测方法、编/解码设备。
背景技术
在数字通信领域,语音、图像、音频、视频的传输有着非常广泛的应用需求,如手机通话、音视频会议、广播电视、多媒体娱乐等。为了降低音视频信号存储或者传输过程中占用的资源,音视频压缩编码技术应运而生。音视频压缩编码技术的发展中涌现出了很多不同的技术分支,其中将信号由时域变换到频域后再进行编码处理的技术,又称为变换域编码技术由于具有很好的压缩特性,得到了非常广泛的应用。
通信传输中越来越重视音频的质量,因此要求在保证语音质量的前提下尽可能的提高音乐信号质量。同时由于音频信号的信息量极为丰富,不能采用传统语音的码激励线性预测(Code Excited Linear Prediction;以下简称CELP)编码模式,而通常是利用变换域编码的音频编码技术将时域信号转换为频域信号来处理音频信号,提升音频信号的编码质量。
现有的音频编码技术中,通常采用快速傅立叶变换(Fast Fourier Transform;以下简称FFT)或改进离散余弦变换(Modified Discrete Cosine Transform;以下简称MDCT)或离散余弦变换(Discrete Cosine Transform;以下简称DCT)等变换技术将音频信号中的高频带信号由时域信号转换为频域信号,然后对频域信号进行编码。
由于在低比特率下有限的量化比特不能满足量化所有的待量化的音频信号,编码设备将大部分比特用于精细量化相对重要的音频信号中的低频带信号,即低频带信号的量化参数占用大部分比特;而仅用少量比特粗略量化编码音频信号中的高频带信号,得到高频带信号的频域包络。然后将高频带信号的频域包络和低频带信号的量化参数以比特流的形式发送至解码设备。低频带信号的量化参数可以包括激励信号和频域包络,低频带信号被量化时也可以先由时域信号转换为频域信号,再量化编码为激励信号。
解码设备一般根据接收到的比特流中的低频带信号的量化参数可以恢复出低频带信号,然后根据低频带信号获取低频带信号的激励信号,并采用频带扩展(band widthextension;以下简称BWE)技术和频谱填充技术,根据低频带信号的激励信号预测高频带信号的激励信号,并根据比特流中的高频带信号的频域包络修正预测的高频带信号的激励信号得到预测的高频带信号,这里得到的高频带信号为频域信号。
在BWE技术中,有比特分配的最高频点可以为有激励信号的最高频点,即从该频点以上没有激励信号被解码出。有比特分配的最高频点之上的频带可以称为高频带,有比特分配的最高频点之下的频带可以称为低频带。根据低频带信号的激励信号预测高频带信号的激励信号,具体可以为:以有比特分配的最高频点为中心,将有比特分配的最高频点之下的低频带信号的激励信号拷贝至该有比特分配的最高频点之上与该低频带信号带宽相等的高频带信号,作为高频带信号的激励信号。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:采用上述现有技术的预测高频带信号,预测的高频带信号的质量较差,从而降低了音频信号的听觉质量。
发明内容
本发明实施例提供一种高频带信号的预测方法、编/解码设备,用以提高预测的高频带信号的质量,从而实现提升音频信号的听觉质量。
第一方面,本发明实施例提供一种高频带信号的预测方法,包括:
获取待解码音频信号的信号类型和所述音频信号的低频带信号;
根据所述信号类型获取所述音频信号的高频带信号的频域包络;
根据所述音频信号的所述低频带信号预测所述音频信号的高频带信号的激励信号;
根据所述高频带信号的频域包络和所述高频带信号的激励信号恢复出所述音频信号的高频带信号。
结合第一方面,在第一方面的第一种实现方式中,所述信号类型为谐波信号或者非谐波信号,根据所述信号类型获取高频带信号的频域包络包括:
当所述信号类型为非谐波信号时,对接收的所述音频信号的码流进行解码得到所述音频信号的高频带信号的频域包络;
当所述信号类型为谐波时,对接收的所述音频信号的码流进行解码得到所述音频信号的高频带信号的初始频域包络;将所述初始频域包络与相邻的N个初始频域包络加权计算得到的值作为高频带信号的频域包络,其中N大于等于1。
结合第一方面,在第一方面的第二种实现方式中,所述信号类型为谐波信号或者非谐波信号,根据所述信号类型获取高频带信号的频域包络包括:
根据所述信号类型从接收的所述音频信号的码流中解码获取到对应的所述高频带信号的频域包络,所述音频信号的码流中携带了所述信号类型和所述高频带信号的频域包络的编码索引。
结合第一方面及其上述实现方式,在第一方面的第三种实现方式中,获取音频信号的信号类型和低频带信号,包括:
对接收的所述音频信号的码流进行解码得到所述信号类型和所述低频带信号;所述信号类型为谐波信号或者非谐波信号。
结合第一方面及其上述实现方式,在第一方面的第四种实现方式中,获取音频信号的信号类型和低频带信号,包括:
对接收的所述音频信号的码流进行解码得到所述音频信号的所述低频带信号;
根据所述低频带信号确定所述信号类型;所述信号类型为谐波信号或者非谐波信号。
结合第一方面及其上述实现方式,在第一方面的第五种实现方式中,根据所述低频带信号预测高频带信号的激励信号,包括:
确定低频带信号有比特分配的最高频点;
判断所述低频带信号有比特分配的最高频点是否小于预设的高频带信号的带宽扩展的起始频点;
当所述低频带信号有比特分配的最高频点小于所述预设的高频带信号的带宽扩展的起始频点时,根据低频带信号中预定频带范围内的激励信号和所述预设的高频带信号带宽扩展的起始频点预测所述高频带信号的激励信号;
当所述低频带信号的有比特分配的最高频点大于等于所述预设的高频带信号的带宽扩展的起始频点时,根据低频带信号中预定频带范围内的激励信号、所述预设的高频带信号带宽扩展的起始频点和所述低频带信号有比特分配的最高频点预测所述高频带信号的激励信号。
结合第一方面及其上述实现方式,在第一方面的第六种实现方式中,根据低频带信号中预定频带范围内的激励信号和所述预设的高频带信号带宽扩展的起始频点预测所述高频带信号的激励信号包括:
拷贝n份所述预定频带范围内的激励信号作为所述预设的高频带信号带宽扩展的起始频点与所述带宽扩展频带的最高频点之间的激励信号;所述n为正整数或者正小数,n等于预设的高频带信号的带宽扩展的起始频点与所述带宽扩展频带的最高频点之间的频点数量和预定频带范围内频点数量的比值。
结合第一方面及其上述实现方式,在第一方面的第七种实现方式中,根据低频带信号中预定频带范围内的激励信号、所述预设的高频带信号带宽扩展的起始频点和所述低频带信号的最高频点预测所述高频带信号的激励信号,包括:
拷贝从所述预定频带范围的起始频点fexc_start之上的第m个频点开始到所述预定频带范围的结束频点fexc_end之间的激励信号,和n份所述预定频带范围内的激励信号作为所述低频带信号有比特分配的最高频点与所述带宽扩展频带的最高频点之间的激励信号;所述n为零、正整数或者正小数,m为所述低频带信号有比特分配的最高频点与预设的扩展频带的起始频点之间的频点数量差值。
第二方面,本发明实施例还提供一种高频带信号的预测方法,包括:
获取音频信号的信号类型和所述音频信号的低频带信号;
根据所述信号类型对所述音频信号的高频带信号的频域包络进行编码,得到高频带信号的频域包络的编码索引;
向解码设备发送携带所述信号类型、所述低频带信号和所述高频带信号的频域包络的编码索引的码流。
结合第二方面,在第二方面的一种实现方式中,所述信号类型为谐波信号或者非谐波信号,根据所述信号类型对高频带信号的频域包络进行编码,得到高频带信号的频域包络的编码索引包括:
当所述信号类型为非谐波信号时,使用第一数量个频谱系数计算高频带信号的频域包络的编码索引;
当所述信号类型为谐波信号时,使用第二数量个频谱系数计算高频带信号的频域包络的编码索引;其中,第二数量大于第一数量。
第三方面,本发明实施例还提供一种高频带信号的预测方法,包括:
获取音频信号的信号类型和所述音频信号的低频带信号,所述信号类型为谐波信号或者非谐波信号,所述音频信号包括低频带信号和高频带信号;;
计算所述音频信号的高频带信号的频域包络,其中使用相同数量的频谱系数计算谐波信号和非谐波信号的高频带信号的频域包络;
向解码设备发送携带所述信号类型、所述低频带信号和高频带信号的频域包络编码索引的码流。
第四方面,本发明实施例还提供一种解码设备,包括:
第一获取模块,用于获取待解码音频信号的信号类型和所述音频信号的低频带信号;
第二获取模块,用于根据所述信号类型获取所述音频信号的高频带信号的频域包络;
预测模块,用于根据所述音频信号的低频带信号预测所述音频信号的高频带信号的激励信号;
恢复模块,用于根据所述高频带信号的频域包络和所述高频带信号的激励信号恢复出所述音频信号的高频带信号。
结合第四方面,在第四方面的第一种实现方式中,所述信号类型为谐波信号或者非谐波信号,所述第二获取模块,具体用于当所述信号类型为非谐波信号时,对接收的所述音频信号的码流进行解码得到高频带信号的频域包络;或者所述第二获取模块,具体用于当所述信号类型为谐波时,对接收的所述音频信号的码流进行解码得到高频带信号的初始频域包络;将所述初始频域包络与相邻的N个初始频域包络加权计算得到的值作为高频带信号的频域包络,其中N大于等于1。
结合第四方面,在第四方面的第二种实现方式中,,所述信号类型为谐波信号或者非谐波信号,所述第二获取模块,具体用于根据所述信号类型从接收的所述音频信号的码流中解码获取到对应的所述高频带信号的频域包络,所述音频信号的码流中携带了所述信号类型和所述高频带信号的频域包络的编码索引。
结合第四方面及其上述实现方式,在第四方面的第三种实现方式中,所述第一获取模块,具体用于对接收的所述音频信号的码流进行解码得到所述信号类型和所述低频带信号;所述信号类型为谐波信号或者非谐波信号。
结合第四方面及其上述实现方式,在第四方面的第四种实现方式中,所述第一获取模块,具体用于对接收的所述音频信号的码流进行解码得到所述音频信号的低频带信号;根据所述低频带信号确定所述信号类型;所述信号类型为谐波信号或者非谐波信号。
结合第四方面及其上述实现方式,在第四方面的第五种实现方式中,所述预测模块包括:
确定单元,用于确定低频带信号有比特分配的最高频点;
判断单元,用于判断所述低频带信号有比特分配的最高频点是否小于预设的高频带信号的带宽扩展的起始频点;
第一处理单元,用于当所述判断单元确定所述低频带信号有比特分配的最高频点小于所述预设的高频带信号的带宽扩展的起始频点时,根据低频带信号中预定频带范围内的激励信号和所述预设的高频带信号的带宽扩展的起始频点预测所述高频带信号的激励信号;
第二处理单元,用于当所述判断单元确定所述低频带信号的有比特分配的最高频点大于等于所述预设的高频带信号的带宽扩展的起始频点时,根据低频带信号中预定频带范围内的激励信号、所述预设的高频带信号的带宽扩展的起始频点和所述低频带信号有比特分配的最高频点预测所述高频带信号的激励信号。
结合第四方面及其上述实现方式,在第四方面的第六种实现方式中,所述第一处理单元,具体用于当所述判断单元确定所述低频带信号有比特分配的最高频点小于所述预设的高频带信号的带宽扩展的起始频点时,拷贝n份所述预定频带范围内的激励信号作为所述预设的高频带信号的带宽扩展的起始频点与所述带宽扩展频带的最高频点之间的激励信号;所述n为正整数或者正小数,n等于预设的高频带信号的带宽扩展的起始频点与所述带宽扩展频带的最高频点之间的频点数量和预定频带范围内频点数量的比值。
结合第四方面及其上述实现方式,在第四方面的第七种实现方式中,所述第二处理单元,具体用于当所述判断单元确定所述低频带信号的有比特分配的最高频点大于等于所述预设的高频带信号的带宽扩展的起始频点时,拷贝从所述预定频带范围的起始频点fexc_start之上的第m个频点开始到所述预定频带范围的结束频点fexc_end之间的激励信号,和n份所述预定频带范围内的激励信号作为所述低频带信号有比特分配的最高频点与所述带宽扩展频带的最高频点之间的激励信号;所述n为零、正整数或者正小数,m为所述低频带信号有比特分配的最高频点与预设的扩展频带的起始频点之间的频点数量差值。
第五方面,本发明实施例还提供一种编码设备,包括:
获取模块,用于获取音频信号的信号类型和所述音频信号的低频带信号;
编码模块,用于根据所述信号类型对所述音频信号的高频带信号的频域包络进行编码,得到高频带信号的频域包络的编码索引;
发送模块,用于向解码设备发送携带所述信号类型、所述低频带信号和所述高频带信号的频域包络的编码索引的码流。
结合第五方面,在第五方面的一种实现方式中,所述信号类型为谐波信号或者非谐波信号,所述编码模块,具体用于当所述信号类型为非谐波信号时,使用第一数量个频谱系数计算高频带信号的频域包络的编码索引;
或者所述编码模块,具体用于当所述信号类型为谐波信号时,使用第二数量个频谱系数计算高频带信号的频域包络的编码索引;其中,第二数量大于第一数量。
第六方面,本发明实施例还提供一种编码设备,包括:
获取模块,用于获取音频信号的信号类型和所述音频信号的低频带信号,所述信号类型为谐波信号或者非谐波信号,所述音频信号包括低频带信号和高频带信号;
计算模块,用于计算所述音频信号的高频带信号的频域包络,其中使用相同数量的频谱系数计算谐波信号和非谐波信号的高频带信号的频域包络;
发送模块,用于向解码设备发送携带所述信号类型、所述低频带信号和高频带信号的频域包络编码索引的码流。本发明实施例的高频带信号的预测方法及系统、编/解码设备,对不同类型信号采用不同的频谱系数解码包络,使得从低频预测的高频带谐波信号的激励能保持住原来的谐波特性,能够提高预测的高频带信号的质量,从而实现提升音频信号的听觉质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中编码设备的结构示意图。
图2为现有技术中解码设备的结构示意图。
图3为本发明一实施例提供的高频带信号的预测方法的流程图。
图4为本发明另一实施例提供的高频带信号的预测方法的流程图。
图5为本发明再一实施例提供的高频带信号的预测方法的流程图。
图6为本发明一实施例提供的解码设备的结构示意图。
图7为本发明另一实施例提供的解码设备的结构示意图。
图8为本发明一实施例提供的编码设备的结构示意图。
图9为本发明另一实施例提供的编码设备的结构示意图。
图10为本发明实施例提供的编码设备的实例图。
图11为本发明实施例提供的解码设备的实例图。
图12为本发明实施例提供的高频带信号的预测系统的结构示意图。
图13为本发明实施例提供的解码设备的另一实例图。
图14为本发明实施例提供的编码设备的另一实例图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
数字信号处理领域,音频编解码器、视频编解码器广泛应用于各种电子设备中,例如:移动电话,无线装置,个人数据助理(PDA),手持式或便携式计算机,GPS接收机/导航器,照相机,音频/视频播放器,摄像机,录像机,监控设备等。通常,这类电子设备中包括音频编码器或音频解码器,音频编码器或者解码器可以直接由数字电路或芯片例如DSP(digitalsignal processor)实现,或者由软件代码驱动处理器执行软件代码中的流程而实现。
例如一种音频编码器,首先对输入信号进行分帧处理,得到20ms一帧的时域数据;然后对时域数据进行加窗处理,得到加窗后的信号;对加窗后的时域信号进行频域变换,将信号由时域变换到频域;再对频域信号进行编码,传输到解码端。解码端接收到由编码端传输出来的压缩码流以后,对信号进行相应的解码操作,对解码的到的频域信号进行编码端所用变换相对应的逆变换,将信号由频域变换到时域,对时域信号进行后处理后得到合成信号,即为解码端输出信号。
图1为现有技术中编码设备的结构示意图。如图1所示,现有的编码设备中包括时频变换模块10、包络提取模块11、包络量化编码模块12、比特分配模块13、激励生成模块14、激励量化编码模块15和复用模块16。
如图1所示,时频变换模块10用于接收输入的音频信号,然后将音频信号由时域信号转换为频域信号。再由包络提取模块11在时频变换模块10变换得到的频域信号中提取频域包络,该频域包络也可以称为子带归一化因子。这里的频域包络包括频域信号中低频带信号的频域包络和高频带信号的频域包络。包络量化编码模块12对包络提取模块11得到频域包络进行量化编码处理,得到量化编码后的频域包络。比特分配模块13根据量化后的频域包络确定各个子带的比特分配。激励生成模块14利用包络量化编码模块12得到的量化编码后的包络信息对时频变换模块10得到的频域信号进行归一化处理,得到激励信号即归一化的频域信号,该激励信号也包括高频带信号激励信号和低频带信号激励信号。激励量化编码模块15根据比特分配模块13分配的各个子带的比特分配对激励生成模块14生成的激励信号进行量化编码处理,得到量化后的激励信号。复用模块16分别对包络量化编码模块12量化后的频域包络和激励量化编码模块15量化后的激励信号复用为比特流,输出给解码设备。
图2为现有技术中解码设备的结构示意图。如图2所示,现有的解码设备中包括解复用模块20、频域包络解码模块21、比特分配获取模块22、激励信号解码模块23、带宽扩展模块24、频域信号恢复模块25和频时变换模块26。
如图2所示,解复用模块20接收编码设备侧发送的比特流,并对比特流解复用(包括解码),分别得到其中的量化后的频域包络和量化后的激励信号。频域包络解码模块21从解复用模块20解复用得到的信号中获取量化后的频域包络,并进行量化解码,得到频域包络。比特分配获取模块22根据频域包络解码模块21得到的频域包络确定各个子带的比特分配。激励信号解码模块23从解复用模块20解复用得到的信号中获取量化后的激励信号,并根据比特分配获取模块22得到的各个子带的比特分配进行量化解码,得到激励信号。带宽扩展模块24根据激励信号解码模块23得到的激励信号对整个带宽进行扩展,具体地就是利用低频带信号的激励信号扩展高频带信号的激励信号。由于激励量化编码模块15和包络量化编码模块12在量化编码激励信号和包络信号时会将大部分比特用于量化相对重要的低频带信号的信号,而仅采用很少的比特量化高频带信号的信号,甚至可能不包括高频带信号的激励信号,因此带宽扩展模块24需要利用低频带信号的激励信号扩展高频带信号的激励信号,从而得到整个频带的激励信号。频域信号恢复模块25分别与频域包络解码模块21和带宽扩展模块24连接,频域信号恢复模块25根据频域包络解码模块21得到的频域包络和带宽扩展模块24得到的整个频带的激励信号恢复出频域信号。频时变换模块26将频域信号恢复模块25恢复出的频域信号转换为时域信号,从而得到原始输入的音频信号。
图1和图2为现有技术的一种编码设备和对应的解码设备的结构图。根据图1和图2所示现有技术的编码设备和解码设备的处理过程,可以知道现有技术中解码设备在恢复低频带信号的频域信号时采用的低频带信号的激励信号和包络信息都是编码设备侧发送的,因此低频带信号的频域信号恢复较为准确。高频带信号的频域信号需要先采用低频带信号的激励信号预测高频带信号的激励信号,然后在采用编码设备侧发送的高频带信号的包络信息修正预测的高频带信号的激励信号,得到高频带信号的频域信号。编码设备在预测高频带信号的频域信号时,未考虑信号类型,采用相同的频域包络,例如当信号类型为谐波时,采用频域包络覆盖的子带范围较窄(小于一个谐波从波峰到波谷覆盖的子带范围)。当采用该频域包络修正预测的高频带信号激励时,会引入更多的噪声,使得修正得到的高频带信号与真实的高频带信号之间存在的误差较大,严重影响了预测高频带信号的准确率,降低了预测的高频带信号的质量,从而降低了音频信号的听觉质量。而且采用上述现有技术中的根据低频带信号的激励信号预测高频带信号的激励信号,不同帧间的同一高频带信号上可能拷贝的是不同低频带信号的激励信号,造成激励的不连续性,降低了预测的高频带信号的质量,从而降低了音频信号的听觉质量。因此可以采用下述本发明实施例的技术方案以解决上所述技术问题。
图3为本发明一实施例提供的高频带信号的预测方法的流程图。本实施例的高频带信号的预测方法的执行主体可以为解码设备。如图3所示,本实施例的高频带信号的预测方法,具体可以包括如下步骤:
100、解码设备获取音频信号的信号类型和低频带信号;
本实施例中信号类型为谐波或者非谐波;音频信号包括低频带信号和高频带信号。一个实施例中,音频信号的信号类型为音频信号的高频带信号的信号类型,即高频带信号属于谐波信号还是非谐波信号。
101、解码设备根据信号类型获取高频带信号的频域包络;
102、解码设备根据低频带信号预测高频带信号的激励信号;
103、解码设备根据高频带信号的频域包络和高频带信号的激励信号恢复高频带信号。
本实施例中预测得到的高频带信号为频域信号。
本实施例的高频带信号的预测方法,根据信号类型获取高频带信号的频域包络,对不同类型信号采用不同的频谱系数解码包络,使得从低频预测的高频带谐波信号的激励能保持住原来的谐波特性能够避免在预测过程中引入过多的噪声,有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
可选地,在上述实施例的技术方案的基础上,还可以包括由如下扩展技术方案,构成图3所示实施例的扩展实施例,在该扩展实施例中,101中“解码设备根据信号类型获取高频带信号的频域包络”,具体可以包括以下两种情况:
第一种情况:当信号类型为非谐波信号时,解码设备对接收的码流进行解码得到高频带信号的频域包络;当信号类型为谐波时,解码设备对接收的码流进行解码得到高频带信号的初始频域包络;将初始频域包络与相邻的N个初始频域包络加权计算得到的值作为高频带信号的频域包络,其中N大于等于1。
此种情况下,无论是谐波还是非谐波,解码设备对接收的码流解码得到的高频带信号的频域包络是相同的。对于非谐波信号,解码得到高频带信号的频域包络即为要得到的高频带信号的频域包络。对于非谐波信号,解码设备解码得到高频带信号的频域包络为高频带信号的初始频域包络,需要再将初始频域包络与相邻的N个初始频域包络加权计算得到的值作为高频带信号的频域包络,其中N大于等于1。这样可以得知,谐波信号对应的高频带信号的频域包络覆盖的子带宽度大于非谐波信号对应的高频带信号的频域包络。
其中N的值的大小可以根据谐波信号高频带信号的频域包络覆盖的子带宽度与非谐波信号高频带信号的频域包络覆盖的子带宽度来决定。例如上述实例中为谐波信号时,每个子带内有40个频谱系数,而非谐波信号时,每个子带内有24个频谱系数。若解码设备判断信号类型为谐波,而码流中携带的高频带信号的频域包络为非谐波对应的频域包络,此时可以将码流中的频域包络的相邻2个求平均得到谐波对应的频域包络。
例如对超宽带信号,8~14kHz范围内有240个频谱系数,信号类型的类型为谐波信号时,可以将240个频谱系数平均分成6个子带,每个子带内有40个频谱系数,每个子带计算一个频域包络,共计算6个频域包络。而信号类型为非谐波信号时,将240个频谱系数平均分成10个子带,每个子带内有24个频谱系数,每个子带计算一个频域包络,共计算10个频域包络。
第二种情况:根据信号类型从码流中解码获取到对应的高频带信号的频域包络,其中码流包含信号类型以及该信号类型对应的高频带信号的频域包络的编码索引。
对于步骤101的上述第一种实现情况下,解码设备需要得到音频信号的信号类型,即为谐波信号或者非谐波信号的信息。可以有不同的实现方式:一种实现方式是编码设备判断该音频信号的信号类型,并将信号类型编码后传输给解码设备;另一种实现方式是解码设备根据解码得到的低频带信号判断该音频信号的类型。这里的音频信号的信号类型具体的可以指音频信号的高频带信号的信号类型,即高频带信号属于谐波信号还是非谐波信号。
谐波信号表示在要处理的频带内,频谱幅度波动较大的信号,可以表现为在一定频带内有一定数量的幅度峰值。编码端或解码端判断音频信号为谐波信号或者非谐波信号可以采用现有的方法,例如,一种方法中,将频域信号分成N个子带,求取每个子带的峰均比(峰均比为某一子带内幅度最大的频谱系数与此子带内幅度的均值的比值),当峰均比大于给定阈值的子带个数大于给定的值时,此时信号为谐波信号,否则为非谐波信号。
步骤100“解码设备获取音频信号的信号类型和低频带信号”,具体可以包括如下两种方式:
第一种方式中:解码设备对接收的码流进行解码得到信号类型和低频带信号。需要说明的是,低频带信号具体可以采用低频带信号的量化参数来唯一标识。因此,对接收的码流进行解码得到低频带信号,具体也可以是获取低频带信号的量化参数。
这种情况下,解码设备接收编码设备发送的码流中携带有信号类型、低频带信号的量化参数和高频带信号的频域包络。此时高频带信号的频域包络无谐波信号与非谐波信号之分。对应的,由编码设备侧确定信号类型是谐波还是非谐波,但是不根据信号类型调整高频带信号的频域包络,而是进根据原始音频信号来确定高频带信号的频域包络,同时编码设备还需要确定低频带信号。然后由编码设备向解码设备发送携带信号类型、低频带信号和高频带信号的频域包络的编码索引的码流。一般情况下,高频带信号的与低频带信号的谐波性是一致的;但也存在低频带信号谐波性强,高频带信号也可能就没谐波的特例。因此,此实施例中编码设备获得的音频信号的信号类型可以是高频带信号的信号类型,也可以是低频带信号的信号型号类型。前一种方式较后一种情况更为准确。
第二种方式:解码设备对码流进行解复用,获取低频带信号;根据低频带信号确定信号类型。
此种方式相对于上述第一种方式,解码设备接收编码设备发送的码流中未携带有信号类型,而是由解码设备根据解复用获取的低频带信号确定的。同理,可以采用低频带信号的量化参数来唯一标识低频带信号。可选地,此时方式下,编码设备发送的码流中也可以只携带低频带信号和高频带信号的频域包络的编码索引,由解码设备接收码流之后,解复用获取低频带信号;根据低频带信号确定信号类型。此种方式对应在编码设备侧可以采用现有技术,即不用确定信号类型,向解码设备发送的码流中不携带信号类型,编码设备侧的处理详细可以参考相关现有技术,在此不再赘述。该实施方式较前一种方式而言,能够进一步节约编码比特。
而对于步骤101的上述第二种实现情况,由于上述第二种实现情况中,需要解码设备根据信号类型从码流中解码获取到对应的高频带信号的频域包络,即对应的编码设备侧需要根据信号类型将高频带信号的频域包络编码在码流中,例如在信号类型为谐波时,编码设备可以采用4比特来编码高频带信号的频域包络,当信号类型为非谐波时,编码设备可以采用5比特来编码高频带信号的频域包络。因此该种情况下,解码设备接收的码流中需要携带信号类型。因此对于步骤101的第二种情况下,步骤100的实施不能采用上述第二种方式。
可选地,在图3所示实施例的扩展实施例中,步骤102“解码设备根据低频带信号预测高频带信号的激励信号”,具体可以现有相关技术来实现,或者优选地,具体可以采用如下步骤来实现:
(1)解码设备确定低频带信号有比特分配的最高频点;
例如解码设备可以根据接收编码设备发送的码流中的低频带信号确定有比特分配的最高频点。当采用低频带信号的量化参数唯一标识低频带信号时,可以根据低频带信号的量化参数确定有比特分配的最高频点。例如本实施例中采用flast_sfm表示有比特分配的最高频点。
(2)解码设备判断低频带信号有比特分配的最高频点是否小于预设的高频带信号的带宽扩展的起始频点;当低频带信号有比特分配的最高频点小于预设的高频带信号的带宽扩展的起始频点时,执行步骤(3);否则当低频带信号的有比特分配的最高频点大于等于预设的高频带信号的带宽扩展的起始频点时,执行步骤(4);
(3)解码设备根据低频带信号中预定频带范围内的激励信号和预设的高频带信号的带宽扩展的起始频点预测高频带信号的激励信号;
(4)解码设备根据低频带信号中预定频带范围内的激励信号、预设的高频带信号的带宽扩展的起始频点和低频带信号有比特分配的最高频点预测高频带信号的激励信号。
进一步可选地,其中步骤(3)解码设备根据低频带信号中预定频带范围内的激励信号和预设的高频带信号的带宽扩展的起始频点预测高频带信号的激励信号包括:
拷贝n份预定频带范围内的激励信号作为预设的高频带信号的带宽扩展的起始频点与带宽扩展频带的最高频点之间的激励信号。
本实施例中,n为正整数或者正小数,n等于预设的高频带信号的带宽扩展的起始频点与带宽扩展频带的最高频点之间的频点数量和预定频带范围内频点数量的比值。
例如,本实施例中可以采用fbwe_start表示预设的高频带信号的带宽扩展的起始频点。其中fbwe_start的选取与编码速率(即总比特数)有关,编码速率越高,可以选取预设的高频带信号的带宽扩展的起始频点fbwe_start越高。例如对超宽带信号,在编码速率为24kbps时,预设的高频带信号的带宽扩展的起始频点fbwe_start=6.4kHz;在编码速率为32kbps时,预设的高频带信号的带宽扩展的起始频点fbwe_start=8kHz。
例如,本实施例中,低频带信号中预定频带范围内的激励信号可以表示为低频带信号中从fexc_start到fexc_end的频带范围内的激励信号;fexc_start为低频带信号中预定频带范围内的起始频点,fexc_end为低频带信号中预定频带范围内的结束频点,fexc_end大于fexc_start。其中fexc_start到fexc_end的预定频带范围的选取是根据信号类型及编码速率有关的,如在较低速率时,对谐波信号,选取低频带信号中相对编码较好的较低频带信号,对非谐波信号,选取低频带信号中相对编码较差的较高频带信号;在较高速率时,对谐波信号可以选取低频带信号中的稍高的频带。
例如,本实施例中,带宽扩展频带的最高频点可以采用ftop_sfm表示。
此时,拷贝n份fexc_start到fexc_end的频带范围内的激励信号作为fbwe_start与ftop_sfm之间的激励信号,n等于fbwe_start与ftop_sfm之间的频点数量和fexc_start到fexc_end范围内频点数量的比值,具体可以为正整数或者正小数。
本实施例中,解码设备从fbwe_start开始,拷贝n份的fexc_start到fexc_end的频带范围内的激励信号作为fbwe_start与ftop_sfm之间的高频带信号的激励信号,具体可以采用如下方式实现:解码设备从fbwe_start开始,依次拷贝n份中的整数份的fexc_start到fexc_end的频带范围内的激励信号和n份中的非整数份的fexc_start到fexc_end的频带范围内的激励信号作为fbwe_start与ftop_sfm之间的高频带激励信号;n份中的非整数份小于1。
本实施例中,拷贝n份中的整数份的fexc_start到fexc_end的频带范围内的低频带激励信号时,可以顺次拷贝,即每次拷贝一份的fexc_start到fexc_end的频带范围内的激励信号,直到拷贝n份的fexc_start到fexc_end的频带范围内的激励信号。或者也可以镜像拷贝(或者成为对折拷贝),即拷贝整数份的fexc_start到fexc_end的频带范围内的激励信号时,依次进行正向拷贝(即从fexc_start到fexc_end)和反向拷贝(即从fexc_end到fexc_start)的交错拷贝,直到完成N份的拷贝。
或者解码设备可以从ftop_sfm开始,拷贝n份的fexc_start到fexc_end的频带范围内的激励信号作为fbwe_start与ftop_sfm之间的高频带激励信号。具体可以采用如下方式实现:解码设备从ftop_sfm开始,依次拷贝n份中的非整数份的fexc_start到fexc_end的频带范围内的激励信号和n份中的整数份的fexc_start到fexc_end的频带范围内的激励信号作为fbwe_start与ftop_sfm之间的高频带激励信号;n份中的非整数份小于1。
具体地,可以从ftop_sfm开始,拷贝n份中的非整数份的fexc_start到fexc_end的频带范围内的激励信号时属于整块拷贝,例如高频带信号的最高频点为14kHz,fexc_start到fexc_end为1.6kHz到4kHz,当取0.5份的fexc_start到fexc_end即1.6kHz到2.8kHz的激励信号。采用该步骤的方案可以将1.6kHz到2.8kHz的激励信号拷贝至(14-1.2)kHz到14kHz之间作为这段高频带信号的激励信号,此时1.6kHz对应拷贝至(14-1.2)kHz上,2.8kHz对应拷贝至14kHz上。
通过上述两种方式,无论从fbwe_start开始拷贝,还是从ftop_sfm开始拷贝,最终预测得到的fbwe_start与ftop_sfm之间的高频带激励信号的结果是一样的。
在上述方案实施过程中,可以先计算fbwe_start到ftop_sfm之间的频点数量除以fexc_start到fexc_end之间的频点数量所得的比值n。
进一步可选地,其中步骤(4)解码设备根据低频带信号中预定频带范围内的激励信号、预设的高频带信号的带宽扩展的起始频点和低频带信号有比特分配的最高频点预测高频带信号的激励信号,包括:
拷贝从预定频带范围的起始频点fexc_start之上的第m个频点开始到预定频带范围的结束频点fexc_end之间的激励信号,和n份预定频带范围内的激励信号作为低频带信号有比特分配的最高频点与带宽扩展频带的最高频点之间的激励信号。
本实施例中n为零、正整数或者正小数,m为低频带信号有比特分配的最高频点与预设的扩展频带的起始频点之间的频点数量差值,可以表示为(flast_sfm—fbwe_start)。
此时,拷贝从fexc_start之上的第(flast_sfm—fbwe_start)个频点开始到fexc_end之间的激励信号,和n份fexc_start到fexc_end频带范围内的激励信号作为flast_sfm与ftop_sfm之间的激励信号,n可以为零、正整数或者正小数。
具体实现时,解码设备可以从flast_sfm开始,依次拷贝从fexc_start+(flast_sfm—fbwe_start))到fexc_end频带范围内的激励信号、n份中的整数份的fexc_start到fexc_end的激励信号、和n份中的非整数份的fexc_start到fexc_end的频带范围内的激励信号作为flast_sfm与ftop_sfm之间的高频带激励信号;其中n份中的非整数份小于1。
或者解码设备可以从ftop_sfm开始,依次拷贝n份的fexc_start到fexc_end的激励信号,和从(fexc_start+(flast_sfm—fbwe_start))到fexc_end频带范围内的激励信号作为flast_sfm与ftop_sfm之间的高频带激励信号;同理,其中n为零、正整数或者正小数。
具体实现时,解码设备可以从ftop_sfm开始,依次拷贝n份中的非整数份的fexc_start到fexc_end的频带范围内的激励信号、n份中的整数份的fexc_start到fexc_end的频带范围内的激励信号、和从fexc_start+(flast_sfm—fbwe_start))到fexc_end频带范围内的激励信号作为点flast_sfm与ftop_sfm之间的高频带激励信号;其中n份中的非整数份小于1。
当解码设备从ftop_sfm开始预测,拷贝n份中的非整数份的fexc_start到fexc_end的频带范围内的激励信号也属于整块拷贝,低频带范围内的低频点对应的激励信号在高频带中位于相应的低频点上,而低频带范围内的高频点对应的激励信号在高频带中位于相应的高频点上,详细可以参考上述相关记载。同理,n份中的整数份的fexc_start到fexc_end的频带范围内的低频带激励信号的拷贝也可以为顺次拷贝或者镜像拷贝,详细可以参考上述相关记载,在此不再赘述。
通过上述两种方式,无论从flast_sfm开始,还是从ftop_sfm开始预测flast_sfm与ftop_sfm之间的高频带激励信号,最终预测得到的flast_sfm与ftop_sfm之间的高频带激励信号的结果是一样的。
且上述方案中,当(fexc_start+(flast_sfm—fbwe_start))到fexc_end的带宽大于等于flast_sfm与ftop_sfm之间的频点数量时,仅需在(fexc_start+(flast_sfm—fbwe_start))到fexc_end中,从(fexc_start+(flast_sfm—fbwe_start))开始,获取频点等于flast_sfm与ftop_sfm的激励信号作为flast_sfm与ftop_sfm之间的激励信号。
在上述方案实施过程中,可以先计算获取(flast_sfm到ftop_sfm之间的频点数量—(fexc_start+(flast_sfm—fbwe_start))的差值)除以fexc_start到fexc_end之间的频点数量所得的比值即为n,n可以为零、正整数或者正小数。。
例如在编码速率为24kbps时,fbwe_start=6.4kHz,ftop_sfm为14kHz。高频带信号的激励信号采用如下方式预测:假定预选择的低频带信号扩展范围为从0~4kHz。第N帧有比特分配的最高频点flast_sfm=8kHz,此时flast_sfm>fbwe_start,则先对选定的0~4kHz的低频带信号激励信号做自适应归一化处理(具体地自适应归一化处理的过程详细可以参考上述实施例的记载,在此不再赘述),然后8kHz以上的高频带信号激励信号从归一化的低频带信号激励信号中进行预测,而按照上述实施例的方式被选择的归一化低频带信号激励信号被拷贝的顺序为:先拷贝(8kHz-6.4kHz)到4kHz的低频带范围内的激励信号,然后再拷贝0.9份的fexc_start到fexc_end(0~4kHz)的低频带范围内的激励信号,即拷贝0kHz到3.6kHz的低频带范围内的激励信号,作为有比特分配的最高频点(flast_sfm=8kHz)到高频带信号的最高频点ftop_sfm(ftop_sfm=14kHz)之间的高频带激励信号。如果第N+1帧有比特分配的最高频点flast_sfm<=6.4kHz(预设的高频带信号带宽扩展的起始频点fbwe_start=6.4kHz),选定的0~4kHz的低频带信号激励信号做自适应归一化处理,然后对6.4kHz以上的高频带信号激励信号从归一化的低频带信号激励信号中进行预测,按照上述实施例的方式被选择的归一化低频带信号激励信号被拷贝的顺序为:先拷贝1份的fexc_start到fexc_end(0~4kHz)的低频带范围内的激励信号,再拷贝0.9份的fexc_start到fexc_end(0~4kHz)的低频带范围内的激励信号,作为预设的高频带信号带宽扩展的起始频点(fbwe_start=6.4kHz)到高频带信号的最高频点ftop_sfm(ftop_sfm=14kHz)之间的高频带激励信号。
高频带信号的最高频点是根据频域信号的类别确定的,例如当频域信号的类别为超宽带信号时,高频带信号的最高频点ftop_sfm为14KHZ。而编码设备和解码设备在进行通信之前通常已经确定了要传输的频域信号的类别,所以频域信号的最高频点便可以认为是确定的。
上述实施例的高频带信号的预测方法,通过采用如上技术方案,对于谐波和非谐波采用不同的包络信息预测高频带信号,能够避免在预测过程中引入过多的噪声,有效地减少修正得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
且经过上述高频带信号激励信号的预测可以发现,虽然第N帧和第N+1帧的高频带信号带宽扩展开始预测的频带不同,但在8kHz以上相同频带的激励信号,都是从低频带信号相同频带的激励信号预测得到的,因此可以保证帧间的连续性。
采用上述实施例的技术方案,能够有效地保证前后帧间预测的高频带信号激励信号的连续性。从而保证了恢复的高频带信号的听觉质量,从而提升音频信号的听觉质量。
图4为本发明另一实施例提供的高频带信号的预测方法的流程图。本实施例的高频带信号的预测方法的执行主体可以为编码设备。如图4所示,本实施例的高频带信号的预测方法,具体可以包括如下步骤:
200、编码设备获取音频信号的信号类型和低频带信号;
本实施例中的信号类型为谐波或者非谐波,本实施例的音频信号包括低频带信号和高频带信号。
201、编码设备根据信号类型对高频带信号的频域包络进行编码,得到高频带信号的频域包络;
202、编码设备向解码设备发送携带信号类型、低频带信号和高频带信号的频域包络的码流。
本实施例是在编码设备一侧描述本发明实施例的技术方案,以及在本实施例中在码流中携带信号类型、低频带信号和高频带信号的频域包络的编码索引的码流。
对应地,在解码设备侧,解码设备接收码流,解复用获取信号类型和低频带信号,然后根据信号类型从接收的码流中解码获取到对应的高频带信号的频域包络。再根据低频带信号预测高频带信号的激励信号;根据高频带信号的频域包络和高频带信号的激励信号恢复高频带信号。具体地,本实施例中与上述图3所示实施例的扩展实施例中的解码设备接收的特流中携带信号类型、低频带信号的量化参数和高频带信号的频域包络的编码索引对应,具体实施过程详细亦可以参考上述图3所示实施例的扩展实施例的相关记载,在此不再赘述。
本实施例的高频带信号的预测方法,编码设备通过获取信号类型和低频带信号;根据信号类型对高频带信号的频域包络进行编码,得到高频带信号的频域包络;向解码设备发送携带信号类型、低频带信号和高频带信号的频域包络的码流,以供解码设备对码流进行解码获取低频带信号的量化参数和信号类型;根据信号类型获取高频带信号的频域包络,并根据低频带信号的量化参数预测高频带信号的激励信号,再根据高频带信号的频域包络和高频带信号的激励信号预测高频带信号。采用本实施例的技术方案,能够避免在预测过程中引入过多的噪声,有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
同理可选地,上述实施例的技术方案中,201中编码设备根据信号类型对高频带信号的频域包络进行编码,得到高频带信号的频域包络,例如当信号类型为非谐波信号时,使用第一数量个频谱系数计算高频带信号的频域包络;当信号类型为谐波信号时,使用第二数量个频谱系数计算高频带信号的频域包络;其中,第二数量大于第一数量、这样当信号类型为谐波时编码设备编码得到的高频带信号的频域包络覆盖的子带宽度大于信号类型为非谐波时编码设备编码得到的高频带信号的频域包络覆盖的子带宽度。具体实现过程详细可以参考上述图3及图3所示实施例的扩展实施例的记载,在此不再赘述。
图5为本发明再一实施例提供的高频带信号的预测方法的流程图。本实施例的高频带信号的预测方法的执行主体可以为编码设备。如图5所示,本实施例的高频带信号的预测方法,具体可以包括如下:
300、编码设备获取音频信号的信号类型和低频带信号;
本实施例中的信号类型为谐波或者非谐波,音频信号包括低频带信号和高频带信号。
301、编码设备计算高频带信号的频域包络;
本实施例中的谐波信号的高频带信号的频域包络的计算方法和非谐波信号的计算方法一样。
302、编码设备向解码设备发送携带信号类型、低频带信号和高频带信号的频域包络编码索引的码流。
同理,本实施例是在编码设备一侧描述本发明实施例的技术方案,以及在本实施例中在码流中携带信号类型、低频带信号和高频带信号的频域包络编码索引的码流。
对应地,在解码设备侧,解码设备接收码流,解复用获取信号类型和低频带信号;然后根据信号类型获取高频带信号的频域包络,例如当信号类型为非谐波信号时,对接收的码流进行解复用,解码得到高频带信号的频域包络;当信号类型为谐波时,对接收的码流进行解复用,解码得到高频带信号的初始频域包络;将初始频域包络与相邻的N个初始频域包络加权计算得到的值作为高频带信号的频域包络,其中N大于等于1。再根据低频带信号预测高频带信号的激励信号;根据高频带信号的频域包络和高频带信号的激励信号恢复高频带信号。具体地,本本实施例中与上述图3所示实施例的扩展实施例中的另一情况对应,具体实施过程详细亦可以参考上述图3及图3所示实施例的扩展实施例的相关记载,在此不再赘述。
本实施例的高频带信号的预测方法,编码设备通过获取音频信号的信号类型、低频带信号;计算高频带信号的频域包络;向解码设备发送携带信号类型、低频带信号和高频带信号的频域包络编码索引的码流,以供解码设备对码流解复用获取信号类型和低频带信号;然后根据信号类型获取高频带信号的频域包络,再根据低频带信号预测高频带信号的激励信号;根据高频带信号的频域包络和高频带信号的激励信号恢复高频带信号。采用本实施例的技术方案,能够避免在预测过程中引入过多的噪声,有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图6为本发明一实施例提供的解码设备的结构示意图。如图6所示,本实施例的解码设备,包括:第一获取模块30、第二获取模块31和预测模块32和恢复模块33。
其中第一获取模块30用于获取音频信号的信号类型和低频带信号;该信号类型为谐波或者非谐波,音频信号包括低频带信号和高频带信号;第二获取模块31与第一获取模块30连接,第二获取模块31用于根据第一获取模块30获取的信号类型获取高频带信号的频域包络;预测模块32与第一获取模块30连接,预测模块32用于根据第一获取模块30获取的低频带信号预测高频带信号的激励信号;恢复模块33分别与第二获取模块31和预测模块32连接,恢复模块33用于根据第二获取模块31获取的高频带信号的频域包络和预测模块32预测得到的高频带信号的激励信号恢复高频带信号。
本实施例的解码设备,通过采用上述模块实现高频带信号的预测与上述相关方法实施例的实现过程相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
本实施例的解码设备,通过采用上述模块实现对不同类型信号采用不同的频谱系数解码包络,使得从低频预测的高频带谐波信号的激励能保持住原来的谐波特性,能够避免在预测过程中引入过多的噪声,有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
图7为本发明另一实施例提供的解码设备的结构示意图。本实施例的解码设备在上述图6所示实施例的基础上,进一步还可以包括如下扩展技术方案,
本实施例的解码设备中,第二获取模块31具体用于当第一获取模块30获取的信号类型为非谐波信号时,对接收的码流进行解复用,解码得到高频带信号的频域包络;或者第二获取模块31具体用于当第一获取模块30获取的信号类型为谐波时,对接收的码流进行解复用,解码得到高频带信号的初始频域包络;将初始频域包络与相邻的N个初始频域包络加权计算得到的值作为高频带信号的频域包络,其中N大于等于1。
或者可选地,本实施例的解码设备中,第二获取模块31具体用于根据第一获取模块30获取的信号类型从接收的码流中解码获取到对应的高频带信号的频域包络。
可选地,本实施例的解码设备中第一获取模块30具体用于对码流进行解复用,获取信号类型和低频带信号。此时对应的解码设备接收编码设备发送的码流中携带信号类型、低频带信号和高频带信号的频域包络的编码索引。
或者可选地,本实施例的解码设备中第一获取模块30具体对码流进行解复用,获取低频带信号;根据低频带信号确定信号类型。
可选地,本实施例的解码设备中预测模块32具体可以包括:确定单元321、判断单元322、第一处理单元323和第二处理单元324。
其中确定单元321与第一获取模块30连接,确定单元321用于确定第一获取模块30获取的低频带信号有比特分配的最高频点;判断单元322与确定单元321连接,判断单元322用于判断确定单元321确定的低频带信号有比特分配的最高频点是否小于预设的高频带信号的带宽扩展的起始频点;第一处理单元323与判断单元322连接,第一处理单元323用于当判断单元322确定低频带信号有比特分配的最高频点小于预设的高频带信号的带宽扩展的起始频点时,根据低频带信号中预定频带范围内的激励信号和预设的高频带信号的带宽扩展的起始频点预测所述高频带信号的激励信号。第二处理单元324也与判断单元322连接,第二处理单元324用于当判断单元322确定低频带信号的有比特分配的最高频点大于等于预设的高频带信号的带宽扩展的起始频点时,根据低频带信号中预定频带范围内的激励信号、预设的高频带信号的带宽扩展的起始频点和低频带信号有比特分配的最高频点预测高频带信号的激励信号。此时对应的,恢复模块33分别与第二获取模块31、第一处理单元323和第二处理单元324连接,但是同一时刻,恢复模块33只能与第一处理单元323和第二处理单元324中一者连接。当判断单元322确定低频带信号有比特分配的最高频点小于预设的高频带信号的带宽扩展的起始频点时,恢复模块33与第一处理单元323连接。当判断单元322确定低频带信号的有比特分配的最高频点大于等于预设的高频带信号的带宽扩展的起始频点时,恢复模块33与第二处理单元324连接。恢复模块33具体用于根据第二获取模块31获取的高频带信号的频域包络和第一处理单元323或者第二处理单元324预测得到的高频带信号的激励信号恢复高频带信号。
进一步可选地,本实施例的解码设备中第一处理单元323具体用于当判断单元322确定低频带信号有比特分配的最高频点小于预设的高频带信号的带宽扩展的起始频点时,拷贝n份预定频带范围内的激励信号作为预设的高频带信号的带宽扩展的起始频点与带宽扩展频带的最高频点之间的激励信号;n为正整数或者正小数,n等于预设的高频带信号的带宽扩展的起始频点与带宽扩展频带的最高频点之间的频点数量和预定频带范围内频点数量的比值。第一处理单元323具体实现可以采用上述图3所示实施例的扩展实施例记载的技术方案,在此不再赘述。
进一步可选地,本实施例的解码设备中第二处理单元324具体用于当判断单元322确定低频带信号的有比特分配的最高频点大于等于预设的高频带信号的带宽扩展的起始频点时,拷贝从预定频带范围的起始频点fexc_start之上的第m个频点开始到预定频带范围的结束频点fexc_end之间的激励信号,和n份预定频带范围内的激励信号作为低频带信号有比特分配的最高频点与带宽扩展频带的最高频点之间的激励信号;n为零、正整数或者正小数,m为低频带信号有比特分配的最高频点与预设的扩展频带的起始频点之间的频点数量差值。第二处理单元324具体实现可以采用上述图3所示实施例的扩展实施例记载的技术方案,在此不再赘述。
本实施例的解码设备是以上述多种可选实施例并存的方式介绍本发明的技术方案,实际引用中,上述多种可选实施例可以采用任意组合的方式形成本发明的实施例,详细不再赘述。
本实施例的解码设备,通过采用上述模块实现高频带信号的预测与上述相关方法实施例的实现过程相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
本实施例的解码设备,通过采用上述模块对不同类型信号采用不同的频谱系数解码包络,使得从低频预测的高频带谐波信号的激励能保持住原来的谐波特性能够避免在预测过程中引入过多的噪声,有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
图8为本发明一实施例提供的编码设备的结构示意图。如图8所示,本实施例的编码设备,具体可以包括:获取模块40、编码模块41和发送模块42。
其中获取模块40用于获取音频信号的信号类型和低频带信号,信号类型为谐波或者非谐波,音频信号包括低频带信号和高频带信号;编码模块41与获取模块40连接,编码模块41用于根据获取模块40获取的信号类型对高频带信号的频域包络进行编码,得到高频带信号的频域包络;发送模块42分别于获取模块40和编码模块41连接,发送模块42用于向解码设备发送携带获取模块40获取的信号类型、获取模块40获取的低频带信号和编码模块41编码得到的高频带信号的频域包络的编码索引的码流。
例如编码设备通过采用上述模块可以将携带信号类型、低频带信号和高频带信号的频域包络的编码索引的码流发送给解码设备,以供解码设备获取音频信号的信号类型和低频带信号;信号类型为谐波或者非谐波,音频信号包括低频带信号和高频带信号;根据信号类型获取高频带信号的频域包络;根据低频带信号预测高频带信号的激励信号;根据高频带信号的频域包络和高频带信号的激励信号恢复高频带信号。详细可以参考上述相关实施例的记载,在此不再赘述。
本实施例的编码设备,通过采用上述模块实现高频带信号的预测与上述相关方法实施例的实现过程相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
本实施例的编码设备,通过采用上述模块能够便于实现对不同类型信号采用不同的频谱系数解码包络,使得从低频预测的高频带谐波信号的激励能保持住原来的谐波特性能够避免在预测过程中引入过多的噪声,有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
可选地,在上述图8所示实施例的基础上,编码模块41具体用于当获取模块40获取的信号类型为非谐波信号时,使用第一数量个频谱系数计算高频带信号的频域包络;或者编码模块41具体用于当获取模块40获取的信号类型为谐波信号时,使用第二数量个频谱系数计算高频带信号的频域包络;其中,第二数量大于第一数量。
图9为本发明另一实施例提供的编码设备的结构示意图。如图9所示,本实施例的编码设备,具体可以包括:获取模块50、计算模块51和发送模块52。
其中获取模块50用于获取音频信号的信号类型和低频带信号,信号类型为谐波或者非谐波,音频信号包括低频带信号和高频带信号;计算模块51用于计算高频带信号的频域包络,其中谐波信号的高频带信号的频域包络的计算方法和非谐波信号的计算方法一样;发送模块52分别与获取模块50和计算模块51连接,发送模块52用于向解码设备发送携带获取模块50获取的信号类型、获取模块50获取的低频带信号和计算模块51计算得到的高频带信号的频域包络编码索引的码流。
例如编码设备通过采用上述模块可以将携带信号类型、低频带信号和高频带信号的频域包络的编码索引的码流发送给解码设备,以供解码设备获取音频信号的信号类型和低频带信号;信号类型为谐波或者非谐波,音频信号包括低频带信号和高频带信号;根据信号类型获取高频带信号的频域包络;根据低频带信号预测高频带信号的激励信号;根据高频带信号的频域包络和高频带信号的激励信号恢复高频带信号。详细可以参考上述相关实施例的记载,在此不再赘述。
本实施例的编码设备,通过采用上述模块实现高频带信号的预测与上述相关方法实施例的实现过程相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
本实施例的编码设备,通过采用上述模块能够便于实现对不同类型信号采用不同的频谱系数解码包络,使得从低频预测的高频带谐波信号的激励能保持住原来的谐波特性能够避免在预测过程中引入过多的噪声,有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
图10为本发明实施例提供的编码设备的实例图。如图10所示,本实施例的编码设备是在上述图1所示的现有的编码设备中增加本发明实施例的技术方案所形成的编码设备的一种实例图。如图10所示,在图1所示现有技术的编码设备的基础上,本实施例的编码设备中增加了分类提取和编码模块17。
该分类提取和编码模块17与时频变换模块10连接,分类提取和编码模块17用于获取时频变换模块10转换后的信号类型,并根据信号类型对包络量化编码模块12量化后的高频带信号的频域包络进行编码,这里的信号类型可以为谐波或者非谐波。分类提取和编码模块17还与复用模块16连接,复用模块16用于此时分别用于对分类提取和编码模块17获取的信号类型、根据信号类型对高频带信号的频域包络编码得到的编码索引、以及激励量化编码模块15量化后的激励信号复用为码流,然后输出给解码设备。其余与上述图1所示实施例相同,详细可以参考上述相关实施例的记载,在此不在赘述。
本实施例的编码设备的技术方案的实现具体可以结合参考上述图1、图4和图6所示实施例的记载,在此不再赘述。
本实施例的编码设备,通过采用上述技术方案,对于谐波和非谐波获取不同的包络信息并发送至解码设备,以供解码设备对于谐波和非谐波采用不同修正预测的高频带信号激励信号,能够避免在修正过程中引入过多的噪声,有效地减少修正得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
或者可选地,上述图13所示实施例中还可以增加计算模块,计算模块用于计算高频带信号的频域包络,其中谐波信号的高频带信号的频域包络的计算方法和非谐波信号的计算方法一样;此时分类提取和编码模块17不根据信号类型对包络量化编码模块12量化后的高频带信号的频域包络进行编码,其实实施与上述图10所示实施例相同。该实施例的编码设备的技术方案的实现具体可以结合参考上述图1、图5和图7所示实施例的记载,在此不再赘述。
图11为本发明实施例提供的解码设备的实例图。如图11所示,本实施例的编码设备是在上述图2所示的现有的解码设备中增加本发明实施例的技术方案所形成的解码设备的实例图。如图11所示,在图2所示现有技术的编码设备的基础上,本实施例的解码设备中增加了解码分类信息模块27。
解码分类信息模块27用于从接收的码流中获取信号类型。频域信号恢复模块25还与解码分类信息模块27连接,频域信号恢复模块25根据解码分类信息模块27得到的解码分类信息模块27得到的信号类型、频域包络解码模块21得到的频域包络和带宽扩展模块24得到的整个频带的激励信号恢复出频域信号。
同时本实施例中,带宽扩展模块24根据激励信号解码模块23得到的激励信号对整个带宽进行扩展即利用低频带信号的激励信号扩展高频带信号的激励信号,可以采用上述图3所述实施例的扩展实施例中记载的根据低频带信号预测高频带信号的激励信号的方法,详细参考上述相关实施例的记载,在此不在赘述。
本实施例的解码设备,通过采用上述方案,能够有效地保证前后帧间预测的高频带信号激励信号的连续性,同时对于谐波和非谐波采用不同的包络信息修正预测的高频带信号激励信号,能够避免在修正过程中引入过多的噪声,有效地减少修正得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。
上述图10所示实施例中的编码设备和图11所示实施例中的解码设备仅为本发明的一种可选的实例结构,实际应用中还可以根据上述图3-图9所示实施例的技术方案演绎出本发明的更多种可选的实例结构,详细可以参考上述实施例的记载,在此不再赘述。
图12为本发明实施例提供的高频带信号的预测系统的结构示意图。本实施例的高频带信号的预测系统包括编码设备70和解码设备80。
本实施例的解码设备80可以采用上述图6或者图7所示实施例的解码设备。编码设备70可以采用现有技术的编码设备或者图8或者图9所示实施例的编码设备。
本实施例的高频带信号的预测系统,采用编码设备70和解码设备80实现高频带信号的预测的具体实现过程详细可以参考上述图6、图7、图8或者图9所示实施例以及相关方法实施例的记载,在此不在赘述。
本实施例的高频带信号的预测系统,通过采用如上技术方案,对于谐波和非谐波采用不同的包络信息修正预测的高频带信号激励信号,能够避免在修正过程中引入过多的噪声,有效地减少修正得到的高频带信号与真实的高频带信号之间存在的误差,提高预测高频带信号的准确率。且高频带信号的预测系统采用图7所示实施例的解码设备80时,还能够有效地保证前后帧间预测的高频带信号激励信号的连续性。从而保证了恢复的高频带信号的听觉质量,从而提升音频信号的听觉质量。
图13是根据本发明另一实施例的装置90的框图。图13的装置90可用于实现上述方法实施例中各步骤及方法。装置90可应用于各种通信系统中的基站或者终端。图13的实施例中,装置90包括接收电路902、解码处理器903、处理单元904,存储器905和天线901。处理单元904控制装置90的操作,处理单元904还可以称为CPU(Central Processing Unit,中央处理单元)。存储器905可以包括只读存储器和随机存取存储器,并向处理单元904提供指令和数据。存储器905的一部分还可以包括非易失行随机存取存储器(NVRAM)。具体的应用中,装置90可以嵌入或者本身可以就是例如移动电话之类的无线通信设备,还可以包括容纳接收电路901的载体,以允许装置90从远程位置接收数据。接收电路901可以耦合到天线901。装置90的各个组件通过总线系统906耦合在一起,其中总线系统906除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图13中将各种总线都标为总线系统906。装置90还可以包括用于处理信号的处理单元904,此外还包括解码处理器903。
上述本发明实施例揭示的方法可以应用于解码处理器903中,或者由解码处理器903实现。解码处理器903可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例(例如图3对应的方法实施例)的各步骤可以通过解码处理器903中的硬件的集成逻辑电路或者软件形式的指令完成。这些指令可以通过处理单元904以配合实现及控制。上述的解码处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立的门或者晶体管逻辑器件、分立的硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器,或者该处理器也可以是任何常规的处理器、译码器等。结合本发明实施例所公开的方法的步骤可以直接通过体现为硬件的解码处理器执行完成,或者用解码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器905,解码处理器903读取存储器905中的信息,结合其硬件完成上述方法的步骤。
例如,图6或图7的信号解码设备可以由解码处理器903实现。另外,图6中的第一获取模块30、第二获取模块31、预测模块32和恢复模块33可以由处理单元904实现,也可以由解码处理器903实现。同理,图7中的各个模块可以由处理单元904实现,也可以由解码处理器903实现。但上述例子仅仅是示意性的,并非将本发明实施例限于这样的具体实现形式。
具体地,存储器905存储使得处理器904、或解码处理器903实现以下操作的指令:获取音频信号的信号类型和低频带信号;所述音频信号包括低频带信号和高频带信号;根据所述信号类型获取高频带信号的频域包络;根据所述低频带信号预测高频带信号的激励信号;根据所述高频带信号的频域包络和所述高频带信号的激励信号恢复高频带信号。
图14是根据本发明另一实施例的装置100的框图。图14的装置90可用于实现上述方法实施例中各步骤及方法。装置100可应用于各种通信系统中的基站或者终端。图14的实施例中,装置100包括接收电路1002、编码处理器1003、处理单元1004,存储器1005和天线1001。处理单元1004控制装置100的操作,处理单元1004还可以称为CPU(CentralProcessing Unit,中央处理单元)。存储器1005可以包括只读存储器和随机存取存储器,并向处理单元1004提供指令和数据。存储器1005的一部分还可以包括非易失行随机存取存储器(NVRAM)。具体的应用中,装置100可以嵌入或者本身可以就是例如移动电话之类的无线通信设备,还可以包括容纳接收电路1001的载体,以允许装置100从远程位置接收数据。接收电路1001可以耦合到天线1001。装置100的各个组件通过总线系统1006耦合在一起,其中总线系统1006除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图14中将各种总线都标为总线系统1006。装置100还可以包括用于处理信号的处理单元1004,此外还包括编码处理器1003。
上述本发明实施例揭示的方法可以应用于编码处理器1003中,或者由编码处理器1003实现。编码处理器1003可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例(例如图4或5对应的方法实施例)的各步骤可以通过编码处理器1003中的硬件的集成逻辑电路或者软件形式的指令完成。这些指令可以通过处理单元1004以配合实现及控制。上述的编码处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立的门或者晶体管逻辑器件、分立的硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器,或者该处理器也可以是任何常规的处理器、译码器等。结合本发明实施例所公开的方法的步骤可以直接通过体现为硬件的解码处理器执行完成,或者用解码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1005,编码处理器1003读取存储器1005中的信息,结合其硬件完成上述方法的步骤。
例如,图8或图9的信号编码设备可以由编码处理器1003实现。另外,图8中的获取模块40、编码模块41和发送模块42可以由处理单元1004实现,也可以由编码处理器1003实现。同理,图9中的各个模块可以由处理单元1004实现,也可以由编码处理器1003实现。但上述例子仅仅是示意性的,并非将本发明实施例限于这样的具体实现形式。
具体地,存储器1005存储使得处理器1004、或编码处理器1003实现以下操作的指令:获取音频信号的信号类型和低频带信号,所述音频信号包括低频带信号和高频带信号;根据所述信号类型对高频带信号的频域包络进行编码,得到高频带信号的频域包络;向解码设备发送携带所述信号类型、所述低频带信号和所述高频带信号的频域包络的编码索引的码流。
具体地,存储器1005存储使得处理器1004、或编码处理器1003实现以下操作的指令:获取音频信号的信号类型和低频带信号,所述信号类型为谐波信号或者非谐波信号,所述音频信号包括低频带信号和高频带信号;计算高频带信号的频域包络,其中谐波信号的高频带信号的频域包络的计算方法和非谐波信号的计算方法一样;向解码设备发送携带所述信号类型、所述低频带信号和高频带信号的频域包络编码索引的码流。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到至少两个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (15)
1.一种高频带信号的预测方法,其特征在于,包括:
获取待解码音频信号的信号类型和所述音频信号的低频带信号,所述音频信号的信号类型为谐波信号或非谐波信号;
根据所述音频信号的信号类型获取所述音频信号的高频带信号的频域包络,其中,不同信号类型的音频信号的高频带信号的频域包络是采用不同的频谱系数获取的;
根据所述音频信号的所述低频带信号预测所述音频信号的高频带信号的激励信号;
根据所述高频带信号的频域包络和所述高频带信号的激励信号恢复出所述音频信号的高频带信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述音频信号的信号类型获取所述音频信号的高频带信号的频域包络包括:
当所述信号类型为非谐波信号时,对接收的所述音频信号的码流进行解码得到所述音频信号的高频带信号的频域包络;
当所述信号类型为谐波时,对接收的所述音频信号的码流进行解码得到所述音频信号的高频带信号的初始频域包络;将所述初始频域包络与相邻的N个初始频域包络加权计算得到的值作为高频带信号的频域包络,其中N大于等于1。
3.根据权利要求1所述的方法,其特征在于,所述根据所述音频信号的信号类型获取所述音频信号的高频带信号的频域包络包括:
根据所述信号类型从接收的所述音频信号的码流中解码获取到对应的所述高频带信号的频域包络,所述音频信号的码流中携带了所述信号类型和所述高频带信号的频域包络的编码索引。
4.根据权利要求1至3任一所述的方法,其特征在于,获取音频信号的信号类型和低频带信号,包括:
对接收的所述音频信号的码流进行解码得到所述信号类型和所述低频带信号。
5.根据权利要求1至3任一所述的方法,其特征在于,当所述低频带信号有比特分配的最高频点小于预设的高频带信号的带宽扩展的起始频点时,所述根据所述低频带信号预测高频带信号的激励信号,包括:
拷贝n份预定频带范围内的激励信号作为所述预设的高频带信号的带宽扩展的起始频点与所述带宽扩展频带的最高频点之间的激励信号;所述n为正整数或者正小数,n等于预设的高频带信号的带宽扩展的起始频点与所述带宽扩展频带的最高频点之间的频点数量和预定频带范围内频点数量的比值。
6.根据权利要求1至3任一所述的方法,其特征在于,当所述低频带信号的有比特分配的最高频点大于等于预设的高频带信号的带宽扩展的起始频点时,所述根据所述低频带信号预测高频带信号的激励信号,包括:
拷贝从预定频带范围的起始频点fexc_start之上的第m个频点开始到所述预定频带范围的结束频点fexc_end之间的激励信号,和n份所述预定频带范围内的激励信号作为所述低频带信号有比特分配的最高频点与所述带宽扩展频带的最高频点之间的激励信号;所述n为零、正整数或者正小数,m为所述低频带信号有比特分配的最高频点与预设的扩展频带的起始频点之间的频点数量差值。
7.一种高频带信号的预测方法,其特征在于,包括:
获取音频信号的信号类型和所述音频信号的低频带信号,所述音频信号的信号类型为谐波信号或非谐波信号;
根据所述音频信号的信号类型计算所述音频信号的高频带信号的频域包络,其中,对不同类型的音频信号采用不同的频谱系数计算高频带信号的频域包络;
对所述音频信号的高频带信号的频域包络进行编码,得到所述音频信号的高频带信号的频域包络的编码索引;
对所述低频带信号进行编码,得到所述低频带信号的编码索引;
向解码设备发送携带所述音频信号的信号类型、所述低频带信号的编码索引和所述高频带信号的频域包络的编码索引的码流。
8.一种解码设备,其特征在于,包括:
第一获取模块,用于获取待解码音频信号的信号类型和所述音频信号的低频带信号,所述音频信号的信号类型为谐波信号或非谐波信号;
第二获取模块,用于根据所述音频信号的信号类型获取所述音频信号的高频带信号的频域包络,其中,不同信号类型的音频信号的高频带信号的频域包络是采用不同的频谱系数获取的;
预测模块,用于根据所述音频信号的低频带信号预测所述音频信号的高频带信号的激励信号;
恢复模块,用于根据所述高频带信号的频域包络和所述高频带信号的激励信号恢复出所述音频信号的高频带信号。
9.根据权利要求8所述的设备,其特征在于,所述第二获取模块,具体用于当所述信号类型为非谐波信号时,对接收的所述音频信号的码流进行解码得到高频带信号的频域包络;或者所述第二获取模块,具体用于当所述信号类型为谐波时,对接收的所述音频信号的码流进行解码得到高频带信号的初始频域包络;将所述初始频域包络与相邻的N个初始频域包络加权计算得到的值作为高频带信号的频域包络,其中N大于等于1。
10.根据权利要求8所述的设备,其特征在于,所述第二获取模块,具体用于根据所述信号类型从接收的所述音频信号的码流中解码获取到对应的所述高频带信号的频域包络,所述音频信号的码流中携带了所述信号类型和所述高频带信号的频域包络的编码索引。
11.根据权利要求8至10任一所述的设备,其特征在于,所述第一获取模块,具体用于对接收的所述音频信号的码流进行解码得到所述信号类型和所述低频带信号。
12.根据权利要求8至10任一所述的设备,其特征在于,所述第一获取模块,具体用于对接收的所述音频信号的码流进行解码得到所述音频信号的低频带信号; 根据所述低频带信号确定所述信号类型。
13.根据权利要求8至10任一所述的设备,其特征在于,所述预测模块包括:
确定单元,用于确定低频带信号有比特分配的最高频点;
判断单元,用于判断所述低频带信号有比特分配的最高频点是否小于预设的高频带信号的带宽扩展的起始频点;
第一处理单元,用于当所述判断单元确定所述低频带信号有比特分配的最高频点小于预设的高频带信号的带宽扩展的起始频点时,拷贝n份预定频带范围内的激励信号作为所述预设的高频带信号的带宽扩展的起始频点与所述带宽扩展频带的最高频点之间的激励信号;所述n为正整数或者正小数,n等于预设的高频带信号的带宽扩展的起始频点与所述带宽扩展频带的最高频点之间的频点数量和预定频带范围内频点数量的比值。
14.根据权利要求13所述的设备,其特征在于,所述预测模块还包括:
第二处理单元,用于当所述判断单元确定所述低频带信号的有比特分配的最高频点大于等于预设的高频带信号的带宽扩展的起始频点时,拷贝从预定频带范围的起始频点fexc_start之上的第m个频点开始到所述预定频带范围的结束频点fexc_end之间的激励信号,和n份所述预定频带范围内的激励信号作为所述低频带信号有比特分配的最高频点与所述带宽扩展频带的最高频点之间的激励信号;所述n为零、正整数或者正小数,m为所述低频带信号有比特分配的最高频点与预设的扩展频带的起始频点之间的频点数量差值。
15.一种编码设备,其特征在于,包括:
获取模块,用于获取音频信号的信号类型和所述音频信号的低频带信号,所述音频信号的信号类型为谐波信号或非谐波信号;
编码模块,用于根据所述音频信号的信号类型计算所述音频信号的高频带信号的频域包络,其中,对不同类型的音频信号采用不同的频谱系数计算高频带信号的频域包络;对所述音频信号的高频带信号的频域包络进行编码,得到所述音频信号的高频带信号的频域包络的编码索引;对所述低频带信号进行编码,得到所述低频带信号的编码索引;
发送模块,用于向解码设备发送携带所述音频信号的信号类型、所述低频带信号的编码索引和所述高频带信号的频域包络的编码索引的码流。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710076995.3A CN106847297B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310033625.3A CN103971693B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
CN201710076995.3A CN106847297B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310033625.3A Division CN103971693B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106847297A CN106847297A (zh) | 2017-06-13 |
CN106847297B true CN106847297B (zh) | 2020-07-07 |
Family
ID=51241109
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310033625.3A Active CN103971693B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
CN201710076995.3A Active CN106847297B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310033625.3A Active CN103971693B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
Country Status (10)
Country | Link |
---|---|
US (3) | US9704500B2 (zh) |
EP (2) | EP3779980A3 (zh) |
JP (2) | JP6204501B2 (zh) |
KR (3) | KR20150108421A (zh) |
CN (2) | CN103971693B (zh) |
BR (1) | BR112015018064B1 (zh) |
ES (1) | ES2822607T3 (zh) |
HK (1) | HK1199540A1 (zh) |
SG (1) | SG11201505885YA (zh) |
WO (1) | WO2014117458A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971693B (zh) | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
EP3040987B1 (en) | 2013-12-02 | 2019-05-29 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
EP3913628A1 (en) * | 2014-03-24 | 2021-11-24 | Samsung Electronics Co., Ltd. | High-band encoding method |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
JP7077139B2 (ja) | 2018-05-23 | 2022-05-30 | 株式会社豊田中央研究所 | 歪ゲージの製造方法および歪ゲージ |
JP7061587B2 (ja) | 2019-04-05 | 2022-04-28 | Ckd株式会社 | 流体制御弁 |
US10978083B1 (en) | 2019-11-13 | 2021-04-13 | Shure Acquisition Holdings, Inc. | Time domain spectral bandwidth replication |
CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN112767954B (zh) * | 2020-06-24 | 2024-06-14 | 腾讯科技(深圳)有限公司 | 音频编解码方法、装置、介质及电子设备 |
CN114582361B (zh) * | 2022-04-29 | 2022-07-08 | 北京百瑞互联技术有限公司 | 基于生成对抗网络的高解析度音频编解码方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101184979A (zh) * | 2005-04-01 | 2008-05-21 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
WO2009078681A1 (en) * | 2007-12-18 | 2009-06-25 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN101521014A (zh) * | 2009-04-08 | 2009-09-02 | 武汉大学 | 音频带宽扩展编解码装置 |
CN101763856A (zh) * | 2008-12-23 | 2010-06-30 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
WO2010091013A1 (en) * | 2009-02-04 | 2010-08-12 | Motorola, Inc. | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
CN102598123A (zh) * | 2009-10-23 | 2012-07-18 | 松下电器产业株式会社 | 编码装置、解码装置及其方法 |
CN102741921A (zh) * | 2010-01-19 | 2012-10-17 | 杜比国际公司 | 改进的基于子带块的谐波换位 |
CN102800317A (zh) * | 2011-05-25 | 2012-11-28 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3751225B2 (ja) * | 2001-06-14 | 2006-03-01 | 松下電器産業株式会社 | オーディオ帯域拡張装置 |
JP2003044098A (ja) | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
AU2006232362B2 (en) | 2005-04-01 | 2009-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for highband time warping |
KR100770839B1 (ko) * | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
EP2571024B1 (en) * | 2007-08-27 | 2014-10-22 | Telefonaktiebolaget L M Ericsson AB (Publ) | Adaptive transition frequency between noise fill and bandwidth extension |
JP4529092B2 (ja) * | 2007-09-25 | 2010-08-25 | ソニー株式会社 | チューナ装置 |
KR100970446B1 (ko) | 2007-11-21 | 2010-07-16 | 한국전자통신연구원 | 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 |
EP2224432B1 (en) | 2007-12-21 | 2017-03-15 | Panasonic Intellectual Property Corporation of America | Encoder, decoder, and encoding method |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
CN101751926B (zh) | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
CN101770775B (zh) * | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
CN102044250B (zh) * | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
CN102436820B (zh) * | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
AU2012217162B2 (en) * | 2011-02-14 | 2015-11-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Noise generation in audio codecs |
CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
CN103971694B (zh) * | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
EP3731226A1 (en) * | 2013-06-11 | 2020-10-28 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Device and method for bandwidth extension for acoustic signals |
-
2013
- 2013-01-29 CN CN201310033625.3A patent/CN103971693B/zh active Active
- 2013-01-29 CN CN201710076995.3A patent/CN106847297B/zh active Active
- 2013-05-29 WO PCT/CN2013/076408 patent/WO2014117458A1/zh active Application Filing
- 2013-05-29 KR KR1020157022814A patent/KR20150108421A/ko not_active Application Discontinuation
- 2013-05-29 EP EP20179865.9A patent/EP3779980A3/en active Pending
- 2013-05-29 BR BR112015018064-7A patent/BR112015018064B1/pt active IP Right Grant
- 2013-05-29 KR KR1020187006404A patent/KR101980057B1/ko active IP Right Grant
- 2013-05-29 SG SG11201505885YA patent/SG11201505885YA/en unknown
- 2013-05-29 ES ES13873224T patent/ES2822607T3/es active Active
- 2013-05-29 EP EP13873224.3A patent/EP2937861B1/en active Active
- 2013-05-29 KR KR1020177009587A patent/KR101837191B1/ko active IP Right Grant
- 2013-05-29 JP JP2015555543A patent/JP6204501B2/ja active Active
-
2014
- 2014-12-30 HK HK14113071.9A patent/HK1199540A1/zh unknown
-
2015
- 2015-07-24 US US14/808,145 patent/US9704500B2/en active Active
-
2017
- 2017-06-06 US US15/615,810 patent/US10089997B2/en active Active
- 2017-08-30 JP JP2017165309A patent/JP6574820B2/ja active Active
-
2018
- 2018-08-21 US US16/106,700 patent/US10636432B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101184979A (zh) * | 2005-04-01 | 2008-05-21 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
WO2009078681A1 (en) * | 2007-12-18 | 2009-06-25 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN101763856A (zh) * | 2008-12-23 | 2010-06-30 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
WO2010091013A1 (en) * | 2009-02-04 | 2010-08-12 | Motorola, Inc. | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
CN101521014A (zh) * | 2009-04-08 | 2009-09-02 | 武汉大学 | 音频带宽扩展编解码装置 |
CN102598123A (zh) * | 2009-10-23 | 2012-07-18 | 松下电器产业株式会社 | 编码装置、解码装置及其方法 |
CN102741921A (zh) * | 2010-01-19 | 2012-10-17 | 杜比国际公司 | 改进的基于子带块的谐波换位 |
CN102800317A (zh) * | 2011-05-25 | 2012-11-28 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2016509256A (ja) | 2016-03-24 |
US10636432B2 (en) | 2020-04-28 |
US9704500B2 (en) | 2017-07-11 |
SG11201505885YA (en) | 2015-09-29 |
EP2937861A4 (en) | 2016-08-03 |
EP3779980A2 (en) | 2021-02-17 |
KR20180026812A (ko) | 2018-03-13 |
ES2822607T3 (es) | 2021-05-04 |
KR20170043665A (ko) | 2017-04-21 |
CN106847297A (zh) | 2017-06-13 |
KR101980057B1 (ko) | 2019-05-17 |
JP6574820B2 (ja) | 2019-09-11 |
EP3779980A3 (en) | 2021-07-07 |
KR20150108421A (ko) | 2015-09-25 |
JP2017223987A (ja) | 2017-12-21 |
KR101837191B1 (ko) | 2018-03-09 |
EP2937861A1 (en) | 2015-10-28 |
BR112015018064B1 (pt) | 2020-12-01 |
US20170270944A1 (en) | 2017-09-21 |
BR112015018064A2 (pt) | 2017-07-18 |
JP6204501B2 (ja) | 2017-09-27 |
US20150332699A1 (en) | 2015-11-19 |
HK1199540A1 (zh) | 2015-07-03 |
EP2937861B1 (en) | 2020-08-12 |
CN103971693B (zh) | 2017-02-22 |
US10089997B2 (en) | 2018-10-02 |
CN103971693A (zh) | 2014-08-06 |
US20180366134A1 (en) | 2018-12-20 |
WO2014117458A1 (zh) | 2014-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106847297B (zh) | 高频带信号的预测方法、编/解码设备 | |
US10607621B2 (en) | Method for predicting bandwidth extension frequency band signal, and decoding device | |
JP6364518B2 (ja) | オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 | |
CN110706715B (zh) | 信号编码和解码的方法和设备 | |
WO2023197809A1 (zh) | 一种高频音频信号的编解码方法和相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |