CN110444217B - 解码装置、解码方法、记录介质 - Google Patents
解码装置、解码方法、记录介质 Download PDFInfo
- Publication number
- CN110444217B CN110444217B CN201910644499.2A CN201910644499A CN110444217B CN 110444217 B CN110444217 B CN 110444217B CN 201910644499 A CN201910644499 A CN 201910644499A CN 110444217 B CN110444217 B CN 110444217B
- Authority
- CN
- China
- Prior art keywords
- vector
- decoding
- prediction
- decoded
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 96
- 239000013598 vector Substances 0.000 claims abstract description 725
- 238000012937 correction Methods 0.000 claims abstract description 300
- 230000000875 corresponding effect Effects 0.000 description 251
- 238000004364 calculation method Methods 0.000 description 65
- 230000003595 spectral effect Effects 0.000 description 60
- 238000012545 processing Methods 0.000 description 53
- 230000008569 process Effects 0.000 description 44
- 238000001228 spectrum Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 21
- 230000005540 biological transmission Effects 0.000 description 18
- 238000013139 quantization Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 11
- 241000209094 Oryza Species 0.000 description 10
- 235000007164 Oryza sativa Nutrition 0.000 description 10
- 235000009566 rice Nutrition 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000005251 gamma ray Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000002161 passivation Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明提供一种解码装置,包括:预测对应解码单元,解码第一码,得到解码差分向量,将所述解码差分向量与至少包含来自过去的帧的预测的预测向量相加,生成可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及非预测对应解码单元,解码第二码,得到解码校正向量,将所述解码校正向量和至少所述解码差分向量的对应的阶数的元素彼此之间相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
Description
本申请为以下专利申请的分案申请:申请日为2015年3月16日,申请号为201580022683.3,发明名称为“编码装置、解码装置、及其方法、程序”。
技术领域
本发明涉及线性预测系数或可变换为线性预测系数的系数的编码技术以及解码技术。
背景技术
在语音或音乐等音响信号的编码中,利用对输入音响信号进行线性预测分析所得到的线性预测系数来编码的方法被广泛使用。
编码装置将线性预测系数编码,将与线性预测系数对应的码输送到解码装置,以便可以在解码装置侧解码在编码处理中使用的线性预测系数的信息。在非专利文献1中,编码装置将线性预测系数变换为与线性预测系数等效的频域的参数即LSP(Line SpectrumPair,线谱对)参数的列,将LSP参数的列编码所得到的LSP码输送到解码装置。
在非专利文献1中,为了减小LSP码的码量,采用使用了移动平均预测(MA预测)的向量编码以及解码技术。
首先,说明编码处理的流程。
<线性预测系数编码装置80>
图1表示以往的线性预测系数编码装置80的结构。
在线性预测系数编码装置80中输入每个帧的LSP(Line Spectrum Pairs)参数θf[1],θf[2],…,θf[p],线性预测系数编码装置80对每个帧进行以下的预测对应减法单元83、向量编码单元84、延迟输入单元87的处理,获得并输出LSP码Cf。而且,f表示帧号,p表示预测阶数。
在线性预测系数编码装置80中输入输入音响信号Xf的情况下,在线性预测系数编码装置80中还包括线性预测分析单元81和LSP计算单元82,连续输入帧单位的输入音响信号Xf,对每个帧进行以下的处理。
以下,说明各单元的具体处理。
<线性预测分析单元81>
线性预测分析单元81接收输入音响信号Xf,对输入音响信号Xf进行线性预测分析,求线性预测系数af[1]、af[2]、…、af[p]后输出。其中,af[i]表示对第f帧的输入音响信号Xf进行线性预测分析所得到的i阶线性预测系数。
<LSP计算单元82>
LSP计算单元82接收线性预测系数af[1]、af[2]、…、af[p],从线性预测系数af[1]、af[2]、…、af[p]求LSP参数θf[1]、θf[2]、…、θf[p],输出以求得的LSP参数作为元素的向量即LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T。其中,θf[i]是与第f帧的输入音响信号Xf对应的i阶的LSP参数。
<预测对应减法单元83>
预测对应减法单元83例如包含存储了规定的系数α的存储单元83c、存储了预测对应平均向量V的存储单元83d、乘法单元88、减法单元83a以及减法单元83b而构成。
预测对应减法单元83接收LSP参数向量Θf和前帧量化差分向量^Sf-1。
预测对应减法单元83生成并输出从LSP参数向量Θf减去预测对应平均向量V、和向量α^Sf-1后的向量即差分向量Sf=Θf-V-α×^Sf-1=(sf[1],sf[2],…,sf[p])T。
而且,预测对应平均向量V=(v[1],v[2],…,v[p])T是存储在存储单元83d中的预定的向量,例如,从预先学习用的音响信号求出即可。例如,使用在线性预测系数编码装置80中成为编码的对象的音响信号,以及在相同的环境(例如,说话者、收音装置、场所)中收音到的音响信号作为学习用的输入音响信号,求多个帧的LSP参数向量,将其平均作为预测对应平均向量。
乘法单元88将存储单元83c中存储的规定的系数α乘以前一帧的解码差分向量^Sf-1,得到向量α×^Sf-1。
而且,在图1中,使用两个减法单元83a以及83b,首先,在减法单元83a中,从LSP参数向量Θf减去存储单元83d中存储的预测对应平均向量V后,在减法单元83b中减去向量α×^Sf-1,但是该顺序也可以相反。或者,也可以通过从LSP参数向量Θf减去将预测对应平均向量V和向量α×^Sf-1相加后的向量V+α×^Sf-1,生成差分向量Sf。
当前的帧的差分向量Sf也可以称为从基于可变换为当前的帧的多阶的线性预测系数的系数的向量(LSP参数向量Θf),减去至少包含来自过去的帧的预测的向量所得到的向量。
<向量编码单元84>
向量编码单元84接收差分向量Sf,将差分向量Sf编码,得到并输出与LSP码Cf和LSP码Cf对应的量化差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T。为了差分向量Sf的编码,也可以使用将差分向量Sf向量量化的方法、将差分向量Sf分为多个子向量,分别将子向量进行向量量化的方法、将差分向量Sf或者子向量进行多级向量量化的方法、将向量的元素进行标量化的方法、将它们组合的方法等公知的任意的编码方法。
这里,说明使用将差分向量Sf进行向量量化的方法的情况的例子。
向量编码单元84从向量码本86中存储的多个候选差分向量中,搜索最接近差分向量Sf的候选差分向量作为量化差分向量^Sf输出,同时将对应于量化差分向量^Sf的差分向量码作为LSP码Cf输出。而且,量化差分向量^Sf与后述的解码差分向量对应。
<向量码本86>
在向量码本86中,预先存储各候选差分向量和与该各候选差分向量对应的差分向量码。
<延迟输入单元87>
延迟输入单元87接受量化差分向量^Sf,保持量化差分向量^Sf,使其延迟相当于1帧,作为前帧量化差分向量^Sf-1输出。即,在预测对应减法单元83对于第f帧的量化差分向量^Sf进行处理时,输出对第f-1帧的量化差分向量^Sf-1。
<线性预测系数解码装置90>
图2表示以往的线性预测系数解码装置90的结构。在线性预测系数解码装置90中,连续输入帧单位的LSP码Cf,以帧为单位解码LSP码Cf,得到解码预测对应LSP参数向量^Θf=(^θf[1],^θf[2],…,^θf[p])。
以下,说明各单元的具体处理。
<向量解码单元91>
向量解码单元91接收LSP码Cf,解码LSP码Cf,得到并输出与LSP码Cf对应的解码差分向量^Sf。在LSP码Cf的解码中,使用与编码装置的向量编码单元84的编码方法对应的解码方法。
这里,说明使用与将向量编码单元84的差分向量Sf进行向量量化的方法对应的解码方法的情况的例子。
向量解码单元91从向量码本92中存储的差分向量码中,搜索与LSP码Cf对应的多个差分向量码,将与该差分向量码对应的候选差分向量作为解码差分向量^Sf输出。而且,解码差分向量^Sf与前述的量化差分向量^Sf对应,只要没有传输错误或者在编码、解码的过程中的错误等,则对应的元素为相同的值。
<向量码本92>
在向量码本92中,预先存储各候选差分向量和与各候选差分向量对应的差分向量码。而且,向量码本92包含与前述的线性预测系数编码装置80的向量码本86共同的信息。
<延迟输入单元93>
延迟输入单元93接收解码差分向量^Sf,保持解码差分向量^Sf,使其延迟1帧的量,作为前帧解码差分向量^Sf-1输出。即,在预测对应加法单元95对第f帧的解码差分向量^Sf进行处理时,输出第f-1个帧的解码差分向量^Sf-1。
<预测对应加法单元95>
预测对应加法单元95例如包含存储了规定的系数α的存储单元95c、存储了预测对应平均向量V的存储单元95d、乘法单元94、加法单元95a以及95b构成。
预测对应加法单元95接收当前的帧的解码差分向量^Sf和前帧解码差分向量^Sf-1。
预测对应加法单元95生成并输出将解码差分向量^Sf、预测对应平均向量V=(v[1],v[2],…,v[N])T、向量α×^Sf-1相加后的向量即解码预测对应LSP参数向量^Θf(=^Sf+V+α^Sf-1)。
乘法单元94将存储单元95c中存储的规定的系数α乘以前帧解码差分向量^Sf-1,得到向量α×^Sf-1。
在图2中,使用两个加法单元95a以及95b,首先,在加法单元95a中,对当前的帧的解码差分向量^Sf加上向量α×^Sf-1后,在加法单元95b中加上预测对应平均向量V,但是该顺序也可以相反。或者,也可以通过将向量α×^Sf-1和预测对应平均向量V相加后的向量与解码差分向量^Sf相加,生成解码预测对应LSP参数向量^Θf。
而且,假设这里使用的预测对应平均向量V与在前述的线性预测系数编码装置80的预测对应减法单元83中使用的预测对应平均向量V相同。
<解码预测对应线性预测系数计算单元96>
在需要线性预测系数的情况下,也可以在线性预测系数解码装置90中具有解码预测对应线性预测系数计算单元96。在该情况下,解码预测对应线性预测系数计算单元96接受解码预测对应LSP参数向量^Θf,将解码预测对应LSP参数向量^Θf变换为解码预测对应线性预测系数^af[1],^af[2],…,^af[p]后输出。
现有技术文献
非专利文献
非专利文献1:"ITU-T Recommendation G.729",ITU,1996
发明内容
发明要解决的课题
在非专利文献1的线性预测系数解码装置中,使用作为第f-1帧的解码结果即解码差分向量^Sf-1进行第f帧的解码处理,所以存在不仅在当前帧的LSP码产生了传输错误的情况下,而且在前一帧的LSP码中产生了传输错误的情况下,也不能正确地解码当前帧的LSP参数的问题。
在非专利文献1的线性预测系数解码装置中,通过解码得到的LSP参数仅被用于线性预测合成,所以即使假设LSP参数不能正确解码,只要在连续的多个帧中解码音响信号的音质劣化的程度的问题中就可以解决。即,可以说非专利文献1的线性预测系数编码装置和线性预测系数解码装置是与LSP参数不能正确解码的情况的问题相比,将以较少的码量表示LSP参数设为优先的结构。
但是,线性预测系数编码装置以及线性预测系数解码装置不仅将LSP参数用于线性预测分析以及合成,还在依赖于构成从LSP参数求出的频谱包络的各振幅值的可变长度编码以及解码中使用的编码装置以及解码装置中也被利用。在该情况下,在一个帧中LSP参数不能正确地解码时,在包含该帧的连续的多个帧中也不能正确地进行可变长度解码,产生不能得到解码音响信号的问题。
鉴于这样问题,在本发明中,目的是提供可变换为线性预测系数的系数的编码方法以及解码方法,该编码方法以及解码方法能够兼用以下两种编码方法以及解码方法,即例如在线性预测分析以及合成中使用的、以较少的码量高精度地表示可变换为线性预测系数的系数的编码方法以及解码方法即预测对应的编码方法以及解码方法;以及例如在依赖于构成从LSP参数求的频谱包络的各振幅值的可变长度编码/解码中使用的、即使与可变换为前一帧的线性预测系数的系数对应的码即线性预测系数码(例如,LSP码)未被正确地输入到线性预测系数解码装置,只要当前帧的线性预测系数码正确地输入到线性预测系数解码装置,就可以正确地解码可变换为当前帧的线性预测系数的系数的编码方法以及解码方法。
用于解决课题的手段
为了解决上述的课题,按照本发明的一个方式,编码装置包括:预测对应编码单元,对由可变换为当前的帧的多阶的线性预测系数的系数的向量的、与至少包含来自过去的帧的预测的预测向量的差分所构成的差分向量进行编码,得到第一码,从而得到与第一码对应的量化差分向量;以及非预测对应编码单元,对由可变换为当前的帧的多阶的线性预测系数的系数的向量、和量化差分向量的差分或者差分的元素的一部分所构成的校正向量进行编码,生成第二码。
为了解决上述的课题,按照本发明的另一个方式,编码装置包括:预测对应编码单元,对由可变换为当前的帧的多阶的线性预测系数的系数的向量、和由至少来自过去的帧的预测和预定的向量所构成的预测向量的差分所构成的差分向量进行编码,得到第一码,从而得到与第一码对应的量化差分向量;以及非预测对应编码单元,对由可变换为当前的帧的多阶的线性预测系数的系数的向量中,减去量化差分向量和预定的向量所得到的差分或者差分的元素的一部分所构成的校正向量进行编码,生成第二码。
为了解决上述的课题,按照本发明的另一个方式,解码装置包括:预测对应解码单元,解码第一码,得到解码差分向量,将解码差分向量与至少包含来自过去的帧的预测的预测向量相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及非预测对应解码单元,解码第二码,得到解码校正向量,将解码校正向量、和至少解码差分向量的对应的阶数的元素彼此之间相加,生成可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
为了解决上述的课题,按照本发明的另一个方式,解码装置包括:预测对应解码单元,解码第一码,得到解码差分向量,将解码差分向量、和至少来自过去的帧的预测和预定的向量所构成的预测向量相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及非预测对应解码单元,解码第二码,得到解码校正向量,对于对应的阶数的每个元素,对解码校正向量至少加上解码差分向量和预定的向量,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
为了解决上述的课题,按照本发明的另一个方式,编码方法包括:预测对应编码步骤,对由可变换为当前的帧的多阶的线性预测系数的系数的向量的、与至少包含来自过去的帧的预测的预测向量的差分所构成的差分向量进行编码,得到第一码,从而得到与第一码对应的量化差分向量;以及非预测对应编码步骤,对由可变换为当前的帧的多阶的线性预测系数的系数的向量、和量化差分向量的差分或者差分的元素的一部分所构成的校正向量进行编码,生成第二码。
为了解决上述的课题,按照本发明的另一个方式,编码方法包括:预测对应编码步骤,对由可变换为当前的帧的多阶的线性预测系数的系数的向量、和由至少来自过去的帧的预测和预定的向量所构成的预测向量的差分所构成的差分向量进行编码,得到第一码,从而得到与第一码对应的量化差分向量;非预测对应编码步骤,对由从可变换为当前的帧的多阶的线性预测系数的系数的向量中,减去量化差分向量和预定的向量所得到的差分或者差分的元素的一部分所构成的校正向量进行编码,生成第二码。
为了解决上述的课题,按照本发明的另一个方式,解码方法包括:预测对应解码步骤,解码第一码,得到解码差分向量,将所述解码差分向量和至少包含来自过去的帧的预测的预测向量相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及非预测对应解码步骤,解码第二码,得到解码校正向量,将所述解码校正向量、至少所述解码差分向量的对应的阶数的元素彼此之间相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
为了解决上述的课题,按照本发明的另一个方式,解码方法包括:预测对应解码步骤,解码第一码,得到解码差分向量,将所述解码差分向量、与由至少来自过去的帧的预测和预定的向量所构成的预测向量相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及非预测对应解码步骤,解码第二码,得到解码校正向量,对于对应的阶数的每个元素,对解码校正向量至少加上解码差分向量和预定的向量,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
发明的效果
按照本发明,产生以下效果,即可以兼用以较少的码量高精度地表示可变换为线性预测系数的系数的编码方法以及解码方法,即预测对应的编码方法以及解码方法;以及即使前面的帧的线性预测系数码未被正确地输入到线性预测系数解码装置,只要当前帧的线性预测系数码被正确地输入到线性预测系数解码装置,就可以正确地解码可变换为当前帧的线性预测系数的系数的编码方法以及解码方法。
附图说明
图1是表示以往的线性预测系数编码装置的结构的图。
图2是表示以往的线性预测系数解码装置的结构的图。
图3是第一实施方式的线性预测系数编码装置的功能方框图。
图4是表示第一实施方式的线性预测系数编码装置的处理流程的例子的图。
图5是第一实施方式的线性预测系数解码装置的功能方框图。
图6第一实施方式的线性预测系数解码装置的处理流程的例子的图。
图7是第二实施方式的线性预测系数编码装置的功能方框图。
图8是表示第二、第三实施方式的线性预测系数编码装置的处理流程的例子的图。
图9是第二实施方式的线性预测系数解码装置的功能方框图。
图10是表示第二、第三实施方式的线性预测系数解码装置的处理流程的例子的图。
图11是第三实施方式的线性预测系数编码装置的功能方框图。
图12是第三实施方式的线性预测系数解码装置的功能方框图。
图13是第四实施方式的编码装置的功能方框图。
图14是表示第四实施方式的编码装置的处理流程的例子的图。
具体实施方式
以下,说明本发明的实施方式。而且,在以下的说明中使用的附图中,对于具有相同的功能的结构单元或进行相同的处理的步骤记为同一标号,省略重复说明。在以下的说明中,在文本中使用的记号“^”,“~”,“-”等是本来应记载在紧后的文字的正上方的记号,但由于文本记法的限制,记载在该文字的紧前。在式子中,这些记号记述在本来的位置。而且,以向量或矩阵的各元素单位进行的处理,只要没有特别指明,是对该向量或该矩阵的全部元素适用的处理。
<第一实施方式>
以下,以与以往的线性预测系数编码装置以及线性预测系数解码装置不同的点为中心进行说明。
<第一实施方式的线性预测系数编码装置100>
图3表示第一实施方式的线性预测系数编码装置100的功能方框图,图4表示该处理流程的例子。
线性预测系数编码装置100包含线性预测分析单元81、LSP计算单元82、预测对应编码单元120、和非预测对应编码单元110。线性预测分析单元81和LSP计算单元82中的处理是与在以往技术中说明的内容相同的处理,与图4的s81~s82对应。
线性预测系数编码装置100接收音响信号Xf,获得并输出LSP码Cf以及校正LSP码Df。从线性预测系数编码装置100输出的码被输入到线性预测系数解码装置200。而且,源自音响信号Xf的LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T由其它装置生成,在线性预测系数编码装置100的输入为LSP参数向量Θf的情况下,线性预测系数编码装置100也可以不包含线性预测分析单元81和LSP计算单元82。
<预测对应编码单元120>
预测对应编码单元120包含预测对应减法单元83、向量编码单元84、向量码本86和延迟输入单元87,各单元中的处理与在以往技术中说明的内容相同。预测对应减法单元83、向量编码单元84、延迟输入单元87中的处理分别与图4的s83~s87对应。其中,向量编码单元84不仅将量化差分向量^Sf输出到延迟输入单元87,还输出到非预测对应编码单元110。
预测对应编码单元120接收LSP参数向量Θf,对由LSP参数向量Θf与至少包含来自过去的帧的预测的预测向量的差分所构成的差分向量Sf进行编码,取得LSP码Cf和与LSP码Cf对应的量化差分向量^Sf(s120)并输出。而且,与LSP码Cf对应的量化差分向量^Sf是由与差分向量Sf的各元素值对应的量化值构成的向量。
这里,至少包含来自过去的帧的预测的预测向量是,例如,将预定的预测对应平均向量V、与对前一帧的量化差分向量(前帧量化差分向量)^Sf-1的各元素乘以预定的α后得到的向量进行相加所得到的向量V+α×^Sf-1。在该例中,在预测向量中包含的表示来自过去的帧的预测部分的向量是前帧量化差分向量^Sf-1的α倍,即α×^Sf-1。
而且,预测对应编码单元120除了LSP参数向量Θf以外不需要来自外部的输入,所以也可以说将LSP参数向量Θf编码而得到LSP码Cf。
而且,虽然在预测对应编码单元120中不生成,但是将预测对应编码单元120中的LSP参数向量Θf的各元素量化所得到的预测对应量化LSP参数向量^Θf称为在量化差分向量^Sf上加上了预测向量V+α×^Sf-1的向量。即,预测对应量化LSP参数向量是^Θf=^Sf+V+α×^Sf-1。而且,预测对应编码单元120中的量化误差向量是Θf-^Θf=Θf-(^Sf+V+α×^Sf-1)。
<非预测对应编码单元110>
非预测对应编码单元110包含非预测对应减法单元111、校正向量编码单元112和校正向量码本113。
非预测对应编码单元110接收LSP参数向量Θf和量化差分向量^Sf,将作为LSP参数向量Θf和量化差分向量^Sf的差分的校正向量进行编码而得到校正LSP码Df(s110)并输出。
这里,由于校正向量是Θf-^Sf,预测对应编码单元120的量化误差向量是Θf-^Θf=Θf-(^Sf+V+α×^Sf-1),所以校正向量是将预测对应编码单元120的量化误差向量Θf-^Θf、预测对应平均向量V、以及乘以α倍后的前帧量化差分向量α×^Sf-1相加后的结果。即,也可以说非预测对应编码单元110对将量化误差向量Θf-^Θf和预测向量V+α×^Sf-1相加的结果进行编码而得到校正LSP码Df。
在校正向量Θf-^Sf的编码中也可以使用公知的任意编码方法,但是在以下的说明中,说明对从校正向量Θf-^Sf减去了非预测对应平均向量Y的结果进行向量量化的方法。而且,在以下的说明中,将从校正向量Θf-^Sf减去非预测对应平均向量Y所得到的向量即Uf=Θf-Y-^Sf简便地称为校正向量。
以下,说明各单元的处理。
<非预测对应减法单元111>
非预测对应减法单元111例如包含存储了非预测对应平均向量Y的存储单元111c、减法单元111a以及111b而构成。
非预测对应减法单元111接收从LSP计算单元82输出的LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T和量化差分向量^Sf。
非预测对应减法单元111生成从LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T减去量化差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T和非预测对应平均向量Y=(y[1],y[2],…,y[p])T所得到的向量即校正向量Uf=Θf-Y-^Sf(s111)并输出。
而且,在图3中,使用两个减法单元111a以及111b,首先,在减法单元111a中从LSP参数向量Θf减去存储单元111c中存储的非预测对应平均向量Y后,在减法单元111b中减去量化差分向量^Sf,但是这些减法的顺序也可以相反。或者,也可以通过从LSP参数向量Θf减去将非预测对应平均向量Y和量化差分向量^Sf相加后的向量,生成校正向量Uf。
而且,非预测对应平均向量Y是预定的向量,例如,从预先学习用的音响信号求出即可。例如,在对应的线性预测系数编码装置100中,使用与成为编码的对象的音响信号相同的环境(例如,说话者、收音装置、场所)中收音到的音响信号作为学习用的输入音响信号,求多个帧的、LSP参数向量和对于该LSP参数向量的量化差分向量的差分,将该差分的平均作为非预测对应平均向量。
<校正向量码本113>
在校正向量码本113中,存储各候选校正向量和与该各候选校正向量对应的校正向量码。
<校正向量编码单元112>
校正向量编码单元112接收校正向量Uf,编码校正向量Uf,得到校正LSP码Df(s112)并输出。例如,校正向量编码单元112从校正向量码本113中存储的多个候选校正向量中,搜索最接近校正向量Uf的候选校正向量,输出与该候选校正向量对应的校正向量码作为校正LSP码Df。而且,虽然也可以在校正向量编码单元112不实际地生成,但是以下将最接近校正向量Uf的候选校正向量作为已量化校正向量^Uf进行说明。
而且,如前述的那样,由于校正向量至少包含来自预测对应编码单元120的前帧的预测部分的前帧量化差分向量^Sf-1,所以也可以说校正向量编码单元112至少编码来自预测对应编码单元120的前帧的预测部分。
而且,虽然在非预测对应编码单元110中也可以不生成,但是将非预测对应编码单元110中的LSP参数向量Θf的各元素量化所得到的非预测对应量化LSP参数向量^Φf是将非预测对应平均向量Y、量化差分向量^Sf和已量化校正向量^Uf相加后的结果。即为,^Φf=^Uf+Y+^Sf。
<第一实施方式的线性预测系数解码装置200>
以下,以与以往不同的点为中心进行说明。
图5表示第一实施方式的线性预测系数解码装置200的功能方框图,图6表示该处理流程的例子。
线性预测系数解码装置200包含预测对应解码单元220和非预测对应解码单元210。
线性预测系数解码装置200接收LSP码Cf和校正LSP码Df,生成并输出解码预测对应LSP参数向量^Θ=(^θf[1],^θf[2],…,^θf[p])和解码非预测对应LSP参数向量。而且,根据需要,生成并输出将解码预测对应LSP参数^θf[1],^θf[2],…,^θf[p]和解码非预测对应LSP参数各自变换为线性预测系数所得到的解码预测对应线性预测系数^af[1],^af[2],…,^af[p]和解码非预测对应线性预测系数^bf[1],^bf[2],…,^bf[p]。
<预测对应解码单元220>
预测对应解码单元220是与以往技术的线性预测系数解码装置90同样的结构,包含向量码本92、向量解码单元91、延迟输入单元93、预测对应加法单元95,根据需要,也包含解码预测对应线性预测系数计算单元96。向量解码单元91、延迟输入单元93、预测对应加法单元95、解码预测对应线性预测系数计算单元96中的处理,分别与图6的s91~s96对应。
预测对应解码单元220接收LSP码Cf,解码LSP码Cf,得到解码差分向量^Sf,将解码差分向量^Sf和至少包含来自过去的帧的预测的预测向量相加,生成LSP参数向量的各元素的解码值^θf[1],^θf[2],…,^θf[p]构成的解码预测对应LSP参数向量^Θf=(^θf[1],^θf[2],…,^θf[p])(s220)并输出。预测对应解码单元220根据需要,进一步将解码预测对应LSP参数向量^Θf变换为解码预测对应线性预测系数^af[1],^af[2],…,^af[p](s220)并输出。
在本实施方式中,预测向量是将预定的预测对应平均向量V和过去的帧的解码差分向量^Sf-1的α倍相加所得到的向量(V+α×^Sf-1)。
而且,向量解码单元91将解码差分向量^Sf除了输出到延迟输入单元93、预测对应加法单元95,还输出到非预测对应解码单元210的非预测对应加法单元213。
<非预测对应解码单元210>
非预测对应解码单元210包含校正向量码本212、校正向量解码单元211、和非预测对应加法单元213,根据需要,还包含解码非预测对应线性预测系数计算单元214。
在非预测对应解码单元210中被输入校正LSP码Df和解码差分向量^Sf。非预测对应解码单元210将校正LSP码Df解码,得到解码校正向量^Uf=(^uf[1],^uf[2],…,^uf[p])T。非预测对应解码单元210进一步在解码校正向量^Uf上至少加上解码差分向量^Sf,生成由当前的帧的LSP参数向量的各元素的解码值构成的解码非预测对应LSP参数向量并输出。非预测对应解码单元210根据需要,进一步将解码非预测对应LSP参数向量^Φf变换为解码非预测对应线性预测系数^bf[1],^bf[2],…,^bf[p](s210)并输出。
在本实施方式中,解码非预测对应LSP参数向量^Φf是在将校正LSP码Df解码所得到的解码校正向量^Uf上,加上将LSP码Cf解码所得到的解码差分向量^Sf和预定的非预测对应平均向量Y所得到的向量。即,在非预测对应解码单元210中,仅从在当前帧中输入的码,得到当前帧的LSP参数向量的解码向量^Φf。
以下,说明各单元的处理内容。
<校正向量码本212>
校正向量码本212存储了与线性预测系数编码装置100内的校正向量码本113相同的内容的信息。即,在校正向量码本212中,存储了各候选校正向量和与该各候选校正向量对应的校正向量码。
<校正向量解码单元211>
校正向量解码单元211接收校正LSP码Df,解码校正LSP码Df而得到解码校正向量^Uf(s211)并输出。例如,校正向量解码单元211从校正向量码本212中存储的多个校正向量码中,搜索与输入到线性预测系数解码装置200的校正LSP码Df对应的校正向量码,输出与搜索到的校正向量码对应的候选校正向量作为解码校正向量^Uf。
<非预测对应加法单元213>
非预测对应加法单元213例如包含存储了非预测对应平均向量Y的存储单元213c、加法单元213a以及213b而构成。
非预测对应加法单元213接收解码校正向量^Uf和解码差分向量^Sf。非预测对应加法单元213生成将解码校正向量^Uf、解码差分向量^Sf、和存储单元213c中存储的非预测对应平均向量Y相加所得到的解码非预测对应LSP参数向量并输出。而且,在图5中,使用两个加法单元213a以及213b,首先,在加法单元213a中在解码校正向量^Uf中加上解码差分向量^Sf后,在加法单元213b中加上存储单元213c中存储的非预测对应平均向量Y,但是这些相加的顺序也可以相反。或者,也可以通过将相加了非预测对应平均向量Y和解码差分向量^Sf的向量,加上解码校正向量^Uf,生成解码非预测对应LSP参数向量^Φf。
而且,这里使用的非预测对应平均向量Y,设为与在前述的线性预测系数编码装置100的非预测对应减法单元111中使用的非预测对应平均向量Y相同的向量。
<解码非预测对应线性预测系数计算单元214>
解码非预测对应线性预测系数计算单元214接收解码非预测对应LSP参数向量^Φf。解码非预测对应线性预测系数计算单元214将解码非预测对应LSP参数向量^Φf变换为解码非预测对应线性预测系数^bf[1],^bf[2],…,^bf[p](s214)并输出。
<第一实施方式的效果>
按照第一实施方式的线性预测系数解码装置,即使在第f-1帧的LSP码Cf-1中发生传输错误,解码差分向量^Sf-1不能正确地解码,由于在非预测对应解码单元210中得到不依赖于解码差分向量^Sf-1的LSP参数向量的解码值即解码非预测对应LSP参数向量^Φf,所以可以不使第f-1帧的LSP码Cf-1的传输错误影响到第f帧的解码非预测对应LSP参数向量^Φf。例如,如果在使用非预测对应量化LSP参数向量/解码非预测对应LSP参数向量^Φf作为依赖于构成从LSP参数向量求出的频谱包络的各振幅值的可变长度编码/解码中使用的LSP参数向量的情况下,即使在第f-1帧中不能得到准确的解码非预测对应LSP参数向量^Φf,不能准确地进行可变长度解码,在第f帧中也得到正确的解码非预测对应LSP参数向量^Φf,可以正确地进行可变长度解码。
而且,因为校正向量不需要如LSP参数向量那样高精度地(使得量化误差变小)被量化,所以校正向量码本113中预先准备的候选校正向量的种类少也可以。例如,校正向量码d的比特长度为2bit,在校正向量码本113中,存储与4种校正向量码(「00」「01」「10」「11」)对应的4种类的候选校正向量。
因此,可以减少在校正向量码本准备的候选校正向量的种类,可以分配较小码量的码。由此,可以通过较少的码量的增加,实现与以往相比失真小的编码以及解码。
<变形例>
在本实施方式中,对LSP参数进行了记载,但是只要是可变换为多阶的线性预测系数的系数,也可以使用其它的系数。可以将PARCOR系数、将LSP参数或者PARCOR系数变形后的系数、进而将线性预测系数本身作为对象。全部这些系数在语音编码的技术领域中,可以相互变换,使用任何系数都可以得到第一实施方式的效果。而且,也将与LSP码Cf或者LSP码Cf对应的码称为第一码,将预测对应编码单元称为第一编码单元。同样,也将与校正LSP码或者校正LSP码对应的码称为第二码,将非预测对应编码单元称为第二编码单元。而且,也将解码预测对应LSP参数向量^Θf或者与解码预测对应LSP参数向量^Θf对应的向量称为第一解码向量,将预测对应解码单元称为第一解码单元。而且,也将解码非预测对应LSP参数向量^Φf或者与解码非预测对应LSP参数向量^Φf对应的向量称为第二解码向量,将非预测对应解码单元称为第二解码单元。
在本实施方式中,作为“过去的帧”,仅利用1帧的量,但是也可以根据需要适当利用2帧以上的量。
<第二实施方式>
以与第一实施方式不同的部分为中心进行说明。
在本实施方式中,利用频谱包络的振幅的凹凸的变化大小,换言之,频谱包络的峰谷的大小来决定是否编码校正向量,以及,是否编码校正LSP码。
若与频谱包络的振幅的凹凸的变化的大小无关,以相同的码量编码LSP参数,则与频谱包络的振幅的凹凸的变化小时相比,频谱包络的振幅的凹凸的变化大的一方的量化误差大。因此,仅在认为LSP的量化误差大的情况下,线性预测系数编码装置执行校正向量编码单元,输出校正LSP码Df,线性预测系数解码装置通过解码校正LSP码Df,与第一实施方式相比,作为全体减少码量,并且与以往技术相比,可进行码的传输错误造成的音质劣化少的编码以及解码处理。
<第二实施方式的线性预测系数编码装置300>
图7是表示第二实施方式的线性预测系数编码装置300的功能方框图,图8是表示该处理流程的例子。
第二实施方式的线性预测系数编码装置300包含非预测对应编码单元310取代非预测对应编码单元110。与第一实施方式的线性预测系数编码装置100同样,源自音响信号Xf的LSP参数θ由其它的装置生成,在线性预测系数编码装置300的输入为LSP参数θf[1],θf[2],…,θf[p]的情况下,线性预测系数编码装置300也可以不包含线性预测分析单元81和LSP计算单元82。
非预测对应编码单元310包含:非预测对应减法单元311、校正向量编码单元312、校正向量码本113、预测对应加法单元314以及指标计算单元315。根据指标计算单元315的计算结果,决定是否在非预测对应减法单元311中执行减法处理,以及是否在校正向量编码单元312中执行编码处理,这一点是不同的。
而且,预测对应编码单元120除了量化差分向量^Sf,还输出作为乘法单元88的输出值的向量α×^Sf-1。
<预测对应加法单元314>
预测对应加法单元314例如包含存储了预测对应平均向量V的存储单元314c、加法单元314a以及314b而构成。
预测对应加法单元314接收当前的帧的量化差分向量^Sf、以及对前帧量化差分向量^Sf-1乘以了规定的系数α的向量α×^Sf-1。
预测对应加法单元314生成相加了量化差分向量^Sf、预测对应平均向量V、以及向量α×^Sf-1的向量即预测对应量化LSP参数向量^Θf(=^Sf+V+α^Sf-1)=(^θf[1],^θf[2],…,^θf[p])T(s314)并输出。
在图7中,使用两个加法单元314a以及314b,首先,在加法单元314b中,对当前的帧的量化差分向量^Sf加上向量α×^Sf-1后,在加法单元314a中加上预测对应平均向量V,但是该顺序也可以相反。或者,也可以通过将相加了向量α×^Sf-1和预测对应平均向量V的向量,与量化差分向量^Sf相加而生成预测对应量化LSP参数向量^Θf。
而且,输入到预测对应加法单元314的当前的帧的量化差分向量^Sf、对前帧量化差分向量^Sf-1乘以了规定的系数α后的向量α×^Sf-1都是在预测对应编码单元120中生成的,在预测对应加法单元314内的存储单元314c中存储的预测对应平均向量V,与在预测对应编码单元120内的存储单元83d中存储的预测对应平均向量V相同,所以也可以是预测对应编码单元120进行预测对应加法单元314所进行的处理,生成预测对应量化LSP参数向量^Θf,输出到非预测对应编码单元310,在非预测对应编码单元310中不具有预测对应加法单元314的结构。
<指标计算单元315>
指标计算单元315接收预测对应量化LSP参数向量^Θf。指标计算单元315使用预测对应量化LSP参数向量^Θf,计算与预测对应量化LSP参数向量^Θf对应的、与频谱包络的峰谷大小的大峰谷对应的指标Q,即,频谱包络的峰谷越大变得越大的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’,即,频谱包络的峰谷越大变得越小的指标Q’(s315)。指标计算单元315输出控制信号C,以便根据指标Q以及/或者Q’的大小,在校正向量编码单元312中执行编码处理,或者,以规定的比特数执行编码处理。而且,指标计算单元315输出控制信号C,以便根据指标Q以及/或者Q’的大小,在非预测对应减法单元311中执行减法处理。以下,说明控制信号C的生成方法。
一般来说,LSP参数是与输入音响信号的功率频谱包络具有相关性的频域的参数列,LSP参数的各值与输入音响信号的功率频谱包络的极值的频率位置相关。在将LSP参数设为θ[1],θ[2],…,θ[p]时,在θ[i]和θ[i+1]之间的频率位置存在功率频谱包络的极值,在该极值的周围的接线的倾斜度越陡峭,θ[i]和θ[i+1]的间隔(即,(θ[i+1]-θ[i])的值)越小。即,功率频谱包络的振幅的凹凸越陡峭,对于各个i,θ[i]和θ[i+1]的间隔变得越不均匀,即,LSP参数的间隔的方差变大。相反,在基本上没有功率频谱包络的凹凸的情况下,对于各个i,θ[i]和θ[i+1]的间隔接近均等间隔,即,LSP参数的间隔的方差变小。
由此,与LSP参数的间隔的方差对应的指标大,意味着功率频谱包络的振幅的凹凸的变化大。而且,与LSP参数的间隔的最小值对应的指标小,意味着功率频谱包络的振幅的凹凸的变化大。
预测对应量化LSP参数^θf[1],^θf[2],…,^θf[p]是将LSP参数θf[1],θf[2],…,θf[p]量化所得到的参数,如果LSP码Cf被无错误地从线性预测编码装置输入到线性预测解码装置,则解码预测对应LSP参数^θf[1],^θf[2],…,^θf[p]是与预测对应量化LSP参数^θf[1],^θf[2],…,^θf[p]相同的参数,所以关于预测对应量化LSP参数^θf[1],^θf[2],…,^θf[p]和解码预测对应LSP参数^θf[1],^θf[2],…,^θf[p],与LSP参数θf[1],θf[2],…,θf[p]同样的性质成立。
因此,可以分别将与预测对应量化LSP参数^θf[1],^θf[2],…,^θf[p]的间隔的方差对应的值作为频谱包络的峰谷越大则变得越大的指标Q使用,将预测对应量化LSP参数向量^Θf=(^θf[1],^θf[2],…,^θf[p])中阶数相邻的预测对应量化LSP参数的差分(^θf[i+1]-^θf[i])的最小值作为频谱包络的峰谷越大则变得越小的指标Q’使用。
频谱包络的峰谷越大则变得越大的指标Q例如通过表示规定的阶数T(T≦p)以下的预测对应量化LSP参数向量^Θf的元素即预测对应量化LSP参数的间隔的方差的指标Q,即,
计算。
而且,频谱包络的峰谷越大则变得越小的指标Q’例如通过表示规定的阶数T(T≦p)以下的预测对应量化LSP参数向量^Θf的阶数相邻的预测对应量化LSP参数的间隔的最小值的指标Q’,即,
来计算。
或者,表示预测对应量化LSP参数向量^Θf的阶数相邻的预测对应已量化LSP参数的间隔、以及最低阶的预测对应量化LSP参数的值中的最小值的指标Q’
计算。LSP参数是从0至π之间按照阶数顺序存在的参数,所以该式的最低阶的预测对应量化LSP参数^θf[1]意味着^θf[1]和0的间隔(^θf[1]-0)。
指标计算单元315在频谱包络的峰谷大于规定的基准的情况,即,在上述的例子中(A-1)指标Q为规定的阈值Th1以上的情况下,以及/或者,(B-1)指标Q’为规定的阈值Th1’以下的情况下,对非预测对应减法单元311以及校正向量编码单元312输出表示执行校正编码处理的控制信号C,在除此以外的情况下,对非预测对应减法单元311以及校正向量编码单元312输出表示不执行校正编码处理的控制信号C。这里,“(A-1)的情况,以及/或者,在(B-1)的情况”是包含:仅求出指标Q而满足(A-1)的条件的情况、仅求出指标Q’而满足(B-1)的条件的情况、求出指标Q和指标Q’两方而满足(A-1)和(B-1)两方的条件的情况的三个情况的表现。当然,在判定是否满足(A-1)的条件的情况下也可以求指标Q’,在判定是否满足(B-1)的条件的情况下也可以求指标Q。关于以下的记载中的“以及/或者”也同样。
而且,指标计算单元315也可以设为在(A-1)以及/或者(B-1)的情况下,输出表示规定的比特数的正的整数(或者表示正的整数的码)作为控制信号C,在除此以外的情况下,输出0作为控制信号C的结构。
而且,在构成为在非预测对应减法单元311中,接收控制信号C时执行减法处理,在校正向量编码单元312中,接收了控制信号C时执行编码处理的结构情况下,在(A-1)以及/或者(B-1)以外的情况下,指标计算单元315也可以设为不输出控制信号C的结构。
<非预测对应减法单元311>
非预测对应减法单元311接收控制信号C、LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T、和量化差分向量^Sf。
在接收了表示执行校正编码处理的控制信号C、接收了正的整数(或者表示正的整数的码)作为控制信号C的情况下,总之,在频谱包络的峰谷大于规定的基准的情况下,即在上述的例子中(A-1)以及/或者(B-1)的情况下,非预测对应减法单元311生成从LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T减去量化差分向量^Sf-1、以及非预测对应平均向量Y=(y[1],y[2],…,y[p])T所得到的向量即校正向量Uf=Θf-Y-^Sf(s311)并且输出。
<校正向量编码单元312>
校正向量编码单元312接收控制信号C和校正向量Uf。在接收到表示执行校正编码处理的控制信号C、或者接收到正的整数(或者表示正的整数的码)作为控制信号C的情况下,总之,在频谱包络的峰谷大于规定的基准的情况下,即在上述的例子中(A-1)以及/或者(B-1)的情况下,校正向量编码单元312编码校正向量Uf,得到校正LSP码Df(s312)并输出。编码校正向量Uf的编码处理本身与校正向量编码单元112相同。
在接收到表示不执行校正编码处理的控制信号C、或者接收到0作为控制信号C的情况下,总之,在频谱包络的峰谷不大于规定的基准的情况下,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,校正向量编码单元312不进行校正向量Uf的编码,得不到校正LSP码Df,并且不输出。
<第二实施方式的线性预测系数解码装置400>
图9表示第二实施方式的线性预测系数解码装置400的功能方框图,图10表示该处理流程的例子。
第二实施方式的线性预测系数解码装置400包含非预测对应解码单元410,取代非预测对应解码单元210。
非预测对应解码单元410包含校正向量码本212、校正向量解码单元411、非预测对应加法单元413、以及指标计算单元415,根据需要,还包含解码非预测对应线性预测系数计算单元214。
在根据指标计算单元415的计算结果,决定在非预测对应加法单元413中是否执行加法处理,以及,在校正向量解码单元411中是否执行解码处理,这一点有所不同。
<指标计算单元415>
指标计算单元415接收解码预测对应LSP参数向量^Θf,计算对应于解码预测对应LSP参数向量^Θf=(^θf[1],^θf[2],…,^θf[p])T的、与频谱包络的峰谷大小的大峰谷对应的指标Q,即,频谱包络的峰谷越大则变得越大的指标Q,以及/或者,与频谱包络的峰谷大小的小峰谷对应的指标Q’,即,频谱包络的峰谷越大则变得越小的指标Q’(s415)。指标计算单元415根据指标Q以及/或者Q’的大小,对校正向量解码单元411以及非预测对应加法单元413输出表示执行/不执行校正解码处理的控制信号C,或者,输出表示以规定的比特数执行校正解码处理的控制信号C。指标Q以及Q’与在指标计算单元315中说明的相同,使用解码预测对应LSP参数向量^Θf取代预测对应量化LSP参数向量^Θf,使用与指标计算单元315相同的方法计算即可。
指标计算单元415在频谱包络的峰谷大于规定的基准的情况,即,在上述的例子中(A-1)指标Q为规定的阈值Th1以上的情况,以及/或者在(B-1)指标Q’为规定的阈值Th1’以下的情况下,对非预测对应加法单元413以及校正向量解码单元411输出指示执行校正解码处理的控制信号C,在除此以外的情况下,对非预测对应加法单元413以及校正向量解码单元411输出指示不执行校正解码处理的控制信号C。
而且,也可以设为以下结构:指标计算单元415在(A-1)以及/或者(B-1)的情况下,输出表示规定的比特数的正的整数(或者表示正的整数的码)作为控制信号C,在除此以外的情况下,输出0作为控制信号C。
而且,也可以在设为校正向量解码单元411以及非预测对应加法单元413中接收到控制信号C时,识别执行校正解码处理的结构的情况下,设为在(A-1)以及/或者(B-1)以外的情况下,指标计算单元415不输出控制信号的结构。
<校正向量解码单元411>
校正向量解码单元411接收校正LSP码Df和控制信号C。在接收到表示执行校正解码处理的控制信号C,或接收到正的整数(或者表示正的整数的码)作为控制信号C的情况下,总之,在频谱包络的峰谷大于规定的基准的情况下,即在上述的例子中(A-1)以及/或者(B-1)的情况下,参照校正向量码本212,解码校正LSP码Df,得到解码校正向量^Uf(s411)并输出。解码校正LSP码Df的解码处理本身与校正向量解码单元211相同。
校正向量解码单元411在接收到表示不执行校正解码处理的控制信号C或者接收到0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,不进行校正LSP码Df的解码,得不到解码校正向量^Uf,并不输出。
<非预测对应加法单元413>
非预测对应加法单元413例如包含存储了非预测对应平均向量Y的存储单元413c、加法单元413a以及413b而构成。
非预测对应加法单元413接收控制信号C和解码差分向量^Sf。在接收到表示执行校正解码处理的控制信号C,或者接收到正的整数(或者表示正的整数的码)作为控制信号C的情况,总之,频谱包络的峰谷大于规定的基准的情况下,在(A-1)以及/或者(B-1)的情况下,还接收解码校正向量^Uf。然后,非预测对应加法单元413生成对解码校正向量^Uf将解码差分向量^Sf、存储单元413c中存储的非预测对应平均向量Y相加所得到的解码非预测对应LSP参数向量^Φf=^Uf+Y+^Sf(s413)并输出。而且,在图9中,使用两个加法单元413a以及413b,首先,在加法单元413a中对解码校正向量^Uf加上解码差分向量^Sf后,在加法单元413b中加上存储单元413c中存储的非预测对应平均向量Y,但是这些相加的顺序也可以相反。或者,也可以通过将相加了非预测对应平均向量Y和解码差分向量^Sf的向量,与解码校正向量^Uf相加,生成解码非预测对应LSP参数向量^Φf。
非预测对应加法单元413在接收到表示不执行校正解码处理的控制信号C,或者接收到0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况,即在上述的例子中(A-1)以及/或者(B-1)以外的情况,即,未接收到解码校正向量^Uf的情况下,生成解码非预测对应LSP参数向量^Φf=Y+^Sf(s413)并输出。
而且,这里使用的非预测对应平均向量Y设为与前述的线性预测系数编码装置300的非预测对应减法单元311中使用的非预测对应平均向量Y相同。
<第二实施方式的效果>
通过这样的结构,除了不使第f-1帧的LSP码Cf-1的传输错误影响第f帧的解码非预测对应LSP参数向量^Φf,在频谱包络的峰谷较大的情况下,通过在非预测对应平均向量Y和解码差分向量^Sf上加上解码校正LSP码Df得到的解码校正向量^Uf,得到量化误差少的解码非预测对应LSP参数向量^Φf,同时在频谱包络的峰谷不大的情况下,通过将不需要校正LSP码Df的非预测对应平均向量Y与解码差分向量^Sf相加的结果设为解码非预测对应LSP参数向量^Φf,可以减少相当于校正LSP码Df部分的码量。即,与第一实施方式的编码以及解码相比,作为整体减少码量,同时与以往技术相比,可以进行前面的帧的码的传输错误导致的音质劣化少的编码以及解码处理。
<变形例>
如在第一实施方式的变形例中说明的那样,如果取代LSP参数,在线性预测系数中为可变换的系数,则也可以使用其它的系数。也可以将PARCOR系数、将LSP参数或PARCOR系数的其中一个变形后的系数,进而,将线性预测系数本身作为对象。以下,说明使用了PARCOR系数kf[1],kf[2],…,kf[p]的情况。
已知与LSP参数向量Θf对应的频谱包络的峰谷的大小越大,由PARCOR系数求的
计算频谱包络的峰谷大小的小峰谷对应的指标Q’(s315)。指标计算单元315根据指标Q’的大小,对校正向量编码单元312以及非预测对应减法单元311输出表示执行/不执行校正编码处理的控制信号C,或者,作为表示规定的比特数的正的整数或者0的控制信号C。指标计算单元415也同样,根据指标Q’的大小,对校正向量解码单元411以及非预测对应加法单元413输出表示执行/不执行校正解码处理的控制信号C,或者,输出表示规定的比特数的正的整数或者0的控制信号C。
指标计算单元315以及指标计算单元415也可以设为取代控制信号C而输出指标Q以及/或者指标Q’的结构。在该情况下,根据指标Q以及/或者指标Q’的大小,判断在校正向量编码单元312以及校正向量解码单元411中是否分别执行编码处理以及解码处理即可。而且,同样地,根据指标Q以及/或者指标Q’的大小,判断在非预测对应减法单元311以及非预测对应加法单元413中是否分别执行减法处理、执行怎样的加法处理即可。校正向量编码单元312、校正向量解码单元411、非预测对应减法单元311以及非预测对应加法单元413中的判断,是与上述的指标计算单元315以及指标计算单元415中说明的相同的判断。
<第三实施方式>
以与第二实施方式不同的部分为中心进行说明。
在校正向量码本中存储的候选校正向量的数多,意味着以相当于该部分的高的近似精度进行编码。因此,在本实施方式中,起因于LSP码的传输错误的解码精度的降低的影响越大,越使用更高的精度的校正向量码本执行校正向量编码单元以及校正向量解码单元。
<第三实施方式的线性预测系数编码装置500>
图11表示第三实施方式的线性预测系数编码装置500的功能方框图,图8表示该处理流程的例子。
第三实施方式的线性预测系数编码装置500包含非预测对应编码单元510,取代非预测对应编码单元310。
非预测对应编码单元510包含非预测对应减法单元311、校正向量编码单元512、校正向量码本513A以及513B、预测对应加法单元314、指标计算单元315。与第一实施方式、二实施方式的线性预测系数编码装置100、300相同,源自音响信号Xf的LSP参数θ通过其它的装置生成,在线性预测系数编码装置500的输入为LSP参数θf[1],θf[2],…,θf[p]的情况下,线性预测系数编码装置500也可以不包含线性预测分析单元81和LSP计算单元82。
第三实施方式的线性预测系数编码装置500具有多个校正向量码本,在校正向量编码单元512中,根据在指标计算单元315中计算的指标Q以及/或者Q’,选择其中一个校正向量码本进行编码,这一点与第二实施方式不同。
以下,以具有两种校正向量码本513A以及513B的情况为例进行说明。
校正向量码本513A以及513B存储的候选校正向量的总数是不同的。候选校正向量的总数多,意味着对应的校正向量码的比特数大。相反换言之,越增大校正向量码的比特数,可以准备越多的候选校正向量。例如,若将校正向量码的比特数设为A,则可以准备最大2A个候选校正向量。
以下,作为与校正向量码本513B相比,校正向量码本513A一方存储的候选校正向量的总数多来进行说明。换言之,校正向量码本513A中存储的码的码长(平均码长)比校正向量码本513B中存储的码的码长(平均码长)大。例如,在校正向量码本513A中,存储2A个码长为A比特的校正向量码和候选校正向量的组,在校正向量码本513B中,存储2B个(2B<2A)码长为B比特(B<A)的校正向量码和候选校正向量的组。
而且,在本实施方式中,如在第二实施方式的变形例的部分中说明的那样,指标计算单元取代控制信号C而输出指标Q以及/或者指标Q’,根据指标Q以及/或者指标Q’的大小,判断在校正向量编码单元以及校正向量解码单元中分别进行哪样的编码以及解码。其中,也可以如第二实施方式那样,设为指标计算单元判断进行哪样的编码以及解码,输出控制信号C的结构。而且,在非预测对应减法单元311以及非预测对应加法单元413中,如在第二实施方式的变形例的部分中说明的那样,根据指标Q以及/或者指标Q’的大小,判断是否分别进行减法处理、进行哪样的加法处理。
<校正向量编码单元512>
校正向量编码单元512接收指标Q以及/或者指标Q’和校正向量Uf。(A-2)指标Q越大,以及/或者,(B-2)指标Q’越小,校正向量编码单元512得到比特数越多的(码长大)校正LSP码Df(s512)并输出。例如,使用规定的阈值Th2,以及/或者,规定的阈值Th2',如以下那样进行编码。而且,校正向量编码单元512执行编码处理的是指标Q为规定的阈值Th1以上的情况,以及/或者,指标Q’为规定的阈值Th1'以下的情况,所以Th2是大于Th1的值,Th2'是小于Th1'的值。
(A-5)在指标Q为规定的阈值Th2以上的情况、以及/或者(B-5)指标Q’为规定的阈值Th2’以下的情况下,作为校正LSP码Df的比特数,设定作为正的整数的A,校正向量编码单元512参照存储有2A个比特数(码长)A的校正向量码和候选校正向量的组的校正向量码本513A,编码校正向量Uf,得到校正LSP码Df(s512)并输出。
(A-6)在指标Q小于规定的阈值Th2,并且指标Q为规定的阈值Th1以上的情况下,以及/或者,(B-6)指标Q’大于规定的阈值Th2’,并且,指标Q’为规定的阈值Th1’以下的情况下,作为校正LSP码Df的比特数,设定作为小于比特数A的正的整数的B,校正向量编码单元512参照存储有2B个比特数(码长)B的校正向量码和候选校正向量的组的校正向量码本513B,编码校正向量Uf,得到校正LSP码Df(s512)并输出。
(C-6)在除此以外的情况下,作为校正LSP码Df的比特数,设定0,校正向量编码单元512不将校正向量Uf编码,得不到校正LSP码Df,不输出。
由此,在指标计算单元315中计算的指标Q大于规定的阈值Th1的情况,以及/或者,指标Q’小于规定的阈值Th1’的情况下,被第三实施方式的校正向量编码单元512执行。
<第三实施方式的线性预测系数解码装置600>
图12表示第三实施方式的线性预测系数解码装置600的功能方框图,图10表示该处理流程的例子。
第三实施方式的线性预测系数解码装置600包含非预测对应解码单元610,取代非预测对应解码单元410。
非预测对应解码单元610包含非预测对应加法单元413、校正向量解码单元611、校正向量码本612A以及612B、指标计算单元415,根据需要还包含解码非预测对应线性预测系数计算单元214。
第三实施方式的线性预测系数解码装置600具有多个校正向量码本,在校正向量解码单元611中,根据指标计算单元415中计算的指标Q以及/或者Q’选择其中一个校正向量码本进行解码,这一点与第二实施方式的线性预测系数解码装置400不同。
以下,以具有两类校正向量码本612A以及612B的情况为例进行说明。
校正向量码本612A以及612B分别存储有与线性预测系数编码装置500的校正向量码本513A以及513B共同的内容。即,在校正向量码本612A以及612B中,存储各候选校正向量和与该各候选校正向量对应的校正向量码,与校正向量码本612B中存储的码的码长(平均码长)相比,校正向量码本612A中存储的码的码长(平均码长)一方大。例如,在校正向量码本612A中存储2A个码长为A比特的校正向量码和候选校正向量的组,在校正向量码本612B中存储2B个(2B<2A)码长为B比特(B<A)的校正向量码和候选校正向量的组。
<校正向量解码单元611>
校正向量解码单元611接收指标Q以及/或者指标Q’和校正LSP码Df。(A-2)指标Q越大,以及/或者,(B-2)指标Q’越小,校正向量解码单元611解码具有越多比特数的校正LSP码Df,从越多的候选校正向量得到解码校正向量^Uf(s611)。例如,使用规定的阈值Th2以及/或者Th2',如以下那样进行解码。而且,校正向量解码单元611执行解码处理是指标Q为规定的阈值Th1以上的情况,以及/或者,指标Q’为规定的阈值Th1'以下的情况,所以Th2为大于Th1的值,Th2'为小于Th1'的值。
(A-5)在指标Q为规定的阈值Th2以上的情况,以及/或者,(B-5)指标Q’为规定的阈值Th2’以下的情况下,作为校正LSP码Df的比特数,设定作为正的整数的A,校正向量解码单元611参照存储了2A个比特数(码长)A的校正向量码和候选校正向量的组的校正向量码本612A,得到对应于与校正LSP码Df一致的校正向量码的候选校正向量,作为解码校正向量^Uf(s611)并输出。
(A-6)在指标Q小于规定的阈值Th2,并且指标Q为规定的阈值Th1以上的情况下,以及/或者,(B-6)指标Q’大于规定的阈值Th2’,并且,指标Q’为规定的阈值Th1’以下的情况下,作为校正LSP码Df的比特数,设定少于比特数A的正的整数的B,校正向量解码单元611参照存储有2B个比特数(码长)B的校正向量码和候选校正向量的组的校正向量码本612B,得到对应于与校正LSP码Df一致的校正向量码的候选校正向量作为解码校正向量^Uf(s611)并输出。
(C-6)除此以外的情况下,设定0作为校正LSP码Df的比特数,校正向量解码单元611不解码校正LSP码Df,不生成解码校正向量^Uf。
由此,在指标计算单元415中计算的指标Q大于规定的阈值Th1的情况,以及/或者,指标Q’小于规定的阈值Th1’的情况下,被第三实施方式的校正向量解码单元611执行。
<第三实施方式的效果>
通过这样的结构,可以得到与第二实施方式相同的效果。进而,通过根据起因于LSP码的传输错误的解码精度的降低的影响的大小,变更近似精度,与第一实施方式的编码及解码相比,可以整体地抑制码量,可进行比第二实施方式的编码及解码音质更好的编码以及解码处理。
<变形例>
校正向量码本的个数不一定是2个,也可以是3个以上。每个校正向量码本中存储不同的比特数(比特长)的校正向量码,存储与该校正向量码对应的校正向量。也可以根据校正向量码本的个数设定阈值。对于指标Q的阈值可以设定为,阈值的值越大,在该阈值以上的情况中使用的校正向量码本中存储的校正向量码的比特数越大。同样,对于指标Q’的阈值可以设定为,阈值的值越小,在该阈值以下的情况中使用的校正向量码本中存储的校正向量码的比特数越大。通过这样的结构,可以整体地抑制码量,并且可以进行精度更高的编码以及解码处理。
<第四实施方式的编码装置700>
第四实施方式的编码装置700是在频域中的编码方法即TCX(transform codedexcitation,变换码激励)编码方法中应用了第一实施方式的线性预测系数编码装置100以及线性预测系数解码装置200的装置。
图13表示第四实施方式的编码装置700的功能方框图,图14表示该处理流程的例子。
第四实施方式的编码装置700包含:线性预测系数编码装置100、线性预测系数解码装置200、功率频谱包络序列计算单元710、第一平滑功率频谱包络序列计算单元720A、第二平滑功率频谱包络序列计算单元720B、频域变换单元730、包络归一化单元740、可变长度编码参数计算单元750和可变长度编码单元760。而且,也可以使用第二、第三实施方式的线性预测系数编码装置300、500以及线性预测系数解码装置400、600,取代线性预测系数编码装置100和线性预测系数解码装置200。
第四实施方式的编码装置700接收输入音响信号Xf,输出频域信号码。
<线性预测系数编码装置100>
线性预测系数编码装置100接收音响信号Xf,得到LSP码Cf以及校正LSP码Df(s100)并输出。
<线性预测系数解码装置200>
线性预测系数解码装置200接收LSP码Cf和校正LSP码Df,得到预测对应量化线性预测系数^af[1],^af[2],…,^af[p]和非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p](s200)并输出。
而且,编码装置700的线性预测系数编码装置100也可以设为在得到LSP码Cf和校正LSP码Df时,得到与LSP码Cf对应的预测对应量化线性预测系数^af[1],^af[2],…,^af[p]、以及与LSP码Cf和校正LSP码Df对应的非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p]的结构。在该情况下,编码装置700也可以不具有线性预测系数解码装置200。
<功率频谱包络序列计算单元710>
功率频谱包络序列计算单元710接收非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p]。功率频谱包络序列计算单元710使用非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p],计算N点的输入音响信号的功率频谱包络序列Z[1],…,Z[N](s710)并输出。例如,功率频谱包络序列的各值Z[n]可以通过下式求出。
其中,n是1≦n≦N的整数,exp(·)是以自然对数为底的指数函数,j是虚数单位,σ2是预测残差能量。
<第一平滑功率频谱包络序列计算单元720A>
第一平滑功率频谱包络序列计算单元720A接收预测对应量化线性预测系数^af[1],^af[2],…,^af[p]。第一平滑功率频谱包络序列计算单元720A使用预测对应量化线性预测系数^af[1],^af[2],…,^af[p]和作为预先提供的1以下的正的常数的校正系数γi,通过
计算第一平滑完毕功率频谱包络序列~W[1],~W[2],…,~W[N](s720A)并输出。
第一平滑完毕功率频谱包络序列~W[1],~W[2],…,~W[N]相当于使通过预测对应量化线性预测系数^af[1],^af[2],…,^af[p]求的功率频谱包络序列W[1],W[2],…,W[N]的振幅的凹凸钝化的(平滑化的)序列。γi是决定平滑化的程度的正的常数。
<第二平滑功率频谱包络序列计算单元720B>
第二平滑功率频谱包络序列计算单元720B接收非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p]。第二平滑功率频谱包络序列计算单元720B使用非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p]和作为预先提供的1以下的正的常数的校正系数γi,通过
计算第二平滑完毕功率频谱包络序列~Z[1],~Z[2],…,~Z[N](s720B)并输出。
第二平滑完毕功率频谱包络序列~Z[1],~Z[2],…,~Z[N]相当于使通过非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p]求的功率频谱包络序列Z[1],Z[2],…,Z[N]的振幅的凹凸钝化的(平滑化的)序列。γi是决定平滑化的程度的正的常数。
<频域变换单元730>
频域变换单元730以规定的时间区间即帧为单位,将输入的时间区域的输入音响信号Xf变换为频域的N点的MDCT系数列X[1],…,X[N](s730)并输出。其中,N是正整数。
<包络归一化单元740>
包络归一化单元740接收MDCT系数列X[1],…,X[N]和第一平滑完毕功率频谱包络序列~W[1],~W[2],…,~W[N],求作为将MDCT系数列X[1],…,X[N]的各系数X[i]以第一平滑完毕功率频谱包络序列~W[1],~W[2],…,~W[N]的各值~W[i]的平方根进行了归一化的序列的、归一化完毕MDCT系数列XN[1],…,XN[N](s740)并输出。即为
XN[i]=X[i]/sqrt(~W[i])
。其中,sqrt(·)是表示1/2次方的记号。
<可变长度编码参数计算单元750>
可变长度编码参数计算单元750接收功率频谱包络序列Z[1],…,Z[N]、第二平滑完毕功率频谱包络序列~Z[1],…,~Z[N]、MDCT系数列X[1],…,X[N]、和归一化完毕MDCT系数列XN[1],…,XN[N]。使用这些值,计算作为用于将归一化完毕MDCT系数列XN[1],…,XN[N]进行可变长度编码的参数的可变长度编码参数ri(s750)并输出。可变长度编码参数ri是确定编码对象的归一化完毕MDCT系数列XN[1],…,XN[N]的振幅能够取的范围的参数。在莱斯(Rice)编码的情况下,莱斯参数相当于可变长度编码参数,在算术编码的情况下,编码对象的振幅的可取范围相当于可变长度编码参数。
在对每1样本进行可变长度编码的情况下,对归一化完毕MDCT系数列的各系数XN[i]计算可变长度编码参数。对于每个由多个样本构成的样本群(例如每次2个样本)统一进行可变长度编码的情况下,对每个样本群计算可变长度编码参数。即,可变长度编码参数计算单元750对作为归一化完毕MDCT系数列的一部分的每一个归一化完毕部分系数列,计算可变长度编码参数。这里,归一化完毕部分系数列有多个,在多个归一化完毕部分系数列中不重复地包含归一化完毕MDCT系数列的系数。
以下,以对每1个样本进行莱斯编码的情况为例,说明可变长度编码参数的计算方法。
(步骤1)例如,通过下式,计算归一化完毕MDCT系数列XN[1],XN[2],…,XN[N]的各系数的振幅的平均的对数,作为成为基准的莱斯参数sb。
sb对于每个帧仅被进行1次编码,作为与成为基准的莱斯参数对应的码被输出到解码装置。或者也可以预先决定以下方法,即在可以从被传输到解码装置的其它的信息估计X[i]的振幅的情况下,在编码装置700和解码装置中共同地从X[i]的振幅的估计值近似地决定sb。在该情况下,也可以不编码sb,不将与成为基准的莱斯参数对应的码输出到解码装置。
(步骤2)通过下式计算阈值θ。
(步骤3)将莱斯参数ri以|sqrt(Z[i])/sqrt(~Z[i])|比θ越大,设为比sb越大的值的方法决定。将莱斯参数ri设为|sqrt(Z[i])/sqrt(~Z[i])|比θ越小,比sb越小的值来决定。
(步骤4)对全部的i=1,2,…,N反复进行步骤3的处理,求出对各归一化完毕MDCT系数XN[i]的莱斯参数ri。
<可变长度编码单元760>
可变长度编码单元760接收可变长度编码参数ri,使用该值将归一化完毕系数列XN(1),…,XN(N)进行可变长度编码,输出可变长码CX(s760)。
<第四实施方式的效果>
第四实施方式是对将MDCT系数列X[1],X[2],…,X[N]以平滑功率频谱包络序列归一化所得到的归一化完毕MDCT系数列XN[1],…,XN[N],使用可变长度编码参数进行编码的结构。
由于作为可变长度编码的对象的归一化完毕MDCT系数列尽量需要使用正确的功率频谱包络序列来求,所以在包络归一化单元740中,使用与通过平滑化线性预测系数求的功率频谱包络序列的误差少的、通过预测对应量化线性预测系数^af[1],^af[2],…,^af[p]求的第一平滑完毕功率频谱包络序列~W[1],~W[2],…,~W[N],生成归一化完毕MDCT系数列。
在可变长度编码参数计算单元750中,为了求可变长度编码参数,利用功率频谱包络序列和平滑功率频谱包络序列。因此,对于在可变长度编码参数计算单元750中使用的功率频谱包络序列和平滑功率频谱包络序列,希望与通过线性预测系数求的功率频谱包络序列或通过平滑化线性预测系数求的功率频谱包络序列的误差小。但是,预测对应量化线性预测系数^af[1],^af[2],…,^af[p]不仅在当前的帧的LSP码中产生了传输错误的情况下,而且在前帧的LSP码中产生了传输错误的情况下,在解码侧也不能得到正确的值。即,由从预测对应量化线性预测系数^af[1],^af[2],…,^af[p]求的功率频谱包络序列或从平滑功率频谱包络序列求可变长度编码参数时,不仅在当前的帧的LSP码中产生了传输错误的情况下,而且在前帧的LSP码中产生了传输错误的情况下,也不能正确地进行可变长度解码。
因此,在第四实施方式中,利用从非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p]求的功率频谱包络序列或平滑功率频谱包络序列来求可变长度编码参数。由此,即使在前面的帧的LSP码中产生了传输错误,只要在当前的帧的LSP码中不产生传输错误,则在当前的帧中可以得到与编码侧相同的非预测对应量化线性预测系数^bf[1],^bf[2],…,^bf[p]、功率频谱包络序列Z[1],Z[2],…,Z[N]以及第二平滑功率频谱包络序列~Z[1],~Z[2],…,~Z[N],所以在当前的帧中可以求出与编码侧相同的可变长度编码参数,对LSP码的传输错误的抗错性提高。
而且,在第四实施方式中,将使用第一平滑功率频谱包络序列~W[1],~W[2],…,~W[N]得到的归一化完毕MDCT系数列XN[1],…,XN[N]作为可变长度编码的对象。因此,不仅在当前帧的LSP码产生了传输错误的情况,而且在前面的帧的LSP码中产生了传输错误的情况下,在解码侧,存在对归一化完毕MDCT系数列XN[1],…,XN[N]相乘的平滑完毕功率频谱包络序列的各值的平方根中产生错误,通过解码得到的MDCT系数列中产生失真的问题。但是,与可变长度编码参数的错误那样的使得可变长度解码本身不正确的问题相比,该问题较小。
<变形例1>
在以上的第一~第四实施方式中,可以将执行在图3的线性预测系数编码装置100的非预测对应编码单元110、图7的线性预测系数编码装置300的非预测对应编码单元310、图11的线性预测系数编码装置500的非预测对应编码单元510中进行的处理(非预测对应编码处理)的对象,仅作为少于预测阶数p的规定的阶数TL以下的LSP参数(低阶的LSP参数),也可以在解码侧进行与它们对应的处理。
首先,对非预测对应编码单元110、310、510的各单元进行说明。
<非预测对应减法单元111,311>
非预测对应减法单元111、311生成由从输入的LSP参数向量Θf=(θf[1],θf[2],…,θf[p])T中的TL阶以下的LSP参数所构成的低阶LSP参数向量Θ’f=(θf[1],θf[2],…,θf[TL])T中,减去了存储单元111c中存储的非预测对应低阶平均向量Y’=(y[1],y[2],…,y[TL])T、和由输入的量化差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T中的TL阶以下的元素所构成的低阶量化差分向量^S’f=(^sf[1],^sf[2],…,^sf[TL])T的向量即低阶校正向量U’f=Θ’f-Y’-^S’f并输出。即,非预测对应减法单元111、311生成由校正向量Uf的元素的一部分所构成的向量即低阶校正向量U’f并输出。
这里,非预测对应低阶平均向量Y'=(y[1],y[2],…,y[TL])T是预定的向量,是在变形例1的解码装置中使用的非预测对应平均向量Y=(y[1],y[2],…,y[p])T中的TL阶以下的元素所构成的向量。
而且,也可以从LSP计算单元82输出LSP参数向量Θf中的TL阶以下的LSP参数所构成的低阶LSP参数向量Θ’f,输入到非预测对应减法单元111、311。而且,也可以从向量编码单元84输出量化差分向量^Sf中的TL阶以下的元素所构成的低阶量化差分向量^S’f,输入到非预测对应减法单元111、311。
<校正向量编码单元112、312、512>
校正向量编码单元112、312以及512参照校正向量码本113、513A、513B,对作为校正向量Uf的元素的一部分所构成的向量的低阶校正向量U’f进行编码。校正向量码本113、513A、513B中预先存储的各候选校正向量也可以作为TL阶的向量。
接着,说明变形例1的线性预测系数解码装置200、400、600。
说明在变形例1的线性预测系数解码装置200的非预测对应解码单元210、线性预测系数解码装置400的非预测对应解码单元410、线性预测系数解码装置600的非预测对应解码单元610中进行的处理(非预测对应解码处理)。
<校正向量解码单元211、411、611>
校正向量解码单元211、411、611接收校正LSP码Df,参照校正向量码本212、612A、612B,将校正LSP码Df解码,得到并输出解码低阶校正向量^U’f。解码低阶校正向量^U’f=(uf[1],uf[2],…,uf[TL])T是TL阶的向量。与校正向量码本113、513A、513B同样,在校正向量码本212、612A、612B中预先存储的各候选校正向量也可以作为TL阶的向量。
<非预测对应加法单元213>
非预测对应加法单元213接收解码低阶校正向量^U’f=(uf[1],uf[2],…,uf[TL])T、非预测对应平均向量Y=(y[1],y[2],…,y[p])T、解码差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T。
非预测对应加法单元213生成对TL阶以下的各阶,将解码低阶校正向量^U’f、解码差分向量^Sf和非预测对应平均向量Y的元素相加,对超过p阶以下的TL阶的各阶,将解码差分向量^Sf和非预测对应平均向量Y的元素相加得到的解码非预测对应LSP参数向量^Φf并输出。即,解码非预测对应LSP参数向量^Φf是,^Φf=(uf[1]+y[1]+^sf[1],uf[2]+y[2]+^sf[2],…,uf[TL]+y[TL]+^sf[TL],y[TL+1]+^sf[TL+1],…,y[p]+^sf[p])。
<非预测对应加法单元413>
非预测对应加法单元413接收解码低阶校正向量^U’f=(uf[1],uf[2],…,uf[TL])T、非预测对应平均向量Y=(y[1],y[2],…,y[p])T、解码差分向量^Sf=(^sf[1],^sf[2],…,^sf[p])T。
在非预测对应加法单元413接收到表示执行校正解码处理的控制信号C、和正的整数(或者表示正的整数的码)作为控制信号C的情况下,总之,在频谱包络的峰谷大于规定的基准的情况、(A-1)以及/或者(B-1)的情况下,生成对TL阶以下的各阶,将解码低阶校正向量^U’f、解码差分向量^Sf、非预测对应平均向量Y的元素相加,对超过p阶以下的TL阶的各阶,将解码差分向量^Sf和非预测对应平均向量Y的元素相加所得到的解码非预测对应LSP参数向量^Φf并输出。即,解码非预测对应LSP参数向量^Φf是^Φf=(uf[1]+y[1]+^sf[1],uf[2]+y[2]+^sf[2],…,uf[TL]+y[TL]+^sf[TL],y[TL+1]+^sf[TL+1],…,y[p]+^sf[p])。
非预测对应加法单元413在接收到表示不执行校正解码处理的控制信号C或者0作为控制信号C的情况,总之,频谱包络的峰谷不大于规定的基准的情况下,即在上述的例子中(A-1)以及/或者(B-1)以外的情况下,生成将解码差分向量^Sf和非预测对应平均向量Y相加所得到的解码非预测对应LSP参数向量^Φf=Y+^Sf并输出。
由此,通过将可能由于后述的信号处理的效率,对近似精度的高度产生较大影响的低阶LSP参数优先而使编码失真降低,能够抑制失真的增大,并且与第一~第三实施方式的方法相比可以减少码量。
<变形例2>
在第一~第四实施方式中,将LSP计算单元的输入设为线性预测系数af[1],af[2],…,af[p],但是也可以例如将对线性预测系数的各系数af[i]乘以γ的i次方的系数的序列af[1]×γ,af[2]×γ2,…,af[p]×γp作为LSP计算单元的输入。
而且,在第一~第四实施方式中,将线性预测系数编码装置的编码或线性预测系数解码装置的解码的对象作为LSP参数,但只要是可变换为线性预测系数本身或ISP参数等的线性预测系数的系数,将任何系数作为编码或解码的对象都可以。
<其它的变形例>
本发明不限定于上述的实施方式以及变形例。例如,上述的各种处理不仅按照记载按时间序列被执行,也可以根据执行处理的装置的处理能力或者需要并行地或者单独地被执行。另外,在不脱离本发明的意旨的范围内能够适当变更。
<程序以及记录介质>
而且,也可以通过计算机实现在上述的实施方式以及变形例中说明的各装置中的各种处理功能。在该情况下,通过程序记述各装置应该具有的功能的处理内容。然后,通过由计算机执行该程序,在计算机上实现上述各装置中的各种处理功能。
记述了该处理内容的程序可以预先记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如可以是磁记录装置、光盘,光磁记录介质,半导体存储器等。
而且,例如通过贩卖、转让、出租记录了该程序的DVD、CD-ROM等可移动型记录介质等来进行该程序的流通。进而,也可以将该程序预先存储在服务器计算机的存储装置中,经由网络,将该程序通过从服务器计算机转发到其它计算机,使该程序流通。
执行这样的程序的计算机,例如,首先,将可移动型记录介质中记录的程序或者从服务器计算机转发的程序暂时存储在自己的存储单元中。然后,在执行处理时,该计算机读取自己的存储单元中存储的程序,执行按照读取的程序的处理。而且,作为该程序的其它实施方式,也可以计算机从可移动型记录介质直接读取程序,执行按照该程序的处理。进而,也可以在每次从服务器计算机对该计算机转发程序时,逐次执行按照接收到的程序的处理。而且,也可以构成为不进行从服务器计算机至该计算机的程序的转发,通过仅按照该执行指示和结果获取来实现处理功能的、所谓ASP(Application Service Provider,应用服务提供者)型的服务,执行上述的处理。而且,设为在程序中,包含作为供电子计算机的处理用的信息的、按照程序看待的内容(具有虽然不是对于计算机的直接的指令,但是规定计算机的处理的性质的数据等)。
而且,虽然设为通过在计算机上执行规定的程序,构成各装置,但是这些处理内容的至少一部分也可以以硬件方式实现。
Claims (9)
1.一种解码装置,包括:
预测对应解码单元,解码第一码,得到解码差分向量,将所述解码差分向量与至少包含来自过去的帧的预测的预测向量相加,生成可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及
非预测对应解码单元,解码第二码,得到解码校正向量,将所述解码校正向量和至少所述解码差分向量的对应的阶数的元素彼此之间相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
2.一种解码装置,包括:
预测对应解码单元,解码第一码,得到解码差分向量,将所述解码差分向量和由至少来自过去的帧的预测和预定的向量所构成的预测向量相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及
非预测对应解码单元,解码第二码,得到解码校正向量,对于对应的阶数的每个元素,对所述解码校正向量至少加上所述解码差分向量和预定的向量,生成可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
3.如权利要求2所述的解码装置,
将α设为正的常数,所述预测向量是将预定的预测对应平均向量与α倍的过去的帧的解码差分向量相加所得到的向量,
所述第二解码向量是将所述解码校正向量、所述解码差分向量、预定的非预测对应平均向量的对应的阶数的元素彼此之间相加所得到的向量。
4.如权利要求1至3的任意一项所述的解码装置,
解码所述第二码所得到的解码校正向量的元素数TL少于所述预测对应解码单元的所述各向量的元素数p,
所述非预测对应解码单元生成的第二解码向量的元素数为p。
5.一种解码方法,包括:
预测对应解码步骤,解码第一码,得到解码差分向量,将所述解码差分向量与至少包含来自过去的帧的预测的预测向量相加,生成可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及
非预测对应解码步骤,解码第二码,得到解码校正向量,将所述解码校正向量和至少所述解码差分向量的对应的阶数的元素彼此之间相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
6.一种解码方法,包括:
预测对应解码步骤,解码第一码,得到解码差分向量,将所述解码差分向量和由至少来自过去的帧的预测和预定的向量所构成的预测向量相加,生成由可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第一解码向量;以及
非预测对应解码步骤,解码第二码,得到解码校正向量,对于对应的阶数的每个元素,对所述解码校正向量至少加上所述解码差分向量和预定的向量,生成可变换为当前的帧的多阶的线性预测系数的系数的解码值所构成的第二解码向量。
7.如权利要求6所述的解码方法,
将α设为正的常数,所述预测向量是将预定的预测对应平均向量与α倍的过去的帧的解码差分向量相加所得到的向量,
所述第二解码向量是将所述解码校正向量、所述解码差分向量、预定的非预测对应平均向量的对应的阶数的元素彼此之间相加所得到的向量。
8.如权利要求5至7的任意一项所述的解码方法,
解码所述第二码所得到的解码校正向量的元素数TL少于所述预测对应解码步骤的所述各向量的元素数p,
所述非预测对应解码步骤生成的第二解码向量的元素数为p。
9.一种计算机可读取的记录介质,记录了用于使计算机执行权利要求5至7的任意一项所述的解码方法的程序。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014094758 | 2014-05-01 | ||
JP2014-094758 | 2014-05-01 | ||
CN201580022683.3A CN106415715B (zh) | 2014-05-01 | 2015-03-16 | 编码装置、编码方法、记录介质 |
PCT/JP2015/057727 WO2015166733A1 (ja) | 2014-05-01 | 2015-03-16 | 符号化装置、復号装置、及びその方法、プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580022683.3A Division CN106415715B (zh) | 2014-05-01 | 2015-03-16 | 编码装置、编码方法、记录介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110444217A CN110444217A (zh) | 2019-11-12 |
CN110444217B true CN110444217B (zh) | 2022-10-21 |
Family
ID=54358473
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910644499.2A Active CN110444217B (zh) | 2014-05-01 | 2015-03-16 | 解码装置、解码方法、记录介质 |
CN201910644404.7A Active CN110444215B (zh) | 2014-05-01 | 2015-03-16 | 编码装置、编码方法、记录介质 |
CN201910644410.2A Active CN110444216B (zh) | 2014-05-01 | 2015-03-16 | 解码装置、解码方法、记录介质 |
CN201580022683.3A Active CN106415715B (zh) | 2014-05-01 | 2015-03-16 | 编码装置、编码方法、记录介质 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910644404.7A Active CN110444215B (zh) | 2014-05-01 | 2015-03-16 | 编码装置、编码方法、记录介质 |
CN201910644410.2A Active CN110444216B (zh) | 2014-05-01 | 2015-03-16 | 解码装置、解码方法、记录介质 |
CN201580022683.3A Active CN106415715B (zh) | 2014-05-01 | 2015-03-16 | 编码装置、编码方法、记录介质 |
Country Status (8)
Country | Link |
---|---|
US (6) | US10418042B2 (zh) |
EP (4) | EP3859734B1 (zh) |
JP (4) | JP6270993B2 (zh) |
KR (4) | KR101855945B1 (zh) |
CN (4) | CN110444217B (zh) |
ES (4) | ES2876184T3 (zh) |
PL (4) | PL3139382T3 (zh) |
WO (1) | WO2015166733A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110444217B (zh) | 2014-05-01 | 2022-10-21 | 日本电信电话株式会社 | 解码装置、解码方法、记录介质 |
US11789729B2 (en) | 2017-12-29 | 2023-10-17 | Intel Corporation | Systems and methods for computing dot products of nibbles in two tile operands |
US11669326B2 (en) | 2017-12-29 | 2023-06-06 | Intel Corporation | Systems, methods, and apparatuses for dot product operations |
US11809869B2 (en) | 2017-12-29 | 2023-11-07 | Intel Corporation | Systems and methods to store a tile register pair to memory |
US11816483B2 (en) | 2017-12-29 | 2023-11-14 | Intel Corporation | Systems, methods, and apparatuses for matrix operations |
US11093247B2 (en) | 2017-12-29 | 2021-08-17 | Intel Corporation | Systems and methods to load a tile register pair |
US11023235B2 (en) * | 2017-12-29 | 2021-06-01 | Intel Corporation | Systems and methods to zero a tile register pair |
CN109688409B (zh) * | 2018-12-28 | 2021-03-02 | 北京奇艺世纪科技有限公司 | 一种视频编码方法及装置 |
US11281470B2 (en) * | 2019-12-19 | 2022-03-22 | Advanced Micro Devices, Inc. | Argmax use for machine learning |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
JP3255189B2 (ja) * | 1992-12-01 | 2002-02-12 | 日本電信電話株式会社 | 音声パラメータの符号化方法および復号方法 |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
CA2722196C (en) * | 1997-12-24 | 2014-10-21 | Mitsubishi Denki Kabushiki Kaisha | A method for speech coding, method for speech decoding and their apparatuses |
JP3478209B2 (ja) * | 1999-11-01 | 2003-12-15 | 日本電気株式会社 | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 |
US7167828B2 (en) * | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP3590342B2 (ja) * | 2000-10-18 | 2004-11-17 | 日本電信電話株式会社 | 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体 |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3472279B2 (ja) * | 2001-06-04 | 2003-12-02 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ符号化方法及び装置 |
KR100487719B1 (ko) * | 2003-03-05 | 2005-05-04 | 한국전자통신연구원 | 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기 |
CN101494460B (zh) * | 2003-09-02 | 2012-07-11 | 日本电信电话株式会社 | 浮点信号的编码方法、解码方法及其编码器、解码器 |
EP1755109B1 (en) * | 2004-04-27 | 2012-08-15 | Panasonic Corporation | Scalable encoding and decoding apparatuses and methods |
ATE394774T1 (de) * | 2004-05-19 | 2008-05-15 | Matsushita Electric Ind Co Ltd | Kodierungs-, dekodierungsvorrichtung und methode dafür |
CN101794579A (zh) * | 2005-01-12 | 2010-08-04 | 日本电信电话株式会社 | 长期预测编码和长期预测解码的方法和装置 |
RU2008112137A (ru) * | 2005-09-30 | 2009-11-10 | Панасоник Корпорэйшн (Jp) | Устройство кодирования речи и способ кодирования речи |
US20090248404A1 (en) * | 2006-07-12 | 2009-10-01 | Panasonic Corporation | Lost frame compensating method, audio encoding apparatus and audio decoding apparatus |
RU2462769C2 (ru) * | 2006-10-24 | 2012-09-27 | Войсэйдж Корпорейшн | Способ и устройство кодирования кадров перехода в речевых сигналах |
US7813922B2 (en) * | 2007-01-30 | 2010-10-12 | Nokia Corporation | Audio quantization |
US8719012B2 (en) * | 2007-06-15 | 2014-05-06 | Orange | Methods and apparatus for coding digital audio signals using a filtered quantizing noise |
JP5006774B2 (ja) * | 2007-12-04 | 2012-08-22 | 日本電信電話株式会社 | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
WO2009075326A1 (ja) * | 2007-12-11 | 2009-06-18 | Nippon Telegraph And Telephone Corporation | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
ES2409843T3 (es) * | 2008-01-24 | 2013-06-28 | Nippon Telegraph And Telephone Corporation | Método de codificación, método de decodificación, y dispositivo y programa para los mismos, y medio o soporte de registro o grabación |
JP5013293B2 (ja) * | 2008-02-29 | 2012-08-29 | 日本電信電話株式会社 | 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体 |
WO2010041680A1 (ja) * | 2008-10-10 | 2010-04-15 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
JP4848049B2 (ja) * | 2008-12-09 | 2011-12-28 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
JP4735711B2 (ja) * | 2008-12-17 | 2011-07-27 | ソニー株式会社 | 情報符号化装置 |
JP5253518B2 (ja) * | 2008-12-22 | 2013-07-31 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
CN101521013B (zh) * | 2009-04-08 | 2011-08-17 | 武汉大学 | 空间音频参数双向帧间预测编解码装置 |
WO2010140546A1 (ja) * | 2009-06-03 | 2010-12-09 | 日本電信電話株式会社 | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体 |
GB0917417D0 (en) * | 2009-10-05 | 2009-11-18 | Mitsubishi Elec R&D Ct Europe | Multimedia signature coding and decoding |
KR101397058B1 (ko) * | 2009-11-12 | 2014-05-20 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
CN102714040A (zh) * | 2010-01-14 | 2012-10-03 | 松下电器产业株式会社 | 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法 |
JP5813094B2 (ja) * | 2010-04-09 | 2015-11-17 | ドルビー・インターナショナル・アーベー | Mdctベース複素予測ステレオ符号化 |
ES2704742T3 (es) * | 2011-04-05 | 2019-03-19 | Nippon Telegraph & Telephone | Descodificación de una señal acústica |
JP6160072B2 (ja) * | 2012-12-06 | 2017-07-12 | 富士通株式会社 | オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
JP6366706B2 (ja) * | 2013-10-18 | 2018-08-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スピーチ関連のスペクトル整形情報を使用したオーディオ信号符号化と復号化の概念 |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
AU2014391078B2 (en) * | 2014-04-17 | 2020-03-26 | Voiceage Evs Llc | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
CN110444217B (zh) * | 2014-05-01 | 2022-10-21 | 日本电信电话株式会社 | 解码装置、解码方法、记录介质 |
US9747910B2 (en) * | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
-
2015
- 2015-03-16 CN CN201910644499.2A patent/CN110444217B/zh active Active
- 2015-03-16 KR KR1020167030130A patent/KR101855945B1/ko active IP Right Grant
- 2015-03-16 PL PL15786812T patent/PL3139382T3/pl unknown
- 2015-03-16 CN CN201910644404.7A patent/CN110444215B/zh active Active
- 2015-03-16 PL PL21158838T patent/PL3859734T3/pl unknown
- 2015-03-16 WO PCT/JP2015/057727 patent/WO2015166733A1/ja active Application Filing
- 2015-03-16 PL PL19174056T patent/PL3544004T3/pl unknown
- 2015-03-16 EP EP21158838.9A patent/EP3859734B1/en active Active
- 2015-03-16 PL PL20167742T patent/PL3706121T3/pl unknown
- 2015-03-16 ES ES20167742T patent/ES2876184T3/es active Active
- 2015-03-16 CN CN201910644410.2A patent/CN110444216B/zh active Active
- 2015-03-16 JP JP2016515896A patent/JP6270993B2/ja active Active
- 2015-03-16 ES ES21158838T patent/ES2911527T3/es active Active
- 2015-03-16 CN CN201580022683.3A patent/CN106415715B/zh active Active
- 2015-03-16 KR KR1020187012384A patent/KR101870957B1/ko active IP Right Grant
- 2015-03-16 EP EP20167742.4A patent/EP3706121B1/en active Active
- 2015-03-16 EP EP19174056.2A patent/EP3544004B1/en active Active
- 2015-03-16 ES ES19174056T patent/ES2822127T3/es active Active
- 2015-03-16 KR KR1020187012387A patent/KR101870962B1/ko active IP Right Grant
- 2015-03-16 US US15/307,059 patent/US10418042B2/en active Active
- 2015-03-16 EP EP15786812.6A patent/EP3139382B1/en active Active
- 2015-03-16 KR KR1020187012383A patent/KR101870947B1/ko active IP Right Grant
- 2015-03-16 ES ES15786812T patent/ES2744904T3/es active Active
-
2017
- 2017-12-25 JP JP2017247954A patent/JP6462104B2/ja active Active
-
2018
- 2018-01-26 JP JP2018011829A patent/JP6490846B2/ja active Active
- 2018-01-26 JP JP2018011828A patent/JP6484358B2/ja active Active
-
2019
- 2019-07-31 US US16/527,160 patent/US11120809B2/en active Active
-
2021
- 2021-07-07 US US17/369,056 patent/US11670313B2/en active Active
- 2021-07-08 US US17/370,060 patent/US11694702B2/en active Active
-
2023
- 2023-05-09 US US18/195,015 patent/US12051430B2/en active Active
-
2024
- 2024-06-14 US US18/743,662 patent/US20240339119A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110444217B (zh) | 解码装置、解码方法、记录介质 | |
CN110534122B (zh) | 解码装置、及其方法、记录介质 | |
WO2013187498A1 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 | |
WO2013129528A1 (ja) | 符号化装置、この方法、プログラムおよび記録媒体 | |
WO2013129439A1 (ja) | 符号化装置、この方法、プログラム及び記録媒体 | |
WO2013118835A1 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |