CN108352165B - 解码装置、解码方法以及计算机可读存储介质 - Google Patents
解码装置、解码方法以及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108352165B CN108352165B CN201680064042.9A CN201680064042A CN108352165B CN 108352165 B CN108352165 B CN 108352165B CN 201680064042 A CN201680064042 A CN 201680064042A CN 108352165 B CN108352165 B CN 108352165B
- Authority
- CN
- China
- Prior art keywords
- decoding
- fade
- boundary position
- audio
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 132
- 230000001360 synchronised effect Effects 0.000 claims abstract description 21
- 239000003550 marker Substances 0.000 claims description 3
- 238000002135 phase contrast microscopy Methods 0.000 description 34
- 238000013139 quantization Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000012782 phase change material Substances 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明涉及一种解码装置、解码方法和程序,其被配置成使得能够尽可能快地交替解码和输出回放定时被同步的多个音频编码比特流。作为本发明的一方面的解码装置设置有:获取单元,用于获取多个音频编码比特流;选择单元,用于确定用于切换对多个音频编码比特流的输出的边界位置并且根据该边界位置将所获取的多个音频编码比特流中的一者选择性地提供给解码处理单元;以及解码处理单元,用于对经由选择单元输入的所述一个比特流执行包括IMDCT处理的解码处理,该解码处理单元消除与边界位置之前和之后的帧中的每一者对应的IMDCT处理的交叠相加。本发明可以应用于例如接收装置、回放装置等。
Description
技术领域
本公开涉及解码装置、解码方法和程序,并且具体涉及适用于在再现定时被同步的音频编码比特流之间切换输出的解码装置、解码方法和程序。
背景技术
例如,在用于电影、新闻、体育直播等的内容的一些视频中准备多种语言(例如日语和英语)的声音,并且在这种情况下,多个声音的再现定时被同步。
在下文中,假设具有同步再现定时的声音各自被准备为音频编码比特流,并且执行至少包括MDCT(修正离散余弦变换)处理的诸如AAC(高级音频编码)的编码处理以对音频编码比特流应用可变长度编码。注意,在数字地面电视广播中采用包括MDCT处理的MPEG-2AAC声音编码系统(例如参见非专利文献1)。
图1简单地示出了对声音的源数据应用编码处理的编码装置和对从编码装置输出的音频编码比特流应用解码处理的解码装置的常规配置的示例。
编码装置10包括MDCT单元11、量化单元12和可变长度编码单元13。
MDCT单元11将从先前级输入的声音的源数据划分成具有预定时间宽度的帧并且执行MDCT处理,以使得前一帧和下一帧彼此交叠。通过这种方式,MDCT单元11将具有时域值的源数据转换成频域值并且将该值输出至量化单元12。量化单元12量化来自MDCT单元11的输入并且将该值输出至可变长度编码单元13。可变长度编码单元13对量化的值应用可变长度编码以生成并且输出音频编码比特流。
解码装置20安装在例如接收广播的或分发的内容的接收装置上或在再现记录在记录介质中的内容的再现装置上,并且解码装置20包括解码单元21、逆量化单元22和IMDCT(逆MDCT)单元23。
与可变长度编码单元13对应的解码单元21基于帧对音频编码比特流应用解码处理并且将解码结果输出至逆量化单元22。与量化单元12对应的逆量化单元22对解码结果应用逆量化并且将处理结果输出至IMDCT单元23。与MDCT单元11对应的IMDCT单元23对逆量化结果应用IMDCT处理,以重构与编码之前的源数据对应的PCM数据。将详细描述由IMDCT单元23进行的IMDCT处理。
图2示出了由IMDCT单元23进行的IMDCT处理。
如图2所示,IMDCT单元23对前一帧和后一帧两者(帧#1和帧#2)的音频编码比特流(音频编码比特流的逆量化结果)BS1-1和BS1-2应用IMDCT处理以获得IMDCT-OUT#1-1作为反向转换结果。IMDCT单元23还将IMDCT处理应用于与上述音频编码比特流交叠的两个帧(帧#2和帧#3)的音频编码比特流(音频编码比特流的逆量化结果)BS1-2和BS1-3,以获得IMDCT-OUT#1-2作为反向转换结果。IMDCT单元23还对IMDCT-OUT#1-1和IMDCT-OUT#1-2应用交叠相加,以完全重构作为与帧#2对应的PCM数据的PCM1-2。
与帧#3和稍后的帧对应的PCM数据1-3也通过类似的方法被完全重构。
然而,此处所使用的术语“完全”表示PCM数据被重构——包括直到交叠相加的处理——并且该术语不表示源数据被100%再现。
引用列表
非专利文献
非专利文献1:ARIB STD-B32,2.2版本,2015年7月29日
发明内容
技术问题
此处,考虑尽可能快地切换具有同步的再现定时的多个音频编码比特流,从而解码并且输出多个音频编码比特流。
图3示出了将第一音频编码比特流切换到再现定时被同步的第二音频编码比特流的常规方法。
如图3所示,当在帧#2与帧#3之间设置切换边界位置并且第一音频编码比特流将被切换到第二音频编码比特流时,针对第一音频编码比特流解码并且输出直到与帧#2对应的PCM1-2为止的数据。针对切换之后的第二音频编码比特流,解码并且输出从与帧#3对应的PCM2-3起的数据。
附带地,如参照图2所描述的那样,反向转换结果IMDCT-OUT#1-1和IMDCT-OUT#1-2对于获得PCM1-2是必要的。类似地,反向转换结果IMDCT-OUT#2-2和IMDCT-OUT#2-3对于获得PCM2-3是必要的。因此,为了执行图3所示的切换,需要在帧#2与帧#3之间的时段期间同时并行地对第一音频编码比特流和第二音频编码比特流应用包括IMDCT处理的解码处理。
然而,为了同时并行地执行包括IMDCT处理的解码处理,需要具有相似配置的多个硬件,以通过硬件实现包括IMDCT处理的解码处理,并且这增大了电路规模并且增加了成本。
此外,为了实现包括通过软件进行的IMDCT处理的解码处理,根据CPU的吞吐量可能出现诸如声音中断和声音异常等问题。因此,需要高性能的CPU来防止这些问题,但这也增加了成本。
鉴于这种情况做出了本公开内容,并且本公开内容被设计成尽可能快地切换具有同步再现定时的多个音频编码比特流,从而在不增大电路规模或增加成本的情况下解码并且输出多个音频编码比特流。
[问题的解决方案]
本公开内容的一方面提供了一种解码装置,该解码装置包括:获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;以及所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
根据本公开内容的该方面的解码装置还可以包括:淡入淡出处理单元,其对边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在边界位置之前和之后的帧中,由解码处理单元跳过了交叠相加。
淡入淡出处理单元可以对边界位置之前的帧的解码处理结果应用淡出处理并且对边界位置之后的帧的解码处理结果应用淡入处理,在边界位置之前和之后的帧中,由解码处理单元跳过了交叠相加。
淡入淡出处理单元可以对边界位置之前的帧的解码处理结果应用淡出处理并且对边界位置之后的帧的解码处理结果应用静音处理,在边界位置之前和之后的帧中,由解码处理单元跳过了交叠相加。
淡入淡出处理单元可以对边界位置之前的帧的解码处理结果应用静音处理并且对边界位置之后的帧的解码处理结果应用淡入处理,在边界位置之前和之后的帧中,由解码处理单元跳过了交叠相加。
选择单元可以基于被添加到每个帧并且在多个音频编码比特流的供应侧设置的最佳切换位置标记来确定边界位置。
可以由音频编码比特流的供应侧基于源数据的能量或上下文来设置最佳切换位置标记。
选择单元可以基于与多个音频编码比特流的增益相关联的信息来确定边界位置。
本公开内容的一方面提供了一种由解码装置执行的解码方法,该解码方法包括:获取步骤,用于获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;确定步骤,用于确定用于切换所述多个音频编码比特流的输出的边界位置;选择步骤,用于根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理步骤;以及所述解码处理步骤,用于对选择性地提供的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,在所述解码处理步骤中,跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
本公开内容的一方面提供了一种使计算机用作如下的程序:获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;以及所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
根据本公开内容的该方面,获取了多个音频编码比特流,并且确定了用于切换多个音频编码比特流的输出的边界位置。对根据边界位置选择性地提供的多个音频编码比特流中的一者应用包括与MDCT处理对应的IMDCT处理的解码处理。在解码处理中,跳过与边界位置之前和之后的每个帧对应的IMDCT处理中的交叠相加。
本发明的有益效果
根据本公开内容的一方面,可以尽可能快地切换具有同步再现定时的多个音频编码比特流,从而解码并且输出多个音频编码比特流。
附图说明
图1是图示编码装置和解码装置的配置的示例的框图。
图2是描述IMDCT处理的图。
图3是图示音频编码比特流的切换的图。
图4是图示根据本公开内容的解码装置的配置示例的框图。
图5是图示由图4的解码装置进行的音频编码比特流的第一切换方法的图。
图6是描述声音切换处理的流程图。
图7是描述最佳切换位置标记设置处理的流程图。
图8是图示最佳切换位置标记设置处理的状态的图。
图9是描述切换边界位置确定处理的流程图。
图10是图示切换边界位置确定处理的状态的图。
图11是图示由图4的解码装置进行的音频编码比特流的第二切换方法的图。
图12是图示由图4的解码装置进行的音频编码比特流的第三切换方法的图。
图13是图示通用计算机的配置示例的框图。
具体实施方式
在下文中,将参照附图详细描述用于执行本公开内容的最佳模式(下文中称为实施方式)。
<作为本公开内容的实施方式的解码装置的配置示例>
图4图示了作为本公开内容的实施方式的解码装置的配置示例。
解码装置30安装在例如接收广播的或分发的内容的接收装置上或在再现记录在记录介质中的内容的再现装置上。此外,解码装置30可以快速地切换具有同步再现定时的第一音频编码比特流和第二音频编码比特流,以解码和输出比特流。
假设执行至少包括MDCT处理的编码处理以将可变长度编码应用于第一音频编码比特流和第二音频编码比特流中的声音的源数据。在下文中,第一音频编码比特流和第二音频编码比特流也将被简单地称为第一编码比特流和第二编码比特流。
解码装置30包括解复用单元31、解码单元32-1和32-2、选择单元33、解码处理单元34和淡入淡出处理单元37。
解复用单元11从先前级输入的复用流中分离具有同步再现定时的第一编码比特流和第二编码流。解复用单元11还将第一编码比特流输出至解码单元32-1并且将第二编码流输出至解码单元32-2。
解码单元32-1对第一编码比特流应用解码处理以解码第一编码比特流的可变长度码并且将处理结果(在下文中称为量化数据)输出至选择单元33。解码单元32-2对第二编码比特流应用解码处理以解码第二编码比特流的可变长度码并且将处理结果的量化数据输出至选择单元33。
选择单元33基于来自用户的声音切换指令来确定切换边界位置,并且根据所确定的切换边界位置将来自解码单元32-1或解码单元32-2的量化数据输出至解码处理单元34。
选择单元33还可以基于添加到第一编码比特流和第二编码比特流的每个帧的最佳切换位置标记来确定切换边界位置。这将在稍后参照图7至图10进行描述。
解码处理单元34包括逆量化单元35和IMDCT单元36。逆量化单元35对通过选择单元33输入的量化数据应用逆量化并且将逆量化结果(在下文中称为MDCT数据)输出至IMDCT单元36。IMDCT单元36对MDCT数据应用IMDCT处理以重构与编码之前的源数据对应的PCM数据。
然而,IMDCT单元36不完全重构与所有相应帧对应的PCM数据,并且IMDCT单元36还针对切换边界位置附近的帧输出在不完全状态下重构的PCM数据。
淡入淡出处理单元37对从解码处理单元34输入的切换边界位置附近的PCM数据应用淡出处理、淡入处理或静音处理,并且将PCM数据输出至稍后的级。
注意,尽管在图4所示的配置示例中所示的情况下具有复用的第一编码比特流和第二编码比特流的复用流被输入至解码装置30,但可以在复用流中复用更多的编码比特流。在这种情况下,解码单元32的数目可以根据复用的编码比特流的数目而增大。
此外,可以将多个编码比特流分别输入至解码装置30,而不是输入复用流。在这种情况下,可以省略解复用单元31。
<解码装置30的编码比特流的第一切换方法>
接下来,图5图示了由解码装置30进行的编码比特流的第一切换方法。
如图5所示,当在帧#2与帧#3之间设置切换边界位置并且第一编码比特流将被切换到第二编码比特流时,对到紧接在第一编码比特流的切换边界位置之前的帧#2为止的数据应用IMDCT处理。在这种情况下,尽管可以完全重构到与帧#1对应的PCM1-1为止的数据,但与帧#2对应的PCM1-2的重构是不完全的。
同时,对于第二编码比特流,对从紧接在切换边界位置之后的帧#3起的数据应用IMDCT处理。在这种情况下,与帧#3对应的PCM2-3的重构是不完全的,并且从与帧#4对应的PCM2-4起,数据被完全重构。
此处,“不完全重构”表示IMDCT-OUT的前半部分或后半部分在不执行交叠相加的情况下被用作PCM数据。
在这种情况下,MDCT-OUT#1-1的后半部分可以用于与第一编码比特流的帧#2对应的PCM1-2。类似地,MDCT-OUT#2-3的前半部分可以用于与第二编码比特流的帧#3对应的PCM2-3。注意,明显地,不完全重构的PCM1-2和PCM2-3的音质低于完全重构的PCM1-2和PCM2-3的音质。
当输出PCM数据时,到与帧#1对应的完全重构的PCM1-1为止的数据以正常音量输出。与紧接在切换边界位置之前的帧#2对应的不完全PCM1-2的音量通过淡出处理逐渐减小,并且与紧接在切换边界位置之后的帧#3对应的不完全PCM2-3的音量通过淡入处理逐渐增大。从帧#4起,完全重构的PCM2-4以正常音量输出。
通过这样的方式,紧在改变边界位置之后输出不完全重构的PCM数据,并且不需要并行地执行两种解码处理。此外,淡出处理和淡入处理连接不完全的PCM数据,并且这可以减少由于声音切换导致的帧的不连续所引起的刺耳干扰噪声的音量。
注意,由解码装置30进行的编码比特流的切换方法不限于第一切换方法,而是也可以采用后述的第二切换方法或第三切换方法。
<由解码装置30进行的声音切换处理>
接下来,图6是描述与图5中图示的第一切换方法对应的声音切换处理的流程图。
假设在声音切换处理之前,在解码装置30中,解复用单元11已经从复用流中分离出第一编码比特流和第二编码比特流,并且解码单元32-1或解码单元31-2分别解码了第一编码比特流和第二编码比特流。还假设选择单元33已经选择来自解码单元32-1和31-2中的一者的量化数据并且将量化数据输入至解码处理单元34。
在下面描述的情况下,选择单元33选择来自解码单元32-1的量化数据并且将量化数据输入至解码处理单元34。因此,解码装置30当前正在以正常音量输出基于第一编码比特流的PCM数据。
在步骤S1中,选择单元33确定是否存在来自用户的声音切换指令并且等待直到存在声音切换指令。当选择单元33等待时,维持由选择单元33进行的选择性输出。因此,解码装置30以正常音量连续输出基于第一编码比特流的PCM数据。
当存在来自用户的声音切换指令时,处理进行到步骤S2。在步骤S2中,选择单元33确定声音的切换边界位置。例如,选择单元33确定从接收到声音切换指令起的预定数量的帧之后的位置处的声音的切换边界位置。然而,选择单元33可以基于包括在编码比特流中的最佳切换位置标记(稍后详细描述)来确定切换边界位置。
在这种情况下,如图5所图示的那样,假设在帧#2与帧#3之间设置切换边界位置。
随后,在步骤S3中,选择单元33保持当前选择,直到选择单元33将与紧接在确定的切换边界位置之前的帧对应的量化数据输出至解码处理单元34为止。因此,选择单元33将来自解码单元32-1的量化数据输出至稍后的级。
在步骤S4中,解码处理单元34的逆量化单元35基于第一编码比特流执行对量化数据的逆量化,并且将作为逆量化的结果获得的MDCT数据输出至IMDCT单元36。IMDCT单元36对到与紧接在切换边界位置之前的帧对应的MDCT数据为止的数据应用IMDCT处理,从而重构与编码之前的源数据对应的PCM数据并且将PCM数据输出至淡入淡出处理单元37。
在这种情况下,尽管可以完全重构到与帧#1对应的PCM1-1为止的数据,但对与帧#2对应的PCM1-2的重构是不完全的。
在步骤S5中,淡入淡出处理单元37对从解码处理单元34输入的与紧接在切换边界位置之前的帧对应的不完全PCM数据(在这种情况下与帧#2对应的PCM1-2)应用淡出处理34,并且将PCM数据输出至稍后的级。
接下来,在步骤S6中,选择单元33切换针对解码处理单元34的输出。因此,选择单元33将来自解码单元32-2的量化数据输出至稍后的级。
在步骤S7中,解码处理单元34的逆量化单元35基于第二编码比特流执行对量化数据的逆量化,并且将作为逆量化的结果获得的MDCT数据输出至IMDCT单元36。IMDCT单元36对从与紧接在切换边界位置之后的帧对应的MDCT数据起的数据应用IMDCT处理,从而重构与编码之前的源数据对应的PCM数据并且将PCM数据输出至淡入淡出处理单元37。
在这种情况下,对与帧#3对应的PCM2-3的重构是不完全的,并且从与帧#4对应的PCM2-4起完全重构数据。
在步骤S8中,淡入淡出处理单元37对从解码处理单元34输入的与紧接在切换边界位置之后的帧对应的不完全PCM数据(在这种情况下与帧#3对应的PCM2-3)应用淡入处理并且将PCM数据输出至稍后的级。然后,该处理返回到步骤S1,并且重复随后的处理。
这完成了由解码装置30进行的声音切换处理的描述。根据声音切换处理,可以在不并行地执行两种解码处理的情况下切换声音的编码比特流。声音切换处理还可以使由于声音切换导致的帧的不连续性引起的刺耳干扰噪音的音量减小。
<最佳切换位置标记设置处理>
在声音切换处理中,在从接收到来自用户的声音切换指令起的预定数目的帧之后的位置处确定声音的切换边界位置。然而,考虑到在切换边界位置附近执行淡出处理和淡入处理,期望切换边界位置是声音尽可能接近静音的位置或下述位置,在该位置处,即使音量根据上下文暂时降低,一系列词语或会话也是可理解的。
因此,在接下来描述的处理(下文中称为最佳切换位置标记设置处理)中,内容的供应方检测声音的尽可能接近静音的状态(即源数据的增益或能量较小的状态)并且在那里设置最佳切换位置标记。
图7是描述由内容的供应方执行的最佳切换位置标记设置处理的流程图。图8图示了最佳切换位置标记设置处理的状态。
在步骤S21中,将从先前级输入的第一源数据和第二源数据(具有同步再现定时的第一编码比特流和第二编码比特流的源)分成帧,并且在步骤S22中,测量每个划分帧中的能量。
在步骤S23中,针对每个帧来确定第一源数据和第二源数据的能量是否等于或小于预定阈值。如果第一源数据和第二源数据两者的能量都等于或小于预定阈值,则处理进行到步骤S24,并且帧的最佳切换位置标记被设置成指示该位置是最佳切换位置的“1”。
另一方面,如果第一源数据或第二源数据中的至少一者的能量大于预定阈值,则处理进行到步骤S25,并且帧的最佳切换位置标记被设置成指示该位置不是最佳的切换位置的“0”。
在步骤S26中,确定第一源数据和第二源数据的输入是否结束,并且如果第一源数据和第二源数据的输入正在继续,则处理返回到步骤S21以重复随后的处理。如果第一源数据和第二源数据的输入结束,则最佳切换位置标记设置处理结束。
接下来,图9是描述与针对最佳切换位置标记设置处理中的第一编码比特流和第二编码比特流的每个帧设置最佳切换位置标记的情况对应的解码装置30中的声音的切换边界位置确定处理的流程图。图10是图示切换边界位置确定处理的状态的图。
执行切换边界位置确定处理以替代参照图6所描述的声音切换处理的步骤S1和步骤S2。
在步骤S31中,解码装置30的选择单元33确定是否存在来自用户的声音切换指令并且等待直到存在声音切换指令为止。当选择单元33等待时,维持由选择单元33进行的选择性输出。因此,解码装置30以正常音量连续地输出基于第一编码比特流的PCM数据。
当存在来自用户的声音切换指令时,处理进行到步骤S32。在步骤S32中,选择单元33等待直到最佳切换位置标记变为1为止,最佳切换位置标记被添加到从先前级顺序输入的第一编码比特流和第二编码比特流(作为第一编码比特流和第二编码比特流的解码结果的量化数据)的每个帧。当选择单元33等待时,由选择单元33进行的选择性输出也被维持。当最佳切换位置标记变为1时,处理进行到步骤S33,并且选择单元33将声音的切换边界位置设置在具有最佳切换位置标记1的帧与下一帧之间。这完成了切换边界位置确定处理。
根据上述的最佳切换位置标记设置处理和切换边界位置确定处理,可以将声音尽可能接近静音的位置设置为切换边界位置。因此,可以减小由执行淡出处理和淡入处理所引起的影响。
此外,即使当不添加最佳切换位置标记时,解码装置30中的选择单元33等也可以参考与编码比特流的增益相关联的信息并且检测等于或小于指定阈值的音量的位置以确定切换边界位置。例如,诸如比例因子的信息可以用于与诸如AAC和MP3之类的编码系统中的增益相关联的信息。
<由解码装置30进行的编码比特流的第二切换方法>
接下来,图11图示了由解码装置30进行的编码比特流的第二切换方法的图。
如图11所图示的,当在帧#2与帧#3之间设置切换边界位置并且第一编码比特流将被切换到第二编码比特流时,将IMDCT处理应用于到紧接在第一编码比特流的切换边界位置之前的帧#2为止的数据。在这种情况下,尽管可以完全重构到与帧#1对应的PCM1-1为止的数据,但对与帧#2对应的PCM1-2的重构是不完全的。
同时,对于第二编码比特流,对从紧接在切换边界位置之后的帧#3起的数据应用IMDCT处理。在这种情况下,对与帧#3对应的PCM2-3的重构是不完全的,并且从与帧#4对应的PCM2-4起,数据被完全重构。
同时,当输出PCM数据时,以正常音量输出到与帧#1对应的完全重构的PCM1-1为止的数据。通过淡出处理逐渐减少与紧接在切换边界位置之前的帧#2对应的不完全PCM1-2的音量,并且执行静音处理以设置针对与紧接在切换边界位置之后的帧#3对应的不完全PCM2-3的静音部分。此外,通过淡入处理逐渐增大完全重构的PCM2-4的音量,并且从与帧#5对应的PCM2-5起以正常音量输出数据。
通过这种方式,紧接在改变边界位置之后输出不完全重构的PCM数据,并且不需要并行地执行两种解码处理。此外,淡出处理、静音处理和淡入处理连接不完全的PCM数据,并且这可以减小由于声音切换导致的帧的不连续性所引起的刺耳干扰噪声的音量。
<由解码装置30进行的编码比特流的第三切换方法>
接下来,图12图示了由解码装置30进行的编码比特流的第三切换方法的图。
如图12所图示的,当在帧#2与帧#3之间设置切换边界位置并且第一编码比特流要被切换到第二编码比特流时,对到紧接在第一编码比特流的切换边界位置之前的帧#2为止的数据应用IMDCT处理。在这种情况下,尽管可以完全重构到与帧#1对应的PCM1-1为止的数据,但对与帧#2对应的PCM1-2的重构是不完全的。
同时,对于第二编码比特流,对从紧接在切换边界位置之后的帧#3起的数据应用IMDCT处理。在这种情况下,对与帧#3对应的PCM2-3的重构是不完全的,并且从与帧#4对应的PCM2-4起,数据被完全重构。
同时,当输出PCM数据时,以正常音量输出与帧#1对应的PCM1-1之前的数据,并且通过淡出处理逐渐减小PCM1-1的音量。执行静音处理以设置针对与紧接在切换边界位置之前的帧#2对应的不完全PCM1-2的静音部分。此外,通过淡入处理逐渐增大与紧接在切换边界位置之后的帧#3对应的不完全PCM2-3的音量,并且从与帧#4对应的PCM2-4起以正常音量输出数据。
通过这种方式,紧接在改变边界位置之后输出不完全重构的PCM数据,并且不需要并行地执行两种解码处理。此外,淡出处理、静音处理和淡入处理连接不完全的PCM数据,并且这可以减小由于声音切换导致的帧的不连续性所引起的刺耳干扰噪声的音量。
<本公开内容的应用示例>
除了用于切换具有同步再现定时的第一编码比特流和第二编码比特流的应用以外,本公开内容还可以应用于例如在3D音频编码中切换对象。更具体地,当要将分组的对象数据全部切换到另一组(切换组)时,本公开内容可以被应用于一次全部切换多个对象,以切换再现场景或自由视点视频中的视点。
本公开内容还可以应用于将频道环境从2ch立体声声音切换到5.1ch环绕声等或根据自由视点视频中的相应座位的改变来切换基于环绕声的流。
附带地,由解码装置30进行的一系列处理可以通过硬件来执行或可以通过软件来执行。当这一系列处理通过软件来执行时,构成该软件的程序被安装在计算机上。此处,计算机的示例包括例如结合在专用硬件中的计算机以及可以通过安装各种程序来执行各种功能的通用个人计算机。
图13是图示使用程序执行一系列处理的计算机的硬件的配置示例的框图。
在计算机100中,CPU(中央处理单元)101、ROM(只读存储器)102和RAM(随机存取存储器)103通过总线104相互连接。
输入输出接口105还连接至总线104。输入单元106、输出单元107、存储单元108、通信单元109和驱动器110连接至输入输出接口105。
输入单元106包括键盘、鼠标、麦克风等。输出单元107包括显示器、扬声器等。存储单元108包括硬盘、非易失性存储器等。通信单元109包括网络接口等。驱动器110驱动诸如磁盘、光盘、磁光盘和半导体存储器的可移除介质111。
在以这种方式配置的计算机100中,例如,CPU 101通过输入输出接口105和总线104在RAM 103上加载存储在存储单元108中的程序并且执行程序以执行一系列处理。
注意,由计算机100执行的程序可以是用于按照本说明书中描述的时间顺序执行处理的程序,或者可以是用于并行地或在必要的定时处——例如,当程序被调用时——执行处理的程序。
本公开内容的实施方式不限于上述实施方式,并且可以在不脱离本公开内容的范围的情况下做出各种改变。
本公开内容也可以如下配置。
(1)
一种解码装置,包括:
获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;以及
所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,
所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
(2)
根据(1)所述的解码装置,还包括:
淡入淡出处理单元,其对所述边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
(3)
根据(2)所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用淡出处理并且对所述边界位置之后的帧的解码处理结果应用淡入处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
(4)
根据(2)所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用淡出处理并且对所述边界位置之后的帧的解码处理结果应用静音处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
(5)
根据(2)所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用静音处理并且对所述边界位置之后的帧的解码处理结果应用淡入处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
(6)
根据(1)至(5)中的任意一项所述的解码装置,其中,
所述选择单元基于被添加到每个帧并且在所述多个音频编码比特流的供给侧设置的最佳切换位置标记来确定所述边界位置。
(7)
根据(6)所述的解码装置,其中,
所述最佳切换位置标记在所述音频编码比特流的供给侧基于所述源数据的能量或上下文来设置。
(8)
根据(1)至(5)中的任意一项所述的解码装置,其中,
所述选择单元基于与所述多个音频编码比特流的增益相关联的信息来确定所述边界位置。
(9)
一种用于解码装置的解码方法,所述解码方法包括由所述解码装置进行的以下步骤:
获取步骤,用于获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
确定步骤,用于确定用于切换所述多个音频编码比特流的输出的边界位置;
选择步骤,用于根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理步骤;以及
所述解码处理步骤,用于对选择性地提供的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,
在所述解码处理步骤中,跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
(10)
一种程序,使计算机用作:
获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;以及
所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,
所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。附图标记列表
30解码装置、31解复用单元、32-1,32-2解码单元、33选择单元、34解码处理单元、35逆量化单元、36 IMDCT单元、37淡入淡出处理单元、100计算机、101 CPU
Claims (9)
1.一种解码装置,包括:
获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;
所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加;以及
淡入淡出处理单元,其对所述边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
2.根据权利要求1所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用淡出处理并且对所述边界位置之后的帧的解码处理结果应用淡入处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
3.根据权利要求1所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用淡出处理并且对所述边界位置之后的帧的解码处理结果应用静音处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
4.根据权利要求1所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用静音处理并且对所述边界位置之后的帧的解码处理结果应用淡入处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
5.根据权利要求1所述的解码装置,其中,
所述选择单元基于被添加到每个帧并且在所述多个音频编码比特流的供给侧设置的最佳切换位置标记来确定所述边界位置。
6.根据权利要求5所述的解码装置,其中,
所述最佳切换位置标记在所述音频编码比特流的供给侧基于所述源数据的能量或上下文来设置。
7.根据权利要求1所述的解码装置,其中,
所述选择单元基于与所述多个音频编码比特流的增益相关联的信息来确定所述边界位置。
8.一种用于解码装置的解码方法,所述解码方法包括由所述解码装置进行的以下步骤:
获取步骤,用于获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
确定步骤,用于确定用于切换所述多个音频编码比特流的输出的边界位置;
选择步骤,用于根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理步骤;
所述解码处理步骤,用于对选择性地提供的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,在所述解码处理步骤中,跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加;以及
淡入淡出处理步骤,用于对所述边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在所述边界位置之前和之后的帧中,在所述解码处理步骤中跳过了所述交叠相加。
9.一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被执行时,使得解码装置执行包括如下步骤的解码方法:
获取步骤,用于获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
确定步骤,用于确定用于切换所述多个音频编码比特流的输出的边界位置;
选择步骤,用于根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理步骤;
所述解码处理步骤,用于对选择性地提供的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,在所述解码处理步骤中,跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加;以及
淡入淡出处理步骤,用于对所述边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在所述边界位置之前和之后的帧中,在所述解码处理步骤中跳过了所述交叠相加。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015219415 | 2015-11-09 | ||
JP2015-219415 | 2015-11-09 | ||
PCT/JP2016/081699 WO2017082050A1 (ja) | 2015-11-09 | 2016-10-26 | デコード装置、デコード方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108352165A CN108352165A (zh) | 2018-07-31 |
CN108352165B true CN108352165B (zh) | 2023-02-03 |
Family
ID=58695167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680064042.9A Active CN108352165B (zh) | 2015-11-09 | 2016-10-26 | 解码装置、解码方法以及计算机可读存储介质 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10553230B2 (zh) |
EP (1) | EP3376500B1 (zh) |
JP (1) | JP6807033B2 (zh) |
KR (1) | KR20180081504A (zh) |
CN (1) | CN108352165B (zh) |
BR (1) | BR112018008874A8 (zh) |
RU (1) | RU2718418C2 (zh) |
WO (1) | WO2017082050A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10424311B2 (en) | 2017-01-30 | 2019-09-24 | Cirrus Logic, Inc. | Auto-mute audio processing |
CN110730408A (zh) * | 2019-11-11 | 2020-01-24 | 北京达佳互联信息技术有限公司 | 一种音频参数切换方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08287610A (ja) * | 1995-04-18 | 1996-11-01 | Sony Corp | オーディオデータの再生装置 |
US6151441A (en) * | 1993-12-18 | 2000-11-21 | Sony Corporation | System for storing and reproducing multiplexed data |
CN101026725A (zh) * | 2005-07-15 | 2007-08-29 | 索尼株式会社 | 再现设备、再现方法、记录设备和记录介质的生产方法 |
CN101189661A (zh) * | 2005-03-30 | 2008-05-28 | 弗劳恩霍夫应用研究促进协会 | 用于产生数据流和产生多通道表示的设备和方法 |
CN103548080A (zh) * | 2012-05-11 | 2014-01-29 | 松下电器产业株式会社 | 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3761639B2 (ja) | 1995-09-29 | 2006-03-29 | ユナイテッド・モジュール・コーポレーション | オーディオ復号装置 |
US5867819A (en) | 1995-09-29 | 1999-02-02 | Nippon Steel Corporation | Audio decoder |
DE19861167A1 (de) * | 1998-08-19 | 2000-06-15 | Christoph Buskies | Verfahren und Vorrichtung zur koartikulationsgerechten Konkatenation von Audiosegmenten sowie Vorrichtungen zur Bereitstellung koartikulationsgerecht konkatenierter Audiodaten |
GB9911737D0 (en) * | 1999-05-21 | 1999-07-21 | Philips Electronics Nv | Audio signal time scale modification |
US7792681B2 (en) * | 1999-12-17 | 2010-09-07 | Interval Licensing Llc | Time-scale modification of data-compressed audio information |
JP2002026738A (ja) * | 2000-07-11 | 2002-01-25 | Mitsubishi Electric Corp | オーディオデータ復号処理装置および方法、ならびにオーディオデータ復号処理プログラムを記録したコンピュータ読取可能な記録媒体 |
US7113538B1 (en) * | 2000-11-01 | 2006-09-26 | Nortel Networks Limited | Time diversity searcher and scheduling method |
US7069208B2 (en) * | 2001-01-24 | 2006-06-27 | Nokia, Corp. | System and method for concealment of data loss in digital audio transmission |
US7189913B2 (en) * | 2003-04-04 | 2007-03-13 | Apple Computer, Inc. | Method and apparatus for time compression and expansion of audio data with dynamic tempo change during playback |
US7260035B2 (en) * | 2003-06-20 | 2007-08-21 | Matsushita Electric Industrial Co., Ltd. | Recording/playback device |
US20050149973A1 (en) * | 2004-01-06 | 2005-07-07 | Fang Henry Y. | Television with application/stream-specifiable language selection |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
ATE537536T1 (de) * | 2004-10-26 | 2011-12-15 | Panasonic Corp | Sprachkodierungsvorrichtung und sprachkodierungsverfahren |
SG124307A1 (en) * | 2005-01-20 | 2006-08-30 | St Microelectronics Asia | Method and system for lost packet concealment in high quality audio streaming applications |
WO2006137425A1 (ja) * | 2005-06-23 | 2006-12-28 | Matsushita Electric Industrial Co., Ltd. | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
US8015000B2 (en) * | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US8010350B2 (en) * | 2006-08-03 | 2011-08-30 | Broadcom Corporation | Decimated bisectional pitch refinement |
DE102007028175A1 (de) * | 2007-06-20 | 2009-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Automatisiertes Verfahren zur zeitlichen Segmentierung eines Videos in Szenen unter Berücksichtigung verschiedener Typen von Übergängen zwischen Bildfolgen |
WO2009025142A1 (ja) * | 2007-08-22 | 2009-02-26 | Nec Corporation | 話者速度変換システムおよびその方法ならびに速度変換装置 |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
WO2010031049A1 (en) * | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
US8185384B2 (en) * | 2009-04-21 | 2012-05-22 | Cambridge Silicon Radio Limited | Signal pitch period estimation |
US9992456B2 (en) * | 2010-02-24 | 2018-06-05 | Thomson Licensing Dtv | Method and apparatus for hypothetical reference decoder conformance error detection |
TWI476761B (zh) * | 2011-04-08 | 2015-03-11 | Dolby Lab Licensing Corp | 用以產生可由實施不同解碼協定之解碼器所解碼的統一位元流之音頻編碼方法及系統 |
US20150309844A1 (en) * | 2012-03-06 | 2015-10-29 | Sirius Xm Radio Inc. | Systems and Methods for Audio Attribute Mapping |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
US9685164B2 (en) * | 2014-03-31 | 2017-06-20 | Qualcomm Incorporated | Systems and methods of switching coding technologies at a device |
US20160071524A1 (en) * | 2014-09-09 | 2016-03-10 | Nokia Corporation | Audio Modification for Multimedia Reversal |
US10614609B2 (en) * | 2017-07-19 | 2020-04-07 | Mediatek Inc. | Method and apparatus for reduction of artifacts at discontinuous boundaries in coded virtual-reality images |
-
2016
- 2016-10-26 CN CN201680064042.9A patent/CN108352165B/zh active Active
- 2016-10-26 BR BR112018008874A patent/BR112018008874A8/pt active Search and Examination
- 2016-10-26 JP JP2017550052A patent/JP6807033B2/ja active Active
- 2016-10-26 EP EP16864014.2A patent/EP3376500B1/en active Active
- 2016-10-26 RU RU2018115550A patent/RU2718418C2/ru active
- 2016-10-26 US US15/772,310 patent/US10553230B2/en active Active
- 2016-10-26 KR KR1020187011895A patent/KR20180081504A/ko not_active Application Discontinuation
- 2016-10-26 WO PCT/JP2016/081699 patent/WO2017082050A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6151441A (en) * | 1993-12-18 | 2000-11-21 | Sony Corporation | System for storing and reproducing multiplexed data |
JPH08287610A (ja) * | 1995-04-18 | 1996-11-01 | Sony Corp | オーディオデータの再生装置 |
CN101189661A (zh) * | 2005-03-30 | 2008-05-28 | 弗劳恩霍夫应用研究促进协会 | 用于产生数据流和产生多通道表示的设备和方法 |
CN101026725A (zh) * | 2005-07-15 | 2007-08-29 | 索尼株式会社 | 再现设备、再现方法、记录设备和记录介质的生产方法 |
CN103548080A (zh) * | 2012-05-11 | 2014-01-29 | 松下电器产业株式会社 | 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3376500A4 (en) | 2018-09-19 |
EP3376500B1 (en) | 2019-08-21 |
US20180286419A1 (en) | 2018-10-04 |
KR20180081504A (ko) | 2018-07-16 |
RU2018115550A3 (zh) | 2020-01-31 |
CN108352165A (zh) | 2018-07-31 |
RU2018115550A (ru) | 2019-10-28 |
RU2718418C2 (ru) | 2020-04-02 |
WO2017082050A1 (ja) | 2017-05-18 |
BR112018008874A8 (pt) | 2019-02-26 |
US10553230B2 (en) | 2020-02-04 |
JPWO2017082050A1 (ja) | 2018-08-30 |
BR112018008874A2 (pt) | 2018-11-06 |
JP6807033B2 (ja) | 2021-01-06 |
EP3376500A1 (en) | 2018-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240055007A1 (en) | Encoding device and encoding method, decoding device and decoding method, and program | |
US9875746B2 (en) | Encoding device and method, decoding device and method, and program | |
JP6510541B2 (ja) | 環境高次アンビソニックス係数の遷移 | |
US9875745B2 (en) | Normalization of ambient higher order ambisonic audio data | |
CA2933734C (en) | Coding independent frames of ambient higher-order ambisonic coefficients | |
JP6356832B2 (ja) | 高次アンビソニックス信号の圧縮 | |
JP6445460B2 (ja) | 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 | |
KR102140388B1 (ko) | 복호 장치, 복호 방법, 및 기록 매체 | |
CA2918256C (en) | Noise filling in multichannel audio coding | |
JP2017532603A (ja) | オーディオ信号のエンコードおよびデコード | |
CN108352165B (zh) | 解码装置、解码方法以及计算机可读存储介质 | |
KR20230153402A (ko) | 다운믹스 신호들의 적응형 이득 제어를 갖는 오디오 코덱 | |
GB2614482A (en) | Seamless scalable decoding of channels, objects, and hoa audio content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TG01 | Patent term adjustment | ||
TG01 | Patent term adjustment |