[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN108352165B - 解码装置、解码方法以及计算机可读存储介质 - Google Patents

解码装置、解码方法以及计算机可读存储介质 Download PDF

Info

Publication number
CN108352165B
CN108352165B CN201680064042.9A CN201680064042A CN108352165B CN 108352165 B CN108352165 B CN 108352165B CN 201680064042 A CN201680064042 A CN 201680064042A CN 108352165 B CN108352165 B CN 108352165B
Authority
CN
China
Prior art keywords
decoding
fade
boundary position
audio
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680064042.9A
Other languages
English (en)
Other versions
CN108352165A (zh
Inventor
畠中光行
知念彻
辻实
本间弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN108352165A publication Critical patent/CN108352165A/zh
Application granted granted Critical
Publication of CN108352165B publication Critical patent/CN108352165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及一种解码装置、解码方法和程序,其被配置成使得能够尽可能快地交替解码和输出回放定时被同步的多个音频编码比特流。作为本发明的一方面的解码装置设置有:获取单元,用于获取多个音频编码比特流;选择单元,用于确定用于切换对多个音频编码比特流的输出的边界位置并且根据该边界位置将所获取的多个音频编码比特流中的一者选择性地提供给解码处理单元;以及解码处理单元,用于对经由选择单元输入的所述一个比特流执行包括IMDCT处理的解码处理,该解码处理单元消除与边界位置之前和之后的帧中的每一者对应的IMDCT处理的交叠相加。本发明可以应用于例如接收装置、回放装置等。

Description

解码装置、解码方法以及计算机可读存储介质
技术领域
本公开涉及解码装置、解码方法和程序,并且具体涉及适用于在再现定时被同步的音频编码比特流之间切换输出的解码装置、解码方法和程序。
背景技术
例如,在用于电影、新闻、体育直播等的内容的一些视频中准备多种语言(例如日语和英语)的声音,并且在这种情况下,多个声音的再现定时被同步。
在下文中,假设具有同步再现定时的声音各自被准备为音频编码比特流,并且执行至少包括MDCT(修正离散余弦变换)处理的诸如AAC(高级音频编码)的编码处理以对音频编码比特流应用可变长度编码。注意,在数字地面电视广播中采用包括MDCT处理的MPEG-2AAC声音编码系统(例如参见非专利文献1)。
图1简单地示出了对声音的源数据应用编码处理的编码装置和对从编码装置输出的音频编码比特流应用解码处理的解码装置的常规配置的示例。
编码装置10包括MDCT单元11、量化单元12和可变长度编码单元13。
MDCT单元11将从先前级输入的声音的源数据划分成具有预定时间宽度的帧并且执行MDCT处理,以使得前一帧和下一帧彼此交叠。通过这种方式,MDCT单元11将具有时域值的源数据转换成频域值并且将该值输出至量化单元12。量化单元12量化来自MDCT单元11的输入并且将该值输出至可变长度编码单元13。可变长度编码单元13对量化的值应用可变长度编码以生成并且输出音频编码比特流。
解码装置20安装在例如接收广播的或分发的内容的接收装置上或在再现记录在记录介质中的内容的再现装置上,并且解码装置20包括解码单元21、逆量化单元22和IMDCT(逆MDCT)单元23。
与可变长度编码单元13对应的解码单元21基于帧对音频编码比特流应用解码处理并且将解码结果输出至逆量化单元22。与量化单元12对应的逆量化单元22对解码结果应用逆量化并且将处理结果输出至IMDCT单元23。与MDCT单元11对应的IMDCT单元23对逆量化结果应用IMDCT处理,以重构与编码之前的源数据对应的PCM数据。将详细描述由IMDCT单元23进行的IMDCT处理。
图2示出了由IMDCT单元23进行的IMDCT处理。
如图2所示,IMDCT单元23对前一帧和后一帧两者(帧#1和帧#2)的音频编码比特流(音频编码比特流的逆量化结果)BS1-1和BS1-2应用IMDCT处理以获得IMDCT-OUT#1-1作为反向转换结果。IMDCT单元23还将IMDCT处理应用于与上述音频编码比特流交叠的两个帧(帧#2和帧#3)的音频编码比特流(音频编码比特流的逆量化结果)BS1-2和BS1-3,以获得IMDCT-OUT#1-2作为反向转换结果。IMDCT单元23还对IMDCT-OUT#1-1和IMDCT-OUT#1-2应用交叠相加,以完全重构作为与帧#2对应的PCM数据的PCM1-2。
与帧#3和稍后的帧对应的PCM数据1-3也通过类似的方法被完全重构。
然而,此处所使用的术语“完全”表示PCM数据被重构——包括直到交叠相加的处理——并且该术语不表示源数据被100%再现。
引用列表
非专利文献
非专利文献1:ARIB STD-B32,2.2版本,2015年7月29日
发明内容
技术问题
此处,考虑尽可能快地切换具有同步的再现定时的多个音频编码比特流,从而解码并且输出多个音频编码比特流。
图3示出了将第一音频编码比特流切换到再现定时被同步的第二音频编码比特流的常规方法。
如图3所示,当在帧#2与帧#3之间设置切换边界位置并且第一音频编码比特流将被切换到第二音频编码比特流时,针对第一音频编码比特流解码并且输出直到与帧#2对应的PCM1-2为止的数据。针对切换之后的第二音频编码比特流,解码并且输出从与帧#3对应的PCM2-3起的数据。
附带地,如参照图2所描述的那样,反向转换结果IMDCT-OUT#1-1和IMDCT-OUT#1-2对于获得PCM1-2是必要的。类似地,反向转换结果IMDCT-OUT#2-2和IMDCT-OUT#2-3对于获得PCM2-3是必要的。因此,为了执行图3所示的切换,需要在帧#2与帧#3之间的时段期间同时并行地对第一音频编码比特流和第二音频编码比特流应用包括IMDCT处理的解码处理。
然而,为了同时并行地执行包括IMDCT处理的解码处理,需要具有相似配置的多个硬件,以通过硬件实现包括IMDCT处理的解码处理,并且这增大了电路规模并且增加了成本。
此外,为了实现包括通过软件进行的IMDCT处理的解码处理,根据CPU的吞吐量可能出现诸如声音中断和声音异常等问题。因此,需要高性能的CPU来防止这些问题,但这也增加了成本。
鉴于这种情况做出了本公开内容,并且本公开内容被设计成尽可能快地切换具有同步再现定时的多个音频编码比特流,从而在不增大电路规模或增加成本的情况下解码并且输出多个音频编码比特流。
[问题的解决方案]
本公开内容的一方面提供了一种解码装置,该解码装置包括:获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;以及所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
根据本公开内容的该方面的解码装置还可以包括:淡入淡出处理单元,其对边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在边界位置之前和之后的帧中,由解码处理单元跳过了交叠相加。
淡入淡出处理单元可以对边界位置之前的帧的解码处理结果应用淡出处理并且对边界位置之后的帧的解码处理结果应用淡入处理,在边界位置之前和之后的帧中,由解码处理单元跳过了交叠相加。
淡入淡出处理单元可以对边界位置之前的帧的解码处理结果应用淡出处理并且对边界位置之后的帧的解码处理结果应用静音处理,在边界位置之前和之后的帧中,由解码处理单元跳过了交叠相加。
淡入淡出处理单元可以对边界位置之前的帧的解码处理结果应用静音处理并且对边界位置之后的帧的解码处理结果应用淡入处理,在边界位置之前和之后的帧中,由解码处理单元跳过了交叠相加。
选择单元可以基于被添加到每个帧并且在多个音频编码比特流的供应侧设置的最佳切换位置标记来确定边界位置。
可以由音频编码比特流的供应侧基于源数据的能量或上下文来设置最佳切换位置标记。
选择单元可以基于与多个音频编码比特流的增益相关联的信息来确定边界位置。
本公开内容的一方面提供了一种由解码装置执行的解码方法,该解码方法包括:获取步骤,用于获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;确定步骤,用于确定用于切换所述多个音频编码比特流的输出的边界位置;选择步骤,用于根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理步骤;以及所述解码处理步骤,用于对选择性地提供的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,在所述解码处理步骤中,跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
本公开内容的一方面提供了一种使计算机用作如下的程序:获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;以及所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
根据本公开内容的该方面,获取了多个音频编码比特流,并且确定了用于切换多个音频编码比特流的输出的边界位置。对根据边界位置选择性地提供的多个音频编码比特流中的一者应用包括与MDCT处理对应的IMDCT处理的解码处理。在解码处理中,跳过与边界位置之前和之后的每个帧对应的IMDCT处理中的交叠相加。
本发明的有益效果
根据本公开内容的一方面,可以尽可能快地切换具有同步再现定时的多个音频编码比特流,从而解码并且输出多个音频编码比特流。
附图说明
图1是图示编码装置和解码装置的配置的示例的框图。
图2是描述IMDCT处理的图。
图3是图示音频编码比特流的切换的图。
图4是图示根据本公开内容的解码装置的配置示例的框图。
图5是图示由图4的解码装置进行的音频编码比特流的第一切换方法的图。
图6是描述声音切换处理的流程图。
图7是描述最佳切换位置标记设置处理的流程图。
图8是图示最佳切换位置标记设置处理的状态的图。
图9是描述切换边界位置确定处理的流程图。
图10是图示切换边界位置确定处理的状态的图。
图11是图示由图4的解码装置进行的音频编码比特流的第二切换方法的图。
图12是图示由图4的解码装置进行的音频编码比特流的第三切换方法的图。
图13是图示通用计算机的配置示例的框图。
具体实施方式
在下文中,将参照附图详细描述用于执行本公开内容的最佳模式(下文中称为实施方式)。
<作为本公开内容的实施方式的解码装置的配置示例>
图4图示了作为本公开内容的实施方式的解码装置的配置示例。
解码装置30安装在例如接收广播的或分发的内容的接收装置上或在再现记录在记录介质中的内容的再现装置上。此外,解码装置30可以快速地切换具有同步再现定时的第一音频编码比特流和第二音频编码比特流,以解码和输出比特流。
假设执行至少包括MDCT处理的编码处理以将可变长度编码应用于第一音频编码比特流和第二音频编码比特流中的声音的源数据。在下文中,第一音频编码比特流和第二音频编码比特流也将被简单地称为第一编码比特流和第二编码比特流。
解码装置30包括解复用单元31、解码单元32-1和32-2、选择单元33、解码处理单元34和淡入淡出处理单元37。
解复用单元11从先前级输入的复用流中分离具有同步再现定时的第一编码比特流和第二编码流。解复用单元11还将第一编码比特流输出至解码单元32-1并且将第二编码流输出至解码单元32-2。
解码单元32-1对第一编码比特流应用解码处理以解码第一编码比特流的可变长度码并且将处理结果(在下文中称为量化数据)输出至选择单元33。解码单元32-2对第二编码比特流应用解码处理以解码第二编码比特流的可变长度码并且将处理结果的量化数据输出至选择单元33。
选择单元33基于来自用户的声音切换指令来确定切换边界位置,并且根据所确定的切换边界位置将来自解码单元32-1或解码单元32-2的量化数据输出至解码处理单元34。
选择单元33还可以基于添加到第一编码比特流和第二编码比特流的每个帧的最佳切换位置标记来确定切换边界位置。这将在稍后参照图7至图10进行描述。
解码处理单元34包括逆量化单元35和IMDCT单元36。逆量化单元35对通过选择单元33输入的量化数据应用逆量化并且将逆量化结果(在下文中称为MDCT数据)输出至IMDCT单元36。IMDCT单元36对MDCT数据应用IMDCT处理以重构与编码之前的源数据对应的PCM数据。
然而,IMDCT单元36不完全重构与所有相应帧对应的PCM数据,并且IMDCT单元36还针对切换边界位置附近的帧输出在不完全状态下重构的PCM数据。
淡入淡出处理单元37对从解码处理单元34输入的切换边界位置附近的PCM数据应用淡出处理、淡入处理或静音处理,并且将PCM数据输出至稍后的级。
注意,尽管在图4所示的配置示例中所示的情况下具有复用的第一编码比特流和第二编码比特流的复用流被输入至解码装置30,但可以在复用流中复用更多的编码比特流。在这种情况下,解码单元32的数目可以根据复用的编码比特流的数目而增大。
此外,可以将多个编码比特流分别输入至解码装置30,而不是输入复用流。在这种情况下,可以省略解复用单元31。
<解码装置30的编码比特流的第一切换方法>
接下来,图5图示了由解码装置30进行的编码比特流的第一切换方法。
如图5所示,当在帧#2与帧#3之间设置切换边界位置并且第一编码比特流将被切换到第二编码比特流时,对到紧接在第一编码比特流的切换边界位置之前的帧#2为止的数据应用IMDCT处理。在这种情况下,尽管可以完全重构到与帧#1对应的PCM1-1为止的数据,但与帧#2对应的PCM1-2的重构是不完全的。
同时,对于第二编码比特流,对从紧接在切换边界位置之后的帧#3起的数据应用IMDCT处理。在这种情况下,与帧#3对应的PCM2-3的重构是不完全的,并且从与帧#4对应的PCM2-4起,数据被完全重构。
此处,“不完全重构”表示IMDCT-OUT的前半部分或后半部分在不执行交叠相加的情况下被用作PCM数据。
在这种情况下,MDCT-OUT#1-1的后半部分可以用于与第一编码比特流的帧#2对应的PCM1-2。类似地,MDCT-OUT#2-3的前半部分可以用于与第二编码比特流的帧#3对应的PCM2-3。注意,明显地,不完全重构的PCM1-2和PCM2-3的音质低于完全重构的PCM1-2和PCM2-3的音质。
当输出PCM数据时,到与帧#1对应的完全重构的PCM1-1为止的数据以正常音量输出。与紧接在切换边界位置之前的帧#2对应的不完全PCM1-2的音量通过淡出处理逐渐减小,并且与紧接在切换边界位置之后的帧#3对应的不完全PCM2-3的音量通过淡入处理逐渐增大。从帧#4起,完全重构的PCM2-4以正常音量输出。
通过这样的方式,紧在改变边界位置之后输出不完全重构的PCM数据,并且不需要并行地执行两种解码处理。此外,淡出处理和淡入处理连接不完全的PCM数据,并且这可以减少由于声音切换导致的帧的不连续所引起的刺耳干扰噪声的音量。
注意,由解码装置30进行的编码比特流的切换方法不限于第一切换方法,而是也可以采用后述的第二切换方法或第三切换方法。
<由解码装置30进行的声音切换处理>
接下来,图6是描述与图5中图示的第一切换方法对应的声音切换处理的流程图。
假设在声音切换处理之前,在解码装置30中,解复用单元11已经从复用流中分离出第一编码比特流和第二编码比特流,并且解码单元32-1或解码单元31-2分别解码了第一编码比特流和第二编码比特流。还假设选择单元33已经选择来自解码单元32-1和31-2中的一者的量化数据并且将量化数据输入至解码处理单元34。
在下面描述的情况下,选择单元33选择来自解码单元32-1的量化数据并且将量化数据输入至解码处理单元34。因此,解码装置30当前正在以正常音量输出基于第一编码比特流的PCM数据。
在步骤S1中,选择单元33确定是否存在来自用户的声音切换指令并且等待直到存在声音切换指令。当选择单元33等待时,维持由选择单元33进行的选择性输出。因此,解码装置30以正常音量连续输出基于第一编码比特流的PCM数据。
当存在来自用户的声音切换指令时,处理进行到步骤S2。在步骤S2中,选择单元33确定声音的切换边界位置。例如,选择单元33确定从接收到声音切换指令起的预定数量的帧之后的位置处的声音的切换边界位置。然而,选择单元33可以基于包括在编码比特流中的最佳切换位置标记(稍后详细描述)来确定切换边界位置。
在这种情况下,如图5所图示的那样,假设在帧#2与帧#3之间设置切换边界位置。
随后,在步骤S3中,选择单元33保持当前选择,直到选择单元33将与紧接在确定的切换边界位置之前的帧对应的量化数据输出至解码处理单元34为止。因此,选择单元33将来自解码单元32-1的量化数据输出至稍后的级。
在步骤S4中,解码处理单元34的逆量化单元35基于第一编码比特流执行对量化数据的逆量化,并且将作为逆量化的结果获得的MDCT数据输出至IMDCT单元36。IMDCT单元36对到与紧接在切换边界位置之前的帧对应的MDCT数据为止的数据应用IMDCT处理,从而重构与编码之前的源数据对应的PCM数据并且将PCM数据输出至淡入淡出处理单元37。
在这种情况下,尽管可以完全重构到与帧#1对应的PCM1-1为止的数据,但对与帧#2对应的PCM1-2的重构是不完全的。
在步骤S5中,淡入淡出处理单元37对从解码处理单元34输入的与紧接在切换边界位置之前的帧对应的不完全PCM数据(在这种情况下与帧#2对应的PCM1-2)应用淡出处理34,并且将PCM数据输出至稍后的级。
接下来,在步骤S6中,选择单元33切换针对解码处理单元34的输出。因此,选择单元33将来自解码单元32-2的量化数据输出至稍后的级。
在步骤S7中,解码处理单元34的逆量化单元35基于第二编码比特流执行对量化数据的逆量化,并且将作为逆量化的结果获得的MDCT数据输出至IMDCT单元36。IMDCT单元36对从与紧接在切换边界位置之后的帧对应的MDCT数据起的数据应用IMDCT处理,从而重构与编码之前的源数据对应的PCM数据并且将PCM数据输出至淡入淡出处理单元37。
在这种情况下,对与帧#3对应的PCM2-3的重构是不完全的,并且从与帧#4对应的PCM2-4起完全重构数据。
在步骤S8中,淡入淡出处理单元37对从解码处理单元34输入的与紧接在切换边界位置之后的帧对应的不完全PCM数据(在这种情况下与帧#3对应的PCM2-3)应用淡入处理并且将PCM数据输出至稍后的级。然后,该处理返回到步骤S1,并且重复随后的处理。
这完成了由解码装置30进行的声音切换处理的描述。根据声音切换处理,可以在不并行地执行两种解码处理的情况下切换声音的编码比特流。声音切换处理还可以使由于声音切换导致的帧的不连续性引起的刺耳干扰噪音的音量减小。
<最佳切换位置标记设置处理>
在声音切换处理中,在从接收到来自用户的声音切换指令起的预定数目的帧之后的位置处确定声音的切换边界位置。然而,考虑到在切换边界位置附近执行淡出处理和淡入处理,期望切换边界位置是声音尽可能接近静音的位置或下述位置,在该位置处,即使音量根据上下文暂时降低,一系列词语或会话也是可理解的。
因此,在接下来描述的处理(下文中称为最佳切换位置标记设置处理)中,内容的供应方检测声音的尽可能接近静音的状态(即源数据的增益或能量较小的状态)并且在那里设置最佳切换位置标记。
图7是描述由内容的供应方执行的最佳切换位置标记设置处理的流程图。图8图示了最佳切换位置标记设置处理的状态。
在步骤S21中,将从先前级输入的第一源数据和第二源数据(具有同步再现定时的第一编码比特流和第二编码比特流的源)分成帧,并且在步骤S22中,测量每个划分帧中的能量。
在步骤S23中,针对每个帧来确定第一源数据和第二源数据的能量是否等于或小于预定阈值。如果第一源数据和第二源数据两者的能量都等于或小于预定阈值,则处理进行到步骤S24,并且帧的最佳切换位置标记被设置成指示该位置是最佳切换位置的“1”。
另一方面,如果第一源数据或第二源数据中的至少一者的能量大于预定阈值,则处理进行到步骤S25,并且帧的最佳切换位置标记被设置成指示该位置不是最佳的切换位置的“0”。
在步骤S26中,确定第一源数据和第二源数据的输入是否结束,并且如果第一源数据和第二源数据的输入正在继续,则处理返回到步骤S21以重复随后的处理。如果第一源数据和第二源数据的输入结束,则最佳切换位置标记设置处理结束。
接下来,图9是描述与针对最佳切换位置标记设置处理中的第一编码比特流和第二编码比特流的每个帧设置最佳切换位置标记的情况对应的解码装置30中的声音的切换边界位置确定处理的流程图。图10是图示切换边界位置确定处理的状态的图。
执行切换边界位置确定处理以替代参照图6所描述的声音切换处理的步骤S1和步骤S2。
在步骤S31中,解码装置30的选择单元33确定是否存在来自用户的声音切换指令并且等待直到存在声音切换指令为止。当选择单元33等待时,维持由选择单元33进行的选择性输出。因此,解码装置30以正常音量连续地输出基于第一编码比特流的PCM数据。
当存在来自用户的声音切换指令时,处理进行到步骤S32。在步骤S32中,选择单元33等待直到最佳切换位置标记变为1为止,最佳切换位置标记被添加到从先前级顺序输入的第一编码比特流和第二编码比特流(作为第一编码比特流和第二编码比特流的解码结果的量化数据)的每个帧。当选择单元33等待时,由选择单元33进行的选择性输出也被维持。当最佳切换位置标记变为1时,处理进行到步骤S33,并且选择单元33将声音的切换边界位置设置在具有最佳切换位置标记1的帧与下一帧之间。这完成了切换边界位置确定处理。
根据上述的最佳切换位置标记设置处理和切换边界位置确定处理,可以将声音尽可能接近静音的位置设置为切换边界位置。因此,可以减小由执行淡出处理和淡入处理所引起的影响。
此外,即使当不添加最佳切换位置标记时,解码装置30中的选择单元33等也可以参考与编码比特流的增益相关联的信息并且检测等于或小于指定阈值的音量的位置以确定切换边界位置。例如,诸如比例因子的信息可以用于与诸如AAC和MP3之类的编码系统中的增益相关联的信息。
<由解码装置30进行的编码比特流的第二切换方法>
接下来,图11图示了由解码装置30进行的编码比特流的第二切换方法的图。
如图11所图示的,当在帧#2与帧#3之间设置切换边界位置并且第一编码比特流将被切换到第二编码比特流时,将IMDCT处理应用于到紧接在第一编码比特流的切换边界位置之前的帧#2为止的数据。在这种情况下,尽管可以完全重构到与帧#1对应的PCM1-1为止的数据,但对与帧#2对应的PCM1-2的重构是不完全的。
同时,对于第二编码比特流,对从紧接在切换边界位置之后的帧#3起的数据应用IMDCT处理。在这种情况下,对与帧#3对应的PCM2-3的重构是不完全的,并且从与帧#4对应的PCM2-4起,数据被完全重构。
同时,当输出PCM数据时,以正常音量输出到与帧#1对应的完全重构的PCM1-1为止的数据。通过淡出处理逐渐减少与紧接在切换边界位置之前的帧#2对应的不完全PCM1-2的音量,并且执行静音处理以设置针对与紧接在切换边界位置之后的帧#3对应的不完全PCM2-3的静音部分。此外,通过淡入处理逐渐增大完全重构的PCM2-4的音量,并且从与帧#5对应的PCM2-5起以正常音量输出数据。
通过这种方式,紧接在改变边界位置之后输出不完全重构的PCM数据,并且不需要并行地执行两种解码处理。此外,淡出处理、静音处理和淡入处理连接不完全的PCM数据,并且这可以减小由于声音切换导致的帧的不连续性所引起的刺耳干扰噪声的音量。
<由解码装置30进行的编码比特流的第三切换方法>
接下来,图12图示了由解码装置30进行的编码比特流的第三切换方法的图。
如图12所图示的,当在帧#2与帧#3之间设置切换边界位置并且第一编码比特流要被切换到第二编码比特流时,对到紧接在第一编码比特流的切换边界位置之前的帧#2为止的数据应用IMDCT处理。在这种情况下,尽管可以完全重构到与帧#1对应的PCM1-1为止的数据,但对与帧#2对应的PCM1-2的重构是不完全的。
同时,对于第二编码比特流,对从紧接在切换边界位置之后的帧#3起的数据应用IMDCT处理。在这种情况下,对与帧#3对应的PCM2-3的重构是不完全的,并且从与帧#4对应的PCM2-4起,数据被完全重构。
同时,当输出PCM数据时,以正常音量输出与帧#1对应的PCM1-1之前的数据,并且通过淡出处理逐渐减小PCM1-1的音量。执行静音处理以设置针对与紧接在切换边界位置之前的帧#2对应的不完全PCM1-2的静音部分。此外,通过淡入处理逐渐增大与紧接在切换边界位置之后的帧#3对应的不完全PCM2-3的音量,并且从与帧#4对应的PCM2-4起以正常音量输出数据。
通过这种方式,紧接在改变边界位置之后输出不完全重构的PCM数据,并且不需要并行地执行两种解码处理。此外,淡出处理、静音处理和淡入处理连接不完全的PCM数据,并且这可以减小由于声音切换导致的帧的不连续性所引起的刺耳干扰噪声的音量。
<本公开内容的应用示例>
除了用于切换具有同步再现定时的第一编码比特流和第二编码比特流的应用以外,本公开内容还可以应用于例如在3D音频编码中切换对象。更具体地,当要将分组的对象数据全部切换到另一组(切换组)时,本公开内容可以被应用于一次全部切换多个对象,以切换再现场景或自由视点视频中的视点。
本公开内容还可以应用于将频道环境从2ch立体声声音切换到5.1ch环绕声等或根据自由视点视频中的相应座位的改变来切换基于环绕声的流。
附带地,由解码装置30进行的一系列处理可以通过硬件来执行或可以通过软件来执行。当这一系列处理通过软件来执行时,构成该软件的程序被安装在计算机上。此处,计算机的示例包括例如结合在专用硬件中的计算机以及可以通过安装各种程序来执行各种功能的通用个人计算机。
图13是图示使用程序执行一系列处理的计算机的硬件的配置示例的框图。
在计算机100中,CPU(中央处理单元)101、ROM(只读存储器)102和RAM(随机存取存储器)103通过总线104相互连接。
输入输出接口105还连接至总线104。输入单元106、输出单元107、存储单元108、通信单元109和驱动器110连接至输入输出接口105。
输入单元106包括键盘、鼠标、麦克风等。输出单元107包括显示器、扬声器等。存储单元108包括硬盘、非易失性存储器等。通信单元109包括网络接口等。驱动器110驱动诸如磁盘、光盘、磁光盘和半导体存储器的可移除介质111。
在以这种方式配置的计算机100中,例如,CPU 101通过输入输出接口105和总线104在RAM 103上加载存储在存储单元108中的程序并且执行程序以执行一系列处理。
注意,由计算机100执行的程序可以是用于按照本说明书中描述的时间顺序执行处理的程序,或者可以是用于并行地或在必要的定时处——例如,当程序被调用时——执行处理的程序。
本公开内容的实施方式不限于上述实施方式,并且可以在不脱离本公开内容的范围的情况下做出各种改变。
本公开内容也可以如下配置。
(1)
一种解码装置,包括:
获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;以及
所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,
所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
(2)
根据(1)所述的解码装置,还包括:
淡入淡出处理单元,其对所述边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
(3)
根据(2)所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用淡出处理并且对所述边界位置之后的帧的解码处理结果应用淡入处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
(4)
根据(2)所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用淡出处理并且对所述边界位置之后的帧的解码处理结果应用静音处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
(5)
根据(2)所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用静音处理并且对所述边界位置之后的帧的解码处理结果应用淡入处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
(6)
根据(1)至(5)中的任意一项所述的解码装置,其中,
所述选择单元基于被添加到每个帧并且在所述多个音频编码比特流的供给侧设置的最佳切换位置标记来确定所述边界位置。
(7)
根据(6)所述的解码装置,其中,
所述最佳切换位置标记在所述音频编码比特流的供给侧基于所述源数据的能量或上下文来设置。
(8)
根据(1)至(5)中的任意一项所述的解码装置,其中,
所述选择单元基于与所述多个音频编码比特流的增益相关联的信息来确定所述边界位置。
(9)
一种用于解码装置的解码方法,所述解码方法包括由所述解码装置进行的以下步骤:
获取步骤,用于获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
确定步骤,用于确定用于切换所述多个音频编码比特流的输出的边界位置;
选择步骤,用于根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理步骤;以及
所述解码处理步骤,用于对选择性地提供的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,
在所述解码处理步骤中,跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。
(10)
一种程序,使计算机用作:
获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;以及
所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,
所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加。附图标记列表
30解码装置、31解复用单元、32-1,32-2解码单元、33选择单元、34解码处理单元、35逆量化单元、36 IMDCT单元、37淡入淡出处理单元、100计算机、101 CPU

Claims (9)

1.一种解码装置,包括:
获取单元,其获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
选择单元,其确定用于切换所述多个音频编码比特流的输出的边界位置,并且根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理单元;
所述解码处理单元,其对通过所述选择单元输入的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,所述解码处理单元跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加;以及
淡入淡出处理单元,其对所述边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
2.根据权利要求1所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用淡出处理并且对所述边界位置之后的帧的解码处理结果应用淡入处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
3.根据权利要求1所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用淡出处理并且对所述边界位置之后的帧的解码处理结果应用静音处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
4.根据权利要求1所述的解码装置,其中,
所述淡入淡出处理单元对所述边界位置之前的帧的解码处理结果应用静音处理并且对所述边界位置之后的帧的解码处理结果应用淡入处理,在所述边界位置之前和之后的帧中,由所述解码处理单元跳过了所述交叠相加。
5.根据权利要求1所述的解码装置,其中,
所述选择单元基于被添加到每个帧并且在所述多个音频编码比特流的供给侧设置的最佳切换位置标记来确定所述边界位置。
6.根据权利要求5所述的解码装置,其中,
所述最佳切换位置标记在所述音频编码比特流的供给侧基于所述源数据的能量或上下文来设置。
7.根据权利要求1所述的解码装置,其中,
所述选择单元基于与所述多个音频编码比特流的增益相关联的信息来确定所述边界位置。
8.一种用于解码装置的解码方法,所述解码方法包括由所述解码装置进行的以下步骤:
获取步骤,用于获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
确定步骤,用于确定用于切换所述多个音频编码比特流的输出的边界位置;
选择步骤,用于根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理步骤;
所述解码处理步骤,用于对选择性地提供的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,在所述解码处理步骤中,跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加;以及
淡入淡出处理步骤,用于对所述边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在所述边界位置之前和之后的帧中,在所述解码处理步骤中跳过了所述交叠相加。
9.一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被执行时,使得解码装置执行包括如下步骤的解码方法:
获取步骤,用于获取多个音频编码比特流,所述多个音频编码比特流通过具有同步再现定时的多个源数据分别以帧单位进行MDCT处理之后被编码而得到;
确定步骤,用于确定用于切换所述多个音频编码比特流的输出的边界位置;
选择步骤,用于根据所述边界位置将所获取的所述多个音频编码比特流中的一个选择性地提供给解码处理步骤;
所述解码处理步骤,用于对选择性地提供的所述多个音频编码比特流中的一个应用包括与所述MDCT处理对应的IMDCT处理的解码处理,其中,在所述解码处理步骤中,跳过与所述边界位置之前和之后的每个帧对应的所述IMDCT处理中的交叠相加;以及
淡入淡出处理步骤,用于对所述边界位置之前和之后的帧的解码处理结果应用淡入淡出处理,在所述边界位置之前和之后的帧中,在所述解码处理步骤中跳过了所述交叠相加。
CN201680064042.9A 2015-11-09 2016-10-26 解码装置、解码方法以及计算机可读存储介质 Active CN108352165B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015219415 2015-11-09
JP2015-219415 2015-11-09
PCT/JP2016/081699 WO2017082050A1 (ja) 2015-11-09 2016-10-26 デコード装置、デコード方法、およびプログラム

Publications (2)

Publication Number Publication Date
CN108352165A CN108352165A (zh) 2018-07-31
CN108352165B true CN108352165B (zh) 2023-02-03

Family

ID=58695167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680064042.9A Active CN108352165B (zh) 2015-11-09 2016-10-26 解码装置、解码方法以及计算机可读存储介质

Country Status (8)

Country Link
US (1) US10553230B2 (zh)
EP (1) EP3376500B1 (zh)
JP (1) JP6807033B2 (zh)
KR (1) KR20180081504A (zh)
CN (1) CN108352165B (zh)
BR (1) BR112018008874A8 (zh)
RU (1) RU2718418C2 (zh)
WO (1) WO2017082050A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10424311B2 (en) 2017-01-30 2019-09-24 Cirrus Logic, Inc. Auto-mute audio processing
CN110730408A (zh) * 2019-11-11 2020-01-24 北京达佳互联信息技术有限公司 一种音频参数切换方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08287610A (ja) * 1995-04-18 1996-11-01 Sony Corp オーディオデータの再生装置
US6151441A (en) * 1993-12-18 2000-11-21 Sony Corporation System for storing and reproducing multiplexed data
CN101026725A (zh) * 2005-07-15 2007-08-29 索尼株式会社 再现设备、再现方法、记录设备和记录介质的生产方法
CN101189661A (zh) * 2005-03-30 2008-05-28 弗劳恩霍夫应用研究促进协会 用于产生数据流和产生多通道表示的设备和方法
CN103548080A (zh) * 2012-05-11 2014-01-29 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3761639B2 (ja) 1995-09-29 2006-03-29 ユナイテッド・モジュール・コーポレーション オーディオ復号装置
US5867819A (en) 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
DE19861167A1 (de) * 1998-08-19 2000-06-15 Christoph Buskies Verfahren und Vorrichtung zur koartikulationsgerechten Konkatenation von Audiosegmenten sowie Vorrichtungen zur Bereitstellung koartikulationsgerecht konkatenierter Audiodaten
GB9911737D0 (en) * 1999-05-21 1999-07-21 Philips Electronics Nv Audio signal time scale modification
US7792681B2 (en) * 1999-12-17 2010-09-07 Interval Licensing Llc Time-scale modification of data-compressed audio information
JP2002026738A (ja) * 2000-07-11 2002-01-25 Mitsubishi Electric Corp オーディオデータ復号処理装置および方法、ならびにオーディオデータ復号処理プログラムを記録したコンピュータ読取可能な記録媒体
US7113538B1 (en) * 2000-11-01 2006-09-26 Nortel Networks Limited Time diversity searcher and scheduling method
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7189913B2 (en) * 2003-04-04 2007-03-13 Apple Computer, Inc. Method and apparatus for time compression and expansion of audio data with dynamic tempo change during playback
US7260035B2 (en) * 2003-06-20 2007-08-21 Matsushita Electric Industrial Co., Ltd. Recording/playback device
US20050149973A1 (en) * 2004-01-06 2005-07-07 Fang Henry Y. Television with application/stream-specifiable language selection
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
ATE537536T1 (de) * 2004-10-26 2011-12-15 Panasonic Corp Sprachkodierungsvorrichtung und sprachkodierungsverfahren
SG124307A1 (en) * 2005-01-20 2006-08-30 St Microelectronics Asia Method and system for lost packet concealment in high quality audio streaming applications
WO2006137425A1 (ja) * 2005-06-23 2006-12-28 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8010350B2 (en) * 2006-08-03 2011-08-30 Broadcom Corporation Decimated bisectional pitch refinement
DE102007028175A1 (de) * 2007-06-20 2009-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Automatisiertes Verfahren zur zeitlichen Segmentierung eines Videos in Szenen unter Berücksichtigung verschiedener Typen von Übergängen zwischen Bildfolgen
WO2009025142A1 (ja) * 2007-08-22 2009-02-26 Nec Corporation 話者速度変換システムおよびその方法ならびに速度変換装置
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
US8185384B2 (en) * 2009-04-21 2012-05-22 Cambridge Silicon Radio Limited Signal pitch period estimation
US9992456B2 (en) * 2010-02-24 2018-06-05 Thomson Licensing Dtv Method and apparatus for hypothetical reference decoder conformance error detection
TWI476761B (zh) * 2011-04-08 2015-03-11 Dolby Lab Licensing Corp 用以產生可由實施不同解碼協定之解碼器所解碼的統一位元流之音頻編碼方法及系統
US20150309844A1 (en) * 2012-03-06 2015-10-29 Sirius Xm Radio Inc. Systems and Methods for Audio Attribute Mapping
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
US20160071524A1 (en) * 2014-09-09 2016-03-10 Nokia Corporation Audio Modification for Multimedia Reversal
US10614609B2 (en) * 2017-07-19 2020-04-07 Mediatek Inc. Method and apparatus for reduction of artifacts at discontinuous boundaries in coded virtual-reality images

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151441A (en) * 1993-12-18 2000-11-21 Sony Corporation System for storing and reproducing multiplexed data
JPH08287610A (ja) * 1995-04-18 1996-11-01 Sony Corp オーディオデータの再生装置
CN101189661A (zh) * 2005-03-30 2008-05-28 弗劳恩霍夫应用研究促进协会 用于产生数据流和产生多通道表示的设备和方法
CN101026725A (zh) * 2005-07-15 2007-08-29 索尼株式会社 再现设备、再现方法、记录设备和记录介质的生产方法
CN103548080A (zh) * 2012-05-11 2014-01-29 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法

Also Published As

Publication number Publication date
EP3376500A4 (en) 2018-09-19
EP3376500B1 (en) 2019-08-21
US20180286419A1 (en) 2018-10-04
KR20180081504A (ko) 2018-07-16
RU2018115550A3 (zh) 2020-01-31
CN108352165A (zh) 2018-07-31
RU2018115550A (ru) 2019-10-28
RU2718418C2 (ru) 2020-04-02
WO2017082050A1 (ja) 2017-05-18
BR112018008874A8 (pt) 2019-02-26
US10553230B2 (en) 2020-02-04
JPWO2017082050A1 (ja) 2018-08-30
BR112018008874A2 (pt) 2018-11-06
JP6807033B2 (ja) 2021-01-06
EP3376500A1 (en) 2018-09-19

Similar Documents

Publication Publication Date Title
US20240055007A1 (en) Encoding device and encoding method, decoding device and decoding method, and program
US9875746B2 (en) Encoding device and method, decoding device and method, and program
JP6510541B2 (ja) 環境高次アンビソニックス係数の遷移
US9875745B2 (en) Normalization of ambient higher order ambisonic audio data
CA2933734C (en) Coding independent frames of ambient higher-order ambisonic coefficients
JP6356832B2 (ja) 高次アンビソニックス信号の圧縮
JP6445460B2 (ja) 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置
KR102140388B1 (ko) 복호 장치, 복호 방법, 및 기록 매체
CA2918256C (en) Noise filling in multichannel audio coding
JP2017532603A (ja) オーディオ信号のエンコードおよびデコード
CN108352165B (zh) 解码装置、解码方法以及计算机可读存储介质
KR20230153402A (ko) 다운믹스 신호들의 적응형 이득 제어를 갖는 오디오 코덱
GB2614482A (en) Seamless scalable decoding of channels, objects, and hoa audio content

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TG01 Patent term adjustment
TG01 Patent term adjustment