CN108899039A - 解码在填充元素中具有增强频谱带复制元数据的音频位流 - Google Patents
解码在填充元素中具有增强频谱带复制元数据的音频位流 Download PDFInfo
- Publication number
- CN108899039A CN108899039A CN201811199390.4A CN201811199390A CN108899039A CN 108899039 A CN108899039 A CN 108899039A CN 201811199390 A CN201811199390 A CN 201811199390A CN 108899039 A CN108899039 A CN 108899039A
- Authority
- CN
- China
- Prior art keywords
- audio
- frequency spectrum
- esbr
- metadata
- bit stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 73
- 230000002708 enhancing effect Effects 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 48
- 230000017105 transposition Effects 0.000 claims description 29
- 230000003595 spectral effect Effects 0.000 claims description 24
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 54
- 230000008569 process Effects 0.000 description 33
- 230000010076 replication Effects 0.000 description 14
- 238000012805 post-processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000004044 response Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 8
- 230000001052 transient effect Effects 0.000 description 7
- 238000007493 shaping process Methods 0.000 description 6
- 241000208340 Araliaceae Species 0.000 description 5
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 5
- 235000003140 Panax quinquefolius Nutrition 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 235000008434 ginseng Nutrition 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
公开了解码在填充元素中具有增强频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。
Description
本申请是申请号为201680015378.6,申请日为2016年3月10日,题为“解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流”的中国发明专利申请的分案申请。
相关申请的交叉引用
本申请要求于2015年3月13日提交的欧洲专利申请No.15159067.6以及于2015年3月16日提交的美国临时申请No.62/133,800的优先权,这两个申请中的每个通过引用被整体结合于此。
技术领域
本发明涉及音频信号处理。一些实施例涉及包括用于控制增强的频谱带复制(eSBR)的元数据的音频位流(例如,具有MPEG-4AAC格式的位流)的编码和解码。其它实施例涉及通过不被配置为执行eSBR处理并且忽略这种元数据的传统解码器对这种位流进行解码,或者通过响应于位流生成eSBR控制数据来对不包括这种元数据的音频位流进行解码。
背景技术
典型的音频位流包括指示音频内容的一个或多个声道(channel)的音频数据(例如,编码的音频数据)以及指示音频数据或音频内容的至少一个特性的元数据两者。用于生成编码音频位流的一种众所周知的格式是在MPEG标准ISO/IEC 14496-3:2009中描述的MPEG-4高级音频编码(AAC)格式。在MPEG-4标准中,AAC表示“高级音频编码”,而HE-AAC表示“高效高级音频编码”。
MPEG-4AAC标准定义了几个音频规范(profile),这几个音频规范确定在适用的(complaint)编码器或解码器中存在哪些对象和编码工具。这些音频规范中的三个是(1)AAC规范,(2)HE-AAC规范,和(3)HE-AAC v2规范。AAC规范包括AAC低复杂度(或“AAC-LC”)对象类型。AAC-LC对象是MPEG-2AAC低复杂度规范的对应物,有一些调整,并且既不包括频谱带复制(“SBR”)对象类型也不包括参数化立体声(“PS”)对象类型。HE-AAC规范是AAC规范的超集(superset)并且还包括SBR对象类型。HE-AAC v2规范是HE-AAC规范的超集,并且还包括PS对象类型。
SBR对象类型包含频谱带复制工具,这是重要的编码工具,该编码工具显著提高感知音频编解码器的压缩效率。SBR在接收器侧(例如,在解码器中)重建音频信号的高频分量。因此,编码器只需要编码和发送低频分量,从而允许在低数据速率下的、高得多的音频质量。根据从编码器获得的控制数据和可用的带宽受限信号,SBR基于先前被截短以便减小数据速率的谐波序列的复制。音调与类噪声(noise-like)分量之间的比通过自适应逆滤波以及噪声和正弦波的可选添加来维持。在MPEG-4AAC标准中,SBR工具执行频谱修补,其中将数个邻接的正交镜像滤波器(QMF)子带从音频信号的所发送低频带部分复制到在解码器中生成的音频信号的高频带部分。
对于某些音频类型,诸如具有相对低交叉频率的音乐内容,频谱修补可能不是理想的。因此,需要改进频谱带复制的技术。
发明内容
第一类实施例涉及包括存储器、位流有效载荷去格式化器和解码子系统的音频处理单元。存储器被配置为存储编码音频位流(例如,MPEG-4AAC位流)的至少一个块。位流有效载荷去格式化器被配置为对编码音频块进行解复用。解码子系统被配置为对编码音频块的音频内容进行解码。编码音频块包括具有指示填充元素的开始的标识符以及标识符之后的填充数据的填充元素。填充数据包括识别是否要对编码音频块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。
第二类实施例涉及用于对编码音频位流进行解码的方法。该方法包括接收编码音频位流的至少一个块、对编码音频位流的至少一个块的至少一些部分进行解复用,以及对编码音频位流的至少一个块的至少一些部分进行解码。编码音频位流的至少一个块包括具有指示填充元素的开始的标识符以及标识符之后的填充数据的填充元素。填充数据包括识别是否要对编码音频位流的至少一个音频块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。
其它类的实施例涉及编码和转码包含元数据的音频位流,该元数据识别是否要执行增强的频谱带复制(eSBR)处理。
附图说明
图1是可以被配置为执行本发明性方法的实施例的系统的实施例的框图。
图2是作为本发明性音频处理单元的实施例的编码器的框图。
图3是包括作为本发明性音频处理单元的实施例的解码器以及可选地还有耦合到其的后处理器的系统的框图。
图4是作为本发明性音频处理单元的实施例的解码器的框图。
图5是作为本发明性音频处理单元的另一实施例的解码器的框图。
图6是本发明性音频处理单元的另一实施例的框图。
图7是MPEG-4AAC位流的块的图,包括它被划分成的段。
符号和命名
贯穿本公开,包括在权利要求中,“对”信号或数据执行操作(例如,对信号或数据进行滤波、缩放、变换或应用增益)的表达在广义上用来表示直接对信号或数据、或者对信号或数据的处理版本(例如,对于在执行操作之前已经经历了初步滤波或预处理的信号的版本)执行操作。
贯穿本公开,包括在权利要求中,表达“音频处理单元”在广义上用来表示被配置为处理音频数据的系统、设备或装置。音频处理单元的示例包括但不限于编码器(例如,转码器)、解码器、编解码器、预处理系统、后处理系统和位流处理系统(有时称为位流处理工具)。几乎所有的消费者电子器件(诸如手机、电视机、笔记本电脑和平板电脑)包含音频处理单元。
贯穿本公开,包括在权利要求中,术语“耦合”或“耦合的”在广义上用来意指或者直接或者间接连接。因此,如果第一设备耦合到第二设备,则那个连接可以通过直接连接,或者通过经由其它设备和连接的间接连接。而且,集成到其它部件中或与其它部件集成的部件也彼此耦合。
具体实施方式
MPEG-4AAC标准设想编码的MPEG-4AAC位流包括指示要由解码器应用以解码位流的音频内容的每种类型的SBR处理(如果任何一个要被应用的话)、和/或控制这种SBR处理、和/或指示要被采用以对位流的音频内容进行解码的至少一个SBR工具的至少一个特性或参数的元数据。在本文,我们使用表达“SBR元数据”来表示在MPEG-4AAC标准中描述或提及的这种类型的元数据。
MPEG-4AAC位流的顶层是数据块(“raw_data_block”元素)的序列,数据块中的每个是包含音频数据(通常是针对1024或960个采样的时间段)和相关信息和/或其它数据的数据段(本文称为“块”)。在本文中,我们使用术语“块”来表示包括音频数据(以及对应的元数据以及可选地还有其它相关数据)的MPEG-4AAC位流的段,该块确定或指示一个(但不多于一个)“raw_data_block“元素。
MPEG-4AAC位流的每个块可以包括数个句法元素(句法元素中的每个也在位流中作为数据段实现)。在MPEG-4AAC标准中定义了七个类型的这种句法元素。每个句法元素由数据元素“id_syn_ele”的不同值识别。句法元素的示例包括“single_channel_element()”、“channel_pair_element()”和“fill_element()”。单个声道元素是包括单个音频声道的音频数据(单声道音频信号)的容器。声道对元素包括两个音频声道的音频数据(即,立体声音频信号)。
填充元素是包括标识符(例如,上述元素“id_syn_ele”的值)后面跟着数据(其被称为“填充数据”)的信息的容器。填充元素历来被用于调整要通过恒定速率信道发送的位流的瞬时位速率。通过向每个块添加适量的填充数据,可以实现恒定的数据速率。
根据本发明的实施例,填充数据可以包括扩展能够在位流中发送的数据(例如,元数据)的类型的一个或多个扩展有效载荷。接收具有包含新类型数据的填充数据的位流的解码器可以可选地被接收位流的设备(例如,解码器)使用以扩展设备的功能。因此,如本领域技术人员可以认识到的,填充元素是特殊类型的数据结构,并且不同于通常用来发送音频数据的数据结构(例如,包含声道数据的音频有效载荷)。
在本发明的一些实施例中,用来识别填充元素的标识符可以由具有值0x6的、三位(three bit)的首先发送最高有效位的无符号整数(“uimsbf”)组成。在一个块中,可以出现相同类型的句法元素(例如,几个填充元素)的几个实例。
用于编码音频位流的另一标准是MPEG统一语音和音频编码(USAC)标准(ISO/IEC23003-3:2012)。MPEG USAC标准描述使用频谱带复制处理(包括MPEG-4AAC标准中描述的SBR处理,还包括其它增强形式的频谱带复制处理)的音频内容的编码和解码。这种处理应用在MPEG-4AAC标准中描述的SBR工具集的扩展和增强版本的频谱带复制工具(本文有时称为“增强型SBR工具”或“eSBR工具”)。因此,eSBR(如在USAC标准中定义的)是对SBR(如在MPEG-4AAC标准中定义的)的改进。
在本文中,我们使用表达“增强型SBR处理”(或“eSBR处理”)来表示使用在MPEG-4AAC标准中没有描述或提及的至少一个eSBR工具(例如,在MPEG USAC标准中描述或提及的至少一个eSBR工具)的频谱带复制处理。这种eSBR工具的示例是谐波转置(transposition)、QMF修补附加预处理或“预平坦化(pre-flattening)”,以及子带间采样时间包络整形或“inter-TES”。
根据MPEG USAC标准生成的位流(有时在本文中称为“USAC位流”)包括编码的音频内容,并且通常包括:指示要由解码器应用来解码USAC位流的音频内容的每种类型的频谱带复制处理的元数据、和/或控制这种频谱带复制处理和/或指示要被采用来解码USAC位流的音频内容的至少一个SBR工具和/或eSBR工具的至少一个特性或参数的元数据。
在本文中,我们使用表达“增强型SBR元数据”(或“eSBR元数据”)表示指示要由解码器应用以对编码音频位流(例如,USAC位流)的音频内容进行解码的每种类型的频谱带复制处理和/或控制这种频谱带复制处理和/或指示要被采用以解码这种音频内容的至少一个SBR工具和/或eSBR工具的至少一个特性或参数、但未在MPEG-4AAC标准中描述或提及的元数据。eSBR元数据的示例是在MPEG USAC标准中描述或提及但不在MPEG-4AAC标准中的元数据(指示或用于控制频谱带复制处理)。因此,本文的eSBR元数据表示不是SBR元数据的元数据,本文的SBR元数据表示不是eSBR元数据的元数据。
USAC位流可以包括SBR元数据和eSBR元数据两者。更具体而言,USAC位流可以包括控制解码器的eSBR处理的执行的eSBR元数据、以及控制解码器的SBR处理的执行的SBR元数据。根据本发明的典型实施例,(根据本发明)在MPEG-4AAC位流中(例如,在SBR有效载荷末尾处的sbr_extension()容器中)包括eSBR元数据(例如,特定于eSBR的配置数据)。
在使用eSBR工具集(包括至少一个eSBR工具)对编码位流进行解码期间,解码器的eSBR处理的执行基于在编码期间被截短的谐波序列的复制而重新生成音频信号的高频带。这种eSBR处理通常调整所生成的高频带的频谱包络并应用逆滤波,并且添加噪声和正弦分量,以便重新创建原始音频信号的频谱特性。
根据本发明的典型实施例,在编码音频位流(例如,MPEG-4AAC位流)的元数据段中的一个或多个中包括eSBR元数据(例如,包括作为eSBR元数据的少量控制位),该编码音频位流还在其它段(音频数据段)中包括编码音频数据。通常,位流的每个块的至少一个这种元数据段是(或者包括)填充元素(包括指示填充元素的开始的标识符),并且eSBR元数据被包括在标识符之后的填充元素中。
图1是示例性音频处理链(音频数据处理系统)的框图,其中可以根据本发明的实施例配置系统的元件中的一个或多个。该系统包括如图所示耦合在一起的以下元件:编码器1、输送子系统2、解码器3和后处理单元4。在对所示系统的变型中,元件中的一个或多个被省略,或者附加的音频数据处理单元被包括。
在一些实现中,编码器1(其可选地包括预处理单元)被配置为接受包括音频内容的PCM(时域)采样作为输入,并且输出指示音频内容的编码音频位流(具有符合MPEG-4AAC标准的格式)。指示音频内容的位流的数据有时在本文中被称为“音频数据”或“编码音频数据”。如果编码器是根据本发明的典型实施例来配置的,则从编码器输出的音频位流包括eSBR元数据(并且通常还有其它元数据)以及音频数据。
从编码器1输出的一个或多个编码音频位流可以被断言(assert)到编码音频输送子系统2。子系统2被配置为存储和/或输送从编码器1输出的每个编码位流。从编码器1输出的编码音频位流可以由子系统2存储(例如,以DVD或蓝光盘的形式),或由子系统2发送(子系统2可以实现传输链路或网络),或者可以由子系统2既存储又发送。
解码器3被配置为解码它经由子系统2接收的编码MPEG-4AAC音频位流(由编码器1生成)。在一些实施例中,解码器3被配置为从位流的每个块提取eSBR元数据,并且解码位流(包括通过使用提取的eSBR元数据执行eSBR处理),以生成解码的音频数据(例如,解码的PCM音频采样的流)。在一些实施例中,解码器3被配置为从位流中提取SBR元数据(但是忽略位流中包括的eSBR元数据)并且解码位流(包括通过使用提取的SBR元数据执行SBR处理)以生成解码的音频数据(例如,解码的PCM音频采样的流)。通常,解码器3包括存储(例如,以非暂态方式)从子系统2接收的编码音频位流的段的缓冲器。
图1的后处理单元4被配置为接受来自解码器3的解码的音频数据的流(例如,解码的PCM音频采样),并对其执行后处理。后处理单元4还可以被配置为渲染后处理音频内容(或者从解码器3接收的解码的音频)以用于由一个或多个扬声器重放。
图2是作为本发明性音频处理单元的实施例的编码器(100)的框图。编码器100的任何部件或元件可以在硬件、软件或硬件和软件的组合中被实现为一个或多个过程和/或一个或多个电路(例如,ASIC、FPGA或其它集成电路)。编码器100包括如图所示进行连接的编码器105、填充器(stuffer)/格式化器级107、元数据生成器106和缓冲存储器109。通常,编码器100还包括其它处理元件(未示出)。编码器100被配置为将输入音频位流转换成编码的输出MPEG-4AAC位流。
元数据生成器106被耦合并被配置为生成(和/或向级107传递)元数据(包括eSBR元数据和SBR元数据)以便由级107包括在编码位流中以从编码器100输出。
编码器105被耦合并被配置为对输入的音频数据进行编码(例如,通过对其执行压缩),并且将所得的编码音频断言到级107以用于包括在编码位流中以从级107输出。
级107被配置为将来自编码器105的编码音频和来自生成器106的元数据(包括eSBR元数据和SBR元数据)进行复用(multiplex)以生成要从级107输出的编码位流,优选地使得编码位流具有由本发明的实施例中的一个指定的格式。
缓冲存储器109被配置为存储(例如,以非暂态方式)从级107输出的编码音频位流的至少一个块,然后编码音频位流的块序列从缓冲存储器109被断言为从编码器100输出到输送系统。
图3是包括作为本发明性音频处理单元的实施例的解码器(200)并且可选地还包括耦合到其的后处理器(300)的系统的框图。解码器200和后处理器300的部件或元件的任何一个可以在硬件、软件或硬件和软件的组合中被实现为一个或多个过程和/或一个或多个电路(例如,ASIC、FPGA或其它集成电路)。解码器200包括如图所示连接的缓冲存储器201、位流有效载荷去格式化器(解析器)205、音频解码子系统202(有时称为“核心”解码级或“核心”解码子系统)、eSBR处理级203以及控制位生成器204。通常,解码器200还包括其它处理元件(未示出)。
缓冲存储器(缓冲器)201存储(例如,以非暂态方式)由解码器200接收的编码的MPEG-4AAC音频位流的至少一个块。在解码器200的操作中,位流的块序列从缓冲器201被断言到去格式化器205。
在图3实施例的变型(或者将要描述的图4实施例)中,不是解码器的APU(例如,图6的APU 500)包括缓冲存储器(例如,与缓冲器201相同的缓冲存储器),其存储(例如,以非暂态方式)由图3或图4的缓冲器201接收的(即,包括eSBR元数据的编码音频位流)相同类型的编码音频位流(例如,MPEG-4AAC音频位流)的至少一个块。
再次参考图3,去格式化器205被耦合并且被配置为对位流的每个块进行解复用以从中提取SBR元数据(包括量化的包络数据)和eSBR元数据(并且通常还有其它元数据),以将至少eSBR元数据和SBR元数据断言到eSBR处理级203,并且通常还将其它提取出的元数据断言到解码子系统202(并且可选地还断言到控制位生成器204)。去格式化器205还被耦合并被配置为从位流的每个块提取音频数据,并将提取出的音频数据断言到解码子系统(解码级)202。
图3的系统可选地还包括后处理器300。后处理器300包括缓冲存储器(缓冲器)301以及包含耦合到缓冲器301的至少一个处理元件的其它处理元件(未示出)。缓冲器301存储(例如,以非暂态方式)由后处理器300从解码器200接收的解码的音频数据的至少一个块(或帧)。后处理器300的处理元件被耦合并且被配置为接收从缓冲器301输出的解码音频的块(或帧)序列,并使用从解码子系统202(和/或去格式化器205)输出的元数据和/或从解码器200的级204输出的控制位来自适应地处理从缓冲器301输出的解码音频的块(或帧)序列。
解码器200的音频解码子系统202被配置为对由解析器205提取出的音频数据进行解码(这种解码可以被称为“核心”解码操作)以生成解码的音频数据,并将解码的音频数据断言到eSBR处理级203。解码在频域中执行,并且通常包括反量化,后面跟着频谱处理。通常,子系统202中的最终处理级将频域-时域变换应用到解码的频域音频数据,使得子系统的输出是时域解码的音频数据。级203被配置为将由(被解析器205提取的)eSBR元数据和SBR元数据所指示的eSBR工具和SBR工具应用到解码的音频数据(即,使用SBR和eSBR元数据对解码子系统202的输出执行SBR和eSBR处理),以生成从解码器200输出(例如,到后处理器300)的完全解码的音频数据。通常,解码器200包括存储从去格式化器205输出的去格式化的音频数据和元数据的存储器(可由子系统202和级203访问),并且级203被配置为在SBR和eSBR处理期间根据需要访问音频数据和元数据(包括SBR元数据和eSBR元数据)。级203中的SBR处理和eSBR处理可以被认为是对核心解码子系统202的输出的后处理。可选地,解码器200还包括最终上混子系统(其可以使用由去格式化器205提取的PS元数据和/或在子系统204中生成的控制位来应用在MPEG-4AAC标准中定义的参数化立体声(“PS”)工具),该最终上混子系统被耦合并配置为对级203的输出执行上混,以生成从解码器200输出的完全解码的上混音频。可替代地,后处理器300被配置为对解码器200的输出执行上混(例如,使用由去格式化器205提取的PS元数据和/或在子系统204中生成的控制位)。
响应于由去格式化器205提取的元数据,控制位生成器204可以生成控制数据,并且控制数据可以在解码器200内(例如,在最终上混子系统中)使用和/或作为解码器200的输出被断言(例如,到后处理器300以用于后处理)。响应于从输入位流提取的元数据(并且可选地还响应于控制数据),级204可以生成(并且向后处理器300断言)控制位,该控制位指示从eSBR处理级203输出的解码的音频数据应当经历特定类型的后处理。在一些实现中,解码器200被配置为将由去格式化器205提取的元数据从输入位流断言到后处理器300,并且后处理器300被配置为使用元数据对从解码器200输出的解码的音频数据执行后处理。
图4是作为本发明性音频处理单元的另一实施例的音频处理单元(“APU”)(210)的框图。APU 210是未被配置为执行eSBR处理的传统解码器。APU 210的部件或元件中的任何一个可以在硬件、软件或硬件和软件的组合中被实现为一个或多个过程和/或一个或多个电路(例如,ASIC、FPGA或其它集成电路)。APU 210包括如图所示连接的缓冲存储器201、位流有效载荷去格式化器(解析器)215、音频解码子系统202(有时被称为“核心”解码级或“核心”解码子系统)和SBR处理级213。通常,APU 210还包括其它处理元件(未示出)。
APU 210的元件201和202与解码器200(图3)的相同编号的元件相同,并且将不重复上面对它们的描述。在APU 210的操作中,从缓冲器201向去格式化器215断言由APU 210接收的编码音频位流(MPEG-4AAC位流)的块序列。
根据本发明的任何实施例,去格式化器215被耦合并配置为对位流的每个块进行解复用,以从其提取SBR元数据(包括量化的包络数据)以及通常还有其它元数据,但是忽略可以被包括在位流中的eSBR元数据。去格式化器215被配置为将至少SBR元数据断言到SBR处理级213。去格式化器215还被耦合并配置为从位流的每个块中提取音频数据,并且将提取出的音频数据断言到解码子系统(解码级)202。
解码器200的音频解码子系统202被配置为对由去格式化器215提取的音频数据进行解码(这种解码可以被称为“核心”解码操作)以生成解码的音频数据,并将解码的音频数据断言到SBR处理级213。解码在频域中执行。通常,子系统202中的最终处理级将频域-时域变换应用到解码的频域音频数据,使得子系统的输出是时域解码的音频数据。级213被配置为将由(被去格式化器215提取的)SBR元数据指示的SBR工具(但不是eSBR工具)应用到解码的音频数据(即,使用SBR元数据对解码子系统202的输出执行SBR处理)以生成从APU 210输出的完全解码的音频数据(例如,输出到后处理器300)。通常,APU 210包括存储从去格式化器215输出的去格式化的音频数据和元数据的存储器(可由子系统202和级213访问),并且级213被配置为在SBR处理期间根据需要访问音频数据和元数据(包括SBR元数据)。级213中的SBR处理可以被认为是对核心解码子系统202的输出的后处理。可选地,APU 210还包括最终上混子系统(其可以使用由去格式化器215提取的PS元数据应用在MPEG-4AAC标准中定义的参数化立体声(“PS”)工具),该最终上混子系统被耦合并配置为对级213的输出执行上混以生成从APU 210输出的完全解码的上混音频。可替代地,后处理器被配置为对APU 210的输出执行上混(例如,使用由去格式化器215提取的PS元数据和/或在APU 210中生成的控制位)。
编码器100、解码器200和APU 210的各种实现被配置为执行本发明性方法的不同实施例。
根据一些实施例,在编码音频位流(例如,MPEG-4AAC位流)中包括eSBR元数据(例如,包括作为eSBR元数据的少量控制位),使得传统解码器(其不被配置为解析eSBR元数据,或使用与eSBR元数据相关的任何eSBR工具)可以忽略eSBR元数据,但是却在可能的范围内解码位流而不使用eSBR元数据或与eSBR元数据相关的任何eSBR工具,通常没有解码音频质量上的任何显著的损失。但是,被配置为解析位流以识别eSBR元数据并且响应于eSBR元数据而使用至少一个eSBR工具的eSBR解码器将享有使用至少一个这种eSBR工具的益处。因此,本发明的实施例提供了一种用于以向后兼容的方式高效地发送增强的频谱带复制(eSBR)控制数据或元数据的手段(means)。
通常,位流中的eSBR元数据指示以下eSBR工具中的一个或多个(例如,指示以下eSBR工具中的一个或多个的至少一个特性或参数)(这些eSBR工具在MPEG USAC标准中被描述,并且可以或可以不在位流的生成期间被编码器应用):
·谐波转置;
·QMF修补附加预处理(预平坦化);以及
·子带间采样时间包络整形或“inter-TES”。
例如,被包括在位流中的eSBR元数据可以指示(在MPEG USAC标准和本公开中描述的)参数的值:harmonSBR[ch]、sbrPatchingMode[ch]、sbrOversamplingFlag[ch]、sbrPitchInBins[ch]、sbrPitchInBins[ch]、bs_interTes、bs_temp_shape[ch][env]、bs_inter_temp_shape_mode[ch][env]和bs_sbr_preprocessing。
在本文中,表示法X[ch](其中X是某个参数)表示该参数与要被解码的编码位流的音频内容的声道(“ch”)有关。为了简单起见,我们有时省略表达[ch],并且假设相关参数与音频内容的声道有关。
在本文中,表示法X[ch][env](其中X是某个参数)表示该参数与要被解码的编码位流的音频内容的声道(“ch”)的SBR包络(“env”)有关。为了简单起见,我们有时省略表达[env]和[ch],并且假设相关参数与音频内容的声道的SBR包络有关。
如所指出的,MPEG USAC标准设想USAC位流包括控制解码器的eSBR处理的执行的eSBR元数据。eSBR元数据包括以下一位(one-bit)元数据参数:harmonicSBR;bs_interTES;和bs_pvc。
参数“harmonicSBR”指示对于SBR的谐波修补(谐波转置)的使用。具体而言,harmonicSBR=0指示如在MPEG-4AAC标准的4.6.18.6.3节中所描述的非谐波频谱修补;并且harmonicSBR=1指示(如在MPEG USAC标准的7.5.3或7.5.4节中所描述的、在eSBR中使用的类型的)谐波SBR修补。根据非eSBR频谱带复制(即,不是eSBR的SBR),不使用谐波SBR修补。贯穿本公开,频谱修补被称为基本形式的频谱带复制,而谐波转置被称为增强形式的频谱带复制。
参数“bs_interTES”的值指示eSBR的inger-TES工具的使用。
参数“bs_pvc”的值指示eSBR的PVC工具的使用。
在对编码位流进行解码期间,(对于由位流指示的音频内容的每个声道“ch”)在解码的eSBR处理级期间谐波转置的执行由以下eSBR元数据参数控制:sbrPatchingMode[ch];sbrOversamplingFlag[ch];sbrPitchInBinsFlag[ch];和sbrPitchInBins[ch]。
值“sbrPatchingMode[ch]”指示在eSBR中使用的转置器类型:sbrPatchingMode[ch]=1指示非谐波修补,如MPEG-4AAC标准的4.6.18.6.3节中所描述的;sbrPatchingMode[ch]=0指示谐波SBR修补,如MPEG USAC标准的7.5.3或7.5.4节中所描述的。
值“sbrOversamplingFlag[ch]”指示在eSBR中的信号自适应频域过采样与基于DFT的谐波SBR修补组合使用,如MPEG USAC标准的7.5.3节中所描述的。这个标志控制在转置器中利用的DFT的大小:1指示如MPEG USAC标准的7.5.3.1节中所描述的信号自适应频域过采样启用;0指示如MPEG USAC标准的7.5.3.1节中所描述的信号自适应频域过采样禁用。
值“sbrPitchInBinsFlag[ch]”控制sbrPitchInBins[ch]参数的解释:1指示sbrPitchInBins[ch]中的值有效并且大于零;0指示sbrPitchInBins[ch]的值被设置为零。
值“sbrPitchInBins[ch]”控制SBR谐波转置器中叉积项的添加。值sbrPitchinBins[ch]是[0,127]范围内的整数值,并且表示对作用于核心编码器的采样频率的1536线DFT(1536-line DFT)在频率区间(frequency bin)中测量的距离。
在MPEG-4AAC位流指示其声道未被耦合的SBR声道对(而不是单个SBR声道)的情况下,位流指示上述句法的两个实例(用于谐波或非谐波转置),sbr_channel_pair_element()的每个声道一个实例。
eSBR工具的谐波转置通常改善在相对低的交叉频率处的解码的音乐信号的质量。应当通过或者基于DFT或者基于QMF的谐波转置在解码器中实现谐波转置。非谐波转置(即,传统的频谱修补或拷贝(copy))通常改善语音信号。因此,关于哪种类型的转置对于编码特定的音频内容是优选的决定的起始点是依赖于语音/音乐检测选择转置方法,其中对音乐内容采用谐波转置,而对语音内容采用频谱修补。
在依赖于被称为“bs_sbr_preprocessing”的一位eSBR元数据参数的值而或者执行或者不执行预平坦化的意义上,在eSBR处理期间预平坦化的执行由这单个位的值控制。当使用如在MPEG-4AAC标准的4.6.18.6.3节中所描述的SBR QMF修补算法时,可以努力执行预平坦化步骤(当由“bs_sbr_preprocessing”参数指示时),以避免被输入到后续包络调节器(包络调节器执行eSBR处理的另一级)的高频信号的频谱包络形状的不连续。预平坦化通常改善后续包络调节级的操作,从而导致被感知为更稳定的高频带信号。
对于正在被解码的USAC位流的音频内容的每个声道(“ch”)的每个SBR包络(“env”),在解码器的eSBR处理期间,子带间采样时间包络整形(“inter-TES”工具)的执行由以下eSBR元数据参数控制:bs_temp_shape[ch][env];和bs_inter_temp_shape_mode[ch][env]。
inter-TES工具在包络调节器之后处理QMF子带采样。这个处理步骤以比包络调节器的时间粒度更细的时间粒度来整形较高频带的时间包络。通过将增益因子应用到SBR包络中的每个QMF子带采样,inter-TES对QMF子带采样当中的时间包络进行整形。
参数“bs_temp_shape[ch][env]”是标示inter-TES的使用的标志。参数“bs_inter_temp_shape_mode[ch][env]”指示(如在MPEG USAC标准中所定义的)inter-TES中的参数γ的值。
根据本发明的一些实施例,用于在MPEG-4AAC位流中包括指示上面提及的eSBR工具(谐波转置、预平坦化和inter_TES)的eSBR元数据的总体位速率要求被预期为在每秒几百位的数量级,因为只有执行eSBR处理所需要的差分控制数据被发送。传统解码器可以忽略这个信息,因为它是以向后兼容的方式被包括的(如稍后将解释的)。因此,出于数个原因,与包括eSBR元数据相关联的对于位速率的不利影响可以被忽略,该数个原因包括以下各项:
·因为只有执行eSBR处理所需要的差分控制数据被发送
(而不是SBR控制数据的同时播放(simulcast)),所以
(由于包括eSBR元数据而导致的)位速率损失是总位速率的很小一部分;
·SBR相关的控制信息的调谐通常不依赖于转置的细节;以及
·Inter-TES工具(在eSBR处理期间采用)执行转置信号的单端后处理。
因此,本发明的实施例提供了以向后兼容的方式高效地发送增强的频谱带复制(eSBR)控制数据或元数据的手段。eSBR控制数据的高效传输减少了采用本发明各方面的解码器、编码器和转码器中的存储器要求,同时对位速率没有切实的负面影响。而且,与根据本发明的实施例执行eSBR相关联的复杂度和处理要求也被减少,因为SBR数据仅需要被处理一次而不是同时播放(如果将eSBR视为MPEG-4AAC中完全分离的对象类型,而不是以向后兼容的方式集成到MPEG-4AAC编解码器中,情况将是如此)。
接下来,参考图7,我们描述MPEG-4AAC位流的块(“raw_data_block”)的元素,根据本发明的一些实施例,MPEG-4AAC位流中包括eSBR元数据。图7是MPEG-4AAC位流的块(“raw_data_block”)的图,示出了位流的段中的一些。
MPEG-4AAC位流的块可以包括至少一个“single_channel_element()”(例如,图7中所示的单个声道元素)和/或至少一个“channel_pair_element()”(在图7中未具体示出,但是可以存在),包含用于音频节目的音频数据。块还可以包括数个“fill_elements”(例如,图7的填充元素1和/或填充元素2),该数个“fill_elements”包含与节目相关的数据(例如,元数据)。每个“single_channel_element()”包括指示单个声道元素的开始的标识符(例如,图7的“ID1”),并且可以包括指示多声道音频节目的不同声道的音频数据。每个“channel_pair_element包括指示声道对元素的开始的标识符(在图7中未示出),并且可以包括指示节目的两个声道的音频数据。
MPEG-4AAC位流的fill_element(本文称为填充元素)包括指示填充元素的开始的标识符(图7的“ID2”)以及在该标识符之后填充数据。标识符ID2可以由具有值0x6的、三位的首先发送最高有效位的无符号整数(“uimsbf”)组成。填充数据可以包括extension_payload()元素(在本文中有时称为扩展有效载荷),该元素的句法在MPEG-4AAC标准的表4.57中示出。几种类型的扩展有效载荷存在并通过“extension_type”参数而被识别,该参数是四位的首先发送最高有效位的无符号整数(“uimsbf”)。
填充数据(例如,其扩展有效载荷)可以包括报头或标识符(例如,图7的“报头1”),该报头或标识符指示表明SBR对象的填充数据的段(即,报头初始化“SBR对象”类型,其在MPEG-4AAC标准中被称为sbr_extension_data())。例如,对于报头中的extension_type字段,频谱带复制(SBR)扩展有效载荷用值'1101'或'1110'识别,其中标识符“1101”识别具有SBR数据的扩展有效载荷并且“1110”识别具有带循环冗余校验(CRC)以验证SBR数据的正确性的SBR数据的扩展有效载荷。
当报头(例如,extension_type字段)初始化SBR对象类型时,SBR元数据(在本文中有时称为“频谱带复制数据”,并且在MPEG-4AAC标准中被称为sbr_data())跟在报头之后,并且至少一个频谱带复制扩展元素(例如,图7的填充元素1的“SBR扩展元素”)可以跟在SBR元数据之后。这种频谱带复制扩展元素(位流的段)在MPEG-4AAC标准中被称为“sbr_extension()”容器。谱带复制扩展元素可选地包括报头(例如,图7的填充元素1的“SBR扩展报头”)。
MPEG-4AAC标准设想频谱带复制扩展元素可以包括用于节目音频数据的PS(参数化立体声)数据。MPEG-4AAC标准设想当填充元素的(例如,其扩展有效载荷的)报头初始化SBR对象类型(如图7的“报头1”所做的那样)并且填充元素的频谱带复制扩展元素包括PS数据时,填充元素(例如,其扩展有效载荷)包括频谱带复制数据以及“bs_extension_id”参数,该参数的值(即,bs_extension_id=2)指示PS数据被包括在填充元素的频谱带复制扩展元素中。
根据本发明的一些实施例,eSBR元数据(例如,指示是否要对块的音频内容执行增强的频谱带复制(eSBR)处理的标志)被包括在填充元素的频谱带复制扩展元素中。例如,这种标志在图7的填充元素1中被指示,其中该标志出现在填充元素1的“SBR扩展元素”的报头(填充元素1的“SBR扩展报头”)之后。可选地,这种标志和附加的eSBR元数据被包括在频谱带复制扩展元素中频谱带复制扩展元素的报头之后(例如,在图7中的填充元素1的SBR扩展元素中,在SBR扩展报头之后)。根据本发明的一些实施例,包括eSBR元数据的填充元素还包括“bs_extension_id”参数,该参数的值(例如,bs_extension_id=3)指示eSBR元数据被包含在填充元素中并且eSBR处理要对相关块的音频内容执行。
根据本发明的一些实施例,eSBR元数据被包括在MPEG-4AAC位流的填充元素(例如,图7的填充元素2)中,而不是填充元素的频谱带复制扩展元素(SBR扩展元素)中。这是因为包含具有SBR数据或带CRC的SBR数据的extension_payload()的填充元素不包含任何其它扩展类型的任何其它扩展有效载荷。因此,在eSBR元数据被存储其自身的扩展有效载荷的实施例中,使用单独的填充元素来存储eSBR元数据。这种填充元素包括指示填充元素的开始的标识符(例如,图7的“ID2”)以及在标识符之后的填充数据。填充数据可以包括extension_payload()元素(在本文中有时称为扩展有效载荷),该元素的句法在MPEG-4AAC标准的表4.57中示出。填充数据(例如,其扩展有效载荷)包括指示eSBR对象的报头(例如,图7的填充元素2的“报头2”)(即,报头初始化增强的频谱带复制(eSBR)对象类型),并且填充数据(例如,其扩展有效载荷)包括报头之后的eSBR元数据。例如,图7的填充元素2包括这种报头(“报头2”),并且在报头之后还包括eSBR元数据(即,填充元素2中的“标志”,其指示增强的频谱带复制(eSBR)处理是否要对块的音频内容执行)。可选地,附加的eSBR元数据也被包括在图7的填充元素2的填充数据中,在报头2之后。在本段落中描述的实施例中,报头(例如,图7的报头2)具有以下标识值:该标识值不是在MPEG-4AAC标准的表4.57中指定的常规值之一,而相反,指示eSBR扩展有效载荷(使得报头的extension_type字段指示填充数据包括esBR元数据)。
在第一类实施例中,本发明是音频处理单元(例如,解码器),包括:
存储器(例如,图3或图4的缓冲器201),被配置为存储编码音频位流的至少一个块(例如,MPEG-4AAC位流的至少一个块);
位流有效载荷去格式化器(例如,图3的元件205或图4的元件215),耦合到存储器并且被配置为对位流的所述块的至少一部分进行解复用;以及
解码子系统(例如,图3的元件202和203,或图4的元件202和213),被耦合并被配置为对位流的所述块的音频内容的至少一部分进行解码,其中块包括:
填充元素,包括指示填充元素的开始的标识符(例如,MPEG-4AAC标准的表4.85的具有值0x6的“id_syn_ele”标识符)以及在标识符之后的填充数据,其中填充数据包括:
识别是否要对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志(例如,使用被包括在块中的eSBR元数据和频谱带复制数据)。
标志是eSBR元数据,并且标志的示例是sbrPatchingMode标志。标志的另一示例是harmonicSBR标志。这两个标志都指示要对块的音频数据执行基本形式的频谱带复制还是增强形式的频谱复制。基本形式的频谱复制是频谱修补,并且增强形式的频谱带复制是谐波转置。
在一些实施例中,填充数据还包括附加的eSBR元数据(即,除标志之外的eSBR元数据)。
存储器可以是存储(例如,以非暂态方式)编码音频位流的至少一个块的缓冲存储器(例如,图4的缓冲器201的实现)。
据估计,在包括eSBR元数据(指示这些eSBR工具)的MPEG-4AAC位流的解码期间,eSBR解码器的eSBR处理(使用eSBR谐波转置、预平坦化和inter_TES工具)的执行复杂度将会如下(对于利用指示的参数的典型解码):
·谐波转置(16kbps,14400/28800Hz)
o基于DFT:3.68WMOPS(加权百万次操作每秒);
o基于QMF:0.98WMOPS;
·QMF修补预处理(预平坦化):0.1WMOPS;以及
·子带间采样时间包络整形(inter-TES):至多0.16WMOPS。
已知,对于瞬变(transients),基于DFT的转置通常比基于QMF的转置表现得更好。
根据本发明的一些实施例,包括eSBR元数据的(编码音频位流的)填充元素也包括其值(例如,bs_extension_id=3)标示eSBR元数据被包括在填充元素中并且eSBR处理要对相关块的音频内容执行的参数(例如,“bs_extension_id”参数),和/或其值(例如,bs_extension_id=2)标示填充元素的sbr_extension()容器包括PS数据的参数(例如,相同的“bs_extension_id”参数)。例如,如下表1中所指示的,具有值bs_extension_id=2的这种参数可以标示填充元素的sbr_extension()容器包括PS数据,并且具有值bs_extension_id=3的这种参数可以标示填充元素的sbr_extension()容器包括eSBR元数据:
表1
bs_extension_id | 含义 | |
0 | 保留 | |
1 | 保留 | |
2 | EXTENSION_ID_PS | |
3 | EXTENSION_ID_ESBR |
根据本发明的一些实施例,包括eSBR元数据和/或PS数据的每个频谱带复制扩展元素的句法如下表2中所指示的那样(其中“sbr_extension()”表示作为频谱带复制扩展元素的容器,“bs_extension_id”如上表1中所述,“ps_data”表示PS数据,并且“esbr_data”表示eSBR元数据):
表2
在示例性实施例中,上表2中提及的esbr_data()指示以下元数据参数的值:
1.上述一位元数据参数“harmonicSBR”、“bs_interTES”和“bs_sbr_preprocessing”中的每个;
2.对于要被解码的编码位流的音频内容的每个声道(“ch”),上述参数“sbrPatchingMode[ch]”、“sbrOversamplingFlag[ch]”、“sbrPitchInBinsFlag[ch]”和“sbrPitchInBins[ch]”中的每个;以及
3.对于要被解码的编码位流的音频内容的每个声道(“ch”)的每个SBR包络(“env”),上述参数“bs_temp_shape[ch][env]”和“bs_inter_temp_shape_mode[ch][env]”中的每个。
例如,在一些实施例中,esbr_data()可以具有表3中指示的句法,以指示这些元数据参数:
表3
在表3中,中心列中的数字指示左列中对应参数的位数。
上述句法使得能够高效地实现增强形式的频谱带复制,诸如谐波转置,作为传统解码器的扩展。具体而言,表3的eSBR数据仅包括执行增强形式的频谱带复制所需要的参数,这些参数既不是在位流中已经被支持也不可以从位流中已经被支持的参数直接导出。执行增强形式的频谱带复制所需要的所有其它参数和处理数据是从位流中已经定义的定位中预先存在的参数中提取的。这与简单地发送用于增强的频谱带复制的全部处理元数据的替代(并且效率较低的)实现相反。
例如,符合MPEG-4HE-AAC或HE-AAC v2的解码器可以被扩展以包括增强形式的频谱带复制,诸如谐波转置。这种增强形式的频谱带复制是解码器已经支持的基本形式的频谱带复制的附加(addition)。在符合MPEG-4HE-AAC或HE-AAC v2的解码器的上下文中,这种基本形式的频谱带复制是如MPEG-4AAC标准的4.6.18节中定义的QMF频谱修补SBR工具。
当执行增强形式的频谱带复制时,扩展的HE-AAC解码器可以重用(reuse)已经被包括在位流的SBR扩展有效载荷中的位流参数中的许多。可以重用的具体参数包括例如确定主频带表的各种参数。这些参数包括bs_start_freq(确定主频表参数开始的参数)、bs_stop_freq(确定主频表停止的参数)、bs_freq_scale(确定每倍频程(octave)频带数的参数),和bs_alter_scale(更改频带的比例(scale)的参数)。可以重用的参数还包括确定噪声带表的参数(bs_noise_bands)和限幅器(limiter)带表参数(bs_limiter_bands)。
除了众多参数,根据本发明的实施例,当执行增强形式的频谱带复制时,其它数据元素也可以被扩展的HE-AAC解码器重用。例如,包络数据和噪声本底(noise floor)数据也可以从bs_data_env和bs_noise_env数据中提取并在增强形式的频谱带复制期间被使用。
实质上,这些实施例在SBR扩展有效载荷中利用已经由传统HE-AAC或HE-AAC v2解码器支持的配置参数和包络数据,以使得能够实现需要尽可能少的额外发送数据的、增强形式的频谱带复制。因而,可以通过依靠已经定义的位流元素(例如,SBR扩展有效载荷中的那些)并且仅(在填充元素扩展有效载荷中)添加支持增强形式的频谱带复制所需要的那些参数而以非常高效的方式来创建支持增强形式的频谱带复制的扩展解码器。通过确保位流与不支持增强形式的频谱带复制的传统解码器向后兼容,这种数据简化特征与将新添加的参数放在保留数据字段(诸如扩展容器)中相结合,大大减少了创建支持增强形式的频谱带复制的解码器的障碍。
在一些实施例中,本发明是一种方法,包括对音频数据进行编码以生成编码位流(例如,MPEG-4AAC位流)的步骤,该步骤包括通过将eSBR元数据包括在编码位流的至少一个块的至少一个段中并且将音频数据包括在该块的至少一个其它段中。在典型的实施例中,该方法包括将编码位流的每个块中的音频数据与eSBR元数据进行复用的步骤。在eSBR解码器中编码位流的典型解码中,解码器从位流中提取eSBR元数据(包括通过解析和解复用eSBR元数据和音频数据),并使用eSBR元数据来处理音频数据以生成解码的音频数据的流。
本发明的另一方面是eSBR解码器,被配置为在解码不包括eSBR元数据的编码音频位流(例如,MPEG-4AAC位流)期间执行eSBR处理(例如,使用被称为谐波转置、预平坦化或inter-TES的eSBR工具中的至少一种)。将参考图5来描述这种解码器的示例。
图5的eSBR解码器(400)包括如图所示连接的缓冲存储器201(与图3和图4的存储器201相同)、位流有效载荷去去格式化器215(与图4的去格式化器215相同)、音频解码子系统202(有时被称为“核心”解码级或“核心”解码子系统,并且与图3的核心解码子系统202相同)、eSBR控制数据生成子系统401和eSBR处理级203(与图3的级203相同)。通常,解码器400还包括其它处理元件(未示出)。
在解码器400的操作中,由解码器400接收的编码音频位流(MPEG-4AAC位流)的块序列从缓冲器201被断言到去格式化器215。
去格式化器215被耦合并配置为对位流的每个块进行解复用,以从其提取SBR元数据(包括量化的包络数据)以及通常还有的其它元数据。去格式化器215被配置为将至少SBR元数据断言到eSBR处理级203。去格式化器215还被耦合并配置为从位流的每个块中提取音频数据,并将提取出的音频数据断言到解码子系统(解码级)202。
解码器400的音频解码子系统202被配置为对由去格式化器215提取的音频数据进行解码(这种解码可以被称为“核心”解码操作)以生成解码的音频数据,并将解码的音频数据断言到eSBR处理级203。解码在频域中执行。通常,子系统202中的最终处理级将频域-时域变换应用到解码的频域音频数据,使得子系统的输出是时域解码的音频数据。级203被配置为将由(被去格式化器215提取的)SBR元数据和在子系统401中生成的eSBR元数据指示的SBR工具(和eSBR工具)应用到解码的音频数据(即,使用SBR和eSBR元数据对解码子系统202的输出执行SBR和eSBR处理)以生成从解码器400输出的完全解码的音频数据。通常,解码器400包括存储从去格式化器215(以及可选地还有系统401)输出的去格式化音频数据和元数据的存储器(可由子系统202和级203访问),并且级203被配置为在SBR和eSBR处理期间根据需要访问音频数据和元数据。级203中的SBR处理可以被认为是对核心解码子系统202的输出的后处理。可选地,解码器400还包括最终上混子系统(其可以使用由去格式化器215提取的PS元数据应用在MPEG-4AAC标准中定义的参数化立体声(“PS”)工具),该最终上混子系统被耦合并配置为对级203的输出执行上混以生成从APU 210输出的完全解码的上混音频。
图5的控制数据生成子系统401被耦合并配置为检测要被解码的编码音频位流的至少一个性质,并且响应于检测步骤的至少一个结果而生成eSBR控制数据(根据本发明的其它实施例,该eSBR控制数据可以是或包括编码音频位流中所包括的任何类型的eSBR元数据)。eSBR控制数据被断言到级203,以便在检测到位流的具体性质(或性质的组合)时触发各个eSBR工具或eSBR工具的组合的应用和/或以便控制这种eSBR工具的应用。例如,为了控制使用谐波转置的eSBR处理的执行,控制数据生成子系统401的一些实施例将包括:音乐检测器(例如,常规音乐检测器的简化版本),用于响应于检测到位流指示或不指示音乐而设置sbrPatchingMode[ch]参数(并将设置的参数断言到级203);瞬变检测器,用于响应于检测到由位流指示的音频内容中是否存在瞬变而设置sbrOversamplingFlag[ch]参数(并将设置的参数断言到级203);和/或音高(pitch)检测器,用于响应于检测到由位流指示的音频内容的音高而设置sbrPitchInBinsFlag[ch]和sbrPitchInBins[ch]参数(并将设置的参数断言到级203)。本发明的其它方面是由本段和前面的段中描述的发明性解码器的任何实施例执行的音频位流解码方法。
本发明的各方面包括本发明性APU、系统或设备的任何实施例被配置(例如,被编程)为执行的类型的编码或解码方法。本发明的其它方面包括被配置(例如,被编程)为执行本发明性方法的任何实施例的系统或设备,以及存储用于实现本发明性方法或其步骤的任何实施例的代码(例如,以非暂态方式)的计算机可读介质(例如,盘)。例如,本发明性系统可以是或包括用软件或固件编程和/或以其它方式被配置以执行对数据的各种操作中的任何操作(包括本发明性方法或其步骤的实施例)的可编程通用处理器、数字信号处理器或微处理器。这种通用处理器可以是或包括计算机系统,该计算机系统包括被编程(和/或以其它方式被配置)以响应于向其断言的数据而执行本发明性方法(或其步骤)的实施例的输入设备、存储器和处理电路。
本发明的实施例可以以硬件、固件或软件或两者的组合(例如,作为可编程逻辑阵列)来实现。除非另有说明,否则作为本发明的一部分被包括的算法或过程并不固有地与任何特定的计算机或其它装置相关。特别地,各种通用机器可以与根据本文的教导编写的程序一起使用,或者构造更专用的装置(例如,集成电路)以执行所需的方法步骤可能更方便。因此,本发明可以在一个或多个可编程计算机系统上执行的一个或多个计算机程序中实现(例如,图1的元件中任何一个的实现,或图2的编码器100(或其元件)的实现,或图3的解码器200(或其元件)的实现,或图4的解码器210(或其元件)的实现,或图5的解码器400(或其元件)的实现),每个计算机系统包括至少一个处理器、至少一个数据存储系统(包括易失性和非易失性存储器和/或存储元件)、至少一个输入设备或端口,以及至少一个输出设备或端口。程序代码被应用到输入数据以执行本文所述的功能并生成输出信息。输出信息以已知的方式被应用到一个或多个输出设备。
每个这样的程序可以以任何期望的计算机语言(包括机器、汇编或高级过程、逻辑或面向对象的编程语言)来实现,以与计算机系统通信。在任何情况下,语言都可以是编译或解释语言。
例如,当由计算机软件指令序列实现时,可以通过在合适的数字信号处理硬件中运行的多线程软件指令序列来实现本发明的实施例的各种功能和步骤,在这种情况下,实施例的各种设备、步骤和功能可以与软件指令的部分对应。
每个这样的计算机程序优选地被存储在或者被下载到可以由通用或专用可编程计算机读取的存储介质或设备(例如,固态存储器或介质,或者磁或光介质)中,以用于在存储介质或设备由计算机系统读取时配置和操作计算机以执行本文所述的过程。本发明性系统还可以被实现为配置有(即,存储)计算机程序的计算机可读存储介质,其中如此配置的存储介质使计算机系统以具体且预定义的方式操作,以执行本文所述的功能。
已经描述了本发明的数个实施例。不过将理解的是,在不背离本发明的精神和范围的情况下,可以做出各种修改。根据上述教导,本发明的许多修改和变化是可能的。应当理解的是,在所附权利要求的范围内,本发明可以以不同于本文具体描述的方式来实践。所附权利要求中包含的任何标号仅用于说明性目的,而不应当用来以任何方式解释或限制权利要求。
Claims (8)
1.一种用于对编码音频位流进行解码的音频处理单元(210),所述音频处理单元包括:
位流有效载荷去格式化器(215),被配置为对编码音频位流进行解复用;以及
解码子系统(202),耦合到位流有效载荷去格式化器(215)并且被配置为对编码音频位流进行解码,其中编码音频位流包括:
填充元素,具有指示填充元素的开始的标识符以及在该标识符之后的填充数据,其中填充数据包括:
至少一个标志,识别要对编码音频位流的音频内容执行基本形式的频谱带复制还是增强形式的频谱带复制,其中基本形式的频谱带复制包括频谱修补,增强形式的频谱带复制包括谐波转置,标志的一个值指示应当对音频内容执行所述增强形式的频谱带复制,并且标志的另一个值指示应当对音频内容执行所述基本形式的频谱带复制而不是所述谐波转置,
其中编码音频位流是MPEG-4AAC位流。
2.如权利要求1所述的音频处理单元,其中填充数据还包括增强的频谱带复制元数据。
3.如权利要求2所述的音频处理单元,其中增强的频谱带复制元数据被包含在填充元素的扩展有效载荷中。
4.如权利要求2至3中任一项所述的音频处理单元,其中增强的频谱带复制元数据包括定义主频带表的一个或多个参数。
5.如权利要求2至3中任一项所述的音频处理单元,其中增强的频谱带复制元数据包括包络比例因子或噪声本底比例因子。
6.一种用于对编码音频位流进行解码的方法,所述方法包括:
对编码音频位流进行解复用;以及
对编码音频位流进行解码,
其中编码音频位流包括:
填充元素,具有指示填充元素的开始的标识符以及在该标识符之后的填充数据,其中填充数据包括:
至少一个标志,识别要对编码音频位流的音频内容执行基本形式的频谱带复制还是增强形式的频谱带复制,其中基本形式的频谱带复制包括频谱修补,增强形式的频谱带复制包括谐波转置,标志的一个值指示应当对音频内容执行所述增强形式的频谱带复制,并且标志的另一个值指示应当对音频内容执行所述基本形式的频谱带复制而不是所述谐波转置,
其中编码音频位流是MPEG-4AAC位流。
7.如权利要求6所述的方法,其中标识符是具有值0x6的三位的首先发送最高有效位的无符号整数。
8.如权利要求6或7所述的方法,其中填充数据还包括增强的频谱带复制元数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811199390.4A CN108899039B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15159067 | 2015-03-13 | ||
EP15159067.6 | 2015-03-13 | ||
US201562133800P | 2015-03-16 | 2015-03-16 | |
US62/133,800 | 2015-03-16 | ||
PCT/US2016/021666 WO2016149015A1 (en) | 2015-03-13 | 2016-03-10 | Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element |
CN201811199390.4A CN108899039B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201680015378.6A CN107408391B (zh) | 2015-03-13 | 2016-03-10 | 解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680015378.6A Division CN107408391B (zh) | 2015-03-13 | 2016-03-10 | 解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108899039A true CN108899039A (zh) | 2018-11-27 |
CN108899039B CN108899039B (zh) | 2023-05-23 |
Family
ID=52692473
Family Applications (22)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811199403.8A Active CN109065062B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201680015399.8A Active CN107430867B (zh) | 2015-03-13 | 2016-03-10 | 解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流 |
CN201811199406.1A Active CN109065063B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811521244.9A Active CN109461453B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199383.4A Active CN109410969B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811199401.9A Active CN108962269B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811521580.3A Active CN109509479B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811521218.6A Active CN109273013B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199400.4A Active CN109243474B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811521577.1A Active CN109326295B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199395.7A Active CN108899040B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811521593.0A Active CN109461454B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199396.1A Active CN109003616B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811199411.2A Active CN109243475B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201680015378.6A Active CN107408391B (zh) | 2015-03-13 | 2016-03-10 | 解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流 |
CN201811521219.0A Active CN109360575B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811521220.3A Active CN109360576B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811521245.3A Active CN109273014B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811521243.4A Active CN109461452B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199404.2A Active CN109273016B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811199390.4A Active CN108899039B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811199399.5A Active CN109273015B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
Family Applications Before (20)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811199403.8A Active CN109065062B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201680015399.8A Active CN107430867B (zh) | 2015-03-13 | 2016-03-10 | 解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流 |
CN201811199406.1A Active CN109065063B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811521244.9A Active CN109461453B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199383.4A Active CN109410969B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811199401.9A Active CN108962269B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811521580.3A Active CN109509479B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811521218.6A Active CN109273013B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199400.4A Active CN109243474B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811521577.1A Active CN109326295B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199395.7A Active CN108899040B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811521593.0A Active CN109461454B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199396.1A Active CN109003616B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201811199411.2A Active CN109243475B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
CN201680015378.6A Active CN107408391B (zh) | 2015-03-13 | 2016-03-10 | 解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流 |
CN201811521219.0A Active CN109360575B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811521220.3A Active CN109360576B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811521245.3A Active CN109273014B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811521243.4A Active CN109461452B (zh) | 2015-03-13 | 2016-03-10 | 解码具有增强的频谱带复制元数据的音频位流 |
CN201811199404.2A Active CN109273016B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811199399.5A Active CN109273015B (zh) | 2015-03-13 | 2016-03-10 | 解码在填充元素中具有增强频谱带复制元数据的音频位流 |
Country Status (23)
Country | Link |
---|---|
US (13) | US10134413B2 (zh) |
EP (10) | EP3268956B1 (zh) |
JP (8) | JP6383501B2 (zh) |
KR (11) | KR102255142B1 (zh) |
CN (22) | CN109065062B (zh) |
AR (10) | AR103856A1 (zh) |
AU (7) | AU2016233669B2 (zh) |
BR (9) | BR112017019499B1 (zh) |
CA (5) | CA3210429A1 (zh) |
CL (1) | CL2017002268A1 (zh) |
DK (6) | DK4198974T3 (zh) |
ES (6) | ES2946760T3 (zh) |
FI (3) | FI4198974T3 (zh) |
HU (6) | HUE066296T2 (zh) |
IL (3) | IL295809B2 (zh) |
MX (2) | MX2017011490A (zh) |
MY (1) | MY184190A (zh) |
PL (8) | PL3657500T3 (zh) |
RU (4) | RU2760700C2 (zh) |
SG (2) | SG11201707459SA (zh) |
TW (3) | TWI771266B (zh) |
WO (2) | WO2016146492A1 (zh) |
ZA (4) | ZA201903963B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI771266B (zh) | 2015-03-13 | 2022-07-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TWI752166B (zh) | 2017-03-23 | 2022-01-11 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
BR112020012648A2 (pt) | 2017-12-19 | 2020-12-01 | Dolby International Ab | métodos e sistemas de aparelhos para aprimoramentos de decodificação de fala e áudio unificados |
TWI812658B (zh) | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
US11315584B2 (en) | 2017-12-19 | 2022-04-26 | Dolby International Ab | Methods and apparatus for unified speech and audio decoding QMF based harmonic transposer improvements |
HUE054531T2 (hu) * | 2018-01-26 | 2021-09-28 | Dolby Int Ab | Visszafelé kompatibilis integrálása magas frekvenciás rekonstrukciós technikáknak audio jelek elõállításához |
TWI834582B (zh) | 2018-01-26 | 2024-03-01 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
WO2019207036A1 (en) * | 2018-04-25 | 2019-10-31 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
SG11202010367YA (en) * | 2018-04-25 | 2020-11-27 | Dolby Int Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11081116B2 (en) * | 2018-07-03 | 2021-08-03 | Qualcomm Incorporated | Embedding enhanced audio transports in backward compatible audio bitstreams |
MX2021001970A (es) | 2018-08-21 | 2021-05-31 | Dolby Int Ab | Métodos, aparatos y sistemas para generación, transporte y procesamiento de tramas de ejecución inmediata (ipfs). |
KR102510716B1 (ko) * | 2020-10-08 | 2023-03-16 | 문경미 | 양파를 이용한 잼의 제조방법 및 이로 제조된 양파잼 |
CN114051194A (zh) * | 2021-10-15 | 2022-02-15 | 赛因芯微(北京)电子科技有限公司 | 一种音频轨道元数据和生成方法、电子设备及存储介质 |
WO2024012665A1 (en) * | 2022-07-12 | 2024-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding of precomputed data for rendering early reflections in ar/vr systems |
CN116528330B (zh) * | 2023-07-05 | 2023-10-03 | Tcl通讯科技(成都)有限公司 | 设备入网方法、装置、电子设备及计算机可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6502069B1 (en) * | 1997-10-24 | 2002-12-31 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method and a device for coding audio signals and a method and a device for decoding a bit stream |
CN1484822A (zh) * | 2001-11-02 | 2004-03-24 | ���µ�����ҵ��ʽ���� | 编码装置和解码装置 |
US20040078194A1 (en) * | 1997-06-10 | 2004-04-22 | Coding Technologies Sweden Ab | Source coding enhancement using spectral-band replication |
EP1926084A2 (en) * | 2006-11-24 | 2008-05-28 | Fujitsu Limited | Decoding apparatus and decoding method |
CN102089808A (zh) * | 2008-07-11 | 2011-06-08 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、音频解码器、用于编码及解码音频信号的方法、音频流与计算机程序 |
CN102144259A (zh) * | 2008-07-11 | 2011-08-03 | 弗劳恩霍夫应用研究促进协会 | 用于产生带宽扩展输出数据的装置和方法 |
CN102687198A (zh) * | 2009-12-07 | 2012-09-19 | 杜比实验室特许公司 | 使用自适应混合变换的多声道音频编码比特流的解码 |
CN103971694A (zh) * | 2013-01-29 | 2014-08-06 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
WO2014118185A1 (en) * | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
Family Cites Families (98)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0003960D0 (en) * | 2000-02-18 | 2000-04-12 | Pfizer Ltd | Purine derivatives |
TW524330U (en) | 2001-09-11 | 2003-03-11 | Inventec Corp | Multi-purposes image capturing module |
CN100395817C (zh) * | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
AU2002352182A1 (en) * | 2001-11-29 | 2003-06-10 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7043423B2 (en) * | 2002-07-16 | 2006-05-09 | Dolby Laboratories Licensing Corporation | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
EP1414273A1 (en) | 2002-10-22 | 2004-04-28 | Koninklijke Philips Electronics N.V. | Embedded data signaling |
EP1590800B1 (en) * | 2003-02-06 | 2009-11-04 | Dolby Laboratories Licensing Corporation | Continuous backup audio |
KR100917464B1 (ko) | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
PL1683133T3 (pl) * | 2003-10-30 | 2007-07-31 | Koninl Philips Electronics Nv | Kodowanie lub dekodowanie sygnału audio |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
WO2005104094A1 (ja) * | 2004-04-23 | 2005-11-03 | Matsushita Electric Industrial Co., Ltd. | 符号化装置 |
DE102004046746B4 (de) * | 2004-09-27 | 2007-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten |
PL1839297T3 (pl) * | 2005-01-11 | 2019-05-31 | Koninklijke Philips Nv | Skalowalne kodowanie/dekodowanie sygnałów audio |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
KR20070003574A (ko) * | 2005-06-30 | 2007-01-05 | 엘지전자 주식회사 | 오디오 신호 인코딩 및 디코딩 방법 및 장치 |
EP1920437A4 (en) * | 2005-07-29 | 2010-01-06 | Lg Electronics Inc | METHOD FOR SIGNALING CUTTING INFORMATION |
KR20070038441A (ko) * | 2005-10-05 | 2007-04-10 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
KR100878766B1 (ko) * | 2006-01-11 | 2009-01-14 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 방법과 장치 |
US7610195B2 (en) * | 2006-06-01 | 2009-10-27 | Nokia Corporation | Decoding of predictively coded data using buffer adaptation |
CA2645618C (en) * | 2006-10-25 | 2013-01-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
US8295494B2 (en) * | 2007-08-13 | 2012-10-23 | Lg Electronics Inc. | Enhancing audio with remixing capability |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8566107B2 (en) * | 2007-10-15 | 2013-10-22 | Lg Electronics Inc. | Multi-mode method and an apparatus for processing a signal |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
RU2488896C2 (ru) * | 2008-03-04 | 2013-07-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Микширование входящих информационных потоков и генерация выходящего информационного потока |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MX2011000372A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio. |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
US8290782B2 (en) * | 2008-07-24 | 2012-10-16 | Dts, Inc. | Compression of audio scale-factors by two-dimensional transformation |
WO2010036061A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
KR101336891B1 (ko) * | 2008-12-19 | 2013-12-04 | 한국전자통신연구원 | G.711 코덱의 음질 향상을 위한 부호화 장치 및 복호화 장치 |
BR122019023704B1 (pt) * | 2009-01-16 | 2020-05-05 | Dolby Int Ab | sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta |
AU2010209673B2 (en) * | 2009-01-28 | 2013-05-16 | Dolby International Ab | Improved harmonic transposition |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
KR20100089772A (ko) * | 2009-02-03 | 2010-08-12 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
CA2949616C (en) * | 2009-03-17 | 2019-11-26 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
EP2433278B1 (en) | 2009-04-07 | 2020-06-03 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for providing a backwards compatible payload format |
US8392200B2 (en) * | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
TWI643187B (zh) * | 2009-05-27 | 2018-12-01 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
CN102318004B (zh) * | 2009-09-18 | 2013-10-23 | 杜比国际公司 | 改进的谐波转置 |
JP5678071B2 (ja) * | 2009-10-08 | 2015-02-25 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 線形予測符号化ベースのノイズ整形を用いた多重モードオーディオ信号デコーダ、多重モードオーディオ信号エンコーダ、方法およびコンピュータプログラム |
JP5771618B2 (ja) * | 2009-10-19 | 2015-09-02 | ドルビー・インターナショナル・アーベー | 音声オブジェクトの区分を示すメタデータ時間標識情報 |
MY188408A (en) * | 2009-10-20 | 2021-12-08 | Fraunhofer Ges Forschung | Audio encoder,audio decoder,method for encoding an audio information,method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
PL2491556T3 (pl) * | 2009-10-20 | 2024-08-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder sygnału audio, odpowiadający mu sposób oraz program komputerowy |
CN102859589B (zh) * | 2009-10-20 | 2014-07-09 | 弗兰霍菲尔运输应用研究公司 | 多模式音频编译码器及其适用的码簿激励线性预测编码 |
TWI529703B (zh) * | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
CN102194457B (zh) * | 2010-03-02 | 2013-02-27 | 中兴通讯股份有限公司 | 音频编解码方法、系统及噪声水平估计方法 |
BR112012022740B1 (pt) * | 2010-03-09 | 2021-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch |
JP5813094B2 (ja) * | 2010-04-09 | 2015-11-17 | ドルビー・インターナショナル・アーベー | Mdctベース複素予測ステレオ符号化 |
ES2911893T3 (es) | 2010-04-13 | 2022-05-23 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio y métodos relacionados para procesar señales de audio estéreo usando una dirección de predicción variable |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
WO2011128399A1 (en) | 2010-04-16 | 2011-10-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
CN102254560B (zh) * | 2010-05-19 | 2013-05-08 | 安凯(广州)微电子技术有限公司 | 一种移动数字电视录像中的音频处理方法 |
ES2644974T3 (es) * | 2010-07-19 | 2017-12-01 | Dolby International Ab | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
US8831933B2 (en) * | 2010-07-30 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization |
US8489391B2 (en) | 2010-08-05 | 2013-07-16 | Stmicroelectronics Asia Pacific Pte., Ltd. | Scalable hybrid auto coder for transient detection in advanced audio coding with spectral band replication |
KR102439053B1 (ko) * | 2010-09-16 | 2022-09-02 | 돌비 인터네셔널 에이비 | 교차 곱 강화된 서브밴드 블록 기반 고조파 전위 |
CN102446506B (zh) * | 2010-10-11 | 2013-06-05 | 华为技术有限公司 | 音频信号的分类识别方法及装置 |
WO2014124377A2 (en) | 2013-02-11 | 2014-08-14 | Dolby Laboratories Licensing Corporation | Audio bitstreams with supplementary data and encoding and decoding of such bitstreams |
US9093120B2 (en) * | 2011-02-10 | 2015-07-28 | Yahoo! Inc. | Audio fingerprint extraction by scaling in time and resampling |
TWI469136B (zh) | 2011-02-14 | 2015-01-11 | Fraunhofer Ges Forschung | 在一頻譜域中用以處理已解碼音訊信號之裝置及方法 |
CA2827335C (en) * | 2011-02-14 | 2016-08-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
JP5805796B2 (ja) * | 2011-03-18 | 2015-11-10 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 柔軟なコンフィギュレーション機能性を有するオーディオエンコーダおよびデコーダ |
ES2704742T3 (es) | 2011-04-05 | 2019-03-19 | Nippon Telegraph & Telephone | Descodificación de una señal acústica |
JP6185457B2 (ja) * | 2011-04-28 | 2017-08-23 | ドルビー・インターナショナル・アーベー | 効率的なコンテンツ分類及びラウドネス推定 |
WO2012158333A1 (en) * | 2011-05-19 | 2012-11-22 | Dolby Laboratories Licensing Corporation | Forensic detection of parametric audio coding schemes |
CN103620678B (zh) | 2011-05-20 | 2015-08-19 | 株式会社索思未来 | 比特流发送装置及方法、比特流收发系统、比特流接收装置及方法、以及比特流 |
US20130006644A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method and device for spectral band replication, and method and system for audio decoding |
KR102608968B1 (ko) * | 2011-07-01 | 2023-12-05 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법 |
CN103918029B (zh) * | 2011-11-11 | 2016-01-20 | 杜比国际公司 | 使用过采样谱带复制的上采样 |
WO2013079524A2 (en) * | 2011-11-30 | 2013-06-06 | Dolby International Ab | Enhanced chroma extraction from an audio codec |
JP5817499B2 (ja) | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
CA2870884C (en) | 2012-04-17 | 2022-06-21 | Sirius Xm Radio Inc. | Systems and methods for implementing efficient cross-fading between compressed audio streams |
EP2709106A1 (en) * | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
WO2014115225A1 (ja) | 2013-01-22 | 2014-07-31 | パナソニック株式会社 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
BR122022020276B1 (pt) * | 2013-01-28 | 2023-02-23 | Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia |
KR101775084B1 (ko) | 2013-01-29 | 2017-09-05 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법 |
TWI530941B (zh) * | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
US9716959B2 (en) * | 2013-05-29 | 2017-07-25 | Qualcomm Incorporated | Compensating for error in decomposed representations of sound fields |
EP3731226A1 (en) | 2013-06-11 | 2020-10-28 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Device and method for bandwidth extension for acoustic signals |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830049A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
US20150127354A1 (en) * | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
EP2881943A1 (en) | 2013-12-09 | 2015-06-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal with low computational resources |
TWI771266B (zh) * | 2015-03-13 | 2022-07-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TWI693595B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10628134B2 (en) | 2016-09-16 | 2020-04-21 | Oracle International Corporation | Generic-flat structure rest API editor |
TWI752166B (zh) * | 2017-03-23 | 2022-01-11 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
TWI834582B (zh) * | 2018-01-26 | 2024-03-01 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
-
2016
- 2016-02-22 TW TW111107792A patent/TWI771266B/zh active
- 2016-02-22 TW TW105105119A patent/TWI693594B/zh active
- 2016-02-22 TW TW110111061A patent/TWI758146B/zh active
- 2016-03-04 AR ARP160100577A patent/AR103856A1/es active IP Right Grant
- 2016-03-10 PL PL19213743T patent/PL3657500T3/pl unknown
- 2016-03-10 JP JP2017547096A patent/JP6383501B2/ja active Active
- 2016-03-10 ES ES21193211T patent/ES2946760T3/es active Active
- 2016-03-10 CN CN201811199403.8A patent/CN109065062B/zh active Active
- 2016-03-10 KR KR1020187017423A patent/KR102255142B1/ko active IP Right Grant
- 2016-03-10 PL PL21193211.6T patent/PL3985667T3/pl unknown
- 2016-03-10 KR KR1020217037713A patent/KR102481326B1/ko not_active Application Discontinuation
- 2016-03-10 FI FIEP23154574.0T patent/FI4198974T3/fi active
- 2016-03-10 DK DK23154574.0T patent/DK4198974T3/da active
- 2016-03-10 BR BR112017019499-6A patent/BR112017019499B1/pt active IP Right Grant
- 2016-03-10 HU HUE22202090A patent/HUE066296T2/hu unknown
- 2016-03-10 CA CA3210429A patent/CA3210429A1/en active Pending
- 2016-03-10 BR BR122020018673-9A patent/BR122020018673B1/pt active IP Right Grant
- 2016-03-10 RU RU2018118173A patent/RU2760700C2/ru active
- 2016-03-10 KR KR1020177025797A patent/KR101871643B1/ko active IP Right Grant
- 2016-03-10 JP JP2017547097A patent/JP6383502B2/ja active Active
- 2016-03-10 KR KR1020177025803A patent/KR101884829B1/ko active IP Right Grant
- 2016-03-10 CA CA2989595A patent/CA2989595C/en active Active
- 2016-03-10 CA CA2978915A patent/CA2978915C/en active Active
- 2016-03-10 EP EP16765449.0A patent/EP3268956B1/en active Active
- 2016-03-10 CN CN201680015399.8A patent/CN107430867B/zh active Active
- 2016-03-10 CA CA3051966A patent/CA3051966C/en active Active
- 2016-03-10 PL PL19190806T patent/PL3598443T3/pl unknown
- 2016-03-10 CN CN201811199406.1A patent/CN109065063B/zh active Active
- 2016-03-10 ES ES22202090T patent/ES2976055T3/es active Active
- 2016-03-10 BR BR122020018676-3A patent/BR122020018676B1/pt active IP Right Grant
- 2016-03-10 WO PCT/EP2016/055202 patent/WO2016146492A1/en active Application Filing
- 2016-03-10 SG SG11201707459SA patent/SG11201707459SA/en unknown
- 2016-03-10 CN CN201811521244.9A patent/CN109461453B/zh active Active
- 2016-03-10 KR KR1020217019073A patent/KR102330202B1/ko active IP Right Grant
- 2016-03-10 CN CN201811199383.4A patent/CN109410969B/zh active Active
- 2016-03-10 CN CN201811199401.9A patent/CN108962269B/zh active Active
- 2016-03-10 RU RU2017131858A patent/RU2665887C1/ru active
- 2016-03-10 EP EP21193211.6A patent/EP3985667B1/en active Active
- 2016-03-10 BR BR122020018627-5A patent/BR122020018627B1/pt active IP Right Grant
- 2016-03-10 CN CN201811521580.3A patent/CN109509479B/zh active Active
- 2016-03-10 CN CN201811521218.6A patent/CN109273013B/zh active Active
- 2016-03-10 EP EP24150177.4A patent/EP4328909A3/en active Pending
- 2016-03-10 DK DK19190806.0T patent/DK3598443T3/da active
- 2016-03-10 BR BR122019004614-0A patent/BR122019004614B1/pt active IP Right Grant
- 2016-03-10 EP EP19213743.8A patent/EP3657500B1/en active Active
- 2016-03-10 MX MX2017011490A patent/MX2017011490A/es active IP Right Grant
- 2016-03-10 BR BR122020018736-0A patent/BR122020018736B1/pt active IP Right Grant
- 2016-03-10 CN CN201811199400.4A patent/CN109243474B/zh active Active
- 2016-03-10 US US15/546,637 patent/US10134413B2/en active Active
- 2016-03-10 EP EP23154574.0A patent/EP4198974B1/en active Active
- 2016-03-10 WO PCT/US2016/021666 patent/WO2016149015A1/en active Application Filing
- 2016-03-10 BR BR112017018548-2A patent/BR112017018548B1/pt active IP Right Grant
- 2016-03-10 BR BR122020018731-0A patent/BR122020018731B1/pt active IP Right Grant
- 2016-03-10 CN CN201811521577.1A patent/CN109326295B/zh active Active
- 2016-03-10 CN CN201811199395.7A patent/CN108899040B/zh active Active
- 2016-03-10 HU HUE19213743A patent/HUE057225T2/hu unknown
- 2016-03-10 CN CN201811521593.0A patent/CN109461454B/zh active Active
- 2016-03-10 AU AU2016233669A patent/AU2016233669B2/en active Active
- 2016-03-10 EP EP22202090.1A patent/EP4141866B1/en active Active
- 2016-03-10 RU RU2017131851A patent/RU2658535C1/ru active
- 2016-03-10 CA CA3135370A patent/CA3135370C/en active Active
- 2016-03-10 DK DK22202090.1T patent/DK4141866T3/da active
- 2016-03-10 US US15/546,965 patent/US10262668B2/en active Active
- 2016-03-10 KR KR1020217035410A patent/KR102445316B1/ko active IP Right Grant
- 2016-03-10 HU HUE21195190A patent/HUE060688T2/hu unknown
- 2016-03-10 ES ES23154574T patent/ES2974497T3/es active Active
- 2016-03-10 EP EP24152023.8A patent/EP4336499A3/en active Pending
- 2016-03-10 CN CN201811199396.1A patent/CN109003616B/zh active Active
- 2016-03-10 HU HUE16765449A patent/HUE057183T2/hu unknown
- 2016-03-10 KR KR1020237033422A patent/KR20230144114A/ko not_active Application Discontinuation
- 2016-03-10 CN CN201811199411.2A patent/CN109243475B/zh active Active
- 2016-03-10 CN CN201680015378.6A patent/CN107408391B/zh active Active
- 2016-03-10 HU HUE23154574A patent/HUE066092T2/hu unknown
- 2016-03-10 HU HUE21193211A patent/HUE061857T2/hu unknown
- 2016-03-10 BR BR122020018629-1A patent/BR122020018629B1/pt active IP Right Grant
- 2016-03-10 KR KR1020187021858A patent/KR102269858B1/ko active IP Right Grant
- 2016-03-10 ES ES21195190T patent/ES2933476T3/es active Active
- 2016-03-10 CN CN201811521219.0A patent/CN109360575B/zh active Active
- 2016-03-10 PL PL16765449T patent/PL3268956T3/pl unknown
- 2016-03-10 RU RU2018126300A patent/RU2764186C2/ru active
- 2016-03-10 FI FIEP21193211.6T patent/FI3985667T3/fi active
- 2016-03-10 EP EP21195190.0A patent/EP3958259B8/en active Active
- 2016-03-10 CN CN201811521220.3A patent/CN109360576B/zh active Active
- 2016-03-10 CN CN201811521245.3A patent/CN109273014B/zh active Active
- 2016-03-10 IL IL295809A patent/IL295809B2/en unknown
- 2016-03-10 CN CN201811521243.4A patent/CN109461452B/zh active Active
- 2016-03-10 PL PL21195190.0T patent/PL3958259T3/pl unknown
- 2016-03-10 KR KR1020217014850A patent/KR102321882B1/ko active IP Right Grant
- 2016-03-10 PL PL23154574.0T patent/PL4198974T3/pl unknown
- 2016-03-10 EP EP19190806.0A patent/EP3598443B1/en active Active
- 2016-03-10 DK DK21193211.6T patent/DK3985667T3/da active
- 2016-03-10 ES ES16765449T patent/ES2893606T3/es active Active
- 2016-03-10 CN CN201811199404.2A patent/CN109273016B/zh active Active
- 2016-03-10 FI FIEP22202090.1T patent/FI4141866T3/fi active
- 2016-03-10 KR KR1020227031975A patent/KR102530978B1/ko active IP Right Grant
- 2016-03-10 DK DK21195190.0T patent/DK3958259T3/da active
- 2016-03-10 CN CN201811199390.4A patent/CN108899039B/zh active Active
- 2016-03-10 EP EP16709426.7A patent/EP3268961B1/en active Active
- 2016-03-10 PL PL22202090.1T patent/PL4141866T3/pl unknown
- 2016-03-10 DK DK19213743.8T patent/DK3657500T3/da active
- 2016-03-10 ES ES19213743T patent/ES2897660T3/es active Active
- 2016-03-10 CN CN201811199399.5A patent/CN109273015B/zh active Active
- 2016-03-10 IL IL307827A patent/IL307827A/en unknown
- 2016-03-10 MY MYPI2017703277A patent/MY184190A/en unknown
- 2016-03-10 KR KR1020227044962A patent/KR102585375B1/ko active IP Right Grant
- 2016-03-10 SG SG10201802002QA patent/SG10201802002QA/en unknown
- 2016-03-10 PL PL16709426T patent/PL3268961T3/pl unknown
-
2017
- 2017-08-29 IL IL254195A patent/IL254195B/en active IP Right Grant
- 2017-09-07 MX MX2020005843A patent/MX2020005843A/es unknown
- 2017-09-07 CL CL2017002268A patent/CL2017002268A1/es unknown
- 2017-10-27 AU AU2017251839A patent/AU2017251839B2/en active Active
-
2018
- 2018-07-19 US US16/040,243 patent/US10553232B2/en active Active
- 2018-08-03 JP JP2018146621A patent/JP6671429B2/ja active Active
- 2018-08-03 JP JP2018146625A patent/JP6671430B2/ja active Active
- 2018-11-09 AU AU2018260941A patent/AU2018260941B9/en active Active
- 2018-12-03 US US16/208,325 patent/US10262669B1/en active Active
-
2019
- 2019-02-04 AR ARP190100263A patent/AR114577A2/es active IP Right Grant
- 2019-02-04 AR ARP190100264A patent/AR114578A2/es active IP Right Grant
- 2019-02-04 AR ARP190100259A patent/AR114573A2/es active IP Right Grant
- 2019-02-04 AR ARP190100266A patent/AR114580A2/es active IP Right Grant
- 2019-02-04 AR ARP190100262A patent/AR114576A2/es active IP Right Grant
- 2019-02-04 AR ARP190100261A patent/AR114575A2/es active IP Right Grant
- 2019-02-04 AR ARP190100265A patent/AR114579A2/es active IP Right Grant
- 2019-02-04 AR ARP190100260A patent/AR114574A2/es active IP Right Grant
- 2019-02-04 AR ARP190100258A patent/AR114572A2/es active IP Right Grant
- 2019-02-06 US US16/269,161 patent/US10453468B2/en active Active
- 2019-06-19 ZA ZA2019/03963A patent/ZA201903963B/en unknown
- 2019-09-12 US US16/568,802 patent/US10734010B2/en active Active
- 2019-10-09 ZA ZA2019/06647A patent/ZA201906647B/en unknown
- 2019-12-10 US US16/709,435 patent/US10943595B2/en active Active
-
2020
- 2020-03-03 JP JP2020035671A patent/JP7038747B2/ja active Active
- 2020-07-17 US US16/932,479 patent/US11367455B2/en active Active
- 2020-11-23 AU AU2020277092A patent/AU2020277092B2/en active Active
-
2021
- 2021-01-21 US US17/154,495 patent/US11417350B2/en active Active
- 2021-09-17 ZA ZA2021/06847A patent/ZA202106847B/en unknown
-
2022
- 2022-03-08 JP JP2022035108A patent/JP7354328B2/ja active Active
- 2022-06-02 US US17/831,234 patent/US11842743B2/en active Active
- 2022-06-02 US US17/831,080 patent/US11664038B2/en active Active
- 2022-07-07 AU AU2022204887A patent/AU2022204887B2/en active Active
- 2022-09-08 ZA ZA2022/09998A patent/ZA202209998B/en unknown
-
2023
- 2023-01-11 JP JP2023002650A patent/JP7503666B2/ja active Active
- 2023-05-16 US US18/318,443 patent/US12094477B2/en active Active
- 2023-09-20 JP JP2023151835A patent/JP2023164629A/ja active Pending
-
2024
- 2024-04-11 US US18/633,112 patent/US20240355345A1/en active Pending
- 2024-05-10 AU AU2024203127A patent/AU2024203127B2/en active Active
- 2024-10-17 AU AU2024227418A patent/AU2024227418A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040078194A1 (en) * | 1997-06-10 | 2004-04-22 | Coding Technologies Sweden Ab | Source coding enhancement using spectral-band replication |
US6502069B1 (en) * | 1997-10-24 | 2002-12-31 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method and a device for coding audio signals and a method and a device for decoding a bit stream |
CN1484822A (zh) * | 2001-11-02 | 2004-03-24 | ���µ�����ҵ��ʽ���� | 编码装置和解码装置 |
EP1926084A2 (en) * | 2006-11-24 | 2008-05-28 | Fujitsu Limited | Decoding apparatus and decoding method |
CN102089808A (zh) * | 2008-07-11 | 2011-06-08 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、音频解码器、用于编码及解码音频信号的方法、音频流与计算机程序 |
CN102144259A (zh) * | 2008-07-11 | 2011-08-03 | 弗劳恩霍夫应用研究促进协会 | 用于产生带宽扩展输出数据的装置和方法 |
CN102687198A (zh) * | 2009-12-07 | 2012-09-19 | 杜比实验室特许公司 | 使用自适应混合变换的多声道音频编码比特流的解码 |
CN103971694A (zh) * | 2013-01-29 | 2014-08-06 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
WO2014118185A1 (en) * | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
Non-Patent Citations (2)
Title |
---|
CHONG KOK SENG,ET AL.: "Low power spectral band replication technology for the MPEG-4 audio standard", 《FOURTH INTERNATIONAL CONFERENCE ON INFORMATION, COMMUNICATIONS AND SIGNAL PROCESSING, 2003 AND THE FOURTH PACIFIC RIM CONFERENCE ON MULTIMEDIA. PROCEEDINGS OF THE 2003 JOINT》 * |
刘丹彤: "新型高保真宽带音频编码算法的研究和实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107408391B (zh) | 解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流 | |
CN110178180A (zh) | 用于音频信号的高频重建的谐波转置器的后向兼容集成 | |
JP7210658B2 (ja) | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 | |
TWI856342B (zh) | 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1259544 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TG01 | Patent term adjustment | ||
TG01 | Patent term adjustment |