ES2522171T3 - Aparato y método para procesar una señal de audio usando alineación de borde de patching - Google Patents
Aparato y método para procesar una señal de audio usando alineación de borde de patching Download PDFInfo
- Publication number
- ES2522171T3 ES2522171T3 ES11715452.6T ES11715452T ES2522171T3 ES 2522171 T3 ES2522171 T3 ES 2522171T3 ES 11715452 T ES11715452 T ES 11715452T ES 2522171 T3 ES2522171 T3 ES 2522171T3
- Authority
- ES
- Spain
- Prior art keywords
- limit
- extension
- frequency
- band
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 70
- 230000005236 sound signal Effects 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims description 66
- 230000017105 transposition Effects 0.000 claims abstract description 180
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 83
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 83
- 230000003595 spectral effect Effects 0.000 claims description 48
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 description 71
- 238000005070 sampling Methods 0.000 description 70
- 239000000523 sample Substances 0.000 description 34
- 238000004422 calculation algorithm Methods 0.000 description 18
- 239000003638 chemical reducing agent Substances 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- 230000001052 transient effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 239000004606 Fillers/Extenders Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000003292 diminished effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 235000020280 flat white Nutrition 0.000 description 2
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Networks Using Active Elements (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
Aparato que permite tratar una señal de audio para generar una señal de anchura de banda extendida que presenta una parte de altas frecuencias (102) y una parte de bajas frecuencias (104) con ayuda de los datos paramétricos (2302) para la parte de altas frecuencias (102), datos paramétricos relativos a las bandas de frecuencias (100, 101) de la parte de altas frecuencias (102), que comprende: un calculador de límite de extensión (2302) destinado a calcular un límite de extensión (1001c, 1002c, 1002d, 1003c, 1003b) entre una pluralidad de límites de extensión de manera que el límite de extensión coincida con un límite de las bandas de frecuencias (101, 100) de la parte de altas frecuencias (102); y un medio de extensión (2312) destinado a generar una señal extendida con ayuda de la señal de audio (2300) y del límite de extensión (1001c, 1002c, 1002b, 1003c, 1003b), en el que los límites de extensión se refieren a la parte de altas frecuencias (102) de la señal de anchura de banda extendida; en el cual el calculador de límite de extensión (2302) está configurado para: calcular (2520) una tabla de frecuencias que definen las bandas de frecuencias de la parte de altas frecuencias (102) con ayuda de los datos paramétricos o de otros datos de entrada de configuración; determinar (2522) un límite de extensión de síntesis diana con ayuda de al menos un factor de transposición; buscar (2524), en la tabla de frecuencias, una banda de frecuencias coincidente que presenta un límite coincidente que coincide con el límite de extensión de síntesis diana en un intervalo de coincidencias predeterminado, o buscar la banda de frecuencias que presenta un límite de banda de frecuencias la más cercana del límite de extensión de síntesis diana; y seleccionar (2525, 2527), como límite de extensión, el límite coincidente que coincide con el límite de extensión de síntesis diana en el intervalo de coincidencias predeterminado o el límite de banda de frecuencias más cercano del límite de extensión de síntesis diana encontrado durante la búsqueda (2524).
Description
[0001] El presente invento se refiere a sistemas de codificación de fuente de audio los cuales hacen uso de un método de transposición armónica para reconstrucción de alta frecuencia (HFR), y a procesadores de efecto digital, por ejemplo, los denominados excitadores, donde la generación de distorsión armónica agrega brillo a la señal procesada, y a extensores de tiempo, donde la duración de una señal es extendida mientras se mantiene el 10 contenido espectral de la original.
[0002] En la PCT WO 98/57436 se estableció el concepto de transposición como un método para recrear una banda 15 de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Se puede obtener un substancial ahorro en cantidad de bits transmitidos usando este concepto para codificación de audio. En un sistema de codificación de audio basado en HFR, una señal de ancho de banda bajo es procesada por un codificador por núcleo de forma de onda y las frecuencias más altas son regeneradas usando transposición e información lateral adicional de muy baja cantidad de bits transmitidos que describe la forma espectral blanco del lado del 20 decodificador. Para bajas cantidades de bits transmitidos, donde el ancho de banda de la señal codificada por un núcleo (core coded) es angosto, se hace cada vez más importante recrear una banda alta con características perceptualmente agradables. La transposición armónica definida en PCT WO 98/57436 funciona muy bien para material musical complejo en una situación con baja frecuencia de transición. El principio de una transposición armónica es que una sinusoide con frecuencia es mapeada a una sinusoide con frecuenciadonde es 25 un entero que define el orden de transposición. En contraste con esto, un método de HFR basado en modulación de banda lateral simple (SSB) mapea una sinusoide con frecuencia a una sinusoide con frecuenciadonde es un corrimiento de frecuencia fijo. Dada una señal núcleo con ancho de banda bajo, puede resultar un artefacto que suena disonante de la transposición SSB. T1T
30
[0003] Otro ejemplo para la regereneración de alta frecuencia se describe en WO 2009/078681.
[0004] Para lograr la mejor calidad de audio posible, los métodos de HFR armónica de alta calidad del estado actual de la técnica emplean bancos de filtros modulados complejos, por ejemplo, una Transformación de Fourier de Tiempo Corto (STFT), con resolución de alta frecuencia y un alto grado de sobre—muestreo para lograr la calidad de 35 audio requerida. La resolución fina es necesaria para evitar distorsión de intermodulación no deseada que aparece del procesamiento no lineal de sumas de sinusoides. Con suficientemente alta resolución de frecuencia, esto es, subbandas angostas, los métodos de alta calidad apuntan a tener un máximo de una sinusoide en cada subbanda. Se necesita un alto grado de sobre—muestreo en el tiempo para evitar un tipo de distorsión aliasing, y se necesita un cierto grado de sobre—muestreo en la frecuencia para evitar pre—ecos para señales con componente transitorio. 40 La desventaja obvia es que la complejidad computacional puede hacerse alta.
[0005] La transposición armónica basada en bloque subbanda es otro método de HFR usado para suprimir productos de intermodulación, en cuyo caso se emplea un banco de filtros con resolución de frecuencia gruesa y un menor grado de sobre—muestreo, por ejemplo, un banco QMF multicanal. En este método, un bloque de tiempo de 45 muestras de subbanda complejas es procesado por un modificador de fase común mientras la superposición de varias muestras modificadas forma una muestra de subbanda de salida. Esto tiene el efecto neto de suprimir productos de intermodulación que de otra manera aparecerían cuando la señal subbanda de entrada consta de varias sinusoides. La transposición basada en procesamiento de subbanda basado en bloques tiene mucho menor complejidad computacional que los medios de transposición de alta calidad y alcanza casi la misma calidad para 50 muchas señales. Sin embargo, la complejidad es todavía mucho más alta que para los métodos de HFR basados en SSB triviales, ya que se requiere una pluralidad de bancos de filtros de análisis, cada que procesa señales de diferentes órdenes de transposición T, en una típica aplicación de HFR para sintetizar el ancho de banda requerido. Adicionalmente, un enfoque común es adaptar la tasa de muestreo de las señales de entrada para ajustar bancos de filtros de análisis de un tamaño constante, aunque los bancos de filtros procesan señales de diferentes órdenes de 55 transposición. También es común aplicar filtros pasabanda a las señales de entrada para obtener señales de salida procesadas desde diferentes órdenes de transposición, con densidades espectrales que no se superponen.
[0006] El almacenamiento o la transmisión de señales de audio con frecuencia están sometidos a estrictas restricciones de cantidad de bits transmitidos. En el pasado, los codificadores eran forzados a reducir drásticamente 60 el ancho de banda de audio transmitido cuando sólo se disponía de una muy baja cantidad de bits transmitidos. Los modernos codificadores—decodificadores de audio hoy en día son capaces de codificar señales de banda ancha usando métodos de extensión de ancho de banda (BWE) [1—12]. Estos algoritmos se basan en una representación paramétrica del contenido de alta frecuencia (HF), que es generado a partir de la parte de baja frecuencia (LF) de la
señal decodificada mediante una transposición dentro de la región espectral de HF ("patching", es decir los “parches” de audio) y aplicación de un procesamiento posterior regido por parámetros. La parte de LF es codificada con cualquier codificador de audio o voz. Por ejemplo, los métodos de extensión de ancho de banda descritos en [1—4] se apoyan en modulación de banda lateral simple (SSB), que con frecuencia se denomina con el término método "copy—up", para generar los múltiples sectores de patching, es decir los parches de HF. 5
[0007] Últimamente se ha presentado un nuevo algoritmo, el cual emplea un banco de vocoders de fase [15—17] para la generación de los diferentes parches [13] (ver Figura 20). Este método ha sido desarrollado para evitar la aspereza auditiva que con frecuencia se observa en señales sometidas a extensión de ancho de banda SSB. A pesar de ser beneficioso para muchas señales tonales, este método llamado "extensión de ancho de banda 10 armónica" (HBE) es proclive a degradaciones de calidad de los componentes transitorios contenidos en la señal de audio [14], ya que no está garantizada la conservación de la coherencia vertical sobre subbandas en el algoritmo de vocoder de fase estándar y, asimismo, el re—cálculo de las fases tiene que ser realizado sobre bloques de tiempo de una transformación o, alternativamente de un banco de filtros. Por lo tanto, aparece una necesidad de un tratamiento especial para partes de señal que contienen componentes transitorios. 15
[0008] Sin embargo, la complejidad computacional es un asunto serio, debido a que el algoritmo de BWE es realizado sobre el lado del decodificador de una cadena de codificador–decodificador. Los métodos del estado actual de la técnica, especialmente la HBE basada en vocoder de fase viene a costo de una complejidad computacional muy incrementada comparado con los métodos basados en SSB. 20
[0009] Como se detalla arriba, los esquemas de extensión de ancho de banda existentes se aplican sólo un método de parcheo sobre un bloque de señal dado a la vez, ya sea parcheo basado en SSB [1—4] o parcheo basado en vocoder de HBE [15—17]. Adicionalmente, los modernos codificadores de audio [19—20] ofrecen la posibilidad de conmutar el método de parcheo globalmente sobre una base de bloque de tiempo entre esquemas de parcheo 25 alternativos.
[0010] El parcheo copy—up de SSB introduce asperezas no deseadas dentro de la señal de audio, pero es computacoinalmente simple y conserva la envolvente de tiempo de componentes transitorios. En codificadores—decodificadores de audio que emplean parcheo de HBE, la calidad de reproducción del componente transitorio es 30 frecuentemente por debajo de óptima. As, la complejidad computacional se incrementa significativamente sobre el método copy—up de SSB de complejidad computacional muy simple.
[0011] En lo que hace a reducción de complejidad, las tasas de muestreo son de particular importancia. Esto se debe al hecho de que una alta tasa de muestreo significa una alta complejidad y una baja tasa de muestreo 35 generalmente significa una baja complejidad debido al reducido número de operaciones requeridas. Por un lado, sin embargo, la situación en aplicaciones de extensión de ancho de banda es particularmente tal que la tasa de muestreo de la señal de salida de codificador por núcleo típicamente será tan bajo que esta tasa de muestreo es demasiado baja para una señal de ancho de banda completa. Dicho de otro modo, cuando la tasa de muestreo de la señal de salida del decodificador es, por ejemplo, 1 o 2,5 veces la frecuencia máxima de la señal de salida del 40 codificador por núcleo, entonces una extensión de ancho de banda, por ejemplo, por un factor 2, significa que se requiere una operación de muestreo hacia arriba de modo que la tasa de muestreo de la señal extendida en ancho de banda sea tan alto que el muestreo puede "cubrir" las componentes de alta frecuencia adicionalmente generadas.
[0012] Adicionalmente, los bancos de filtros tales como bancos de filtros de análisis y bancos de filtros de síntesis, 45 son responsables de una considerable cantidad de operaciones de procesamiento. Por ende, el tamaño de los bancos de filtros, esto es, si el banco de filtros es un banco de filtros de 32 canales, un banco de filtros de 64 canales o incluso un banco de filtros con un mayor número de canales, influirá significativamente en la complejidad del algoritmo de procesamiento de audio. En general, uno pude decir que un alto número de canales de banco de filtros requiere más operaciones de procesamiento y, por lo tanto, mayor complejidad que un pequeño número de 50 canales de banco de filtros. En vista de esto, en aplicaciones de extensión de ancho de banda y también en otras aplicaciones de procesamiento de audio, donde los diferentes tasas de muestreo son un tema, tal como en aplicaciones de tipo vocoder o cualquier otra aplicación de efecto de audio, hay una interdependencia específica entre complejidad y tasa de muestreo o ancho de banda de audio, lo cual significa que las operaciones de muestreo hacia arriba o filtrado subbanda pueden mejorar drásticamente la complejidad sin influir específicamente la calidad 55 de audio en un buen sentido cuando se eligen algoritmos o herramientas de software inadecuados para las operaciones específicas.
[0013] En el contexto de extensión de ancho de banda, se usan conjuntos de datos paramétricos para realizar un ajuste de envolvente espectral y para realizar otras manipulaciones a una señal generada mediante una operación 60 de parcheo, esto es, mediante una operación que toma algunos datos del rango fuente, esto es de la porción de banda baja de la señal extendida en ancho de banda que está disponible en la entrada del procesador de extensión de ancho de banda y luego mapea estos datos a un rango de alta frecuencia. El ajuste de envolvente espectral puede tener lugar antes de realmente mapear la señal de banda baja al rango de alta frecuencia o subsiguientemente a haber mapeado el rango de la fuente al rango de alta frecuencia. 65
[0014] Típicamente, los conjuntos de datos paramétricos son provistos con una cierta resolución de frecuencia, esto es, datos paramétricos refieren a bandas de frecuencia de la parte de frecuencia alta. Por el otro lado, el parcheo de la banda baja a la banda alta, esto es, cuáles rangos de fuente son usados para obtener cuáles rangos blanco o de alta frecuencia, es una operación independiente de la resolución, en la cual los conjuntos datos paramétricos están dados con respecto a la frecuencia. El hecho de que los datos paramétricos transmitidos son, en un sentido, 5 independientes de lo que realmente se usa como algoritmo de parcheo, es un rasgo importante, ya que esto permite gran flexibilidad del lado del decodificador, esto es, cuando se trata de la implementación del procesador de extensión de ancho de banda. Aquí se pueden usar diferentes algoritmos de parcheo pero se debe realizar uno y el mismo ajuste de envolvente espectral. Dicho de otro modo, el procesador de reconstrucción de frecuencia alta o el procesador de ajuste de envolvente espectral en una aplicación de extensión de ancho de banda no necesitan tener 10 información sobre el algoritmo de parcheo aplicado para realizar el ajuste de envolvente espectral.
[0015] Una desventaja de este procedimiento, sin embargo, es que puede ocurrir una mala alineación entre las bandas de frecuencia para las cuales se proveen los conjuntos de datos paramétricos por un lado, y los bordes espectrales de un parche por el otro. Particularmente en situaciones donde la energía espectral cambia mucho en la 15 vecindad de un borde de parche, pueden aparecer artefactos, específicamente en esta región, los cuales degradas la calidad de la señal extendida en ancho de banda.
SÍNTESIS DEL INVENTO
20
[0016] Es un objetivo del presente invento proveer un concepto mejorado del procesamiento de audio que permita buena calidad de audio.
[0017] Este objetivo se alcanza con un aparato para procesar una señal de audio de acuerdo con la reivindicación 1, un método para procesar una señal de audio de alta frecuencia de acuerdo con la reivindicación 12 o un programa 25 de computadora de acuerdo con la reivindicación 13.
[0018 ] El presente invento es particularmente útil por el hecho de que se evitan los artefactos que aparecen por bordes de parches mal alineados por un lado, y por otro, las bandas de frecuencia para datos paramétricos. En cambio, debido a la perfecta alineación, incluso señales fuertemente cambiantes o señales que tienen porciones 30 fuertemente cambiantes en la región del borde de parche, son sometidas a extensión de ancho de banda con una buena calidad.
[0019] Asimismo, el presente invento es ventajoso por el hecho de que no obstante permite alta flexibilidad debido al hecho de que el codificador no tiene que tratar con un algoritmo de parcheo a ser aplicado del lado de decodificador. 35 Se mantiene la independencia entre parcheo por un lado, y ajuste de envolvente espectral, esto es, usar los datos paramétricos generados por el codificador de extensión de ancho de banda por el otro, y permite la aplicación de diferentes algoritmos de parcheo o incluso una combinación de diferentes algoritmos de parcheo. Esto es posible ya que la alineación de borde de parche asegura que en el extremo los datos de parche por un lado y los conjuntos de datos paramétricos por el otro, coincidan entre sí con respecto a las bandas de frecuencia, las cuales también son 40 denominadas bandas de factor de escala.
[0020] Dependiendo de los bordes de parche calculados, los cuales pueden relacionarse por ejemplo, con el rango blanco, esto es, la pare de alta frecuencia de la señal extendida en ancho de banda finalmente extendida, se calculan los correspondientes rangos de fuente para determinar los datos de fuente de parche forman la porción de 45 banda baja de la señal de audio. Resulta que se requiere sólo un cierto (pequeño) ancho de banda de la porción de banda baja de la señal de audio debido al hecho de que en algunas realizaciones se aplican factores de transposición armónica. Por lo tanto, para extraer en forma eficiente esta porción de la señal de audio de banda baja, se usa una estructura de banco de filtros de análisis específica que se basa bancos de filtros individuales en cascada. 50
[0021] Tales realizaciones se basan en una ubicación en cascada específica de bancos de filtros de análisis y/o síntesis para obtener un re—muestreo de baja complejidad sin sacrificar calidad de audio. En una realización, un aparato para procesar una señal de audio de entrada comprende un banco de filtros de síntesis para sintetizar una señal intermedia de audio a partir de la señal de audio de entrada, donde la señal de audio de entrada está 55 representadas por una pluralidad de primeras señales subbanda generadas por un banco de filtros de análisis colocado en la dirección de procesamiento antes del banco de filtro de síntesis, en donde un número de canales de banco de filtros del banco de filtros de síntesis es más pequeño que un número de canales del banco de filtros de análisis. La señal intermedia es procesada asimismo mediante un banco de filtros de análisis adicional para generar una pluralidad de segundas señales subbanda a partir de la señal intermedia de audio, en donde el banco de filtros 60 de análisis adicional tiene un número de canales que es diferente del número de canales del banco de filtros de síntesis de modo que una tasa de muestreo de una señal subbanda de la pluralidad de señales subbanda es diferente de una tasa de muestreo de una primera señal subbanda de la pluralidad de primeras señales subbanda generadas mediante el banco de filtros de análisis.
65
[0022] La cascada de un banco de filtros de síntesis y un banco de filtros de análisis adicional conectado subsiguientemente provee una conversión de tasa de muestreo y adicionalmente una modulación de la porción de ancho de banda de la señal de audio de entrada original que ha sido ingresada al banco de filtros de síntesis a una banda de base. Esta señal intermedia de tiempo, que ahora ha sido extraída de la señal de audio de entrada original la cual puede ser, por ejemplo, la señal de salida de un decodificador por núcleo de un esquema de extensión de 5 ancho de banda, ahora es representada preferiblemente como una señal muestreada críticamente modulada a la banda de base, y se halló que esta representación, es decir, la señal de salida re—muestreada, cuando está siendo procesada por un banco de filtros de análisis adicional para obtener una representación subbanda permite un procesamiento de baja complejidad de operaciones de procesamiento adicionales que pueden ocurrir o no, y que pueden ser, por ejemplo, operaciones de procesamiento relacionado con extensión de ancho de banda tales como 10 operaciones de subbanda no lineales seguidas por procesamiento de reconstrucción de alta frecuencia y por una fusión de subbandas en el banco de filtros de síntesis final.
[0023] La presente solicitud provee diferentes aspectos de aparatos, métodos o programas de computadora para procesar señales de audio en el contexto de extensión de ancho de banda y en el contexto de otras aplicaciones de 15 audio, las cuales no están relacionadas con extensión de ancho de banda. Los rasgos de los aspectos individuales subsiguientemente descritos y reivindicados pueden ser parcial o totalmente combinados, pero también pueden ser usados separadamente uno de otro, ya que los aspectos individuales ya proveen ventajas con respecto a la calidad perceptual, la complejidad computacional y los recursos de procesador/memoria cuando son implementados en un sistema de computadora o microprocesador. 20
[0024] Realizaciones proveen un método para reducir la complejidad computacional de un método de HFR armónica basado en bloque subbanda por medio de eficiente filtrado y conversión de tasa de muestreo de las señales de entrada a las etapas de análisis de banco de filtros de HFR. Además, se puede mostrar que los filtros pasabanda aplicados a las señales de entrada son obsoletos en una medios de transposición basado en bloque subbanda. 25
[0025] Las presentes realizaciones ayudan a reducir la complejidad computacional de la transposición armónica basad en bloque subbanda implementando en forma eficiente varios órdenes de transposición basada en bloque subbanda en el marco de un solo par de banco de filtros de análisis y síntesis. Dependiendo de la solución de compromiso de calidad perceptual en función de complejidad computacional, se puede realizar sólo un subconjunto 30 de órdenes o todos los órdenes de transposición conjuntamente dentro de un par de bancos de filtros. Asimismo, un esquema de transposición combinada donde sólo se calculan directamente ciertos órdenes de transposición mientras el ancho de banda restante es filtrado mediante replicación de órdenes de transposición disponibles, esto es, calculados previamente (por ejemplo, 2º orden) y/o el ancho de banda codificado por núcleo. En este caso el parcheado puede ser llevado a cabo usando toda combinación concebible de rangos de fuente disponibles para 35 replicación.
[0026] Adicionalmente, hay realizaciones que proveen un método para mejorar tanto métodos de HFR armónica de alta calidad como métodos de HFR armónica basada en bloque subbanda por medio de alineación espectral de herramientas de HFR. En particular se alcanza mayor rendimiento alineando los bordes espectrales de las señales 40 generadas por HFR a bordes espectrales de la tabla de frecuencia de ajuste de envolvente. Además, los bordes espectrales de la herramienta limitadora son alineados mediante el mismo principio a los bordes espectrales de las señales generadas por HFR.
[0027] Otras realizaciones está configuradas para mejorar la calidad perceptual de componentes transitorios y 45 reduciendo al mismo tiempo complejidad computacional, por ejemplo, mediante aplicación de un esquema de parcheo que aplica un parcheo mixto que consta de parcheo armónico y parcheo copy—up. En realizaciones específicas, los bancos de filtros individuales de la estructura de banco de filtro en cascada son bancos de filtro de espejo en cuadratura (QMF), los cuales se basan en un filtro prototipo pasabajos o ventana modulada usando un conjunto de frecuencias de modulación que definen las frecuencias centrales de los canales de banco de filtros. 50 Preferiblemente, todas las funciones de ventana o filtros prototipo dependen entre sí de una manera tal que los filtros de los bancos de filtros son diferentes tamaños (canales de banco de filtro) también dependen entre sí. Preferiblemente, el banco de filtros más grande es una estructura en cascada de bancos de filtros que comprende, en realizaciones, un primer banco de filtros de análisis, una subsiguiente banco de filtros conectados, un banco de filtros de análisis adicional y en algún estado posterior de procesamiento, un banco de filtros de síntesis final, tiene 55 una función de ventana o respuesta de filtro prototipo que tiene un cierto número de coeficientes de función ventana o filtro prototipo. Los bancos de filtros de tamaños más menores son todas versiones sub—muestreadas de esta función ventana, lo cual significa que las funciones ventana para los otros bancos de filtros son versiones sub—muestreadas de la función ventana "grande". Por ejemplo, si un banco de filtros tiene la mitad del tamaño del banco de filtros grande, entonces la función ventana tiene la mitad del número de coeficientes, y los coeficientes de los 60 bancos de filtros de tamaño menor son derivados mediante sub—muestreo. En esta situación, el sub—muestreo significa que, por ejemplo, para el banco de filtros más pequeño que tiene la mitad del tamaño, se toma cada segundo coeficiente de filtro. Sin embargo, cuando hay otras relaciones entre los tamaños de banco de filtros que no son valores enteros, entonces, se realiza un cierto tipo de interpolación de los coeficientes de ventana de modo que al final la ventana del banco de filtros más pequeño de nuevo es una versión sub—muestreada de la ventana del 65 banco de filtros más grande.
[0028] Unas realizaciones del presente invento son particularmente útiles en situaciones donde sólo se requiere una porción de la señal de audio de entrada para ulterior procesamiento, y esta situación aparece particularmente en el contexto de extensión de ancho de banda armónica. En este contexto se prefieren particularmente operaciones de procesamiento tipo vocoder. 5
[0029] Es una ventaja en algunas realizaciones que las realizaciones proveen una menor complejidad para un medio de transposición de QMF mediante operaciones eficientes en el dominio del tiempo y de la frecuencia y una mejor calidad de audio para replicación de banda espectral armónica basada en QMF y DFT usando alineación espectral.
10
[0030] Algunas realizaciones se refieren a sistemas de codificación de fuente de audio que emplean, por ejemplo, un método de transposición armónica basada en bloque subbanda para reconstrucción de alta frecuencia (HFR), y a procesadores de efecto digital, por ejemplo, los denominados excitadores, donde la generación de distorsión armónica agrega brillo a la señal procesada, y a extensores de tiempo, donde la duración de una señal es extendida mientras se mantiene el contenido espectral de la original. Realizaciones proveen un método para reducir la 15 complejidad computacional de un método de HFR armónica basado en bloque subbanda por medio de eficiente filtrado y conversión de tasa de muestreo de las señales de entrada antes de las etapas de análisis de banco de filtros de HFR. Además, hay realizaciones que muestran que los filtros pasabanda convencionales aplicados a las señales de entrada son obsoletos en un sistema de HFR basado en bloque subbanda. Adicionalmente, hay realizaciones que proveen un método para mejorar tanto métodos de HFR armónica de alta calidad como métodos 20 de HFR armónica basada en bloque subbanda por medio de alineación espectral de herramientas de HFR. En particular, hay realizaciones que enseñan cómo se alcanza mayor rendimiento alineando los bordes espectrales de las señales generadas por HFR a bordes espectrales de la tabla de frecuencia de ajuste de envolvente. Además, los bordes espectrales de la herramienta limitadora son alineados mediante el mismo principio a los bordes espectrales de las señales generadas por HFR. 25
[0031] Ahora se describirá el presente invento por medio de ejemplos ilustrativos con referencia a los dibujos acompañantes, en los cuales: 30
la Figura 1 ilustra el funcionamiento de un medio de transposición basado en bloque usando órdenes de transposición 1, 3 y 4 en un marco de decodificador mejorado de HFR;
la Figura 2 ilustra el funcionamiento de las unidades de estiramiento subbanda no lineal de la Figura 1; 35
la Figura 3 ilustra una implementación eficiente del medio de transposición basado en bloque de la Figura 1, donde los re—muestreadores y filtros pasabanda que preceden el bando de filtros de análisis de HFR están implementados usando re—muestreadores del dominio del tiempo multi—tasa y filtros pasabanda basados en QMF;
40
la Figura 4 ilustra un ejemplo de construir bloques para una eficiente implementación de un re—muestreador del dominio del tiempo multi—tasa de la Figura 3;
las Figuras 5a—5f ilustran el efecto de una señal ejemplar procesada por los diferentes bloques de la Figura 4 para un orden de transposición de 2; 45
la Figura 6 ilustra una implementación eficiente del medio de transposición basado en bloque de la Figura 1, donde los re—muestreadores y filtros pasabanda que preceden el bando de filtros de análisis de HFR están reemplazados por pequeños bancos de filtros de síntesis sub—muestreados que funcionan sobre subbandas seleccionadas de un banco de filtros de análisis de 32 bandas; 50
la Figura 7 ilustra el efecto de una señal ejemplar procesada por un banco de filtros de síntesis sub—muestreado de la Figura 6 para un orden de transposición de 2;
las Figuras 8a—8f ilustran los bloques de implementación de un reductor de la tasa de muestreo del dominio del 55 tiempo multi—tasa eficiente, de dos un factor 2;
las Figuras 9a—9e ilustran los bloques de implementación de un reductor de la tasa de muestreo o del dominio del tiempo multi—tasa eficiente, de dos un factor 3/2;
60
la Figura 10 ilustra la alineación de bordes espectrales de las señales del medio de transposición de HFR a los bordes de las bandas de frecuencia de ajuste de envolvente en un codificador mejorado de HFR;
la Figura 11 ilustra un escenario donde emergen artefactos debido a bordes espectrales de las señales del medio de transposición de HFR desalineados; 65
la Figura 12 ilustra un escenario donde los artefactos de la Figura 11 son evitados como resultado de bordes espectrales de las señales de medio de transposición de HFR alineados;
la Figura 13 ilustra la adaptación de bordes espectrales en la herramienta limitadora a los bordes espectrales de las señales del medio de transposición de HFR; 5
la Figura 14 ilustra el principio de transposición armónica basada en bloque subbanda;
la Figura 15 ilustra un escenario de ejemplo para la aplicación de transposición basada en bloque subbanda usando varios órdenes de transposición en un codificador—decodificador de audio mejorado de HFR; 10
la Figura 16 ilustra un escenario de ejemplo del arte previo para la operación de una transposición basada en bloque subbanda de múltiples órdenes aplicando un banco de filtros de análisis separado por cada orden de transposición;
la Figura 17 ilustra un escenario de ejemplo inventivo para la operación eficiente de una transposición basada en 15 bloque subbanda de múltiples órdenes aplicando un único banco de filtros de análisis QMF de 64 bandas;
la Figura 18 ilustra otro ejemplo para formar un procesamiento a modo de señal subbanda;
la Figura 19 ilustra un parcheo de modulación de banda lateral simple (SSB) 20
la Figura 20 ilustra un parcheo de extensión de ancho de banda armónica (HBE)
la Figura 21 ilustra un parcheo mixto, donde el primer parcheo es generado desparramando frecuencia y el segundo parche es generado mediante copy—up de SSB de una porción de baja frecuencia; 25
la Figura 22 ilustra un parcheo mixto alternativo utilizando el primer parcho de HBE para una operación de copy—up SSB para generar un segundo parche;
la Figura 23 ilustra un visión general de un aparato para procesar una señal de audio usando alineación de banda 30 espectral de acuerdo con una realización;
La Figura 24a ilustra una implementación preferida del calculador de borde de parche de la Figura 23.
la Figura 24b ilustra otra visión general de una secuencia de pasos realizados por realizaciones del invento; 35
la Figura 25a ilustra un diagrama de bloques que ilustra más detalles del calculador de borde de parche y más detalles sobre el ajuste de envolvente espectral en el contexto de la alineación de bordes de parches;
la Figura 25b ilustra un diagrama lógico para el procedimiento indicado en la Figura 24a como un pseudo código; 40
la Figura 26 ilustra una visión general del marco de trabajo en el contexto de procesamiento de extensión de ancho de banda; y
la Figura 27 ilustra una implementación preferida de un procesamiento de señales subbanda entregadas por el 45 banco de filtros de análisis adicional de la Figura 23.
[0032] Las realizaciones que se describen abajo son meramente ilustrativas y pueden proveer una complejidad 50 inferior de un medio de transposición QMF mediante operaciones eficientes en el dominio del tiempo y de la frecuencia, y calidad de audio mejorada de ambos, SBR armónico basado QMF y DFT, mediante alineación espectral. Se entiende que las modificaciones y variaciones posibles de las disposiciones y de los detalles descritos en la presente serán evidentes para los expertos en la materia. Por lo tanto, es la intención que el invento esté limitado sólo por el alcance de las siguientes reivindicaciones de patente y no por los detalles específicos 55 presentados por la descripción y la explicación de las realizaciones en la presente.
[0033] La Figura 23 ilustra una realización de un aparato para procesar una señal de audio 2300 para generar una señal extendida en ancho de banda que tiene una parte de alta frecuencia y una parte de baja frecuencia, usando datos paramétricos para la parte de alta frecuencia, donde los datos paramétricos se relacionan con bandas de 60 frecuencia de la parte de alta frecuencia. El aparato comprende un calculador de borde de parche 2302 para calcular un borde de parche preferiblemente usando un borde de parche blanco 2304 que no coincide con un borde de banda de frecuencia de la banda de frecuencia. La información 2306 sobre las bandas de frecuencia de la parte de alta frecuencia puede ser tomada, por ejemplo, de una transmisión de datos codificada adecuada para extensión de ancho de banda. En una realización adicional, el calcular de borde parche no sólo calcula un borde de parche simple 65 para una solo parche sino que calcula varios bordes de parche para un varios diferentes parches que pertenecen a
diferentes factores de transposición, donde la información sobre los factores de transposición son provistos al calculador de borde de parche 2302 como se indica en 2308. El calculador de borde de parche está configurado para calcular los bordes de parche de modo un borde de parche coincida con un borde de banda de frecuencia de las bandas de frecuencia. Preferiblemente, cuando el calculador de borde de parche recibe información 2304 sobre un borde parche blanco, entonces el calculador de borde de parche es configurado para poner el borde de parche 5 diferente del borde de parche blanco para obtener la alineación. El calculador de borde de parche entrega los bordes de parche calculados, los cuales son diferentes de los bordes de parche blanco, en la línea 2310 a un parcheador 2312. El parcheador 2312 genera una señal parcheada o varias señales parcheadas en la salida 2314 usando la señal de audio de banda baja 2300 y los bordes de parche 2310, y en las realizaciones donde se realizan múltiples transposiciones, usando los factores de transposición sobre la línea 2308. 10
[0034] La tabla de la Figura 23 ilustra un ejemplo numérico para ilustrar el concepto básico. Por ejemplo, cuando se supone que la señal de audio de banda baja tiene una porción de baja frecuencia que se extiende desde 0 hasta 4 kHz (es claro que el rango fuente no empieza realmente en 0 Hz sino cerca de 0, tal como en 20 Hz). Asimismo, es la intención del usuario realizar una extensión de ancho de banda de la señal de 4 kHz a una señal extendida en 15 ancho de banda de 16 kHz. Adicionalmente, el usuario ha indicado que el usuario desea realizar una extensión de ancho de banda usando tres parches armónicos con factores de transposición 2, 3 y 4. Entonces, los bordes blanco de los parches pueden ser puestos a un primer parche que se extiende desde 4 hasta 8 kHz, un segundo parche que se extiende desde 8 hasta 12 kHz y un tercer parche que se extiende desde 12 hasta 16 kHz. Así, los bordes de parche son 8, 12 y 16 cuando se supone que no se cambia el primer borde de parche que coincide con la frecuencia 20 máxima o de transición de la señal de banda de frecuencia baja. Sin embargo, cambiar este borde del primer parche también está dentro de las realizaciones del presente invento si se requiere. Los bordes blanco corresponderían a un rango fuente de 2 a 4 kHz para el factor de transposición 1, 2,66 a 4 kHz para el factor de transposición de 3, y 3 a 4 kHz para el factor de transposición de 4. Específicamente, el rango fuente es calculando dividiendo los bordes blanco por el factor de transposición realmente usado. 25
[0035] Para el ejemplo de la Figura 23 se supone que los bordes 8, 12, 16 no coinciden con los bordes de banda de frecuencia de las bandas de frecuencia a las cuales se relacionan los datos paramétricos de entrada . Por den, el calculador de borde de parche calcula bordes de parche alineados y no aplican inmediatamente los bordes blanco. Esto puede dar por resultado un borde de parche superior de 7,7 kHz para el primer parche, un borde superior de 30 11,9 kHz para el segundo parche y 15,8 kHz para el borde superior para el tercer parche. Entonces, usando el factor de transposición de nuevo para el parche individual, se calculan ciertos rangos fuente "ajustados" y se usan para parcheo, los cuales están indicados en la Figura 23 en forma ejemplar.
[0036] A pesar de que se ha expresado que los rangos fuente son cambiados junto con los rangos blanco, para 35 otras implementaciones uno también podría manipular el factor de transposición y mantener el rango fuente o los bordes blanco o para otras aplicaciones uno incluso podría cambiar el rango fuente y el factor de transposición para finalmente arriba a bordes de parche ajustados los cuales coinciden con bordes de banda de frecuencia de las bandas de frecuencia a las cuales se relacionan los datos de extensión de ancho de banda paramétricos que describen la envolvente espectral de la porción de banda alta de la señal original. 40
[0037] La Figura 14 ilustra el principio de transposición basada en bloque subbanda. La señal del dominio del tiempo de entrada es alimentada a un banco de filtros de análisis 1410 el cual provee una multitud de señales subbanda de valor complejo. Estas son alimentadas a la unidad de procesamiento subbanda 1402. La multitud de subbandas de salida de valor complejo es alimentada al banco de filtros de síntesis 1403, el cual a su vez entrega la 45 señal del dominio del tiempo modificada. La unidad de procesamiento subbanda 1402 realiza operaciones de procesamiento subbanda basadas en bloque no lineal tal que la señal del dominio del tiempo modificada es una versión transpuesta de la señal de entrada correspondiente a un orden de transposición . La noción de un procesamiento subbanda basado en bloque se define comprendiendo operaciones no lineales sobre bloques de más que una muestra subbanda a un tiempo, donde los bloques subsiguientes son ventaneados y sumados en 50 superposición para generar las señales subbanda de salida. 1T
[0038] Los bancos de filtros 1401 y 1403 pueden ser cualquier tipo modulado exponencial complejo tal como QMF o un DFT ventaneado. Pueden ser apilados de manera par o impar en la modulación y pueden ser definidos a partir de un amplio rango de filtros prototipo o ventanas. Es importante conocer el cociente de los siguientes dos 55 parámetros de banco de filtros, medidos en unidades físicas. /SAff
: el espaciamiento subbanda de frecuencia del banco de filtros de análisis 1401; Af
: el espaciamiento subbanda de frecuencia del banco de filtros de síntesis 1403. 60 Sf
[0039] Para la configuración del procesamiento subbanda 1402 es necesario hallar la correspondencia entre índices subbanda fuente y blanco. Se observa que una sinusoide de entrada de frecuencia física dará por resultado que
ocurre una contribución principal en subbandas de entrada con índice. Una sinusoide de salida de la frecuencia física transpuesta deseada resultará de alimentar la subbanda de síntesis con índice . Por ende, los apropiados valores de índice subbanda fuente del procesamiento subbanda part un dado índice subbanda blanco deben obedecer /AnfT/SmTfm
5
. (1) 1SAfnmfT
[0040] La Figura 15 ilustra un escenario de ejemplo para la aplicación de transposición basada en bloque subbanda usando varios órdenes de transposición en un codificador—decodificador de audio mejorado de HFR. Una serie de bits en el tiempo transmitidos, es recibida en el decodificador por núcleo 1501, el cual provee una señal de núcleo 10 decodificada de ancho de banda bajo a una frecuencia de muestreo fs. La frecuencia baja es re—muestreada a la frecuencia de muestreo de salida 2fs por medio de un banco de análisis QMF de 32 bandas modulado complejo 1502 seguido por un banco de síntesis QMF de 64 bandas (QMF inverso) 1505. Los dos bancos de filtros 1502 y 1505 tienen los mismos parámetros de resolución física y la unidad de procesamiento de HFR 1504 simplemente deja pasar las subbandas inferiores no modificadas correspondientes a la señal núcleo de ancho de 15 banda baja. El contenido de alta frecuencia de la señal de salida se obtiene alimentando las subbandas superiores del banco de síntesis QMF de 64 bandas 1505 con las bandas de salida de la unidad transponedora múltiple 1503, sometidas a modelado y modificación espectral realizados mediante la unidad de procesamiento de HFR 1504. El transponedor múltiple 1503 toma como entrada la señal núcleo decodificada y entrega una multitud de señales subbanda las cuales representan el análisis de banda OMF de 64 de una superposición o combinación de varios 20 componentes de señal transpuestos. El objetivo es que si se saltea el procesamiento de HFR, cada componente corresponda a una transposición física entera de la señal núcleo, (). SAff2,3,T
[0041] la Figura 16 ilustra un escenario de ejemplo del arte previo para la operación de una transposición basada en bloque subbanda de múltiples órdenes 1603 aplicando un banco de filtros de análisis separado por cada orden de 25 transposición. Aquí se han de producir y suministrar tres órdenes de transposición en el dominio de un QMF de 64 bandas que funciona a tasa de muestreo de salida 2fs. La unidad de fusión 1604 simplemente selecciona y combina las subbandas relevantes de cada rama de factor de transposición en una sola multitud de subbandas de QMF a ser alimentadas en la unidad de procesamiento de HFR. 2,3,4T
30
[0042] Considere primero el caso . El objetivo es específicamente que la cadena de procesamiento de un análisis de QMF de 64 bandas 1602—2, una unidad de procesamiento subbanda 1603—2 y una síntesis de QMF de 64 bandas 1505 resulte en una transposición física de . Identificando estos tres bloques con 1401, 1402 y 1403 de la Figura 14, uno encuentra que y tal que (1) da por resultado la especificación para 1603—2 que la correspondencia entre subbandas fuente y blanco está dada por . 35 2T2T/2SAffnmnm
[0043] Para el caso , el sistema ejemplar incluye un convertidor de tasa de muestreo 1601—3 el cual reduce la tasa de muestreo de entrada mediante un factor 3/2 desde fs a 2fs/3. El objetivo es específicamente que la cadena de procesamiento de un análisis de QMF de 64 bandas 1602—3, la unidad de procesamiento subbanda 1603—3 y una síntesis de QMF de 64 bandas 1505 resulte en una transposición física de . Identificando 40 estos tres bloques con 1401, 1402 y 1403 de la Figura 14, uno encuentra debido al re—muestreo, que ,tal que (1) provee la especificación para 1603—3, donde la correspondencia entre subbandas fuente y blanco nuevamente está dada por . 3T3T/3SAff
[0044] Para el caso , el sistema ejemplar incluye un convertidor de tasa de muestreo 1601—4 el cual reduce 45 la tasa de muestreo de entrada mediante un factor dos desde fs a fs/2. El objetivo es específicamente que la cadena de procesamiento de un análisis de QMF de 64 bandas 1602—4, la unidad de procesamiento subbanda 1603—4 y una síntesis de QMF de 64 bandas 1505 resulte en una transposición física de . Identificando estos tres bloques con 1401, 1402 y 1403 de la Figura 14, uno encuentra debido al re—muestreo, que ,tal que (1) provee la especificación para 1603—4, donde la correspondencia entre subbandas fuente y blanco 50 también está dada por . 4T4T/4SAff
[0045] La Figura 17 ilustra un escenario de ejemplo inventivo para la operación eficiente de una transposición basada en bloque subbanda de múltiples órdenes aplicando un único banco de filtros de análisis QMF de 64 bandas. En realidad, el uso de tres bancos de análisis QMF separados y dos convertidores de tasa de muestreo en la Figura 55 16 da por resultado una complejidad computacional bastante alta, así como también algunas desventajas de implementación por procesamiento basado en cuadro debido a la conversión de tasa de muestre 1601—3. Las realizaciones actuales enseñan reemplazar las dos ramas 1601—3 → 1602—3 → 1603—3 y 1601—4 → 1602—4 →
1603—4 por el procesamiento subbanda 1703—3 y 1703—4, respectivamente, mientras la rama 1602—2 → 1603—2 se mantiene sin cambio en comparación con la Figura 16. Los tres órdenes de transposición ahora tendrán que ser realizados en un dominio de banco de filtros con referencia a la Figura 14, donde . Para el caso , la especificación para 1703—3 dada por (1) es que la correspondencia entre subbandas fuente y blanco está dada por . Para el caso , las especificaciones para 1703—4 dadas por (1) son que la 5 correspondencia entre subbandas fuente y blanco está dada por . Para reducir adicionalmente la complejidad, algunos órdenes de transposición pueden ser generados copiando órdenes de transposición ya calculados o la salida del decodificador por núcleo. /2SAff3T2/3nm4T2nm
[0046] La Figura 1 ilustra el funcionamiento de un medio de transposición basado en bloque subbanda que usa los 10 órdenes de transposición de 2, 3, y 4 en un marco de trabajo de decodificador de HFR mejorado, tal como SBR [ISO/IEC 14496—3:2009, "Tecnología de información — Codificación de objetos audio—visuales" ("Information technology – Coding of audio—visual objects") – Parte 3: Audio]. La serie de bits en el tiempo (bitstream) es decodificada al dominio del tiempo mediante el decodificado por núcleo 101 y se la hace pasar al módulo de HFR 103, el cual genera una señal de alta frecuencia a partir de la señal núcleo de banda base. Después de la 15 generación, la señal generada por la HFR es ajustada dinámicamente para coincidir con la señal original lo más cercanamente posible por medio de información lateral transmitida. Este ajuste es realizado por el procesador de HFR 105 sobre señales subbanda, obtenida de uno o varios bancos de análisis QMF. Un escenario típico es donde el decodificador por núcleo funciona sobre una señal del dominio del tiempo muestreada a la mitad de la frecuencia de las señales de entrada y salida, esto es el módulo de decodificador HFR efectivamente re—muestreará la señal 20 núcleo al doble de la frecuencia de muestreo. Esta conversión de tasa de muestreo usualmente es obtenida mediante el primer paso de filtrar la señal de codificador por núcleo por medio de un banco de análisis QMF de 32 bandas, 102. Las subbandas por debajo de la denominada frecuencia de transición, esto es el subconjunto inferior de las 32 subbandas que contiene toda la energía de señal de codificador por núcleo, son combinadas con el conjunto de subbandas que portan la señal generada en la HFR. Usualmente, el número de subbandas así 25 combinadas es 64, lo cual, después de filtrar a través del banco de síntesis QMF 106, resulta en una señal de codificador por núcleo de tasa de muestreo convertido combinada con la salida del módulo de HFR.
[0047] En el medio de transposición basado en bloque subbanda del módulo de HFR 103, se han de producir y suministrar tres órdenes de transposición T = 2, 3 y 4, en el dominio de un QMF de 64 bandas que funciona a una 30 tasa de muestreo de salida de 2fs. La señal del dominio del tiempo de entrada es filtrada pasabanda en los bloques 103—12, 103—13 y 103—14. Esto se hace para hacer que las señales de salida sean procesadas por los diferentes órdenes de transposición, para tener contenidos espectrales que no se superponen. Se reduce más la tasa de muestreo de las señales (103—23, 103—24) para adaptar la tasa de muestreo de las señales de entrada para calzar con los bancos de filtro de análisis de un tamaño constante (en este caso 64). Se puede notar que el incremento de 35 la tasa de muestreo, de fs a 2fs, puede ser explicado por el hecho de que los convertidores de tasa de muestreo usan factores de reducción de la tasa de muestreo de T/2 en lugar de T, y con el último resultarían señales subbanda transpuestas con igual tasa de muestreo que la señal de entrada. Las señales con tasa de muestreo reducida son alimentadas a bancos de filtros de análisis de HFR separados (103—32, 103—33 y 103—34), uno por cada orden de transposición, los cuales proveen una multitud de señales subbanda de valores complejos. Éstas son 40 alimentadas a las unidades extensoras subbanda no lineales (103—42, 103—43 y 103—44). La multitud de subbandas de salida de valor complejo es alimentada al módulo Fusionar/Combinar 104 junto con la salida del banco de análisis submuestreado 102. La unidad de Fusionar/Combinar simplemente fusiona las subbandas provenientes del banco de filtro de análisis por núcleo 102 y cada rama de factor de estiramiento en una única multitud de subbandas de QMF a ser alimentadas en la unidad de procesamiento de HFR 105. 45
[0048] Cuando los espectros de señal de diferentes órdenes de transposición son ajustados para no superponerse, esto es, el espectro de la señal de 7º orden de transposición debe empezar cuando termina el espectro de la señal de orden T—1, las señales transpuestas necesitan ser de carácter pasabanda. De ahí los filtros pasabanda tradicionales 103—12—103—14 de la Figura 1. Sin embargo, a través de una simple selección exclusiva entre 50 subbandas disponibles mediante la unidad Fundir/Combinar 104, los filtros pasabanda separados son redundantes y pueden ser evitados. En cambio, la característica pasabanda inherente provista por el banco QMF es aprovechada alimentando las diferentes contribuciones desde las ramas de medio de transposición independientemente a diferentes canales subbanda en 104. También alcanza para aplicar el estiramiento de tiempo sólo a bandas que son combinadas en 104. 55
[0049] La Figura 2 ilustra el funcionamiento de una unidad de estiramiento subbanda no lineal. El extractor de bloques 201 muestrea un cuadro finito de muestras de la señal de entrada de valor complejo. El cuadro esta definido por una posición de puntero de entrada. Este cuadro sufre procesamiento no lineal en 202 y subsiguientemente es ventaneado mediante una ventana de longitud finita 203. Las muestras resultantes son sumadas a las muestras en 60 la unidad de superposición—y—suma 204 donde se define la posición de cuadro de salida mediante una posición de puntero de salida. El puntero de entrada es incrementado por una magnitud fija y el puntero de salida es incrementado por un factor de estiramiento subbanda veces la misma magnitud. Una iteración de esta cadena de
operaciones producirá una señal de salida con la duración que es el factor de estiramiento subbanda veces la duración de la señal subbanda de entrada, hasta la longitud de la ventana de síntesis.
[0050] Mientras el medio de transposición SSB empleado por SBR [ISO/IEC 14496—3:2009, "Tecnología de información — Codificación de objetos audio—visuales" ("Information technology – Coding of audio—visual objects") 5 – Parte 3: Audio] típicamente aprovecha toda la banda base, excluyendo la primera subbanda, para generar la señal de banda alta, un medio de transposición armónica generalmente usa una parte más pequeña del espectro de codificador por núcleo. La magnitud usada, el denominado rango fuente, depende del orden de transposición, el factor de extensión de ancho de banda, y las reglas aplicadas para el resultado combinado, por ejemplo, si se permite o no, la superposición espectral de las señales generadas a partir de diferentes órdenes de transposición. 10 Como consecuencia, sólo una parte limitada del espectro de salida del medio de transposición armónica para un dado orden de transposición, será realmente usada por el módulo de procesamiento HFR 105.
[0051] La Figura 18 ilustra otra realización de una implementación de procesamiento ejemplar para procesar una señal subbanda simple. La señal subbanda simple ha sido sometida a cualquier tipo de diezmado (decimation) ya 15 sea antes o después de ser filtrada por un banco de filtros de análisis no mostrado en la Figura 18. Por lo tanto, la longitud de tiempo de la señal subbanda simple es más corto que la longitud de tiempo antes del diezmado. La señal subbanda simple es ingresada al extractor de bloque 1800, el cual puede ser idéntico al extractor de bloque 201, pero el cual también puede ser implementado de una manera diferente. El extractor de bloque 1800 de la Figura 18 funciona usando un valor de avance de muestra/bloque llamado para el ejemplo, e. El valor de avance de 20 muestra/bloque puede ser variable o puede ser puesto fijo y está ilustrado en la Figura 18 como una flecha en la caja de extractor de bloque 1800. En la salida del extractor de bloque 1800 existe una pluralidad de bloques extraídos. Estos bloques tienen alta superposición, ya que el valor de avance de muestra/bloque e es significativamente más pequeño que la longitud de bloque del extractor de bloque. Un ejemplo es que el extractor de bloques extrae bloques de 12 muestras. El primer bloque comprende muestras 0 a 11, el segundo bloque comprende muestras 1 a 12, el 25 tercer bloque comprende muestras 2 a 2 a 13, y así siguiendo. En esta realización, el valor de avance de muestra/bloque e es igual a 1, y hay superposición de 11 veces.
[0052] Los bloques individuales son ingresados en un medio de ventaneo 1802 para ventanear los bloques usando una función de ventana para cada bloque. Adicionalmente, se provee un calculador de fase 1804, el cual calcula 30 una fase para cada bloque. El calculador de fase 1804 puede usar el bloque individual antes del ventaneo o subsiguiente al ventaneo. Luego se calcula un valor de ajuste de fase p x k y se ingresa a un ajustador de fase 1806. El ajustador de fase aplica el valor de ajuste a cada muestra del bloque. Asimismo, el factor k es igual al factor de extensión de ancho de banda. Cuando, por ejemplo, se ha de obtener la extensión de ancho de banda por un factor 1, entonces la fase p calculada para un bloque extraído por el extractor de bloque 1800 es multiplicada por el factor 35 2 y el valor de ajuste aplicado a cada muestra del bloque en el ajustador de fase 1806 es p multiplicado por 2. Este es un valor/regla ejemplar. Alternativamente, la fase corregida por síntesis es k * p, p + (k—1)*p. Así, en este ejemplo, el factor de corrección es 2 si se multiplica, o 1*p si se suma. Se pueden aplicar otros valores/reglas para calcular el valor de corrección de fase.
40
[0053] En una realización, la señal subbanda simple es una señal subbanda compleja, y la fase de un bloque puede ser calculada mediante una pluralidad de diferentes maneras. Una manera es tomar la muestra en el medio o alrededor del medio del bloque y calcular la fase de esta muestra compleja. También es posible calcular la fase para cada muestra.
45
[0054] A pesar de que en la Figura 18 se ilustra la manera en que opera un ajustador de fase subsiguiente al medio de ventaneo, estos dos bloques también puede ser intercambiado, de modo que el ajuste de fase es realizado a los bloques extraídos por el extractor de bloque y se realiza una subsiguiente operación de ventaneo. Como ambas operaciones, esto es, ventaneo y ajuste de fase son multiplicaciones de valores reales o valores complejos, estas dos operaciones pueden ser resumidas en una sola operación usando un factor de multiplicación complejo el cual, 50 en sí mismo, es el producto de un factor de multiplicación de ajuste de fase y un factor de ventaneo.
[0055] Los bloques ajustados en fase son ingresados en un bloque de superposición/suma y corrección de amplitud 1808, donde los bloques ventaneados y ajustados en fase son superpuestos—sumados. Sin embargo, de manera importante, el valor de avance de muestra/bloque es el bloque 1808 es diferente del valor usado en el extractor de 55 bloque 1800. Particularmente, el valor de avance de muestra/bloque en el bloque 1808 es mayor que el valor e usado en el bloque 1800, de modo que se obtiene un estiramiento de tiempo de la señal entregada por el bloque 1808. Así, la señal subbanda procesada entregada por el bloque 1808 tiene una longitud que es más larga que la señal subbanda ingresada en el bloque 1800. Cuando se ha de obtener la extensión de ancho de banda de dos, entonces se usa el valor de avance de muestra/bloque, que es dos veces el valor correspondiente en el bloque 60 1800. Esto da por resultado un estiramiento de tiempo por un factor de dos. Sin embargo, cuando se necesitan otros factores de estiramiento de tiempo, entonces se pueden usar otros valores de avance de muestra/bloque de modo que la salida del bloque 1808 tiene una longitud de tiempo requerida.
[0056] Para encarar el problema de superposición, preferiblemente se realiza una corrección de amplitud para 65 encarar el problema de diferentes superposiciones en el bloque 1800 y 1808. Sin embargo, esta corrección de
amplitud también podría ser introducida en el factor de multiplicación de ajustador de ventaneo/fase, pero la corrección de amplitud también puede ser realizada subsiguiente a superposición/procesamiento.
[0057] En el ejemplo de arriba con una longitud de bloque de 12 y un valor de avance de muestra/bloque en el extractor de bloque de uno, el valor de avance de muestra/bloque para el bloque de superposición/suma 1808 sería 5 igual a dos, cuando se realiza la extensión de ancho de banda por un factor de dos. Esto todavía daría por resultado una superposición de cinco bloques. Cuando se ha de realizar una extensión de ancho de banda por un factor de tres, entonces el valor de avance de muestra/bloque usado por el bloque 1808 sería igual a tres, y la superposición caería a una superposición de tres. Cuando se ha de realizar una extensión de ancho de banda por cuatro, entonces el bloque de superposición/suma 1808 tendría que usar un valor de avance de muestra/bloque de cuatro, lo cual 10 todavía daría por resultado una superposición de más que dos bloques.
[0058] Se pueden lograr grandes ahorros computacionales restringiendo las señales de entrada a las ramas de medio de transposición que solo contienen el rango fuente, y esto a una tasa de muestreo adaptada a cada orden de transposición. El esquema de bloque básico de un sistema así para un generador de HFR basado en bloques, está 15 ilustrado en la Figura 3. La señal de codificador por núcleo de entrada es procesada por reductores de la tasa de muestreo dedicados que preceden a los bancos de filtros de análisis de HFR.
[0059] El efecto esencial de cada reductor de la tasa de muestreo es quitar por filtrado la señal de rango fuente y suministrarla al banco de filtros de análisis a la tasa de muestreo más bajo posible. Aquí, más bajo posible se refiere 20 a la tasa de muestreo más bajo que todavía es adecuado para el procesamiento corriente abajo, no necesariamente la tasa de muestreo más baja que evita aliasing después del diezmado. La conversión de tasa de muestreo puede obtenerse de varias maneras. Sin limitar el alcance del invento, se darán dos ejemplos: el primero muestra el re—muestreo realizado mediante procesamiento en el dominio del tiempo multi—tasa, y el segundo ilustra el re—muestreo logrado por medio de procesamiento subbanda QMF. 25
[0060] La Figura 4 muestra un ejemplo de los bloques en un reductor de la tasa de muestreo del dominio del tiempo multi—tasa para un orden de transposición de 2. La señal de entrada, que tiene un ancho de banda B Hz, y una frecuencia de muestreo fs, es modulada por una exponencial compleja (401) para correr en frecuencia el inicio del rango fuente a frecuencia DC según 30
()()exp22msBxnxnif
[0061] En las Figuras 5(a) y (b) se representan ejemplos de una señal de entrada y el espectro después de la modulación. La señal modulada es interpolada (402) y filtrada mediante un filtro pasabajo de valor complejo con 35 límites pasabanda 0 y B/2 Hz (403). En las Figuras 5(c) y (d) se muestran los espectros después de los respectivos pasos. La señal filtrada es subsiguientemente diezmada (404) y la parte real de la señal es computada (405). Los resultados de estos pasos se muestran en las Figuras 5(e) y (f). En este ejemplo particular, cuando T=2, B=0,6 (en una escala normalizada, esto es, fs=2), P2 se elige como 24, para cubrir de manera segura el rango fuente. El factor de reducción de la tasa de muestreo da 40
, 232648243TP
donde la fracción ha sido reducida por el factor común 8. De ahí, el factor de interpolación es 3 (como se ve de la Figura 5(c)) y el factor de diezmado es 8. Usando las identidades de Noble ["Sistemas Multiritmo y Bancos de Filtros" 45 (“Multirate Systems And Filter Banks”) por P.P. Vaidyanathan, 1993, Prentice Hall, Englewood Cliffs], el diezmador puede ser movido por todo el trayecto a la izquierda, y el interpolador todo el trayecto a la derecha en la Figura 4. De esta manera, la modulación y el filtrado se hacen a la tasa de muestreo más bajo posible y se disminuye aun más la complejidad computacional.
50
[0062] Otro enfoque es usar las salidas subbanda del banco QMF de análisis de 32 bandas sub—muestreada 102 ya presente en el método SBR HFR. Las subbandas que cubren los rangos fuente para las diferentes ramas del medio de transposición son sintetizadas al dominio del tiempo mediante pequeños bancos QMF sub—muestreados que preceden los bancos de filtro de análisis HFR. Este tipo de sistema de HFR está ilustrado en la Figura 6. Los pequeños bancos QMF se obtienen sub—muestreando el banco QMF de 64 bandas origianl, donde los coeficientes 55 de filtro prototipo se hallan mediante interpolación lineal del filtro prototipo original. Siguiendo las notaciones de la Figura 6, el banco QMF de síntesis que precede a la rama del medio de transposición de 2º orden tiene Q2=12 bandas (las subbandas con índices basados en cero desde 8 a 19 en el QMF de 32 bandas). Para evitar aliasing en el proceso de síntesis, las primera (índice 8) y la última (índice 19) bandas, son puestas en cero. La salida espectral resultante se muestra en la Figura 7. Note que el banco de filtros de análisis del medio de transposición basado en 60
bloque tiene 2Q2=24 bandas, esto es, el mismo número de bandas que en el ejemplo basado en reductor de la tasa de muestreo en el dominio del tiempo multi—tasa (Figura 3).
[0063] El sistema detallado en la Figura 1 puede ser visto como un caso especial simplificado del re—muestreo detallado en las Figuras 3 y 4. Para simplificar el arreglo se omiten los moduladores. Además, todo el filtrado de 5 análisis de HFR se obtiene usando bancos de filtros de análisis de 64 bandas. De ahí, P2 = P3 = P4 = 64 de la Figura 3, y los factores de reducción de la tasa de muestreo son 1, 1,5 y 2 para las ramas del medio de transposición de 2º, 3º y 4º orden, respectivamente.
[0064] En la Figura 8(a) se muestra un diagrama de bloques de un reductor de la tasa de muestreo de factor 2. El 10 filtro pasa bajos ahora de valor real puede ser escrito, dondees la parte no recursiva (FIR) yes la parte recursiva (IIR). Sin embargo, para una implementación eficiente, usando las Identidades de Noble para disminuir la complejidad computacional, es beneficioso diseñar un filtro donde todos los polos tengan multiplicidad 2 (polos dobles) como. Por ende, el filtro puede ser factoreado como se muestra en la Figura 8(b). Usando la Identidad de Noble 1, la parte recursiva puede ser movida más allá del medio de diezmado como en 15 la Figura 8(c). El filtro no recursivopuede ser implementado usando descomposición polifase de 2 componentes estándar según ()()/()HzBzAz()Bz()Az2()Az()Bz
, donde 1200()()()zNnllnlBzbnzzEz/20()(2)zNnlnEzbnlz
20
[0065] Por ende, el reductor de tasa de muestreo puede ser estructurado como en la Figura 8(d). Después de usar la Identidad de Noble 1, la parte FIR es computada a la tasa de muestreo más bajo posible como se muestra en la Figura 8(e). De la Figura 8(e) es fácil ver que la operación FIR (retardo, medios de diezmado y componentes polifase) pueden verse como una operación de ventana—suma usando un tranco de entrada de dos muestras. Para dos muestras de entrada, se producirá una nueva muestra de salida, resultando efectivamente una reducción de la 25 tasa de muestreo de un factor 2.
[0066] En la Figura 9(a) se muestra un diagrama de bloques del reducción de la tasa de muestreo de factor 1,5=3/2. El filtro pasa bajos de valor real puede ser escrito nuevamente, dondees la parte no recursiva (FIR) yes la parte recursiva (IIR). Como antes, para una implementación eficiente, usando las 30 Identidades de Noble para disminuir la complejidad computacional, es beneficioso diseñar un filtro donde todos los polos tengan multiplicidad 2 (polos dobles) o multiplicidad 3 (polos tripes) comoorespectivamente. Aquí, se eligen polos dobles ya que el algoritmo de diseño para el filtro pasa bajos es más eficiente, a pesar de que la parte recursiva realmente da 1,5 veces más complejo de implementar comparado con el enfoque de polo triple. Por ende, el filtro puede ser factoreado como se muestra en la Figura 9(b). Usando la Identidad de Noble 2, la parte 35 recursiva puede ser movida al frente del medio de interpolación como en la Figura 9(c). El filtro no recursivopuede ser implementado usando descomposición polifase de componente estándar según ()()/()HzBzAz()Bz()Az2()Az3()Az()Bz236
, donde 5600()()()zNnllnlBzbnzzEz/60()(6)zNnlnEzbnlz
40
[0067] Por ende, el reductor de tasa de muestreo puede ser estructurado como en la Figura 9(d). Después de usar ambas, la Identidad de Noble 1 y la 2, la parte FIR es computada a la tasa de muestreo más baja posible como se muestra en la Figura 9(e). De la Figura 9(e) es fácil ver que las muestras de salida de índice par son computadas usando el grupo de tres filtros polifase inferior () mientras que las muestras de índice impar son computadas desde el grupo superior (). La operación de cada grupo (cadena de retarde, 45 medios de diezmado y componentes polifase) puede ser vista como una operación de ventana—suma usando un paso de entrada de tres muestras. Los coeficientes de ventana usados en el grupo superior son los coeficientes de índice impar, mientras que el grupo inferior usa los coeficientes de índice par del filtro original. De ahí, para un grupo de tres muestras de entrada, se producirán dos nuevas muestras de salida, resultando efectivamente una reducción de la tasa de muestreo de un factor 1,5. 50 024(),(),()EzEzEz135(),(),()EzEzEz()Bz
[0068] La señal en el dominio del tiempo del decodificador por núcleo (101 en la Figura 1) también puede ser sub—muestreado usando una transformación de síntesis sub—muestreada más pequeña en el decodificador por núcleo. El uso de una transformación de síntesis más pequeña ofrece todavía más disminución de complejidad
computacional. Dependiendo de la frecuencia de transición, esto es, el ancho de banda de la señal de codificador por núcleo, el cociente del tamaño de transformación de síntesis y el tamaño nominal Q (Q < 1), resulta en una señal de salida de codificador por núcleo que tiene un tasa de muestreo Qfs. Para procesar la señal de codificador por núcleo sub—muestreada en los ejemplos detallados en la presente solicitud, todos los bancos de filtros de análisis de la Figura 1 (102, 103—32, 103—33 y 103—34) necesitan ser puestos a escala por el factor Q, así como también 5 los reductores de tasa de muestreo (301—2, 301—3 y 301—T) de la Figura 3, el elemento de diezmado 404 de la Figura 4, y el banco de filtros de análisis 601 de la Figura 6. Evidentemente, Q tiene que ser seleccionado de modo que todos los tamaños de bancos de filtros sean enteros.
[0069] La Figura 10 ilustra la alineación de los bordes espectrales de las señales de medio de transposición de HFR 10 a los bordes espectrales de la tabla de frecuencia de ajuste de envolvente en un codificador de HFR mejorado, tal como SBR [ISO/IEC 14496—3:2009, "Tecnología de información — Codificación de objetos audio—visuales" ("Information technology – Coding of audio—visual objects") – Parte 3: Audio]. La Figura 10(a) muestra un gráfico esquemático de las bandas de frecuencia que conforman la tabla de ajuste de envolvente, las denominadas bandas de factor de escala, cubriendo el rango de frecuencia desde la frecuencia de transición kx a la frecuencia de parada 15 ks. Las bandas de factor de escala constituyen la grilla de frecuencia usada en el codificador mejorado de HFR cuando se ajusta el nivel de energía de la banda alta regenerada sobre frecuencia, esto es, la envolvente de frecuencia. Para ajustar la envolvente, se promedia la energía de la señal sobre un bloque tiempo/frecuencia restringido por los bordes de banda de factor de escala y bordes de tiempo seleccionados.
20
[0070] Específicamente, la Figura 10 ilustra en la porción superior, una división en bandas de frecuencia 100, y resulta claro de la Figura 10 que las bandas de frecuencia aumentan con la frecuencia, donde el eje horizontal corresponde a la frecuencia y tiene en la notación de la Figura 10, canales de banco de filtro k, donde el banco de filtros puede ser implementado como un banco de filtros QMF tal como un banco de filtros de 64 canales o puede ser implementado vía una transformación de Fourier digital, donde k corresponde a una cierta bandeja de frecuencia de 25 la aplicación DFT. Por ende, una bandeja de frecuencia de una aplicación DFT y un canal de banco de filtros de una aplicación QMF indican lo mismo en el contexto de esta descripción. Por ende, los datos paramétricos se dan para la parte de alta frecuencia 102 en las bandejas de frecuencia 100 o bandas de frecuencia. La parte de baja frecuencia de la señal extendida en ancho de banda finalmente está indicada en 104. La ilustración intermedia en la Figura 10 ilustra los rangos de parche para un primer parche 1001, un segundo parche 1002 y un tercer parche 1003. Cada 30 parche se extiende entre dos bordes de parche, donde hay un borde de parche inferior 1001a y un borde de parche superior 1001b, par el primer parche. El borde superior del primer parche indicado en 1001b corresponde al borde inferior del segundo parche el cual está indicado en 1002a. Por ende, los números de referencia 1001b y 1002a realmente se refieren a una y la misma frecuencia. Un borde de parche superior 1002b del segundo parche, de nuevo, corresponde a un borde de parche inferior 1003a del tercer parche, y el tercer parche también tiene un borde 35 de parche superior 1003b. Se prefiere que no haya agujeros entre parches individuales, pero éste no es un requerimiento final. Es visible en la Figura 10 que los bordes de parche 1001b, 1002b no coinciden con bordes correspondientes de las bandas de frecuencia 100 sino que están adentro de ciertas bandas de frecuencia 101. La línea inferior en la Figura 10 ilustra diferentes parches con bordes alineados 1001c, donde la alineación del borde superior 1001c del primer parche automáticamente significa la alineación del borde inferior 1002c del segundo 40 parche y vice versa. Adicionalmente, se indica que el borde superior del segundo parche 1002d ahora está alineado con el borde de frecuencia o banda de frecuencia inferior 101 en la primera línea de la Figura 10 que, por lo tanto, automáticamente el borde inferior del tercer parche indicado en 1003c, también está alineado.
[0071] En la realización de la Figura 10 se muestra que los bordes alineados están alineados al borde de frecuencia 45 inferior de la banda de frecuencia coincidente 101, pero la alineación también podría ser hecho en una dirección diferente, esto es, que el borde de parche 1001c, 1002c es alineado al borde de frecuencia superior de la banda 101 en lugar de al borde de frecuencia inferior del mismo. Dependiendo de la implementación real, se puede aplicar una de esas posibilidades e incluso puede ser una mezcla de ambas posibilidades para diferentes parches.
50
[0072] Si las señales generadas por diferentes órdenes de transposición no están alineadas a las bandas de factor de escala, como se ilustra en la Figura 10(b), pueden aparecer artefactos si la energía espectral cambia drásticamente en el vecindad de un borde de banda de transposición, ya que el proceso de ajuste de envolvente mantendrá la estructura espectral dentro de una banda de factor de escala. Por ende, el invento adapta los bordes de frecuencia de las señales transpuestas a los bordes de las bandas de factor de escala como se muestra en la 55 Figura 10(c). En la figura, el borde superior de las señales generadas por órdenes de transposición de 2 y 3 (T=2, 3) son disminuidas o cantidad pequeña, comparado con la Figura 10(b), para alinear los bordes de frecuencia de las bandas de transposición a bordes de banda de factor de escala existentes.
[0073] Un escenario realista que muestra potenciales artefactos cuando se usan bordes no alineados, está 60 representado en la Figura 11. La Figura 11(a) muestra nuevamente los bordes de banda de factor de escala. La Figura 11(b) muestra las señales generadas por HFR no ajustadas de órdenes de transposición T=2, 3 y 4 junto con la señal de banda base decodificada por núcleo. La Figura 11(c) muestra la señal ajustada en envolvente cuando se supone una envolvente blanco plana. Los bloques con áreas cuadriculadas representan bandas de factor de escala con altas variaciones de energía intra—banda, lo cual puede causar anomalías en la señal de salida. 65
[0074] La Figura 12 ilustra el escenario de la Figura 11, pero esta vez usando bordes alineados. La Figura 12(a) muestra los bordes de banda de factor de escala, la Figura 12(b) representa las señales generadas por HFR no ajustadas, de órdenes de transposición T=2, 3 y 4 junto con la señal de banda base decodificada por núcleo y, en línea con la Figura 11(c), la Figura 12(c) muestra la señal ajustada por envolvente si se supone una envolvente blanco plana. Como se ve de esta figura, no hay bandas de factor de escala con altas variaciones de energía intra—5 banda debido a mala alineación de bandas de señal transpuestas y las bandas de factor de escala, y por ende, se disminuyen los potencial artefactos.
[0075] La Figura 25a ilustra una visión general de una implementación del calculador de borde de parche 2302 y el parcheador y la ubicación de esos elementos adentro del escenario de extensión de ancho de banda en 10 concordancia con una realización preferida. Específicamente, se provee una interfaz de entrada 2500, la cual recibe los datos de banda baja 2300 y los datos paramétricos 2302. Los datos paramétricos pueden ser datos de extensión de ancho de banda, como por ejemplo, lo conocido de ISO/IEC 14496—3: 2009 y particularmente con respecto a la sección relacionada con extensión de ancho de banda, que es la sección 4.6.18 "herramienta SBR" ("SBR tool”). De particular relevancia en la sección 4.6.18 es el apartado 4.6.18.3.2 "Tablas de banda de frecuencia" (“Frequency 15 band tables”), y en particular el cálculo de algunas tablas de frecuencia fmaster, fTableHigh, fTableLow, fTableNoise y fTableLim. Particularmente, la sección 4.6.18.3.2.1 de la Norma define el cálculo de las tablas de banda de frecuencia maestras, y la sección 4.6.18.3.2.2 defines el cálculo de las tablas de banda de frecuencia derivadas de la tabla de banda de frecuencia maestra, y en particular entrega cómo se calcula fTableHigh, fTableLow y fTableNoise. La sección 4.6.18.3.2.3 define el cálculo de la tabla de banda de frecuencia limitadora. 20
[0076] La tabla de frecuencia de baja resolución fTableLow es para datos paramétricos de baja resolución y la tabla de frecuencia de alta resolución fTableHigh es para datos paramétricos de alta resolución, las cuales son ambas posibles en el contexto de la herramienta de software MPEG—4 SBR, como se discute en la Norma mencionada y si los datos paramétricos son datos paramétricos de baja resolución o datos paramétricos de alta resolución, depende de 25 la implementación de codificador. La interfaz de entrada 2500 determina si los datos paramétricos son datos de bajo o alta resolución y provee esta información al calculador de tabla de frecuencia 2501. El calculador de tabla de frecuencia entonces calcula la tabla maestra o generalmente deriva una tabla de alta resolución 2502 y una tabla de baja resolución 2503 y provee la mismo al núcleo calculador de borde de parche 2504, el cual adicionalmente comprende o coopera con, un calculador de banda limitadora 2505. Los elementos 2504 y 2505 generan bordes de 30 parche de síntesis alineados 2506 y correspondientes bordes de banda limitadores relacionados al rango de síntesis. Esta información 2506 es provista a un calculador de banda fuente 2507, el cual calcula el rango fuente de la señal de audio de banda baja para un cierto parche de modo que junto con los correspondientes factores de transposición, se obtienen los bordes de parche de síntesis alineados 2506 después del parcheo usando, por ejemplo un medio de transposición armónica 2508 como parcheador. 35
[0077] En particular, el medio de transposición armónica 2508 puede ejecutar diferente algoritmos de parcheo tal como el algoritmo de parcheo basado en DFT o un algoritmo de parcheo basado en QMF. El medio de transposición armónica 2508 puede ser implementado para realizar un procesamiento de tipo vocoder el cual se describe en el contexto de las Figuras 26 y 27 para la realización de medio de transposición armónica basada en QMF, pero 40 también se pueden usar otras operaciones de medio de transposición tal como un medio de transposición basado en DFT con el propósito de generar una porción de alta frecuencia en una estructura de tipo vocoder. Para el medio de transposición basado en DFT, el calculador de banda fuente calcula ventanas de frecuencia para el rango de baja frecuencia. Para la implementación basada en QMF, el calculador de banda fuente 2507 calcula las bandas QMF requeridas del rango fuente para cada parche. El rango fuente está definido por los datos de audio de banda baja 45 2300, que típicamente está provisto en forma codificada y remitido por la interfaz de entrada 2500 a un decodificador por núcleo 2509. El decodificador por núcleo 2509 alimenta sus datos de salida a un banco de filtros de análisis 2510, que puede ser una implementación de QMF o una implementación de DFT. En la implementación de QMF, el banco de filtros de análisis 2510 puede tener 32 canales de banco de filtros, y estos 32 canales de banco de filtros definen el rango fuente "máximo", y el medio de transposición armónica 2508 entonces selecciona, de estas 32 50 bandas, las bandas actuales que componen el rango fuente ajustado según es definido por el calculador de banda fuente 2507 para, por ejemplo, cumplir los datos de rango fuente ajustados de la tabla de la Figura 23, provisto que los valores de frecuencia de la tabla de la Figura 23 son convertidos a índices subbanda de banco de filtros de síntesis. Un procedimiento similar puede ser realizado para el medio de transposición basado en DFT, que recibe para cada parche una cierta ventana para el rango de frecuencia baja y esta ventana luego es remitida al bloque de 55 DFT 2510 para seleccionar el rango fuente en concordancia con los bordes de parche síntesis ajustados o alineados calculados por el bloque 2504.
[0078] La señal transpuesta 2509 entregada por el medio de transposición 2508 es remitida a un ajustador de envolvente y limitador de ganancia 2510, que recibe como entrada la tabla de alta resolución 2502 y la tabla de baja 60 resolución 2503, las bandas limitadoras ajustadas 2511 y, naturalmente, los datos paramétricos 2302. La banda alta ajustada por envolvente sobre la línea 2512 luego es ingresada a un banco de filtros de síntesis 2514, que adicionalmente recibe la banda baja típicamente en forma de salida por el decodificador por núcleo 2509. Ambas contribuciones se funden mediante el banco de filtros de síntesis 2514 para finalmente obtener la señal reconstruida de alta frecuencia en línea 2515. 65
[0079] Es claro que la fusión de la banda alta y la banda baja puede ser hecha de manera diferente, tal como realizando una fusión en el dominio del tiempo en lugar de en el dominio de la frecuencia. Asimismo, es claro que se puede cambiar el orden de fusión, sin importar la implementación de la fusión y el ajuste de envolvente, esto es, de modo que el ajuste de envolvente de un cierto rango de frecuencia puede ser realizado subsiguiente a la fusión o, alternativamente, antes de la fusión, donde el último caso está ilustrado en la Figura 25a. Además se detalla que el 5 ajuste de envolvente puede incluso ser realizado antes de la transposición en el medio de transposición 2508, de modo que el orden del medio de transposición 2508 y el ajustador de envolvente 2510 también puede ser diferente de lo que se ilustra en la Figura 25a como una realización.
[0080] Como ya se detalló en el contexto del bloque 2508, en las realizaciones se puede aplicar un medio de 10 transposición armónica basado en DFT o un medio de transposición armónica basado en QMF. Ambos algoritmos se apoyan en desparramo de frecuencia de vocoder de fase. La señal del dominio del tiempo de codificador por núcleo es extendida en ancho de bando usando una estructura de vocoder de fase modificado. La extensión de ancho de banda es realizada mediante estiramiento en el tiempo seguido de diezmado, esto es, transposición, usando varios factores de transposición (t = 2, 3, 4) en una etapa de transformación de análisis/síntesis común. La señal de salida 15 del medio de transposición tendrá una tasa de muestreo del doble que la de la señal de entrada, lo cual significa que para un factor de transposición de dos, la señal será estirada en el tiempo pero no diezmada, produciendo eficientemente una señal de igual tiempo de duración que la señal de entrada pero teniendo el doble de frecuencia de muestreo. El sistema combinado puede ser interpretado como tres medios de transposición en paralelo usando factores de transposición de 2, 3 y 4, respectivamente, donde los factores de diezmado son 1; 1,5 y 2. Para reducir 20 complejidad, los medios de transposición de factor 3 y 4 (medios de transposición de tercer y cuarto orden) son integrados dentro del medio de transposición de factor 2 (medio de transposición de segundo orden) por medio de interpolación como se discute subsiguientemente en el contexto de la Figura 27.
[0081] Para cada cuadro, se determina un tamaño de transformación de "tamaño completo" nominal de una medio 25 de transposición, dependiendo de un sobre—muestreo en el dominio de la frecuencia señal—adaptable que puede aplicarse para mejorar la respuesta de componente transitorio o que puede ser apagado. Este valor está indicado en la Figura 24a como FFTSizeSyn. Entonces, se transforman bloques de muestras de entrada ventaneadas, donde para la extracción de bloque se ejecuta un valor de avance de bloque o valor de paso de análisis de un número mucho más pequeño de muestras, para tener una superposición significativa de bloques. Los bloques extraídos son 30 transformados al dominio de la frecuencia por medio de una DFT dependiendo de la señal de control de sobre—muestreo del dominio de la frecuencia señal—adaptable. Las fases de los coeficientes de la DFT de valores complejos son modificadas de acuerdo con los tres factores de transposición usados. Para transposición de segundo orden, las fases son duplicadas, para las transposiciones de tercer y cuarto orden, las fases son triplicadas, cuadruplicadas o interpoladas a partir de dos coeficientes de DFT consecutivos. Los coeficientes modificados son 35 transformados subsiguientemente de vuelta al dominio del tiempo por medio de una DFT, son ventaneados y combinados por medio de superponer—sumar usando un paso de salida diferente del paso de entrada. Entonces, usando algoritmo ilustrado en la Figura 24a, se calculan los bordes de parche y se escriben en el arreglo xOverBin. Luego se usan los bordes de parche para calcular ventanas de transformación en el dominio del tiempo para la aplicación del medio de transposición de DFT. Para el medio de transposición de QMF se calculan números de canal 40 de rango fuente en base a los bordes de parche calculados en el rango de síntesis. Preferiblemente, esto está ocurriendo antes de la transposición ya que se necesita como información de control para generar el espectro transpuesto.
[0082] Subsiguientemente se discute el pesudo código indicado en la Figura 24a en relación con el diagrama de flujo 45 de la Figura 25b que ilustra una implementación preferida del calculador de borde de parche. En el paso 2520 se calcula una tabla de frecuencia en base a los datos de entrada tales como una tabla de alta o baja resolución. De ahí, el bloque 2520 corresponde al bloque 2501 de la Figura 25a. Luego, en el paso 2522 se determina un borde de parche de síntesis blanco en base al factor de transposición. En particular, el borde de parche de síntesis blanco corresponde al resultado de la multiplicación del valor de parche de la Figura 24a y fTableLow(0), donde fTableLow(0) 50 indica el primer canal o bandeja del rango de extensión de ancho de banda, esto es, la primera banda por arriba de la frecuencia de transición, por debajo de la cual los datos de audio de entrada 2300 están dados con alta resolución. En el paso 2524 se verifica si el borde de parche de síntesis blanco coincide con una entrada en la tabla de baja resolución dentro de un rango de alineación. En particular, se prefiere un rango de alineación de 3, como se indica, por ejemplo, en 2525 en la Figura 24a. Sin embargo, otros rangos también son útiles, tal como rangos más 55 pequeños o iguales que 5. Si en el paso 2524 se determina que el blanco coincide con una entrada de la tabla de baja resolución, entonces esta entrada coincidente es tomada como el nuevo borde de parche en lugar del borde de parche blanco. Sin embargo, si se determina que no existe entrada dentro del rango de alineación, se aplica el paso 2526, en el cual se hace la misma búsqueda con la tabla de alta resolución que también se indica en 2527 en la Figura 24a. Si en el paso 2526 se determina que existe una entrada de tabla dentro del rango de alineación, 60 entonces la entrada coincidente es tomada como un nuevo borde de parche en lugar del borde de parche de síntesis blanco. Sin embargo, si en el paso 2526 se determina que incluso en la tabla de alta resolución no existe valor dentro del rango de alineación, entonces se aplica el paso 2528 en el cual se usa el borde de síntesis blanco sin alineación alguna. Esto también está indicado en la Figura 24a en 2529. Por ende, se puede ver el paso 2528 como una posición para caso de caída de modo que se garantiza en cualquier caso que el decodificador de extensión de 65
ancho de banda no queda en un bucle, sino que llega a alguna solución en cualquier caso incluso si hay una selección muy específica y problemática de las tablas de frecuencia y los rangos blanco.
[0083] Con respecto al pseudo código de la Figura 24a, se detalla que las líneas de código 2531 ejecutan cierto procesamiento para asegurar que todas las variables estén en un rango útil. Asimismo, la verificación acerca de si el 5 blanco coincide con una entrada en la tabla de baja resolución dentro de un rango de alineación, se ejecuta como el cálculo de una diferencia (líneas 2525, 2527) entre el borde de parche de síntesis blanco calculado por el producto indicado cerca del bloque 2522 en la Figura 25b e indicado en las líneas 2525, 2527 y una entrada de tabla actual definida por el parámetro sfbL para la línea 2525 o sfbH para la línea 2527 (sfb = banda de factor de escala). Naturalmente, también se pueden ejecutar otras operaciones de verificación. 10
[0084] Asimismo, no necesariamente es el caso que se busca una coincidencia dentro de un rango de alineación cuando el rango de alineación está predeterminado. En cambio, se puede realizar una búsqueda en la tabla para hallar la mejor entra de tabla coincidente, esto es, la entrada de tabla que está más cercana al valor de la frecuencia blanco sin importar si la diferencia entre esos dos es pequeña o alta. 15
[0085] Otras implementaciones se refieren a una búsqueda en la tabla, tal como fTableLow o fTableHigh para el borde más alto que no excede los límites de ancho de banda (fundamental) de la señal generada por HFR para un factor de transposición T. Luego se usa este borde más alto como el límite de frecuencia de la señal generada por HFR del factor de transposición T. En esta implementación no se requiere el cálculo de blanco indicado cerca de la caja 2522 20 en Figura 25b.
[0086] La Figura 13 ilustra la adaptación de los bordes de banda de limitador de HFT, como se describe, por ejemplo, en SBR [ISO/IEC 14496—3:2009, "Tecnología de información — Codificación de objetos audio—visuales" ("Information technology – Coding of audio—visual objects) – Parte 3: Audio] para los parches armónicos en un 25 codificador de HFR mejorado. El limitador opera sobre bandas de frecuencia que tienen una resolución mucho más gruesa que las bandas de factor de escala, pero el principio de operación es muy parecido. En el limitador se calcula el valor de ganancia promedio para casa una de las bandas de limitador. No se permite que los valores de ganancia individuales, esto es, los valores de ganancia de envolvente calculados para cada una de las bandas de factor de escala, excedan el valor de ganancia promedio de limitador por más que un cierto factor multiplicativo. El objetivo del 30 limitados es suprimir grandes variaciones de ganancias de banda de factor de escala dentro de cada una de las bandas del limitador. Mientras la adaptación de las bandas generadas por el medio de transposición a las bandas de factor de escala asegura pequeñas variaciones de la energía intra—banda dentro de la banda de factor de escala, la adaptación de los bordes de banda de limitador a los bordes de banda de medio de transposición, de acuerdo con el presente invento, maneja las diferencias de energía de mayor escala entre bandas procesadas del medio de 35 transposición. La Figura 13(a) muestra los límites de frecuencia de las señales generadas por HFR de órdenes de transposición T=2, 3 y 4. Los niveles de energía de las diferentes señales transpuestas pueden ser substancialmente diferentes. La Figura 13(b) muestra las bandas de frecuencia del limitador las cuales típicamente son de ancho constante en una escala de frecuencia logarítmica. Los bordes de banda de frecuencia de medio de transposición son sumados como bordes de limitador constantes y los restantes bordes de limitador son re—calculados para 40 mantener las relaciones logarítmicas lo más cercanas posibles, como se ilustra, por ejemplo, en la Figura 13(c).
[0087] Otras realizaciones emplean un esquema de parcheo mixto el cual está mostrado en la Figura 21, donde se ejecuta el método de parcheo mixto dentro de un bloque de tiempo. Para cobertura completa de las diferentes regiones del espectro de HF, un BWE comprende varios parches. En HBE, los parches más altos requieren altos 45 factores de transposición dentro de los vocoders de fase, lo cual deteriora particularmente la calidad perceptual de los componentes transitorios.
[0088] Realizaciones así generan los parches de orden más alto que ocupan las regiones espectrales superiores preferiblemente mediante parcheo copy—up SSB computacionalmente eficiente y los parches de orden inferior que 50 cubren las regiones espectrales medias, para los cuales se desea conservación de la estructura armónica, preferiblemente, mediante parcheo HBE. La mezcla individual de métodos de parcheo puede ser estática en el tiempo o, preferiblemente, puede ser señalizada en la serie de bits en el tiempo.
[0089] Para la operación de copy—up, se puede usar la información de baja frecuencia como se muestra en la 55 Figura 21. Alternativamente se pueden usar los datos de parches que fueron generados usando métodos HBR como se ilustra en la Figura 21. Esto último conduce a una estructura tonal menos densa para parches más altos. Además de estos dos ejemplos, se puede concebir toda otra combinación de copy—up y HBE.
[0090] Las ventajas de los conceptos propuestos son 60
Mejor calidad perceptual de componentes transitorios
Reducida complejidad computacional
65
[0091] La Figura 26 ilustra una cadena de procesamiento preferida con el propósitos de extensión de ancho de banda, donde se pueden ejecutar diferentes operaciones de procesamiento dentro del procesamiento subbanda no lineal indicado en los bloques 1020a, 1020b. En una implementación, el procesamiento banda—selectivo de la señal en el dominio del tiempo procesada tal como la señal extendida en ancho de banda, se ejecuta en el dominio del tiempo más que en el dominio subbanda, que existe antes del banco de filtros de síntesis 2311. 5
[0092] La Figura 26 ilustra un aparato para generar una señal de audio extendida en ancho de banda a partir de una señal de entrada de banda baja 1000 de acuerdo con otra realización. El aparato comprende un banco de filtros de análisis 1010, un procesador subbanda no lineal de modo—subbanda 1020a, 1020b, un ajustador de envolvente conectado subsiguientemente 1030 o, digo en general, un procesador de reconstrucción de alta frecuencia que 10 opera sobre parámetros de reconstrucción de alta frecuencia, por ejemplo, como entrada en la línea de parámetro 1040. El ajustador de envolvente, o como se expresa en general, el procesador de reconstrucción de alta frecuencia, procesa señales subbanda individuales para cada canal de subbanda y hace entrar señales subbanda procesadas para cada canal de subbanda en un banco de filtros de síntesis 1050. El banco de filtros de síntesis 1050 recibe, en sus señales de entrada de canal inferior, una representación de subbanda de la señal de decodificador por núcleo 15 de banda baja. Dependiendo de la implementación, la banda baja también puede ser derivada de las salidas del banco de filtros de análisis 1010 de la Figura 26. Las señales subbanda transpuestas son alimentadas en canales de banco de filtros más altos del banco de filtros de síntesis para ejecutar reconstrucción de alta frecuencia.
[0093] El banco de filtros 1050 finalmente entrega una señal de salida de medio de transposición la cual comprende 20 extensiones de ancho de banda por factores de transposición 2, 3 y 4, y la señal entregada por el bloque 1050 ya no está limitada en ancho de banda a la frecuencia de transición, esto es, a la más alta frecuencia de la señal de codificador por núcleo que corresponde a la frecuencia más baja de los componentes de señal generados por SBR o HFR. El banco de filtros de análisis 1010 de la Figura 26 corresponde al banco de filtros de análisis 2510 y el banco de filtros de síntesis 1050 puede corresponder al banco de filtros de síntesis 2514 de la Figura 25a. En particular, 25 como se discute en el contexto de la Figura 27, el cálculo de banda fuente ilustrado en el bloque 2507 en la figura 25a es realizado dentro del procesamiento subbanda no lineal 1020a, 1020b, usando los bordes de parche de síntesis alineados y los bordes de banda de limitador calculados por los bloques 2504 y 2505.
[0094] Con respecto a las tablas de banda de frecuencia de limitador, se ha de notar que las tablas de banda de 30 frecuencia de limitador pueden ser construidas para tener o bien una banda de limitados sobre todo el rango de reconstrucción, o bien, aproximadamente 1,2; 2 o 3 bandas por octava, señalizadas por un elemento de serie de bits en el tiempo bs_limi—ter_bands como se define en ISO/IEC 14496—3: 2009, 4.6.18.3.2.3. La tabla de banda puede comprender bandas adicionales correspondientes a los parches de generador de alta frecuencia. La tabla puede contener índices de subbandas de banco de filtros de síntesis, donde el número de elementos es igual al número de 35 bandas más uno. Cuando transposición armónica está activa, se asegura que el calculador de banda de limitador introduce bordes de banda de limitador que coinciden con los bordes de parche definidos por el calculador de borde de parche 2504. Adicionalmente, los restantes bordes de banda de limitador luego son calculados entre aquellos bordes de banda de limitador puestos "fijamente" para los bordes de parche.
40
[0095] En la realización de la Figura 26, el banco de filtros realiza un sobre muestreo de dos veces y tiene un cierto espaciamiento subbanda de análisis 1060. El banco de filtros 1050 tiene un espaciamiento subbanda de síntesis 1070 que es, en esta realización, el doble del espaciamiento subbanda de análisis lo cual da por resultado una contribución de transposición como se discutirá luego en el contexto de la Figura 27.
45
[0096] La Figura 27 ilustra una implementación detallada de una realización preferida de un procesador subbanda no lineal 1020a de la Figura 26. El circuito ilustrado en la Figura 27 recibe como entrada una señal subbanda simple 1080, la cual es procesada en tres "ramas". La rama superior 110a es para una transposición por un factor de transposición de 2. La rama del medio de la Figura 27 indicada en 110b es para una transposición por un factor de transposición de 3, y la rama inferior de la Figura 27 es para una transposición por un factor de transposición 4, y 50 está indicada mediante el número de referencia 110c. Sin embargo, la transposición real obtenida por cada elemento de procesamiento de la Figura 27 es sólo 1 (esto es, sin transposición) por rama 110a. La transposición real obtenida por el elemento de procesamiento ilustrado en la Figura 27 por la rama del medio 110b es igual a 1,5 y la transposición real para la rama inferior 110c es igual a 2. Esto está indicado por los números entre corchetes a la izquierda de la Figura 27, donde están indicados los factores de transposición T. Las transposiciones de 1,5 y 2 55 representan una primera contribución de transposición obtenida teniendo una operación de diezmado en las ramas 110b, 110c y un estiramiento de tiempo mediante el procesador de superponer—sumar. La segunda contribución, esto es, la duplicación de la transposición, se obtiene mediante el banco de filtros de síntesis 105, el cual tiene un espaciamiento subbanda de síntesis 1070 que es el doble del espaciamiento subbanda del banco de filtro de análisis. Por lo tanto, como el banco de filtros de síntesis tiene el doble de espaciamiento subbanda de síntesis, la 60 funcionalidad de diezmado no tiene lugar en la rama 110a.
[0097] Sin embargo, la rama 110b tiene una funcionalidad de diezmado para obtener una transposición por 1,5. Debido al hecho de que el banco de filtros de síntesis tiene el doble de espaciamiento subbanda físico que el banco de filtros de análisis, se obtiene un factor d transposición de 3 como está indicado en la Figura 27 a la izquierda del 65 extractor de bloque para la segunda rama 110b.
[0098] Análogamente, la tercera rama tiene una funcionalidad de diezmado correspondiente a un factor de transposición de 2, y la contribución final del espaciamiento subbanda diferente en el banco de filtros de análisis y el banco de filtros de síntesis finalmente corresponde a un factor de transposición de 4 de la tercera rama 110c.
5
[0099] En particular, cada rama tiene un extractor de bloque 120a, 120b, 120c y cada uno de estos extractores de bloque puede ser similar al extractor de bloque 1800 de la Figura 18. Asimismo, cada rama tiene un calculador de fase 122a, 122b y 122c, y el calculador de fase puede ser similar al calculador de fase 1804 de la Figura 18. Asimismo, cada rama tiene un ajustador de fase 124a, 122b y 122c, y el ajustador de fase puede ser similar al ajustador de fase 1806 de la Figura 18. Asimismo, cada rama tiene un elemento de ventaneo 126a, 120b, 120c, 10 donde cada uno de estos elementos de ventaneo puede ser similar al elemento de ventaneo 1802 de la Figura 18. En toco caso, los elementos de ventaneo 126a, 126b, 126c también pueden ser configurados para aplicar una ventana rectangular junto con algún "rellenado con ceros". Las señales transpuestas o de parche de cada rama 110a, 110b, 110c de la realización de la Figura 11 se ingresa en el sumador 128, el cual suma la contribución proveniente de cada rama a la señal subbanda real para finalmente obtener lo que se denomina bloques de 15 transpuestos en la salida del sumador 128. Luego se realiza un procedimiento de superposición—suma en el medio de superposición—suma 130, y el medio de superposición—suma 130 puede ser similar al bloque de superposición—suma 1808 de la Figura 18. El medio de superposición—suma aplica un valor de avance de superposición—suma d 2 e, donde e es el valor de superposición—avance o "valor de paso" de los extractores de bloque 120a, 120b, 120c, y el medio de superposición—suma 130 entrega la señal transpuesta, que en esta 20 realización de la Figura 27, es una salida subbanda de señal para el canal k, esto es para el canal subbanda actualmente observado. El procesamiento ilustrado en la Figura 27 es realizado para cada subbanda de análisis o para un cierto grupo de subbandas de análisis y, como se ilustra en la Figura 26, se ingresan señales subbanda transpuestas en el banco de filtros de síntesis 105 después de ser procesadas por el bloque 103 para finalmente obtener la señal de salida de medio de transposición ilustrada en la Figura 26 en la salida del bloque de salida 105. 25
[0100] En una realización, el extractor de bloque 120a de la primera rama de medio de transposición 110a extrae 10 muestras subbanda y subsiguientemente se realiza una conversión de estas 10 muestras QMF a coordenadas polares. Esta salida, generada por el ajustador de fase 124a, luego es remitida al elemento de ventaneo 126a, que extiende la salida mediante ceros para el primero y último valor del bloque, donde esta operación es equivalente a 30 un ventaneo (síntesis) con una ventana rectangular de longitud 10. El extractor de bloque 120a de la rama 110a no realiza diezmado. Por lo tanto, las muestras extraídas mediante el extractor de bloque son mapeadas en un bloque extraído en el mismo espaciamiento de muestra que donde fueron extraídas.
[0101] Sin embargo, esto es diferente para las ramas 110b y 110c. El extractor de bloque 120b preferiblemente 35 extrae un bloque de 8 muestras subbanda y distribuye estas 8 muestras subbanda del bloque extraído en un espaciamiento de muestra subbanda diferente. Las entradas de muestra subbanda no enteras para el bloque extraído se obtienen mediante una interpolación, y las muestras QMF así obtenidas junto con las muestras interpoladas son convertidas a coordenadas polares y son procesadas por el ajustador de fase. Luego, de nuevo, se realiza el ventaneo en el elemento de ventaneo 126b para extender la salida de bloque mediante el ajustador de 40 fase 124b mediante ceros para las dos primeras muestras y las dos últimas muestras, cuya operación es equivalente a un ventaneo (síntesis) con una ventana rectangular de longitud 8.
[0102] El extractor de bloque 120c está configurado para extraer un bloque con una extensión de tiempo de 6 muestras subbanda y realiza un diezmado de un factor de diezmado 2, realizar una conversión de las muestras QMF 45 en coordenadas polares y de nuevo realiza una operación en el ajustador de fase 124b, y la salida de nuevo es extendida mediante ceros, aunque ahora para las tres primera muestras subbanda y para las tres últimas muestras subbanda. Esta operación es equivalente a un ventaneo (síntesis) con una venta rectangular de longitud 6.
[0103] Las salidas de transposición de cada rama son sumadas luego para formar la salida de QMF combinada 50 mediante el sumador 128, y las salidas de QMF combinadas son finalmente superpuestas usando superposición—suma en el bloque 130, donde el avance de superposición—suma o valor de paso es el doble que el valor de paso de los extractores de bloque 120a, 120b, 120c como se discutió antes.
[0104] La Figura 27 adicionalmente ilustra la funcionalidad realizada por el calculador de banda fuente 2507 de la 55 Figura 25a, donde se considera que el número de referencia 108 ilustra las señales subbanda de análisis disponibles para una parcheo, esto es, las señales indicadas en 1080 de la Figura 26, que son entregadas por el banco de filtros de análisis 1010 de la Figura 26. La selección de la subbanda correcta de las señales subbanda de análisis o, en la otra realización relacionada con el medio de transposición de DFT, la aplicación de la correcta ventana de frecuencia de análisis es realidad por los extractores de bloque 120a, 120b, 120c. Con este fin, los 60 bordes de parche que indican la primera señal subbanda, la última señal subbanda y las señales subbanda intermedias para cada parche son provistas al extractor de bloque para cada rama de transposición. La primera rama finalmente que da por resultado un factor de transposición de T=2 recibes, con su extractor de bloque 120a todos los índices subbanda entre xOverQmf(0) y xOverQmf(1), y el extractor de bloque 120a entonces extrae un bloque de la subbanda de análisis así seleccionada. Se ha de notar que los bordes de parche se dan como un índice 65 de canal del rango de síntesis indicado por k, y las bandas de análisis están indicadas por n con respecto a sus
canales subbanda. Por ende, como n se calcula dividiendo 2k por T, los números de canal de la banda de análisis n, por lo tanto, son iguales a los números de canal del rango de síntesis debido al doble espaciamiento de frecuencia del banco de filtros de síntesis como se discutió en el contexto de la Figura 26. Esto está indicado arriba del bloque 120a para el primera extractor de bloque 120a o, generalmente, para la primera rama de medio de transposición 110a. Luego, para la segunda rama de parcheo 110b, el extractor de bloque recibe todos los índices 5 de canal de rango de síntesis entre xOverQmf(1) y xOverQmf(2). En particular, los índices de canal de rango fuente, desde los cuales el extractor de bloque tiene que extraer bloques para ulterior procesamiento, son calculados a partir de los índices de canal de rango de síntesis dados por los bordes de parche determinados multiplicando k con el factor 2/3. Entonces, se toma la parte entera de este cálculo como el número de canal de análisis n, del cual luego el extractor de bloque extrae el bloque a ser adicionalmente procesado mediante los elementos 124b, 126b. 10
[0105] Para la tercera rama 110c, el extractor de bloque 120c, otra vez recibe los bordes de parche y realiza una extracción de bloque de las subbandas que corresponden a bandas de síntesis definidas por xOverQmf(2) hasta xOverQmf(3). Los números de análisis n son calculados por 2 multiplicado por k, y éste es la regla de cálculo para calcular los números de canal de análisis a partir de los números de canal de síntesis. En este contexto, se ha de 15 destacar que xOverQmf corresponde a xOverBin de la Figura 24a, a pesar de que la Figura 24a corresponde al parcheador basado en DFT, mientras que xOverQmf corresponde al parcheador basado en QMF. Las reglas de cálculo para determinar xOverQmf(i) es determinada de la misma manera que se ilustra en la Figura 24a, pero no se requiere el factor fftSizeSyn/128 para calcular xOverQmf.
20
[0106] El procedimiento para determinar los bordes de parche para calcular los rangos de análisis para la realización de la Figura 27, también se ilustra en la Figura 24. En el primer paso 2600 se calculan los bordes de parche para los parches correspondientes a los factores de transposición 2, 3, 4 y, opcionalmente, incluso más, como se discutió en el contexto de las figuras 24a o la Figuras 25a. Luego se calcula la ventana del dominio de la frecuencia de rango fuente para el parcheador de DFT o las subbandas de rango fuente para el parcheador de QMF, mediante las 25 ecuaciones discutidas en el contexto de los bloques 120a, 120b, 120c, los cuales también se ilustran a la derecha del bloque 2602. Luego se realiza un parcheo calculando la señal transpuesta y mapeando la señal transpuesta a las altas frecuencias como se indica en el bloque 2604, y el calculo de la señal transpuesta está ilustrado en particular en el procedimiento de la Figura 27, donde la señal transpuesta entregada por el medio de superposición—suma de bloque 130 corresponde al resultado del parcheo generado por el procedimiento del bloque 30 2604 de la Figura 24. El procesamiento del invento es útil para mejorar codificadores—decodificadores de audio que se apoyan en un esquema de extensión en ancho de banda. Especialmente si es muy importante una calidad perceptual óptima a una cantidad de bits transmitidos y, al mismo tiempo, la potencia de procesamiento es un recurso limitado.
35
[0107] La mayoría de las aplicaciones destacadas son decodificadores de audio que son implementados con frecuencia en dispositivos portátiles y, de ese modo, funcionan sobre una fuente de energía de batería.
[0108] La señal de audio codificada puede ser almacenada en un medio de almacenamiento digital o puede ser transmitida a través de un medio de transmisión tal como un medio de transmisión inalámbrico o una medio de 40 transmisión físico tal como Internet.
[0109] Dependiendo de ciertos requerimientos de implementación, las realizaciones del invento pueden ser implementadas en hardware o en software. La implementación se puede llevar a cabo utilizando un medio de almacenamiento digital, por ejemplo un diskette, un DVD, un CD, una ROM, una EPROM, una EEPROM o una 45 memoria FLASH, los cuales tienen unas señales de control electrónicamente legibles guardadas en ellos, las cuales cooperan (o son capaces de cooperar) con un sistema de computación programable de modo que se ejecuta el respectivo método.
[0110] Algunas realizaciones de acuerdo con el invento comprenden un portador de datos que tiene señales de 50 control legibles electrónicamente, las cuales son capaces de cooperar con una sistema de computadora programable, tal que uno de los métodos descrito en la presente sea ejecutado.
[0111] Generalmente, realizaciones del presente invento pueden ser implementadas como un programa de computador con un código de programa, siendo código de programa operativo para ejecutar uno de los métodos 55 cuando el producto de programa de computadora corre en una computadora. El código de programa puede ser almacenado, por ejemplo, sobre un portador legible por una máquina.
[0112] Otras realizaciones comprenden el programa de computadora para ejecutar uno de los métodos descritos en la presente, almacenado en un portador legible por una máquina. 60
[0113] En otras palabras, una realización del método inventivo es, por lo tanto, un programa de computadora que un código de programa para ejecutar uno de los métodos descritos en la presente, cuando el programa de computadora corre en una computadora.
65
[0114] Una realización adicional de los métodos inventivos es, por lo tanto, un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, grabado en el mismo, el programa de computadora para ejecutar uno de los métodos descritos en la presente.
[0115] Una realización adicional del método inventivo es, por lo tanto, una transmisión de datos o una secuencia de 5 señales que representan el programa de computador para ejecutar uno de los métodos descritos en la presente. La transmisión de datos o la secuencia de señales pueden ser configuradas, por ejemplo, para ser transferidos vía una conexión de comunicación de datos, por ejemplo, vía Internet.
[0116] Una realización adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un 10 dispositivo lógico programable, configurado para o adaptado para ejecutar uno de los métodos descritos en la presente.
[0117] Una realización adicional comprende una computadora que tiene instalado en ella el programa de computadora para ejecutar uno de los métodos descritos en la presente. 15
[0118] En algunas realizaciones se puede usar un dispositivo de lógica programable (por ejemplo un arreglo de compuesta programable de campo) para realizar algunas o todas las funcionalidades de los métodos descritos en la presente. En algunas realizaciones, el arreglo de compuerta programable de campo puede cooperar con un microprocesador para realizar uno de los métodos descritos en la presente. Generalmente, los métodos 20 preferiblemente son realizados mediante algún aparato de hardware.
[0119] Las realizaciones que se describieron más arriba son puramente ilustrativas para los principios del presente invento. Se entiende que las modificaciones y variaciones posibles de las disposiciones y de los detalles descritos en la presente serán evidentes para los expertos en la materia. Por lo tanto, es la intención que el invento esté limitado 25 sólo por el alcance de las siguientes reivindicaciones de patente y no por los detalles específicos presentados por la descripción y la explicación de las realizaciones en la presente.
LITERATURA:
30
[0120]
[1] M. Dietz, L. Liljeryd, K. Kjörling y O. Kunz, Replicación de Banda Espectral, un enfoque novedoso en codificación de audio" (“Spectral Band Replication, a novel approach in audio coding”) en la 112º Convención AES, Munich, mayo de 2002. 35
[2] S. Meltzer, R. Böhm y F. Henn, " Codificadores—decodificadores de audio mejorados con SBR para radiodifusión digital tal como "Digital Radio Mondiale" (DRM)" (“SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale” (DRM),”) en la 112º Convención AES, Munich, mayo de 2002.
[3] T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Mejoramiento de mp3 con SBR: Rasgos y Capacidades del nuevo Algoritmo mp3PRO" (“Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,”) 40 en la 112º Convención AES, Munich, mayo de 2002.
[4] Norma Internacional ISO/IEC 14496–3: 2001/FPDAM 1 “Extensión de Ancho de Banda” ISO/IEC, 2002. (International Standard ISO/IEC 14496—3:2001/FPDAM 1, “Bandwidth Extension” ISO/IEC, 2002.) "Método y Aparato de extensión de ancho de banda de voz" (Speech bandwidth extension method and apparatus) Vasu Iyengar et al.. 45
[5] Larsen, R. M. Aarts, y M. Danessis. "Extensión de ancho de banda de alta frecuencia eficiente de música y voz" ("Efficient high—frequency bandwidth extension of music and speech") en la convención 112º AES, Munich, Alemania, mayo de 2002.
[6] R. M. Aarts, E. Larsen, y O. Ouweltjes. "Un enfoque unificado a la extensión de ancho de banda de baja y alta frecuencia" (A unified approach to low— and high frequency bandwidth extension). en La 115º Convención AES, 50 New York, USA, octubre de 2003.
[7] K. Käyhkö. "Un Mejoramiento de Banda Ancha Robusto para Señal de Voz de Banda angosta" (A Robust Wideband Enhancement for Narrowband Speech Signal). Informe de investigación, Universidad de Tecnología de Helsinki, Laboratorio de Acústica y Procesamiento de Señal de Audio (Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing), 2001. 55
[8] E. Larsen y R. M. Aarts. "Extensión de Ancho de Banda de Audio — Aplicación a Psicoacústica, Procesamiento de Señal y Diseño de Altavoz" (Audio Bandwidth Extension — Application to psychoacoustics, Signal Processing and Loudspeaker Design). John Wiley & Sons, Ltd, 2004.
[9] Larsen, R. M. Aarts, y M. Danessis. "Extensión de ancho de banda de alta frecuencia eficiente de música y voz" ("Efficient high—frequency bandwidth extension of music and speech") en la convención 112º AES, Munich, 60 Alemania, mayo de 2002.
[10] J. Makhoul. "Análisis Espectral de Voz mediante Predicción Lineal" (Spectral Analysis of Speech by Linear Prediction). IEEE "Transacciones de Audio y Electroacústica" (Transactions on Audio and Electroacoustics), AU—21(3), junio de 1973.
[11] Solicitud de Patente de Estados Unidos Número 08/951.029, Ohmori , et al. "Sistema y método de 65 extensión de ancho de banda de audio" ("Audio band width extending system and method")
[12] Patente de Estados Unidos Nº 6895375, Malah, D & Cox, R. V.: "Sistema para extensión de ancho de banda de vos de banda angosta" (System for bandwidth extension of Narrow—band speech).
[13] Frederik Nagel, Sascha Disch, "Un método de extensión de ancho de banda armónica para codificador–decodificador de audio" (“A harmonic bandwidth extension method for audio codecs”), ICASSP Congreso Internacional sobre el procesamiento de acústica, voz y señal (International Conference on Acoustics, Speech and 5 Signal Processing), IEEE CNF, Taipei, Taiwan, Abril de 2009
[14] Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, "Un método de extensión de ancho de banda impulsada por vocoder de fase con un nuevo tratamiento de componentes transitorios para códigos de audio." ("A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs,”) 126th AES Convention, Munich, Alemania, mayo de 2009. 10
[15] M. Puckette. Vocoder de fase sincronizada. Congreso IEEE ASSP sobre Aplicaciones de Procesamiento de Señales en Audio y Acústica. (Phase—locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics), Mohonk 1995.", A. Röbel, : "Detección y preservación de componentes transitorios en el vocoder de fase." ("Transient detection and preservation in the phase vocoder,") citeseer.ist.psu.edu/679246.html 15
[16] Laroche L., Dolson M.: "Modificación mejorada de escala de tiempo de vocoder de fase de audio (“Improved phase vocoder timescale modification of audio"), IEEE Trans, sobre procesamiento de voz y audio (IEEE Trans. Speech and Audio Processing), vol. 7, no. 3, pp. 323—332,
[17] Patente de los Estados Unidos 6 549 884, Laroche, J. & Dolson, M.: "Desplazamiento de tono de fase—vocoder" (“Phase—vocoder pitch—shifting”) 20
[18] Herre, J.; Faller, C.; Ertel, C.; Hilpert, J.; Hölzer, A.; Spenger, C, "Surround de MP3: Codificación Eficiente y Compatible de Señales de Audio de Múltiples Canales" ("MP3 Surround: Efficient and Compatible Coding of Multi—Channel Audio"), 116° Congreso de la Sociedad de Ingenioros de Audio, Mayo de 2004 (116th Conv. Aud. Eng. Soc., May 2004)
[19] Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jérémie; Bessette, Bruno; Geiger, Ralf; 25 Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Esquema de Codificación Unificada de Voz y Audio para una Alta Calidad con una Baja Cantidad de Bits Transmitidos" ("Unified Speech and Audio Coding Scheme for High Quality at Lowbitrates"), ICASSP 2009 (Congreso Internacional sobre el procesamiento de acústica, voz y señal), 19 al 24 de Abril de 2009, Taipei, Taiwan 30
[20] Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jérémie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: "Un Esquema Novedoso para la Codificación Unificada de Voz y Audio con una Baja Cantidad de Bits Transmitidos" ("A Novel Scheme for Low Bitrate Unified Speech and Audio Coding"), en la convención 126º AES, Munich, Alemania, 7 de mayo de 2009. 35
Claims (13)
- REIVINDICACIONES1. Aparato que permite tratar una señal de audio para generar una señal de anchura de banda extendida que presenta una parte de altas frecuencias (102) y una parte de bajas frecuencias (104) con ayuda de los datos paramétricos (2302) para la parte de altas frecuencias (102), datos paramétricos relativos a las bandas de 5 frecuencias (100, 101) de la parte de altas frecuencias (102), que comprende:un calculador de límite de extensión (2302) destinado a calcular un límite de extensión (1001c, 1002c, 1002d, 1003c, 1003b) entre una pluralidad de límites de extensión de manera que el límite de extensión coincida con un límite de las bandas de frecuencias (101, 100) de la parte de altas frecuencias (102); y 10un medio de extensión (2312) destinado a generar una señal extendida con ayuda de la señal de audio (2300) y del límite de extensión (1001c, 1002c, 1002b, 1003c, 1003b), en el que los límites de extensión se refieren a la parte de altas frecuencias (102) de la señal de anchura de banda extendida;15en el cual el calculador de límite de extensión (2302) está configurado para:calcular (2520) una tabla de frecuencias que definen las bandas de frecuencias de la parte de altas frecuencias (102) con ayuda de los datos paramétricos o de otros datos de entrada de configuración;20determinar (2522) un límite de extensión de síntesis diana con ayuda de al menos un factor de transposición;buscar (2524), en la tabla de frecuencias, una banda de frecuencias coincidente que presenta un límite coincidente que coincide con el límite de extensión de síntesis diana en un intervalo de coincidencias predeterminado, o buscar la banda de frecuencias que presenta un límite de banda de frecuencias la más cercana del límite de extensión de 25 síntesis diana; yseleccionar (2525, 2527), como límite de extensión, el límite coincidente que coincide con el límite de extensión de síntesis diana en el intervalo de coincidencias predeterminado o el límite de banda de frecuencias más cercano del límite de extensión de síntesis diana encontrado durante la búsqueda (2524). 30
- 2. Aparato según la reivindicación 1, en el cual el calculador de límite de extensión (2302) está configurado para calcular los límites de extensión para tres factores de transposición diferentes de manera que cada límite de extensión coincide con un límite de las bandas de frecuencias (100, 101) de la parte de altas frecuencias, y en el cual el medio de extensión (2312) está configurado para generar la señal extendida con ayuda de los tres factores 35 de transposición diferentes (2308) de manera que un límite entre extensiones adyacentes coincide con un límite entre dos bandas de frecuencias (100, 101) adyacentes.
- 3. Aparato según cualquiera de las reivindicaciones anteriores, en el cual el calculador de límite de extensión (2302) está configurado para calcular el límite de extensión como límite de frecuencia (k) en un intervalo de frecuencias de 40 síntesis correspondiente a la parte de altas frecuencias (102), y en el cual el medio de extensión (2312) está configurado para seleccionar una parte de frecuencia de la parte de la banda baja (104) con ayuda de un factor de transposición y del límite de extensión.
- 4. Aparato según cualquiera de las reivindicaciones anteriores, que comprende por otro lado: un reconstructor de 45 altas frecuencias (1030, 2510) destinado a ajustar la señal extendida (2509) con ayuda de los datos paramétricos (2302), estando el reconstructor de altas frecuencias configurado para calcular, para una banda de frecuencias o un grupo de bandas de frecuencias, un factor de ganancia a utilizar para ponderar la banda de frecuencias o un grupo de bandas de frecuencias correspondiente de la señal extendida (2509).50
- 5. Aparato según la reivindicación 1, en el cual el intervalo de coincidencias predeterminado está ajustado a un valor inferior o igual a cinco bandas QMF o 40 bins de frecuencias de la parte de altas frecuencias (102).
- 6. Aparato según cualquiera de las reivindicaciones anteriores, en el cual los datos paramétricos comprenden un valor de datos de envolvente espectral, en el cual se determina, para cada banda de frecuencias, un valor de datos 55 de envolvente espectral separada, en el cual el aparato comprende por otro lado un reconstructor de altas frecuencias (2510, 1030) destinado a ajustar en envolvente espectral cada banda de la señal extendida con ayuda del valor de datos de envolvente espectral para esta banda.
- 7. Aparato según cualquiera de las reivindicaciones anteriores, en el cual el calculador de límite de extensión (2302) 60 está configurado para buscar en la tabla de frecuencias el límite más elevado que no sobrepasa un límite de anchura de banda de una señal regenerada en altas frecuencias para un factor de transposición, y para utilizar el límite más elevado encontrado como límite de extensión.
- 8. Aparato según la reivindicación 7, en el cual el calculador de límite de extensión (2302) está configurado para recibir, para cada factor de transposición entre la pluralidad de factores de transposición diferentes, un límite de extensión diana diferente.
- 9. Aparato según cualquiera de las reivindicaciones anteriores, que comprende por otro lado una herramienta de 5 limitación (2505, 2510) destinada a calcular las bandas de limitación utilizadas para limitar los valores de ganancia para ajustar las señales extendidas, comprendiendo el aparato por otro lado un calculador de bandas de limitación configurado para definir un límite de limitación de manera que al menos un límite de extensión determinada por el calculador de límite de extensión (2302) también se establezca como límite de limitación.10
- 10. Aparato según la reivindicación 9, en el cual el calculador de bandas de limitación (2505) está configurado para calcular otros límites de limitación de manera que los otros límites de limitación coinciden con los límites de las bandas de frecuencias de la parte de altas frecuencias (102).
- 11. Dispositivo según cualquiera de las reivindicaciones anteriores, en el cual el medio de extensión (2312) está 15 configurado para generar múltiples extensiones con ayuda de diferentes factores de transposición (2308), en el cual el calculador de límite de extensión (2302) está configurado para calcular los límites de extensión de cada extensión entre las múltiples extensiones de manera que los límites de extensión coinciden con límites diferentes de las bandas de frecuencias de la parte de altas frecuencias (102), en el cual el aparato comprende por otro lado un ajustador de envolvente (2510) destinado a ajustar una envolvente de la parte de altas frecuencias (102) tras la 20 extensión o a ajustar la parte de altas frecuencias antes de la extensión con ayuda de los factores de escala comprendida en los datos paramétricos suministrados para las bandas de factores de escala.
- 12. Procedimiento que permite tratar una señal de audio para generar una señal extendida en anchura de banda que presenta una parte de altas frecuencias (102) y una parte de bajas frecuencias (104) con ayuda de los datos 25 paramétricos (2302) para la parte de altas frecuencias (102), datos paramétricos relativos a las bandas de frecuencias (100, 101) de la parte de altas frecuencias (102), que comprende:calcular (2302) un límite de extensión (1001c, 1002c, 1002d, 1003c, 1003b) de manera que el límite de extensión entre una pluralidad de límites de extensión coincida con un límite de las bandas de frecuencias (101, 100) de la 30 parte de altas frecuencias (102); ygenerar (2312) una señal extendida con ayuda de la señal de audio (2300) y del límite de extensión (1001c, 1002c, 1002b, 1003c, 1003b), en el que los límites de extensión se refieren a la parte de altas frecuencias (102) de la señal de anchura de banda extendida, en el cual la etapa de cálculo (2302) de un límite de extensión comprende: 35calcular (2520) una tabla de frecuencias que definen las bandas de frecuencias de la parte de altas frecuencias (102) con ayuda de los datos paramétricos o de otros datos de entrada de configuración;determinar (2522) un límite de extensión de síntesis diana con ayuda de al menos un factor de transposición; 40buscar (2524), en la tabla de frecuencias, una banda de frecuencias coincidente que presenta un límite coincidente que coincida con el límite de extensión de síntesis diana en un intervalo de coincidencias predeterminado, o buscar la banda de frecuencias que presenta un límite de banda de frecuencias la más cercana del límite de extensión de síntesis diana; y 45seleccionar (2525, 2527), como límite de extensión, el límite coincidente que coincide con el límite de extensión de síntesis diana en el intervalo de coincidencias predeterminado o el límite de banda de frecuencias más cercana del límite de extensión de síntesis diana encontrado durante la búsqueda (2524).
- 13. Programa de ordenador que tiene un código de programa adaptado para realizar, cuando se ejecuta en un 50 ordenador, el procedimiento según la reivindicación 12.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31212710P | 2010-03-09 | 2010-03-09 | |
US312127P | 2010-03-09 | ||
PCT/EP2011/053313 WO2011110499A1 (en) | 2010-03-09 | 2011-03-04 | Apparatus and method for processing an audio signal using patch border alignment |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2522171T3 true ES2522171T3 (es) | 2014-11-13 |
Family
ID=43987731
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES11715452.6T Active ES2522171T3 (es) | 2010-03-09 | 2011-03-04 | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
ES19179788T Active ES2935637T3 (es) | 2010-03-09 | 2011-03-04 | Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES19179788T Active ES2935637T3 (es) | 2010-03-09 | 2011-03-04 | Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada |
Country Status (18)
Country | Link |
---|---|
US (7) | US9792915B2 (es) |
EP (4) | EP2545553B1 (es) |
JP (2) | JP5523589B2 (es) |
KR (2) | KR101425154B1 (es) |
CN (2) | CN103038819B (es) |
AR (2) | AR080476A1 (es) |
AU (2) | AU2011226212B2 (es) |
BR (5) | BR122021014312B1 (es) |
CA (2) | CA2792452C (es) |
ES (2) | ES2522171T3 (es) |
HK (1) | HK1181180A1 (es) |
MX (2) | MX2012010416A (es) |
MY (1) | MY154204A (es) |
PL (2) | PL3570278T3 (es) |
RU (1) | RU2586846C2 (es) |
SG (1) | SG183967A1 (es) |
TW (2) | TWI444991B (es) |
WO (2) | WO2011110500A1 (es) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2704143B1 (en) * | 2009-10-21 | 2015-01-07 | Panasonic Intellectual Property Corporation of America | Apparatus, method and computer program for audio signal processing |
EP2362376A3 (en) * | 2010-02-26 | 2011-11-02 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using envelope shaping |
ES2522171T3 (es) * | 2010-03-09 | 2014-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
SG178320A1 (en) | 2010-06-09 | 2012-03-29 | Panasonic Corp | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit and audio decoding apparatus |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
EP3975177B1 (en) | 2010-09-16 | 2022-12-14 | Dolby International AB | Cross product enhanced subband block based harmonic transposition |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
JP6155274B2 (ja) * | 2011-11-11 | 2017-06-28 | ドルビー・インターナショナル・アーベー | 過剰サンプリングされたsbrを使ったアップサンプリング |
TWI478548B (zh) * | 2012-05-09 | 2015-03-21 | Univ Nat Pingtung Sci & Tech | 對等網路串流傳輸方法 |
EP2709106A1 (en) * | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
CN103915104B (zh) * | 2012-12-31 | 2017-07-21 | 华为技术有限公司 | 信号带宽扩展方法和用户设备 |
DE112014000945B4 (de) * | 2013-02-22 | 2021-10-28 | Mitsubishi Electric Corporation | Sprachbetonungsgerät |
EP2975890A4 (en) * | 2013-03-14 | 2017-01-04 | LG Electronics Inc. | Method for receiving signal by using device-to-device communication in wireless communication system |
JP6553590B2 (ja) * | 2013-03-26 | 2019-07-31 | バラット, ラックラン, ポールBARRATT, Lachlan, Paul | サンプルレートを仮想的に増加させた音声フィルタ処理 |
US9305031B2 (en) * | 2013-04-17 | 2016-04-05 | International Business Machines Corporation | Exiting windowing early for stream computing |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
US9454970B2 (en) * | 2013-07-03 | 2016-09-27 | Bose Corporation | Processing multichannel audio signals |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
TWI584567B (zh) * | 2013-08-12 | 2017-05-21 | Idt歐洲有限公司 | 功率轉換器及用於功率轉換器的控制方法 |
CA2887124C (en) * | 2013-08-28 | 2015-09-29 | Mixgenius Inc. | System and method for performing automatic audio production using semantic data |
TWI557726B (zh) | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
KR101815079B1 (ko) | 2013-09-17 | 2018-01-04 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
KR101804745B1 (ko) | 2013-10-22 | 2017-12-06 | 한국전자통신연구원 | 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치 |
CN104681034A (zh) * | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
WO2015079946A1 (ja) * | 2013-11-29 | 2015-06-04 | ソニー株式会社 | 周波数帯域拡大装置および方法、並びにプログラム |
WO2015099429A1 (ko) | 2013-12-23 | 2015-07-02 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치 |
BR112016014476B1 (pt) | 2013-12-27 | 2021-11-23 | Sony Corporation | Aparelho e método de decodificação, e, meio de armazenamento legível por computador |
US9832585B2 (en) | 2014-03-19 | 2017-11-28 | Wilus Institute Of Standards And Technology Inc. | Audio signal processing method and apparatus |
KR102216801B1 (ko) | 2014-04-02 | 2021-02-17 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
US9306606B2 (en) * | 2014-06-10 | 2016-04-05 | The Boeing Company | Nonlinear filtering using polyphase filter banks |
EP2963648A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using vertical phase correction |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
KR101523559B1 (ko) * | 2014-11-24 | 2015-05-28 | 가락전자 주식회사 | 토폴로지를 이용한 오디오 스트림 형성 장치 및 방법 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
TWI693595B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TWI693594B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10129659B2 (en) | 2015-05-08 | 2018-11-13 | Doly International AB | Dialog enhancement complemented with frequency transposition |
KR101661713B1 (ko) * | 2015-05-28 | 2016-10-04 | 제주대학교 산학협력단 | 파라메트릭 어레이 응용을 위한 변조 방법 및 장치 |
US9514766B1 (en) * | 2015-07-08 | 2016-12-06 | Continental Automotive Systems, Inc. | Computationally efficient data rate mismatch compensation for telephony clocks |
US10672408B2 (en) | 2015-08-25 | 2020-06-02 | Dolby Laboratories Licensing Corporation | Audio decoder and decoding method |
BR112018005391B1 (pt) * | 2015-09-22 | 2023-11-21 | Koninklijke Philips N.V | Aparelho para processamento de sinais de áudio, método de processamento de sinais de áudio, e dispositivo |
US10586553B2 (en) | 2015-09-25 | 2020-03-10 | Dolby Laboratories Licensing Corporation | Processing high-definition audio data |
EP3171362B1 (en) * | 2015-11-19 | 2019-08-28 | Harman Becker Automotive Systems GmbH | Bass enhancement and separation of an audio signal into a harmonic and transient signal component |
EP3182411A1 (en) * | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
US10157621B2 (en) * | 2016-03-18 | 2018-12-18 | Qualcomm Incorporated | Audio signal decoding |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US10848363B2 (en) * | 2017-11-09 | 2020-11-24 | Qualcomm Incorporated | Frequency division multiplexing for mixed numerology |
EP3729427A1 (en) * | 2017-12-19 | 2020-10-28 | Dolby International AB | Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements |
TWI834582B (zh) * | 2018-01-26 | 2024-03-01 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
CN114242089A (zh) | 2018-04-25 | 2022-03-25 | 杜比国际公司 | 具有减少后处理延迟的高频重建技术的集成 |
CN118800271A (zh) | 2018-04-25 | 2024-10-18 | 杜比国际公司 | 高频音频重建技术的集成 |
WO2021154211A1 (en) * | 2020-01-28 | 2021-08-05 | Hewlett-Packard Development Company, L.P. | Multi-channel decomposition and harmonic synthesis |
CN111768793B (zh) * | 2020-07-11 | 2023-09-01 | 北京百瑞互联技术有限公司 | 一种lc3音频编码器编码优化方法、系统、存储介质 |
TWI834408B (zh) * | 2022-12-02 | 2024-03-01 | 元智大學 | 兩階濾波器 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55107313A (en) | 1979-02-08 | 1980-08-18 | Pioneer Electronic Corp | Adjuster for audio quality |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US6766300B1 (en) | 1996-11-07 | 2004-07-20 | Creative Technology Ltd. | Method and apparatus for transient detection and non-distortion time scaling |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6549884B1 (en) | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
MXPA03009357A (es) | 2001-04-13 | 2004-02-18 | Dolby Lab Licensing Corp | Escalamiento en el tiempo y escalamiento en el tono de alta calidad de senales de audio. |
EP1351401B1 (en) | 2001-07-13 | 2009-01-14 | Panasonic Corporation | Audio signal decoding device and audio signal encoding device |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP4227772B2 (ja) | 2002-07-19 | 2009-02-18 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
JP4313993B2 (ja) | 2002-07-19 | 2009-08-12 | パナソニック株式会社 | オーディオ復号化装置およびオーディオ復号化方法 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
KR100524065B1 (ko) * | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
US7372907B2 (en) * | 2003-06-09 | 2008-05-13 | Northrop Grumman Corporation | Efficient and flexible oversampled filterbank with near perfect reconstruction constraint |
US20050018796A1 (en) * | 2003-07-07 | 2005-01-27 | Sande Ravindra Kumar | Method of combining an analysis filter bank following a synthesis filter bank and structure therefor |
US7337108B2 (en) | 2003-09-10 | 2008-02-26 | Microsoft Corporation | System and method for providing high-quality stretching and compression of a digital audio signal |
CN101556800B (zh) | 2003-10-23 | 2012-05-23 | 松下电器产业株式会社 | 音频频谱编解码方法和装置、声音信号发送和接收装置 |
JP4254479B2 (ja) * | 2003-10-27 | 2009-04-15 | ヤマハ株式会社 | オーディオ帯域拡張再生装置 |
DE102004046746B4 (de) * | 2004-09-27 | 2007-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten |
US8255231B2 (en) | 2004-11-02 | 2012-08-28 | Koninklijke Philips Electronics N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
CN1668058B (zh) * | 2005-02-21 | 2011-06-15 | 南望信息产业集团有限公司 | 基于递归最小平方差的子带回声抵消器 |
ATE421845T1 (de) | 2005-04-15 | 2009-02-15 | Dolby Sweden Ab | Zeitliche hüllkurvenformgebung von entkorrelierten signalen |
JP2007017628A (ja) | 2005-07-06 | 2007-01-25 | Matsushita Electric Ind Co Ltd | 復号化装置 |
US7565289B2 (en) | 2005-09-30 | 2009-07-21 | Apple Inc. | Echo avoidance in audio time stretching |
JP4760278B2 (ja) | 2005-10-04 | 2011-08-31 | 株式会社ケンウッド | 補間装置、オーディオ再生装置、補間方法および補間プログラム |
WO2007069150A1 (en) | 2005-12-13 | 2007-06-21 | Nxp B.V. | Device for and method of processing an audio data stream |
US7676374B2 (en) * | 2006-03-28 | 2010-03-09 | Nokia Corporation | Low complexity subband-domain filtering in the case of cascaded filter banks |
FR2910743B1 (fr) * | 2006-12-22 | 2009-02-20 | Thales Sa | Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade. |
KR20100086000A (ko) * | 2007-12-18 | 2010-07-29 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
CN101471072B (zh) * | 2007-12-27 | 2012-01-25 | 华为技术有限公司 | 高频重建方法、编码装置和解码装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
CN102881294B (zh) | 2008-03-10 | 2014-12-10 | 弗劳恩霍夫应用研究促进协会 | 操纵具有瞬变事件的音频信号的方法和设备 |
US9147902B2 (en) | 2008-07-04 | 2015-09-29 | Guangdong Institute of Eco-Environmental and Soil Sciences | Microbial fuel cell stack |
BRPI0904958B1 (pt) | 2008-07-11 | 2020-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral |
EP2301027B1 (en) | 2008-07-11 | 2015-04-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for generating bandwidth extension output data |
JP5255699B2 (ja) * | 2008-07-11 | 2013-08-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 帯域幅拡張信号の生成装置及び生成方法 |
US8258849B2 (en) * | 2008-09-25 | 2012-09-04 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
EP2945159B1 (en) * | 2008-12-15 | 2018-03-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and bandwidth extension decoder |
EP2953131B1 (en) | 2009-01-28 | 2017-07-26 | Dolby International AB | Improved harmonic transposition |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
ES2963061T3 (es) | 2009-10-21 | 2024-03-25 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
US8321216B2 (en) | 2010-02-23 | 2012-11-27 | Broadcom Corporation | Time-warping of audio signals for packet loss concealment avoiding audible artifacts |
ES2522171T3 (es) * | 2010-03-09 | 2014-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
MX2012010314A (es) | 2010-03-09 | 2012-09-28 | Fraunhofer Ges Forschung | Dispositivo y metodo para respuesta de magnitud mejorada y alineacion temporaria en un metodo de extension de ancho de banda basado en un codificador de fase operado por voz para señales de audio. |
-
2011
- 2011-03-04 ES ES11715452.6T patent/ES2522171T3/es active Active
- 2011-03-04 RU RU2012142732/08A patent/RU2586846C2/ru active
- 2011-03-04 CA CA2792452A patent/CA2792452C/en active Active
- 2011-03-04 JP JP2012556464A patent/JP5523589B2/ja active Active
- 2011-03-04 WO PCT/EP2011/053315 patent/WO2011110500A1/en active Application Filing
- 2011-03-04 AU AU2011226212A patent/AU2011226212B2/en active Active
- 2011-03-04 JP JP2012556463A patent/JP5588025B2/ja active Active
- 2011-03-04 KR KR1020127026267A patent/KR101425154B1/ko active IP Right Grant
- 2011-03-04 BR BR122021014312-9A patent/BR122021014312B1/pt active IP Right Grant
- 2011-03-04 AU AU2011226211A patent/AU2011226211B2/en active Active
- 2011-03-04 BR BR122021019082-8A patent/BR122021019082B1/pt active IP Right Grant
- 2011-03-04 EP EP11715452.6A patent/EP2545553B1/en active Active
- 2011-03-04 MX MX2012010416A patent/MX2012010416A/es active IP Right Grant
- 2011-03-04 CN CN201180023444.1A patent/CN103038819B/zh active Active
- 2011-03-04 EP EP22203358.1A patent/EP4148729A1/en active Pending
- 2011-03-04 MY MYPI2012004003A patent/MY154204A/en unknown
- 2011-03-04 MX MX2012010415A patent/MX2012010415A/es active IP Right Grant
- 2011-03-04 PL PL19179788.5T patent/PL3570278T3/pl unknown
- 2011-03-04 WO PCT/EP2011/053313 patent/WO2011110499A1/en active Application Filing
- 2011-03-04 EP EP11707400A patent/EP2545548A1/en not_active Ceased
- 2011-03-04 ES ES19179788T patent/ES2935637T3/es active Active
- 2011-03-04 EP EP19179788.5A patent/EP3570278B1/en active Active
- 2011-03-04 KR KR1020127026332A patent/KR101414736B1/ko active IP Right Grant
- 2011-03-04 CN CN201180023443.7A patent/CN102939628B/zh active Active
- 2011-03-04 PL PL11715452T patent/PL2545553T3/pl unknown
- 2011-03-04 BR BR112012022740-8A patent/BR112012022740B1/pt active IP Right Grant
- 2011-03-04 BR BR122021014305-6A patent/BR122021014305B1/pt active IP Right Grant
- 2011-03-04 BR BR112012022574-0A patent/BR112012022574B1/pt active IP Right Grant
- 2011-03-04 CA CA2792450A patent/CA2792450C/en active Active
- 2011-03-04 SG SG2012066544A patent/SG183967A1/en unknown
- 2011-03-08 TW TW100107715A patent/TWI444991B/zh active
- 2011-03-08 TW TW100107724A patent/TWI446337B/zh active
- 2011-03-09 AR ARP110100723A patent/AR080476A1/es active IP Right Grant
- 2011-03-09 AR ARP110100724A patent/AR080477A1/es active IP Right Grant
-
2012
- 2012-09-05 US US13/604,364 patent/US9792915B2/en active Active
- 2012-09-05 US US13/604,336 patent/US9305557B2/en active Active
-
2013
- 2013-07-16 HK HK13108340.5A patent/HK1181180A1/xx unknown
-
2017
- 2017-03-15 US US15/459,520 patent/US10032458B2/en active Active
-
2018
- 2018-06-22 US US16/016,284 patent/US10770079B2/en active Active
-
2020
- 2020-05-19 US US16/878,313 patent/US11495236B2/en active Active
-
2022
- 2022-10-21 US US18/048,810 patent/US11894002B2/en active Active
-
2023
- 2023-12-27 US US18/397,158 patent/US20240135939A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2522171T3 (es) | Aparato y método para procesar una señal de audio usando alineación de borde de patching | |
ES2813940T3 (es) | Aparato, método y programa informático para decodificar una señal de audio codificada | |
ES2796493T3 (es) | Aparato y método para convertir una señal de audio en una representación parametrizada, aparato y método para modificar una representación parametrizada, aparato y método para sintetizar una representación parametrizada de una señal de audio | |
BR122021019078B1 (pt) | Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata |