ES2906085T3 - Sobremuestreo en un banco de filtros de reemisor combinado - Google Patents
Sobremuestreo en un banco de filtros de reemisor combinado Download PDFInfo
- Publication number
- ES2906085T3 ES2906085T3 ES20172571T ES20172571T ES2906085T3 ES 2906085 T3 ES2906085 T3 ES 2906085T3 ES 20172571 T ES20172571 T ES 20172571T ES 20172571 T ES20172571 T ES 20172571T ES 2906085 T3 ES2906085 T3 ES 2906085T3
- Authority
- ES
- Spain
- Prior art keywords
- analysis
- synthesis
- window
- order
- transposition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 178
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 167
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 166
- 230000017105 transposition Effects 0.000 claims abstract description 100
- 238000012545 processing Methods 0.000 claims abstract description 35
- 230000009466 transformation Effects 0.000 claims abstract description 14
- 230000005236 sound signal Effects 0.000 claims abstract description 11
- 238000005070 sampling Methods 0.000 claims description 22
- 238000000034 method Methods 0.000 claims description 21
- 230000001052 transient effect Effects 0.000 description 16
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 description 10
- 238000013507 mapping Methods 0.000 description 7
- 238000002592 echocardiography Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000036278 prepulse Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Networks Using Active Elements (AREA)
- Static Random-Access Memory (AREA)
Abstract
Un sistema para generar una señal de salida que comprende una componente de alta frecuencia a partir de una señal de audio de entrada que comprende una componente de baja frecuencia usando un orden de transposición T, que comprende: una unidad de ventana de análisis configurada para aplicar una ventana de análisis (611) de una longitud de muestras LA, extrayendo así un cuadro de la señal de entrada; una unidad de transformación de análisis de orden M (601) y que tiene una resolución de frecuencia Δf configurada para transformar las muestras LA en M coeficientes complejos; una unidad de procesamiento no lineal (643, 644, 650), configurada para alterar la fase de los coeficientes complejos utilizando el orden de transposición T; una unidad de transformación de síntesis (602) de orden M y que tiene una resolución de frecuencia QΔf, configurada para transformar los coeficientes alterados en M muestras de dominio temporal; en donde Q es un factor de resolución de frecuencia menor o igual que el orden de transposición T; y una unidad de ventana de síntesis configurada para aplicar una ventana de síntesis (612) de una longitud de muestras Ls a las M muestras de dominio temporal, generando así un cuadro de la señal de salida; en donde la orden de transformación M es M = F· Ls, y en donde .
Description
DESCRIPCIÓN
Sobremuestreo en un banco de filtros de reemisor combinado
Referencia cruzada a solicitudes relacionadas
Esta solicitud es una solicitud divisional europea de la solicitud de patente europea EP17192422.8 (referencia: D09105EP03), para la cual se presentó el formulario OEP 1001 el 21 de septiembre de 2017.
Campo técnico
La presente invención se refiere a la codificación de señales de audio, y en particular a métodos de reconstrucción de alta frecuencia que incluyen un reemisor armónico de dominio de frecuencia.
Antecedentes de la invención
Las tecnologías HFR, tales como la tecnología de replicación de banda espectral (SBR), permiten mejorar significativamente la eficiencia de codificación de los códecs de audio perceptuales tradicionales. En combinación con codificación de audio avanzada (AAC) de MPEG-4, la tecnología HFR forma unos códecs de audio muy eficientes, que ya están en uso en el sistema de XM Satellite Radio y Digital Radio Mondiale, y también estandarizadas en 3GPP, DVD Forum, y otros. La combinación de AAC y SBR se denomina aacPlus. Es parte del estándar MPEG-4, en el que se denomina como el perfil AAC de alta eficiencia (HE-AAC). En general, la tecnología HFR puede combinarse con cualquier códec de audio perceptual de manera compatible hacia atrás y hacia delante, ofreciendo así la posibilidad de actualizar sistemas de difusión ya establecidos, como el MPEG Capa 2 usado en el sistema de Eureka DAB. Los métodos de transposición HFR también pueden combinarse con códecs de voz para permitir un habla de banda ancha a velocidades de bits ultrabajas.
La idea básica detrás de la HFR es la observación de que normalmente está presente una correlación fuerte entre las características del intervalo de alta frecuencia de una señal y las características del intervalo de baja frecuencia de la misma señal. Por lo tanto, una buena aproximación para una representación del intervalo de alta frecuencia de entrada original de una señal puede conseguirse por una transposición de señal desde el intervalo de baja frecuencia al intervalo de alta frecuencia.
Este concepto de transposición se estableció en el documento WO 98/57436, que se incorpora por referencia, como un método para recrear una banda de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Puede obtenerse un ahorro sustancial en velocidad de bits usando este concepto en la codificación de audio y/o codificación de voz. A continuación, se hará referencia a la codificación de audio, pero se ha de observar que los métodos y los sistemas descritos pueden aplicarse igualmente a la codificación de voz y en la codificación de voz y audio unificada (USAC).
En un sistema de codificación de audio basado en HFR, una señal de bajo ancho de banda se presenta en un codificador de forma de onda central para su codificación, y las frecuencias más altas se regeneran en el lado del decodificador usando la transposición de la señal de bajo ancho de banda e información lateral adicional, que se codifica comúnmente a velocidades de bits muy bajas y que describe la forma espectral diana. Para bajas velocidades de bits, donde el ancho de banda de la señal codificada central es estrecho, es cada vez más importante reproducir o sintetizar una banda alta, es decir, el intervalo de alta frecuencia de la señal de audio, con características perceptualmente agradables.
Uno de los problemas subyacentes que existen con los métodos de la HFR armónica son las restricciones contrarias de una resolución de alta frecuencia pretendida con el fin de conseguir una transposición de alta calidad para sonidos fijos, y la respuesta temporal del sistema para sonidos transitorios o percusivos. En otras palabras, aunque el uso de una resolución de alta frecuencia es beneficioso para la transposición de señales fijas, tal resolución de alta frecuencia típicamente requiere grandes tamaños de ventana que son perjudiciales cuando se trata de porciones transitorias de una señal. Un enfoque para abordar este problema puede ser cambiar de forma adaptativa las ventanas del reemisor, por ejemplo, usando intercambio de ventana, en función de las características de la señal de entrada. Típicamente se usarán ventanas largas para porciones fijas de una señal, con el fin de conseguir una resolución de alta frecuencia, mientras que se usarán ventanas cortas para porciones transitorias de la señal, para implementar una buena respuesta transitoria, es decir, una buena resolución temporal, del reemisor. Sin embargo, este enfoque tiene el inconveniente de que tienen que incorporarse medidas del análisis de señales, tal como detección transitoria o similares, en el sistema de transposición. Tales medidas de análisis de señal implican a menudo una etapa de decisión, por ejemplo, una decisión sobre la presencia de una transitoria, que desencadena un intercambio del procesamiento de señal. Además, tales medidas típicamente afectan a la fiabilidad del sistema y pueden introducir artefactos de señal al intercambiar el procesamiento de señal, por ejemplo, al intercambiar entre los tamaños de ventana.
Con el fin de conseguir una calidad de audio mejorada y para sintetizar el ancho de banda requerido de la señal de banda alta, los métodos de HFR armónica típicamente emplean varios órdenes de transposición. Con el fin de implementar una pluralidad de transposiciones de diferente orden de transposición, las soluciones de la técnica anterior requieren una pluralidad de bancos de filtros en la etapa de análisis o la etapa de síntesis, o en ambas etapas.
Típicamente, se requiere un banco de filtros diferente para cada orden de transposición diferente. Además, en situaciones en las que el codificador de forma de onda central opera a una tasa de muestreo inferior que la tasa de muestreo de la señal de salida final, existe típicamente la necesidad adicional de convertir la señal central en la tasa de muestreo de la señal de salida, y este muestreo superior de la señal central se consigue normalmente añadiendo otro banco de filtros más. Con todo, la complejidad computacional aumenta significativamente con un número en aumento de diferentes órdenes de transposición.
El presente documento aborda los problemas que se han mencionado anteriormente con respecto al rendimiento transitorio de la transposición armónica y con respecto a la complejidad computacional. Como resultado, se consigue una mejor transposición armónica a una baja complejidad adicional.
Compendio de la invención
De acuerdo con un aspecto, se propone un sistema según la reivindicación independiente 1. De acuerdo con aspectos adicionales, se proponen métodos según las reivindicaciones independientes 9 y 10 así como medios de almacenamiento según la reivindicación independiente 11. Debe señalarse también que los métodos y sistemas, incluyendo sus realizaciones preferidas tal como se esbozan en la presente solicitud de patente, se pueden utilizar independientemente o en combinación con los otros métodos y sistemas descritos en este documento.
Breve descripción de los dibujos
La presente invención se describirá ahora a modo de ejemplos ilustrativos, que no limitan el alcance de la invención, con referencia a los dibujos adjuntos, en los que:
La figura 1 ilustra la operación de un reemisor armónico de dominio de frecuencia (FD, Frequency Domain) de orden único ejemplar;
la figura 2 ilustra la operación de un reemisor armónico ejemplar que usa varios órdenes;
la figura 3 ilustra la operación de la técnica anterior de un reemisor armónico ejemplar que usa varios órdenes de transposición, usando al mismo tiempo un banco de filtros de análisis común;
la figura 4 ilustra la operación de la técnica anterior de un reemisor armónico ejemplar que usa varios órdenes de transposición, usando al mismo tiempo un banco de filtros de síntesis común;
la figura 5 ilustra la operación de un reemisor armónico ejemplar que usa varios órdenes de transposición, usando al mismo tiempo un banco de filtros de síntesis común y un banco de filtros de síntesis común;
la figura 5b ilustra un ejemplo para el mapeo de señales de sub-banda para un esquema de reemisor múltiple de acuerdo con la figura 5;
la figura 6a ilustra un reemisor múltiple ejemplar del orden T = 2, 3, 4 que usa un banco de filtros de análisis común y bancos de filtros de síntesis separados;
la figura 6b ilustra un reemisor múltiple ejemplar del orden T = 2, 3, 4 que usa un banco de filtros de análisis común y un banco de filtros de síntesis común;
la figura 7 ilustra un ejemplo para el mapeo de señales de sub-banda para un reemisor múltiple de acuerdo con la figura 6b;
la figura 8 ilustra un Dirac en una posición particular como aparece en las ventanas de análisis y de síntesis de un reemisor armónico;
la figura 9 ilustra un Dirac en una posición diferente como aparece en las ventanas de análisis y de síntesis de un reemisor armónico; y
la figura 10 ilustra un Dirac para la posición de la figura 9 como aparecerá al usar el sobremuestreo del dominio de frecuencia.
Descripción de realizaciones preferidas
Las realizaciones descritas a continuación son únicamente ilustrativas para los principios de la presente invención para el sobremuestreo en un banco de filtros de reemisor combinado. Se entenderá que serán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento para los expertos en la técnica. Por lo tanto, es la intención que se limite únicamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.
La figura 1 ilustra la operación de un reemisor armónico de dominio de frecuencia (FD) 100. En una forma básica, un reemisor armónico de Tésimo orden es una unidad que desplaza todas las componentes de seña1 H(f) de la señal de
entrada, es decir, una sub-banda de la señal en el dominio de frecuencia, a H(Tf). Es decir, la componente de frecuencia H(f) de la señal de entrada se desplaza hasta una frecuencia T veces superior. Con el fin de implementar tal transposición en el dominio de frecuencia, un banco de filtros de análisis 101 transforma la señal de entrada del dominio temporal en el dominio de la frecuencia y transmite sub-bandas complejas o señales de sub-banda, también denominadas como sub-bandas de análisis o señales de sub-banda de análisis. El banco de filtros de análisis típicamente comprende una transformada de análisis, por ejemplo una FFT, DFT o una transformada de ondícula, y una ventana de análisis deslizante. Las señales de sub-banda de análisis se remiten a un procesamiento no lineal 102 que modifica la fase y/o la amplitud de acuerdo con el orden de transposición T escogido. Típicamente, el procesamiento no lineal transmite varias señales de sub-banda que es igual al número de señales de sub-banda de entrada, es decir, igual al número de señales de sub-banda de análisis. Las sub-bandas o las señales de sub-banda modificadas, que también se denominan como las sub-bandas de síntesis o señales de sub-banda de síntesis, se suministran a un banco de filtros de síntesis 103 que transforma las señales de sub-banda del dominio de la frecuencia en el dominio temporal y transmite la señal de dominio temporal transpuesta. El banco de filtros de síntesis 103 comprende típicamente una transformada inversa, por ejemplo, una FFT inversa, una DFT inversa o una transformada de ondícula inversa, en combinación con una ventana de síntesis deslizante.
Típicamente, cada banco de filtros tiene una resolución de frecuencia física Af medida en Hercios y un parámetro de avance del tiempo físico At medido en segundos, en el que la resolución de frecuencia física Af se asocia normalmente con la resolución de frecuencia de la función de la transformada y el parámetro de avance del tiempo físico At se asocia normalmente con el intervalo de tiempo entre las funciones de ventana sucesivas. Estos dos parámetros, es decir, la resolución de frecuencia y el avance de tiempo, definen los parámetros de tiempo discreto del banco de filtros dada la tasa de muestreo seleccionada. Escogiendo los parámetros de avance del tiempo físico, es decir, el parámetro de avance de tiempo medido en unidades de tiempo, por ejemplo, segundos, de los bancos de filtros de análisis y de síntesis para que sean idénticos, puede obtenerse una señal de salida del reemisor 100 que tiene la misma tasa de muestreo que la señal de entrada. Además, omitiendo el procesamiento no lineal 102 puede conseguirse una reconstrucción perfecta de la señal de entrada en la salida. Esto requiere un diseño cuidadoso de los bancos de filtros de análisis y de síntesis. Por otra parte, si la tasa de muestreo de salida se selecciona para que sea diferente de la tasa de muestreo de entrada, puede obtenerse una conversión de la tasa de muestreo. Este modo de operación puede ser necesario en el caso en el que el ancho de banda deseado de la señal de salida y sea superior a la mitad de la tasa de muestreo de la señal de entrada x, es decir, cuando el ancho de banda de salida deseado excede la frecuencia de Nyquist de la señal de entrada.
La figura 2 ilustra la operación de un reemisor múltiple o un sistema de reemisor múltiple 200 que comprende varios reemisores armónicos 201-1,..., 201-P de diferentes órdenes. La señal de entrada que se va a transponer se pasa a un banco de P reemisores individuales 201-1, 201-2,..., 201-P. Los reemisores individuales 201-1, 201-2.... 201-P realizan una transposición armónica de la señal de entrada como se representa en el contexto de la figura 1. Típicamente, cada uno de los reemisores individuales 201-1, 201-2,..., 201-P realiza una transposición armónica de un orden de transposición diferente T. A modo de ejemplo, el reemisor 201-1 puede realizar una transposición del orden T = 1, el reemisor 201-2 puede realizar una transposición del orden T = 2,..., y el reemisor 201-P puede realizar una transposición del orden T = P. Sin embargo, en términos genéricos, cualquiera de los reemisores 201-1,..., 201-P puede realizar una transposición armónica de un orden de transposición arbitrario T. Las contribuciones, es decir, las señales de salida de los reemisores individuales 201-1, 201-2,..., 201-P pueden sumarse en el combinador 202 para producir la salida del reemisor combinada.
Se ha de observar que cada reemisor 201-1, 201-2,..., 201-P requiere un banco de filtros de análisis y de síntesis como se representa en la figura 1. Además, la implementación habitual de los reemisores individuales 201-1,201-2,..., 201-P cambiará típicamente la tasa de muestreo de la señal de entrada procesada en diferentes cantidades. A modo de ejemplo, la tasa de muestreo de la señal de salida del reemisor 201-P puede ser T veces superior a la tasa de muestreo de la señal de entrada con respecto al reemisor 201-P, en el que T es el orden de transposición aplicado por el reemisor 201-P. Esto puede deberse al factor de expansión del ancho de banda de T usado en el reemisor 201-P, es decir, debido al uso de un banco de filtros de síntesis que tiene T veces más subcanales que el banco de filtros de análisis. Haciendo esto, la tasa de muestreo y la frecuencia de Nyquist aumentan en un factor T. Como consecuencia, las señales de dominio temporal individuales pueden necesitar muestrearse de nuevo con el fin de permitir una combinación de las diferentes señales de salida en el combinador 202. El remuestreo de las señales de dominio temporal puede realizarse en el lado de entrada o en el lado de salida de cada reemisor individual 201-1,201 2,..., 201-P.
La figura 3 ilustra una configuración ejemplar de un reemisor armónico múltiple o un sistema de reemisor múltiple 300 que realiza varios órdenes de transposición y que usa un banco de filtros de análisis común 301. Un punto de partida para el diseño del reemisor múltiple 300 puede ser diseñar los reemisores individuales 201-1, 201-2,.., 201-P de la figura 2 de tal forma que los bancos de filtros de análisis (signo de referencia 101 en la figura 1) de todos los reemisores 201-1, 201-2,.., 201-P sean idénticos y puedan reemplazarse por un único banco de filtros de análisis 301. Como consecuencia, la señal de entrada de dominio temporal se transforma en un único conjunto de señales de sub-banda de dominio de frecuencia, es decir, un único conjunto de señales de sub-banda de análisis. Estas señales de sub banda se remiten a diferentes unidades de procesamiento no lineales 302-1, 302-2,..., 302-P para diferentes órdenes de transposición. Como se ha descrito anteriormente en el contexto de la figura 1, cada unidad de procesamiento no
lineal realiza una modificación de la fase y/o amplitud de las señales de sub-banda, y esta modificación difiere para los diferentes órdenes de transposición. Posteriormente, las señales de sub-banda o sub-bandas modificadas de forma diferente tienen que reemitirse a diferentes bancos de filtros de síntesis 303-1, 303-2,..., 303-P correspondientes a las diferentes unidades de procesamiento no lineales 302-1, 302-2,..., 302-P. Como resultado, se obtienen P señales de salida de dominio temporal transpuestas de forma diferente que se suman en el combinador 304 para producir la salida del reemisor combinada.
Se ha de observar que si los bancos de filtros de síntesis 303-1, 303-2,... , 303-P correspondientes a los diferentes órdenes de transposición operan en diferentes tasas de muestreo, por ejemplo, usando diferentes grados de expansión de ancho de banda, las señales de salida de dominio temporal de los diferentes bancos de filtros de síntesis 303-1, 303-2, ..., 303-P han de remuestrearse de forma diferente con el fin de alinear las P señales de salida con respecto a una rejilla temporal común, antes de su suma en el combinador 304.
La figura 4 ilustra una operación ejemplar de un reemisor armónico múltiple 400 que usa varios órdenes de transposición, usando al mismo tiempo un banco de filtros de síntesis común 404. El punto de partida para el diseño de tal reemisor múltiple 400 puede ser el diseño de los reemisores individuales 201-1, 201-2, .., 201-P de la figura 2 de tal forma que los bancos de filtros de síntesis de todos los reemisores sean idénticos y puedan reemplazarse por un único banco de filtros de síntesis 404. Se ha de observar que de una forma análoga a la situación mostrada en la figura 3, las unidades de procesamiento no lineales 402-1, 402-2,..., 402-P son diferentes para cada orden de transposición. Además, los bancos de filtros de análisis 401-1, 401-2,... , 401-P son diferentes para los diferentes órdenes de transposición. Como tal, un conjunto de P bancos de filtros de análisis 401-1, 401-2,..., 401-P determina P conjuntos de señales de sub-banda de análisis. Estos P conjuntos de señales de sub-banda de análisis se remiten a las unidades de procesamiento no lineales correspondientes 402-1, 402-2....402-P para producir P conjuntos de señales de sub-banda modificadas. Estos P conjuntos de señales de sub-banda pueden combinarse en el dominio de frecuencia en el combinador 403 para producir un conjunto combinado de señales de sub-banda como una entrada al único banco de filtros de síntesis 404. Esta combinación en el combinador 403 puede comprender el suministro de señales de sub-banda procesadas de forma diferente en diferentes intervalos de sub-banda y/o la superposición de contribuciones de señales de sub-banda a intervalos de sub-banda de solapamiento. En otras palabras, las diferentes señales de sub-banda de análisis que se han procesado con diferentes órdenes de transposición pueden incluir intervalos de frecuencia de solapamiento. A modo de ejemplo, un segundo reemisor de orden puede transponer la sub-banda de análisis [2A,2B] con respecto al intervalo de sub-banda [4A,4B]. Al mismo tiempo, un reemisor de cuarto orden puede transponer la sub-banda de análisis [A,B] con respecto al mismo intervalo de sub-banda [4A,4B]. En tales casos, las contribuciones superpuestas pueden combinarse, por ejemplo, añadirse y/o promediarse, por el combinador 403. La señal de salida de dominio temporal del reemisor múltiple 400 se obtiene a partir del banco de filtros de síntesis común 404. De una manera similar a como se ha descrito anteriormente, si los bancos de filtros de análisis 401-1, 401-2,..., 401-P operan en diferentes tasas de muestreo, las señales de dominio temporal introducidas en los diferentes bancos de filtros de análisis 401-1,401-2,..., 401-P pueden necesitar remuestrearse con el fin de alinear las señales de salida de las diferentes unidades de procesamiento no lineales 402-1, 402-2, ..., 402-P con respecto a la misma rejilla temporal.
La figura 5 ilustra la operación de un reemisor armónico múltiple 500 que usa varios órdenes de transposición y que comprende un único banco de filtros de análisis común 501 y un único banco de filtros de síntesis común 504. En este caso, los reemisores individuales 201-1, 201-2,.., 201-P de la figura 2 deben diseñarse de tal forma que tanto los bancos de filtros de análisis como los bancos de filtros de síntesis de todos los P reemisores armónicos sean idénticos. Si la condición de los bancos de filtros de análisis y de síntesis idénticos para los diferentes P reemisores armónicos se cumple, entonces los bancos de filtros idénticos pueden reemplazarse por un único banco de filtros de análisis 501 y un único banco de filtros de síntesis 504. Las unidades de procesamiento no lineales avanzadas 502-1, 502-2,..., 502-P transmiten diferentes contribuciones a intervalos de frecuencia de solapamiento parcial que se combinan en el combinador 503 para producir una entrada combinada con respecto a las sub-bandas respectivas del banco de filtros de síntesis 504. De forma similar al reemisor armónico múltiple 400 representado en la figura 4, la combinación en el combinador 503 puede comprender el suministro de las diferentes señales de salida de la pluralidad de unidades de procesamiento no lineales 502-1,502-2,..., 502-P a diferentes intervalos de sub-banda, y la superposición de múltiples salidas de contribución a intervalos de sub-banda de solapamiento.
Como ya se ha indicado anteriormente, el procesamiento no lineal 102 típicamente proporciona varias sub-bandas a su salida que corresponde al número de sub-bandas a la entrada. El procesamiento no lineal 102 típicamente modifica la fase y/o la amplitud de la sub-banda o la señal de sub-banda de acuerdo con el orden de transposición subyacente T. A modo de ejemplo, una sub-banda a la entrada se convierte en una sub-banda a la salida con una frecuencia T veces superior, es decir, una sub-banda a la salida con respecto al procesamiento no lineal 102, es decir, la sub-banda
í ( k - 1 W , ( k \ - ja / ¡
de análisis ¿ ¿ puede transponerse con respecto a una sub-banda a la salida del
procesamiento no lineal 102, es decir, la sub-banda de síntesis, en la que k es un número de índice de sub-banda y Af si la resolución de frecuencia del banco de filtros de análisis. Con el fin de
permitir el uso de bancos de filtros de análisis comunes 501 y bancos de filtros de síntesis comunes 504, una o más de las unidades de procesamiento avanzadas 502-1, 502-2,..., 502-P pueden configurarse para proporcionar varias sub-bandas de salida que pueden ser diferentes del número de sub-bandas de entrada.
A continuación, se describirán los principios del procesamiento no lineal avanzado en las unidades de procesamiento no lineales 502-1, 502-2,..., 502-P. Para este fin, se asume que
- el banco de filtros de análisis y el banco de filtros de síntesis comparten el mismo parámetro de avance del tiempo físico Af;
- el banco de filtros de análisis tiene una resolución de frecuencia física Af,
- el banco de filtros de síntesis tiene una resolución de frecuencia física QAf donde el factor de resolución Q > 1 es un número entero.
Además, se asume que los bancos de filtros se apilan de modo par, es decir, la sub-banda con índice cero se centra alrededor de la frecuencia cero, de tal forma que las frecuencias centrales del banco de filtros de análisis se dan por kAf donde el índice de sub-banda de análisis k =1,..., Ka-1 y Ka es el número de sub-bandas del banco de filtros de análisis. Las frecuencias centrales del banco de filtros de síntesis se dan por kQAf, donde el índice de sub-banda de síntesis n = 1 , . , Ns-1 y Ns es el número de sub-bandas del banco de filtros de síntesis.
Al realizar una transposición convencional del orden de números enteros T>1 como se muestra en la figura 1, el factor de resolución Q se selecciona como Q = T y la sub-banda de análisis procesada de forma no lineal k se mapea en la sub-banda de síntesis con el mismo índice n = k. El procesamiento no lineal 102 típicamente comprende multiplicar la fase de una sub-banda o una señal de sub-banda por el factor T. Es decir, para cada muestra de las sub-bandas del banco de filtros se puede escribir
es(k) = re A{k) , ( i)
donde &A(k) es la fase de una muestra (compleja) de la sub-banda de análisis k y Qs(k) es la fase de una muestra (compleja) de la sub-banda de síntesis k. La magnitud o amplitud de una muestra de la sub-banda puede mantenerse inalterada o puede aumentar o reducirse por un factor de ganancia constante. Debido al hecho de que T es un número entero, la operación de la ecuación (1) es independiente de la definición del ángulo de fase.
En los reemisores múltiples convencionales, el factor de resolución Q de un banco de filtros de análisis/síntesis se selecciona para que sea igual al orden de transposición T del reemisor respectivo, es decir, Q = T. En este caso, la resolución de frecuencia del banco de filtros de síntesis es TAf y, por lo tanto, depende del orden de transposición T. En consecuencia, es necesario usar diferentes bancos de filtros para diferentes órdenes de transposición T en la etapa de análisis o de síntesis. Esto se debe a que el orden de transposición T define el cociente de las resoluciones de frecuencia físicas, es decir, el cociente de la resolución de frecuencia Af del banco de filtros de análisis y la resolución de frecuencia TAf del banco de filtros de síntesis.
Con el fin de poder usar un banco de filtros de análisis común 501 y un banco de filtros de síntesis común 504 para una pluralidad de diferentes órdenes de transposición T, se propone ajustar la resolución de frecuencia del banco de filtros de síntesis 504 a QAf, es decir, se propone hacer la resolución de frecuencia del banco de filtros de síntesis 504 independiente del orden de transposición T. Entonces, surge la cuestión de cómo implementar una transposición del orden T cuando el factor de resolución Q, es decir, el cociente Q de la resolución de frecuencia física del banco de filtros de análisis y de síntesis, no obedece necesariamente a la relación Q = T.
Como se ha descrito anteriormente, un principio de la transposición armónica es que la entrada a la sub-banda del banco de filtros de síntesis n con frecuencia central nQAf se determina a partir de una sub-banda de análisis a una frecuencia central T veces inferior, es decir, a la frecuencia central nQAf/T. Las frecuencias centrales de las sub bandas de análisis se identifican a través del índice de sub-banda de análisis k como kAf. Ambas expresiones para la frecuencia central del índice de sub-banda de análisis, es decir, nQAf/T y kAf, pueden igualarse. Teniendo en cuenta n Q
que el índice n es un valor de número entero, la expresión T es un número racional que puede expresarse como la suma de un índice de sub-banda de análisis de número entero k y un resto r e {0,1/T,2/T,...,(T-1)/T} de tal forma que
Como tal, puede estipularse que la entrada a una sub-banda de síntesis con el índice de sub-banda de síntesis n puede derivarse, usando una transposición del orden T, a partir de la sub-banda de análisis con el índice k dado por
n Q
la ecuación (2). En vista del hecho de que T es un número racional, el resto r puede ser distinto de 0 y el valor k+r puede ser mayor que el índice de sub-banda de análisis k y menor que el índice de sub-banda de análisis k+1, es decir, k<k r<k 1. En consecuencia, la entrada a una sub-banda de síntesis con el índice de sub-banda de síntesis n debe derivarse, usando una transposición del orden T, de las sub-bandas de análisis con el índice de sub-banda de análisis k y k+1, en la que k se da por la ecuación (2). En otras palabras, la entrada de una sub-banda de síntesis puede derivarse de dos sub-bandas de análisis consecutivas.
Como consecuencia de lo anterior, el procesamiento no lineal avanzado realizado en una unidad de procesamiento no lineal 502-1, 502-2,..., 502-P puede comprender la etapa de considerar dos sub-bandas de análisis vecinas con índice k y k+1 para proporcionar la salida para la sub-banda de síntesis n. Para un orden de transposición T, la modificación de fase realizada por la unidad de procesamiento no lineal 502-1, 502-2,..., 502-P puede definirse, por ejemplo, por la regla de interpolación lineal,
donde 0A(k) es la fase de una muestra de la sub-banda de análisis k, 0A(k+1) es la fase de una muestra de la sub banda de análisis k+1, y 0s(n) es la fase de una muestra de la sub-banda de síntesis n. Si el resto r está cerca de cero, es decir, si el valor k+r está cerca de k, entonces la contribución principal de la fase de la muestra de sub-banda de síntesis se deriva de la fase de la muestra de sub-banda de análisis de la sub-banda k. Por otra parte, si el resto r está cerca de uno, es decir, si el valor k+r está cerca de k+1, entonces la contribución principal de la fase de la muestra de sub-banda de síntesis se deriva de la fase de la muestra de sub-banda de análisis de la sub-banda k+1. Se ha de observar que los multiplicadores de fase T(1-r) y Tr son ambos números enteros de tal forma que las modificaciones de fase de la ecuación (3) se definen bien y son independientes de la definición del ángulo de fase.
En lo que respecta a las magnitudes de las muestras de sub-banda, puede seleccionarse el siguiente valor medio geométrico para la determinación de la magnitud de las muestras de sub-banda de síntesis,
a s ( n ) = a A (k f ~ r ) a A ( k l ) r , ( 4 )
donde as(n) representa la magnitud de una muestra de la sub-banda de síntesis n, aA(k) representa la magnitud de una muestra de la sub-banda de análisis k, y aA(k+1) representa la magnitud de una muestra de la sub-banda de análisis k+1. Se ha de observar que pueden contemplarse otras reglas de interpolación para la fase y/o la magnitud.
Para el caso de un banco de filtros apilados de modo impar, donde las frecuencias centrales del banco de filtros de
( " 1 ) A f
análisis se dan por 2 con k = 1,..., KA-1, y las frecuencias centrales de bancos de filtros de síntesis se dan , U Q A f
(n )
por 2 T con n = 1,..., Ns-1, una ecuación correspondiente con respecto a la ecuación (2) puede derivarse , U Q A f
(n )
equiparando la frecuencia central de bancos de filtros de síntesis transpuesta 2 T y la frecuencia central
( k 1 ) A f
de bancos de filtros de análisis 2 Asumiendo un índice de número entero k y un resto r e [0,1] puede obtenerse la siguiente ecuación para bancos de filtros apilados de modo impar:
El experto en la técnica apreciará que si T - Q, es decir, la diferencia entre el orden de transposición y el factor de resolución, es par, T(1-r) y Tr son ambos números enteros y pueden usarse las reglas de interpolación de las ecuaciones (3) y (4).
El mapeo de sub-bandas de análisis en sub-bandas de síntesis se ilustra en la figura 5b. La figura 5b muestra cuatro diagramas para diferentes órdenes de transposición T = 1 a T = 4. Cada diagrama ilustra cómo las ubicaciones de procedencia 510, es decir, las sub-bandas de análisis, se mapean en las ubicaciones de destino 530, es decir, las sub-bandas de síntesis. Con fines de ilustración, se asume que el factor de resolución Q es igual a uno. En otras palabras, la figura 5b ilustra el mapeo de las señales de sub-banda de análisis con respecto a señales de sub-banda de síntesis usando la Ec. (2) y (3). En el ejemplo ilustrado, el banco de filtros de análisis/síntesis se apila de modo par, con Q = 1 y el máximo orden de transposición T = 4.
En el caso ilustrado, la ecuación (2) puede escribirse como . En consecuencia, para un orden de transposición T = 1, se mapea una sub-banda de análisis con un índice k con respecto a una sub-banda de síntesis correspondiente n y el resto r es siempre cero. Esto puede observarse en la figura 5b, donde, por ejemplo, se mapea la ubicación de procedencia 511 una a una con respecto a una ubicación de destino 531.
En el caso de un orden de transposición T = 2, el resto r tiene en cuenta los valores 0 y 1/2 y se mapea ubicación de procedencia con respecto a una pluralidad de ubicaciones de destino. Al invertir la perspectiva, puede señalarse que cada ubicación de destino 532, 535 recibe una contribución de hasta dos ubicaciones de procedencia. Esto puede observarse en la figura 5b, donde la ubicación de destino 535 recibe una contribución de las ubicaciones de procedencia 512 y 515. Sin embargo, la ubicación de destino 532 recibe una contribución únicamente de la ubicación de procedencia 512. Si se asume que la ubicación de destino 532 tiene un índice par n, por ejemplo n = 10, entonces la ecuación (2) especifica que la ubicación de destino 532 recibe una contribución de la ubicación de procedencia 512 con un índice k = n/2, por ejemplo k = 5. El resto r es cero, es decir, no hay ninguna contribución de la ubicación de procedencia 515 con índice k+1, por ejemplo, k+1 = 6. Esto cambia para la ubicación de destino 535 con un índice impar n, por ejemplo n = 11. En este caso, la ecuación (2) especifica que la ubicación de destino 535 recibe contribuciones desde la ubicación de procedencia 512 (índice k = 5) y la ubicación de procedencia 515 (índice k+1 = 6). Esto se aplica de forma similar a órdenes de transposición T mayores, por ejemplo, T = 3 y T = 4, como se muestra en la figura 5b.
Una interpretación adicional del procesamiento no lineal avanzado anterior puede ser como se indica a continuación. El procesamiento no lineal avanzado puede entenderse como una combinación de una transposición de un orden dado T en señales de sub-banda intermedia en una rejilla de frecuencia intermedia TAf y un mapeo posterior de las señales de sub-banda intermedia con respecto a una rejilla de frecuencia definida por un banco de filtros de síntesis común, es decir, por una rejilla de frecuencia QAf. Con el fin de ilustrar esta interpretación, se hace referencia de nuevo a la figura 5b. Sin embargo, para esta ilustración, las ubicaciones de procedencia 510 se consideran sub-bandas intermedias obtenidas de las sub-bandas de análisis usando un orden de transposición T. Estas sub-bandas intermedias tienen una rejilla de frecuencia dada por TAf. Para generar señales de sub-banda de síntesis en una rejilla de frecuencia predefinida QAf dada por las ubicaciones de destino 530, las ubicaciones de procedencia 510, es decir, las sub-bandas intermedias que tienen la rejilla de frecuencia TAf, han de mapearse sobre la rejilla de frecuencia predefinida QAf. Esto puede realizarse determinando una ubicación de destino 530, es decir, una señal de sub-banda de síntesis en la rejilla de frecuencia QAf, interpolando una o dos ubicaciones de procedencia 510, es decir, las señales de sub-banda intermedia en la rejilla de frecuencia TAf. En una realización preferida, se usa interpolación lineal, en la que las ponderaciones de la interpolación son inversamente proporcionales a la diferencia entre la frecuencia central de la ubicación de destino 530 y la ubicación de procedencia correspondiente 510. A modo de ejemplo, si la diferencia es cero, entonces la ponderación es 1, y si la diferencia es TAf, entonces la ponderación es 0.
En resumen, se ha descrito un método de procesamiento no lineal que permite la determinación de contribuciones a una sub-banda de síntesis por medio de la transposición de varias sub-bandas de análisis. El método de procesamiento no lineal permite el uso de bancos de filtros de sub-banda de análisis y de síntesis comunes individuales para diferentes órdenes de transposición, reduciendo de esta manera significativamente la complejidad computacional de los reemisores armónicos múltiples.
Las figuras 6a y 6b ilustran bancos de filtros de análisis/síntesis ejemplares que usan una FFT/DFT de M = 1024 puntos (T ransformada Rápida de Fourier o T ransformada Discreta de Fourier) para órdenes de transposición múltiples de T = 2,3,4. La figura 6a ilustra el caso convencional de un reemisor armónico múltiple 600 que usa un banco de filtros de análisis común 601 y bancos de filtros de síntesis separados 602, 603, 604 para cada factor de transposición T = 2,3,4. La figura 6a muestra las ventanas de análisis va 611 y las ventanas de síntesis vs 612, 613, 614 aplicadas al banco de filtros de análisis 601 y los bancos de filtros de síntesis 602, 603, 604, respectivamente. En el ejemplo ilustrado, la ventana de análisis va 611 tiene una longitud La =1024 que es igual al tamaño M de la FFT o la DFT de los bancos de filtros de análisis/síntesis 601, 602, 603, 604. De una forma similar, las ventanas de síntesis vs 612, 613, 614 tienen una longitud de Ls = 1024 que es igual al tamaño M de la FFT o la DFT.
La figura 6a también ilustra el tamaño de salto Asa empleado por el banco de filtros de análisis 601 y el tamaño de salto Ass empleado por los bancos de filtros de síntesis 602, 603, 604, respectivamente. El tamaño de salto As corresponde al número de muestras de datos por las que la ventana respectiva 611, 612, 613, 614 se desplaza entre las etapas de transformación sucesivas. El tamaño de salto As se refiere al avance del tiempo físico At a través de la tasa de muestreo de la señal subyacente, es decir, As = fsAt, en la que fs es la tasa de muestreo.
Puede observarse que la ventana de análisis 611 se mueve por un tamaño de salto 621 de 128 muestras. La ventana de síntesis 612 correspondiente a una transposición del orden T = 2 se mueve por un tamaño de salto 622 de 256 muestras, es decir, un tamaño de salto 622 que es dos veces el tamaño de salto 621 de la ventana de análisis 611. Como se ha indicado anteriormente, esto conduce a una extensión de tiempo de la señal por el factor T = 2. Como alternativa, si se asume una tasa de muestreo T = 2 veces superior, la diferencia entre el tamaño de salto de análisis 621 y el tamaño de salto de síntesis 622 conduce a una transposición armónica del orden T = 2. Es decir, una extensión
de tiempo en un orden T puede convertirse en una transposición armónica realizando una conversión de la tasa de muestreo del orden T.
De una manera similar, puede observarse que el tamaño de salto de síntesis 623 asociado con el reemisor armónico del orden T = 3 es T = 3 veces mayor que el tamaño de salto de análisis 621, y el tamaño de salto de síntesis 624 asociado con el reemisor armónico del orden T = 4 es T = 4 veces mayor que el tamaño de salto de análisis 621. Para alinear las tasas de muestreo del reemisor de 3er orden y el reemisor de 4° orden con la tasa de muestreo de salida del reemisor de 2° orden, el reemisor de 3er orden y el reemisor de 4° orden comprenden un submuestreador de factor 3/2 633 y un submuestreador de factor 2 634, respectivamente. En términos generales, el reemisor de T° orden comprenderá un submuestreador de factor T/2, si se solicita una tasa de muestreo de salida, que es 2 veces mayor que la tasa de muestreo de entrada. Es decir, no se requiere ningún submuestreo para el reemisor armónico de orden T = 2.
Finalmente, la figura 6a ilustra las unidades de modificación de fase separadas 642, 643, 644 para el orden de transposición T = 2, 3, 4, respectivamente. Estas unidades de modificación de fase 642, 643, 644 realizan una multiplicación de la fase de las señales de sub-banda respectivas por el orden de transposición T = 2, 3, 4, respectivamente (véase la ecuación (1)).
Puede obtenerse una estructura de bancos de filtros combinados eficaz para el reemisor limitando el reemisor múltiple de la figura 6a a un único banco de filtros de análisis 601 y un único banco de filtros de síntesis 602. Después, los armónicos de 3er y 4° orden se producen en una unidad de procesamiento no lineal 650 dentro de un banco de filtros de 2° orden como se representa en la figura 6b. La figura 6b muestra un banco de filtros de análisis que comprende una unidad de FFT directa de 1024 puntos 601 y una ventana de análisis 611 que se aplica a la señal de entrada x con un tamaño de salto de análisis 621. El banco de filtros de síntesis comprende una unidad de FFT inversa de 1024 puntos 602 y una ventana de síntesis 612 que se aplica con un tamaño de salto de síntesis 622. En el ejemplo ilustrado, el tamaño de salto de síntesis 622 es dos veces el tamaño de salto de análisis 621. Además, se asume que la tasa de muestreo de la señal de salida y será dos veces la tasa de muestreo de la señal de entrada x.
El banco de filtros de análisis/síntesis de la figura 6b comprende un único banco de filtros de análisis y un único banco de filtros de síntesis. Usando el procesamiento no lineal avanzado 650 de acuerdo con los métodos representados en el contexto de la figura 5 y la figura 5b, es decir, el procesamiento no lineal avanzado realizado en las unidades 502 1,..., 502-P, este banco de filtros de análisis/síntesis puede usarse para proporcionar un reemisor múltiple, es decir, un reemisor armónico para una pluralidad de órdenes de transposición T.
Como se ha representado en el contexto de las figuras 5 y 5b, el mapeo una a una de las sub-bandas de análisis con respecto a las sub-bandas de síntesis correspondientes que implica una multiplicación de la fase de las señales de sub-banda por la orden de transposición respectiva T, puede generalizarse con respecto a las reglas de interpolación (véanse las Ecuaciones (3) y (4)) que implican una o más señales de sub-banda. Se ha descrito que si la separación física QAf de las sub-bandas de bancos de filtros de síntesis es Q veces la separación física Af del banco de filtros de análisis, la entrada a la banda de síntesis con índice n se obtiene a partir de las bandas de análisis con índices k y k + 1. La relación entre los índices n y k se da por la ecuación (2) o (5), dependiendo de si los bancos de filtros se apilan de modo par o impar. Se aplica una interpolación geométrica para las magnitudes con las potencias 1-r y r (ecuación (4)), y las fases se combinan de forma lineal con las ponderaciones T(1-r) y Tr (ecuación (3)). Para el caso ilustrado en el que Q = 2, los mapeos de fase para cada factor de transposición se ilustran gráficamente en la figura 7.
De una manera similar al caso de Q = 1 ilustrado en la figura 5, una sub-banda de destino o una ubicación de destino 730 recibe contribuciones de hasta dos sub-bandas de procedencia o ubicaciones de procedencia 710. En el caso T = Q = 2, cada ubicación de procedencia de fase modificada 711 se asigna a una ubicación de destino correspondiente 731. Para órdenes de transposición superiores T>Q, puede obtenerse una ubicación de destino 735 a partir de una ubicación de procedencia de fase modificada correspondiente 715. Este es el caso si los restos obtenidos a partir de la ecuación (2) o (5) es cero. De otro modo, se obtiene una ubicación de destino 732 interpolando dos ubicaciones de procedencia de fase modificada 712 y 715.
El procesamiento no lineal que se ha mencionado anteriormente se realiza en la unidad de reemisor múltiple 650 que determina las ubicaciones de destino 730 para las diferentes órdenes de transposición T = 2, 3, 4 usando las unidades de procesamiento no lineal avanzado 502-2, 502-3, 502-4. Posteriormente, las ubicaciones de destino correspondientes 730 se combinan en una unidad de combinador 503 para producir un único conjunto de señales de sub-banda de síntesis que se suministran al banco de filtros de síntesis. Como se ha indicado anteriormente, la unidad de combinador 503 se configura para combinar una pluralidad de contribuciones en intervalos de frecuencia de solapamiento a partir de la salida de las diferentes unidades de procesamiento no lineal 502-2, 502-3, 502-4.
A continuación, se describe la transposición armónica de señales transitorias que usan reemisores armónicos. En este contexto, se ha de observar que la transposición armónica del orden T que usa bancos de filtros de análisis/síntesis puede interpretarse como una extensión del tiempo de una señal subyacente por un factor de transposición de número entero T seguido de un submuestreo y/o una conversión de la tasa de muestreo. La extensión del tiempo se realiza de tal forma que las frecuencias de sinusoides que componen la señal de entrada se mantengan. Dicha extensión de tiempo puede realizarse usando el banco de filtros de análisis/síntesis en combinación con una modificación intermedia
de las fases de las señales de sub-banda en base al orden de transposición T. Como se ha indicado anteriormente, el banco de filtros de análisis puede ser un banco de filtros de DFT en ventana con una ventana de análisis va, y el banco de filtros de síntesis puede ser un banco de filtros de DFT inversa en ventana con una ventana de síntesis vs. Dicha transformada de análisis/síntesis también se denomina como Transformada de Fourier de Tiempo Reducido (STFT, Short-Time Fourier Transform).
Se realiza una transformada de Fourier de tiempo reducido en una señal de entrada de dominio temporal x para obtener una sucesión de cuadros espectrales solapados. Con el fin de reducir al mínimo los posibles efectos de la banda lateral, deben seleccionarse ventanas de análisis/síntesis apropiadas, por ejemplo, ventanas Gaussianas, ventanas de coseno, ventanas de Hamming, ventanas de Hann, ventanas rectangulares, ventanas de Bartlett, ventanas de Blackman, y otras. El retardo temporal en el que cada cuadro espectral se recoge de la señal de entrada x se denomina como el tamaño de salto As o el avance del tiempo físico At. La STFT de la señal de entrada x se denomina como la etapa de análisis y conduce a una representación del dominio de la frecuencia de la señal de entrada x. La representación del dominio de la frecuencia comprende una pluralidad de señales de sub-banda, en la que cada señal de sub-banda representa una determinada componente de frecuencia de la señal de entrada.
Con el fin de la extensión del tiempo de la señal de entrada, cada señal de sub-banda puede extenderse en el tiempo, por ejemplo, retrasando las muestras de las señales de sub-banda. Esto puede conseguirse usando un tamaño de salto de síntesis que sea superior al tamaño de salto de análisis. La señal de dominio temporal puede reconstruirse realizando una transformada de Fourier (Rápida) inversa en todos los cuadros seguida de una acumulación sucesiva de los cuadros. Esta operación de la etapa de síntesis se denomina como operación de solapamiento-suma. La señal de salida resultante es una versión extendida en el tiempo de la señal de entrada que comprende las mismas componentes de frecuencia que la señal de entrada. En otras palabras, la señal de salida resultante tiene la misma composición espectral que la señal de entrada, pero es menor que la señal de entrada, es decir, su progresión se extiende en el tiempo.
Entonces, puede obtenerse posteriormente la transposición a frecuencias mayores, o de forma integrada, a través de submuestreo de las señales extendidas, o realizando una conversión de la tasa de muestra de la señal de salida extendida en el tiempo. Como resultado, la señal transpuesta tiene la longitud en el tiempo de la señal inicial, pero comprende componentes de frecuencia que se desplazan hacia arriba por un factor de transposición predefinido.
En vista de lo anterior, la transposición armónica de señales transitorias usando reemisores armónicos se describe considerando como un punto de partida la extensión del tiempo de una señal transitoria prototipo, es decir, un pulso de Dirac de tiempo discreto en el instante de tiempo t = fe,
La transformada de Fourier de tal pulso de Dirac tiene una magnitud y una fase lineal con una pendiente proporcional a te.
en la que es la frecuencia central de la mésima señal de sub-banda del análisis STFT y M es el tamaño de la transformada discreta de Fourier (DFT). Tal transformada de Fourier puede considerarse como la etapa de análisis del banco de filtros de análisis que se ha descrito anteriormente, en la que se usa una ventana de análisis plana va de una duración infinita. Con el fin de generar una señal de salida y que se extiende en el tiempo por un factor T, es decir, un pulso de Dirac 8(t-Tto) en el instante de tiempo t = Tto, la fase de las señales de sub-banda de análisis deben multiplicarse por el factor T para obtener la señal de sub-banda de síntesis Y(Qm) = exp(-jQmTto) que produce el pulso de Dirac deseado 8(t-Tto) como una salida de una transformada inversa de Fourier.
Sin embargo, se ha de observar que las consideraciones anteriores se refieren a una etapa de análisis/síntesis que usa ventanas de análisis y de síntesis de longitudes infinitas. De hecho, un reemisor teórico con una ventana de duración infinita dará el tramo correcto de un pulso de Dirac 8(t-to). Para un análisis en ventana de duración finita, la situación se confunde por el hecho de que cada bloque de análisis se va a interpretar como un intervalo periódico de una señal periódica con un periodo igual al tamaño de la DFT.
Esto se ilustra en la figura 8, que muestra el análisis y la síntesis 800 de un pulso de Dirac 8(t-to). La parte superior de la figura 8 muestra la entrada a la etapa de análisis 810 y la parte inferior de la figura 8 muestra la salida de la etapa
de síntesis 820. Los gráficos superior e inferior representan el dominio temporal. La ventana de análisis estilizada 811 y la ventana de síntesis 821 se representan como ventanas triangulares (Bartlett). El pulso de entrada S(t-td) 812 en el instante de tiempo t = fo se representa en el gráfico superior 810 como una flecha vertical. Se asume que el bloque de la transformada DFT es de un tamaño M = L = La = Ls, es decir, el tamaño de la transformada DFT se selecciona para que sea igual al tamaño de las ventanas. La multiplicación de fase de las señales de sub-banda por el factor T producirá el análisis DFT de un pulso de Dirac 8(t-Tfo) en t = Tto, sin embargo, de un pulso de Dirac periodizado con respecto a un tren de pulsos de Dirac con un periodo L. Esto se debe a la longitud finita de la ventana aplicada y la Transformada de Fourier. El tren de pulsos periodizado con el periodo L se representa por las flechas discontinuas 823, 824 en el gráfico inferior.
En un sistema del mundo real, el tren de pulsos contiene realmente sólo unos pocos pulsos (dependiendo del factor de transposición), un pulso principal, es decir, el término deseado, unos pocos pre-pulsos y unos pocos post-pulsos, es decir, los términos no deseados. Los pre-pulsos y los post-pulsos surgen debido a que la DFT es periódica (con L). Cuando se localiza un pulso en una ventana de análisis, de manera que la fase compleja se envuelva al multiplicarse por T (es decir, el pulso se desplaza fuera del extremo de la ventana y vuelve de nuevo al principio), surge un pulso no deseado dentro de la ventana de síntesis. Los pulsos no deseados pueden tener, o no, la misma polaridad que el pulso de entrada, dependiendo de la localización en la ventana de análisis y el factor de transposición.
En el ejemplo de la figura 8, la ventana de síntesis usa una ventana finita vs 821. La ventana de síntesis finita 821 recoge el pulso deseado S(t-Tto) en t = Tto que se representa como una flecha sólida 822 y cancela las otras contribuciones no deseadas que se muestran como flechas discontinuas 823, 824.
Puesto que la etapa de análisis y de síntesis desplazan a lo largo del tiempo el eje de tiempo de acuerdo con el factor de salto As o el avance de tiempo At, el pulso S(t-tü) 812 tendrá otra posición con respecto al centro de la ventana de análisis respectiva 811. Como se ha indicado anteriormente, la operación para conseguir la extensión en el tiempo consiste en mover el pulso 812 hasta T veces su posición con respecto al centro de la ventana. Siempre que esta posición esté dentro de la ventana 821, esta operación de extensión de tiempo garantiza que todas las contribuciones constituyen un único pulso sintetizado extendido en el tiempo S(t-Tto) en t = Tto.
Sin embargo, tiene lugar un problema para la situación de la figura 9, donde el pulso S(t-to) 912 se mueve adicionalmente fuera hacia el borde del bloque de la DFT. La figura 9 ilustra una configuración de análisis/síntesis similar 900 que en la figura 8. El gráfico superior 91 ü muestra la entrada a la etapa de análisis y la ventana de análisis 911, y el gráfico inferior 920 ilustra la salida de la etapa de síntesis y la ventana de síntesis 921. Al extender en el tiempo el pulso de Dirac de entrada 912 en un factor T, el pulso de Dirac extendido en el tiempo 922, es decir, S(t-Tto), se coloca fuera de la ventana de síntesis 921. Al mismo tiempo, otro pulso de Dirac 924 del tren de pulsos, es decir, S(t-Tto L) en el instante de tiempo t = Tto - L, se recoge por la ventana de síntesis. En otras palabras, el pulso de Dirac de entrada 912 no se retrasa a un instante de tiempo posterior T veces, sino que se desplaza hacia delante a un instante de tiempo que se encuentra antes del pulso de Dirac de entrada 912. El efecto final sobre la señal de audio es la aparición de un pre-eco a una distancia de tiempo de la escala de las ventanas del reemisor muy extensas, es decir, en un instante de tiempo t = Tto- L que es L - (T-1)fo antes que el pulso de Dirac de entrada 912.
El principio de la solución a este problema se describe en referencia a la figura 10. La figura 10 ilustra un escenario de análisis/síntesis 1000 similar a la figura 9. El gráfico superior 1010 muestra la entrada a la etapa de análisis con la ventana de análisis 1011, y el gráfico inferior 1020 muestra la salida de la etapa de síntesis con la ventana de síntesis 1021. El tamaño de la DFT se adapta para evitar pre-ecos. Esto se consigue ajustando el tamaño M de la DFT de tal forma que no se recojan imágenes de pulsos de Dirac no deseados del tren de pulsos resultante por la ventana de síntesis. El tamaño de la transformada DFT 1001 aumenta a M = FL, donde L es la longitud de la función de la ventana 1002 y el factor F es un factor de sobremuestreo de dominio de frecuencia. En otras palabras, el tamaño de la transformada DFT 1001 se selecciona para que sea mayor que el tamaño de la ventana 1002. En particular, el tamaño de la transformada DFT 1001 puede seleccionarse para que sea mayor que el tamaño de la ventana 1002 de la ventana de síntesis. Debido a la longitud aumentada 1001 de la transformada DFT, el periodo del tren de pulsos que comprende los pulsos de Dirac 1022, 1024 es FL. Seleccionando un valor suficientemente grande de F, es decir, seleccionando un factor de sobremuestreo de dominio de frecuencia suficientemente grande, pueden cancelarse las contribuciones no deseadas al tramo de pulsos. Esto se muestra en la figura 10, donde el pulso de Dirac 1024 en el instante de tiempo t = Tto-FL está fuera de la ventana de síntesis 1021. Por lo tanto, el pulso de Dirac 1024 no se recoge por la ventana de síntesis 1021 y, en consecuencia, pueden evitarse los pre-ecos.
Se ha de observar que en una realización preferida, la ventana de síntesis y la ventana de análisis tienen longitudes "nominales" iguales (medidas en el número de muestras). Sin embargo, al usar un remuestreo implícito de la señal de salida descartando o insertando muestras en las bandas de frecuencia de la transformada o el banco de filtros, el tamaño de la ventana de síntesis (medido en el número de muestras) será típicamente diferente del tamaño de análisis, dependiendo del remuestreo y/o el factor de transposición.
El valor mínimo de F, es decir, el factor de sobremuestreo de dominio de frecuencia mínimo, puede deducirse a partir de la figura 10. La condición para no recoger imágenes de pulsos de Dirac no deseados puede formularse como se
L
t = t 0 <
indica a continuación: Para cualquier pulso de entrada S(t-to) en la posición 2 , es decir, para cualquier pulso de entrada comprendido dentro de la ventana de análisis 1011, la imagen no deseada S(t - Tto+ FL) en el instante de L
tiempo t = Tto - FL debe localizarse a la izquierda del borde izquierdo de la ventana de síntesis en 2 . De forma
T L - FL < - L
equivalente, la condición 2 2 debe cumplirse, lo que conduce a la regla
T
F > - + 1
(6)
Como puede observarse a partir de la fórmula (6), el factor de sobremuestreo de dominio de frecuencia mínimo F es una función del orden de transposición T. Más específicamente, el factor de sobremuestreo de dominio de frecuencia mínimo F es proporcional al orden de transposición T.
Repitiendo la línea de pensamiento anterior para el caso en el que las ventanas de análisis y de síntesis tienen diferentes longitudes, se obtiene una fórmula más general. Se permite que La y Ls sean las longitudes de las ventanas de análisis y de síntesis (medidas en el número de muestras), respectivamente, y se permite que M sea del tamaño de DFT empleado. La regla general que extiende la fórmula (6) es entonces
De hecho, que esta regla es una extensión de (6) puede verificarse insertando M = FL, y La = Ls = L en (7) y dividiendo por L en ambos lados de la ecuación resultante.
El análisis anterior se realiza para un modelo bastante especial de un transitorio, es decir, un pulso de Dirac. Sin embargo, el razonamiento puede extenderse para demostrar que al usar la extensión en el tiempo que se ha descrito anteriormente y/o el esquema de transposición armónica, las señales de entrada que tienen una envolvente espectral casi plana y que desaparecen fuera de un intervalo de tiempo [a,b] se extenderán a señales de salida que son pequeñas fuera del intervalo [Ta, Tb]. También puede verificarse, estudiando los espectrogramas de señales de audio y/o voz reales, que los pre-ecos desaparecen en las señales extendidas o transpuestas cuando la regla que se ha descrito anteriormente para seleccionar un factor de sobremuestreo de dominio de frecuencia apropiado se respeta. Un análisis más cuantitativo también revela que los pre-ecos aún se reducen al usar factores de sobremuestreo de dominio de frecuencia que son ligeramente inferiores al valor impuesto por la condición de la fórmula (6) o (7). Esto se debe al hecho de que las funciones de ventana típicas vs son pequeñas cerca de sus bordes, atenuando así pre ecos no deseados que se sitúan cerca de los bordes de las funciones de ventana.
En resumen, un modo de mejorar la respuesta transitoria de los reemisores armónicos de dominio de frecuencia, o extensores de tiempo, se ha descrito introduciendo una transformada sobremuestreada, donde la cantidad de sobremuestreo es una función del factor de transposición escogido. La respuesta transitoria mejorada del reemisor se obtiene por medio del sobremuestreo del dominio de frecuencia.
En el reemisor múltiple de la figura 6, el sobremuestreo de dominio de frecuencia puede implementarse usando núcleos de DFT 601,602, 603, 604 de longitud 1024F y completando con ceros las ventanas de análisis y de síntesis simétricamente a esta longitud. Se ha de observar que por motivos de complejidad, es beneficioso mantener la cantidad de sobremuestreo bajo. Si la fórmula (6) se aplica al reemisor múltiple de la figura 6, debe aplicarse un factor de sobremuestreo F = 2,5 para incluir todos los factores de transposición T = 2, 3, 4. Sin embargo, puede mostrarse que el uso de F = 2,0 ya conduce a una mejora de la calidad significativa para las señales de audio real.
A continuación, y según la presente invención, se describe el uso del sobremuestreo de dominio de frecuencia en el contexto de los bancos de filtros de análisis/síntesis combinados, tal como se describe en el contexto de las figuras 5 o la figura 6b.
En general, para un banco de filtros de transposición combinado donde la separación física QAf de las sub-bandas del banco de filtros de síntesis es Q veces la separación física Af del banco de filtros de análisis y donde la duración de la ventana de análisis física Da (medida en unidades de tiempo, por ejemplo segundos) es también Q veces la del banco de filtros de síntesis, Da = QDs, el análisis para un pulso de Dirac como anteriormente se aplicará para todos los factores de transposición T = Q, Q+1, Q+2,... como si T = Q. En otras palabras, la regla para el grado de sobremuestreo de dominio de frecuencia requerido en un banco de filtros de transposición combinado se da por
F < T +1 En particular, se ha de observar que para T>Q, el factor de sobremuestreo de dominio de frecuencia 2 es suficiente, al mismo tiempo que se asegura aún la supresión de artefactos en las señales transitorias causados por la transposición armónica de orden T. Es decir, usando las reglas de sobremuestreo anteriores para el banco de filtros combinado, puede observarse que incluso al usar órdenes de transposición mayores T>Q, no se requiere aumentar adicionalmente el factor de sobremuestreo F. Como se indica por la ecuación (6b), es suficiente en la implementación del banco de filtros combinado de la figura 6b usar un factor de sobremuestreo F = 1,5 con el fin de evitar la aparición de pre-ecos. Este valor es menor que el factor de sobremuestreo F = 2,5 requerido para el reemisor múltiple de la figura 6. En consecuencia, la complejidad de realizar el sobremuestreo de dominio de frecuencia para mejorar el rendimiento transitorio de los reemisores armónicos múltiples puede reducirse al usar un banco de filtros de análisis/síntesis combinado (en lugar de bancos de filtros de análisis y/o síntesis separados para los diferentes órdenes de transposición).
En un escenario más general, la duración de tiempo física de las ventanas de análisis y de síntesis Da y Ds, respectivamente, pueden seleccionarse de forma arbitraria. Entonces, la separación física Af de las sub-bandas del banco de filtros de análisis debe satisfacer
para evitar los artefactos descritos causados por la transposición armónica. Se ha de observar que la duración de una ventana D típicamente difiere de la longitud de una ventana L. Mientras que la longitud de una ventana L corresponde al número de muestras de señal cubiertas por la ventana, la duración de la ventana D corresponde al intervalo de tiempo de la señal cubierta por la ventana. Como se ilustra en la figura 6a, las ventanas 611,612, 613, 614 tienen una longitud equivalente de L = 1024 muestras. Sin embargo, la duración Da de la ventana de análisis 611 es T veces la duración Ds de la ventana de síntesis 612, 613, 614, en la que T es el orden de transposición respectivo y el factor de resolución del banco de filtros de síntesis respectivo. De una manera similar, la duración Da de la ventana de análisis 611 en la figura 6b es Q veces la duración Ds de la ventana de síntesis 612, en la que Q es el factor de resolución del banco de filtros de síntesis. La duración de una ventana D se refiere a la longitud de la ventana L a través de la
D = —
frecuencia de muestreo fs, es decir, particularmente ■'* . De una manera similar, la resolución de frecuencia de una transformada Af se refiere al número de puntos o longitud M de la transformada a través de la frecuencia de
A f = —
muestreo fs, es decir, particularmente M Además, el avance del tiempo físico At de un banco de filtros se refiere al tamaño de salto As del banco de filtros a través de la frecuencia de muestreo fs, es decir, particularmente . As
A t =
f s
Usando las relaciones anteriores, la ecuación (6b) puede escribirse como
2
AfDA=QAfD,ú-— , (6c)
es decir, el producto de la resolución de frecuencia y la longitud de ventana del banco de filtros de análisis y/o la resolución de frecuencia y la longitud de ventana del banco de filtros de síntesis deben seleccionarse para que sean 2 2
menores o igual a Q 1 . Para T>Q, el producto AfDA y/o QAfDs puede seleccionarse para que sea mayor de T + 1 , reduciendo así la complejidad computacional de los bancos de filtros.
En el presente documento se han descrito diversos métodos para realizar la transposición armónica de señales, preferiblemente señales de audio y/o voz. Se ha puesto énfasis particular sobre la complejidad computacional de los reemisores armónicos múltiples. En este contexto, se ha descrito un reemisor múltiple, que está configurado para realizar múltiples órdenes de transposición usando un banco de filtros de análisis/síntesis combinado, es decir, un banco de filtros que comprende un único banco de filtros de análisis y un único banco de filtros de síntesis. Un reemisor múltiple que usa un banco de filtros de análisis/síntesis combinado ha reducido la complejidad computacional en comparación con un reemisor múltiple convencional. Además, se ha descrito el sobremuestreo del dominio de frecuencia en el contexto de bancos de filtros de análisis/síntesis combinados. Puede usarse un sobremuestreo del dominio de frecuencia para reducir o eliminar los artefactos causados en las señales transitorias por la transposición
armónica. Se ha mostrado que el sobremuestreo de dominio de frecuencia puede implementarse con una complejidad computacional reducida dentro de bancos de filtros de análisis/síntesis combinados, en comparación con las implementaciones de reemisores múltiples convencionales.
Aunque se han descrito en el presente documento realizaciones específicas de la presente invención y aplicaciones de la invención, será evidente para los expertos en la técnica que son posibles muchas variaciones en las realizaciones y aplicaciones descritas en el presente documento sin apartarse del alcance de la invención descrita y reivindicada en el presente documento. Se entenderá que aunque se han mostrado y se han descrito ciertas formas de la invención, la invención no se limitará a las realizaciones específicas descritas y mostradas o los métodos específicos descritos. Los métodos y sistemas descritos en el documento presente pueden implementarse como software, firmware y/o hardware. Ciertos componentes pueden implementarse, por ejemplo, como software que se ejecuta en un procesador de señales digitales o microprocesador. Otros componentes pueden implementarse, por ejemplo, como hardware y/o como circuitos integrados específicos de aplicación. Las señales encontradas en los procedimientos y sistemas descritos pueden almacenarse en medios tales como una memoria de acceso aleatorio o medios de almacenamiento ópticos. Pueden transferirse a través de redes, tales como redes de radio, redes de satélite, redes inalámbricas o redes cableadas, por ejemplo Internet. Los dispositivos típicos que hacen uso de los métodos que se describen en el presente documento son, por ejemplo, reproductores multimedia o receptores de televisión que descodifican señales de audio. En el lado de codificación, los sistemas y métodos pueden usarse, por ejemplo, en estaciones de radiodifusión y en sitios de producción multimedia.
Claims (11)
1. Un sistema para generar una señal de salida que comprende una componente de alta frecuencia a partir de una señal de audio de entrada que comprende una componente de baja frecuencia usando un orden de transposición T, que comprende:
una unidad de ventana de análisis configurada para aplicar una ventana de análisis (611) de una longitud de muestras La , extrayendo así un cuadro de la señal de entrada;
una unidad de transformación de análisis de orden M (601) y que tiene una resolución de frecuencia A/ configurada para transformar las muestras La en M coeficientes complejos;
una unidad de procesamiento no lineal (643, 644, 650), configurada para alterar la fase de los coeficientes complejos utilizando el orden de transposición T;
una unidad de transformación de síntesis (602) de orden M y que tiene una resolución de frecuencia QAf, configurada para transformar los coeficientes alterados en M muestras de dominio temporal; en donde Q es un factor de resolución de frecuencia menor o igual que el orden de transposición T; y
una unidad de ventana de síntesis configurada para aplicar una ventana de síntesis (612) de una longitud de muestras Ls a las M muestras de dominio temporal, generando así un cuadro de la señal de salida;
en donde la orden de transformación M es M = F- Ls, y en donde 2
2. El sistema de la reivindicación 1, en el que la diferencia entre M y la longitud promedio de la ventana de análisis (611) y la ventana de síntesis (612) es proporcional a (Q -1).
3. El sistema de la reivindicación 1 o la reivindicación 2, en el que M es menor que (TLa +Ls)/2.
4. El sistema de cualquier reivindicación anterior, en el que
la unidad de transformación de análisis (601) realiza una de una Transformada de Fourier, una Transformada Rápida de Fourier, una Transformada Discreta de Fourier, una Transformada de Ondícula; y
la unidad de transformación de síntesis (602) realiza la transformada inversa correspondiente.
5. El sistema de cualquier reivindicación anterior, en el que la ventana de análisis (611) y/o síntesis (612) es una de: ventana gaussiana;
ventana cosenoidal
ventana Hamming;
ventana Hann;
ventana rectangular
ventana de Bartlett;
ventana de Blackman.
6. El sistema de cualquier reivindicación anterior, en el que
una tasa de muestreo de la señal de audio es /A;
la ventana de análisis (611) se desplaza por un tamaño de salto de análisis de muestras Asa a lo largo de la señal de audio;
7. El sistema de cualquier reivindicación anterior, en el que
una tasa de muestreo de la componente de alta frecuencia es fs = QfA
la ventana de síntesis (612) se desplaza por un tamaño de salto de síntesis de muestras Ass a lo largo de la componente de alta frecuencia;
8. El sistema de cualquier reivindicación anterior, en el que el sistema se usa para codificación o decodificación unificada de voz y audio.
9. Un método para generar una señal de salida que comprende una componente de alta frecuencia a partir de una señal de audio de entrada que comprende una componente de baja frecuencia usando un orden de transposición T, comprendiendo el método:
aplicar una ventana de análisis (611) de una longitud de muestras La , extrayendo así un cuadro de la señal de entrada; transformar el cuadro de muestras La de la señal de entrada en M coeficientes complejos usando una transformación de análisis de orden M y resolución de frecuencia ñf;
alterar la fase de los coeficientes complejos usando el orden de transposición T;
transformar los coeficientes alterados en M muestras alteradas usando una transformación de síntesis de orden M y resolución de frecuencia Qñf; en donde
Q es un factor de resolución de frecuencia menor o igual que el orden de transposición T; y
aplicar una ventana de síntesis (612) de una longitud de muestras Ls a las M muestras alteradas, generando así un cuadro de la señal de salida;
en donde la orden de transformación M es M = F- Ls, y en donde 2
10. Un método para diseñar un reemisor configurado con el fin de generar una señal de salida que comprende una componente de alta frecuencia a partir de una señal de entrada que comprende una componente de baja frecuencia usando un orden de transposición T, comprendiendo el método:
proporcionar una unidad de ventana de análisis configurada para aplicar una ventana de análisis (611) de una longitud de muestras La , extrayendo así un cuadro de la señal de entrada;
proporcionar una unidad de transformación de análisis de orden M (601) y con una resolución de frecuencia ñ f configurada para transformar las muestras LA en M coeficientes complejos;
proporcionar una unidad de procesamiento no lineal (643, 644, 650), configurada para alterar la fase de los coeficientes complejos utilizando el orden de transposición T;
proporcionar una unidad de transformación de síntesis (602) de orden M y con una resolución de frecuencia Qñf, configurada para transformar los coeficientes alterados en M muestras alteradas; en donde Q es un factor de resolución de frecuencia menor o igual que el orden de transposición T;
11. Un medio de almacenamiento que comprende software para un procesador o microprocesador de señal digital, que cuando se ejecuta en el procesador o microprocesador de señal digital hace que realice el método de la reivindicación 9 o de la reivindicación 10.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US25377509P | 2009-10-21 | 2009-10-21 | |
US33078610P | 2010-05-03 | 2010-05-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2906085T3 true ES2906085T3 (es) | 2022-04-13 |
Family
ID=42542966
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES23194739T Active ES2989851T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES21210177T Active ES2936307T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES14173151.3T Active ES2656668T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES20172571T Active ES2906085T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES17192422T Active ES2805349T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES10730734.0T Active ES2507165T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES22204414T Active ES2963061T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES23194739T Active ES2989851T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES21210177T Active ES2936307T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES14173151.3T Active ES2656668T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES17192422T Active ES2805349T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES10730734.0T Active ES2507165T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
ES22204414T Active ES2963061T3 (es) | 2009-10-21 | 2010-05-25 | Sobremuestreo en un banco de filtros de reemisor combinado |
Country Status (11)
Country | Link |
---|---|
US (10) | US8886346B2 (es) |
EP (8) | EP3998606B8 (es) |
JP (3) | JP5345737B2 (es) |
KR (1) | KR101309671B1 (es) |
CN (3) | CN102576541B (es) |
BR (2) | BR112012009375B1 (es) |
ES (7) | ES2989851T3 (es) |
HK (2) | HK1168189A1 (es) |
PL (6) | PL4276823T3 (es) |
RU (1) | RU2494478C1 (es) |
WO (1) | WO2011047887A1 (es) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7928310B2 (en) * | 2002-11-12 | 2011-04-19 | MediaLab Solutions Inc. | Systems and methods for portable audio synthesis |
ES2921059T3 (es) * | 2008-12-15 | 2022-08-17 | Fraunhofer Ges Forschung | Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente |
US8971551B2 (en) | 2009-09-18 | 2015-03-03 | Dolby International Ab | Virtual bass synthesis using harmonic transposition |
EP3998606B8 (en) * | 2009-10-21 | 2022-12-07 | Dolby International AB | Oversampling in a combined transposer filter bank |
BR122021014305B1 (pt) | 2010-03-09 | 2022-07-05 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch |
MY152376A (en) * | 2010-03-09 | 2014-09-15 | Fraunhofer Ges Forschung | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals |
EP2532002B1 (en) * | 2010-03-09 | 2014-01-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for processing an audio signal |
AU2011239995B2 (en) * | 2010-04-16 | 2014-01-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
ES2712304T3 (es) * | 2010-07-19 | 2019-05-10 | Dolby Int Ab | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
EP3544006A1 (en) | 2011-11-11 | 2019-09-25 | Dolby International AB | Upsampling using oversampled sbr |
EP2717261A1 (en) * | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding |
WO2014071514A1 (en) | 2012-11-06 | 2014-05-15 | Evolution Engineering Inc. | Fluid pressure pulse generator and method of using same |
CA3036490C (en) | 2012-12-17 | 2021-08-03 | Evolution Engineering Inc. | Mud pulse telemetry apparatus with a pressure transducer and method of operating same |
CA2895346C (en) | 2012-12-17 | 2018-10-23 | Evolution Engineering Inc. | Downhole telemetry signal modulation using pressure pulses of multiple pulse heights |
US10753201B2 (en) | 2012-12-17 | 2020-08-25 | Evolution Engineering Inc. | Mud pulse telemetry apparatus with a pressure transducer and method of operating same |
EP2830056A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
US9577798B1 (en) * | 2014-04-30 | 2017-02-21 | Keysight Technologies, Inc. | Real-time separation of signal components in spectrum analyzer |
US9306606B2 (en) * | 2014-06-10 | 2016-04-05 | The Boeing Company | Nonlinear filtering using polyphase filter banks |
CA2895680A1 (en) | 2014-06-27 | 2015-12-27 | Evolution Engineering Inc. | Fluid pressure pulse generator for a downhole telemetry tool |
US9670774B2 (en) | 2014-06-27 | 2017-06-06 | Evolution Engineering Inc. | Fluid pressure pulse generator for a downhole telemetry tool |
US9631488B2 (en) | 2014-06-27 | 2017-04-25 | Evolution Engineering Inc. | Fluid pressure pulse generator for a downhole telemetry tool |
EP2980791A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9704497B2 (en) * | 2015-07-06 | 2017-07-11 | Apple Inc. | Method and system of audio power reduction and thermal mitigation using psychoacoustic techniques |
CN107919136B (zh) * | 2017-11-13 | 2021-07-09 | 河海大学 | 一种基于高斯混合模型的数字语音采样频率估计方法 |
DE102018206159B3 (de) * | 2018-04-20 | 2019-09-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Paket-Detektor/Decoder für ein Funkübertragungssystem |
KR20210005164A (ko) * | 2018-04-25 | 2021-01-13 | 돌비 인터네셔널 에이비 | 고주파 오디오 재구성 기술의 통합 |
US11322127B2 (en) * | 2019-07-17 | 2022-05-03 | Silencer Devices, LLC. | Noise cancellation with improved frequency resolution |
US11889280B2 (en) * | 2021-10-05 | 2024-01-30 | Cirrus Logic Inc. | Filters and filter chains |
Family Cites Families (144)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4016540A (en) * | 1970-12-28 | 1977-04-05 | Gilbert Peter Hyatt | Apparatus and method for providing interactive audio communication |
US4060848A (en) * | 1970-12-28 | 1977-11-29 | Gilbert Peter Hyatt | Electronic calculator system having audio messages for operator interaction |
JPS5237465B2 (es) | 1973-03-28 | 1977-09-22 | ||
JPS5237465U (es) | 1975-09-09 | 1977-03-16 | ||
US4395700A (en) * | 1980-08-15 | 1983-07-26 | Environmental Research Institute Of Michigan | Image analyzer with variable line storage |
FR2628918B1 (fr) * | 1988-03-15 | 1990-08-10 | France Etat | Dispositif annuleur d'echo a filtrage en sous-bandes de frequence |
US5297236A (en) * | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
US5357594A (en) * | 1989-01-27 | 1994-10-18 | Dolby Laboratories Licensing Corporation | Encoding and decoding using specially designed pairs of analysis and synthesis windows |
EP0428156B1 (en) * | 1989-11-14 | 1996-08-21 | Nec Corporation | Adaptive transform coding by selecting optimum block lengths according to variations between successive blocks |
US5408580A (en) * | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
US5890106A (en) * | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US6073100A (en) * | 1997-03-31 | 2000-06-06 | Goodridge, Jr.; Alan G | Method and apparatus for synthesizing signals using transform-domain match-output extension |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
RU2256293C2 (ru) | 1997-06-10 | 2005-07-10 | Коудинг Технолоджиз Аб | Усовершенствование исходного кодирования с использованием дублирования спектральной полосы |
US6026356A (en) * | 1997-07-03 | 2000-02-15 | Nortel Networks Corporation | Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form |
JP3164038B2 (ja) * | 1997-11-05 | 2001-05-08 | 日本電気株式会社 | 音声帯域分割復号装置 |
US6493665B1 (en) * | 1998-08-24 | 2002-12-10 | Conexant Systems, Inc. | Speech classification and parameter weighting used in codebook search |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
US6246345B1 (en) * | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
US6298322B1 (en) * | 1999-05-06 | 2001-10-02 | Eric Lindemann | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
DE10030583A1 (de) * | 2000-06-21 | 2002-01-10 | Marconi Comm Gmbh | Vorrichtung und Verfahren zum Verarbeiten von Frequenzsignalen |
US20020016698A1 (en) * | 2000-06-26 | 2002-02-07 | Toshimichi Tokuda | Device and method for audio frequency range expansion |
SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US6900381B2 (en) * | 2001-05-16 | 2005-05-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Method for removing aliasing in wave table based synthesizers |
DE60118800T2 (de) * | 2001-06-08 | 2007-04-26 | Stmicroelectronics Asia Pacific Pte Ltd. | Einheitsfilterbank zur Audiocodierung |
US20040254797A1 (en) * | 2001-08-21 | 2004-12-16 | Niamut Omar Aziz | Audio coding with non-uniform filter bank |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
WO2003038813A1 (en) * | 2001-11-02 | 2003-05-08 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
FI20012313A (fi) * | 2001-11-26 | 2003-05-27 | Genelec Oy | Menetelmä matalataajuista ääntä muokkaavan modaalisen ekvalisaattorin suunnittelemiseksi |
ATE288617T1 (de) * | 2001-11-29 | 2005-02-15 | Coding Tech Ab | Wiederherstellung von hochfrequenzkomponenten |
US7146313B2 (en) * | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US20030138117A1 (en) * | 2002-01-22 | 2003-07-24 | Goff Eugene F. | System and method for the automated detection, identification and reduction of multi-channel acoustical feedback |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
FI20020865A (fi) * | 2002-05-07 | 2003-11-08 | Genelec Oy | Menetelmä matalataajuisen modaalisen ekvalisaattorin suunnittelemiseksi erityisesti lähekkäin sijaitsevia moodeja varten |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
WO2004008437A2 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
CN1328707C (zh) * | 2002-07-19 | 2007-07-25 | 日本电气株式会社 | 音频解码设备以及解码方法 |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
JP3879922B2 (ja) * | 2002-09-12 | 2007-02-14 | ソニー株式会社 | 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム |
CA2469674C (en) | 2002-09-19 | 2012-04-24 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
US7248711B2 (en) | 2003-03-06 | 2007-07-24 | Phonak Ag | Method for frequency transposition and use of the method in a hearing device and a communication device |
JP4076887B2 (ja) * | 2003-03-24 | 2008-04-16 | ローランド株式会社 | ボコーダ装置 |
DE10328777A1 (de) * | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
US20050018796A1 (en) * | 2003-07-07 | 2005-01-27 | Sande Ravindra Kumar | Method of combining an analysis filter bank following a synthesis filter bank and structure therefor |
FI118550B (fi) * | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
EP1507334A1 (fr) * | 2003-08-12 | 2005-02-16 | STMicroelectronics S.A. | Composant électronique permettant notamment le décodage de signaux modulés par une modulation numérique en quadrature sur un grand nombre de porteuses orthogonales |
KR20050027179A (ko) * | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
RU2374703C2 (ru) | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
KR20050064442A (ko) * | 2003-12-23 | 2005-06-29 | 삼성전자주식회사 | 이동통신 시스템에서 입체음향 신호 생성 장치 및 방법 |
DK1706866T3 (da) * | 2004-01-20 | 2008-06-09 | Dolby Lab Licensing Corp | Audiokodning på basis af blokgruppering |
US6980933B2 (en) * | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
CN1662100B (zh) * | 2004-02-24 | 2010-12-08 | 三洋电机株式会社 | 低音强调电路以及低音强调处理方法 |
EP1914722B1 (en) * | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
FR2875351A1 (fr) * | 2004-09-16 | 2006-03-17 | France Telecom | Procede de traitement de donnees par passage entre domaines differents de sous-bandes |
US7937271B2 (en) * | 2004-09-17 | 2011-05-03 | Digital Rise Technology Co., Ltd. | Audio decoding using variable-length codebook application ranges |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
JP4580210B2 (ja) * | 2004-10-19 | 2010-11-10 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
WO2006046546A1 (ja) * | 2004-10-26 | 2006-05-04 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
US7983904B2 (en) * | 2004-11-05 | 2011-07-19 | Panasonic Corporation | Scalable decoding apparatus and scalable encoding apparatus |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
ES2391292T3 (es) * | 2005-04-01 | 2012-11-23 | Qualcomm Incorporated | Sistemas, procedimientos y aparato para la generación de una señal de excitación de banda alta |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
EP1722360B1 (en) * | 2005-05-13 | 2014-03-19 | Harman Becker Automotive Systems GmbH | Audio enhancement system and method |
DK1742509T3 (da) * | 2005-07-08 | 2013-11-04 | Oticon As | Et system og en fremgangsmåde til eliminering af feedback og støj i et høreapparat |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US7197453B2 (en) * | 2005-07-29 | 2007-03-27 | Texas Instruments Incorporated | System and method for optimizing the operation of an oversampled discrete Fourier transform filter bank |
JP4701931B2 (ja) | 2005-09-02 | 2011-06-15 | 日本電気株式会社 | 信号処理の方法及び装置並びにコンピュータプログラム |
KR100851972B1 (ko) * | 2005-10-12 | 2008-08-12 | 삼성전자주식회사 | 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치 |
US20070083377A1 (en) * | 2005-10-12 | 2007-04-12 | Steven Trautmann | Time scale modification of audio using bark bands |
BRPI0520729B1 (pt) * | 2005-11-04 | 2019-04-02 | Nokia Technologies Oy | Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital. |
US7774396B2 (en) * | 2005-11-18 | 2010-08-10 | Dynamic Hearing Pty Ltd | Method and device for low delay processing |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN101356573B (zh) * | 2006-01-09 | 2012-01-25 | 诺基亚公司 | 对双耳音频信号的解码的控制 |
FR2897977A1 (fr) * | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
US8920343B2 (en) * | 2006-03-23 | 2014-12-30 | Michael Edward Sabatino | Apparatus for acquiring and processing of physiological auditory signals |
US20070299655A1 (en) * | 2006-06-22 | 2007-12-27 | Nokia Corporation | Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech |
US7876904B2 (en) * | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
WO2008035949A1 (en) * | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
WO2008045950A2 (en) * | 2006-10-11 | 2008-04-17 | Nielsen Media Research, Inc. | Methods and apparatus for embedding codes in compressed audio data streams |
CN101163240A (zh) * | 2006-10-13 | 2008-04-16 | 国际商业机器公司 | 一种滤波装置及其方法 |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
US7647229B2 (en) * | 2006-10-18 | 2010-01-12 | Nokia Corporation | Time scaling of multi-channel audio signals |
US8041578B2 (en) * | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8126721B2 (en) * | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
HUE068020T2 (hu) * | 2006-10-25 | 2024-12-28 | Fraunhofer Ges Forschung | Eljárás audiójel feldolgozására |
US20100017197A1 (en) * | 2006-11-02 | 2010-01-21 | Panasonic Corporation | Voice coding device, voice decoding device and their methods |
US7756350B2 (en) * | 2006-11-13 | 2010-07-13 | Global Ip Solutions, Inc. | Lossless encoding and decoding of digital data |
US20080243518A1 (en) * | 2006-11-16 | 2008-10-02 | Alexey Oraevsky | System And Method For Compressing And Reconstructing Audio Files |
JP4967618B2 (ja) * | 2006-11-24 | 2012-07-04 | 富士通株式会社 | 復号化装置および復号化方法 |
JP5103880B2 (ja) * | 2006-11-24 | 2012-12-19 | 富士通株式会社 | 復号化装置および復号化方法 |
US20100076755A1 (en) * | 2006-11-29 | 2010-03-25 | Panasonic Corporation | Decoding apparatus and audio decoding method |
KR101377135B1 (ko) * | 2007-01-02 | 2014-03-21 | 삼성전자주식회사 | 오디오 신호의 저주파 및 중주파 성분 보강 방법 및 그장치 |
SG144752A1 (en) * | 2007-01-12 | 2008-08-28 | Sony Corp | Audio enhancement method and system |
JP4708446B2 (ja) * | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP4984983B2 (ja) * | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
GB0710211D0 (en) * | 2007-05-29 | 2007-07-11 | Intrasonics Ltd | AMR Spectrography |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
EP2026597B1 (en) * | 2007-08-13 | 2009-11-11 | Harman Becker Automotive Systems GmbH | Noise reduction by combined beamforming and post-filtering |
US7522074B2 (en) * | 2007-09-17 | 2009-04-21 | Samplify Systems, Inc. | Enhanced control for compression and decompression of sampled signals |
KR101107992B1 (ko) * | 2007-09-20 | 2012-01-25 | 국립대학법인 도야마 다이가쿠 | 신호 해석 방법, 신호 해석 장치, 및 신호 해석 프로그램 |
JP5284360B2 (ja) * | 2007-09-26 | 2013-09-11 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 周囲信号を抽出するための重み付け係数を取得する装置および方法における周囲信号を抽出する装置および方法、並びに、コンピュータプログラム |
JP5098569B2 (ja) * | 2007-10-25 | 2012-12-12 | ヤマハ株式会社 | 帯域拡張再生装置 |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
DE602007004632D1 (de) * | 2007-11-12 | 2010-03-18 | Harman Becker Automotive Sys | Mischung von ersten und zweiten Tonsignalen |
US8483854B2 (en) * | 2008-01-28 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multiple microphones |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
US8000487B2 (en) * | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
US8060042B2 (en) * | 2008-05-23 | 2011-11-15 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
KR20100008749A (ko) * | 2008-07-16 | 2010-01-26 | 삼성전자주식회사 | 스위칭 파워 증폭 장치 및 그 제어 방법 |
JP4818335B2 (ja) * | 2008-08-29 | 2011-11-16 | 株式会社東芝 | 信号帯域拡張装置 |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
EP2224433B1 (en) * | 2008-09-25 | 2020-05-27 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
ES2921059T3 (es) * | 2008-12-15 | 2022-08-17 | Fraunhofer Ges Forschung | Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente |
CN101430882B (zh) * | 2008-12-22 | 2012-11-28 | 无锡中星微电子有限公司 | 一种抑制风噪声的方法及装置 |
BRPI1007050B1 (pt) * | 2009-01-16 | 2020-04-22 | Dolby Int Ab | Sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequênciaalta |
CN102342132B (zh) * | 2009-01-20 | 2015-04-01 | Med-El电气医疗器械有限公司 | 生成植入电极阵列的电极刺激信号的方法及耳蜗植入系统 |
CA2749239C (en) * | 2009-01-28 | 2017-06-06 | Dolby International Ab | Improved harmonic transposition |
CA3210604A1 (en) * | 2009-01-28 | 2010-08-05 | Dolby International Ab | Improved harmonic transposition |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US8359195B2 (en) * | 2009-03-26 | 2013-01-22 | LI Creative Technologies, Inc. | Method and apparatus for processing audio and speech signals |
US8526650B2 (en) * | 2009-05-06 | 2013-09-03 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
US8971551B2 (en) * | 2009-09-18 | 2015-03-03 | Dolby International Ab | Virtual bass synthesis using harmonic transposition |
TWI675367B (zh) * | 2009-05-27 | 2019-10-21 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
RU2557455C2 (ru) * | 2009-06-23 | 2015-07-20 | Войсэйдж Корпорейшн | Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала |
CN102859589B (zh) * | 2009-10-20 | 2014-07-09 | 弗兰霍菲尔运输应用研究公司 | 多模式音频编译码器及其适用的码簿激励线性预测编码 |
EP4362014A1 (en) * | 2009-10-20 | 2024-05-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
PL2486564T3 (pl) * | 2009-10-21 | 2014-09-30 | Dolby Int Ab | Urządzenie i sposób do generowania sygnału audio o wysokiej częstotliwości z użyciem adaptacyjnego nadpróbkowania |
EP3998606B8 (en) * | 2009-10-21 | 2022-12-07 | Dolby International AB | Oversampling in a combined transposer filter bank |
EP2513899B1 (en) * | 2009-12-16 | 2018-02-14 | Dolby International AB | Sbr bitstream parameter downmix |
-
2010
- 2010-05-25 EP EP21210177.8A patent/EP3998606B8/en active Active
- 2010-05-25 ES ES23194739T patent/ES2989851T3/es active Active
- 2010-05-25 EP EP20172571.0A patent/EP3723090B1/en active Active
- 2010-05-25 EP EP14173151.3A patent/EP2800094B1/en active Active
- 2010-05-25 US US13/499,893 patent/US8886346B2/en active Active
- 2010-05-25 EP EP24181063.9A patent/EP4451267A1/en active Pending
- 2010-05-25 PL PL23194739.1T patent/PL4276823T3/pl unknown
- 2010-05-25 EP EP23194739.1A patent/EP4276823B1/en active Active
- 2010-05-25 BR BR112012009375-4A patent/BR112012009375B1/pt active IP Right Grant
- 2010-05-25 ES ES21210177T patent/ES2936307T3/es active Active
- 2010-05-25 EP EP22204414.1A patent/EP4152320B1/en active Active
- 2010-05-25 PL PL20172571T patent/PL3723090T3/pl unknown
- 2010-05-25 KR KR1020127007844A patent/KR101309671B1/ko active IP Right Grant
- 2010-05-25 PL PL14173151T patent/PL2800094T3/pl unknown
- 2010-05-25 PL PL22204414.1T patent/PL4152320T3/pl unknown
- 2010-05-25 RU RU2012116009/08A patent/RU2494478C1/ru active
- 2010-05-25 ES ES14173151.3T patent/ES2656668T3/es active Active
- 2010-05-25 ES ES20172571T patent/ES2906085T3/es active Active
- 2010-05-25 ES ES17192422T patent/ES2805349T3/es active Active
- 2010-05-25 EP EP17192422.8A patent/EP3291231B1/en active Active
- 2010-05-25 CN CN2010800434072A patent/CN102576541B/zh active Active
- 2010-05-25 BR BR122020007866-9A patent/BR122020007866B1/pt active IP Right Grant
- 2010-05-25 JP JP2012530183A patent/JP5345737B2/ja active Active
- 2010-05-25 WO PCT/EP2010/057156 patent/WO2011047887A1/en active Application Filing
- 2010-05-25 PL PL17192422T patent/PL3291231T3/pl unknown
- 2010-05-25 CN CN201310423105.3A patent/CN103559890B/zh active Active
- 2010-05-25 PL PL21210177.8T patent/PL3998606T3/pl unknown
- 2010-05-25 EP EP10730734.0A patent/EP2491557B1/en active Active
- 2010-05-25 ES ES10730734.0T patent/ES2507165T3/es active Active
- 2010-05-25 CN CN201310423103.4A patent/CN103559889B/zh active Active
- 2010-05-25 ES ES22204414T patent/ES2963061T3/es active Active
-
2012
- 2012-09-06 HK HK12108706.4A patent/HK1168189A1/xx unknown
-
2013
- 2013-08-14 JP JP2013168635A patent/JP5613802B2/ja active Active
-
2014
- 2014-09-08 JP JP2014181997A patent/JP5950974B2/ja active Active
- 2014-10-03 US US14/505,739 patent/US9384750B2/en active Active
- 2014-11-28 HK HK14112055.1A patent/HK1198561A1/xx unknown
-
2016
- 2016-05-26 US US15/165,735 patent/US9830928B2/en active Active
-
2017
- 2017-10-25 US US15/792,956 patent/US10186280B2/en active Active
-
2018
- 2018-12-18 US US16/223,112 patent/US10584386B2/en active Active
-
2020
- 2020-03-05 US US16/810,786 patent/US10947594B2/en active Active
-
2021
- 2021-03-15 US US17/201,107 patent/US11591657B2/en active Active
-
2023
- 2023-01-19 US US18/156,701 patent/US11993817B2/en active Active
-
2024
- 2024-04-17 US US18/637,832 patent/US20240294987A1/en active Pending
- 2024-04-17 US US18/637,814 patent/US20240271217A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2906085T3 (es) | Sobremuestreo en un banco de filtros de reemisor combinado | |
ES2639716T3 (es) | Transposición armónica mejorada | |
ES2930054T3 (es) | Transposición armónica mejorada |