[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

ES2744904T3 - Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación - Google Patents

Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación Download PDF

Info

Publication number
ES2744904T3
ES2744904T3 ES15786812T ES15786812T ES2744904T3 ES 2744904 T3 ES2744904 T3 ES 2744904T3 ES 15786812 T ES15786812 T ES 15786812T ES 15786812 T ES15786812 T ES 15786812T ES 2744904 T3 ES2744904 T3 ES 2744904T3
Authority
ES
Spain
Prior art keywords
vector
predictive
correction
unit
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15786812T
Other languages
English (en)
Inventor
Takehiro Moriya
Yutaka Kamamoto
Noboru Harada
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Application granted granted Critical
Publication of ES2744904T3 publication Critical patent/ES2744904T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un dispositivo (100) de codificación de señal de sonido que comprende: una unidad (120) de codificación predictiva que está adaptada para obtener un primer código codificando un vector diferencial formado por diferenciales entre un vector de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden obtenidos a partir de una señal de sonido de entrada de una presente trama y un vector de predicción que contiene al menos un vector pronosticado a partir de una trama pasada, y obtener un vector diferencial de cuantificación correspondiente al primer código; y una unidad (110) de codificación no predictiva que está adaptada para generar un segundo código codificando un vector de corrección que está formado por todos o algunos de los elementos de diferenciales entre el vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la presente trama y el vector diferencial de cuantificación.

Description

DESCRIPCIÓN
Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación [Campo técnico]
La presente invención se refiere a una tecnología de codificación de codificación de coeficientes de predicción lineal y coeficientes que son convertibles en los mismos.
[Antecedentes de la técnica]
En la codificación de señales de sonido tales como habla y música, se utiliza ampliamente un método de realización de la codificación utilizando coeficientes de predicción lineal obtenidos realizando análisis de predicción lineal sobre una señal de sonido de entrada.
Para hacer posible la obtención, en la parte de un dispositivo de decodificación, de la información sobre los coeficientes de predicción lineal utilizados en el procesamiento de codificación mediante decodificación, un dispositivo de codificación codifica los coeficientes de predicción lineal y envía un código correspondiente a los coeficientes de predicción lineal al dispositivo de decodificación. En la Bibliografía no relacionada con patentes 1, un dispositivo de codificación convierte los coeficientes de predicción lineal en una secuencia de parámetros LSP (Par de Espectro de Línea) que son parámetros en un dominio de frecuencia y equivalentes a los coeficientes de predicción lineal y envía un código LSP obtenido codificando la secuencia de parámetros LSP a un dispositivo de codificación.
En la bibliografía no relacionada con patentes 1, para reducir la cantidad de código del código LSP, se utiliza una tecnología de codificación y decodificación vectorial que utiliza predicción de media móvil (predicción de MA).
En primer lugar, se describirá el flujo de procesamiento de codificación.
<Dispositivo 80 de codificación de coeficientes de predicción lineal>
La Figura 1 representa la configuración de un dispositivo 80 de codificación de coeficientes de predicción lineal existente. Al dispositivo 80 de codificación de coeficientes de predicción lineal, se introducen parámetros LSP (Pares de Espectro de Línea) 0f[1], 0f[2], ..., 0f[p] de cada trama, y el dispositivo 80 de codificación de coeficientes de predicción lineal realiza el siguiente procesamiento de una unidad 83 de resta predictiva, una unidad 84 de codificación vectorial, y una unidad 87 de entrada de retardo trama por trama, obtiene un código LSP Cf, y emite el código LSP Cf. Por otro lado, f representa un número de trama y p representa un orden de predicción.
Cuando se introduce una señal Xf de sonido de entrada al dispositivo 80 de codificación de coeficientes de predicción lineal, el dispositivo 80 de codificación de coeficientes de predicción lineal también se proporciona con una unidad 81 de análisis de predicción lineal y una unidad 82 de cálculo LSP, y las señales Xf de sonido de entrada de trama por trama se introducen consecutivamente en el mismo y se realiza el siguiente procesamiento trama por trama.
En adelante, se describirá el procesamiento específico de cada unidad.
<Unidad 81 de análisis de predicción lineal>
La unidad 81 de análisis de predicción lineal recibe la señal Xf de sonido de entrada, realiza análisis de predicción lineal sobre la señal Xf de sonido de entrada, obtiene los coeficientes af[1], af[2], ..., af[p] de predicción lineal, y emite los coeficientes af[1], af[2], ..., af[p] de predicción lineal. Aquí, af[i] representa un coeficiente de predicción lineal de i-ésimo orden que se obtiene realizando análisis de predicción lineal sobre una señal Xf de sonido de entrada de una f-ésima trama.
<Unidad 82 de cálculo LSP>
La unidad 82 de cálculo LSP recibe los coeficientes af[1], a{2], ..., af[p] de predicción lineal, obtiene los parámetros LSP 0f[1]], 0f[2], ..., 0f[p] a partir de los coeficientes af[1], af[2], ..., af[p] de predicción lineal y emite un vector 0 f = (0f[1], 0f[2], ..., 0f[p])T de parámetros LSP que es un vector que utiliza los parámetros LSP obtenidos como elementos del mismo. Aquí, Here, 0f[i] es un parámetro LSP de i-ésimo orden correspondiente a la señal Xf de sonido de entrada de la f-ésima trama. <Unidad 83 de resta predictiva>
La unidad 83 de resta predictiva está formada por, por ejemplo, un almacenamiento 83c que almacena un coeficiente a predeterminado, un almacenamiento 83d que almacena un vector V de media predictiva, una unidad 88 de multiplicación, y unidades 83a y 83b de resta.
La unidad 83 de resta predictiva recibe el vector ®f de parámetros LSP y un vector aSm . diferencial de cuantificación de la trama precedente.
La unidad 83 de resta predictiva genera un vector diferencial Sf = ®f-V-axASf-i = (Sf[1], Sf[2], ..., Sf[p])T que es un vector obtenido restando el vector V de media predictiva y un vector aASf-i del vector 0f de parámetros LSP y emite el vector diferencial Sf.
Por otro lado, el vector V = (v[1], v[2], ..., v[p])T de media predictiva es un vector predeterminado almacenado en el almacenamiento 83d y simplemente tiene que ser obtenido por adelantado a partir de, por ejemplo, una señal de sonido para el aprendizaje. Por ejemplo, en el dispositivo 80 de codificación de coeficientes de predicción lineal, utilizando una señal de sonido captada en el mismo entorno (por ejemplo, el mismo altavoz, dispositivo de captación de sonido, y lugar) que la señal de sonido a ser decodificada como una señal de sonido de entrada para el aprendizaje, se obtienen vectores de parámetros LSP de muchas tramas, y el promedio de los mismos se utiliza como el vector de media predictiva.
La unidad 88 de multiplicación obtiene un vector axASf-i multiplicando un vector A f diferencial decodificado de una trama precedente por el coeficiente a predeterminado almacenado en el almacenamiento 83c.
Por otro lado, en la Figura 1, utilizando las dos unidades 83a y 83b de resta, en primer lugar, después de que el vector V de media predictiva almacenado en el almacenamiento 83d sea restado del vector 0f de parámetros LSP en la unidad 83a de resta, el vector axASf-i se resta en la unidad 83b de resta, pero lo anterior se puede realizar a la inversa. Alternativamente, el vector diferencial Sf se puede generar restando, del vector 0f de parámetros LSP, un vector V+axASfi obtenido sumando el vector V de media predictiva y el vector axASf-i.
El vector diferencial Sf de la presente trama también se puede denominar un vector que se obtiene restando un vector que contiene al menos una predicción basada en una trama pasada de un vector (un vector 0 f de parámetros LSP) basado en coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden de la presente trama.
<Unidad 84 de codificación vectorial>
La unidad 84 de codificación vectorial recibe el vector diferencial Sf, codifica el vector diferencial Sf, y obtiene un código LSP Cf y un vector ASf = (Asf[i], ASf [2], ..., Asf[p])T diferencial de cuantificación correspondiente al código LSP Cf y emite el código LSP Cfy el vector ASf diferencial de cuantificación. Para codificar el vector diferencial Sf, se puede utilizar cualquiera de los métodos de codificación bien conocidos, tal como un método de cuantificación vectorial del vector diferencial Sf, un método de división del vector diferencial Sf en una pluralidad de subvectores y cuantificación vectorial de cada uno de los subvectores, un método de cuantificación vectorial multietapa del vector diferencial Sf o los subvectores, un método de cuantificación escalar de los elementos de un vector, y un método obtenido combinando estos métodos.
Aquí, se describirá un ejemplo de un caso en el que se utiliza el método de cuantificación vectorial del vector diferencial Sf
La unidad 84 de codificación vectorial busca un vector diferencial candidato más cercano al vector diferencial Sf a partir de una pluralidad de vectores diferenciales candidatos almacenados en un libro de códigos 86 de vectores y emite el vector diferencial candidato como el vector ASf diferencial de cuantificación, y emite un código vectorial diferencial correspondiente al vector ASf diferencial de cuantificación como el código LSP Cf. Por otro lado, el vector ASf diferencial de cuantificación corresponde a un vector diferencial decodificado que se describirá más adelante.
<Libro de códigos 86 de vectores>
En el libro de códigos 86 de vectores, los vectores diferenciales candidatos y los códigos vectoriales diferenciales correspondientes a los vectores diferenciales candidatos se almacenan por adelantado.
<Unidad 87 de entrada de retardo>
La unidad 87 de entrada de retardo recibe el vector ASf diferencial de cuantificación, mantiene el vector ASf diferencial de cuantificación, retarda el vector ASf, diferencial de cuantificación en una trama, y emite el vector resultante como un vector ASf-i diferencial de cuantificación de la trama precedente. Es decir, si la unidad 83 de resta predictiva ha realizado el procesamiento sobre un vector ASf diferencial de cuantificación de una f-ésima trama, la unidad 87 de entrada de retardo emite un vector ASf-i diferencial de cuantificación sobre una f-i-ésima trama.
<Dispositivo 90 de decodificación de coeficientes de predicción lineal>
La Figura 2 representa la configuración de un dispositivo 90 de decodificación de coeficientes de predicción lineal existente. Al dispositivo 90 de decodificación de coeficientes de predicción lineal, se introducen consecutivamente códigos LSP Cf de trama por trama, y el dispositivo 90 de decodificación de coeficientes de predicción lineal obtiene un vector A0 f = (A9[1], A9f[2], ..., A9f[p]) de parámetros LSP predictivos decodificados decodificando el código LSP Cf trama por trama.
En adelante, se describirá el procesamiento específico de cada unidad.
<Unidad 91 de decodificación vectorial>
Una unidad 91 de decodificación vectorial recibe el código LSP Cf, decodifica el código LSP Cf, obtiene un vector ASf diferencial decodificado correspondiente al código LSP Cf, y emite el vector ASf diferencial decodificado. Para la decodificación del código LSP Cf, se utiliza un método de decodificación correspondiente al método de codificación adoptado por la unidad 84 de codificación vectorial del dispositivo de codificación.
Aquí, se describirá un ejemplo de un caso en el que se utiliza un método de decodificación correspondiente al método adoptado por la unidad 84 de codificación vectorial, el método de cuantificación vectorial del vector diferencial Sf.
La unidad 91 de decodificación vectorial busca una pluralidad de códigos vectoriales diferenciales correspondientes al código LSP Cf a partir de códigos vectoriales diferenciales almacenados en un libro de códigos 92 de vectores y emite un vector diferencial candidato correspondiente a los códigos vectoriales diferenciales como el vector ASf diferencial decodificado. Por otro lado, el vector ASf diferencial decodificado corresponde al vector ASf diferencial de cuantificación descrito anteriormente y los elementos correspondientes toman los mismos valores si no hay errores de transmisión y no hay errores y similares en el curso de la codificación y decodificación.
<Libro de códigos 92 de vectores>
En el libro de códigos 92 de vectores, los vectores diferenciales candidatos y los códigos vectoriales diferenciales correspondientes a los vectores diferenciales candidatos se almacenan por adelantado. Por otro lado, el libro de códigos 92 de vectores comparte información en común con el libro de códigos 86 de vectores del dispositivo 80 de codificación de coeficientes de predicción lineal descrito anteriormente.
<Unidad 93 de entrada de retardo>
Una unidad 93 de entrada de retardo recibe el vector ASf diferencial decodificado, mantiene el vector ASf diferencial decodificado, retarda el vector ASf diferencial decodificado en una trama, y emite el vector resultante como un vector aSm diferencial decodificado de la trama precedente. Es decir, si una unidad 95 de suma predictiva realiza el procesamiento sobre un vector ASf diferencial decodificado de una f-ésima trama, la unidad 93 de entrada de retardo emite un vector ASfi diferencial decodificado de una f-1-ésima trama.
<Unidad 95 de suma predictiva>
Una unidad 95 de suma predictiva está formada por, por ejemplo, un almacenamiento 95c que almacena un coeficiente a predeterminado, un almacenamiento 95d que almacena un vector V de media predictiva, una unidad 94 de multiplicación, y unidades 95a y 95b de suma.
La unidad 95 de suma predictiva recibe el vector ASf diferencial decodificado de la presente trama y el vector ASf-i diferencial decodificado de la trama precedente.
La unidad 95 de suma predictiva genera un vector A©f (= ASf+V+aASf-i) de parámetros LSP predictivos decodificados que es un vector obtenido sumando el vector ASf diferencial decodificado, el vector V = (v[1], v[2], ..., v[N])T de media predictiva, y un vector axASf-i y emite el vector A©f de parámetros LSP predictivos decodificados.
La unidad 94 de multiplicación obtiene el vector axASf-i multiplicando el vector ASf-i diferencial decodificado de la trama precedente por el coeficiente a predeterminado almacenado en el almacenamiento 95c.
En la Figura 2, utilizando las dos unidades 95a y 95b de suma, en primer lugar, después de que vector axASf-i sea sumado al vector ASf diferencial decodificado de la presente trama en la unidad 95a de suma, el vector V de media predictiva se suma en la unidad 95b de suma, pero lo anterior se puede realizar a la inversa. Alternativamente, el vector A©f de parámetros LSP predictivos decodificados se puede generar sumando un vector obtenido sumando el vector axASf-i y el vector V de media predictiva al vector ASf diferencial decodificado.
Por otro lado, se supone que el vector V de media predictiva utilizado aquí es el mismo que el vector V de media predictiva utilizado en la unidad 83 de resta predictiva del dispositivo 80 de codificación de coeficientes de predicción lineal descrito anteriormente.
<Unidad 96 de cálculo de coeficientes de predicción lineal predictivos decodificados>
Si son necesarios coeficientes de predicción lineal, el dispositivo 90 de decodificación de coeficientes de predicción lineal se puede proporcionar con una unidad 96 de cálculo de coeficientes de predicción lineal predictivos decodificados. En este caso, la unidad 96 de cálculo de coeficientes de predicción lineal predictivos decodificados recibe el vector A®f de parámetros LSP predictivos decodificados, convierte el vector A©f de parámetros LSP predictivos decodificados en coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos decodificados, y emite los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos decodificados.
[Bibliografía de la técnica anterior]
[Bibliografía no relacionada con patentes]
Bibliografía no relacionada con patentes 1: "ITU-T Recommendation G.729", ITU, se conocen esquemas de codificación y decodificación predictiva/no predictiva adicionales a partir de los siguientes documentos:
Bibliografía no relacionada con patentes 2: Zarrinkoub H et al. "Switched prediction quantization of LSP frequencies", Proc. IEEE ICASSP, vol. 2, páginas 757-760, 7 Mayo de 1996
Bibliografía no relacionada con patentes 3: Jelinek M et al. "G.718: A new embedded speech and audio coding standard with high resilience to error-prone transmission channels", IEEE Communications Magazine, vol. 47, no. 10, páginas 117­ 123, Octubre de 2009
[Compendio de la invención]
[Problemas a ser resueltos por la invención]
En el dispositivo de decodificación de coeficientes de predicción lineal de la bibliografía no relacionada con patentes 1, dado que el procesamiento de decodificación de una f-ésima trama se realiza utilizando el vector asm diferencial decodificado que es el resultado de decodificación de una f-1-ésima trama, no solo cuando ocurre un error de transmisión en un código LSP de la presente trama, sino también cuando ocurre un error de transmisión en un código LSP de la trama inmediatamente precedente, los parámetros LSP de la presente trama tampoco se pueden decodificar correctamente.
En el dispositivo de decodificación de coeficientes de predicción lineal de la bibliografía no relacionada con patentes 1, dado que los parámetros LSP obtenidos mediante decodificación se utilizan solamente para la síntesis de predicción lineal, incluso cuando los parámetros LSP no se pueden decodificar correctamente, esto simplemente causa una reducción en la calidad de sonido de la señal de sonido decodificada en una pluralidad de tramas consecutivas. Es decir, puede decirse que el dispositivo de codificación de coeficientes de predicción lineal y el dispositivo de decodificación de coeficientes de predicción lineal de la bibliografía no relacionada con patentes 1 tienen una configuración que da una mayor prioridad a la expresión de los parámetros LSP con una cantidad de código pequeña que a un problema que surgirá cuando los parámetros LSP no puedan ser decodificados correctamente.
Sin embargo, el dispositivo de codificación de coeficientes de predicción lineal y el dispositivo de decodificación de coeficientes de predicción lineal se utilizan también en un dispositivo de codificación y un dispositivo de decodificación que utilizan los parámetros LSP no solo para análisis y síntesis de predicción lineal, sino también para codificación y decodificación de longitud variable en función de los valores de amplitud que forman una envolvente espectral que se determina a partir de los parámetros LSP. En este caso, surge el siguiente problema: si los parámetros LSP no se pueden decodificar correctamente en una trama, la decodificación de longitud variable no se puede realizar correctamente en una pluralidad de tramas consecutivas que incluyen esa trama, lo que hace posible obtener una señal de sonido decodificada.
En vista de tal problema, un objetivo de la presente invención es proporcionar un método de codificación y un método de decodificación de codificación y decodificación de coeficientes que son convertibles en coeficientes de predicción lineal, el método de codificación y el método de decodificación que pueden utilizar en combinación el método de codificación y método de decodificación predictivas que son un método de codificación y un método de decodificación que pueden expresar de manera precisa coeficientes que son convertibles en coeficientes de predicción lineal con una cantidad de código pequeña, los coeficientes tales como los utilizados en el análisis y síntesis de predicción lineal, por ejemplo, y un método de codificación y un método de decodificación que pueden obtener correctamente, mediante decodificación, coeficientes que son convertibles en coeficientes de predicción lineal de la presente trama, incluso cuando un código de coeficientes de predicción lineal (por ejemplo, un código LSP) que es un código correspondiente a los coeficientes que son convertibles en coeficientes de predicción lineal de una trama precedente, los coeficientes tales como los utilizados en codificación/decodificación de longitud variable en función de los valores de amplitud que forman una envolvente espectral que se determina a partir de los parámetros LSP, por ejemplo, no se introduce correctamente a un dispositivo de decodificación de coeficientes de predicción lineal, si se introduce correctamente un código de coeficientes de predicción lineal de la presente trama al dispositivo de decodificación de coeficientes de predicción lineal.
[Medios para resolver los problemas]
Para resolver el problema descrito anteriormente, según la presente invención se proporcionan un dispositivo de codificación de señal de sonido como se expone en la reivindicación independiente 1, y un método de codificación de señal de sonido como se expone en la reivindicación independiente 4, un programa como se expone en la reivindicación independiente 7, y un medio de grabación como se expone en la reivindicación independiente 8. Las realizaciones preferidas están definidas por las reivindicaciones dependientes.
Todas las siguientes apariciones de la palabra “realización(es)”, si se refieren a combinaciones de características diferentes de las definidas por las reivindicaciones independientes, se refieren a ejemplos que se presentaron originalmente pero que no representan realizaciones de la invención actualmente reivindicada; estos ejemplos se muestran aun así con fines ilustrativos solamente.
[Efectos de la invención ]
La presente invención produce el efecto de ser capaz de utilizar en combinación el método de codificación y método de decodificación predictivas que son un método de codificación y un método de decodificación que expresan de manera precisa coeficientes que son convertibles en coeficientes de predicción lineal con una cantidad de código pequeña y un método de codificación y un método de decodificación que pueden obtener correctamente, mediante decodificación, coeficientes que son convertibles en coeficientes de predicción lineal de la presente trama, incluso cuando un código de coeficientes de predicción lineal de una trama precedente no se introduce correctamente a un dispositivo de decodificación de coeficientes de predicción lineal, si se introduce correctamente un código de coeficientes de predicción lineal de la presente trama al dispositivo de decodificación de coeficientes de predicción lineal.
[Breve descripción de los dibujos]
La Figura 1 es un diagrama que representa la configuración de un dispositivo de codificación de coeficientes de predicción lineal existente.
La Figura 2 es un diagrama que representa la configuración de un dispositivo de decodificación de coeficientes de predicción lineal existente.
La Figura 3 es un diagrama de bloques funcional de un dispositivo de codificación de coeficientes de predicción lineal según una primera realización.
La Figura 4 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de codificación de coeficientes de predicción lineal según la primera realización.
La Figura 5 es un diagrama de bloques funcional de un dispositivo de decodificación de coeficientes de predicción lineal según la primera realización.
La Figura 6 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de decodificación de coeficientes de predicción lineal según la primera realización.
La Figura 7 es un diagrama de bloques funcional de un dispositivo de codificación de coeficientes de predicción lineal según una segunda realización.
La Figura 8 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de codificación de coeficientes de predicción lineal según la segunda y tercera realizaciones.
La Figura 9 es un diagrama de bloques funcional de un dispositivo de decodificación de coeficientes de predicción lineal según la segunda realización.
La Figura 10 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de decodificación de coeficientes de predicción lineal según la segunda y tercera realizaciones.
La Figura 11 es un diagrama de bloques funcional del dispositivo de codificación de coeficientes de predicción lineal según la tercera realización.
La Figura 12 es un diagrama de bloques funcional del dispositivo de decodificación de coeficientes de predicción lineal según la tercera realización.
La Figura 13 es un diagrama de bloques funcional de un dispositivo de codificación según una cuarta realización.
La Figura 14 es un diagrama que representa un ejemplo del flujo de procesamiento del dispositivo de codificación según la cuarta realización.
[Descripción detallada de las realizaciones]
En adelante, se describirán las realizaciones de la presente invención. Por otro lado, en los dibujos que se utilizan en la siguiente descripción, los elementos componentes que tienen la misma función y pasos en los que se realiza el mismo procesamiento se identifican con los mismos caracteres y se omitirán las explicaciones superpuestas. En la siguiente descripción, se supone que los símbolos tales como “A” y “~” y "-" utilizados en este texto se escriben inmediatamente encima de las letras que siguen inmediatamente a estos símbolos, pero, debido a una restricción impuesta por la notación de texto, se han escrito inmediatamente antes de las letras. En las fórmulas, estos símbolos están escritos en sus posiciones apropiadas. Además, se supone que el procesamiento que se realiza para cada elemento de los elementos de un vector y una matriz se aplica a todos los elementos del vector y la matriz a menos que se especifique lo contrario.
<Primera realización>
En adelante, se describirán principalmente las diferencias entre el dispositivo de codificación de coeficientes de predicción lineal y el dispositivo de decodificación de coeficientes de predicción lineal existentes.
<Dispositivo 100 de codificación de coeficientes de predicción lineal según la primera realización>
La Figura 3 representa un diagrama de bloques funcional de un dispositivo 100 de codificación de coeficientes de predicción lineal según la primera realización, y la Figura 4 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 100 de codificación de coeficientes de predicción lineal incluye una unidad 81 de análisis de predicción lineal, una unidad 82 de cálculo LSP, una unidad 120 de codificación predictiva, y una unidad 110 de codificación no predictiva. El procesamiento que se realiza en la unidad 81 de análisis de predicción lineal y la unidad 82 de cálculo LSP es el mismo que el descrito en la tecnología existente y corresponde a s81 y s82 de la Figura 4.
El dispositivo 100 de codificación de coeficientes de predicción lineal recibe una señal de sonido Xf, obtiene un código LSP Cf y un código LSP de corrección Df, y emite el código LSP Cf y el código LSP de corrección Df. Los códigos emitidos desde el dispositivo 100 de codificación de coeficientes de predicción lineal se introducen a un dispositivo 200 de decodificación de coeficientes de predicción lineal. Por otro lado, si un vector ®f = (0f[1], 0f[2], ..., 0f[p])T de parámetros LSP derivado de la señal de sonido Xf es generado por otro dispositivo y la entrada del dispositivo 100 de codificación de coeficientes de predicción lineal es el vector ®f de parámetros LSP, el dispositivo 100 de codificación de coeficientes de predicción lineal no tiene que incluir la unidad 81 de análisis de predicción lineal y la unidad 82 de cálculo LSP.
<Unidad 120 de codificación predictiva>
La unidad 120 de codificación predictiva incluye una unidad 83 de resta predictiva, una unidad 84 de codificación vectorial, un libro de códigos 86 de vectores, y una unidad 87 de entrada de retardo, y el procesamiento que se realiza en cada unidad es el mismo que el descrito en la tecnología existente. El procesamiento que se realiza en la unidad 83 de resta predictiva, la unidad 84 de codificación vectorial, y la unidad 87 de entrada de retardo corresponde a s83 a s87, respectivamente, de la Figura 4. Sin embargo, la unidad 84 de codificación vectorial emite el vector ASf diferencial de cuantificación no solo a la unidad 87 de entrada de retardo, sino también a la unidad 110 de codificación no predictiva.
La unidad 120 de codificación predictiva recibe el vector ®f de parámetros LSP, codifica un vector Sf diferencial formado por diferenciales entre el vector ®f de parámetros LSP y un vector de predicción que contiene al menos una predicción basada en una trama pasada, obtiene un código LSP Cf y un vector ASf diferencial de cuantificación correspondiente al código LSP Cf (s120), y emite el código LSP Cf y el vector ASf diferencial de cuantificación. Por otro lado, el vector ASf diferencial de cuantificación correspondiente al código LSP Cf es un vector formado por valores de cuantificación correspondientes a los valores de los elementos del vector diferencial Sf.
Aquí, el vector de predicción que contiene al menos una predicción basada en una trama pasada es, por ejemplo, un vector V+axASf-1 obtenido sumando un vector V de media predictiva predeterminado y un vector obtenido multiplicando cada elemento de un vector aSm diferencial de cuantificación (un vector diferencial de cuantificación de la trama precedente) de la trama inmediatamente precedente por a predeterminado. En este ejemplo, el vector que representa una predicción basada en una trama pasada, la predicción contenida en el vector de predicción, es axASf-1 que es a veces tan largo como el vector ASm diferencial de cuantificación de la trama precedente.
Por otro lado, dado que la unidad 120 de codificación predictiva no necesita ninguna entrada desde el exterior aparte del vector ®f de parámetros LSP, puede decirse que la unidad 120 de codificación predictiva obtiene el código LSP Cf codificando el vector Of de parámetros LSP.
Además, aunque no se genere un vector A®f de parámetros LSP de cuantificación predictivos en la unidad 120 de codificación predictiva, puede decirse que el vector A®f de parámetros LSP de cuantificación predictivos obtenidos cuantificando los elementos del vector ®f de parámetros LSP en la unidad 120 de codificación predictiva es lo que se obtiene sumando el vector V+axASf-1 de predicción al vector ASf diferencial de cuantificación. Es decir, el vector de parámetros LSP de cuantificación predictivos es A®f = ASf+V+ axASf-1. Además, un vector de error de cuantificación en la unidad 120 de codificación predictiva es ® ^ ® f = ®f-(ASf+V+ axASf-1).
<Unidad 110 de codificación no predictiva>
La unidad 110 de codificación o predictiva incluye una unidad 111 de resta no predictiva, una unidad 112 de codificación vectorial de corrección, y un libro de códigos 113 de vectores de corrección.
La unidad 110 de codificación no predictiva recibe el vector ®f de parámetros LSP y el vector ASf diferencial de cuantificación, y obtiene un código LSP de corrección Df codificando un vector de corrección que es un diferencial entre el vector ® f de parámetros LSP y el vector ASf diferencial de cuantificación y emite el código LSP de corrección Df (s110).
Aquí, dado que el vector de corrección es ® ^ S f y el vector de error de cuantificación de la unidad 120 de codificación predictiva es ®f-A®f = ®f-(ASf+V+ axASf-1), el vector de corrección es lo que se obtiene sumando el vector ®f-A®f de error de cuantificación de la unidad 120 de codificación predictiva, el vector V de media predictiva, y axASf-1 que es el vector diferencial de cuantificación de la trama precedente multiplicado por a. Es decir, puede decirse que la unidad 110 de codificación no predictiva obtiene el código LSP de corrección Df codificando lo que se obtiene sumando el vector ® ^ ® f de error de cuantificación y el vector V+axASf-1 de predicción.
Se puede utilizar cualquiera de los métodos de codificación bien conocidos para codificar el vector ®f-ASf de corrección; en la siguiente descripción, se describirá un método de cuantificación vectorial que se obtiene restando un vector Y de media no predictiva del vector ®f-ASf de corrección. Por otro lado, en la siguiente descripción, Uf = ®rY-ASf que es un vector obtenido restando el vector Y de media no predictiva del vector ® ^ S f de corrección se denomina como un vector de corrección con fines descriptivos.
En adelante, se describirá el procesamiento de cada unidad
<Unidad 111 de resta no predictiva>
La unidad 111 de resta no predictiva está formada por, por ejemplo, un almacenamiento 111c que almacena el vector Y de media no predictiva y las unidades 111a y 111b de resta.
La unidad 111 de resta no predictiva recibe el vector ®f = (0f[1], 9i[2], ..., 0f[p])T de parámetros LSP emitido desde la unidad 82 de cálculo LSP y el vector ASf diferencial de cuantificación.
La unidad 111 de resta no predictiva genera un vector Uf = ® r Y-ASf de corrección que es un vector obtenido restando el vector ASf = (As[1], Asf [2], ..., Asf[p])T diferencial de cuantificación y el vector Y = (y[1], y[2], ..., y[p])T de media no predictiva del vector ®f = (9f[1], 9f[2], ..., 9f[p])T de parámetros LSP (s111), y emite el vector Uf de corrección.
Por otro lado, en la Figura 3, utilizando las dos unidades 111a y 111b de resta, en primer lugar, después de que el vector Y de media no predictiva almacenado en el almacenamiento 111c sea restado del vector ®f de parámetros LSP en la unidad 111a de resta, el vector ASf diferencial de cuantificación se resta en la unidad 111b de resta, pero estas restas se pueden realizar a la inversa. Alternativamente, el vector Uf de corrección se puede generar restando un vector obtenido sumando el vector Y de media no predictiva y el vector ASf diferencial de cuantificación del vector ®f de parámetros LSP.
Por otro lado, el vector Y de media no predictiva es un vector predeterminado y simplemente tiene que ser obtenido por adelantado a partir de, por ejemplo, una señal de sonido para el aprendizaje. Por ejemplo, en el dispositivo 100 de codificación de coeficientes de predicción lineal correspondiente, utilizando una señal de sonido captada en el mismo entorno (por ejemplo, el mismo altavoz, dispositivo de captación de sonido, y lugar) que la señal de sonido a ser codificada como una señal de sonido de entrada para el aprendizaje, se obtienen los diferenciales entre los vectores de parámetros LSP y los vectores diferenciales de cuantificación para los vectores de parámetros LSP de muchas tramas, y se utiliza el promedio de los diferenciales como el vector de media no predictiva.
<Libro de códigos 113 de vectores de corrección>
En el libro de códigos 113 de vectores de corrección, se almacenan los vectores de corrección candidatos y los códigos vectoriales de corrección correspondientes a los vectores de corrección candidatos.
<Unidad 112 de codificación vectorial de corrección>
La unidad 112 de codificación vectorial de corrección recibe el vector Uf de corrección, codifica el vector Uf de corrección, obtiene el código LSP de corrección Df (s112), y emite el código LSP de corrección Df. Por ejemplo, la unidad 112 de codificación vectorial de corrección busca un vector de corrección candidato más cercano al vector Uf de corrección a partir de la pluralidad de vectores de corrección candidatos almacenados en el libro de códigos 113 de vectores de corrección y emite el código vectorial de corrección correspondiente a ese vector de corrección candidato como el código LSP de corrección Df. Por otro lado, aunque la generación real del mismo no tiene que ser realizada en la unidad 112 de codificación vectorial de corrección, la siguiente descripción se dará en el supuesto de que un vector de corrección candidato más cercano al vector Uf de corrección es un vector AUf de corrección cuantificado.
Por otro lado, como se describió anteriormente, dado que el vector de corrección contiene al menos el vector A f diferencial de cuantificación de la trama precedente que es la predicción de la unidad 120 de codificación predictiva basada en la trama precedente, puede decirse que la unidad 112 de codificación vectorial de corrección codifica al menos la predicción de la unidad 12o de codificación predictiva en base a la trama precedente.
Además, aunque la generación del mismo no tiene que ser realizada en la unidad 110 de codificación no predictiva, un vector A$f de parámetros LSP de cuantificación no predictivos obtenido cuantificando los elementos del vector ©f de parámetros LSP en la unidad 110 de codificación no predictiva es lo que se obtiene sumando el vector Y de media no predictiva, el vector ASf diferencial de cuantificación, y el vector AUf de corrección cuantificado. Es decir, a$ , = AUf+Y+ASf se mantiene.
<Dispositivo 200 de decodificación de coeficientes de predicción lineal según la primera realización>
En adelante, se describirán principalmente las diferencias con el ejemplo existente.
La Figura 5 representa un diagrama de bloques funcional del dispositivo 200 de decodificación de coeficientes de predicción lineal según la primera realización, y la Figura 6 representa un ejemplo del flujo de procesamiento del mismo. El dispositivo 200 de decodificación de coeficientes de predicción lineal incluye una unidad 220 de decodificación predictiva y una unidad 210 de decodificación no predictiva.
El dispositivo 200 de decodificación de coeficientes de predicción lineal recibe el código LSP C y el código LSP de corrección Df, genera un vector A©f= (aq^ ] , aq^ ] , ..., A0f[p]) de parámetros LSP predictivos decodificados y un vector a$ f = (a 0f[1], a 0,[2], ..., a 0f[p]) de parámetros LSP no predictivos decodificados, y emite el vector A©f de parámetros LSP predictivos decodificados y el vector a$ ( de parámetros LSP no predictivos decodificados. Además, cuando sea necesario, el dispositivo 200 de decodificación de coeficientes de predicción lineal genera coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos decodificados y coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos decodificados que se obtienen convirtiendo los parámetros A0f[1], A0f[2], ..., A0f[p] LSP predictivos decodificados y los parámetros A0f[1], a 0^2], ..., A0f[p] LSP no predictivos decodificados respectivamente en coeficientes de predicción lineal, y emite los coeficientes Aai[1], Aaf[2], ...Aaf[p] de predicción lineal predictivos decodificados y los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos decodificados.
<Unidad 220 de decodificación predictiva>
La unidad 220 de decodificación predictiva tiene una configuración similar a la del dispositivo 90 de decodificación de coeficientes de predicción lineal de la tecnología existente, y la unidad 220 de decodificación predictiva incluye un libro de códigos 92 de vectores, una unidad 91 de decodificación vectorial, una unidad 93 de entrada de retardo, y una unidad 95 de suma predictiva y, cuando sea necesario, también incluye una unidad 96 de cálculo de coeficientes de predicción lineal predictivos decodificados. El procesamiento que se realiza en la unidad 91 de decodificación vectorial, la unidad 93 de entrada de retardo, la unidad 95 de suma predictiva, y la unidad 96 de cálculo de coeficientes de predicción lineal predictivos decodificados corresponde a s91 a s96 respectivamente, de la Figura 6.
La unidad 220 de decodificación predictiva recibe el código LSP Cf, obtiene un vector ASf diferencial decodificado decodificando el código LSP Cf, genera un vector A©f = (A0f[1], A0f[2], ..., A0f[p]) de parámetros LSP predictivos decodificados formado por los valores A0f[1], A0f[2], ..., A0f[p] decodificados de los elementos del vector de parámetros LSP sumando el vector ASf diferencial decodificado y un vector de predicción que contiene al menos una predicción basada en una trama pasada (s220), y emite el vector A®f de parámetros LSP predictivos decodificados. Cuando sea necesario, la unidad 220 de decodificación predictiva convierte además el vector A0f de parámetros LSP predictivos decodificados en coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos decodificados (s220) y emite los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal predictivos decodificados.
En la presente realización, el vector de predicción es un vector (V+ axASf-i) obtenido sumando el vector V de media predictiva predeterminado y lo que se obtiene multiplicando el vector aSm diferencial decodificado de una trama pasada por un factor de a.
Por otro lado, la unidad 91 de decodificación vectorial emite el vector ASf diferencial decodificado también a una unidad 213 de suma no predictiva de la unidad 210 de decodificación no predictiva además de la unidad 93 de entrada de retardo y la unidad 95 de suma predictiva.
<Unidad 210 de decodificación no predictiva>
La unidad 210 de decodificación no predictiva incluye un libro de códigos 212 de vectores de corrección, una unidad 211 de decodificación vectorial de corrección, y la unidad 213 de suma no predictiva y, cuando sea necesario, también incluye una unidad 214 de cálculo de coeficientes de predicción lineal no predictivos decodificados.
A la unidad 210 de decodificación no predictiva, se introducen el código LSP de corrección Df y el vector ASf diferencial decodificado. La unidad 210 de decodificación no predictiva obtiene un vector AUf = (Auf[1], Auf[2], ..., Auf[p])T de corrección decodificado el código LSP de corrección Df. La unidad 210 de decodificación no predictiva genera además un vector a$ f = (a 0 f[1], a 0i{2], ..., a 0f[p]) de parámetros LSP no predictivos decodificados formado por valores A0f[1], a 0f[2], ..., a 0 f[p] decodificados de los elementos del vector de parámetros LSP de la presente trama sumando al menos el vector ASf diferencial decodificado al vector AUf de corrección decodificado (s210) y emite el vector A$f de parámetros LSP no predictivos decodificados. Cuando sea necesario, la unidad 210 de decodificación no predictiva convierte además el vector A $ f de parámetros LSP no predictivos decodificados en coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos decodificados (s210) y emite los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos decodificados.
En la presente realización, el vector A$f de parámetros LSP no predictivos decodificados es un vector obtenido sumando el vector ASf diferencial decodificado obtenido decodificando el código LSP Cf y el vector Y de media no predictiva predeterminado al vector AUf de corrección decodificado obtenido decodificando el código LSP de corrección Df. Es decir, en la unidad 210 de decodificación no predictiva, el vector A$f decodificado del vector de parámetros LSP de la presente trama se obtiene solamente a partir de los códigos introducidos en la presente trama.
En adelante, se describirán los detalles de procesamiento de cada unidad.
<Libro de códigos 212 de vectores de corrección>
El libro de códigos 212 de vectores de corrección almacena la información con el mismo contenido que el del libro de códigos 113 de vectores de corrección en el dispositivo 100 de codificación de coeficientes de predicción lineal. Es decir, en el libro de códigos 212 de vectores de corrección, se almacenan los vectores de corrección candidatos y los códigos vectoriales de corrección correspondientes a los vectores de corrección candidatos.
<Unidad 211 de decodificación vectorial de corrección>
La unidad 211 de decodificación vectorial de corrección recibe el código LSP de corrección Df, obtiene el vector AUf de corrección decodificado decodificando el código LSP de corrección Df (s211), y emite el vector AUf de corrección decodificado. Por ejemplo, la unidad 211 de decodificación vectorial de corrección busca un código vectorial de corrección correspondiente al código LSP de corrección Df introducido al dispositivo 200 de decodificación de coeficientes de predicción lineal a partir de la pluralidad de códigos vectoriales de corrección almacenados en el libro de códigos 212 de vectores de corrección y emite un vector de corrección candidato correspondiente al código vectorial de corrección obtenido por la búsqueda como el vector AUf de corrección decodificado.
<Unidad 213 de suma no predictiva>
La unidad 213 de suma no predictiva está formada por, por ejemplo, un almacenamiento 213c que almacena un vector Y de media no predictiva y unidades 213a y 213b de suma.
La unidad 213 de suma no predictiva recibe el vector AUf de corrección decodificado y el vector ASf diferencial decodificado. La unidad 213 de suma no predictiva genera un vector A$f = AUf+Y+ASf = (a 0f[1], a 0f[2], ..., a 0f[p]) de parámetros LSP no predictivos decodificados obtenido sumando el vector AUf de corrección decodificado, el vector ASf diferencial decodificado, y el vector Y de media no predictiva almacenados en el almacenamiento 213c (s213) y emite el vector a$ , de parámetros LSP no predictivos decodificados. Por otro lado, en la Figura 5, utilizando las dos unidades 213a y 213b de suma, en primer lugar, después de que el vector ASf diferencial decodificado sea sumado al vector AUf de corrección decodificado en la unidad 213a de suma, el vector Y de media no predictiva almacenado en el almacenamiento 213c se suma en la unidad 213b de suma, pero estas sumas se pueden realizar a la inversa. Alternativamente, el vector a$ , de parámetros LSP no predictivos decodificados se puede generar sumando un vector obtenido sumando el vector Y de media no predictiva y el vector ASf diferencial decodificado al vector AUf de corrección decodificado.
Por otro lado, se supone que el vector Y de media no predictiva utilizado aquí es el mismo que el vector Y de media no predictiva utilizado en la unidad 111 de resta no predictiva del dispositivo 100 de codificación de coeficientes de predicción lineal descrito anteriormente.
<Unidad 214 de cálculo de coeficientes de predicción lineal no predictivos decodificados>
La unidad 214 de cálculo de coeficientes de predicción lineal no predictivos decodificados recibe el vector a$ , de parámetros LSP no predictivos decodificados. La unidad 214 de cálculo de coeficientes de predicción lineal no predictivos decodificados convierte el vector a$ , de parámetros LSP no predictivos decodificados en coeficientes Abf[1], Abf[2], ..., Abf[p] (s214) de predicción lineal no predictivos decodificados y emite los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal no predictivos decodificados.
<Efecto de la primera realización>
Con el dispositivo de decodificación de coeficientes de predicción lineal de la primera realización, incluso cuando el vector ASf-1 diferencial decodificado no se puede decodificar correctamente debido a un error de transmisión ocurrido en un código LSP Cf -1 de una f-1-ésima trama, dado que el vector a$ , de parámetros LSP no predictivos decodificados que es un valor decodificado del vector de parámetros LSP que no depende del vector ASf-1 diferencial decodificado se obtiene en la unidad 210 de decodificación no predictiva, es posible evitar que el error de transmisión en el código LSP Cf -1 de la f-1-ésima trama afecte al vector a$ , de parámetros LSP no predictivos decodificados de una f-ésima trama. Por ejemplo, cuando el vector de parámetros LSP de cuantificación no predictivos/vector a$ , de parámetros LSP no predictivos decodificados se utiliza como un vector de parámetros LSP que se utiliza en la codificación/decodificación de longitud variable en función de los valores de amplitud que forman una envolvente espectral que se determina a partir de un vector de parámetros LSP, incluso cuando no se puede obtener un vector a$ , de parámetros LSP no predictivos decodificados correcto en la f-1-ésima trama y no se puede realizar correctamente la decodificación de longitud variable, se obtiene un vector a$ , de parámetros LSP no predictivos decodificados correcto en la f-ésima trama y se puede realizar correctamente la decodificación de longitud variable.
Por otro lado, dado que el vector de corrección no tiene que ser cuantificado de manera precisa hasta tal punto que el vector de parámetros LSP se cuantifica (de tal manera que un error de cuantificación se vuelve menor), el número de tipos de vectores de corrección candidatos preparados en el libro de códigos 113 de vectores de corrección puede ser pequeño. Por ejemplo, la longitud de bit del código vectorial de corrección es 2-bits, y, en el libro de códigos 113 de vectores de corrección, se almacenan cuatro tipos de vectores de corrección candidatos correspondientes a cuatro tipos de códigos vectoriales de corrección ("00" "01" "10" "11").
Esto hace posible reducir el número de tipos de vectores de corrección candidatos preparados en el libro de códigos de vectores de corrección y de este modo asignar un código con una cantidad de código pequeña. Como resultado, con un aumento en una cantidad de código pequeña, es posible implementar la codificación y decodificación en las que ocurre menos distorsión que en el ejemplo existente.
<Modificación>
En la presente realización, se describen los parámetros LSP, pero se pueden utilizar otros coeficientes siempre que los coeficientes sean coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden. Lo anterior se puede aplicar a coeficientes PARCOR, coeficientes obtenidos transformando los parámetros LSP o los coeficientes PARCOR, y los propios coeficientes de predicción lineal. Todos estos coeficientes se pueden convertir entre sí en el campo técnico de la codificación de habla, y el efecto de la primera realización se puede obtener utilizando cualquiera de estos coeficientes. Por otro lado, el código LSP Cf o un código correspondiente al código LSP Cf también se denomina como un primer código y la unidad de codificación predictiva también se denomina como una primera unidad de codificación. Similarmente, el código LSP de corrección o un código correspondiente al código LSP de corrección también se denomina como un segundo código y la unidad de codificación no predictiva también se denomina como una segunda unidad de codificación. Además, el vector A©f de parámetros LSP predictivos decodificados o un vector correspondiente al vector a ®f de parámetros LSP predictivos decodificados también se denomina como un primer vector decodificado y la unidad de decodificación predictiva también se denomina como una primera unidad de decodificación. Además, el vector AOf de parámetros LSP no predictivos decodificados o un vector correspondiente al vector a$ , de parámetros LSP no predictivos decodificados también se denomina como un segundo vector decodificado y la unidad de decodificación no predictiva también se denomina como una segunda unidad de decodificación.
En la presente realización, solamente se utiliza una trama como una “trama pasada”, pero, si es necesario, se pueden utilizar dos tramas o más como sea apropiado.
<Segunda realización>
Se describirán principalmente las diferencias con la primera realización
En la presente realización, se determina si codificar o no un vector de corrección y decodificar un código LSP de corrección utilizando la magnitud de un cambio en la diferencia de altura en las ondas de la amplitud de una envolvente espectral, en otras palabras, la altura de pico a valle de la envolvente espectral.
Si los parámetros LSP se codifican mediante la misma cantidad de código independientemente de la magnitud de un cambio en la diferencia de altura en las ondas de la amplitud de una envolvente espectral, un error de cuantificación observado cuando un cambio en la diferencia de altura en las ondas de la amplitud de una envolvente espectral es grande es mayor que un error de cuantificación observado cuando un cambio en la diferencia de altura de las ondas de la amplitud de una envolvente espectral es pequeño. Por tanto, un dispositivo de codificación de coeficientes de predicción lineal ejecuta la unidad de codificación vectorial de corrección solo cuando se considera que un error de cuantificación en LSP es grande y emite un código LSP de corrección Df y un dispositivo de decodificación de coeficientes de predicción lineal decodifica el código LSP de corrección Df, por lo que es posible realizar procesamiento de codificación y decodificación que sufra menos reducción en la calidad de sonido causada por un error de transmisión en un código que en la tecnología existente mientras se reduce la cantidad de código en su conjunto en comparación con la primera realización.
<Dispositivo 300 de codificación de coeficientes de predicción lineal según la segunda realización>
La Figura 7 representa un diagrama de bloques funcional de un dispositivo 300 de codificación de coeficientes de predicción lineal según la segunda realización, y la Figura 8 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 300 de codificación de coeficientes de predicción lineal de la segunda realización incluye una unidad 310 de codificación no predictiva en lugar de la unidad 110 de codificación no predictiva. Como es el caso con el dispositivo 100 de codificación de coeficientes de predicción lineal de la primera realización, si los parámetros d LSP derivados de una señal Xf de sonido son generados por otro dispositivo y la entrada del dispositivo 300 de codificación de coeficientes de predicción lineal es los parámetros LSP 0f[1], 0f[2], ..., 0f[p], el dispositivo 300 de codificación de coeficientes de predicción lineal no tiene que incluir la unidad 81 de análisis de predicción lineal y la unidad 82 de cálculo LSP.
La unidad 310 de codificación no predictiva incluye una unidad 311 de resta no predictiva, una unidad 312 de codificación vectorial de corrección, el libro de códigos 113 de vectores de corrección, una unidad 314 de suma predictiva, y una unidad 315 de cálculo de índice. La diferencia radica en que se determina si se realiza o no procesamiento de resta en la unidad 311 de resta no predictiva y si se realiza o no procesamiento de codificación en la unidad 312 de codificación vectorial de corrección en función del resultado de cálculo de la unidad 315 de cálculo de índice.
Por otro lado, la unidad 120 de codificación predictiva emite un vector axASf-1, que es un valor de salida de la unidad 88 de multiplicación, además de un vector ASf diferencial de cuantificación.
<Unidad 314 de suma predictiva>
La unidad 314 de suma predictiva está formada por, por ejemplo, un almacenamiento 314c que almacena un vector V de media predictiva y unidades 314a y 314b de suma.
La unidad 314 de suma predictiva recibe el vector ASf diferencial de cuantificación de la presente trama y el vector axASf-1 obtenido multiplicando el vector ASf-! diferencial de cuantificación de la trama precedente por un coeficiente a predeterminado.
La unidad 314 de suma predictiva genera un vector A©f (= ASf+V+ aASf-1) = (A0f[1], A0f[2], ..., A0f[p])T de parámetros LSP de cuantificación predictivos que es un vector obtenido sumando el vector ASf diferencial de cuantificación, el vector V de media predictiva, y el vector axASf-1 (s314) y emite el vector A©f de parámetros LSP de cuantificación predictivos.
En la Figura 7, utilizando las dos unidades 314a y 314b de suma, en primer lugar, después de que el vector axASf-i sea sumado al vector ASf diferencial de cuantificación de la presente trama en la unidad 3 l4b de suma, el vector V de media predictiva se suma en la unidad 314a de suma, pero lo anterior se puede realizar a la inversa. Alternativamente, el vector A0f de parámetros LSP de cuantificación predictivos se puede generar sumando un vector obtenido sumando el vector axASf-i y el vector V de media predictiva al vector ASf diferencial de cuantificación.
Por otro lado, dado que tanto el vector ASf diferencial de cuantificación de la presente trama como el vector axASf-i obtenido multiplicando el vector asm diferencial de cuantificación de la trama precedente por el coeficiente a predeterminado, el vector ASf diferencial de cuantificación y el vector axASf-i que se introducen a la unidad 314 de suma predictiva, se generan también en la unidad 120 de codificación predictiva y el vector V de media predictiva almacenado en el almacenamiento 314c en la unidad 314 de suma predictiva es el mismo que el vector V de media predictiva almacenado en el almacenamiento 83d en la unidad 120 de codificación predictiva, se puede adoptar una configuración en la que la unidad 120 de codificación predictiva genera el vector A0f de parámetros LSP de cuantificación predictivos realizando el procesamiento que es realizado por la unidad 314 de suma predictiva y emite el vector A0f de parámetros LSP de cuantificación predictivos a la unidad 310 de codificación no predictiva y la unidad 314 de suma predictiva no se proporciona en la unidad 310 de codificación no predictiva.
<Unidad 315 de cálculo de índice>
La unidad 315 de cálculo de índice recibe el vector A0f de parámetros LSP de cuantificación predictivos. Utilizando el vector A0f de parámetros LSP de cuantificación predictivos, la unidad 315 de cálculo de índice calcula un índice Q proporcional a lo alta que sea la altura de pico a valle de una envolvente espectral, correspondiendo la envolvente espectral al vector A0f de parámetros LSP de cuantificación predictivos, es decir, el índice Q que aumenta con un aumento en el pico a valle de la envolvente espectral y/o un índice Q' proporcional a lo corta que sea la altura de pico a valle de la envolvente espectral, es decir, el índice Q' que disminuye con un aumento en el pico a valle de la envolvente espectral (s315). De acuerdo con la magnitud del índice Q y/o Q', la unidad 315 de cálculo de índice emite una señal C de control a la unidad 312 de codificación vectorial de corrección de tal manera que la unidad 312 de codificación vectorial de corrección realiza el procesamiento de codificación o realiza el procesamiento de codificación utilizando un número de bits predeterminado. Además, de acuerdo con la magnitud del índice Q y/o Q', la unidad 315 de cálculo de índice emite la señal C de control a la unidad 311 de resta no predictiva de tal manera que la unidad 311 de resta no predictiva realiza el procesamiento de resta. En adelante, se describirá un método de generación de la señal C de control.
En general, los parámetros LSP son una secuencia de parámetros en un dominio de frecuencia que tienen una correlación con una envolvente espectral de potencia de una señal de sonido de entrada, y cada valor de los parámetros LSP se correlaciona con la posición de frecuencia del valor de extremo de la envolvente espectral de potencia de la señal de sonido de entrada. Si se supone que los parámetros LSP son 0 [1], 0 [2], ..., 0 [p], el valor de extremo de la envolvente espectral de potencia está presente en la posición de frecuencia entre 0 [i] y 0 [i+1], y, cuanto más pronunciada sea la pendiente de una tangente alrededor de este valor de extremo, más estrecho se vuelve el intervalo (es decir, el valor de (0[i+1] - 0[i])) entre 0[i] y 0[i+1]. Es decir, cuanto mayor sea la diferencia de altura en las ondas de la amplitud de la envolvente espectral de potencia, más desigual se vuelve el intervalo entre 0 [i] y 0 [i+1] para cada i, es decir, mayor se vuelve la varianza de los intervalos entre los parámetros LSP; a la inversa, si no hay casi ninguna diferencia de altura en las ondas de la envolvente espectral de potencia, más igual se vuelve el intervalo entre 0 [i] and 0 [i+1] y para cada i, es decir, menor se vuelve la varianza de los intervalos entre los parámetros LSP.
Por tanto, un índice grande correspondiente a la varianza de los intervalos entre los parámetros LSP significa un gran cambio en la diferencia de altura de las ondas de la amplitud de una envolvente espectral de potencia. Además, un índice pequeño correspondiente al valor mínimo de los intervalos entre los parámetros LSP significa un gran cambio en la diferencia de altura de las ondas de la amplitud de una envolvente espectral de potencia.
Dado que los parámetros A0¿1], a0£2], ..., A0f[p] LSP de cuantificación predictivos son lo que se obtiene cuantificando los parámetros lSp 0f[1], 0f[2], ..., 0f[p] y, si el código LSP Cf se introduce al dispositivo de decodificación predictivo lineal desde el dispositivo de codificación predictivo lineal sin error, los parámetros A0f[1], A0f[2], ..., A0f[p] LSP predictivos decodificados son los mismos que los parámetros A0f[1], A0f[2], ..., A0f[p] LSP de cuantificación predictivos, los parámetros A0f[1 ], A0f[2], ..., A0f[p] LSP de cuantificación predictivos y los parámetros A0f[1], A0f[2], ..., A0f[p] LSP predictivos decodificados también tienen las propiedades similares a las de los parámetros LSP 0f[1], 0f[2], ..., 0f[p].
Por tanto, un valor correspondiente a la varianza de los intervalos entre los parámetros A0f[1], A0f[2], ..., A0f[p] LSP de cuantificación predictivos se puede utilizar como el índice Q que aumenta con un aumento en el pico a valle de una envolvente espectral, y el valor mínimo de los diferenciales (A0,[i+1] - A0f[i]) entre los parámetros lSp de cuantificación predictivos con órdenes adyacentes, los parámetros LSP de cuantificación predictivos del vector A0f = (A0f[1], A0f[2], ..., A0f[p]) de parámetros LSP de cuantificación predictivos, se pueden utilizar como el índice Q' que disminuye con un aumento en el pico a valle de una envolvente espectral.
El índice Q que aumenta con un aumento en el pico a valle de una envolvente espectral se calcula mediante, por ejemplo, un índice Q que indica la varianza de los intervalos entre los parámetros LSP de cuantificación predictivos que son los elementos del vector A0f de parámetros LSP de cuantificación predictivos, teniendo cada uno un orden menor o igual que un orden T(T s p) predeterminado, es decir,
Figure imgf000014_0003
Además, el índice Q' que disminuye con un aumento en el pico a valle de una envolvente espectral se calcula mediante, por ejemplo, un índice Q' que indica el valor mínimo del intervalo entre los parámetros LSP de cuantificación predictivos con órdenes adyacentes, los parámetros LSP de cuantificación predictivos del vector A0f de parámetros LSP de cuantificación predictivos cuyo orden es menor o igual que un orden T (T s p) predeterminado, es decir,
Figure imgf000014_0001
Alternativamente, el índice Q' se calcula mediante un índice Q' que indica el valor mínimo del intervalo entre los parámetros LSP cuantificados de predicción con órdenes adyacentes, los parámetros LSP cuantificados de predicción del vector A0f de parámetros LSP de cuantificación predictivos, y el valor del parámetro LSP de cuantificación predictivo de orden más bajo:
Figure imgf000014_0002
Dado que los parámetros LSP son parámetros presentes entre 0 y n en secuencia de orden, el parámetro A0f[l] LSP de cuantificación predictivo de orden más bajo en esta fórmula significa el intervalo (A0f[1] - 0) entre A0f[1] y 0.
La unidad 315 de cálculo de índice emite, a la unidad 311 de resta no predictiva y la unidad 312 de codificación vectorial de corrección, la señal C de control que indica que se realiza el procesamiento de codificación de corrección si el pico a valle de la envolvente espectral está por encima de un estándar predeterminado, es decir, en el ejemplo descrito anteriormente, si (A-1) el índice Q es mayor o igual que un valor de umbral Th1 predeterminado y/o (B-1) el índice Q' es menor o igual que un valor de umbral Th1' predeterminado; de lo contrario, la unidad 315 de cálculo de índice emite, a la unidad 311 de resta no predictiva y la unidad 312 de codificación vectorial de corrección, la señal C de control que indica que no se realiza el procesamiento de codificación de corrección. Aquí, “en el caso de (A-1) y/o (B-1)” es una expresión que incluye los siguientes tres casos: un caso en el que solo se obtiene el índice Q y se satisface la condición (A-1), un caso en el que solo se obtiene el índice Q' y se satisface la condición (B-1), y un caso en el que se obtienen tanto el índice Q como el índice Q' y se satisfacen las condiciones (A-1) y (B-1). Huelga decir que, incluso cuando se hace una determinación en cuanto a si se satisface o no la condición (A-1), se puede obtener el índice Q', y, incluso cuando se hace una determinación en cuanto a si se satisface o no la condición (B-1), se puede obtener el índice Q. Lo mismo ocurre con “y/o” en la siguiente descripción.
Además, la unidad 315 de cálculo de índice se puede configurar de tal manera que la unidad 315 de cálculo de índice emita un entero positivo (o un código que representa un entero positivo) que representa un número de bits predeterminado como la señal C de control en el caso de (A-1) y/o (B-1); de lo contrario, la unidad 315 de cálculo de índice emite 0 como la señal C de control.
Por otro lado, cuando la unidad 311 de resta no predictiva se configura para realizar procesamiento de resta si la unidad 311 de resta no predictiva recibe la señal C de control y la unidad 312 de codificación vectorial de corrección se configura para realizar procesamiento de codificación si la unidad 312 de codificación vectorial de corrección recibe la señal C de control, la unidad 315 de cálculo de índice se puede configurar para no emitir la señal C de control en casos distintos del caso (A-1) y/o (B-1).
<Unidad 311 de resta no predictiva>
La unidad 311 de resta no predictiva recibe la señal C de control, el vector ®f= (0f[1], 0f[2], ..., 0f[p])T de parámetros LSP, y el vector ASf diferencial de cuantificación.
La unidad 311 de resta no predictiva recibe la señal C de control que indica que se realiza el procesamiento de codificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en el caso de (A-1) y/o (B-1), la unidad 311 de resta no predictiva genera un vector Uf = 0f-Y-ASf de corrección que es un vector obtenido restando el vector aSm diferencial de cuantificación y el vector = (y[1], y[2], ..., y[p])T de media no predictiva del vector 0f = (0f[1], 0f[2], ..., 0f[p])T de parámetros LSP (s311) y emite el vector Uf de corrección.
<Unidad 312 de codificación vectorial de corrección>
La unidad 312 de codificación vectorial de corrección recibe la señal C de control y el vector Uf de corrección. Si la unidad 312 de codificación vectorial de corrección recibe la señal C de control que indica que se realiza el procesamiento de codificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en el caso de (A-1) y/o (B-1), la unidad 312 de codificación vectorial de corrección obtiene un código LSP de corrección D codificando el vector Uf de corrección (s312) y emite el código LSP de corrección Df. El propio procesamiento de codificación de la codificación del vector Uf de corrección es similar al realizado en la unidad 112 de codificación vectorial de corrección.
Si la unidad 312 de codificación vectorial de corrección recibe la señal C de control que indica que no se realiza el procesamiento de codificación de corrección o 0 como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral no está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en casos distintos del caso (A-1) y/o (B-1), la unidad 312 de codificación vectorial de corrección no realiza la codificación del vector Uf de corrección y no obtiene y emite un código LSP de corrección Df.
<Dispositivo 400 de decodificación de coeficientes de predicción lineal según la segunda realización>
La Figura 9 representa un diagrama de bloques funcional de un dispositivo 400 de decodificación de coeficientes de predicción lineal según la segunda realización, y la Figura 10 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 400 de decodificación de coeficientes de predicción lineal de la segunda realización incluye una unidad 410 de decodificación no predictiva en lugar de la unidad 210 de decodificación no predictiva.
La unidad 410 de decodificación no predictiva incluye el libro de códigos 212 de vectores de corrección, una unidad 411 de decodificación vectorial de corrección, y una unidad 413 de suma no predictiva, y una unidad 415 de cálculo de índice y, cuando sea necesario, también incluye la unidad 214 de cálculo de coeficientes de predicción lineal no predictivos decodificados.
La diferencia radica en que se determina si se realiza o no procesamiento de suma en la unidad 413 de suma no predictiva y si se realiza o no procesamiento de decodificación en la unidad 411 de decodificación vectorial de corrección en función del resultado de cálculo de la unidad 415 de cálculo de índice.
<Unidad 415 de cálculo de índice>
La unidad 415 de cálculo de índice recibe el vector A0f de parámetros LSP predictivos decodificados y calcula un índice Q proporcional a lo alta que sea la altura de pico a valle de una envolvente espectral, correspondiendo la envolvente espectral al vector A0f = (A0f[1], A0f[2], ..., A0f[p])T de parámetros LSP predictivos decodificados, es decir, el índice Q que aumenta con un aumento en el pico a valle de la envolvente espectral y/o un índice Q' proporcional a lo corta que sea la altura de pico a valle de la envolvente espectral, es decir, el índice Q' que disminuye con un aumento en el pico a valle de la envolvente espectral (s415). De acuerdo con la magnitud del índice Q y/o Q', la unidad 415 de cálculo de índice emite, a la unidad 411 de decodificación vectorial de corrección y la unidad 413 de suma no predictiva, una señal C de control que indica que se realiza/no se realiza el procesamiento de decodificación de corrección o una señal C de control que indica que se realiza el procesamiento de decodificación de corrección utilizando un número de bits predeterminado. Los índices Q y Q' son similares a los de la descripción de la unidad 315 de cálculo de índice y simplemente tienen que ser calculados de manera similar a la utilizada en la unidad 315 de cálculo de índice utilizando el vector A0f de parámetros LSP predictivos decodificados en lugar del vector A0f de parámetros LSP de cuantificación predictivos.
La unidad 415 de cálculo de índice emite, a la unidad 413 de suma no predictiva y la unidad 411 de decodificación vectorial de corrección, la señal C de control que indica que se realiza el procesamiento de decodificación de corrección si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, si (A-1) el índice Q es mayor o igual que el valor de umbral Th1 predeterminado y/o (B-1) el índice Q' es menor o igual que el valor de umbral Th1' predeterminado; de lo contrario, la unidad 415 de cálculo de índice emite, a la unidad 413 de suma no predictiva y la unidad 411 de decodificación vectorial de corrección, la señal C de control que indica que no se realiza el procesamiento de decodificación de corrección.
Además, la unidad 415 de cálculo de índice se puede configurar de tal manera que la unidad 415 de cálculo de índice emita un entero positivo (o un código que representa un entero positivo) que representa un número de bits predeterminado como la señal C de control en el caso de (A-1) y/o (B-1); de lo contrario, la unidad 415 de cálculo de índice emite 0 como la señal C de control.
Por otro lado, cuando la unidad 411 de decodificación vectorial de corrección y la unidad 413 de suma no predictiva se configuran para determinar la realización del procesamiento de decodificación de corrección si la unidad 411 de decodificación vectorial de corrección y la unidad 413 de suma no predictiva recibe la señal C de control, la unidad 415 de cálculo de índice se puede configurar para no emitir la señal C de control en casos distintos del caso (A-1) y/o (B-1).
<Unidad 411 de decodificación vectorial de corrección>
La unidad 411 de decodificación vectorial de corrección recibe el código LSP de corrección Df y la señal C de control. Si la unidad 411 de decodificación vectorial de corrección recibe la señal C de control que indica que se realiza el procesamiento de decodificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en el caso de (A-1) y/o (B-1), la unidad 411 de decodificación vectorial de corrección obtiene un vector AUf de corrección decodificado decodificando el código LSP de corrección Df haciendo referencia al libro de códigos 212 de vectores de corrección (s411) y emite el vector AUf de corrección decodificado. El propio procesamiento de decodificación de decodificación del código LSP de corrección Df es similar al realizado en la unidad 211 de decodificación vectorial de corrección.
Si la unidad 411 de decodificación vectorial de corrección recibe la señal C de control que indica que no se realiza el procesamiento de decodificación de corrección o 0 como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral no está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en casos distintos del caso (A-1) y/o (B-1), la unidad 411 de decodificación vectorial de corrección no realiza decodificación del código LSP de corrección Df y no obtiene y emite un vector AUf de corrección decodificado.
<Unidad 413 de suma no predictiva>
La unidad 413 de suma no predictiva está formada por, por ejemplo, un almacenamiento 413c que almacena un vector Y de media no predictiva y unidades 413a y 413b de suma.
La unidad 413 de suma no predictiva recibe la señal C de control y el vector ASf diferencial decodificado. Si la unidad 413 de suma no predictiva recibe la señal C de control que indica que se realiza el procesamiento de decodificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, en el caso de (A-1) y/o (B-1), la unidad 413 de suma no predictiva recibe además el vector AUf de corrección decodificado. Luego, la unidad 413 de suma no predictiva genera un vector A0f = AUf+Y+ASf de parámetros LSP no predictivos decodificados obtenido sumando el vector ASf diferencial decodificado y el vector Y de media no predictiva almacenado en el almacenamiento 413c al vector AUf de corrección decodificado (s413) y emite el vector A0f de parámetros LSP no predictivos decodificados. Por otro lado, en la Figura 9, utilizando las dos unidades 413a y 413b de suma, en primer lugar, después de que el vector ASf diferencial decodificado sea sumado al vector AUf de corrección decodificado en la unidad 413a de suma, el vector Y de media no predictiva almacenado en el almacenamiento 413c se suma en la unidad 413b de suma, pero estas sumas se pueden realizar a la inversa. Alternativamente, el vector A0f de parámetros LSP no predictivos decodificados se puede generar sumando un vector obtenido sumando el vector Y de media no predictiva y el vector ASf diferencial decodificado al vector AUf de corrección decodificado.
Si la unidad 413 de suma no predictiva recibe la señal C de control que indica que no se realiza el procesamiento de decodificación de corrección o 0 como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral no está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en casos distintos del caso (A-1) y/o (B-1), es decir, si la unidad 413 de suma no predictiva no recibe el vector AUf de corrección decodificado, la unidad 413 de suma no predictiva genera un vector A0f = Y+ASf(s413) de parámetros LSP no predictivos decodificados y emite el vector A0f de parámetros LSP no predictivos decodificados.
Por otro lado, se supone que el vector Y de media no predictiva utilizado aquí es el mismo que el vector Y de media no predictiva utilizado en la unidad 311 de resta no predictiva del dispositivo 300 de codificación de coeficientes de predicción lineal descrito anteriormente.
<Efecto de la segunda realización>
Con tal configuración, además de evitar que un error de transmisión en un código LSP Cm de una f-1-ésima trama afecte al vector A0f de parámetros LSP no predictivos decodificados de una f-ésima trama, es posible obtener un vector A0f de parámetros LSP no predictivos decodificados que contiene errores de cuantificación reducidos sumando, al vector Y de media no predictiva y el vector ASf diferencial decodificado, del vector AUf de corrección decodificado obtenido decodificando el código LSP de corrección Df si la altura de pico a valle de una envolvente espectral es alta y reducir la cantidad de código en una cantidad correspondiente al código LSP de corrección Df utilizando, como el vector A0f de parámetros LSP no predictivos decodificados, lo que se obtiene sumando el vector Y de media no predictiva y el vector ASf diferencial decodificado, que no necesita el código LSP de corrección Df, si la altura de pico a valle de una envolvente espectral no es alta. Es decir, es posible realizar el procesamiento de codificación y decodificación que sufre menos reducción en la calidad de sonido causada por un error de transmisión en un código de la trama precedente que en la tecnología existente mientras se reduce la cantidad de código en su conjunto en comparación con la codificación y decodificación de la primera realización.
<Modificación>
Como ya se ha explicado en la modificación de la primera realización, en lugar de los parámetros LSP, se pueden utilizar otros coeficientes siempre que los coeficientes sean coeficientes que son convertibles en coeficientes de predicción lineal. Lo anterior se puede aplicar a coeficientes PARCOR, coeficientes obtenidos transformando cualquiera de los parámetros LSP y los coeficientes PARCOR, y los propios coeficientes de predicción lineal. En adelante, se describirá un caso en el que se utilizan coeficientes PARc Or kf[1], kf[2], ..., kf[p].
Se sabe que cuanto mayor sea la altura de pico a valle de una envolvente espectral correspondiente a un vector 0f de parámetros LSP, menor se vuelve un valor de
Figure imgf000017_0001
determinado por un coeficiente PARCOR. Por tanto, cuando se utilizan los coeficientes PARCOR, la unidad 315 de cálculo de índice recibe los coeficientes Akf[1], Akf[2], ..., Akf[p] PARCOR cuantificados y calcula un índice Q' proporcional a lo corta que sea la altura de pico a valle de una envolvente espectral mediante
Figure imgf000017_0002
(s315). De acuerdo con la magnitud del índice Q', la unidad 315 de cálculo de índice emite, a la unidad 312 de codificación vectorial de corrección y la unidad 311 de resta no predictiva, una señal C de control que indica que se realiza/no se realiza el procesamiento de codificación de corrección o una señal C de control que es un entero positivo que representa un número de bits predeterminado o es 0. Asimismo, de acuerdo con la magnitud del índice Q', la unidad 415 de cálculo de índice emite, a la unidad 411 de decodificación vectorial de corrección y la unidad 413 de suma no predictiva, una señal C de control que indica que se realiza/no se realiza el procesamiento de decodificación de corrección o una señal C de control que es un entero positivo que representa un número de bits predeterminado o es 0.
La unidad 315 de cálculo de índice y la unidad 415 de cálculo de índice se pueden configurar para emitir el índice Q y/o el índice Q' en lugar de la señal C de control. En ese caso, de acuerdo con la magnitud del índice Q y/o el índice Q', la unidad 312 de codificación vectorial de corrección y la unidad 411 de codificación vectorial de corrección simplemente tienen que determinar si se realiza o no procesamiento de codificación y el procesamiento de decodificación, respectivamente. Además, asimismo, de acuerdo con la magnitud del índice Q y/o el índice Q', la unidad 311 de resta no predictiva simplemente tiene que determinar si se realiza o no procesamiento de resta y la unidad 413 de suma no predictiva simplemente tiene que determinar qué tipo de procesamiento de suma realiza la unidad 413 de suma no predictiva. Las determinaciones hechas en la unidad 312 de codificación vectorial de corrección, la unidad 411 de decodificación vectorial de corrección, la unidad 311 de resta no predictiva, y la unidad 413 de suma no predictiva son las mismas que las explicadas en la unidad 315 de cálculo de índice y la unidad 415 de cálculo de índice descritas anteriormente.
<Tercera realización>
Se describirán principalmente las diferencias con la segunda realización.
Un gran número de vectores de corrección candidatos almacenados en un libro de códigos de vectores de corrección significa que se puede realizar la codificación con una alta precisión de la aproximación en consecuencia. Por tanto, en la presente realización, la unidad de codificación vectorial de corrección y la unidad de decodificación vectorial de corrección se ejecutan utilizando un libro de códigos de vectores de corrección cuya precisión aumenta con un aumento en la influencia de una reducción en la precisión de la decodificación causada por un error de transmisión en un código LSP.
<Dispositivo 500 de codificación de coeficientes de predicción lineal según la tercera realización>
La Figura 11 representa un diagrama de bloques funcional de un dispositivo 500 de codificación de coeficientes de predicción lineal de la tercera realización, y la Figura 8 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 500 de codificación de coeficientes de predicción lineal de la tercera realización incluye una unidad 510 de codificación no predictiva en lugar de la unidad 310 de codificación no predictiva.
La unidad 510 de codificación no predictiva incluye la unidad 311 de resta no predictiva, una unidad 512 de codificación vectorial de corrección, libros de códigos 513A y 513B de vectores de corrección, la unidad 314 de suma predictiva, y la unidad 315 de cálculo de índice. Como es el caso con los dispositivos 100 y 300 de codificación de coeficientes de predicción lineal de la primera y segunda realizaciones, si los parámetros 0 LSP derivados de una señal Xf de sonido son generados por otro dispositivo y la entrada del dispositivo 500 de codificación de coeficientes de predicción lineal es los parámetros LSP 0f[1], 0f[2], ..., 0f[p], el dispositivo 500 de codificación de coeficientes de predicción lineal no tiene que incluir la unidad 81 de análisis de predicción lineal y la unidad 82 de cálculo LSP.
Las diferencias con la segunda realización radican en que el dispositivo 500 de codificación de coeficientes de predicción lineal de la tercera realización incluye una pluralidad de libros de códigos de vectores de corrección y la unidad 512 de codificación vectorial de corrección realiza la codificación seleccionando cualquiera de los libros de códigos de vectores de corrección de acuerdo con el índice Q y/o Q' calculados en la unidad 315 de cálculo de índice.
En adelante, se dará una descripción tomando como ejemplo un caso en el que se proporcionan los dos tipos de libros de códigos 513A y 513B de vectores de corrección.
Los libros de códigos 513A y 513B de vectores de corrección difieren entre sí en el número total de vectores de corrección candidatos almacenados en los mismos. Un gran número total de vectores de corrección candidatos significa un gran número de bits de un código vectorial de corrección correspondiente. Para expresarlo al revés, cuanto mayor sea el número de bits de un código vectorial de corrección, más vectores de corrección candidatos se pueden preparar. Por ejemplo, si se supone que el número de bits de un código vectorial de corrección es A, se pueden preparar hasta 2A vectores de corrección candidatos.
En adelante, se dará una descripción en el supuesto de que el número total de vectores de corrección candidatos almacenados en el libro de códigos 513A de vectores de corrección es mayor que el número total de vectores de corrección candidatos almacenados en el libro de códigos 513B de vectores de corrección. En otras palabras, la longitud del código (longitud promedio del código) de los códigos almacenados en el libro de códigos 513A de vectores de corrección es mayor que la longitud del código (longitud promedio del código) de los códigos almacenados en el libro de códigos 513B de vectores de corrección. Por ejemplo, 2A pares de un código vectorial de corrección que tiene una longitud del código de A bits y un vector de corrección candidato se almacenan en el libro de códigos 513A de vectores de corrección, y 2B (2B < 2a) pares de un código vectorial de corrección que tiene una longitud del código de B bits (B < A) y un vector de corrección candidato se almacenan en el libro de códigos 513B de vectores de corrección.
Por otro lado, en la presente realización, como ya se explicó en la parte de modificación de la segunda realización, la unidad de cálculo de índice emite el índice Q y/o el índice Q' en lugar de la señal C de control, y, de acuerdo con la magnitud del índice Q y/o el índice Q', la unidad de codificación vectorial de corrección y la unidad de decodificación vectorial de corrección determinan qué tipo de codificación y decodificación realizan la unidad de codificación vectorial de corrección y la unidad de decodificación vectorial de corrección, respectivamente. Sin embargo, como en la segunda realización, se puede adoptar una configuración en la que la unidad de cálculo de índice determina qué tipo de codificación y decodificación se realiza y emite la señal C de control. Por otro lado, como ya se explicó en la parte de modificación de la segunda realización, de acuerdo con la magnitud del índice Q y/o el índice Q', la unidad 311 de resta no predictiva determina si se realiza o no procesamiento de resta y la unidad 413 de suma no predictiva determina qué tipo de procesamiento de suma realiza la unidad 413 de suma no predictiva.
<Unidad 512 de codificación vectorial de corrección>
La unidad 512 de codificación vectorial de corrección recibe el índice Q y/o el índice Q' y el vector Uf de corrección. La unidad 512 de codificación vectorial de corrección obtiene un código LSP de corrección Df cuyo número de bits se vuelve mayor (la longitud del código se vuelve mayor) a medida que (A-2) el índice Q aumenta y/o (B-2) el índice Q' disminuye (s512) y emite el código LSP de corrección Df. Por ejemplo, la unidad 512 de codificación vectorial de corrección realiza la codificación de la siguiente manera utilizando un valor Th2 de umbral predeterminado y/o un valor Th2' de umbral predeterminado. Por otro lado, dado que la unidad 512 de codificación vectorial de corrección realiza el procesamiento de codificación si el índice Q es mayor o igual que el valor Th1 de umbral predeterminado y/o el índice Q' es menor o igual que el valor Th1' de umbral predeterminado, Th2 es un valor mayor que Th1 y Th2' es un valor menor que Th1'.
Si (A-5) el índice Q es mayor o igual que el valor Th2 de umbral predeterminado y/o (B-5) el índice Q' es menor o igual que el valor Th2' de umbral predeterminado, se supone que A que es un entero positivo se establece como el número de bits del código LSP de corrección Df, y la unidad 512 de codificación vectorial de corrección obtiene un código LSP de corrección Df codificando el vector Uf de corrección haciendo referencia al libro de códigos 513A de vectores de corrección que almacena los 2A pares de un código vectorial de corrección que tiene el número de bits (longitud del código) A y un vector de corrección candidato (s512) y emite el código LSP de corrección Df.
Si (A-6) el índice Q es menor o igual que el valor Th2 de umbral predeterminado y el índice Q es mayor o igual que el valor Th1 de umbral predeterminado y/o (B-6) el índice Q' es mayor que el valor Th2' de umbral predeterminado y el índice Q' es menor o igual que el valor Th1' de umbral predeterminado, se supone que B que es un entero positivo menor que el número de bits A se establece como el número de bits del código lSp de corrección Df, y la unidad 512 de codificación vectorial de corrección obtiene un código LSP de corrección Df codificando el vector Uf de corrección haciendo referencia al libro de códigos 513B de vectores de corrección que almacena los 2B pares de un código vectorial de corrección que tiene el número de bits (longitud del código) B y un vector de corrección candidato (s512) y emite el código LSP de corrección Df.
En otros casos (C-6), se supone que 0 se establece como el número de bits del código LSP de corrección Df, y la unidad 512 de codificación vectorial de corrección no codifica el vector Uf de corrección y no obtiene y emite un código LSP de corrección Df.
Por tanto, la unidad 512 de codificación vectorial de corrección de la tercera realización se ejecuta cuando el índice Q calculado en la unidad 315 de cálculo de índice es mayor que el valor Th1 de umbral predeterminado y/o el índice Q' calculado en la unidad 315 de cálculo de índice es menor que el valor Th1' de umbral predeterminado.
<Dispositivo 600 de decodificación de coeficientes de predicción lineal según la tercera realización>
La Figura 12 representa un diagrama de bloques funcional de un dispositivo 600 de decodificación de coeficientes de predicción lineal según la tercera realización, y la Figura 10 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 600 de decodificación de coeficientes de predicción lineal de la tercera realización incluye una unidad 610 de decodificación no predictiva en lugar de la unidad 410 de decodificación no predictiva.
La unidad 610 de decodificación no predictiva incluye la unidad 413 de suma no predictiva, una unidad 611 de decodificación vectorial de corrección, libros de códigos 612A y 612B de vectores de corrección, y la unidad 415 de cálculo de índice y, cuando sea necesario, también incluye la unidad 214 de cálculo de coeficientes de predicción lineal no predictivos decodificados.
Las diferencias con el dispositivo 400 de decodificación de coeficientes de predicción lineal de la segunda realización radican en que el dispositivo 600 de decodificación de coeficientes de predicción lineal de la tercera realización incluye una pluralidad de libros de códigos de vectores de corrección y la unidad 611 de decodificación vectorial de corrección realiza la decodificación seleccionando cualquiera de los libros de códigos de vectores de corrección de acuerdo con el índice Q y/o Q' calculados en la unidad 415 de cálculo de índice.
En adelante, se dará una descripción tomando como ejemplo un caso en el que se proporcionan los dos tipos de libros de códigos 612A y 612B de vectores de corrección.
Los libros de códigos 612A y 612B de vectores de corrección almacenan los contenidos compartidos por los libros de códigos 513A y 513B de vectores de corrección, respectivamente, del dispositivo 500 de codificación de coeficientes de predicción lineal. Es decir, en los libros de códigos 612A y 612B de vectores de corrección, se almacenan los vectores de corrección candidatos y los códigos vectoriales de corrección correspondientes a los vectores de corrección candidatos, y la longitud del código (longitud promedio del código) de los códigos almacenados en el libro de códigos 612A de vectores de corrección es mayor que la longitud del código (longitud promedio del código) de los códigos almacenados en el libro de códigos 612B de vectores de corrección. Por ejemplo, 2a pares de un código vectorial de corrección que tiene una longitud del código de A bits y un vector de corrección candidato se almacenan en el libro de códigos 612A de vectores de corrección, y 2B (2B < 2A) pares de un código vectorial de corrección que tiene una longitud del código de B bits (B < A) y un vector de corrección candidato se almacenan en el libro de códigos 612B de vectores de corrección.
<Unidad 611 de decodificación vectorial de corrección>
La unidad 611 de decodificación vectorial de corrección recibe el índice Q y/o el índice Q' y el código LSP de corrección Df. La unidad 611 de decodificación vectorial de corrección obtiene un vector AUf de corrección decodificado a partir de un gran número de vectores de corrección candidatos decodificando un código LSP de corrección Df con un número de bits en función de la magnitud del índice Q y el índice Q', de tal manera que (A-2) cuanto mayor sea el índice Q y/o (B-2) menor sea el índice Q', mayor será el número de bits (s611). Por ejemplo, la unidad 611 de decodificación vectorial de corrección realiza la decodificación de la siguiente manera utilizando un valor Th2 y/o Th2' de umbral predeterminado. Por otro lado, dado que la unidad 611 de decodificación vectorial de corrección realiza el procesamiento de decodificación si el índice Q es mayor o igual que el valor Th1 de umbral predeterminado y/o el índice Q' es menor o igual que el valor Th1' de umbral predeterminado, Th2 es un valor mayor que Th1 y Th2' es un valor menor que Th1'.
Si (A-5) el índice Q es mayor o igual que el valor Th2 de umbral predeterminado y/o (B-5) el índice Q' es menor o igual que el valor Th2' de umbral predeterminado, se supone que A que es un entero positivo se establece como el número de bits del código LSP de corrección Df, y la unidad 611 de decodificación vectorial de corrección obtiene, como un vector AUf de corrección decodificado, un vector de corrección candidato correspondiente a un código vectorial de corrección que coincide con el código LSP de corrección Df haciendo referencia al libro de códigos 612A de vectores de corrección que almacena los 2A pares de un código vectorial de corrección que tiene el número de bits (longitud del código) A y un vector de corrección candidato (s611) y emite el vector AUf de corrección decodificado.
Si (A-6) el índice Q es menor que el valor Th2 de umbral predeterminado y el índice Q es mayor o igual que el valor Th1 de umbral predeterminado y/o (B-6) el índice Q' es mayor que el valor Th2' de umbral predeterminado y el índice Q' es menor o igual que el valor Th1' de umbral predeterminado, se supone que B que es un entero positivo menor que el número de bits A se establece como el número de bits del código LSP de corrección Df, y la unidad 611 de decodificación vectorial de corrección obtiene, como un vector AUf de corrección decodificado, un vector de corrección candidato correspondiente a un código vectorial de corrección que coincide con el código LSP de corrección Df haciendo referencia al libro de códigos 612B de vectores de corrección que almacena los 2B pares de un código vectorial de corrección que tiene el número de bits (longitud del código) B y un vector de corrección candidato (s611) y emite el vector AUf de corrección decodificado.
En otros casos (C-6), se supone que 0 se establece como el número de bits del código LSP de corrección Df, y la unidad 611 de decodificación vectorial de corrección no decodifica el código LSP de corrección Df y no genera un vector AUf de corrección decodificado.
Por tanto, la unidad 611 de decodificación vectorial de corrección de la tercera realización se ejecuta si el índice Q calculado en la unidad 415 de cálculo de índice es mayor que el valor Th1 de umbral predeterminado y/o el índice Q' calculado en la unidad 415 de cálculo de índice es menor que el valor Th1' de umbral predeterminado.
<Efecto de la tercera realización>
Con tal configuración, es posible obtener el efecto similar al de la segunda realización. Además, cambiando la precisión de la aproximación en función de la magnitud de la influencia de una reducción en la precisión de la decodificación causada por un error de transmisión en un código LSP, es posible realizar procesamiento de codificación y decodificación de mayor calidad de sonido que la codificación y decodificación de la segunda realización mientras se reduce la cantidad de código en su conjunto en comparación con la codificación y decodificación de la primera realización.
<Modificación>
El número de libros de códigos de vectores de corrección no necesariamente tiene que ser dos y puede ser tres o más. El número de bits (longitud de bits) de los códigos vectoriales de corrección almacenados difiere de un libro de códigos de vectores de corrección a otro, y se almacenan los vectores de corrección correspondientes a los códigos vectoriales de corrección. Es necesario simplemente establecer un valor de umbral en función del número de libros de códigos de vectores de corrección. Un valor de umbral para el índice Q simplemente tiene que ser establecido de tal manera que cuanto mayor se vuelva el valor del valor de umbral, mayor se vuelva el número de bits de un código vectorial de corrección, el código vectorial de corrección que se almacena en el libro de códigos de vectores de corrección que se utiliza si el índice Q es mayor o igual que ese valor de umbral. Asimismo, un valor de umbral para el índice Q' simplemente tiene que ser establecido de tal manera que cuanto menor se vuelva el valor del valor de umbral, mayor se vuelva el número de bits de un código vectorial de corrección, el código vectorial de corrección que se almacena en el libro de códigos de vectores de corrección que se utiliza si el índice Q' es menor o igual que ese valor de umbral. Con tal configuración, es posible realizar codificación y decodificación de mayor precisión mientras se reduce la cantidad de código en su conjunto.
<Dispositivo 700 de codificación según una cuarta realización>
Un dispositivo 700 de codificación según una cuarta realización es lo que se obtiene aplicando el dispositivo 100 de codificación de coeficientes de predicción lineal y el dispositivo 200 de decodificación de coeficientes de predicción lineal de la primera realización al método de codificación TCX (excitación codificada por transformación) que es un método de codificación en un dominio de frecuencia.
La Figura 13 representa un diagrama de bloques funcional del dispositivo 700 de codificación de la cuarta realización, y la Figura 14 representa un ejemplo del flujo de procesamiento del mismo.
El dispositivo 700 de codificación de la cuarta realización incluye el dispositivo 100 de codificación de coeficientes de predicción lineal, el dispositivo 200 de decodificación de coeficientes de predicción lineal, una unidad 710 de cálculo de serie de envolventes espectrales de potencia, una primera unidad 720A de cálculo de serie de envolventes espectrales de potencia de suavizado, una segunda unidad 720B de cálculo de serie de envolventes espectrales de potencia de suavizado, una unidad 730 de conversión de dominio de frecuencia, una unidad 740 de normalización de envolvente, una unidad 750 de cálculo de parámetros de codificación de longitud variable, y una unidad 760 de codificación de longitud variable. Por otro lado, en lugar del dispositivo 100 de codificación de coeficientes de predicción lineal y el dispositivo 200 de decodificación de coeficientes de predicción lineal, se pueden utilizar los dispositivos 300 y 500 de codificación de coeficientes de predicción lineal y los dispositivos 400 y 600 de decodificación de coeficientes de predicción lineal de la segunda y tercera realizaciones.
El dispositivo 700 de codificación de la cuarta realización recibe una señal Xf de sonido de entrada y emite un código de señal de dominio de frecuencia.
<Dispositivo 100 de codificación de coeficientes de predicción lineal>
El dispositivo 100 de codificación de coeficientes de predicción lineal recibe la señal Xf de sonido, obtiene un código LSP Cf y un código LSP de corrección Df (s100), y emite el código LSP Cf y el código LSP de corrección Df.
<Dispositivo 200 de decodificación de coeficientes de predicción lineal>
El dispositivo 200 de decodificación de coeficientes de predicción lineal recibe el código LSP Cf y el código LSP de corrección Df, obtiene los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos y los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos (s200), y emite los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos y los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos.
Por otro lado, el dispositivo 100 de codificación de coeficientes de predicción lineal del dispositivo 700 de codificación se puede configurar para obtener, cuando se obtiene el código LSP Cfy el código LSP de corrección Df, los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos correspondientes al código LSP Cfy los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos correspondientes al código LSP Cf y el código LSP de corrección Df. En este caso, el dispositivo 700 de codificación no tiene que incluir el dispositivo 200 de decodificación de coeficientes de predicción lineal.
<Unidad 710 de cálculo de serie de envolventes espectrales de potencia>
La unidad 710 de cálculo de serie de envolventes espectrales de potencia recibe los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos. La unidad 710 de cálculo de serie de envolventes espectrales de potencia calcula una serie Z[1], ..., Z[N] de envolventes espectrales de potencia de la señal de sonido de entrada en el punto N utilizando los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos (s710) y emite la serie Z[1], ..., Z[N] de envolventes espectrales de potencia. Por ejemplo, cada valor Z[n] de la serie de envolventes espectrales de potencia se puede determinar mediante la siguiente fórmula.
Figure imgf000022_0001
donde n es un entero 1 s n s N, exp() es una función exponencial que utiliza la constante de Napier como base, j es una unidad imaginaria, y a2 es la energía residual de predicción.
<Primera unidad 720A de cálculo de serie de envolventes espectrales de potencia de suavizado>
La primera unidad 720A de cálculo de serie de envolventes espectrales de potencia de suavizado recibe los coeficientes Aaf[1], Aaf[2],..., Aaf[p] de predicción lineal de cuantificación predictivos. Utilizando los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos y un factor Yi de corrección que se da por adelantado y es una constante positiva menor o igual que 1, la primera unidad 720A de cálculo de serie de envolventes espectrales de potencia de suavizado calcula una primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas mediante
Figure imgf000022_0002
(s720A), y emite la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas.
La primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas corresponde a una serie obtenida aplanando (suavizando) las ondas de la amplitud de una serie W[1], W[2], ..., W[N] de envolventes espectrales de potencia determinada por los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos. Yi es una constante positiva que determina el grado de suavizado.
<Segunda unidad 720B de cálculo de serie de envolventes espectrales de potencia de suavizado>
La segunda unidad 720B de cálculo de serie de envolventes espectrales de potencia de suavizado recibe los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos. Utilizando los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos y un factor Yi de corrección que se da por adelantado y es una constante positiva menor o igual que 1, la segunda unidad 720B de cálculo de serie de envolventes espectrales de potencia de suavizado calcula una segunda serie ~Z[1], ~Z[2], ..., ~Z[N] de envolventes espectrales de potencia suavizadas mediante
Figure imgf000023_0001
(s720B) y emite la segunda serie ~Z[1], ~Z[2], ..., ~Z[N] de envolventes espectrales de potencia suavizadas.
La segunda serie ~Z[1], ~Z[2], ..., ~Z[N] de envolventes espectrales de potencia suavizadas corresponde a una serie obtenida aplanando (suavizando) las ondas de la amplitud de una serie Z[1], Z[2], ..., Z[N] de envolventes espectrales de potencia determinada por los coeficientes Abf[1], Abf[2], ..., Atf[p] de predicción lineal de cuantificación no predictivos. Yi es una constante positiva que determina el grado de suavizado.
<Unidad 730 de conversión de dominio de frecuencia>
La unidad 730 de conversión de dominio de frecuencia convierte la señal Xf de sonido de entrada, que se introduce a la unidad 730 de conversión de dominio de frecuencia, en el dominio de tiempo en la secuencia X[1], ..., X[N] de coeficientes MDCT en el punto N en el dominio de frecuencia trama por trama que es un segmento de tiempo (s730) predeterminado y emite la secuencia X[1], ..., X[N] de coeficientes MDCT. Aquí, N es un entero positivo.
<Unidad 740 de normalización de envolvente>
La unidad 740 de normalización de envolvente recibe la secuencia X[1], ..., X[N] de coeficientes MDCT y la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas, obtiene una secuencia Xn[1], ..., Xn[N] de coeficientes MDCT normalizados que es una serie obtenida normalizando cada coeficiente X[i] de la secuencia X[1], ...,X[N] de coeficientes MDCT por la raíz cuadrada de cada valor ~W[i] de la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas (s740), y emite la secuencia Xn[1], ..., Xn[N] de coeficientes MDCT normalizados. Es decir,
XN[í] = X[Í]/sqrt(~W[i])
se mantiene. Aquí, sqrt() es un símbolo que representa la mitad de la potencia.
<Unidad 750 de cálculo de parámetros de codificación de longitud variable>
La unidad 750 de cálculo de parámetros de codificación de longitud variable recibe la serie Z[1], ...,Z[N] de envolventes espectrales de potencia, la segunda serie ~Z[1], ..., ~Z[N] de envolventes espectrales de potencia suavizadas, la secuencia X[1], ..., X[N] de coeficientes MDCT, y la secuencia Xn[1], ..., Xn[N] de coeficientes MDCT normalizados. Utilizando estos valores, la unidad 750 de cálculo de parámetros de codificación de longitud variable calcula un parámetro ri de codificación de longitud variable que es un parámetro para realizar la codificación de longitud variable de la secuencia Xn[1], ..., Xn[N] de coeficientes MDCT normalizados (s750) y emite el parámetro r de codificación de longitud variable. El parámetro r de codificación de longitud variable es un parámetro que especifica un posible rango de la amplitud de la secuencia Xn[1], ..., Xn[N] de coeficientes MDCT normalizados a codificar. En el caso de codificación de Rice, un parámetro de Rice corresponde al parámetro de codificación de longitud variable; en el caso de codificación aritmética, un posible rango de la amplitud de un objeto a codificar corresponde al parámetro de codificación de longitud variable.
Cuando se realiza la codificación de longitud variable por muestra, se calcula un parámetro de codificación de longitud variable para cada coeficiente Xn[í] de la secuencia de coeficientes MDCT normalizados. Cuando se realiza la codificación de longitud variable colectivamente para un grupo de muestra formado por una pluralidad de muestras (por ejemplo, dos muestras a la vez), se calcula un parámetro de codificación de longitud variable para cada grupo de muestras. Es decir, la unidad 750 de cálculo de parámetros de codificación de longitud variable calcula un parámetro de codificación de longitud variable para una secuencia de coeficientes parciales normalizados que es parte de la secuencia de coeficientes MDCT normalizados. Aquí, se supone que hay una pluralidad de secuencias de coeficientes parciales normalizados y, en la pluralidad de secuencias de coeficientes parciales normalizados, los coeficientes de la secuencia de coeficientes MDCT normalizados se incluyen sin solapamientos.
En adelante, se describirá un método de cálculo de un parámetro de codificación de longitud variable tomando como ejemplo un caso en el que se realiza codificación de Rice por muestra.
(Paso 1) Por ejemplo, mediante la siguiente fórmula, se calcula el logaritmo del promedio de las amplitudes de los coeficientes de la secuencia Xn[1], Xn[2], ..., Xn[N] de coeficientes MDCT normalizados como un parámetro de Rice sb.
Figure imgf000024_0001
sb se codifica solo una vez en cada trama y se transmite al dispositivo de decodificación como un código correspondiente a un parámetro de Rice de referencia. Alternativamente, cuando la amplitud de X[i] se puede estimar mediante otra información que se transmite al dispositivo de decodificación, se puede establecer un método para determinar aproximadamente sb a partir del valor estimado de la amplitud de X[i], compartido el método por el dispositivo 700 de codificación y el dispositivo de decodificación. En este caso, no hay necesidad de codificar sb y emitir un código correspondiente a un parámetro de Rice de referencia al dispositivo de decodificación.
(Paso 2) Se calcula un valor 0 de umbral mediante la siguiente fórmula.
Figure imgf000024_0002
(Paso 3) Cuanto mayor sea el grado en el que |sqrt(Z[i])/sqrt(~Z[i])| es mayor que 0, mayor será un valor que sb, el valor al que se establece el parámetro de Rice n. Cuanto menor sea el grado en el que |sqrt(Z[i])/sqrt(~Z[i])| es menor que 0, menor será un valor que sb, el valor al que se establece el parámetro de Rice n.
(Paso 4) Realizando repetidamente el procesamiento en el paso 3 en todos los i=1, 2, ..., N, se obtiene un parámetro de Rice ri para cada coeficiente Xn[í] MDCT normalizado.
<Unidad 760 de codificación de longitud variable>
La unidad 760 de codificación variable recibe el parámetro ri de codificación de longitud variable, realiza la codificación de longitud variable de la secuencia Xn(1), ..., Xn(N) de coeficientes normalizados utilizando este valor, y emite un código Cx de longitud variable (s760).
<Efecto de la cuarta realización>
La cuarta realización tiene una configuración en la que la secuencia Xn[1], ..., Xn[N] de coeficientes MDCT normalizados obtenida normalizando la secuencia X[1], X[2], ..., x [N] de coeficientes MDCT por la serie de envolventes espectrales de potencia suavizadas se codifica utilizando un parámetro de codificación de longitud variable.
Dado que es necesario obtener, utilizando la serie de envolventes espectrales de potencia más precisa posible, una secuencia de coeficientes MDCT normalizados sobre la que se ha de realizar codificación de longitud variable, la unidad 740 de normalización de envolvente genera una secuencia de coeficientes MDCT normalizados utilizando la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas determinada por los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictiva, la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas cuya diferencia con una serie de envolventes espectrales de potencia determinada suavizando los coeficientes de predicción lineal es pequeña.
La unidad 750 de cálculo de parámetros de codificación de longitud variable utiliza una serie de envolventes espectrales de potencia y una serie de envolventes espectrales de potencia suavizadas para obtener un parámetro de codificación de longitud variable. Por tanto, es también deseable que, para la serie de envolventes espectrales de potencia y la serie de envolventes espectrales de potencia suavizadas que se utilizan en la unidad 750 de cálculo de parámetros de codificación de longitud variable, una diferencia con una serie de envolventes espectrales de potencia que se determina mediante coeficientes de predicción lineal y una serie de envolventes espectrales de potencia que se determina suavizando los coeficientes de predicción lineal es pequeña. Sin embargo, no solo cuando ocurre un error de transmisión en un código LSP de la presente trama, sino también cuando ocurre un error de transmisión en un código LSP de la trama precedente, los valores correctos de los coeficientes Aaf[1], Aaf[2], ..., Aaf[p] de predicción lineal de cuantificación predictivos no se pueden obtener en el lado de decodificación. Es decir, si se determina un parámetro de codificación de longitud variable a partir de una serie de envolventes espectrales de potencia y una serie de envolventes espectrales de potencia suavizadas que se determinan a partir de los coeficientes Aaf[1], Aaf[2], ..., Aaf[p], de predicción lineal de cuantificación predictivos, se vuelve imposible realizar la decodificación de longitud variable correctamente no solo cuando ocurre un error de transmisión en un código LSP de la presente trama, sino también cuando ocurre un error de transmisión en un código LSP de la trama precedente.
Por tanto, en la cuarta realización, se determina un parámetro de codificación de longitud variable utilizando una serie de envolventes espectrales de potencia y una serie de envolventes espectrales de potencia suavizadas que se determinan a partir de los coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos. Como resultado, incluso cuando ocurre un error de transmisión en un código LSP de la trama precedente, dado que es posible obtener los mismos coeficientes Abf[1], Abf[2], ..., Abf[p] de predicción lineal de cuantificación no predictivos, la serie Z[1], Z[2], ..., Z[N] de envolventes espectrales de potencia, y la segunda serie ~Z[1], ~Z[2], ..., ~Z[N] de envolventes espectrales de potencia suavizadas como las del lado de codificación en la presente trama si no ocurre error de transmisión en un código LSP de la presente trama, es posible obtener el mismo parámetro de codificación de longitud variable que el del lado de codificación en la presente trama y de este modo aumentar la resistencia a un error de transmisión en un código LSP.
Por otro lado, en la cuarta realización, se establece una secuencia Xn[1], ..., Xn[N] de coeficientes MDCT normalizados obtenida utilizando la primera serie ~W[1], ~W[2], ..., ~W[N] de envolventes espectrales de potencia suavizadas como un objeto sobre el que se ha de realizar la codificación de longitud variable. Por lo tanto, no solo cuando ocurre un error de transmisión en un código LSP de la presente trama, sino también cuando ocurre un error de transmisión en un código LSP de la trama precedente, ocurre un error en la raíz cuadrada de cada valor de una serie de envolventes espectrales de potencia suavizadas por el que se multiplica la secuencia Xn[1], ..., Xn[N] de coeficientes MDCT normalizados en el lado de decodificación y se produce distorsión indeseable en una secuencia de coeficientes MDCT que se obtiene mediante decodificación. Sin embargo, esto es menos problemático que un error en un parámetro de codificación de longitud variable que hace incorrecta la propia decodificación de longitud variable.
<Primera modificación>
En la primera a cuarta realizaciones anteriores, solo se puede establecer un parámetro LSP (un parámetro LSP de bajo orden) cuyo orden es menor o igual que un orden Tl predeterminado menor que un orden p de predicción como un objeto sobre el que se ha de realizar el procesamiento (procesamiento de codificación no predictiva), siendo realizado el procesamiento en la unidad 110 de codificación no predictiva del dispositivo 100 de codificación de coeficientes de predicción lineal de la Figura 3, la unidad 310 de codificación no predictiva del dispositivo 300 de codificación de coeficientes de predicción lineal de la Figura 7, y la unidad 510 de codificación no predictiva del dispositivo 500 de codificación de coeficientes de predicción lineal de la Figura 11, y el procesamiento correspondiente a los descritos anteriormente se puede realizar también en el lado de decodificación.
En primer lugar, se describirán cada una de las unidades 110, 310, y 510.
<Unidades 111 y 311 de resta no predictiva>
Las unidades 111 y 311 de resta no predictiva generan un vector U'f = 0'f-Y'-AS'f de corrección de bajo orden que es un vector obtenido restando, de un vector 0 'f = (0f[1], 0f[2], ..., 0f[TL])T de parámetros LSP de bajo orden formado por parámetros LSP, cuyos órdenes son menores o iguales que el orden Tl, del vector 0f = (0f[1], 0f[2], ...,0f[p])T de parámetros LSP de entrada, un vector Y' = (y[1], y[2], ..., y[TL])T de media de bajo orden no predictiva almacenado en el almacenamiento 111c y un vector AS'f = (Asf[1], Asf[2], ..., Asf[TL])T diferencial de cuantificación de bajo orden formado por elementos, cuyos órdenes son menores o iguales que el orden Tl, del vector ASf = (Asi[1], Asf[2], ..., Asf[p])T diferencial de cuantificación de entrada, y emite el vector Uf de corrección de bajo orden. Es decir, las unidades 111 y 311 de resta no predictiva generan un vector Uf de corrección de bajo orden que es un vector formado por algunos de los elementos del vector Uf de corrección y emiten el vector U'f de corrección de bajo orden.
Aquí, el vector Y' = (y[1], y[2], ..., y[Ti_)T de media de bajo orden no predictiva es un vector predeterminado y es un vector formado por elementos, cuyos órdenes son menores o iguales que el orden Tl, del vector Y = (y[1], y[2], ..., y[p])T de media no predictiva que se utiliza en el dispositivo de decodificación de la primera modificación.
Por otro lado, un vector 0'f de parámetros LSP de bajo orden formado por parámetros LSP, cuyos órdenes son menores o iguales que el orden Tl, del vector 0f de parámetros LSP se puede emitir desde la unidad 82 de cálculo LSP e introducir a las unidades 111 y 311 de resta no predictiva. Además, un vector AS'f diferencial de cuantificación de bajo orden formado por elementos, cuyos órdenes son menores o iguales que el orden Tl, del vector ASf diferencial de cuantificación se puede emitir desde la unidad 84 de codificación vectorial e introducir a las unidades 111 y 311 de resta no predictiva.
<Unidades 112, 312, y 512 de codificación vectorial de corrección>
Las unidades 112, 312, y 512 de codificación vectorial de corrección codifican el vector U'f de corrección de bajo orden que es un vector formado por algunos de los elementos del vector Uf de corrección haciendo referencia a los libros de códigos 113, 513A, y 513B de vectores de corrección. Los vectores de corrección candidatos que se almacenan en los libros de códigos 113, 513A, y 513B de vectores de corrección simplemente tienen que ser vectores del orden Tl.
A continuación, se describirán los dispositivos 200, 400, y 600 de decodificación de coeficientes de predicción lineal de la primera modificación.
Se describirá el procesamiento (procesamiento de decodificación no predictiva) que se realiza en la unidad 210 de decodificación no predictiva del dispositivo 200 de decodificación de coeficientes de predicción lineal de la primera modificación, la unidad 410 de decodificación no predictiva del dispositivo 400 de decodificación de coeficientes de predicción lineal de la primera modificación, y la unidad 610 de decodificación no predictiva del dispositivo 600 de decodificación de coeficientes de predicción lineal de la primera modificación.
<Unidades 211,411, y 611 de decodificación vectorial de corrección>
Las unidades 211,411, y 611 de decodificación vectorial de corrección reciben un código LSP de corrección Df, obtienen un vector AU'f de corrección de bajo orden decodificado decodificando el código LSP de corrección Df haciendo referencia a los libros de códigos 212, 612A, y 612B de vectores de corrección, y emiten el vector AU'f de corrección de bajo orden decodificado. El vector AU'f = (uf[1], uf[2], ..., u{T l])t de corrección de bajo orden decodificado es un vector del orden Tl. Los vectores de corrección candidatos que se almacenan en los libros de códigos 212, 612A, y 612B de vectores de corrección simplemente tienen que ser vectores del orden Tl como en el caso de los libros de códigos 113, 513A, y 513B de vectores de corrección.
<Unidad 213 de suma no predictiva>
La unidad 213 de suma no predictiva recibe el vector AU'f = (uf[1], uf[2], ..., uf[T_])T de corrección de bajo orden decodificado, el vector Y = (y[1], y[2], ..., y[p])T de media no predictiva, y el vector ASf = (Asf[1], Asf[2], ..., Asf[p])T diferencial decodificado.
La unidad 213 de suma no predictiva genera un vector A0f de parámetros LSP no predictivos decodificados que se obtiene sumando los elementos del vector AU'f de corrección de bajo orden decodificado, el vector ASf diferencial decodificado, y el vector Y de media no predictiva para cada orden que sea menor o igual que el orden Tl y sumando los elementos del vector ASf diferencial decodificado y el vector Y de media no predictiva para cada orden que sea menor o igual que el orden p y sea mayor que el orden Tl, y emite el vector A0f de parámetros LSP no predictivos decodificados. Es decir, el vector A0f de parámetros LSP no predictivos decodificados es A0f = (uf[1]+y[1]+Asf[1], uf[2]+y[2]+yAsf[2], ..., uf[T_]+y[TL]+Asf[TL], y [T .+ 1 ]+ fL 1 ], .., y[p]+Asf[p]).
<Unidad 413 de suma no predictiva>
La unidad 413 de suma no predictiva recibe el vector AU'f = (uf[1], uf[2], ..., uf[T_])T de corrección de bajo orden decodificado, el vector Y = (y[1], y[2], ..., y[p])T de media no predictiva, y el vector ASf= (Asf[1], Asf[2], ..., Asf[p])T diferencial decodificado.
Si la unidad 413 de suma no predictiva recibe la señal C de control que indica que se realiza el procesamiento de decodificación de corrección o un entero positivo (o un código que representa un entero positivo) como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral está por encima del estándar predeterminado, en el caso de (A-1) y/o (B-1), la unidad 413 de suma no predictiva genera un vector A0f de parámetros LSP no predictivos decodificados que se obtiene sumando los elementos del vector AU'f de corrección de bajo orden decodificado, el vector ASf diferencial decodificado, y el vector Y de media no predictiva para cada orden menor o igual que el orden Tl y sumando los elementos del vector ASf diferencial decodificado y el vector Y de media no predictiva para cada orden que sea menor o igual que el orden p y sea mayor que el orden Tl, y emite el vector A0f de parámetros lSp no predictivos decodificados. Es decir, el vector A0f de parámetros LSP no predictivos decodificados es A0f = (uf[1]+y[1]+Asf[1], uf[2]+y[2]+sf[2], ..., ufFJ+y[TL]+Asf[TJ, y[T_+1]+Asf[TL+1], ..., y[p]+*sf[p]).
Si la unidad 413 de suma no predictiva recibe la señal C de control que indica que no se realiza el procesamiento de decodificación de corrección o 0 como la señal C de control, en una palabra, si el pico a valle de la envolvente espectral no está por encima del estándar predeterminado, es decir, en el ejemplo descrito anteriormente, en casos distintos del caso (A-1) y/o (B-1), la unidad 413 de suma no predictiva genera un vector A0f = Y+ASf de parámetros LSP no predictivos decodificados que se obtiene sumando el vector ASf diferencial decodificado y el vector Y de media no predictiva y emite el vector A0f de parámetros LSP no predictivos decodificados.
Como resultado, reduciendo preferentemente la distorsión de codificación de un parámetro LSP de bajo orden cuyo grado de precisión de la aproximación puede tener una mayor influencia sobre la eficiencia del procesamiento de señal que se describirá más adelante, es posible reducir la cantidad de código en comparación con los métodos de la primera a tercera realizaciones mientras se suprime un aumento en la distorsión.
<Segunda modificación>
En la primera a cuarta realizaciones, los coeficientes af[1], af[2], ..., af[p] de predicción lineal se utilizan como la entrada de la unidad de cálculo LSP; por ejemplo, una serie de coeficientes af[1]xY, af[2]xY2, ..., af[p]xYp obtenidos multiplicando cada coeficiente af[i] de los coeficientes de predicción lineal por y elevado a la i-ésima potencia se pueden utilizar como la entrada de la unidad de cálculo LSP.
Además, en la primera a cuarta realizaciones, se supone que un objeto a ser codificado por el dispositivo de codificación de coeficientes de predicción lineal y decodificado por el dispositivo de decodificación de coeficientes de predicción lineal es un parámetro lSp , pero se puede utilizar un propio coeficiente de predicción lineal o cualquier coeficiente tal como un parámetro ISP como un objeto a ser codificado y decodificado siempre que el coeficiente sea un coeficiente que es convertible en un coeficiente de predicción lineal.
<Otras modificaciones>
La presente invención no está limitada a las realizaciones y modificaciones descritas anteriormente. Por ejemplo, se pueden realizar los diversos tipos de procesamiento descritos anteriormente, además de ser realizados en orden cronológico de acuerdo con la descripción, simultáneamente o individualmente en función de la potencia de procesamiento de un dispositivo que realiza el procesamiento o cuando sea necesario. Se pueden hacer otros cambios según sea apropiado sin desviarse de la presente invención.
<Programa y medio de grabación>
Además, pueden ser implementados por un ordenador diversos tipos de funciones de procesamiento de los dispositivos descritos en las realizaciones y modificaciones descritas anteriormente. En ese caso, los detalles de procesamiento de las funciones que se supone que se proporcionan en los dispositivos son descritos por un programa. Como resultado de la ejecución de este programa por el ordenador, los diversos tipos de funciones de procesamiento de los dispositivos descritos anteriormente son implementados en el ordenador.
El programa que describe los detalles de procesamiento se puede grabar en un medio de grabación legible por ordenador. Como medio de grabación legible por ordenador se puede utilizar, por ejemplo, cualquiera de un dispositivo de grabación magnética, un disco óptico, un medio de grabación magneto óptica, memoria de semiconductor, etc.
Además, la distribución de este programa es realizada, por ejemplo, vendiendo, transfiriendo, o prestando un medio de grabación portátil tal como un DVD o un CD-ROM en el que está grabado el programa. Además, el programa se puede distribuir almacenando el programa en un dispositivo de almacenamiento de un ordenador servidor y transfiriendo el programa a otros ordenadores desde el ordenador servidor a través de una red.
El ordenador que ejecuta tal programa en primer lugar, por ejemplo, almacena temporalmente el programa grabado en el medio de grabación portátil o el programa transferido desde el ordenador servidor en un almacenamiento del mismo. Luego, en el momento de la ejecución del procesamiento, el ordenador lee el programa almacenado en el almacenamiento del mismo y ejecuta el procesamiento de acuerdo con el programa leído. Además, como otra realización de este programa, el ordenador puede leer el programa directamente del medio de grabación portátil y ejecutar el procesamiento de acuerdo con el programa. Además, cada vez que el programa es transferido al ordenador desde el ordenador servidor, el ordenador puede ejecutar secuencialmente el procesamiento de acuerdo con el programa recibido. Además, se puede adoptar una configuración en la que no se realiza la transferencia de un programa al ordenador desde el ordenador servidor y el procesamiento descrito anteriormente es ejecutado por un así denominado servicio de tipo proveedor de servicios de aplicaciones (ASP) por el que son implementadas las funciones de procesamiento solo mediante una instrucción para la ejecución de las mismas y adquisición de resultados. Por otro lado, se supone que el programa incluye información (datos o similares que no son una orden directa al ordenador pero tienen la propiedad de definir el procesamiento del ordenador) que se utiliza para el procesamiento por una calculadora electrónica y es equivalente a un programa.
Además, se supone que los dispositivos se configuran como resultado de la ejecución de un programa predeterminado en el ordenador, pero al menos parte de estos detalles de procesamiento se pueden implementar en el hardware.

Claims (8)

REIVINDICACIONES
1. Un dispositivo (100) de codificación de señal de sonido que comprende:
una unidad (120) de codificación predictiva que está adaptada para obtener un primer código codificando un vector diferencial formado por diferenciales entre un vector de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden obtenidos a partir de una señal de sonido de entrada de una presente trama y un vector de predicción que contiene al menos un vector pronosticado a partir de una trama pasada, y obtener un vector diferencial de cuantificación correspondiente al primer código; y
una unidad (110) de codificación no predictiva que está adaptada para generar un segundo código codificando un vector de corrección que está formado por todos o algunos de los elementos de diferenciales entre el vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la presente trama y el vector diferencial de cuantificación.
2. El dispositivo (100) de codificación de señal de sonido según la Reivindicación 1, en donde
el vector de predicción es un vector formado por al menos una predicción basada en una trama pasada y un vector predeterminado, y el vector de corrección es un vector formado por diferenciales obtenidos restando el vector diferencial de cuantificación y un vector predeterminado del vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la presente trama o formado por algunos de los elementos de los diferenciales.
3. El dispositivo (100) de codificación de señal de sonido según la Reivindicación 1 o 2, en donde
con el supuesto de que a es una constante positiva, el vector de predicción es un vector obtenido sumando un vector de media predictiva predeterminado y lo que se obtiene multiplicando un vector diferencial de cuantificación de la trama pasada por un factor de a, y
el vector de corrección es un vector obtenido restando el vector diferencial de cuantificación y un vector de media no predictiva predeterminado del vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la presente trama o un vector formado por algunos de los elementos de ese vector.
4. Un método de codificación de señal de sonido que comprende:
un paso de codificación predictiva de obtención de un primer código codificando un vector diferencial formado por diferenciales entre un vector de coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden obtenidos a partir de una señal de sonido de entrada de una presente trama y un vector de predicción que contiene al menos un vector pronosticado a partir de una trama pasada, y obtención de un vector diferencial de cuantificación correspondiente al primer código; y
un paso de codificación no predictiva de generación de un segundo código codificando un vector de corrección que está formado por todos o algunos de los elementos de diferenciales entre el vector de los coeficientes que son convertibles en coeficientes de predicción lineal de más de un orden la presente trama y el vector diferencial de cuantificación.
5. El método de codificación de señal de sonido según la Reivindicación 4, en donde
el vector de predicción es un vector formado por al menos una predicción basada en una trama pasada y un vector predeterminado, y el vector de corrección es un vector formado por diferenciales obtenidos restando el vector diferencial de cuantificación y un vector predeterminado del vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la presente trama o formados por algunos de los elementos de los diferenciales.
6. El método de codificación de señal de sonido según la Reivindicación 4 o 5, en donde
con el supuesto de que a es una constante positiva, el vector de predicción es un vector obtenido sumando un vector de media predictiva predeterminado y lo que se obtiene multiplicando un vector diferencial de cuantificación de la trama pasada por un factor de a, y
el vector de corrección es un vector obtenido restando el vector diferencial de cuantificación y un vector de media no predictiva predeterminado del vector de los coeficientes que son convertibles en los coeficientes de predicción lineal de más de un orden de la presente trama o un vector formado por algunos de los elementos de ese vector.
7. Un programa que comprende instrucciones que, cuando el programa es ejecutado por un ordenador, causa que el ordenador realice los pasos del método de codificación de señal de sonido según cualquiera de las Reivindicaciones 4 a 6.
8. Un medio de grabación que comprende instrucciones que, cuando son ejecutadas por un ordenador, causan que el ordenador realice los pasos del método de codificación de señal de sonido según cualquiera de las Reivindicaciones 4 a 6.
ES15786812T 2014-05-01 2015-03-16 Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación Active ES2744904T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014094758 2014-05-01
PCT/JP2015/057727 WO2015166733A1 (ja) 2014-05-01 2015-03-16 符号化装置、復号装置、及びその方法、プログラム

Publications (1)

Publication Number Publication Date
ES2744904T3 true ES2744904T3 (es) 2020-02-26

Family

ID=54358473

Family Applications (4)

Application Number Title Priority Date Filing Date
ES20167742T Active ES2876184T3 (es) 2014-05-01 2015-03-16 Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y soporte de registro
ES21158838T Active ES2911527T3 (es) 2014-05-01 2015-03-16 Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro
ES19174056T Active ES2822127T3 (es) 2014-05-01 2015-03-16 Dispositivo de decodificación de señal de sonido, método de decodificación de señal de sonido, programa y soporte de registro
ES15786812T Active ES2744904T3 (es) 2014-05-01 2015-03-16 Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación

Family Applications Before (3)

Application Number Title Priority Date Filing Date
ES20167742T Active ES2876184T3 (es) 2014-05-01 2015-03-16 Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y soporte de registro
ES21158838T Active ES2911527T3 (es) 2014-05-01 2015-03-16 Dispositivo de descodificación de señales de sonido, método de descodificación de señales de sonido, programa y soporte de registro
ES19174056T Active ES2822127T3 (es) 2014-05-01 2015-03-16 Dispositivo de decodificación de señal de sonido, método de decodificación de señal de sonido, programa y soporte de registro

Country Status (8)

Country Link
US (6) US10418042B2 (es)
EP (4) EP3859734B1 (es)
JP (4) JP6270993B2 (es)
KR (4) KR101855945B1 (es)
CN (4) CN110444217B (es)
ES (4) ES2876184T3 (es)
PL (4) PL3139382T3 (es)
WO (1) WO2015166733A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110444217B (zh) 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
US11789729B2 (en) 2017-12-29 2023-10-17 Intel Corporation Systems and methods for computing dot products of nibbles in two tile operands
US11669326B2 (en) 2017-12-29 2023-06-06 Intel Corporation Systems, methods, and apparatuses for dot product operations
US11809869B2 (en) 2017-12-29 2023-11-07 Intel Corporation Systems and methods to store a tile register pair to memory
US11816483B2 (en) 2017-12-29 2023-11-14 Intel Corporation Systems, methods, and apparatuses for matrix operations
US11093247B2 (en) 2017-12-29 2021-08-17 Intel Corporation Systems and methods to load a tile register pair
US11023235B2 (en) * 2017-12-29 2021-06-01 Intel Corporation Systems and methods to zero a tile register pair
CN109688409B (zh) * 2018-12-28 2021-03-02 北京奇艺世纪科技有限公司 一种视频编码方法及装置
US11281470B2 (en) * 2019-12-19 2022-03-22 Advanced Micro Devices, Inc. Argmax use for machine learning

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
JP3255189B2 (ja) * 1992-12-01 2002-02-12 日本電信電話株式会社 音声パラメータの符号化方法および復号方法
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
CA2722196C (en) * 1997-12-24 2014-10-21 Mitsubishi Denki Kabushiki Kaisha A method for speech coding, method for speech decoding and their apparatuses
JP3478209B2 (ja) * 1999-11-01 2003-12-15 日本電気株式会社 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
US7167828B2 (en) * 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP3590342B2 (ja) * 2000-10-18 2004-11-17 日本電信電話株式会社 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3472279B2 (ja) * 2001-06-04 2003-12-02 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ符号化方法及び装置
KR100487719B1 (ko) * 2003-03-05 2005-05-04 한국전자통신연구원 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기
CN101494460B (zh) * 2003-09-02 2012-07-11 日本电信电话株式会社 浮点信号的编码方法、解码方法及其编码器、解码器
EP1755109B1 (en) * 2004-04-27 2012-08-15 Panasonic Corporation Scalable encoding and decoding apparatuses and methods
ATE394774T1 (de) * 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
CN101794579A (zh) * 2005-01-12 2010-08-04 日本电信电话株式会社 长期预测编码和长期预测解码的方法和装置
RU2008112137A (ru) * 2005-09-30 2009-11-10 Панасоник Корпорэйшн (Jp) Устройство кодирования речи и способ кодирования речи
US20090248404A1 (en) * 2006-07-12 2009-10-01 Panasonic Corporation Lost frame compensating method, audio encoding apparatus and audio decoding apparatus
RU2462769C2 (ru) * 2006-10-24 2012-09-27 Войсэйдж Корпорейшн Способ и устройство кодирования кадров перехода в речевых сигналах
US7813922B2 (en) * 2007-01-30 2010-10-12 Nokia Corporation Audio quantization
US8719012B2 (en) * 2007-06-15 2014-05-06 Orange Methods and apparatus for coding digital audio signals using a filtered quantizing noise
JP5006774B2 (ja) * 2007-12-04 2012-08-22 日本電信電話株式会社 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
WO2009075326A1 (ja) * 2007-12-11 2009-06-18 Nippon Telegraph And Telephone Corporation 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
ES2409843T3 (es) * 2008-01-24 2013-06-28 Nippon Telegraph And Telephone Corporation Método de codificación, método de decodificación, y dispositivo y programa para los mismos, y medio o soporte de registro o grabación
JP5013293B2 (ja) * 2008-02-29 2012-08-29 日本電信電話株式会社 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体
WO2010041680A1 (ja) * 2008-10-10 2010-04-15 日本電信電話株式会社 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP4848049B2 (ja) * 2008-12-09 2011-12-28 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP4735711B2 (ja) * 2008-12-17 2011-07-27 ソニー株式会社 情報符号化装置
JP5253518B2 (ja) * 2008-12-22 2013-07-31 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
CN101521013B (zh) * 2009-04-08 2011-08-17 武汉大学 空间音频参数双向帧间预测编解码装置
WO2010140546A1 (ja) * 2009-06-03 2010-12-09 日本電信電話株式会社 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体
GB0917417D0 (en) * 2009-10-05 2009-11-18 Mitsubishi Elec R&D Ct Europe Multimedia signature coding and decoding
KR101397058B1 (ko) * 2009-11-12 2014-05-20 엘지전자 주식회사 신호 처리 방법 및 이의 장치
CN102714040A (zh) * 2010-01-14 2012-10-03 松下电器产业株式会社 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
JP5813094B2 (ja) * 2010-04-09 2015-11-17 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
ES2704742T3 (es) * 2011-04-05 2019-03-19 Nippon Telegraph & Telephone Descodificación de una señal acústica
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
JP6366706B2 (ja) * 2013-10-18 2018-08-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スピーチ関連のスペクトル整形情報を使用したオーディオ信号符号化と復号化の概念
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
AU2014391078B2 (en) * 2014-04-17 2020-03-26 Voiceage Evs Llc Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
CN110444217B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
US9747910B2 (en) * 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework

Also Published As

Publication number Publication date
EP3859734A1 (en) 2021-08-04
EP3706121B1 (en) 2021-05-12
KR101870947B1 (ko) 2018-06-25
CN106415715B (zh) 2019-11-01
CN110444215A (zh) 2019-11-12
US20210335375A1 (en) 2021-10-28
EP3706121A1 (en) 2020-09-09
JP2018077502A (ja) 2018-05-17
CN110444217B (zh) 2022-10-21
JP6484358B2 (ja) 2019-03-13
US20210335374A1 (en) 2021-10-28
CN110444216B (zh) 2022-10-21
US20230306976A1 (en) 2023-09-28
US20190355369A1 (en) 2019-11-21
JP2018084842A (ja) 2018-05-31
CN110444216A (zh) 2019-11-12
KR20160138533A (ko) 2016-12-05
ES2876184T3 (es) 2021-11-12
EP3544004B1 (en) 2020-08-19
US12051430B2 (en) 2024-07-30
US20240339119A1 (en) 2024-10-10
ES2911527T3 (es) 2022-05-19
PL3859734T3 (pl) 2022-04-11
KR101855945B1 (ko) 2018-05-10
PL3706121T3 (pl) 2021-11-02
EP3139382A1 (en) 2017-03-08
JP6490846B2 (ja) 2019-03-27
PL3139382T3 (pl) 2019-11-29
KR20180049234A (ko) 2018-05-10
JPWO2015166733A1 (ja) 2017-04-20
US11694702B2 (en) 2023-07-04
ES2822127T3 (es) 2021-04-29
JP6270993B2 (ja) 2018-01-31
PL3544004T3 (pl) 2020-12-28
EP3544004A1 (en) 2019-09-25
CN110444215B (zh) 2022-10-21
KR101870962B1 (ko) 2018-06-25
JP6462104B2 (ja) 2019-01-30
KR20180049233A (ko) 2018-05-10
JP2018063458A (ja) 2018-04-19
EP3139382A4 (en) 2017-11-22
EP3139382B1 (en) 2019-06-26
EP3859734B1 (en) 2022-01-26
CN106415715A (zh) 2017-02-15
US11120809B2 (en) 2021-09-14
KR20180050762A (ko) 2018-05-15
CN110444217A (zh) 2019-11-12
US20170053656A1 (en) 2017-02-23
US10418042B2 (en) 2019-09-17
KR101870957B1 (ko) 2018-06-25
WO2015166733A1 (ja) 2015-11-05
US11670313B2 (en) 2023-06-06

Similar Documents

Publication Publication Date Title
ES2744904T3 (es) Dispositivo de codificación de señal de sonido, método de codificación de señal de sonido, programa y medio de grabación
US10553229B2 (en) Coding device, decoding device, and method and program thereof