[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

BR112013027093B1 - Método para quantizar, método para decodificar, método para codificar, e meio de gravação legível por computador não transitório - Google Patents

Método para quantizar, método para decodificar, método para codificar, e meio de gravação legível por computador não transitório Download PDF

Info

Publication number
BR112013027093B1
BR112013027093B1 BR112013027093-4A BR112013027093A BR112013027093B1 BR 112013027093 B1 BR112013027093 B1 BR 112013027093B1 BR 112013027093 A BR112013027093 A BR 112013027093A BR 112013027093 B1 BR112013027093 B1 BR 112013027093B1
Authority
BR
Brazil
Prior art keywords
quantization
mode
prediction
quantizer
scheme
Prior art date
Application number
BR112013027093-4A
Other languages
English (en)
Other versions
BR112013027093A2 (pt
Inventor
Ho-Sang Sung
Eun-mi Oh
Original Assignee
Samsung Electronics Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co., Ltd filed Critical Samsung Electronics Co., Ltd
Priority to BR122020023350-8A priority Critical patent/BR122020023350B1/pt
Priority to BR122020023363-0A priority patent/BR122020023363B1/pt
Publication of BR112013027093A2 publication Critical patent/BR112013027093A2/pt
Publication of BR112013027093B1 publication Critical patent/BR112013027093B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

método para quantizar, método para decodificar, método para codificar, e meio de gravação legível por computador não transitório um método para quantizar é fornecido que inclui quantizar um sinal de entrada selecionando um de um primeiro esquema de quantização não usando predição inter quadro e um segundo esquema de quantização usando predição inter quadro em consideração de um ou mais de um modo de predição, um erro preditivo e um estado de canal de transmissão.

Description

Campo Técnico
Métodos e dispositivos consistentes com a presente revelação se referem à quantização e dequantização de coeficientes de codificação preditiva linear, e mais especificamente, a um método para eficientemente quantizer os coeficientes de codificação preditiva linear com baixa complexidade, um método de codificação de som empregando o método de quantização, um método para dequantizar os coeficientes de codificação preditiva linear, um método de decodificação de som empregando o método de dequantização, e um meio de gravação para os mesmos.
Fundamentos da Técnica
Nos sistemas para codificar um som, tal como voz ou áudio, coeficientes de Codificação Preditiva Linear (LPC) são usados para representar uma característica de frequência de curto prazo do som. Os coeficientes LPC são obtidos em um padrão de divisão de um som de entrada em unidades de quadro e minimizando a energia de um erro preditivo por quadro. Contudo, como os coeficientes LPC têm uma faixa dinâmica ampla e uma característica de um filtro
LPC usado é muito sensível aos erros de quantização dos coeficientes LPC, a estabilidade do filtro LPC não é garantida.
Assim, a quantização é realizada mediante conversão dos coeficientes LPC em outros coeficientes fáceis de verificar a estabilidade de um filtro, vantajoso para interpolação, e tendo uma boa característica de quantização. É principalmente preferido que a quantização seja realizada mediante conversão dos coeficientes LPC em coeficientes de Frequência Espectral de Linha (LSF) ou de Frequência Espectral de Imitanciometria (ISF). Particularmente, um método de quantizer os coeficientes LPC pode aumentar um ganho de quantização mediante uso de uma elevada correlação interquadro dos coeficientes LSF em um domínio de frequência e em um domínio de tempo.
Os coeficientes LSF indicam uma característica de frequência de um som de curto prazo, e para quadros nos quais uma característica de frequência de um som de entrada é rapidamente mudada, os coeficientes LSF do quadro também são rapidamente mudados. Contudo, para um quantizador utilizando a correlação elevada interquadro de coeficiente LSF, como a própria predição não pode ser realizada para quadros que mudaram rapidamente, o desempenho de quantização do quantizador diminui.
Revelação da Invenção Problema Técnico
Um aspecto é o de prover um método para quantizer eficientemente os coeficientes de Codificação Preditiva Linear (LPC) com baixa complexidade, um método de codificação de som empregando o método de quantização, um método para dequantizar os coeficientes LPC, um método de decodificação de som empregando o método de dequantização, e um meio de gravação para os mesmos.
Solução para o Problema
De acordo com um aspecto de uma ou mais modalidades exemplares, é provido um método para quantizar compreendendo quantizar um sinal de entrada mediante seleção de um dentre um primeiro esquema de quantização não utilizando uma predição interquadro e um segundo esquema de quantização utilizando a predição interquadro, em consideração de pelo menos um de um modo de predição, um erro preditivo e um estado de canal de transmissão.
De acordo com outro aspecto de uma ou mais modalidades exemplares, é provido um método de codificação compreendendo determinar um modo de codificação de um sinal de entrada; quantizar o sinal de entrada mediante seleção de um de um primeiro esquema de quantização não usando uma predição interquadro e um segundo esquema de quantização usando a predição interquadro, de acordo com informação de caminho determinada em consideração de pelo menos um de um modo de predição, um erro preditivo e um estado de canal de transmissão; codificar o sinal de entrada quantizado no modo de codificação; e gerar um fluxo de bits incluindo um de um resultado quantizado no primeiro esquema de quantização e um resultado quantizado no segundo esquema de quantização, o modo de codificação do sinal de entrada, e informação de caminho relacionada à quantização do sinal de entrada.
De acordo com outro aspecto de uma ou mais modalidades exemplares, é provido um método de dequantização compreendendo dequantizar um sinal de entrada mediante seleção de um dentre um primeiro esquema de dequantização não utilizando uma predição interquadro e um segundo esquema de dequantização utilizando a predição interquadro, com base na informação de caminho incluída em um fluxo de bits, a informação de caminho é determinada em consideração de pelo menos um dentre um modo de predição, um erro preditivo e um estado de canal de transmissão em uma extremidade de codificação.
De acordo com outro aspecto de uma ou mais modalidades exemplares, é provido um método de decodificação compreendendo decodificar os parâmetros de Codificação Preditiva Linear (LPC) e um modo de codificação incluído em um fluxo de bits; dequantizar os parâmetros LPC decodificados mediante uso de um dentre um primeiro esquema de dequantização não utilizando predição interquadro e um segundo esquema de dequantização utilizando a predição interquadro com base em informação de caminho incluída no fluxo de bits; e decodificar os parâmetros LPC dequantizados no modo de codificação decodificado, em que a informação de caminho é determinada em consideração de pelo menos um dentre um modo de predição, um erro preditivo e um estado de canal de transmissão em uma extremidade de codificação.
De acordo com outro aspecto de uma ou mais modalidades exemplares, é provido um método de determinar um tipo de quantizador, o método compreendendo comparar uma taxa de bits de um sinal de entrada com um primeiro valor de referência; comparar uma largura de banda do sinal de entrada com um segundo valor de referência; comparar uma frequência de amostragem interna com um terceiro valor de referência; e determinar o tipo de quantizador para o sinal de entrada como um de um tipo de laço aberto e um tipo de laço fechado com base nos resultados de uma ou mais das comparações.
De acordo com outro aspecto de uma ou mais modalidades exemplares, é provido um dispositivo eletrônico incluindo uma unidade de comunicação que recebe pelo menos um de um sinal de som e um fluxo de bits codificado, ou que transmite pelo menos um de um sinal de som codificado em um sinal restaurado; e um módulo de codificação que quantiza o sinal de som recebido mediante seleção de um dentre um primeiro esquema de quantização não utilizando uma predição interquadros e um segundo esquema de quantização utilizando a predição interquadro, de acordo com a informação de caminho determinada em consideração de pelo menos um de um modo de predição, um erro preditivo e um estado de canal de transmissão e codificar o sinal de som quantizado em um modo de codificação.
De acordo com outro aspecto de uma ou mais modalidades exemplares, é provido um dispositivo eletrônico que inclui uma unidade de comunicação que recebe pelo menos um dentre um sinal de som e um fluxo de bits codificado, ou que transmite pelo menos um de um sinal de som codificado e um som restaurado; e um módulo de decodificação que decodifica os parâmetros de Codificação Preditiva Linear (LPC) e um modo de codificação incluído no fluxo de bits, dequantiza os parâmetros LPC decodificados mediante uso de um dentre um primeiro esquema de dequantização não utilizando predição interquadro e um segundo esquema de dequantização utilizando a predição interquadro com base na informação de percurso incluída no fluxo de bits, e decodifica os parâmetros LPC dequantizados no modo de codificação decodificado, em que a informação de caminho é determinada em consideração de pelo menos um dentre um modo de predição, um erro preditivo e um estado de canal de transmissão em uma extremidade de codificação.
De acordo com outro aspecto de uma ou mais modalidades exemplares, é provido um dispositivo eletrônico incluindo uma unidade de comunicação que recebe ao menos um de um sinal de som e um fluxo de bits codificado, ou que transmite ao menos um de um sinal de som codificado e um som restaurado; um módulo de codificação que quantiza o sinal de som recebido mediante seleção de um dentre um primeiro esquema de quantização não utilizando uma predição interquadro e um segundo esquema de quantização utilizando a predição interquadro, de acordo com a informação de caminho determinada em consideração de ao menos um dentre um modo de predição, um erro preditivo e um estado de canal de transmissão e que codifica o sinal de som quantizado em um modo de codificação; e um módulo de decodificação que decodifica os parâmetros de Codificação Preditiva Linear (LPC) e um modo de codificação incluído no fluxo de bits, dequantiza os parâmetros LPC decodificados mediante uso de um dentre um primeiro esquema de dequantização não utilizando predição interquadro e um segundo esquema de dequantização utilizando a predição interquadro com base na informação de caminho incluída no fluxo de bits, e decodifica os parâmetros LPC dequantizados no modo de codificação decodificado.
Efeitos Vantajosos da Invenção
De acordo com o presente conceito inventivo, para quantizar eficientemente um sinal de áudio ou fala, mediante aplicação de uma pluralidade de modos de codificação de acordo com as características do sinal de áudio ou fala e alocação de vários números de bits ao sinal de áudio ou fala de acordo com uma razão de compactação aplicada a cada um dos modos de codificação, um quantizador ótimo com baixa complexidade pode ser selecionado em cada um dos modos de codificação.
Breve Descrição dos Desenhos
Os aspectos acima e outros aspectos se tornarão mais evidentes mediante descrição em detalhe de suas modalidades exemplares com referência aos desenhos anexos nos quais: A Figura 1 é um diagrama de blocos de um aparelho de codificação de som de acordo com uma modalidade exemplar; As Figuras 2A a 2D são exemplos de vários modos de codificação que podem ser selecionados por um seletor de modo de codificação do aparelho de codificação de som da Figura 1; A Figura 3 é um diagrama de blocos de um quantizador de coeficiente de Codificação Preditiva Linear (LPC) de acordo com uma modalidade exemplar; A Figura 4 é um diagrama de blocos de um determinador de função de ponderação de acordo com uma modalidade exemplar; A Figura 5 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar; A Figura 6 é um diagrama de blocos de um seletor de caminho de quantização de acordo com uma modalidade exemplar; As Figuras 7A e 7B são fluxogramas ilustrando operações do seletor de caminho de quantização da Figura 6, de acordo com uma modalidade exemplar; A Figura 8 é um diagrama de blocos de um seletor de caminho de quantização de acordo com outra modalidade exemplar; A Figura 9 ilustra informação com relação a um estado de canal que pode ser transmitido em uma extremidade de rede quando um serviço de codec é provido; A Figura 10 é um diagrama de blocos de um quantizador de coeficiente modalidade exemplar; LPC de acordo com outra A Figura 11 é um diagrama de blocos de um quantizador de coeficiente modalidade exemplar; LPC de acordo com outra A Figura 12 é um diagrama de blocos de um quantizador de coeficiente modalidade exemplar; LPC de acordo com outra A Figura 13 é um diagrama de blocos de um quantizador de coeficiente modalidade exemplar; LPC de acordo com outra A Figura 14 é um diagrama de blocos de um quantizador de coeficiente modalidade exemplar; LPC de acordo com outra A Figura 15 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar; As Figuras 16A e 16B são diagramas de bloco de quantizadores de coeficiente LPC de acordo com outras modalidades exemplares; As Figuras 17A a 17C são diagramas de bloco de quantizadores de coeficiente LPC de acordo com outras modalidades exemplares; A Figura 18 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar; A Figura 19 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar; A Figura 20 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar; A Figura 21 é diagrama de blocos de um seletor de tipo de quantizador de acordo com uma modalidade exemplar. A Figura 22 é um fluxograma ilustrando uma operação de um método de seleção de tipo de quantizador, de acordo com uma modalidade exemplar; A Figura 23 é um diagrama de blocos de um aparelho de decodif icação de som de acordo com uma modalidade exemplar; A Figura 24 é um diagrama de blocos de um dequantizador de coeficiente LPC de acordo com uma modalidade exemplar; A Figura 2 5 é um diagrama de blocos de um dequantizador de coeficiente LPC de acordo com outra modalidade exemplar; A Figura 26 é um diagrama de blocos de um exemplo de um primeiro esquema de dequantização e de um segundo esquema de dequantização no dequantizador de coeficiente LPC da Figura 25, de acordo com uma modalidade exemplar; A Figura 27 é um fluxograma ilustrando um método de quantização de acordo com uma modalidade exemplar; A Figura 28 é um fluxograma ilustrando um método de dequantização de acordo com uma modalidade exemplar; A Figura 29 é um diagrama de blocos de um dispositivo eletrônico incluindo um módulo de codificação de acordo com uma modalidade A Figura 3 0 é um exemplar; diagrama de blocos de um dispositivo eletrônico incluindo um módulo de decodificação, de acordo com uma modalidade exemplar; e A Figura 31 é um diagrama de blocos de um dispositivo eletrônico incluindo um módulo de codificação e um módulo de decodificação, de acordo com uma modalidade exemplar.
Modo para a Invenção
O presente conceito inventivo pode permitir vários tipos de mudança ou modificação e várias mudanças em forma, e modalidades exemplares específicas serão ilustradas nos desenhos e descritas em detalhe no relatório descritivo. Contudo, deve se entendido que as modalidades exemplares específicas não limitam o presente conceito inventivo a uma forma de revelação específica, mas incluem cada conceito modificado, equivalente ou substituído por um conceito dentro da essência e escopo técnico do presente conceito inventivo. Na descrição a seguir, funções ou construções bem conhecidos não são descritas em detalhe uma vez que elas obscureceriam a invenção com detalhe desnecessário.
Embora os termos, tal como "primeiro" e "segundo" possam ser usados para descrever vários elementos, os elementos não podem ser limitados pelos termos. Os termos podem ser usados para distinguir um determinado elemento de outro elemento.
A terminologia usada no pedido é usada apenas para descrever modalidades exemplares específicas e não tem qualquer intenção em limitar o conceito inventivo. Embora termos gerais, conforme atualmente usados amplamente como possíveis sejam selecionados como termos usados neste conceito inventivo enquanto considerando as funções neste conceito inventivo, eles podem variar de acordo com uma intenção daqueles de conhecimento comum na técnica, precedentes judiciais, ou o surgimento de nova tecnologia. Além disso, nos casos específicos, os termos intencionalmente selecionados pelo requerente podem ser usados, e nesse caso, o significado dos termos será revelado na descrição correspondente. Consequentemente, os termos usados neste conceito inventivo devem ser definidos não pelos nomes simples dos termos, mas pelo significado dos termos e do conteúdo em relação ao presente conceito inventivo.
Uma expressão no singular inclui uma expressão no plural a menos que elas sejam claramente diferentes em contexto uma da outra. No pedido, deve ser entendido que termos, tal como "incluir" e "ter", são usados para indicar a existência de característica implementada, número, etapa, operação, elemento, parte, ou uma combinação dos mesmos sem excluir antecipadamente a possibilidade de existência ou adição de uma ou mais de outras características, números, etapas, operações, elementos, partes, ou combinações dos mesmos.
O presente conceito inventivo será descrito agora mais completamente com referência aos desenhos anexos, nos quais modalidades exemplares da presente invenção são mostradas. Numerais de referência semelhantes nos desenhos denotam elementos semelhantes e, assim, sua descrição repetitiva será omitida.
Expressões tais como "pelo menos um de", quando precedendo uma lista de elementos, modificam a lista inteira de elementos e não modificam os elementos individuais da lista.
A Figura 1 é um diagrama de blocos de um aparelho de codificação de som 100 de acordo com uma modalidade exemplar.
O aparelho de codificação de som 100 mostrado na Figura 1 pode incluir um pré-processador (por exemplo, uma unidade de processamento central (CPU)) 111, um e analisador de espectro e Predição Linear (LP) 113, um seletor de modo de codificação 115, um quantizador de coeficiente de Codificação Preditiva Linear (LPC) 117, um codificador de modo variável 119, e um codificador de parâmetro 121. Cada um dos componentes do aparelho de codificação de som 100 pode ser implementado por ao menos um processador (por exemplo, uma unidade de processamento central (CPU) ) pelo fato de ser integrado em ao menos um módulo. Deve-se observar que um som pode indicar áudio, fala ou uma combinação dos mesmos. A descrição a seguir se referirá ao som como fala para conveniência de descrição. Contudo, será entendido que qualquer som pode ser processado.
Com referência à Figura 1, o pré-processador 111 pode pré-processar um sinal de fala de entrada. No processo de pré-processamento, um componente de frequência indesejado pode ser removido do sinal de fala, ou uma característica de frequência do sinal de fala pode ser ajustada para ser vantajoso para codificação. Em detalhe, o pré-processador 111 pode realizar filtração passa alta, pré-ênfase ou conversão de amostragem.
O analisador de LP e espectro 113 pode extrair coeficientes LPC mediante análise de características em um domínio de frequência ou realizar análise de LP no sinal de fala pré-processado. Embora uma análise de LP por quadro seja geralmente realizada, duas ou mais análises de LP por quadro podem ser realizadas para aperfeiçoamento de qualidade de som adicional. Nesse caso, uma análise de LP é um LP para uma extremidade de quadro, que é realizada como uma análise LP convencional, e as outras podem ser LP para subquadros intermediários para aperfeiçoamento de qualidade de som. Nesse caso, uma extremidade de quadro de um quadro atual indica um subquadro final entre os subquadros formando o quadro atual, e uma extremidade de quadro de um quadro anterior indica um subquadro final dentre os subquadros formando o quadro anterior. Por exemplo, um quadro pode consistir em quatro subquadros.
Os subquadros intermediários indicam um ou mais subquadros dentre subquadros existentes entre o subquadro final, que é a extremidade de quadro do quadro anterior, e o subquadro final, que é a extremidade de quadro do quadro atual. Consequentemente, o analisador de espectro e LP 113 pode extrair um total de dois ou mais conjuntos de coeficientes LPC. Os coeficientes LPC podem usar uma ordem de 10 quando um sinal de entrada é uma faixa estreita e podem utilizar uma ordem de 16 a 2 0 quando o sinal de entrada é uma banda larga. Contudo, a dimensão dos coeficientes LPC não é limitada a isso.
O seletor de modo de codificação 115 pode selecionar um de uma pluralidade de modos de codificação em correspondência com múltiplas taxas. Além disso, o seletor de modo de codificação 115 pode selecionar um da pluralidade de modos de codificação mediante uso de características do sinal de fala, que são obtidas a partir da informação de banda, informação de altura, ou informação de análise do domínio de frequência. Além disso, o seletor de modo de codificação 115 pode selecionar um da pluralidade de modos de codificação mediante uso de múltiplas taxas e as características do sinal de fala.
O quantizador de coeficiente LPC 117 pode quantizar os coeficientes LPC extraídos pelo analisador de espectro e LP 113. O quantizador de coeficiente LPC 117 pode realizar a quantização mediante conversão dos coeficientes LPC para outros coeficientes adequados para quantização. O quantizador de coeficiente LPC 117 pode selecionar um de uma pluralidade de caminhos incluindo um primeiro caminho não usando predição interquadro e um segundo caminho utilizando a predição interquadro como um caminho de quantização do sinal de fala com base em um primeiro critério antes da quantização do sinal de fala e quantizar o sinal de fala mediante uso de um de um primeiro esquema de quantização e de um segundo esquema de quantização de acordo com o caminho de quantização selecionado. Alternativamente, o quantizador de coeficiente LPC 117 pode quantizer os coeficientes LPC para ambos, primeiro caminho por intermédio do primeiro esquema de quantização não usando a predição interquadro, e o segundo caminho por intermédio do segundo esquema de quantização utilizando a predição interquadro e selecionar um resultado de quantização de um do primeiro caminho e do segundo caminho com base em um segundo critério. 0 primeiro critério e o segundo critério podem ser idênticos um ao outro ou diferentes um do outro.
O codificador de modo variável 119 pode gerar um fluxo de bits mediante codificação dos coeficientes LPC quantizados pelo quantizador de coeficiente LPC 117. O codificador de modo variável 119 pode codificar os coeficientes LPC quantizados no modo de codificação selecionado pelo seletor de modo de codificação 115. O codificador de modo variável 119 pode codificar um sinal de excitação dos coeficientes LPC em unidades de quadros ou subquadros.
Um exemplo de algoritmos de codificação usados no codificador de modo variável 119 pode ser Predição Linear Co-excitada (CELP) ou CELP algébrico (ACELP). Um algoritmo de codificação de transformada pode ser usado adicionalmente de acordo com um modo de codificação. Parâmetros representativos para codificar os coeficientes
LPC no algoritmo CELP são um índice adaptativo de livro de códigos, um ganho adaptativo de livro de códigos, um índice fixo de livro de códigos e um ganho fixo de livro de códigos. O quadro atual codificado pelo codificador de modo variável 119 pode ser armazenado para codificar um quadro subsequente.
O codificador de parâmetro 121 pode codificar os parâmetros a serem usados por uma extremidade de decodificação para que a decodificação seja incluída em um fluxo de bits. É vantajoso se os parâmetros correspondendo ao modo de codificação forem codificados. O fluxo de bits gerado pelo codificador de parâmetros 121 pode ser armazenado ou transmitido.
As Figuras 2A a 2D são exemplos de vários modos de codificação que podem ser selecionados pelo seletor de modo de codificação 115 do aparelho de codificação de som 100 da Figura 1. As Figuras 2A e 2C são exemplos de modos de codificação classificados em um caso onde o número de bits alocados para quantização é grande, isto é, um caso de uma taxa elevada de bits, e as Figuras 2B e 2D são exemplos de modos de codificação classificados em um caso onde o número de bits alocados para quantização é pequeno, isto é, um caso de uma taxa baixa de bits.
Em primeiro lugar, no caso de uma taxa alta de bits, o sinal de fala pode ser classificado em um modo de Codificação Genérica (GC) e um modo de Codificação de
Transição (TC) para uma estrutura simples; como mostrado na Figura 2A. Nesse caso, o modo GC inclui um modo de Codificação Sem Voz (UC) e um modo de Codificação Com Voz (VC) . No caso de uma taxa alta de bits, um modo de Codificação Inativa (IC) e um modo de Codificação de Áudio (AC) podem ser incluídos adicionalmente, conforme mostrado na Figura 2C.
Além disso, de no caso de uma taxa baixa de bits, o sinal de fala pode ser classificado no modo GC, no modo UC, no modo VC e no modo TC, conforme mostrado na Figura 2B. Além disso, no caso de uma taxa baixa de bits, o modo IC e o modo AC podem ser incluídos adicionalmente, conforme mostrado na Figura 2D.
Nas Figuras 2A e 2C, o modo UC pode ser selecionado quando o sinal de fala é um som ou ruído sem voz tendo características similares a do som sem voz. O modo VC pode ser selecionado quando o sinal de fala é um som com voz. O modo TC pode ser usado para codificar um sinal de um intervalo de transição no qual características do sinal de fala são mudadas rapidamente. O modo GC pode ser usado para codificar outros sinais. 0 modo UC, o modo VC, o modo TC e o modo GC se baseiam em um critério de definição e classificação revelado em ITU-T G.718, mas não são limitados a isso.
Nas Figuras 2B e 2D, o modo IC pode ser selecionado para um som mudo, e o modo AC pode ser selecionado quando características do sinal de fala são aproximadas para áudio.
Os modos de codificação podem ser classificados ainda de acordo com as bandas do sinal de fala. As bandas do sinal de fala podem ser classificadas, por exemplo, em Banda Estreita (NB) , uma Banda Larga (WB) , uma Banda Super Larga (SWB) e uma Banda Completa (FB) . A NB pode ter uma largura de banda de aproximadamente 300 Hz a aproximadamente 3.400 Hz ou de aproximadamente 50 Hz a aproximadamente 4.000 Hz, a WB pode ter uma largura de banda de aproximadamente 50 Hz a aproximadamente 7.000 Hz ou de aproximadamente 50 Hz a aproximadamente 8.000 Hz, a SWB pode ter uma largura de banda de aproximadamente 50 Hz a aproximadamente 14.000 Hz ou de aproximadamente 50 Hz a aproximadamente 16.000 Hz, e a FB pode ter uma largura de banda de até aproximadamente 20.000 Hz. Aqui, os valores numéricos relacionados às larguras de banda são definidos para conveniência e não são limitados a esses. Além disso, a classificação das bandas pode ser definida mais simplesmente ou com mais complexidade do que a descrição acima.
O codificador de modo variável 119 da Figura 1 pode codificar os coeficientes LPC mediante uso de diferentes algoritmos de codificação correspondendo aos modos de codificação mostrados nas Figuras 2A a 2D. Quando os tipos de modos de codificação e o número de modos de codificação são determinados, um livro de códigos pode precisar ser outra vez treinado mediante uso de sinais de fala correspondendo aos modos de codificação determinados.
A Tabela 1 mostra um exemplo de esquemas e estruturas de quantização em um caso de 4 modos de codificação. Aqui, um método de quantização não utilizando a predição interquadro pode ser denominado um esquema de segurança livre, e o método de quantização utilizando a predição interquadro pode ser denominado como esquema preditivo. Além disso, VQ denota um quantizador de vetor, e BC-TCQ denota um quantizador Codificado em Trellis Restrito em Bloco. Tabela 1
Figure img0001
Os modos de codificação podem ser alterados de acordo com uma taxa de bits aplicada. Conforme descrito acima, para quantizar os coeficientes LPC em uma taxa de bits elevada utilizando dois modos de codificação, 40 ou 41 bits por quadro podem ser usados no modo GC, e 46 bits por quadro podem ser usados no modo TC.
A Figura 3 é um diagrama de blocos de um quantizador de coeficiente LPC 300 de acordo com uma modalidade exemplar.
O quantizador de coeficiente LPC 300 mostrado na Figura 3 pode incluir um primeiro conversor de coeficiente 311, um determinador de função de ponderação 313, um quantizador de frequência espectral de imitanciometria (ISF)/frequência espectral de linha (LSF) 315, e um segundo conversor de coeficiente 317. Cada um dos componentes do quantizador de coeficiente LPC 300 pode ser implementado por ao menos um processador (por exemplo, unidade de processamento central (CPU)) pelo fato de ser integrado em ao menos um módulo.
Com referência à Figura 3, o primeiro conversor de coeficiente 311 pode converter os coeficientes LPC extraídos mediante realização de análise LP em uma extremidade de quadro de um quadro atual ou anterior de um sinal de fala para os coeficientes em outro formato. Por exemplo, o primeiro conversor de coeficiente 311 pode converter os coeficientes LPC da extremidade de quadro de um quadro atual ou anterior em qualquer um formato de coeficientes LSF e coeficientes ISF. Nesse caso, os coeficientes ISF ou os coeficientes LSF indicam um exemplo de formatos nos quais os coeficientes LPC podem ser facilmente quantizados.
O determinador de função de ponderação 313 pode determinar uma função de ponderação relacionada à importância dos coeficientes LPC com relação à extremidade de quadro do quadro atual e à extremidade de quadro do quadro anterior mediante uso dos coeficientes ISF ou dos coeficientes LSF convertidos a partir dos coeficientes LPC. A função de ponderação determinada pode ser usada em um processo de selecionar um caminho de quantização ou procurar um índice de livro de códigos através do qual os erros de ponderação são minimizados em quantização. Por exemplo, o determinador de função de ponderação 313 pode determinar uma função de ponderação por magnitude e uma função de ponderação por frequência.
Além disso, o determinador de função de ponderação 313 pode determinar uma função de ponderação mediante consideração de pelo menos uma de uma banda de frequência, um modo de codificação, e informação de análise de espectro. Por exemplo, o determinador de função de ponderação 313 pode derivar uma função de ponderação ótima por modo de codificação. Além disso, o determinador de função de ponderação 313 pode derivar uma função de ponderação ótima por banda de frequência. Adicionalmente, o determinador de função de ponderação 313 pode derivar uma função de ponderação ótima com base na informação de análise de frequência do sinal de fala. A informação de análise de frequência pode incluir informação de inclinação de espectro. 0 determinador de função de ponderação 313 será descrito em mais detalhe abaixo.
O quantizador ISF/LSF 315 pode quantizar os coeficientes ISF ou os coeficientes LSF convertidos a partir dos coeficientes LPC da extremidade de quadro do quadro atual. O quantizador ISF/LSF 315 pode obter um índice de quantização ótimo em um modo de quantização de entrada. O quantizador ISF/LSF 315 pode quantizar os coeficientes ISF ou os coeficientes LSF mediante uso da função de ponderação determinada pelo determinador de função de ponderação 313. 0 quantizador ISF/LSF 315 pode quantizar os coeficientes ISF ou os coeficientes LSF mediante seleção de um de uma pluralidade de caminhos de quantização no uso da função de ponderação determinada pelo determinador de função de ponderação 313. Como resultado da quantização, um índice de quantização dos coeficientes ISF ou dos coeficientes LSF e coeficientes ISF Quantizados (QISF) ou coeficientes LSF Quantizado (QLSF) com relação à extremidade de quadro do quadro atual, podem ser obtidos.
O segundo conversor de coeficiente 317 pode converter os coeficientes QISF ou QLSF para coeficientes
LPC quantizados (QLPC). Uma relação entre quantização de vetor de coeficientes LPC e uma função de ponderação será descrita agora.
A quantizador de vetor indica um processo de selecionar um índice de livro de códigos tendo o erro mínimo mediante uso de uma medida de distância de erro elevado ao quadrado, considerando que todas as entradas em um vetor têm a mesma importância. Contudo, como a importância é diferente em cada um dos coeficientes LPC, se erros de coeficientes importantes forem reduzidos, uma qualidade perceptual de um sinal sintetizado final pode aumentar. Assim, quando os coeficientes LSF são quantizados, aparelhos de decodificação podem aumentar um desempenho de um sinal sintetizado mediante aplicação de uma função de ponderação representando importância de cada um dos coeficientes LSF para a medida de distância de erro elevado ao quadrado e selecionando um índice ótimo de livro de códigos.
De acordo com uma modalidade exemplar, uma função de ponderação por magnitude pode ser determinada com base em que cada um dos coeficientes ISF ou LSF atualmente afeta um envelope espectral mediante uso de informação de frequência e magnitudes espectrais efetivas dos coeficientes ISF ou LSF. De acordo com uma modalidade exemplar, eficiência de quantização adicional pode ser obtida mediante combinação da função de ponderação por magnitude e uma função de ponderação por frequência considerando características perceptuais e uma distribuição de grupo de ondas sonoras no domínio de frequência. De acordo com uma modalidade exemplar, como a magnitude efetiva do domínio de frequência é utilizada, informação de todas as frequências podem ser bem refletidas, e um peso de cada um dos coeficientes ISF ou LSF pode ser corretamente derivado.
De acordo com uma modalidade exemplar, quando quantização de vetor de coeficientes ISF ou LSF convertida a partir de coeficientes LPC é realizada, se a importância de cada coeficiente for diferente, uma função de ponderação indicando qual entrada é relativamente mais importante em um vetor pode ser determinada. Além disso, uma função de ponderação capaz de ponderar uma porção de energia elevada mediante análise de um espectro de um quadro a ser codificado, pode ser determinada para aperfeiçoar a exatidão de codificação. Energia espectral elevada indica uma elevada correlação no domínio de tempo.
Um exemplo da aplicação de tal função de ponderação a uma função de erro é descrito. Em primeiro lugar, se a variação de um sinal de entrada for alta, quando a quantização é realizada sem usar a predição interquadro, uma função de erro para procurar um índice de livro de códigos através de coeficientes QISF pode ser representada pela Equação 1 abaixo. Caso contrário, se a variação do sinal de entrada for baixa, quando a quantização é realizada utilizando a predição interquadro, uma função de erro para procurar um índice de livro de códigos através dos coeficientes QISF pode ser representada pela Equação 2. Um índice de livro de códigos indica um valor para minimizar uma função de erro correspondente.
Figure img0002
Aqui, w(i) denota uma função de ponderação z(i) e r(i) denota entradas de um quantizador, z(i) denota um vetor no qual um valor médio é removido de ISF(i) na Figura 3, e r(i) denota um vetor no qual um valor preditivo interquadro é removido a partir de z(i). Ewerr(k) pode ser usado para procurar um livro de códigos no caso em que uma predição interquadro não é realizada e Ewerr(p) pode ser usado para procurar um livro de códigos no caso em que uma predição interquadro é realizada. Além disso, c(i) denota um livro de códigos, e p denota uma ordem de coeficientes ISF, que normalmente é 10 na NB e 16 a 20 na WB.
De acordo com uma modalidade exemplar, aparelhos de codificação podem determinar uma função de ponderação ótima mediante combinação de uma função de ponderação por magnitude no uso de magnitudes espectrais correspondendo às frequências dos coeficientes ISF ou LSF convertidos a partir dos coeficientes LPC e uma função de ponderação por frequência em consideração das características perceptuais e uma distribuição de grupo de ondas sonoras de um sinal de entrada.
A Figura 4 é um diagrama de blocos de um determinador de função de ponderação 400 de acordo com uma modalidade exemplar. 0 determinador de função de ponderação 400 é mostrado em conjunto com um processador de janela 421, uma unidade de mapeamento de frequência 4 23, e um calculador de magnitude 425 de um analisador de espectro e LP 410.
Com referência à Figura 4, o processador de janela 421 pode aplicar uma janela a um sinal de entrada. A janela pode ser uma janela retangular, uma janela e Hamming, ou uma janela de seno.
A unidade de mapeamento de frequência 423 pode mapear o sinal de entrada no domínio de tempo para um sinal de entrada no domínio de frequência. Por exemplo, a unidade de mapeamento de frequência 423 pode transformar o sinal de entrada para o domínio de frequência através de uma Transformada Rápida de Fourier (FFT) ou uma Transformada Discreta Modificada de Cosseno (MDCT).
O calculador de magnitude 425 pode calcular as magnitudes dos recipientes de espectro de frequência com relação ao sinal de entrada transformado para o domínio de frequência. O número de recipientes de espectro de frequência pode ser o mesmo que o número para normalizar os coeficientes ISF ou LSF por intermédio do determinador de função de ponderação 400.
Informação de análise de espectro pode ser introduzida ao determinador de função de ponderação 400 como um resultado realizado pelo analisador de espectro e LP 410. Nesse caso, a informação de análise de espectro pode incluir uma inclinação de espectro.
O determinador de função de ponderação 400 pode normalizar os coeficientes ISF ou LSF convertidos a partir dos coeficientes LPC. Uma faixa a qual a normalização é efetivamente aplicada dentre os coeficientes ISF de ordem pth é da ordem de 0° a (p-2)°. Normalmente, a ordem de 0o a (p-2)° existem entre 0 e π. 0 determinador de função de ponderação 400 pode realizar a normalização com o mesmo número K que o número de recipientes de espectro de frequência, que é derivado pela unidade de mapeamento de frequência 423 para usar a informação de análise de espectro.
O determinador de função de ponderação 400 pode determinar uma função de ponderação por magnitude W1(n) no qual os coeficientes ISF ou LSF afetam um envelope espectral para um subquadro médio mediante uso da informação de análise de espectro. Por exemplo, o determinador de função de ponderação 400 pode determinar a função de ponderação por magnitude W1(n) mediante uso da informação de frequência dos coeficientes ISF ou LSF e magnitudes espectrais efetivas do sinal de entrada. A função de ponderação por magnitude W1(n) pode ser determinada para os coeficientes ISF ou LSF convertidos a partir dos coeficientes LPC.
O determinador de função de ponderação 400 pode determinar a função de ponderação por magnitude W1(n) mediante uso de uma magnitude de um recipiente de espectro de frequência correspondendo a cada um dos coeficientes ISF ou LSF.
O determinador de função de ponderação 400 pode determinar a função de ponderação por magnitude W1(n) mediante uso de magnitudes de um recipiente de espectro correspondendo a cada um dos coeficientes ISF ou LSF e pelo menos um recipiente de espectro adjacente localizado em torno do recipiente de espectro. Nesse caso, o determinador de função de ponderação 400 pode determinar a função de ponderação por magnitude W1(n) relacionada a um envelope espectral mediante extração de um valor representativo de cada recipiente de espectro e pelo menos um recipiente de espectro adjacente. Um exemplo do valor representativo é um valor máximo, um valor médio ou um valor intermediário de um recipiente de espectro correspondendo a cada um dos coeficientes ISF ou LSF e pelo menos um recipiente e espectro adjacente.
O determinador de função de ponderação 400 pode determinar uma função de ponderação por frequência W2 (n) mediante uso da informação de frequência dos coeficientes ISF ou LSF. Em detalhe, o determinador de função de ponderação 400 pode determinar a função de ponderação por frequência W2(n) mediante uso de características perceptuais e uma distribuição de grupo de ondas sonoras do sinal de entrada. Nesse caso, o determinador de função de ponderação 400 pode extrair as características perceptuais do sinal de entrada de acordo com uma escala de som agudo. Então, o determinador de função de ponderação 400 pode determinar a função de ponderação por frequência W2(n) com base em um primeiro grupo de ondas sonoras da distribuição de grupo de ondas sonoras.
A função de ponderação por frequência W2(n) pode resultar em um peso relativamente baixo em uma frequência superbaixa e em uma frequência alta e resultar em um peso constante em um intervalo de frequência de uma frequência baixa, por exemplo, um intervalo correspondendo ao primeiro grupo de ondas sonoras.
O determinador de função de ponderação 400 pode determinar uma função de ponderação final W(n) mediante combinação da função de ponderação por magnitude W1(n) e a função de ponderação por frequência W2(n). Nesse caso, o determinador de função de ponderação 400 pode determinar a função de ponderação final W(n) mediante multiplicação ou adição da função de ponderação por magnitude W1(n) por intermédio de, ou para a função de ponderação por frequência W2(n).
Como outro exemplo, o determinador de função de ponderação 400 pode determinar a função de ponderação pode magnitude W1(n) e a função de ponderação por frequência W2 (n) mediante consideração de um modo de codificação e informação de banda de frequência do sinal de entrada.
Para fazer isso, o determinador de função de ponderação 400 pode verificar os modos de codificação do sinal de entrada para um caso onde uma largura de banda do sinal de entrada é uma NB e um caso onde a largura de banda do sinal de entrada é uma WB mediante verificação de largura de banda do sinal de entrada. Quando o modo de codificação do sinal de entrada é o modo UC, o determinador de função de ponderação 400 pode determinar e combinar a função de ponderação por magnitude W1(n) e a função de ponderação por frequência W2(n) no modo UC.
Quando o modo de codificação do sinal de entrada não é o modo UC, o determinador de função de ponderação 400 pode determinar e combinar a função de ponderação por magnitude Wl(n) e a função de ponderação por frequência W2(n) no modo VC.
Se o modo de codificação do sinal de entrada for o modo GC ou o modo TC, o determinador de função de ponderação 400 pode determinar uma função de ponderação através do mesmo processo como no modo VC.
Por exemplo, quando o sinal de entrada é transformado em frequência pelo algoritmo FFT, a função de ponderação por magnitude W1(n) utilizando magnitudes 5 espectrais dos coeficientes FFT pode ser determinada pela Equação 3 abaixo.
Figure img0003
Por exemplo, a função de ponderação por frequência
W2 (n) no modo VC pode ser determinada pela Equação 4, e a função de ponderação por frequência W2(n) no modo UC pode ser determinada pela Equação 5. Constantes nas Equações 4 e 5 podem ser mudadas de acordo com as características do 15 sinal de entrada:
Figure img0004
A função de ponderação finalmente derivada W(n) pode ser determinada pela Equação 6.
Figure img0005
A Figura 5 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com uma modalidade exemplar.
Com referência à Figura 5, o quantizador de coeficiente LPC 500 pode incluir um determinador de função de ponderação 511, um determinador de caminho de quantização 513, um primeiro esquema de quantização 515, e um segundo esquema de quantização 517. Como o determinador de função de ponderação 511 foi descrito na Figura 4, uma sua descrição é aqui omitida.
O determinador de caminho de quantização 513 pode determinar que um dos vários caminhos, incluindo um primeiro caminho não utilizando predição interquadro e um segundo caminho utilizando a predição interquadro, é selecionado como um caminho de quantização de um sinal de entrada, com base em um critério antes da quantização do sinal de entrada.
O primeiro esquema de quantização 515 pode quantizar o sinal de entrada provido a partir do determinador de caminho de quantização 513, quando o primeiro caminho é selecionado como o caminho de quantização do sinal de entrada. O primeiro esquema de quantização 515 pode incluir um primeiro quantizador (não mostrado) para quantizar aproximadamente o sinal de entrada e o segundo quantizador (não mostrado) para quantizar precisamente um sinal de erro de quantização entre o sinal de entrada e um sinal de saída do primeiro quantizador.
O segundo esquema de quantização 517 pode quantizar o sinal de entrada provido a partir do determinador de caminho de quantização 513, quando o segundo caminho é selecionado como o caminho de quantização do sinal de entrada. O primeiro esquema de quantização 515 pode incluir um elemento para realizar quantização codificada em trellis restrito em bloco em um erro preditivo do sinal de entrada e um valor preditivo interquadro e um elemento de predição interquadro.
O primeiro esquema de quantização 515 é um esquema de quantização não usando a predição interquadro e pode ser denominado esquema de segurança líquida. O segundo esquema de quantização 517 é um esquema de quantização utilizando a predição interquadro e pode ser denominado esquema preditivo.
O primeiro esquema de quantização 515 e o segundo esquema de quantização 517 não são limitados à modalidade exemplar atual e podem ser implementados mediante uso de primeiro e segundo esquemas de quantização de acordo com várias modalidades exemplares descritas abaixo, respectivamente.
Consequentemente, de acordo com uma baixa taxa de bits para um serviço de voz interativo de elevada eficiência para uma taxa elevada de bits para prover um serviço de qualidade diferenciada, um quantizador ótimo pode ser selecionado.
A Figura 6 é um diagrama de blocos de um determinador de caminho de quantização de acordo com uma modalidade exemplar.
Com referência à Figura 6, o determinador de caminho de quantização 600 pode incluir um calculador de erro preditivo 611 e um seletor de esquema de quantização 613 .
O calculador de erro preditivo 611 pode calcular um erro preditivo em vários métodos para receber um valor preditivo interquadro p(n), uma função de ponderação w(n), e um coeficiente LSF z (n) a partir do qual um valor de
Corrente Direta (DC) é removido. Em primeiro lugar, um preditor interquadro (não mostrado) que é o mesmo que aquele usado em um segundo esquema de quantização, isto é, o esquema preditivo, pode ser usado. Aqui, pode ser usado qualquer um de um método Auto-Regressivo (AR) e um método de Média Móvel (MA) . Um sinal z (n) de um quadro anterior para predição interquadro pode usar um valor quantizado ou um valor não quantizado. Além disso, um erro preditivo pode ser obtido mediante uso ou não da função de ponderação w(n). Consequentemente, o número total de combinações é 8, 4 das quais são como a seguir:
Em primeiro lugar, um erro preditivo AR ponderado utilizando um sinal quantizado de um quadro anterior pode ser representado pela Equação 7.
Figure img0006
Em segundo lugar, um erro preditivo AR utilizando o sinal quantizado do quadro anterior pode ser representado pela Equação 8.
Figure img0007
Em terceiro lugar, um erro preditivo AR ponderado utilizando o sinal z(n) do quadro anterior pode ser representado pela Equação 9.
Figure img0008
Em quarto lugar, um erro preditivo AR utilizando o sinal z (n) do quadro anterior pode ser representado pela Equação 10.
Figure img0009
Nas Equações 7 a 10, M denota uma ordem de coeficientes LSF e M é normalmente 16 quando uma largura de banda de um sinal de fala de entrada é uma WB, e denota um coeficiente preditivo do método AR. Conforme descrito acima, informação com relação ao quadro imediatamente anterior é geralmente usada, e um esquema de quantização pode ser determinado mediante uso de um erro preditivo obtido a partir da descrição acima.
Além disso, para um caso onde a informação com relação a um quadro anterior não existe devido aos erros de quadro no quadro anterior, um segundo erro preditivo pode ser obtido mediante uso de um quadro imediatamente antes do quadro anterior, e um esquema de quantização pode ser determinado mediante uso do segundo erro preditivo. Nesse caso, o segundo erro preditivo pode ser representado pela Equação 11 abaixo em comparação com a Equação 7.
Figure img0010
O seletor de esquema de quantização 613 determina um esquema de quantização de um quadro atual mediante uso de pelo menos um o erro preditivo obtido pelo calculador de erro preditivo 611 e o modo de codificação obtido pelo determinador de modo de codificação (115 da Figura 1).
A Figura 7A é um fluxograma ilustrando uma operação do determinador de caminho de quantização da Figura 6, de acordo com uma modalidade exemplar. Como um exemplo, 0, 1, e 2 pode ser usado como um modo de predição. Em um modo de predição 0, apenas um esquema de segurança líquida pode ser usado e em um modelo de predição, apenas um esquema preditivo pode ser usado. Em um modo de predição 2, o esquema de segurança líquida e o esquema preditivo podem ser trocados.
Um sinal a ser codificado no modo de predição 0 tem uma característica não estacionária. Um sinal não estacionário tem uma grande variação entre quadros vizinhos. Portanto, se uma predição interquadro for realizada no sinal não estacionário, um erro de predição pode ser maior do que um sinal original, que resulta em deterioração no desempenho de um quantizador. Um sinal a ser codificado no modo de predição 1 tem uma característica estacionária. Como um sinal estacionário tem uma pequena variação entre quadros vizinhos, uma sua correlação interquadro é elevada. O desempenho ótimo pode ser obtido mediante realização em um modo de predição 2 de quantização de um sinal no qual uma característica não estacionária e uma característica estacionária são misturadas. Embora um sinal tenha uma característica não estacionária e uma característica estacionária, um modo de predição 0 ou um modo de predição 1 pode ser estabelecido, com base em uma razão de misturação. Entretanto, a razão de misturação a ser estabelecida em um modo de predição 2 pode ser definida antecipadamente como um valor ótimo experimentalmente ou através de simulações.
Com referência à Figura 7A, na operação 711, é determinado se um modo de predição de um quadro atual é 0, isto é, se um sinal de fala do quadro atual tem uma característica não estacionária. Como um resultado da determinação na operação 711, se o modo de predição for 0, por exemplo, quando variação do sinal de fala do quadro atual é grande como no modo TC ou no modo UC, uma vez que a predição interquadro é difícil, o esquema de segurança líquida, isto é, o primeiro esquema de quantização, pode ser determinado como um caminho de quantização na operação 714 .
Como um resultado da determinação na operação 711, se o modo de predição não for 0, é determinado na operação 712 se o modo de predição é 1, isto é, se um sinal de fala do quadro atual tem uma característica estacionária. Como um resultado da determinação na operação 712, se o modo de predição for 1, como o desempenho de predição interquadro é excelente, o esquema preditivo, isto é, o segundo esquema de quantização, pode ser determinado como o caminho de quantização na operação 715.
Como um resultado da determinação na operação 712, se o modo de predição não forma 1, é determinado que o modo de predição é 2 para utilizar o primeiro esquema de quantização e o segundo esquema de quantização em uma forma de comutação. Por exemplo, quando o sinal de fala do quadro atual não tem a característica não estacionária, isto é, quando um modo de predição é 2 no modo GC ou no modo VC, um do primeiro esquema de quantização e do segundo esquema de quantização pode ser determinado como o caminho de quantização considerando-se um erro preditivo. Para fazer isso, é determinado na operação 713 se um primeiro erro preditivo entre o quadro atual e o quadro anterior é maior do que um primeiro limiar. O primeiro limiar pode ser definido antecipadamente como um valor ótimo experimentalmente ou através de simulações. Por exemplo, em um caso de um WB tendo uma ordem de 16, o primeiro limiar pode ser ajustado para 2.085.975.
Como um resultado da determinação na operação 713, se o primeiro erro preditivo for maior do que ou igual ao primeiro limiar, o primeiro esquema de quantização pode ser determinado como o caminho de quantização na operação 714. Como um resultado da determinação na operação 713, se o primeiro erro preditivo não for maior do que o primeiro limiar, o esquema preditivo, isto é, o segundo esquema e a quantização podem ser determinados como o caminho de quantização na operação 715.
A Figura 7B é um fluxograma ilustrando uma operação do determinador do caminho de quantização da Figura 6, de acordo com outra modalidade exemplar.
Com referência à Figura 7B, as operações 731 a 733 são idênticas às operações 711 a 713 da Figura 7A, e operação 734 na qual um segundo erro preditivo entre um quadro imediatamente antes de um quadro anterior e um quadro atual a ser comparado com um segundo limiar é incluído adicionalmente. O segundo limiar pode ser definido antecipadamente como um valor ótimo experimentalmente ou através de simulações. Por exemplo, em um caso de uma WD tendo uma ordem de 16, o segundo limiar pode ser ajustado (o primeiro limiar xl.l).
Como um resultado da determinação na operação 734, se o segundo erro preditivo for maior do que ou igual ao segundo limiar, o esquema de segurança líquida, isto é, o primeiro esquema de quantização pode ser determinado como o caminho de quantização na operação 735. Como um resultado da determinação na operação 734, se o segundo erro preditivo não for maior do que o segundo limiar, o esquema preditivo, isto é, o segundo esquema de quantização pode ser determinado como o caminho de quantização na operação 736.
Embora o número de modos de predição seja 3 nas Figuras 7A e 7B, a presente invenção não é limitada a isso.
Entretanto, na determinação de um esquema de quantização, informação adicional pode ser usada adicionalmente além de um modo de predição ou de um erro de predição.
A Figura 8 é um diagrama de blocos de um determinador de caminho de quantização de acordo com uma modalidade exemplar. Com referência à Figura 8, o determinador de caminho de quantização 800 pode incluir um calculador de erro preditivo 811, um analisador de espectro 813 e um seletor de esquema de quantização 815.
Como o calculador de erro preditivo 811 é idêntico ao calculador de erro preditivo 611, da Figura 6, uma sua descrição detalhada é omitida.
O analisador de espectro 813 pode determinar as características de sinal de um quadro atual mediante análise de informação de espectro. Por exemplo, no analisador de espectro 813, uma distância ponderada D entre N (N é um número inteiro maior do que 1) quadros anteriores e o quadro atual pode ser obtida mediante uso de informação de magnitude espectral no domínio de frequência, e quando a distância ponderada é maior do que um limiar, isto é, quando for grande a variação interquadro, o esquema de segurança líquida pode ser determinado como o esquema de quantização. Como os objetos a serem comparados aumentam à medida que N aumenta, a complexidade aumenta à medida que N aumenta. A distância ponderada D pode ser obtida utilizando-se a Equação 12 abaixo. Para obter uma distância ponderada D com baixa complexidade, o quadro atual pode ser comparado com os quadros anteriores mediante uso apenas de magnitudes espectrais em torno de uma frequência definida por LSF/ISF. Nesse caso, um valor médio, um valor máximo ou um valor intermediário de magnitudes de M recipientes de frequência em torno da frequência definida por LSF/ISF podem ser comparados com os quadros anteriores.
Figure img0011
Na equação 12, uma função de ponderação Wk(i) pode ser obtida pela Equação 3 descrita acima e é idêntica a Wl(n) da Equação 3. Em Dn, n denota uma diferença entre um quadro anterior e um quadro atual. Um caso e n=l indica uma distância ponderada entre um quadro imediatamente anterior e um quadro atual, e um caso de n=2 indica uma distância ponderada entre um segundo quadro anterior e o quadro atual. Quando um valor de Dn é maior do que o limiar, pode ser determinado que o quadro atual tenha a característica não estacionária.
O seletor de esquema de quantização 815 pode determinar um caminho de quantização do quadro atual mediante recebimento de erros preditivos providos a partir do calculador de erro preditivo 811 e as características de sinal, um modo de predição, e informação de canal de transmissão provida a partir do analisador de espectro 813. Por exemplo, as prioridades podem ser designadas para a informação introduzida no seletor de esquema de quantização 815 para ser considerada seqüencialmente quando um caminho de quantização é selecionado. Por exemplo, quando um modo de Taxa de Erro de Quadro (FER) elevada é incluído na informação de canal de transmissão, uma razão de seleção de esquema de segurança líquida pode ser ajustada relativamente alta ou apenas o esquema de segurança líquida pode ser selecionado. A razão de seleção de esquema de segurança líquida pode ser definida de forma variável mediante ajuste de um limiar relacionado aos erros preditivos.
A Figura 9 ilustra informação com relação a um estado de canal que pode ser transmitido em uma extremidade de rede quando um serviço de codec é provido.
Quando o estado de canal é ruim, os erros de canal aumentam e, como resultado, a variação interquadro pode ser grande resultando em uma ocorrência de quadro. Assim, uma razão de seleção do esquema preditivo como um caminho de quantização é reduzida e uma razão de seleção do esquema de segurança líquida é aumentada. Quando o estado de canal é extremamente ruim, apenas o esquema de segurança líquida pode ser usado como o caminho de quantização. Para fazer isso, um valor indicando o estado de canal mediante combinação de uma pluralidade de peças de informação de canal de transmissão é expresso com um ou mais níveis. Um nível alto indica um estado no qual é alta uma probabilidade de um erro de canal. O caso mais simples é o caso onde o número de níveis é 1, isto é, um caso onde o estado de canal é determinado como modo FER alto por um determinador de modo FER alto 911, conforme mostrado na Figura 9. Como o modo FER alto indica que o estado de canal é muito instável, a codificação é realizada mediante uso da razão de seleção mais elevada do esquema de segurança líquida ou utilizando apenas o esquema de segurança líquida. Quando o número de níveis é plural, a razão de seleção do esquema de segurança líquida pode ser estabelecida nível por nível.
Com referência à Figura 9, um algoritmo de determinação do modo FER alto no determinador de modo FER alto 911 pode ser realizado através, por exemplo, de quatro peças de informação. Em detalhe, as quatro peças de informação podem ser (1) informação de Realimentação Rápida (FFB), que é uma realimentação de Solicitação de Repetição Automática Híbrida (HARQ) transmitida para uma camada física, (2) informação de Realimentação Lenta (SFB), que é realimentação a partir de sinalização de rede transmitida para uma camada superior à camada física, (3) informação de Realimentação em Banda (ISB), que é uma realimentação em banda sinalizada a partir de um decodificador EVS 913 em uma extremidade distante, e (4) informação de quadro de elevada sensibilidade (HSF), que é selecionada por um codificador EVS 915 com relação a um quadro crucial específico a ser transmitido de um modo redundante. Embora a informação FFB e a informação SFB sejam independentes para um codec EVS, a informação ISB e a informação HSF são dependentes para o codec EVS e podem demandar algoritmos específicos para o codec EVS. O algoritmo de determinação do estado de canal como o modo FER alto mediante uso das quatro peças de informação, pode ser expresso por intermédio, por exemplo, do código seguinte como tabelas 2-4. Tabela 2 Definições
Figure img0012
Tabela 3
Figure img0013
Tabela 4
Figure img0014
Como acima, o codec EVS pode ser ordenado para entrar no modo FER alto com base na informação de análise processada com uma ou mais das 4 peças de informação. A informação de análise pode ser, por exemplo, (1) SFBavg derivada de uma taxa média calculada de erro de Ns quadros mediante uso da informação SFB, (2) FFBavg derivada de uma taxa média calculada de erro de Nf quadros mediante uso da informação FFB, e (3) ISBavg derivada de uma taxa média calculada de erro e Ni quadros mediante uso da informação ISB e limiares Ts, Tf e Ti da informação SFB, a informação FFB e a informação ISB, respectivamente. Pode ser determinado que o codec EVS é determinado para entrar no modo FER alto com base em um resultado da comparação de SFBavg, FFBavg e ISBavg com os limiares Ts, Tf e Ti, respectivamente. Para todas as condições, HiOK em se cada codec suporta comumente o modo FER alto pode ser verificado.
O determinador de modo FER alto 911 pode ser incluído como um componente do codificador EVS 915 ou um codificador de outro formato. Alternativamente, o determinador de modo FER alto 911 pode ser implementado em outro dispositivo externo exceto o componente do codificador EVS 915 ou um codificador de outro formato.
A Figura 10 é um diagrama de blocos de um quantizador de coeficiente LPC 1000 de acordo com outra modalidade exemplar.
Com referência à Figura 10, o quantizador de coeficiente LPC 1000 pode incluir um determinador de caminho de quantização 1010, um primeiro esquema de quantização 1030, e um segundo esquema de quantização 1050.
O determinador de caminho de quantização 1010 determina um de um primeiro caminho incluindo o esquema de segurança líquida e um segundo caminho incluindo o esquema preditivo como um caminho de quantização de um quadro atual, com base em pelo menos um de um erro preditivo e um modo de codificação.
O primeiro esquema de quantização 1030 realiza quantização sem usar a predição interquadro quando o primeiro caminho é determinado como o caminho de quantização e pode incluir um Quantizador de Vetor de Multi-estágio (MSVQ) 1041 e um Quantizador de Vetor de Treliça (LVQ) 1043. O MSVQ 1041 pode incluir preferivelmente dois estágios. O MSVQ 1041 gera um índice de quantização mediante realização aproximadamente de quantização de vetor de coeficientes LSF a partir do qual um valor DC é removido. O LVQ 1043 gera um índice de quantização mediante realização da quantização mediante recebimento de erros de quantização LSF entre os coeficientes QLSF inversos emitidos a partir do MSVQ 1041 e os coeficientes LSF a partir dos quais um valor DC é removido. Os coeficientes QLSF finais são gerados mediante adição de uma saída do MSVQ 1041 e uma saída do LVQ 1043 e então adicionando um valor DC ao resultado da adição. O primeiro esquema de quantização 1030 pode implementar uma estrutura de quantizador muito eficiente mediante uso de uma combinação do MSVQ 1041 tendo excelente desempenho em uma baixa taxa de bits embora um tamanho grande de memória seja necessário para um livro de códigos, e o LVQ 1043 que é eficiente na taxa baixa de bits com um pequeno tamanho de memória e baixa complexidade.
O segundo esquema de quantização 1050 realiza quantização utilizando a predição interquadro quando o segundo caminho é determinado como o caminho de quantização e pode incluir um BC-TCQ 1063, o qual tem um preditor intraquadro 1065, e um preditor interquadro 1061. O preditor interquadro 1061 pode usar qualquer um do método AR e do método MA. Por exemplo, um método AR de primeira ordem é empregado. Um coeficiente preditivo é definido antecipadamente, e um vetor selecionado como um vetor ótimo em um quadro anterior é usado como um vetor passado para predição. Erros preditivos LSF obtidos a partir de valores preditivos do preditor interquadro 1061 são quantizados pelo BC-TCQ 1063 tendo o preditor intraquadro 1065. Consequentemente, uma característica do BC-TCQ 1063 tendo excelente desempenho de quantização com um pequeno tamanho de memória e baixa complexidade, em uma taxa alta de bits, pode ser maximizada.
Como resultado, quando o primeiro esquema de quantização 1030 e o segundo esquema de quantização 1050 são usados, um quantizador ótimo pode ser implementado em correspondência com as características de um sinal de fala de entrada.
Por exemplo, quando 41 bits são usados no quantizador de coeficiente LPC 1000 para quantizar um sinal de fala no modo GC com uma WB de 8-KHz, 12 bits e 28 bits podem ser alocados ao MSVQ 1041 e ao LVQ 1043 do primeiro esquema de quantização 1030, respectivamente, exceto para 1 bit indicando informação de caminho de quantização. Além disso, 40 bits podem ser alocados ao BC-TCQ 1063 do segundo esquema de quantização 1050 exceto por 1 bit indicando informação de caminho de quantização.
A Tabela 5 mostra um exemplo no qual os bits são alocados a um sinal de fala de WB de uma banda de 8-KHz. Tabela 5
Figure img0015
A Figura 11 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar. O quantizador de coeficiente LPC 1100 5 mostrado na Figura 11 tem uma estrutura oposta àquela mostrada na Figura 10.
Com referência à Figura 11, o quantizador de coeficiente LPC 1100 pode incluir um determinador de caminho de quantização 1110, um primeiro esquema de 10 quantização 1130, e um segundo esquema de quantização 1150.
O determinador de caminho de quantização 1110 determina um de um primeiro caminho incluindo o esquema de segurança líquida e um segundo caminho incluindo o esquema preditivo como um caminho de quantização de um quadro 15 atual, com base em pelo menos um de um erro preditivo e de um modo de predição.
O primeiro esquema de quantização 1130 realiza quantização sem usar a predição interquadro quando o primeiro caminho é selecionado como o caminho e quantização e pode incluir um Quantizador de Vetor (VQ) 1141 e um DC- TCQ 1143 tendo um preditor intraquadro 1145. O VQ 1141 gera um índice de quantização mediante realização aproximadamente de quantização de vetor de coeficientes LSF a partir dos quais um valor DC é removido. O BC-TCQ 1143 gera um índice de quantização mediante realização de quantização através do recebimento de erros de quantização LSF entre coeficientes QLSF inversos emitidos a partir do VQ 1141 e os coeficientes LSF a partir dos quais um valor DC é removido. OS coeficientes QLSF finais são gerados mediante adição de uma saída do VQ 1141 e uma saída do BC- TCQ 1143 e então adicionando um valor DC ao resultado da adição.
O segundo esquema de quantização 1150 realiza quantização utilizando a predição interquadro quando o segundo caminho é determinado como o caminho de quantização e pode incluir um LVQ 1163 e um preditor interquadro 1161. O preditor interquadro 1161 pode ser implementado do mesmo modo como, ou similar àquele na Figura 10. Erros preditivos LSF obtidos a partir de valores preditivos do preditor interquadro 1161 são quantizados pelo LVQ 1163.
Consequentemente, como o número de bits alocados ao BC-TCQ 1143 é pequeno, o BC-TCQ 1143 tem baixa complexidade, e como o LVQ 1163 tem baixa complexidade em
uma alta taxa de bits, a quantização pode ser realizada geralmente com baixa complexidade.
Por exemplo, quando 41 bits são usados no quantizador de coeficiente LPC 1100 para quantizar um sinal 5 de fala no modo GC com uma WB de 8-KHz, 6 bits e 34 bits podem ser alocados ao VQ 1141 e ao BC-TCQ 1143 do primeiro esquema de quantização 1130, respectivamente, exceto para 1 bit indicando informação de caminho de quantização. Além disso, 4 0 bits podem ser alocados ao LVQ 1163 do segundo 10 esquema de quantização 1150 exceto para 1 bit indicando informação de caminho de quantização.
A Tabela 6 mostra um exemplo nos quais bits são alocados a um sinal de fala de WB de uma banda de 8-KHz. Tabela 6
Figure img0016
Um índice opcional relacionado ao VQ 1141 usado na maioria dos modos de codificação pode ser obtido mediante busca por um índice para minimizar Ewerr(p) da Equação 13.
Figure img0017
Na Equação 13, w(i) denota uma função de ponderação determinada no determinador de função de ponderação (313 da
Figura 3), r(i) denota uma entrada do VQ 1141, e c(i) denota uma saída do VQ 1141. Isto é, um índice para minimizar distorção ponderada entre r(i) e c(i) é obtido.
Uma medida de distorção d(x, y) usada no BC-TCQ 1143 pode ser representada pela Equação 14.
Figure img0018
De acordo com uma modalidade exemplar, a distorção ponderada pode ser obtida mediante aplicação de uma função de ponderação wk à medida de distorção d(x, y) conforme representado pela Equação 15.
Figure img0019
Isto é, um índice ótimo pode ser obtido mediante obtenção de distorção ponderada em todos os estágios do BC- TCQ 1143.
A Figura 12 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar.
Com referência à Figura 12, o quantizador de coeficiente LPC 1200 pode incluir um determinador de caminho de quantização 1210, um primeiro esquema de quantização 1230, e um segundo esquema de quantização 1250.
O determinador de caminho de quantização 1210 determina um de um primeiro caminho incluindo o esquema de segurança líquida e um segundo caminho incluindo o esquema preditivo como um caminho de quantização de um quadro atual, com base em pelo menos um de um erro preditivo e um modo de predição.
O primeiro esquema de quantização 1230 realiza quantização sem usar a predição interquadro quando o primeiro caminho é determinado como o caminho de quantização e pode incluir um VQ ou MSVQ 1241 e um LVQ ou TCQ 1243. 0 VQ ou MSVQ 1241 gera um índice de quantização mediante realização aproximadamente de quantização de vetor de coeficientes LSF a partir dos quais um valor DC é removido. O LVQ ou TCQ 124 3 gera um índice de quantização mediante realização da quantização através do recebimento de erros de quantização LSF entre coeficientes QLSF inversos emitidos a partir do VQ 1141 e os coeficientes LSF a partir dos quais um valor DC é removido. Coeficientes QLSF finais são gerados mediante adição de uma saída do VQ ou MSVQ 1241 e uma saída do LVQ do TCQ 124 3 e então adicionando um valor de DC ao resultado da adição. Como o VQ ou MSVQ 1241 tem uma boa taxa de erros de bits embora o VQ ou MSVQ 1241 tenha elevada complexidade e utilize uma grande quantidade de memória, o número de estágios do VQ ou MSVQ 1241 pode aumentar de 1 para n considerando-se a complexidade global. Por exemplo, quando apenas um primeiro estágio é usado, o VQ ou MSVQ 1241 se torna um VQ, e quando dois ou mais estágios são usados, o VQ ou MSVQ 1241 se torna um MSVQ. Além disso, como o LVQ ou TCQ 1243 tem baixa complexidade, os erros de quantização LSF podem ser eficientemente quantizados.
O segundo esquema de quantização 1250 realiza quantização utilizando a predição interquadro quando o segundo caminho é determinado como o caminho de quantização e pode incluir um preditor interquadro 1261 e um LVQ ou TCQ 1263. O preditor interquadro 1261 pode ser implementado do mesmo modo como ou similar àquele na Figura 10. Erros preditivos LSF obtidos a partir de valores preditivos do preditor interquadro 1261 são quantizados pelo LVQ ou TCQ 1263. Similarmente, como o LVQ ou TCQ 1243 tem baixa complexidade, os erros preditivos LSF podem ser eficientemente quantizados. Consequentemente, a quantização pode ser realizada geralmente com baixa complexidade.
A Figura 13 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar.
Com referência à Figura 13, o quantizador de coeficiente LPC 1300 pode incluir um determinador de caminho de quantização 1310, um primeiro esquema de quantização 1030, e um segundo esquema de quantização 1350.
O determinador de caminho de quantização 1310 determina um de um primeiro caminho incluindo o esquema de segurança líquida e um segundo caminho incluindo o esquema preditivo como um caminho de quantização de um quadro atual, com base em ao menos um de um erro preditivo e de um modo de predição.
O primeiro esquema de quantização 1330 realiza quantização sem usar a predição interquadro quando o primeiro caminho é determinado como o caminho de quantização, e como o primeiro esquema de quantização 1330 é o mesmo daquele mostrado na Figura 12, uma descrição do mesmo é omitida.
O segundo esquema de quantização 1350 realiza quantização utilizando a predição interquadro quando o segundo caminho é determinado como o caminho de quantização e pode incluir um preditor interquadro 1361, um VQ ou MSVQ 1363, e um LVQ ou TCQ 1365. O preditor interquadro 1361 pode ser implementado da mesma forma como, ou similar àquela na Figura 10. Os erros preditivos LSF obtidos utilizando valores preditivos do preditor interquadro 1361 são aproximadamente quantizados pelo VQ ou MSVQ 1363. Um vetor de erro entre os erros preditivos LSF e os erros preditivos LSF dequantizados emitidos a partir do VQ ou MSVQ 1363 é quantizado pelo LVQ ou TCQ 1365. Similarmente, como o LVQ ou TCQ 13 65 tem baixa complexidade, os erros preditivos LSF podem ser quantizados eficientemente. Consequentemente, a quantização pode ser realizada geralmente com baixa complexidade.
A Figura 14 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar. Em comparação com o quantizador de coeficiente LPC 1200 mostrado na Figura 12, o quantizador de coeficiente LPC 1400 tem uma diferença em que um primeiro esquema de quantização 1430 inclui um BC-TCQ 1443 tendo um preditor intraquadro 1445 em vez do LVQ ou TCQ 1243, e um segundo esquema de quantização 1450 inclui um BC-TCQ 1463 tendo um preditor intraquadro 1465 em vez do LVQ ou TCQ 1263.
Por exemplo, quando 41 bits são usados no quantizador de coeficiente LPC 1400 para quantizar um sinal de fala no modo GC com uma WB de 8 KHz, 5 bits e 3 5 bits podem ser alocados a um VQ 1441 e ao BC-TCQ 1443 do primeiro esquema de quantização 1430, respectivamente, exceto por 1 bit indicando informação de caminho de quantização. Além disso, 40 bits podem ser alocados ao BC- TCQ 1463 do segundo esquema de quantização 1460 exceto por 1 bit indicando informação de caminho de quantização.
A Figura 15 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar. 0 quantizador de coeficiente LPC 1500 mostrado na Figura 15 é um exemplo concreto do quantizador de coeficiente LPC 1300 mostrado na Figura 13, em que um MSVQ 1541 de um primeiro esquema de quantização 153 0 e um MSVQ 1563 de um segundo esquema de quantização 1550 tem dois estágios.
Por exemplo, quando 41 bits são usados no quantizador de coeficiente LPC 1500 para quantizar um sinal de fala no modo GC com uma WB de 8-KHz, 6 + 6 = 12 bits e 28 bits podem ser alocados ao MSVQ de dois estágios 1541 e um LVQ 1543 do primeiro esquema de quantização 1530, respectivamente, exceto para 1 bit indicando informação de caminho de quantização. Além disso, 5 + 5 = 10 bits e 30 bits podem ser alocados ao MSVQ de dois estágios 1563 e um LVQ 1565 do segundo esquema de quantização 1550, respectivamente.
As Figuras 16A e 16B são diagramas de bloco dos quantizadores de coeficiente LPC de acordo com outras modalidades exemplares. Especificamente, os quantizadores de coeficiente LPC 1610 e 1630 mostrados nas Figuras 16A e 16B, respectivamente, podem ser usados para formar o esquema de segurança líquida, isto é, o primeiro esquema de quantização.
O quantizador de coeficiente LPC 1610 mostrado na Figura 16A pode incluir um VQ 1621 e um TCQ ou BC-TCQ 1623 tendo um preditor intraquadro 1625 e o quantizador de coeficiente LPC 1630 mostrado na Figura 16B pode incluir um VQ ou MSVQ 1641 e um TCQ ou LVQ 1643.
Com referência às Figuras 16A e 16B, o VQ 1621 ou o VQ ou MSVQ 1641 quantiza aproximadamente o vetor de entrada inteiro com um pequeno número de bits, e o TCQ ou BC-TCQ 1623 ou o TCQ ou LVQ 1643 quantiza precisamente os erros de quantização LSF.
Quando apenas o esquema de segurança líquida, isto é, o primeiro esquema de quantização é usado para cada quadro, um método de Algoritmo Viterbi de lista (LVA) pode ser aplicado para aperfeiçoamento adicional de desempenho. Isto é, como há espaço em termos de complexidade em comparação com um método de comutação quando apenas o primeiro esquema de quantização é usado, o método LVA obtendo o aperfeiçoamento de desempenho mediante aumento de complexidade em uma operação de busca pode ser empregado. Por exemplo, mediante aplicação do método LVA a um BC-TCQ, pode ser estabelecido de modo que a complexidade de uma estrutura LVA seja inferior à complexidade de uma estrutura de comutação embora aumente a complexidade da estrutura LVA.
As Figuras 17A a 17C são diagramas de blocos de quantizadores de coeficiente LPC de acordo com outras modalidades exemplares, que tem particularmente uma estrutura de um BC-TCQ utilizando uma função de ponderação.
Com referência à Figura 17A, o quantizador de coeficiente LPC pode incluir um determinador de função de ponderação 1710 e um esquema de quantização 1720 incluindo um BC-TCQ 1721 tendo um preditor intraquadro 1723.
Com referência à Figura 17B, o quantizador de coeficiente LPC pode incluir um determinador de função de ponderação 1730 e um esquema de quantização 1740 incluindo um BC-TCQ 1743, o qual tem um preditor intraquadro 1745, e um preditor interquadro 1741. Aqui, 40 bits podem ser alocados ao BC-TCQ 1743.
Com referência à Figura 17C, o quantizador de coeficiente LPC pode incluir um determinador de função de ponderação 1750 e um esquema de quantização 1760 incluindo um BC-TCQ 1763, o qual tem um preditor intraquadro 1765, e um VQ 1761. Aqui, 5 bits e 50 bits podem ser alocados ao VQ 1761 e ao BC-TCQ 1763, respectivamente.
A Figura 18 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar.
Com referência à Figura 18, o quantizador de coeficiente LPC 1800 pode incluir um primeiro esquema de quantização 1810, um segundo esquema de quantização 1830, e um determinador de caminho de quantização 1850.
O primeiro esquema de quantização 1810 realiza quantização sem usar a predição interquadro e pode usar uma combinação de um MSVQ 1821 e de um LVQ 1823 para aperfeiçoamento de desempenho de quantização. O MSVQ 1821 pode incluir preferivelmente dois estágios. O MSVQ 1821 gera um índice de quantização por intermédio de realização aproximadamente de quantização de vetor dos coeficientes LSF a partir dos quais um valor DC é removido. O LVQ 1823 gera um índice de quantização mediante realização da quantização por intermédio do recebimento de erros de quantização LSF entre coeficientes QLSF inversos emitidos a partir do MSVQ 1821 e os coeficientes LSF a partir dos quais um valor DC é removido. Coeficientes QLSF finais são gerados mediante adição de uma saída do MSVQ 1821 e uma saída do LVQ 1823 e então adicionando um valor ao resultado da adição. O primeiro esquema de quantização 1810 pode implementar uma estrutura de quantizador muito eficiente mediante uso de uma combinação do MSVQ 1821 tendo excelente desempenho em uma baixa taxa de bits e o LVQ 1823 que é eficiente na baixa taxa de bits.
O segundo esquema de quantização 1830 realiza quantização utilizando a predição interquadro e pode incluir um BC-TCQ 1843, o qual tem um preditor de intraquadro 1845, e um preditor interquadro 1841. Os erros preditivos LSF obtidos utilizando valores preditivos do preditor interquadro 1841 são quantizados pelo BC-TCQ 1843 tendo o preditor intraquadro 1845. Consequentemente, uma característica do BC-TCQ 1843 tendo excelente desempenho de quantização em uma alta taxa de bits pode ser maximizada.
O determinador de caminho de quantização 1850 determina um de uma saída do primeiro esquema de quantização 1810 e uma saída do segundo esquema de quantização 1830 como uma quantização final emitida mediante consideração de um modo de predição e de uma distorção ponderada.
Como resultado, quando o primeiro esquema de quantização 1810 e o segundo esquema de quantização 1830 são usados, um quantizador ótimo pode ser implementado em correspondência com características de um sinal de fala de 5 entrada. Por exemplo, quando 43 bits são usados no quantizador de coeficiente LPC 1800 para quantizar um sinal de fala no modo VC com uma WD de 8-KHz, 12 bits e 3 0 bits podem ser alocados ao MSVQ 1821 e ao LVQ 1823 do primeiro esquema de quantização 1810, respectivamente, exceto para 1 10 bit indicando informação de percurso de quantização. Além disso, 42 bits podem ser alocados ao BC-TCQ 1843 do segundo esquema de quantização 1830 exceto por 1 bit indicando informação de caminho de quantização.
A Tabela 7 mostra um exemplo no qual os bits são 15 alocados a um sinal de fala de WB de uma banda de 8-KHz. Tabela 7
Figure img0020
A Figura 19 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar.
Com referência à Figura 19, o quantizador de coeficiente LPC 1900 pode incluir um primeiro esquema de quantização 1910, um segundo esquema de quantização 1930, e um determinador de caminho de quantização 1950.
O primeiro esquema de quantização 1910 realiza quantização sem usar a predição interquadro e pode usar uma combinação de um VQ 1921 e um BC-TCQ 1923 tendo um preditor intraquadro 1925 para aperfeiçoamento de desempenho de quantização.
O segundo esquema de quantização 1930 realiza quantização utilizando predição interquadro e pode incluir um BC-TCQ 1943, o qual tem um preditor intraquadro 1945, e um preditor interquadro 1941.
O determinador de caminho de quantização 1950 determina um caminho de quantização mediante recebimento de um modo de predição e distorção ponderada utilizando valores otimamente quantizados obtidos pelo primeiro esquema de quantização 1910 e pelo segundo esquema de quantização 1930. Por exemplo, é determinado se um modo de predição de um quadro atual é 0, isto é, se um sinal de fala do quadro atual tiver uma característica não estacionária. Quando variação do sinal de fala do quadro atual é grande como no modo TC ou no modo UC, uma vez que a predição interquadro é difícil, o esquema de segurança líquida, isto é, o primeiro esquema de quantização 1910, é sempre determinado como o caminho de quantização.
Se o modo de predição do quadro atual for 1, isto é, se o sinal de fala do quadro atual estiver no modo GC ou no modo VC não tendo a característica não estacionária, o determinador de caminho de quantização 1950 determina um dentre o primeiro esquema de quantização 1910 e o segundo esquema de quantização 1930 como o caminho de quantização mediante consideração dos erros preditivos. Para fazer isso, distorção ponderada no primeiro esquema de quantização 1910 é considerada em primeiro lugar de modo que o quantizador de coeficiente LPC 1900 é robusto para erros de quadro. Isto é, se um valor de distorção ponderado do primeiro esquema de quantização 1910 for menor do que um limiar predefinido, o primeiro esquema de quantização 1910 é selecionado independentemente de um valor de distorção ponderado do segundo esquema de quantização 1930. Além disso, em vez de uma simples seleção de um esquema de quantização tendo um valor de distorção menos ponderado, o primeiro esquema de quantização 1910 é selecionado mediante consideração dos erros de quadro em um caso do mesmo valor de distorção ponderado. Se o valor de distorção ponderado do primeiro esquema de quantização 1910 for um determinado número de vezes maior do que o valor de distorção ponderado do segundo esquema de quantização 1930, o segundo esquema de quantização 1930 pode ser selecionado. O número determinado de vezes pode ser, por exemplo, estabelecido para 1.15. Como tal, quando o percurso de quantização é determinado, um índice de quantização gerado por um esquema de quantização do caminho de quantização determinado é transmitido.
Mediante consideração de que o número de modos de predição é 3, o mesmo pode ser implementado para selecionar o primeiro esquema de quantização 1910 quando o modo de predição for 0, selecionando o segundo esquema de quantização 1930 quando o modo de predição for 1, e selecionando um dentre o primeiro esquema de quantização 1910 e o segundo esquema de quantização 1930 quando o modo de predição for 2, como o caminho de quantização.
Por exemplo, quando 3 7 bits são usados no quantizador de coeficiente LPC 1900 para quantizar um sinal de fala no modo GC com uma WB de 8-KHz, 2 bits e 34 bits podem ser alocados ao VQ 1921 e ao BC-TCQ 1923 do primeiro esquema de quantização 1910, respectivamente, exceto para 1 bit indicando informação de caminho de quantização. Além disso, 36 bits podem ser alocados ao BC-CQ 1943 do segundo esquema de quantização 1930 exceto para 1 bit indicando informação de caminho de quantização. A Tabela 8 mostra um exemplo no qual os bits são alocados a um sinal de fala WD de uma banda de 8-KHz. Tabela 8
Figure img0021
A Figura 2 0 é um diagrama de blocos de um quantizador de coeficiente LPC de acordo com outra modalidade exemplar.
Com referência à Figura 20, o quantizador de coeficiente LPC 2000 pode incluir um primeiro esquema de quantização 2010, um segundo esquema de quantização 2030, e um determinador de caminho de quantização 2050.
O primeiro esquema de quantização 2010 realiza quantização sem usar a predição interquadro e pode usar uma combinação de um VQ 2021 e um BC-TCQ 2023 tendo um preditor intraquadro 2025 para aperfeiçoamento de desempenho de quantização.
O segundo esquema de quantização 2030 realiza quantização utilizando a predição interquadro e pode incluir um LVQ 2043 e um preditor interquadro 2041.
O determinador de caminho de quantização 2050 determina um caminho de quantização mediante recebimento de um modo de predição e distorção ponderada usando valores otimamente quantizados obtidos pelo primeiro esquema de quantização 2010 e pelo esquema de quantização 2030.
Por exemplo, quando 4 3 bits são usados no quantizador de coeficiente LPC 2000 para quantizar um sinal de fala no modo VC com uma WD de 8 KHz, 6 bits e 3 6 bits podem ser alocados ao VQ 2021 e ao BC-TCQ 2023 do primeiro esquema de quantização 2010, respectivamente, exceto para 1 bit indicando informação de caminho de quantização. Além disso, 4 2 bits podem ser alocados ao LVQ 204 3 do segundo esquema de quantização 2030 exceto para 1 bit indicando informação de caminho de quantização. A Tabela 9 mostra um exemplo no qual os bits são alocados a um sinal de fala WB de uma banda de 8-KHz. Tabela 9
Figure img0022
A Figura 21 é um diagrama de blocos do seletor de tipo de quantizador de acordo com uma modalidade exemplar.
O seletor de tipo de quantizador 2100 mostrado na Figura 21 pode incluir um determinador de taxa de bits 2110, um determinador de largura de banda 2130, um determinador de frequência de amostragem interna 2150 e um determinador de tipo de quantizador 2107. Cada um dos componentes pode ser implementado por intermédio de pelo menos um processador (por exemplo, uma unidade de processamento central (CPU)) pelo fato de ser integrado em ao menos um módulo. 0 seletor de tipo de quantizador 2100 pode ser usado em um modo de predição 2 no qual dois esquemas de quantização são comutados. O seletor de tipo de quantizador 2100 pode ser incluído como um componente do quantizador de coeficiente LPC 117 do aparelho de codificação 100 da Figura 1 ou um componente do aparelho de codificação de som 100 da Figura 1.
Com referência à Figura 21, o determinador de taxa de bits 2110 determina uma taxa de bits de codificação de um sinal de fala. A taxa de bits de codificação pode ser determinada para todos os quadros ou em uma unidade de quadros. Um tipo de quantizador pode ser alterado dependendo da taxa de bits de codificação.
O determinador de largura de banda 2130 determina uma largura de banda do sinal de fala. 0 tipo de quantizador pode ser alterado dependendo da largura de banda do sinal de fala.
O determinador de frequência de amostragem interna 2150 determina uma frequência de amostragem interna com base em um limite superior de uma largura de banda usada em um quantizador. Quando a largura de banda do sinal de fala é igual ou maior do que uma WB, isto é, a WB, uma SWB ou uma FB, a frequência de amostragem interna varia de acordo com o fato de se o limite superior da largura de banda de codificação é de 6.4 KHz ou 8 KHz. Se o limite superior da largura de banda de codificação for de 6.4 KHz, a frequência de amostragem interna é e 12.8 KHz, e se o limite superior da largura de banda de codificação for de 8 KHz, a frequência de amostragem interna é de 16 KHz. O limite superior da largura de banda de codificação não é limitado a isso.
O determinador de tipo de quantizador 2107 seleciona um de um laço aberto e um laço fechado como o tipo de quantizador mediante recebimento de uma saída do determinador de taxa de bits 2110, uma saída do determinador de largura de banda 2130, e uma saída do determinador de frequência de amostragem interna 2150. 0 determinador de tipo de quantizador 2107 pode selecionar o laço aberto como o tipo de quantizador quando a taxa de bits de codificação é maior do que um valor de referência predeterminado, a largura de banda do sinal de voz é igual ou mais amplo do que a WB, e a frequência de amostragem interna é de 16 KHz. De outro modo, o circuito fechado pode ser selecionado como o tipo de quantizador.
A Figura 22 é um fluxograma ilustrando um método de selecionar um tipo de quantizador, de acordo com uma modalidade exemplar.
Com referência à Figura 22, na operação 2201, é determinado se uma taxa de bits é maior do que um valor de referência. O valor de referência é estabelecido em 16.4 Kbps na Figura 22, mas não é limitado a isso. Como resultado da determinação na operação 2201, se a taxa de bits for igual ou menor do que o valor de referência, o tipo de laço fechado é selecionado na operação 2209.
Como um resultado da determinação na operação 2201, se a taxa de bits for maior do que o valor de referência é determinado na operação 22 03 se o uma largura de banda de um sinal de entrada é maior do que uma NB. Como um resultado da determinação na operação 2203, se a largura de banda do sinal de entrada é a NB, o tipo de laço fechado é selecionado na operação 2209.
Como um resultado da determinação na operação 2203, se a largura de banda do sinal de entrada for mais ampla do que a NB, isto é, se a largura de banda do sinal de entrada for uma WB, uma SWB ou uma FB é determinado na operação 2205 se uma frequência de amostragem interna é certa frequência. Por exemplo, na Figura 22 a certa frequência é definida como 16 KHz. Como um resultado da determinação na operação 2205, se a frequência de amostragem interna não for a frequência de referência determinada, o tipo de laço fechado é selecionado na operação 2209.
Como um resultado da determinação na operação 2205, se a frequência de amostragem interna for de 16 KHz, um tipo de laço aberto ê selecionado na operação 2207.
A Figura 23 é um diagrama de blocos de um aparelho de decodif icação de som de acordo com uma modalidade exemplar.
Com referência à Figura 23, o aparelho de decodificação de som 2300 pode incluir um decodificador de parâmetro 2311, um dequantizador de coeficiente LPC 2313, um decodif icador de modo variável 2315, e um pós- processador 2319. O aparelho de decodificação de som 2300 pode incluir ainda um restaurador de erro 2317. Cada um dos componentes do aparelho de decodificação de som 2300 pode ser implementado por intermédio de pelo menos um processador (por exemplo, uma unidade de processamento central (CPU)) pelo fato de ser integrado em pelo menos um módulo.
O decodificador de parâmetro 2311 pode decodificar os parâmetros a serem usados para decodificação a partir de um fluxo de bits. Quando um modo de codificação é incluído no fluxo de bits, o decodificador de parâmetro 2311 pode decodificar o modo de codificação e os parâmetros correspondendo ao modo de codificação. A dequantização de coeficiente LPC e decodificação de excitação podem ser realizadas em correspondência com o modo de codificação decodificado.
O dequantizador de coeficiente LPC 2313 pode gerar coeficientes LSF decodificado mediante dequantização dos coeficientes ISF ou LSF quantizados, erros de quantização ISF ou LSF quantizados ou erros preditivos ISF ou LSF quantizados incluídos nos parâmetros LPC e gerar coeficientes LPC mediante conversão dos coeficientes LSF decodificados.
O decodificador de modo variável 2315 pode gerar um sinal sintetizado mediante decodificação dos coeficientes LPC gerados pelo dequantizador de coeficiente LPC 2313. O decodificador de modo variável 2315 pode realizar a decodificação em correspondência com os modos de codificação como mostrado nas Figuras 2A a 2D de acordo com aparelhos de codificação correspondendo aos aparelhos de decodificação.
O restaurador de erro 2317, se incluído, pode restaurar ou cancelar um quadro atual de um sinal de fala quando erros ocorrem no quadro atual como um resultado da decodificação do decodificador de modo variável 2315.
O pós-processador (por exemplo, uma unidade de processamento central (CPU)) 2319 pode gerar um sinal sintetizado final, isto é, um som restaurado, mediante realização de vários tipos de filtração e processamento de aperfeiçoamento de qualidade de fala do sinal sintetizado gerado pelo decodificador de modo variável 2315.
A Figura 24 é um diagrama de blocos de um dequantizador de coeficiente LPC de acordo com uma modalidade exemplar.
Com referência à Figura 24, o dequantizador de coeficiente LPC 2400 pode incluir um dequantizador ISF/LSF 2411 e um conversor de coeficiente 2413.
O dequantizador ISF/LSF 2411 pode gerar coeficientes ISF ou LSF decodificados mediante dequantização dos coeficientes ISF ou LSF quantizados, erros de quantização ISF ou LSF quantizados, ou erros preditivos ISF ou LSF quantizados incluídos nos parâmetros LPC em correspondência com informação de caminho de quantização incluída em um fluxo de bits.
O conversor de coeficiente 2413 pode converter os coeficientes ISF ou LSF decodificados obtidos como um resultado da dequantização por intermédio do dequantizador ISF/LSF 2411 para Pares Espectrais de Imitanciometria (ISPs) ou Pares Espectrais Lineares (LSPs) e realizar interpolação para cada subquadro. A interpolação pode ser realizada mediante uso de ISPs/LSPs de um quadro anterior e ISPs/LSPs de um quadro atual. O conversor de coeficiente 2413 pode converter os ISPs/LSPs dequantizados e interpolados de cada subquadro para coeficientes LSP.
A Figura 25 é um diagrama de blocos de um dequantizador de coeficiente LPC de acordo com outra modalidade exemplar.
Com referência à Figura 25, o dequantizador de coeficiente LPC 2500 pode incluir um determinador de caminho de dequantização 2511, um primeiro esquema de dequantização 2513, e um segundo esquema de dequantização 2515 .
O determinador de caminho de dequantização 2511 pode prover parâmetros LPC a um do primeiro esquema de dequantização 2513 e do segundo esquema de dequantização 2515 com base na informação de caminho de quantização incluída em um fluxo de bits. Por exemplo, a informação de caminho de quantização pode ser representada por 1 bit.
O primeiro esquema de dequantização 2513 pode incluir um elemento para dequantizar aproximadamente os parâmetros LPC e um elemento para dequantizar com exatidão os parâmetros LPC.
O segundo esquema de dequantização 2515 pode incluir um elemento para realizar Dequantização Codificada em Trellis Restrito em Bloco e um elemento preditivo interquadro com relação aos parâmetros LPC.
O primeiro esquema de dequantização 2513 e o segundo esquema de dequantização 2515 não são limitados à modalidade exemplar atual e podem ser implementados mediante uso de processos inversos do primeiro e do segundo esquema de quantização; as modalidades exemplares descritas acima de acordo com os aparelhos de codificação correspondendo aos aparelhos de decodificação.
Uma configuração do dequantizador de coeficiente LPC 2500 pode ser aplicada independentemente de se um método de quantização é um tipo de laço aberto ou um tipo de laço fechado.
A Figura 26 é um diagrama de blocos do primeiro esquema de dequantização 2513 e do segundo esquema de dequantização 2515 no dequantizador de coeficiente LPC 2500 da Figura 25, de acordo com uma modalidade exemplar.
Com referência à Figura 26, um primeiro esquema de dequantização 2610 pode incluir um Quantizador de Vetor de Multi-estágio (MSVQ) 2611 para dequantizar os coeficientes LSF quantizados incluídos nos parâmetros LPC por intermédio do uso de um primeiro índice de livro de códigos gerado por um MSVQ (não mostrado) de uma extremidade de codificação (não mostrada) e um Quantizador de Vetor de Treliça (LVQ) 2613 para dequantizar os erros de quantização LSF incluídos nos parâmetros LPC mediante uso de um segundo índice de livro de códigos gerado por um LVQ (não mostrado) da extremidade de codificação. Os coeficientes LSF decodificados são gerados mediante adição dos coeficientes LSF dequantizados obtidos pelo MSVQ 2611 e os erros de quantização LSF dequantizados obtidos pelo LVQ 2613 e então adicionando um valor médio, o qual é um valor DC predeterminado, ao resultado de adição.
Um segundo esquema de dequantização 2630 pode incluir um quantizador de treliça codificada de bloco restrito (BC-TCQ) 2631 para dequantizar os erros preditivos LSF incluídos nos parâmetros LPC mediante uso de um terceiro índice de livro de códigos gerado por um BC-TCQ (não mostrado) da extremidade de codificação, um preditor intraquadro 2633, e um preditor interquadro 2635. O processo de dequantização começa a partir do vetor mais baixo dentre os vetores LSF, e o preditor intraquadro 2633 gera um valor preditivo para um elemento de vetor subsequente mediante uso de um vetor decodificado. O preditor interquadro 2635 gera valores preditivos através de predição interquadro mediante uso de coeficientes LSF decodificados em um quadro anterior. Coeficientes LSF decodificados, finais são gerados mediante adição dos coeficientes LSF obtidos pelo BC-TCQ 2631 e preditor intraquadro 2633 e os valores preditivos gerados pelo preditor interquadro 2635 e então adicionando um valor médio, o qual é um valor DC predeterminado, ao resultado de adição.
O primeiro esquema de dequantização 2610 e o segundo esquema de dequantização 2630 não são limitados à modalidade exemplar atual e podem ser implementados mediante uso de processos inversos do primeiro e segundo esquemas de quantização das modalidades exemplares descritas acima de acordo com os aparelhos de codificação correspondendo aos aparelhos de decodificação.
A Figura 27 é um fluxograma ilustrando um método de quantização de acordo com uma modalidade exemplar.
Com referência à Figura 27, na operação 2710, um caminho de quantização de um som recebido é determinado com base em um critério predeterminado antes da quantização do som recebido. Em uma modalidade exemplar, um de um primeiro caminho não usando predição interquadro e um segundo caminho usando a predição interquadro pode ser determinado.
Na operação 2730, um caminho de quantização determinado dentre o primeiro caminho e o segundo caminho é verificado.
Se o primeiro caminho for determinado como o caminho de quantização como um resultado da verificação na operação 2730, o som recebido é quantizado utilizando um primeiro esquema de quantização na operação 2750.
Por outro lado, se o segundo caminho for determinado como o caminho de quantização como um resultado da verificação na operação 2730, o som recebido é quantizado utilizando um segundo esquema de quantização na operação 2770.
O processo de determinação de caminho de quantização na operação 2710 pode ser realizado através de várias modalidades exemplares descritas acima. Os processos de quantização nas operações 2750 e 2770 podem ser realizados mediante uso das várias modalidades exemplares descritas acima e primeiro e segundo esquemas de quantização, respectivamente.
Embora o primeiro e o segundo caminho sejam definidos como caminhos de quantização selecionáveis na modalidade exemplar atual, vários caminhos, incluindo o primeiro e o segundo caminho, podem ser estabelecidos, e o fluxograma da Figura 27 pode ser mudado em correspondência com a pluralidade de caminhos estabelecidos.
A Figura 28 é um fluxograma ilustrando um método de dequantização de acordo com uma modalidade exemplar.
Com referência à Figura 28, na operação 2810, os parâmetros LPC incluídos em um fluxo de bits são decodificados.
Na operação 2830, um caminho de quantização incluído no fluxo de bits é verificado, e é determinado na operação 2850 se o caminho de quantização verificado é um primeiro caminho ou um segundo caminho.
Se o caminho de quantização for o primeiro caminho como um resultado da determinação na operação 2850, os parâmetros LPC decodificados são dequantizados mediante utilização de um primeiro esquema de dequantização na operação 2870.
Se o caminho de quantização for o segundo caminho como um resultado da determinação na operação 2850, os parâmetros LPC decodificados são dequantizados mediante uso de um segundo esquema de dequantização na operação 2890.
Os processos de dequantização nas operações 2870 e 2890 podem ser realizados mediante uso de processos inversos do primeiro e segundo esquemas de quantização das várias modalidades exemplares descritas acima, respectivamente, de acordo com os aparelhos de codificação correspondendo aos aparelhos de decodificação.
Embora o primeiro e o segundo caminho sejam estabelecidos como os caminhos de quantização verificada na modalidade exemplar atual, vários caminhos, incluindo o primeiro e o segundo caminho, podem ser estabelecidos, e o fluxograma da Figura 28 pode ser mudado em correspondência com a pluralidade de caminhos estabelecidos.
Os métodos das Figuras 27 e 28 podem ser programados e podem ser realizados por pelo menos um dispositivo de processamento. Além disso, as modalidades exemplares podem ser realizadas em uma unidade de quadro ou em uma unidade de subquadro.
A Figura 29 é um diagrama de blocos de um dispositivo eletrônico incluindo um módulo de codificação de acordo com uma modalidade exemplar.
Com referência à Figura 29, o dispositivo eletrônico 2900 pode incluir uma unidade de comunicação 2910 e o módulo de codificação 2930. Além disso, o dispositivo eletrônico 2900 pode incluir ainda uma unidade de armazenamento 2950 para armazenar um fluxo de bits de som obtido como um resultado da codificação de acordo com a utilização do fluxo de bits de som. Além disso, o dispositivo eletrônico 2900 pode incluir ainda um microfone 2970. Isto é, a unidade de armazenamento 2950 e o microfone 2970 podem ser incluídos opcionalmente. O dispositivo decodificação arbitrária (não mostrado), por exemplo, um módulo de decodificação para realizar uma função de decodificação geral ou um módulo de decodificação de acordo com uma modalidade exemplar. O módulo de codificação 2930 pode ser implementado mediante ao menos um processador (por exemplo, uma unidade de processamento central (CPU)) (não mostrada) pelo fato de ser integrada com outros componentes (não mostrados), incluídos no dispositivo eletrônico 2900, como um só corpo.
A unidade de comunicação 2910 pode receber pelo menos um de um som ou um fluxo de bits codificado provido a partir do lado externo ou transmitir pelo menos um de um som decodificado ou um fluxo de bits de som obtido como um resultado da codificação por intermédio do módulo de codificação 2930.
A unidade de comunicação 2910 é configurada para transmitir e receber dados para e a partir de um dispositivo eletrônico externo por intermédio de uma rede sem fio, tal como a Internet sem fio, intranet sem fio, uma rede de telefonia sem fio, uma Rede de Área Local sem Fio (WLAN), Wi-Fi, Wi-Fi Direta (WFD) , comunicação de terceira geração (3D), de quarta geração (4G), Bluetooth, Associação de Dados de Infravermelho (IrDA), Identificação de Radiofrequência (RFID), Ultra Banda Larga (UWB), Zigbee, ou Comunicação de Campo Próximo (NFC) , ou uma rede cabeada, tal como uma rede de telefonia cabeada ou Internet cabeada.
O módulo de codificação 2930 pode gerar um fluxo de bits mediante seleção de um de uma pluralidade de caminhos, incluindo um primeiro caminho não usando predição interquadro e um segundo caminho utilizando a predição interquadro, como um caminho de quantização de um som provido através da unidade de comunicação 2910 ou do microfone 2970 com base em um critério predeterminado antes da quantização do som, quantizando o som mediante uso de um primeiro esquema de quantização e de um segundo esquema de quantização de acordo com o caminho de quantização selecionado, e codificando o som quantizado.
O primeiro esquema de quantização pode incluir um primeiro quantizador (não mostrado) para quantizar aproximadamente o som e um . segundo quantizador (não mostrado) para quantizar precisamente um sinal de erro de quantização entre o som e um sinal de saída do primeiro quantizador. O primeiro esquema de quantização pode incluir um MSVQ (não mostrado) para quantizar o som e um LVQ (não mostrado) para quantizar um sinal de erro de quantização entre o som e um sinal de saída do MSVQ. Além disso, o primeiro esquema de quantização pode ser implementado por uma das várias modalidades exemplares descritas acima.
O segundo esquema de quantização pode incluir um preditor interquadro (não mostrado) para realizar a predição interquadro do som, um preditor intraquadro (não mostrado) para realizar predição intraquadro de erros preditivos, e um BC-TCQ (não mostrado) para quantizar os erros preditivos. Similarmente, o segundo esquema de quantização pode ser implementado por uma das várias modalidades exemplares descritas acima.
A unidade de armazenamento 2950 pode armazenar um fluxo de bits codificados gerados pelo módulo de codificação 2930. A unidade de armazenamento 2950 pode armazenar vários programas necessários para operar o dispositivo eletrônico 2900.
O microfone 2970 pode prover um som de um usuário fora do módulo de codificação 2930.
A Figura 3 0 é um diagrama de blocos de um dispositivo eletrônico incluindo um módulo de decodificação, de acordo com uma modalidade exemplar.
Com referência ã Figura 30, o dispositivo eletrônico 3000 pode incluir uma unidade de comunicação 3010 e o módulo de decodificação 3030. Além disso, o dispositivo eletrônico 3000 pode incluir ainda uma unidade de armazenamento 3050 para armazenar um som restaurado obtido como um resultado da decodificação de acordo com a utilização do som restaurado. Além disso, o dispositivo eletrônico 3000 pode incluir ainda um altofalante 3070. Isto é, a unidade de armazenamento 3050 e o altofalante 3070 podem ser opcionalmente incluídos. O dispositivo eletrônico 3000 pode incluir ainda um módulo de codificação arbitrário (não mostrado), por exemplo, um módulo de codificação para realizar uma função de codificação geral ou um módulo de codificação de acordo com uma modalidade exemplar da presente invenção. O módulo de decodificação 3030 pode ser implementado por ao menos um processador (por exemplo, uma unidade de processamento central (CPU)) (não mostrada) pelo fato de ser integral com outros componentes (não mostrados) incluídos no dispositivo eletrônico 3000 como um só corpo.
A unidade de comunicação 3010 pode receber pelo menos um dentre um som ou um fluxo de bits codificado provido a partir do lado externo ou transmitir pelo menos um de um som restaurado obtido como um resultado da decodificação do módulo de decodificação 3030 ou um fluxo de bits de som obtido como um resultado da codificação. A unidade de comunicação 3010 pode ser implementada substancialmente como a unidade de comunicação 2910 da Figura 29.
O módulo de decodificação 3 03 0 pode gerar um som restaurado pelos parâmetros LPC de decodificação incluídos em um fluxo de bits provido através da unidade de comunicação 3010, dequantizar os parâmetros LPC decodificados mediante uso de um dentre um primeiro esquema de dequantização não utilizando a predição interquadros e um segundo esquema de dequantização utilizando a predição interquadro com base na informação de caminho incluída no fluxo de bits, e decodificar os parâmetros LPC dequantizados no modo de codificação decodificado. Quando um modo de codificação é incluído no fluxo de bits, o módulo de decodificação 3030 pode decodificar os parâmetros LPC dequantizados em um modo de codificação decodificado.
O primeiro esquema de dequantização pode incluir um primeiro dequantizador (não mostrado) para aproximadamente dequantizar os parâmetros LPC e um segundo dequantizador (não mostrado) para dequantizar precisamente os parâmetros LPC. O primeiro esquema de dequantização pode incluir um MSVQ (não mostrado) para dequantizar os parâmetros LPC mediante uso de um primeiro índice de livro de códigos e um LVQ (não mostrado) para dequantizar os parâmetros LPC mediante uso de um segundo índice de livro de códigos. Além disso, como o primeiro esquema de dequantização realiza uma operação inversa do primeiro esquema de quantização descrito na Figura 29, o primeiro esquema de dequantização pode ser implementado por um dos processos inversos das várias modalidades exemplares descritas acima correspondendo ao primeiro esquema de quantização de acordo com os aparelhos de codificação correspondendo aos aparelhos de decodificação.
O segundo esquema de dequantização pode incluir um BC-TCQ (não mostrado) para dequantizar os parâmetros LPC mediante uso de um terceiro índice de livro de códigos, um preditor intraquadro (não mostrado) , e um preditor interquadro (não mostrado). Similarmente, como o segundo esquema de dequantização realiza uma operação inversa do segundo esquema de quantização descrito na Figura 29, o segundo esquema de dequantização pode ser implementado por um dos processos inversos das várias modalidades exemplares descritas acima correspondendo ao segundo esquema de quantização de acordo com os aparelhos de codificação correspondendo aos aparelhos de decodificação.
A unidade de armazenamento 3050 pode armazenar o som restaurado gerado pelo módulo de decodificação 3030. A unidade de armazenamento 3050 pode armazenar vários programas para operar o dispositivo eletrônico 3000.
O altofalante 3070 pode produzir o som restaurado gerado pelo módulo de decodificação 3030 para o lado externo.
A Figura 31 é um diagrama de blocos de um dispositivo eletrônico incluindo um módulo de codificação e um módulo de decodificação, de acordo com uma modalidade exemplar.
O dispositivo eletrônico 3100 mostrado na Figura 31 pode incluir uma unidade de comunicação 3110, um módulo de codificação 3120, e um módulo de decodificação 3130. Além disso, o dispositivo eletrônico 3100 pode incluir ainda uma unidade de armazenamento 3140 para armazenar um fluxo de bits de som obtido como um resultado da codificação ou um som restaurado obtido como um resultado da decodificação de acordo com a utilização do fluxo de bits de som ou do som restaurado. Além disso, o dispositivo eletrônico 3100 pode incluir ainda um microfone 3150 e/ou um altofalante 3160. 0 módulo de codificação 3120 e o módulo de decodificação 3130 podem ser implementados por ao menos um processador (por exemplo, uma unidade central de processamento (CPU)) (não mostrada) pelo fato de ser integrado com outros componentes (não mostrados) incluídos no dispositivo eletrônico 3100 como um só corpo.
Como os componentes do dispositivo eletrônico 3100, mostrados na Figura 31, correspondem aos componentes do dispositivo eletrônico 2900 mostrado na Figura 29 ou os componentes do dispositivo eletrônico 3000, mostrado na Figura 30, uma descrição detalhada dos mesmos é omitida.
Cada um dos dispositivos eletrônicos 2900, 3000, e 3100 mostrados nas Figuras 29, 30 e 31 pode incluir um terminal apenas de comunicação de voz, tal como um telefone ou um telefone móvel, um dispositivo apenas de música ou transmissão, tal como uma TV ou um dispositivo de reprodução MP3 ou um dispositivo de terminal híbrido de um terminal apenas de comunicação de voz e um dispositivo apenas de transmissão ou música, mas não são limitados a isso. Além disso, cada um dos dispositivos eletrônicos 2900, 3000 e 3100, pode ser usado como um cliente, um servidor, ou um transdutor deslocado entre um cliente e um servidor.
Quando o dispositivo eletrônico 2900, 3000 ou 3100 é, por exemplo, um telefone móvel, embora não mostrado, o dispositivo eletrônico 2900, 3000 ou 3100 pode incluir ainda uma unidade de entrada de usuário, tal como um teclado, uma unidade de exibição, para exibir informação processada por uma interface de usuário ou pelo telefone móvel, e um processador (por exemplo, uma unidade central de processamento (CPU)) para controlar as funções do telefone móvel. Além disso, o telefone móvel pode incluir ainda uma unidade de câmera tendo uma função de captura de imagem e pelo menos um componente para realizar uma função para o telefone móvel.
Quando o dispositivo eletrônico 2900, 3000 ou 3100 é, por exemplo, uma TV, embora não mostrada, o dispositivo eletrônico 2900, 3000 ou 3100 pode incluir ainda uma unidade de entrada de usuário, tal como um teclado, uma unidade de exibição para exibir informação de transmissão recebida, e um processador (por exemplo, unidade de processamento central (CPU)) para controlar todas as funções da TV. Além disso, a TV pode incluir ainda ao menos um componente para realizar uma função da TV.
Conteúdos relacionados a BC-TCQ incorporados em associação com a quantização/dequantização de coeficientes LPC são revelados em detalhe na Patente dos Estados Unidos N° 7630890 (Método TCQ restrito em blocos e método e equipamento para quantizar parâmetro LSF empregando o mesmo em sistema de codificação de fala). Os conteúdos em associação com um método LVA são revelados em detalhe no Pedido de Patente dos Estados Unidos N° 20070233473 (Método de quantização de treliça codificada de multi-caminho e quantizador codificado em trellis de multi-caminho utilizando o mesmo). Os conteúdos da Patente dos Estados Unidos N° 7630890 e Pedido de Patente dos Estados Unidos N° 20070233473 são aqui incorporados mediante referência.
O método de quantização, o método de dequantização, o método de codificação e o método de decodificação de acordo com as modalidades exemplares podem ser gravados como programas de computador e podem ser implementados em computadores digitais de uso comum que executam os programas utilizando um meio de gravação legível por computador. Além disso, uma estrutura de dados, um comando de programa ou um arquivo de dados disponíveis nas modalidades exemplares podem ser gravados no meio de gravação legível por computador de várias maneiras. O meio de gravação legível por computador é qualquer dispositivo de armazenamento de dados que pode armazenar os dados que podem posteriormente ser lidos por um sistema de computador. Exemplos de meio de gravação legível por computador incluem meios de gravação magnética, tais como discos rígidos, disquetes e fitas magnéticas, meios de gravação ótica, tais como CD-ROMs e DVDs, meios de gravação magneto-óticos, tais como discos magnéticos e óticos e dispositivos de hardware, tais como ROM, RAM e memórias flash, configurados particularmente para armazenar e executar um comando de programa. O meio de gravação legível por computador também pode ser um meio de transmissão para transmitir um sinal no qual um comando de programa e uma 5 estrutura de dados são designados. Exemplos do comando de programa podem incluir códigos de linguagem de máquina criados por um compilador e códigos de linguagem de alto nível, executáveis por um computador através de um intérprete.
Embora o presente conceito inventivo tenha sido particularmente mostrado e descrito com referência às suas modalidades exemplares, será entendido por aqueles de conhecimento comum na técnica que várias alterações em forma e detalhes podem ser feitas, sem se afastar da essência e escopo do presente conceito inventivo como definido pelas reivindicações seguintes.

Claims (11)

1. Aparelho de quantização para um sinal de entrada, que inclui pelo menos uma de uma característica de fala e uma característica de áudio em um dispositivo de codificação, o aparelho caracterizado por compreender: um processador configurado para: comparar um erro preditivo de informações de predição linear no sinal de entrada com um limite, onde o erro preditivo para um quadro atual é obtido a partir de uma contribuição de predição interquadros do quadro atual, uma função de ponderação e informações de predição linear do quadro atual; selecionar um dentre uma pluralidade de módulos de quantização, em um modo de circuito aberto, em resposta a um resultado da comparação do erro preditivo com o limite; quantizar o quadro atual sem predição interquadros, com base no módulo de quantização selecionado; quantizar o quadro atual com a predição interquadros, com base no módulo de quantização selecionado; e transmitir um fluxo de bits incluindo um resultado de quantização, para reconstrução do sinal de entrada, e em que a predição interquadros é realizada com base em um quadro anterior.
2. Aparelho, de acordo com a reivindicação 1, caracterizado por o módulo de quantização selecionado compreender um quantizador de treliça-estruturada e um preditor intraquadros.
3. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o módulo de quantização selecionado compreende um quantizador de treliça- estruturada, um preditor intraquadros e um preditor interquadros.
4. Aparelho, de acordo com a reivindicação 1, caracterizado por o módulo de quantização selecionado compreender um quantizador de treliça-estruturada e um quantizador vetorial.
5. Aparelho de quantização para um sinal de entrada incluindo pelo menos uma de uma característica de fala e uma característica de áudio em um dispositivo de codificação, o aparelho caracterizado por compreender: um processador configurado para: selecionar um dentre uma pluralidade de módulos de quantização com base em um erro preditivo de informações de predição linear no sinal de entrada, em um modo de circuito aberto, onde o erro preditivo para um quadro atual é obtido a partir de uma contribuição de predição interquadros do quadro atual, uma função de ponderação e informação de predição linear do quadro atual, em um modo de circuito aberto; quantizar o quadro atual sem predição interquadros, com base no módulo de quantização selecionado; e quantizar o quadro atual com a predição interquadros, com base no módulo de quantização selecionado; e transmitir um fluxo de bits incluindo um resultado de quantização, para reconstrução do sinal de entrada, em que um modo de codificação do sinal de entrada é um modo de codificação de voz, e em que a predição interquadros é realizada com base em um quadro anterior.
6. Aparelho, de acordo com a reivindicação 5, caracterizado por o módulo de quantização selecionado compreender um quantizador de treliça-estruturada e um preditor intraquadros.
7. Aparelho, de acordo com a reivindicação 5, caracterizado por o módulo de quantização selecionado compreende um quantizador de treliça-estruturada, um preditor intraquadros e um preditor interquadros.
8. Aparelho, de acordo com a reivindicação 5, caracterizado por o módulo de quantização selecionado compreender um quantizador de treliça-estruturada e um quantizador vetorial.
9. Método de decodificação para um sinal codificado, que inclui pelo menos uma de uma característica de fala e uma característica de áudio em um dispositivo de decodificação, o método caracterizado por compreender: receber um fluxo de bits incluindo o sinal codificado; selecionar, com base em uma informação de modo a partir do fluxo de bits, um de um primeiro módulo de decodificação e um segundo módulo de decodificação; quando o primeiro módulo de decodificação é selecionado, decodificar o fluxo de bits, sem predição intraquadros, para reconstrução de um sinal de voz ou um sinal de áudio; e quando o segundo módulo de decodificação é selecionado, decodificar o fluxo de bits, com predição interquadros, para reconstrução do sinal codificado, em que o primeiro módulo de decodificação compreende um desquantizador de treliça-estruturada com restrições de bloco, um preditor intraquadros e um desquantizador vetorial, e em que a informação de modo é gerada com base em um erro preditivo de informação de predição linear em um dispositivo de codificação, e em que a predição interquadros é realizada com base em um quadro anterior.
10. Método, de acordo com a reivindicação 9, caracterizado por o segundo módulo de decodificação compreender um desquantizador de treliça-estruturada com restrições de bloco, um preditor intraquadros, um preditor interquadros e um desquantizador vetorial.
11. Método, de acordo com a reivindicação 9, caracterizado por um modo de codificação associado ao fluxo de bits ser um modo de codificação falado.
BR112013027093-4A 2011-04-21 2012-04-23 Método para quantizar, método para decodificar, método para codificar, e meio de gravação legível por computador não transitório BR112013027093B1 (pt)

Priority Applications (2)

Application Number Priority Date Filing Date Title
BR122020023350-8A BR122020023350B1 (pt) 2011-04-21 2012-04-23 método de quantização
BR122020023363-0A BR122020023363B1 (pt) 2011-04-21 2012-04-23 Método de decodificação

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161477797P 2011-04-21 2011-04-21
US61/477,797 2011-04-21
US201161481874P 2011-05-03 2011-05-03
US61/481,874 2011-05-03
PCT/KR2012/003128 WO2012144878A2 (en) 2011-04-21 2012-04-23 Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium

Publications (2)

Publication Number Publication Date
BR112013027093A2 BR112013027093A2 (pt) 2020-08-11
BR112013027093B1 true BR112013027093B1 (pt) 2021-04-13

Family

ID=47042087

Family Applications (3)

Application Number Title Priority Date Filing Date
BR112013027093-4A BR112013027093B1 (pt) 2011-04-21 2012-04-23 Método para quantizar, método para decodificar, método para codificar, e meio de gravação legível por computador não transitório
BR122020023350-8A BR122020023350B1 (pt) 2011-04-21 2012-04-23 método de quantização
BR122020023363-0A BR122020023363B1 (pt) 2011-04-21 2012-04-23 Método de decodificação

Family Applications After (2)

Application Number Title Priority Date Filing Date
BR122020023350-8A BR122020023350B1 (pt) 2011-04-21 2012-04-23 método de quantização
BR122020023363-0A BR122020023363B1 (pt) 2011-04-21 2012-04-23 Método de decodificação

Country Status (15)

Country Link
US (3) US8977544B2 (pt)
EP (2) EP2700173A4 (pt)
JP (2) JP6178305B2 (pt)
KR (2) KR101863688B1 (pt)
CN (3) CN105719654B (pt)
AU (3) AU2012246799B2 (pt)
BR (3) BR112013027093B1 (pt)
CA (1) CA2833874C (pt)
MX (2) MX2013012300A (pt)
MY (1) MY185091A (pt)
RU (3) RU2619710C2 (pt)
SG (1) SG194579A1 (pt)
TW (2) TWI591621B (pt)
WO (1) WO2012144878A2 (pt)
ZA (1) ZA201308709B (pt)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
WO2012144877A2 (en) * 2011-04-21 2012-10-26 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefor
BR112013027093B1 (pt) * 2011-04-21 2021-04-13 Samsung Electronics Co., Ltd Método para quantizar, método para decodificar, método para codificar, e meio de gravação legível por computador não transitório
CN110047499B (zh) 2013-01-29 2023-08-29 弗劳恩霍夫应用研究促进协会 低复杂度音调自适应音频信号量化
CN105745703B (zh) 2013-09-16 2019-12-10 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
WO2015054811A1 (en) 2013-10-14 2015-04-23 Microsoft Corporation Features of intra block copy prediction mode for video and image coding and decoding
US11109036B2 (en) 2013-10-14 2021-08-31 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
CA2928882C (en) * 2013-11-13 2018-08-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
BR112016006925B1 (pt) 2013-12-02 2020-11-24 Huawei Technologies Co., Ltd.. Metodo e aparelho de codificaqao
EP3090553B1 (en) 2014-01-03 2022-07-06 Microsoft Technology Licensing, LLC Block vector prediction in video and image coding/decoding
US10074375B2 (en) * 2014-01-15 2018-09-11 Samsung Electronics Co., Ltd. Weight function determination device and method for quantizing linear prediction coding coefficient
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
JP2017512026A (ja) * 2014-03-04 2017-04-27 マイクロソフト テクノロジー ライセンシング,エルエルシー イントラブロックコピー予測におけるブロック反転及びスキップモード
CN110853659B (zh) 2014-03-28 2024-01-05 三星电子株式会社 用于对音频信号进行编码的量化装置
JP6270992B2 (ja) * 2014-04-24 2018-01-31 日本電信電話株式会社 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体
KR102593442B1 (ko) * 2014-05-07 2023-10-25 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
US9959876B2 (en) * 2014-05-16 2018-05-01 Qualcomm Incorporated Closed loop quantization of higher order ambisonic coefficients
WO2015192353A1 (en) 2014-06-19 2015-12-23 Microsoft Technology Licensing, Llc Unified intra block copy and inter prediction modes
CN111968655B (zh) 2014-07-28 2023-11-10 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
EP3186808B1 (en) * 2014-08-28 2019-03-27 Nokia Technologies Oy Audio parameter quantization
CA2959682C (en) 2014-09-30 2022-12-06 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
EP3320539A1 (en) * 2015-07-06 2018-05-16 Nokia Technologies OY Bit error detector for an audio signal decoder
WO2018133043A1 (zh) * 2017-01-20 2018-07-26 华为技术有限公司 量化器与量化方法
CN109473116B (zh) * 2018-12-12 2021-07-20 思必驰科技股份有限公司 语音编码方法、语音解码方法及装置
TWI723545B (zh) * 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置
CN114727109B (zh) * 2021-01-05 2023-03-24 腾讯科技(深圳)有限公司 多媒体的量化处理方法、装置及编码、解码设备

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62231569A (ja) 1986-03-31 1987-10-12 Fuji Photo Film Co Ltd 予測誤差の量子化方法
JPH0863198A (ja) * 1994-08-22 1996-03-08 Nec Corp ベクトル量子化器
JPH08190764A (ja) 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
FR2729244B1 (fr) 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
JPH08211900A (ja) * 1995-02-01 1996-08-20 Hitachi Maxell Ltd ディジタル音声圧縮方式
US5699485A (en) 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
US6889185B1 (en) 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
CN1296888C (zh) 1999-08-23 2007-01-24 松下电器产业株式会社 音频编码装置以及音频编码方法
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
CN1187735C (zh) 2000-01-11 2005-02-02 松下电器产业株式会社 多模式话音编码装置和解码装置
JP3453116B2 (ja) * 2000-09-26 2003-10-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化方法及び装置
US7031926B2 (en) 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
JP3557416B2 (ja) * 2002-04-12 2004-08-25 松下電器産業株式会社 Lspパラメータ符号化復号化装置及び方法
ATE381091T1 (de) * 2002-04-22 2007-12-15 Nokia Corp Erzeugung von lsf-vektoren
US7167568B2 (en) * 2002-05-02 2007-01-23 Microsoft Corporation Microphone array signal enhancement
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP4292767B2 (ja) 2002-09-03 2009-07-08 ソニー株式会社 データレート変換方法及びデータレート変換装置
CN1186765C (zh) * 2002-12-19 2005-01-26 北京工业大学 2.3kb/s谐波激励线性预测语音编码方法
CA2415105A1 (en) 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100486732B1 (ko) * 2003-02-19 2005-05-03 삼성전자주식회사 블럭제한된 트렐리스 부호화 양자화방법과 음성부호화시스템에있어서 이를 채용한 라인스펙트럼주파수 계수양자화방법 및 장치
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
JP4369857B2 (ja) 2003-12-19 2009-11-25 パナソニック株式会社 画像符号化装置および画像符号化方法
KR20070009644A (ko) * 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
EP2290824B1 (en) * 2005-01-12 2012-05-23 Nippon Telegraph And Telephone Corporation Long term prediction coding and decoding method, devices thereof, program thereof, and recording medium
EP1720249B1 (en) * 2005-05-04 2009-07-15 Harman Becker Automotive Systems GmbH Audio enhancement system and method
US8781842B2 (en) 2006-03-07 2014-07-15 Telefonaktiebolaget Lm Ericsson (Publ) Scalable coding with non-casual predictive information in an enhancement layer
GB2436191B (en) * 2006-03-14 2008-06-25 Motorola Inc Communication Unit, Intergrated Circuit And Method Therefor
RU2395174C1 (ru) * 2006-03-30 2010-07-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования/кодирования сигнала видео
KR100728056B1 (ko) 2006-04-04 2007-06-13 삼성전자주식회사 다중 경로 트랠리스 부호화 양자화 방법 및 이를 이용한다중 경로 트랠리스 부호화 양자화 장치
US20090198491A1 (en) * 2006-05-12 2009-08-06 Panasonic Corporation Lsp vector quantization apparatus, lsp vector inverse-quantization apparatus, and their methods
US8532178B2 (en) 2006-08-25 2013-09-10 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal with inter-view reference picture list construction
US7813922B2 (en) * 2007-01-30 2010-10-12 Nokia Corporation Audio quantization
US8265142B2 (en) 2007-03-14 2012-09-11 Nippon Telegraph And Telephone Corporation Encoding bit-rate control method and apparatus, program therefor, and storage medium which stores the program
KR100903110B1 (ko) 2007-04-13 2009-06-16 한국전자통신연구원 트렐리스 부호 양자화 알고리듬을 이용한 광대역 음성 부호화기용 lsf 계수 양자화 장치 및 방법
WO2009044346A1 (en) * 2007-10-05 2009-04-09 Nokia Corporation System and method for combining adaptive golomb coding with fixed rate quantization
US20090136052A1 (en) 2007-11-27 2009-05-28 David Clark Company Incorporated Active Noise Cancellation Using a Predictive Approach
US20090245351A1 (en) * 2008-03-28 2009-10-01 Kabushiki Kaisha Toshiba Moving picture decoding apparatus and moving picture decoding method
US20090319261A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MX2011003824A (es) * 2008-10-08 2011-05-02 Fraunhofer Ges Forschung Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple.
JP5678071B2 (ja) 2009-10-08 2015-02-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 線形予測符号化ベースのノイズ整形を用いた多重モードオーディオ信号デコーダ、多重モードオーディオ信号エンコーダ、方法およびコンピュータプログラム
CA2778373C (en) * 2009-10-20 2015-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications
WO2012144877A2 (en) * 2011-04-21 2012-10-26 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefor
BR112013027093B1 (pt) * 2011-04-21 2021-04-13 Samsung Electronics Co., Ltd Método para quantizar, método para decodificar, método para codificar, e meio de gravação legível por computador não transitório
JP2017137439A (ja) * 2016-02-04 2017-08-10 株式会社双葉紙器 セラミドとセラミド誘導体との製造方法

Also Published As

Publication number Publication date
AU2016203627A1 (en) 2016-06-16
RU2647652C1 (ru) 2018-03-16
KR20120120086A (ko) 2012-11-01
US8977544B2 (en) 2015-03-10
KR20180063008A (ko) 2018-06-11
JP2017203997A (ja) 2017-11-16
CN105513602A (zh) 2016-04-20
WO2012144878A3 (en) 2013-03-14
US20170221494A1 (en) 2017-08-03
EP2700173A4 (en) 2014-05-28
TWI672691B (zh) 2019-09-21
WO2012144878A2 (en) 2012-10-26
RU2013151673A (ru) 2015-05-27
MY185091A (en) 2021-04-30
BR112013027093A2 (pt) 2020-08-11
TW201243828A (en) 2012-11-01
CA2833874A1 (en) 2012-10-26
TWI591621B (zh) 2017-07-11
SG194579A1 (en) 2013-12-30
US20150162017A1 (en) 2015-06-11
EP2700173A2 (en) 2014-02-26
TW201729182A (zh) 2017-08-16
CN105719654B (zh) 2019-11-05
CN103620676A (zh) 2014-03-05
US10229692B2 (en) 2019-03-12
MX354812B (es) 2018-03-22
RU2619710C2 (ru) 2017-05-17
CN105719654A (zh) 2016-06-29
BR122020023350B1 (pt) 2021-04-20
BR122020023363B1 (pt) 2021-06-01
AU2012246799B2 (en) 2016-03-03
CN105513602B (zh) 2019-08-06
RU2675044C1 (ru) 2018-12-14
AU2017268591B2 (en) 2018-11-08
US20120278069A1 (en) 2012-11-01
EP3537438A1 (en) 2019-09-11
KR101997038B1 (ko) 2019-07-05
KR101863688B1 (ko) 2018-06-01
AU2017268591A1 (en) 2017-12-21
CA2833874C (en) 2019-11-05
JP2014519044A (ja) 2014-08-07
MX2013012300A (es) 2013-12-06
US9626980B2 (en) 2017-04-18
JP6178305B2 (ja) 2017-08-09
CN103620676B (zh) 2016-03-09
ZA201308709B (en) 2021-05-26
AU2016203627B2 (en) 2017-08-31

Similar Documents

Publication Publication Date Title
KR101997037B1 (ko) 선형예측계수 양자화장치, 사운드 부호화장치, 선형예측계수 역양자화장치, 사운드 복호화장치와 전자기기
BR112013027093B1 (pt) Método para quantizar, método para decodificar, método para codificar, e meio de gravação legível por computador não transitório

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 23/04/2012, OBSERVADAS AS CONDICOES LEGAIS.