PT2791937T - Geração de uma extensão da banda alta de um sinal de áudio de largura de banda estendida - Google Patents
Geração de uma extensão da banda alta de um sinal de áudio de largura de banda estendida Download PDFInfo
- Publication number
- PT2791937T PT2791937T PT128457439T PT12845743T PT2791937T PT 2791937 T PT2791937 T PT 2791937T PT 128457439 T PT128457439 T PT 128457439T PT 12845743 T PT12845743 T PT 12845743T PT 2791937 T PT2791937 T PT 2791937T
- Authority
- PT
- Portugal
- Prior art keywords
- excitation
- band
- frame
- noise
- spectral
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 11
- 230000005284 excitation Effects 0.000 claims description 107
- 230000003595 spectral effect Effects 0.000 claims description 68
- 230000011664 signaling Effects 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 25
- 238000002156 mixing Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 17
- 230000006978 adaptation Effects 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- 238000001228 spectrum Methods 0.000 description 53
- 238000005516 engineering process Methods 0.000 description 31
- 230000015572 biosynthetic process Effects 0.000 description 25
- 238000003786 synthesis reaction Methods 0.000 description 25
- 239000013598 vector Substances 0.000 description 15
- 230000006835 compression Effects 0.000 description 12
- 238000007906 compression Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 208000020401 Depressive disease Diseases 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000233866 Fungi Species 0.000 description 1
- 206010021403 Illusion Diseases 0.000 description 1
- 101150096038 PTH1R gene Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Description
DESCRIgAO "GERAQAO DE UMA EXTENSAO DA BANDA ALTA DE UM SINAL DE AUDIO DE LARGURA DE BANDA ESTENDIDA"
DOMINIO TECNICO A tecnologia proposta diz respeito a geragao de uma extensao da banda alta de um sinal de audio de largura de banda estendida.
ANTECEDENTES A maioria dos sistemas de telecomunicagoes existentes operam numa largura de banda de audio limitada. Decorrentes das limitagoes dos sistemas de telefonia por linha fixa terrestre, a maioria dos servigos de voz esta limitada a apenas transmitir a extremidade inferior do espectro. Embora a largura de banda de audio seja suficiente para a maioria das conversagoes, existe uma vontade para aumentar a largura de banda visando melhorar a inteligibilidade e a sensagao de presenga. Embora a capacidade nas redes de telecomunicagoes esteja continuamente a aumentar, ainda e de grande interesse a limitagao da largura de banda requerida por cada canal de comunicagao. Nas redes moveis, para cada chamada, as larguras de banda de transmissao mais pequenas geram menores consumos de energia, tanto no dispositivo movel como na estagao de base. Isso traduz-se em economia de energia e de custos para o operador de rede movel, enquanto o utilizador final ira experimentar a vida prolongada da bateria e o aumento de tempo de conversagao. Para alem disso, com menos largura de banda consumida por utilizador, a rede movel podera servir urn maior niimero de utilizadores em paralelo.
Uma propriedade do sistema auditivo humano e que a percepgao e dependente da frequencia. Em particular, a nossa audigao e menos precisa para frequencias mais altas. Isto inspirou as denominadas tecnicas de extensao da largura de banda (BWE) ("bandwidth extension"), onde uma banda de alta frequencia e reconstruida a partir de uma banda de baixa frequencia utilizando recursos limitados. A BWE convencional utiliza uma representagao da envolvente espectral do sinal de banda alta estendida, e reproduz a estrutura fina do espectro do sinal, utilizando uma versao modificada do sinal de banda baixa. Se a envolvente de banda alta e representada por um filtro, o sinal de estrutura fina e muitas vezes chamado de sinal de excitagao. Uma representagao precisa da envolvente de banda alta e perceptivelmente mais importante do que a estrutura fina. Consequentemente, e comum que os recursos disponiveis em termos de bits sejam gastos com a representagao da envolvente, enquanto a estrutura fina e reconstruida a partir do sinal de banda baixa codificado sem adicional informagao lateral. 0 conceito basico da BWE e ilustrado na Fig 1. A tecnologia da BWE tem sido aplicada numa variedade de sistemas de codificagao de audio. Por exemplo, o 3GPP AMR-WB + , [1], utiliza uma BWE no dominio do tempo baseada num codificador de banda baixa que alterna entre a codificagao de voz por Dispositivo de Previsao por Exeitagao de Codigo (CELP) ("Code Excited Linear Predictor") e a codificagao da Transformada Codificada Residual (TCX) ("Transform Coded Residual") . Outro exemplo e o 3GPP e AAC codec de audio com base na transformada que realiza uma transformada variante de dominio da BWE chamada de Replicagao da Banda Espectral (SBR), [2]. Aqui, a exeitagao e criada utilizando uma mistura de componentes de tonalidade (tonais) gerados a partir da exeitagao de banda baixa e de uma fonte de ruido, com o fim de fazer coincidir a tonalidade com o racio do ruido do sinal de entrada. Em geral, o indice de ruido do sinal pode ser descrito como uma medida, de como o e que o espectro e piano, por exemplo, utilizando uma medida de nivelamento espectral. 0 indice de ruido tambem pode ser descrito como a nao tonalidade, a aleatoriedade ou a nao estrutura de exeitagao. Aumentar o indice de ruido de um sinal e torna-lo mais semelhante a ruido, por exemplo misturando o sinal com um sinal de ruido a partir de por exemplo, um gerador de niimeros aleatorios ou outra qualquer fonte de ruido. Tambem pode ser feito por modificagao do espectro do sinal para o tornar mais piano. A estrutura fina espectral da banda baixa pode ser muito diferente da estrutura fina encontrada na banda alta. Em particular, a combinagao de uma excitagao gerada a partir do sinal de banda baixa em conjunto com a envolvente de banda alta pode produzir perturbagbes indesejaveis como, existencia de harmonicas residentes ou a forma de excitagao poder ser enfatizada de uma maneira descontrolada pela modelagao da envolvente. Como medida de seguranga, e comum tornar plana a envolvente de banda alta, a fim de limitar a indesejavel interacgao entre a excitagao e a envolvente. Embora esta solugao possa dar urn razoavel "trade-off", a envolvente plana pode ser percebida como mais ruidosa e a envolvente de banda alta ira ser menos precisa. Gustaffson et al: "Band Speech width Extension" divulga a extensao da largura de banda com o controlo do indice de ruido da excitagao de banda alta e aplicagao de um filtro posterior.
RESUMO
Um objectivo da tecnologia proposta e um melhor controlo da geragao da extensao de banda alta de uma largura de banda estendida de sinal de audio.
Este objectivo e conseguido de acordo com as reivindicagdes anexas.
Uma primeira vertente da tecnologia proposta envolve um metodo de geragao de uma extensao de banda alta de um sinal de audio a partir de uma envolvente e de uma excitagao. 0 metodo inclui a etapa de conjuntamente controlar a forma de envolvente e o indice de ruido da excitagao com um parametro de controlo comum.
Uma segunda vertente da tecnologia proposta envolve um descodificador de audio configurado para gerar uma extensao de banda alta de um sinal de audio a partir de uma envolvente e de uma excitagao. 0 descodificador de audio inclui um dispositivo de arranjo de controlo configurado para conjuntamente controlar a forma de envolvente e o indice de ruido da excitagao com um parametro de controlo comum.
Uma terceira vertente da tecnologia proposta envolve um equipamento de utilizador (UE) que inclui um descodificador de audio de acordo com a segunda vertente.
Uma quarta vertente da tecnologia proposta envolve um codificador de audio, que inclui um estimador de nivelamento planar do espectro, configurado para determinar uma medida de nivelamento planar do espectro de um sinal de banda alta para transmissao a um descodificador. A tecnologia proposta permite uma estrutura de envolvente mais pronunciada que mascara perturbagoes perceptivas, criadas por excitagoes de banda alta artificialmente geradas. Ao mesmo tempo, o controlo conjunto da estrutura da envolvente e do indice de ruido da excitagao melhora a naturalidade do sinal de audio reconstruido.
BREVE DESCRigAO DOS DESENHOS A tecnologia proposta, juntamente com outros objectos e vantagens dos mesmos, podem ser melhor compreendidos fazendo referenda a seguinte descrigao tomada em conjunto com os desenhos anexos. FIG. 1, ilustra o concerto basico da tecnica de BWE sob a forma de urn espectro de frequencias. 0 sinal de banda baixa codificado e estendido com uma banda alta utilizando, uma envolvente de banda alta e um sinal de excitagao que e gerado a partir do sinal de banda baixa. FIG. 2, ilustra um exemplo do sistema de BWE com um codec de CELP para a banda baixa e em que a banda superior e reconstruida utilizando uma envolvente do
Dispositivo de Previsao Linear (LP) ("Linear Predictor") e um sinal de excitagao, que e gerado a partir de parametros modificados de saida do descodificador de CELP. FIG. 3, ilustra um exemplo de descodificador de BWE que tem como mostrado na Fig. 2, um correspondente codificador. A excitagao modulada e misturada com um sinal de ruido a partir de um gerador de ruido. FIG. 4, ilustra um exemplo de modelo de realizagao da tecnologia proposta num sistema descodificador de CELP com um dispositivo de arranjo de controlo conjunto, de exoitagao para a mistura de excitagao e da forma espectral. FIG. 5, ilustra um exemplo de um espectro de LP de entrada e de um espectro de LP, o qual foi acentuado com um filtro posterior. FIG. 6, ilustra um exemplo de modelo de realizagao de um codificador utilizando uma analise de nivelamento planar espectral com base nos coeficientes da Codificagao Linear de Previsao (LPC) ("Linear Predictive Coding"). FIG. 7, ilustra um exemplo de modelo de realizagao de um descodificador correspondente ao codificador da Fig. 6, o qual utiliza o parametro de nivelamento transmitido, para juntar a envolvente espectral e o controlo de estrutura de excitagao. FIG. 8, ilustra um exemplo de codec de audio com base na transformada que tern uma codificagao de envolvente conjunta para todo o espectro, e emprega as tecnicas do descodificador de BWE para obter a estrutura fina espectral da banda alta. FIG. 9, ilustra um exemplo de um descodificador de BWE pertencente a um correspondente codificador, tal como mostrado na Fig. 8. A excitagao modulada e modificada utilizando um compressor para conseguir uma estrutura fina de nivelador para a excitagao de banda alta. FIG. 10, ilustra um exemplo de modelo de realizagao da tecnologia proposta num sistema de descodificador baseado na transformada, com um controlador conjunto para compressao de excitagao e expansao de envolvente. FIG. 11, ilustra um exemplo de modelo de realizagao de um codificador, o qual tern uma unidade de descodificagao local e um estimador de erro de banda baixa.
Figura 12, ilustra um exemplo de modelo de realizagao da tecnologia proposta num sistema de descodificador baseado na transformada com um dispositivo de arranjo de controlo conjunto para a compressao de excitagao e expansao de envolvente, em que o controlo conjunto esta adaptado, utilizando a estimativa de erro de banda baixa a partir do codificador. FIG. 13, ilustra um exemplo de modelo de realizagao de um dispositivo de controlo. FIG. 14, ilustra um equipamento de utilizador (UE) que inclui um descodificador proporcionado com um arranjo de controlo. FIG. 15, e um fluxograma que ilustra a tecnologia proposta. FIG. 16, e um fluxograma que ilustra um exemplo de modelo de realizagao da tecnologia proposta. FIG. 17, e um fluxograma que ilustra um exemplo de modelo de realizagao da tecnologia proposta. FIG. 18, e um fluxograma que ilustra um exemplo de modelo de realizagao da tecnologia proposta. FIG. 19, e um fluxograma que ilustra um exemplo de modelo de realizagao da tecnologia proposta.
DESCRigAO DETALHADA
Na descrigao detalhada que se segue os blocos que desempenham as mesmas ou semelhantes fungoes foram proporcionados com as mesmas designagoes de referenda. A tecnologia proposta pode ser utilizada tanto em BWE no dominio do tempo como em BWE no dominio da frequencia. Exemplos de modelos de realizagao para ambos serao dados em baixo. BWE no Dominio do Tempo
Um exemplo de um modelo de realizagao de BWE da tecnologia anterior destina-se principalmente para as aplicagoes de voz, e mostrado na Fig. 2. Este exemplo utiliza um algoritmo de codificagao de voz para o CELP, para o sinal de entrada de banda baixa. A envolvente de banda alta e representada com um filtro de LP. A sintese da banda alta e criada utilizando uma versao modificada do sinal de excitagao de banda baixa, extraido a partir da sintese de CELP.
Cada trama de sinal de entrada y e sub-dividida num sinal de banda de frequencia baixa yL e um sinal de banda de frequencia alta yH utilizando um banco/bateria de filtros de analise 10. Pode ser utilizado qualquer banco de filtros apropriado, mas essencialmente, deveria consistir de um filtro passa-baixo e um filtro passa-alto, por exemplo, um banco de filtros de "Filtro de Espelho em Quadratura" (QMF) ("Quadrature Mirror Filter"). 0 sinal de banda baixa e alimentado para um algoritmo de codificagao desempenhado por um codificador de CELP 12. A analise de LP e conduzida sobre o sinal de banda alta num bloco de analise de LP 14, para se obter uma representagao A da envolvente de banda alta. Os coeficientes de LP que definem A sao codificados com um quantificador de LP ou codificador de LP 16, e os indices de quantificagao Ilp sao multiplexados num multiplexador de fluxo de bits (multiplexer) 18, em conjunto com os indices de codificador de CELP Icelp, para serem armazenados ou transmitidos para urn descodificador. Por sua vez, o descodificador demultiplexa os indices ILP e Icelp num desmultiplexador de fluxo de bits (desmultiplexer) 20, e encaminha-os respectivamente, para o descodificador de LP 22 e o descodificador de CELP 24. Na descodificagao de CELP o sinal de excitagao de CELP xL e extraido e processado de tal forma, que o espectro de frequencias e modulado para gerar o sinal χρ de excitagao de banda alta.
Existe uma variedade de esquemas de modulagao para criar uma excitagao de banda alta xH a partir de urn sinal de excitagao de baixa banda xL num processador de excitagao 26. Por exemplo, invertendo-se o espectro, garante-se que as propriedades do sinal sao semelhantes na regiao de transigao entre a banda baixa e a banda alta, mas a extremidade alta do sinal de banda alta pode ter propriedades indesejaveis. Outros caminhos para gerar uma excitagao de banda alta, e levar ao desempenho de outros tipos de modulagao, os quais podem ou nao podem preservar a estrutura harmonica de uma serie de harmonicas. 0 sinal de excitagao pode ser tornado apenas a partir de uma parte da banda baixa ou mesmo de forma adaptativa, pela pesquisa na banda baixa por partes adequadas a serem utilizadas para formar o sinal de excitagao de banda alta. Esta liltima abordagem pode tambem requerer que os parametros sejam codificados de modo a que o descodif icador possa identificar as regioes utilizadas na excitagao de banda alta. A excitagao modulada xH e filtrada utilizando o filtro de LP de banda alta 1 /A para formar a sintese de banda de alta yB. Isto e feito num bloco de sintese de LP 28. A saida de yL do descodificador de CELP e junta com a sintese de banda alta yH no banco de filtros de sintese 30, para formar o sinal de saida y.
Na Fig. 2 e nas figuras seguintes as linhas de e para o multiplexador de fluxo de bits 18 e desmultiplexador de fluxo de bits 20, foram feitas respectivamente, em tracejado para indicar que elas transferem indices que representam quantidades quantificadas, em vez dos valores reais das quantidades quantificadas. A excitagao a partir da banda baixa pode ter propriedades que nao sao adequadas para serem utilizadas como excitagao de banda alta. Por exemplo, o sinal de banda de baixa contem muitas vezes estrutura harmonica forte a qual promove perturbagoes inconvenientes quando transferido para a banda alta. Uma solugao da tecnologia anterior para controlar a estrutura de excitagao, e a de misturar o sinal de excitagao de banda baixa com o ruido. Urn descodificador de exemplo de urn sistema deste tipo e mostrado na Fig. 3. Aqui, os coeficientes do filtro de LP de banda alta A, sao descodificados e o descodificador de CELP 24 e executado enquanto e feita a extracgao do sinal de excitagao, tal como descrito na Fig. 2. No entanto, a excitagao modulada Xh e tambem misturada, como ilustrado pelos multiplicadores 32, 34 e um somador 36, com urn sinal de ruido Gaussiano n a partir de um gerador de ruido 38 utilizando os respectivos factores de mistura gx(i) e gn(i) para cada sub-trama i, isto e:
(1)
Aqui xH,± representa a amostra xH da sub-trama i, de tal modo que xh=[xb,i Xb,2" 'xa,Nsvb] , onde Nsub e o ndrnero de sub-tramas. Neste exemplo Nsub = 4. Pode ser ainda benefico para se adaptar a forma temporal do sinal de ruido de n de tal modo que corresponda a forma temporal de xH.
Neste exemplo, os factores de mistura sao determinados num controlador de mistura 40 e sao baseados num parametro de sonorizagao v(i) de cada sub-trama i do codec de CELP:
(2) onde El e E2 sao as energias de trama de xH e de n, respectivamente, ou seja.:
(3) onde a trama corrente e representada com as amostras k = 0,1,2, ..., L-l. 0 parametro v(i) de sonorizagao influencia o equilibrio do componente de ruido n e a excitagao modulada xh e por exemplo, pode estar no intervalo de v(i) e [0,1]. 0 parametro de sonorizagao expressa a periodicidade do sinal (ou a tonalidade ou harmonicidade) e e calculado a partir da energia EACb do livro de codigo algebrico e a energia EFCb do livro de codigo fixo do codec de CELP, por exemplo, em conformidade com:
(4)
Onde
(5) onde Ev(i) e Ec(i) sao as energias do vector de codigo de campo dimensionado e vector de codigo algebrico dimensionado para a sub-trama i. A excitagao mista xh e filtrada no bloco de sintese de LP 28 utilizando o filtro de LP de banda alta 1/A para formar a sintese de banda de alta yH. A saida yL do descodificador de CELP e junta com a sintese de banda alta Ϋη no banco de filtros de sintese 30 para formar o sinal de saida y.
Um exemplo de um modo de realizagao de BWE no dominio do tempo com base na tecnologia aqui proposta concentra-se num codificador de audio e num sistema de descodificador principalmente destinado para aplicagoes de voz. Este modelo de realizagao reside no descodificador de um sistema de codificagao e de descodificagao, conforme descrito na Fig. 2, e com um ruido de excitagao do sistema de mistura, tal como descrito na Fig. 3. 0 acrescimo aos sistemas da anterior tecnologia e um controlo adicional em ambos, a envolvente espectral e a mistura de excitagao controlando conjuntamente a forma de envolvente de indice de ruido de excitagao com um parametro de controlo comum (ou partilhado) f, tal como exemplificado no descodificador 200 na Fig. 4. 0 parametro de controlo f e "comum", no sentido de que o mesmo parametro de controlo f e utilizado para controlar tanto a forma de envolvente como o indice de ruido de excitagao. Neste exemplo, e utilizado um linico parametro de controlo f e [0,1]. Deve, no entanto, ser notado que pode ser utilizado qualquer intervalo do parametro de controlo, por exemplo, [~A,A], [0,A], [A,0] ou [A,B] para qualquer A e B. No entanto, existe uma vantagem de ter um intervalo de unidade simples para a finalidade de controlar dois ou mais processos em conjunto. 0 controlo da envolvente espectral pode, por exemplo, ser feito utilizando um filtro posterior H(Z) formante (ilustrado em 42 na Fig. 4) da forma:
(6)
Onde A e um filtro de previsao linear representando a envolvente, e
Yir Y2 sao fungoes do parametro f de controlo.
Este filtro posterior 42 e tipicamente utilizado para a limpeza de depressoes espectrais num descodificador de CELP, e e controlado por um filtro posterior conjunto e controlador de excitagao 44. Um exemplo da enfase de envolvente do espectro obtida com um tal filtro posterior pode ser vista na Fig. 5. Neste exemplo de modelo de realizagao o filtro 42 e tornado adaptativo pela modificagao de γι, y2, utilizando o parametro f de controlo em conformidade com:
(7) onde γο, Δγ sao constantes pre-determinadas. Os valores adequados para yo podem ser yo = 0,75 ou no intervalo y0 e [0,5, 0,9], e os valores adequados para Δγ podem ser Δγ = 0,15 ou no intervalo Δγ e [0,1, 0,3] .
Contudo e de notar que yo e Δγ podem ser escolhidos de tal modo que yi e [0,1] e γ2 e [0,1]. Com esta definigao, o valor de controlo f = 1 dara a modificagao mais forte a partir do filtro posterior enquanto f = 0 ira desactivar o filtro posterior, ao definir yi = y2 que produz H(z)= 1.
Numa outra variante do filtro posterior 42 o estado de repouso do filtro para f = 0 e modificado para ter um efeito de nivelamento no espectro. Isto pode ser iltil para situagoes onde o espectro inicial tem demasiada estrutura, de tal modo que uma desactivagao do filtro posterior nao e suficiente para se atingir a quantidade desejada de enfase de depressao espectral. Nesse caso, a expressao na equagao (7) pode ser modificada como:
(8) ou
(9) onde a equagao (9) implicitamente contabiliza, para o nivelamento definido do filtro. Note-se que f = 0 neste caso gera Yi<Y2 o que significa que o filtro posterior 42 tem um efeito de nivelamento, em detrimento de enfatizar o efeito sobre a forma da envolvente. 0 efeito de nivelamento pode tambem ser alcangado atraves da extensao do intervalo do parametro f de controlo para, por exemplo f e [-1, 1] ou f e [-Ά, A] ou f e [-A, B] para os valores adequados de A e B. Neste caso, o filtro posterior 42 pode ser expresso como na equagao (7) de tal modo que um f negativo origina um efeito de nivelamento a envolvente espectral, enquanto um f positivo faz aumentar a estrutura da envolvente espectral. Pode tambem ser desejavel utilizar diferentes intensidades de filtro posterior para a enfase da estrutura espectral e de nivelamento espectral, respectivamente. Um tal metodo poderia ser a utilizagao de um Δγ diferente dependendo da indicagao do parametro f de controlo.
(10) onde ^yfiat e 2\ySharp sao constantes pre- determinadas, que controlam respectivamente, o nivelamento e a intensidade de aumento espectral. Os valores adequados podem ser AYflat. = 0,12 ou no intervalo AYflat e [0,01, 0,20] e 2\ysharp = 0,08 ou no intervalo 4ysharp e [0,01, 0,20]. A mistura de excitagao e por sua vez controlada por um controlador de mistura 41 configurado para controlar o indice de ruido de excitagao por mistura da excitagao de banda alta xH,i da sub-trama i com ruido n± de acordo com (1), onde os factores de mistura gx(±) e gn(i) sao definidos por:
(Π) onde v(i) e um parametro de sonorizagao que controla parcialmente o indice de ruido de excitagao, a e uma constante de ajustamento pre-determinada, Ei e a energia de trama de excitagoes de banda alta xH,i para todas as sub-tramas i, e E2 e a energia de trama do ruido n± para todas as sub-tramas i. A constante de ajustamento a decide a modificagao maxima comparada com a equagao (2). Um valor adequado para a pode ser a = 0,3 ou no intervalo a e [0,1]. Quando 0 parametro f de controlo esta perto de 1, os factores de mistura serao equilibrados para originarem mais ruido, enquanto f perto de 0 originara a proporgao de ruido nao modificada na mistura.
Se forem permitidos valores negativos do parametro f de controlo, uma expressao alternativa para os factores de ruido de mistura gerados pelo controlador de mistura 41 e
(12) onde V(i) e um parametro de sonorizagao que controla parcialmente 0 indice de ruido de excitagao, a e uma constante de ajustamento pre-determinada, Ei e a energia de trama de excitagoes de banda alta xH,i para todas as sub-tramas i, e E2 e a energia de trama do ruido n± para todas as sub-tramas i.
Aqui, a fungao max(a,jb) devolve o valor maximo de a e de Jb, tal como definido na equagao (14) em baixo. Na expressao acima isso asegura que urn f negativo nao influencia os valores de ruido de mistura.
Num modo de realizagao o parametro f de controlo pode ser adaptado utilizando parametros ja presentes no descodificador 200. Urn exemplo e a utilizagao da sinalizagao espectral do sinal de banda alta, uma vez que o filtro posterior 42 pode ser prejudicial em combinagao com uma forte sinalizagao espectral. Assim, o filtro posterior conjunto e o controlador de excitagao 44 podem ser configurados para adaptar o parametro f de controlo a uma sinalizagao espectral de banda alta tm da trama m. A sinalizagao espectral de banda alta pode ser aproximada utilizando o segundo coeficiente OLlrm do filtro LP descodificado A = {1, a1/m, a2,mi ···/ da trama corrente m, onde Pea ordem do filtro.
Em geral, e benefico para suavizar a adaptagao para evitar a criagao de alteragdes abruptas na na envolvente espectral, por exemplo de acordo com:
(13)
em que tm e o valor de sinalizagao espectral da trama m, tm-i e o valor de sinalizagao espectral da trama precedente m-1 e & = 0,1 ou no intervalo β = [0, 0,5]. A fungao max pode ser definida como:
(14)
Aqui a fungao max garante que o valor de sinalizagao espectral utilizado a partir da trama precedente nao e negativo. Outros exemplos para suavizar a sinalizagao espectral sao os seguintes:
(15) e (16)
Tambem pode ser desejavel considerar ambas, as inclinagdes espectrais negativas e as positivas. Neste caso, pode ser utilizado o valor absoluto da aproximagao de sinalizagao espectral, ou seja:
(17) 0 valor de sinalizagao espectral suavizado pode ser mapeado para o parametro f de controlo com uma fungao linear por etapas sucessivas:
¢18] onde Cmin e Cmax sao constantes pre-determinadas. Neste exemplo, os valores das constantes sao definidos como Cmax = 0,8 e Cmin = 0,4, mas outros valores adequados podem ser escolhidos a partir de entre a Cmax e [0,5, 2,0] e Cmin e [0, Cmax] .
Voltando a Fig. 4, utilizando os gx e gn modificados e obtido um novo sinal de excitagao xH. Este sinal e filtrado utilizando o filtro de LP de banda alta de 1 /A (em 28) para formar uma sintese de banda alta de primeiro estagio y'H. Este sinal e alimentado para o filtro posterior adaptativo H(z) (em 42) para se obter a sintese de banda alta yB. A saida yi do descodificador de CELP 24 e combinada com a sintese de banda alta yB no banco de filtros de sintese 30 para formar o sinal de saida y.
Existem outras alternativas para a adaptagao com base na sinalizagao acima descrito. Por exemplo, pode ser utilizada uma medida da nivelamento espectral da banda alta. 0 nivelamento espectral <p e medido sobre alguma representagao do espectro de banda alta. Pode, por exemplo, ser derivado a partir dos coeficientes A LPC de banda alta, utilizando a bem conhecida expressao:
(19) onde
(20) onde DFT(A,M) indica a transformada de Fourier discreta de comprimento M dos coeficientes A de LPC. A expressao | · | indica a magnitude dos valores da transformada complexa (o ponto representa uma expressao matematica), e devido a simetria da transformada apenas sao considerados os primeiros valores N = M/2. Esta transformada e implementada de preferencia com uma FFT (Transformada Rapida de Fourier) (Fast-Fourier Transform) e ο M seria a mais alta potencia mais proxima de 2 para o comprimento do filtro P+1, isto e, M =2|’log2(P+1)"1.
Se P + 1> Μ, o filtro de entrada A e preenchido com zeros antes da FFT ser executada. 0 nivelamento espectral tambem <p pode tambem ser calculada utilizando os coeficientes quantificados de LPC A. Se isto for feito, a medida de nivelamento espectral pode ser calculada no descodificador sem sinalizagao adicional. Neste caso, o sistema pode ser descrito pela Fig. 4, na condigao de que A seja substituido com A na equagao (20).
Pode ser desejavel para determinar a medida de nivelamento espectral no lado do codificador para reduzir a complexidade global, quando considerando ambos, codificador e descodificador. Num tal modelo de realizagao o codificador inclui um estimador de nivelamento espectral configurado para determinar, para a transmissao a um descodificador, uma medida de nivelamento espectral do sinal de banda alta. Esta representado na FIG 6 um codificador utilizando um estimador de nivelamento espectral 46 com base nos coeficientes de LPC. Neste caso, a medida de nivelamento deve ser sinalizada no fluxo de bits. A sinalizagao pode ser constituida por uma decisao binaria de φ e {0,1} se o nivelamento espectral for considerado alto ou baixo, dependendo de um valor de limiar <Pthr
(21) 0 correspondente parametro f de controlo pode, por exemplo, ser derivado utilizando a decisao binaria φ, isto e, f = 1 - 2<p.
Com as definigoes acima, o parametro f de controlo sera 1 para valores de nivelamento acima do limiar e -1 para valores de nivelamento abaixo do limiar. Para limitar a influencia da comutagao brusca entre estes valores, o parametro de controlo pode ainda ser suavizado, utilizando por exemplo, um factor de esquecimento β de uma forma semelhante como para a filtragem de sinalizagao:
(22)
Um descodificador 200 que corresponde ao codificador da Fig. 6 e mostrado na Fig 7. E semelhante ao descodif icador na Fig. 4. No entanto, na Fig. 7 o filtro posterior conjunto e o controlador de excitagao 44 determina o parametro f de controlo com base na decisao binaria recebida φ em vez do filtro de previsao linear A representando a envolvente. Geralmente, o parametro f de controlo esta adaptado para uma medida do nivelamento espectral (φ) da banda alta.
Deve notar-se que outros estagios de processamento podem ser possiveis antes do filtro de sintese 1/A ou antes ou apos o filtro posterior H(z) . Um tal estagio de processamento poderia ser um procedimento de modelagem temporal o qual visa reconstruir a estrutura temporal do sinal da banda alta original. Tal modelagem temporal pode ser codificada utilizando uma quantificagao de vector de ganho de forma que representa factores de corregao de ganho num nivel de sub-trama. Parte da modelagem temporal ira tambem ser herdada a partir do sinal de excitagao de banda baixa, o qual e utilizado, em parte, como uma base para o sinal de excitagao de banda alta. 0 filtro posterior e mistura de excitagao pode tambem afectar a energia dos sinais. E desejavel Manter a energia estavel e existem muitos metodos disponiveis para lidar com isto. Uma possivel solugao e a de medir a energia antes e depois da modificagao e restaurar a energia para o valor anterior ao da mistura de excitagao e de pos-filtragem. A medigao de energia pode tambem ser limitada a uma certa banda ou para as regioes de energia mais elevadas do espectro, permitindo a perda de energia nas depressoes do espectro. Neste mnodelo de realizagao de exemplo, a compensagao de energia pode ser utilizada como parte integrante das fungbes de mistura e de filtro posterior. BWE no Dominio da Frequencia A transformada de frequencia baseada em codificadores de audio e muitas vezes utilizada para sinais genericos de audio, tais como a miisica ou a fala com ruidos de fundo ou reverberagao. Para baixas taxas de bits ela geralmente mostra urn desempenho pobre. Uma solugao comum da tecnologia anterior e a de reduzir a largura de banda para se obter uma qualidade aceitavel para uma banda mais estreita e aplicar a BWE para as frequencias mais altas. Uma visao geral de urn tal sistema e mostrada na Fig. 8 0 audio de entrada e primeiro dividido em segmentos de tempo ou tramas como uma etapa de preparagao para a transformada de frequencia. Cada trama y e transformada no dominio da frequencia, para formar urn espectro Y do dominio da frequencia. Isto pode ser feito utilizando qualquer transformada adequada, tal como a Transformada do Cosseno Discreto Modificado (MDCT) ("Modified Discrete Cosine Transform"), a Transformada de Cosseno Discreta (DCT) ("Discrete Cosine Transform") ou a Transformada de Fourier Discreta (DFT) ("Discrete Fourier Transformed"). 0 espectro de frequencia e dividido em referenciados vectores de linha mais curtos Y(b). Essas fungoes sao desempenhadas por um transformador de frequencia 50. Cada vector representa agora os coeficientes de uma banda de frequencia b fora de um niimero total de bandas Nb. Sob o ponto de vista perceptual, e benefico para fazer a partigao do espectro a utilizagao de uma estrutura de banda nao-uniforme, a qual segue a resolugao de frequencia do sistema auditivo humano. Isso geralmente significa que sao utilizadas bandas estreitas para baixas frequencias, enquanto sao utilizadas maiores larguras de banda para altas frequencias.
Em seguida, a norma de cada banda e calculada num analisador de envolvente 52 para formar uma sequencia de valores de ganho E (b) que formam a envolvente espectral. Estes valores sao entao quantificados utilizando um codificador de envolvente 54 para formar a envolvente quantificada Fourier E(b) . A quantificagao da envolvente pode ser efectuada utilizando qualquer tecnica de quantificagao, por exemplo, a quantifagao escalar diferencial ou qualquer esquema de quantificagao vetocrial. Os coeficientes de Envolvente E (b) quantificados sao utilizados para normalizar os vectores da banda Y(b) dentro de um normalizador envolvente 56 para formar os vectores na correspondente forma normalizada X(b):
¢23) A sequencia de vectores de forma normalizados X(b) constitui a estrutura fina do espectro. A importancia de percepgao da estrutura fina espectral varia com a frequencia, mas pode tambem depender de outras propriedades do sinal, tais como o sinal de envolvente espectral. Codificadores de transformada empregam muitas vezes um modelo auditivo para determinar as partes importantes da estrutura fina e fazer a atribuigao dos recursos disponiveis as partes mais importantes. A envolvente espectral e muitas vezes utilizada como entrada para este modelo auditivo e a saida e tipicamente uma atribuigao de bits a cada uma das bandas correspondentes aos coeficientes da envolvente. Aqui, um algoritmo de alocagao de bits num alocador de bit 58 utiliza a envolvente quantificada E(b) em combinagao com um modelo auditivo interno para atribuir um niimero de bits R(b), que por sua vez sao utilizados por um codificador de estrutura fina 60. Quando o codificador de transformada e colocado a trabalhar para taxas de bits baixas, algumas das bandas sera atribuida com zero bits e os vectores de forma correspondentes nao serao quantificados. Os indices de IE e Ιχ provenientes da quantificagao, respectivamente da envolvente e dos vectores codificados da estrutura fina, sao multiplexados num fluxo de bits multiplexador (multiplexer) 62 para serem armazenados ou transmitidos para um descodificador. 0 descodificador demultiplexa os indices provenientes do canal de comunicagao ou a midia armazenada num desmultiplexador fluxo de bits (de-multiplexer) 70 e encaminha os indices Ix para um descodificador de estrutura fina 72 e IE para um descodif icador de envolvente 74. A envolvente quantificada E(b) e obtida e alimentada para o algoritmo de alocagao de bits num alocador de bit 76 no descodificador, o qual gera a alocagao de bits R(b). Utilizando R(b), e encontrada a banda com o maior valor diferente de zero na alocagao de bits. Esta banda e indicada por jbm^x. 0 descodificador de estrutura fina 72 utiliza os indices de estrutura fina Ix e a alocagao de bits R(b) para
A produzir os vectores da estrutura fina quantificados XL(b), que sao definidos para b =1,2,...,bmax·
Neste exemplo de modo de realizagao a frequencia de transigao e adaptativa, dependendo da alocagao de bits e comega a partir da banda ibmax + 1, dada a restrigao de que bmax + 1 ^ Nb.
Podem existir bandas b < bmax que tenham zero bits atribuidos. Em especial para baixas taxas de bits, e comum que essas bandas de zero bits aparegam e devido as variagoes no espectro, as posigoes das bandas de zero bits geralmente variam de trama para trama. Tais variagdes causam efeitos de modulagao na sintese. Tipicamente, as bandas de zero bits sao manuseadas com tecnicas espectrais de enchimento, onde os sinais sao injectados nas bandas de zero bits. 0 sinal de enchimento pode ser urn sinal de ruido pseudo-aleatorio ou uma versao modificada das bandas codificadas. A tecnica de enchimento nao e uma parte essencial da presente tecnologia e presume-se que urn enchimento espectral apropriado faz parte do descodificador de estrutura fina 72. Apos o enchimento do espectro ter sido feito, a estrutura fina de banda de baixa Xi,(b) constitui a entrada para urn modelador de envolvente de baixa frequencia 78, que restaura o espectro de banda baixa sintetizado %(b) de acordo com:
(24)
A A estrutura fina de banda de baixa Xz(b) tambem constitui a entrada para urn modificador de estrutura fina ou processador 80, que identifica o comprimento da estrutura de banda baixa a partir do parametro b„&x e gera
A urn sinal de excitagao de banda alta Xsib) definido para bm£x + 1,-bmax + 2,..., Nb. Existem muitas tecnicas para a criagao de uma excitagao de banda alta a partir da excitagao de banda baixa. Neste exemplo de modelo de realizagao, a metade superior da excitagao de banda baixa e dobrada e duplicada para preencher a excitagao de banda
A alta. Assume-se que Xlh representa a metade superior do sinal de excitagao de banda baixa e que a fungao de rev (.) inverte os elementos de um vector. Em seguida, a sequencia
// Λ A de [rev(XLH) Xlh rev(XLii) Xl‘ ' ' ] e repetida por tantas vezes quantas as necessarias para preencher o espectro de excitagao da banda alta ΧηΦ) r &max Ί" 1 t bmax "t 2,..., Nfc. 0 sinal de excitagao de banda alta e, em seguida, colocado na entrada para um modificador de envolvente de frequencia alta 82 para formar o espectro de banda alta sintetizado yB(b) de acordo com:
(25) 0 espectro de banda baixa sintetizado Yzib) e o espectro de banda alta sintetizado ΫηΦ) sao combinados num combinador de espectro 84 para formar o espectro de sintese Y(b), ou Ϋ com o indice de banda omitido. 0 espectro de sintese constitui a entrada para o transformador de frequencia inversa 86 para formar o sinal de saida y. Neste processo, tambem sao realizadas a criagao necessaria de janelas e as operagbes de sobreposigao e de adigao que estejam relacionadas com a transformada de frequencia.
Tal como foi o caso da BWE no dominio do tempo, a excitagao de banda baixa pode ter propriedades que nao sao adequadas para serem utilizadas como excitagao de banda alta. Em particular, pode-se desejar nivelar alguma da estrutura fina na excitagao de banda baixa. Um descodificador de um tal sistema de exemplo e mostrado na
Fig. 9. Este sistema da anterior tecnologia assume um codificador tal como delineado na Fig. 8. A adigao para com o esquema descrito ha um compressor H (no 88) , que opera Λ sobre o sinal de excitagao de banda alta ΧηΦ) para produzir o sinal de excitagao de banda alta comprimido XB(b). Um exemplo da fungao de compressor e:
(26) o que significa que H e um vector com o mesmo Λ .., comprimento de XH. Aqui, o indice de banda b foi omitido e o vector representa todos os elementos para as bandas definidas, isto e:
(27) 0 factor de compressao η e menor do que 1 e um valor adequado pode ser η = 0,5 ou no intervalo η e [0,01, 0,99], em que valores proximos de 0 nao conferem qualquer efeito e os valores de perto de 1 conferem o maximo de compressao. A sintese de banda alta comprimida e obtida
A pela multiplicagao de elemento a elemento de H e XH. Ela pode ser expressa como uma multiplicagao de matrizes:
(28) /S Λ onde diag (XH) produz uma matriz quadrada com XH na diagonal. A excitagao de banda alta comprimida XH(b) constitui a entrada para o modificador da envolvente de alta frequencia 82 para formar o espectro de banda alta ΫηΦ) de acordo com:
(29)
Tal como ilustrado na figura 9, o espectro de banda baixa Ϋι,(&) e o espectro de banda alta Yn(b) sao combinados no combinador de espectro 84 para formar o espectro de sintese Ϋ o qual constitui a entrada para o transformador de frequencia inversa 86 para formar o sinal de saida y.
Urn exemplo de modo de realizagao da BWE no dominio da frequencia com base na tecnologia proposta foca-se sobre um sistema de codificador e descodificador de audio, principalmente destinado para sinais de audio genericos. A nova tecnologia reside principalmente no descodificador de um sistema de codificagao e de descodificagao, conforme descrito na Fig. 8, com um sistema de compressao de excitagao, tal como ilustrado na Fig. 9. Um exemplo de modelo de realizagao de um tal descodificador 200 esta ilustrado na Fig. 10.
Como uma adigao a anterior tecnologia, e proporcionado um controlo combinado de uma compressao de excitagao de banda alta, que e controlada em conjunto com um expansor de envolvente espectral 90 como mostrado na Fig. 10. Tal como no dominio do tempo, e utilizado um parametro de controlo f e [0,1] para orientar ambos, o compressor 88 e o expansor 90. Isto e desempenhado por um conjunto de expansor e de controlador de compressao 92. A intensidade de banda alta do compressor de excitagao 88 esta adaptada utilizando o parametro f de controlo em conformidade com:
(30) onde Δη origina o expoente maximo de factor de compressao η + Δη quando f = 1. Se η = 0,5, entao, um valor adequado para Δη podera ser Δη = 0,3 ou no intervalo Δη e [0,01,1-1)] . Note-se que η + Δη ^1. A excitagao da banda alta comprimida e obtida pela multiplicagao elemento a
A elemento de H e XH, ou seja:
(31) 0 expansor 90 utilizado na envolvente de banda alta tern uma estrutura semelhante como a do compressor de excitagao de banda alta:
(32)
Aqui, o valor absoluto |· | pode ser omitido, uma vez que os coeficientes da envolvente E(b)Z 0. Para f = 0 o expansor tera efeito minimo com o coeficiente de expansao φ. Um valor adequado para <p pode ser φ = 0, uma vez que isto, para f = 0, daria uma envolvente nao afectada. Se um pequeno efeito de expansao for sempre desejavel, os valores adequados podem, por exemplo, ser escolhidos a partir do intervalo φ e [0, 0,5]. A expansao maxima e obtida para f = 1, o que origina o expoente do factor de expansao -(φ + Δφ) 0 valor para Δφ pode ser definido para Δφ = 1, mas o valor adequado vai depender fortemente da estrutura de banda e pode ser escolhido de entre um vasto intervalo, por exemplo, Δφ e [0,5, 10]. A envolvente expandida E (b) e obtida pela multiplicagao elemento a elemento da envolvente com a fungao de expansao G, isto e:
(33)
onde Εά represents os elementos da envolvente de banda alta ER = [Ej (bmaX + 1) E (bm&K +2)··· E (Nb) ] . A envolvente expandida e aplicada a estrutura fina de banda Δ alta comprimida para formar o espectro de banda alta ΥηΦ) de acordo com:
(34) 0 espectro de baixa banda sintetizado Yi,(b) e o espectro de banda alta sintetizado Ya(b) sao combinados no combinador de espectro 84 para formar o espectro de sintese Y o qual constitui a entrada para o transf ormador de frequencia inversa 86 para formar o sinal de saida y. 0 parametro f de controlo conjunto pode ser derivado a partir de parametros ja disponiveis no descodificador 200, ou pode ser baseado na analise feita no codificador e transmitida para o descodificador. Aqui, como no caso de BWE dominio do tempo, contamos com uma estimativa sobre a sinalizagao espectral de banda alta. Uma tal estimativa pode ser derivada a partir dos parametros de envolvente medindo o quociente qm da soma dos coeficientes de envolvente em cada metade do sinal de banda alta, ou se j a:
(35) onde
(36) A suavizagao da sinalizagao espectral tm para a trama m pode ser feita da mesma maneira que no modelo de realizagao no dominio do tempo, utilizando por exemplo:
(37) 0 mapeamento da sinalizagao espectral para o parametro f de controlo pode tambem ser efectuado utilizando a mesma fungao linear por etapas sucessivas como no modelo de realizagao no dominio do tempo, ou seja:
(38)
No entanto, uma vez que a definigao da sinalizagao espectral e diferente, consoante as constantes Clnax e Cmin da fungao de mapeamento sejam diferentes. Estas irao, por exemplo, depender da estrutura de banda.
Em alternativa ao modelo de realizagao no dominio de frequencia acima descrito, o controlo conjunto de envolvente e de excitagao e adaptado ao sinal de erro de banda baixa, o qual e estimado no codificador, o qual e semelhante ao eodifieador no sistema descrito na Fig. 8, mas tern ainda uma unidade de descodificagao local e de medigao de erro. Urn exemplo de urn tal sistema e mostrado na Fig. 11, em que a unidade de descodif icagao local e de medigao de erro inclui urn descodificador local 96, urn extractor de espectro de baixa frequencia 98, urn somador 100 e urn codificador de erro de baixa frequencia 102. Neste modelo de realizagao, e obtida uma sintese de banda baixa local utilizando a envolvente quantizada E (b) e uma Λ estrutura fina de banda baixa descodificada Xl(b), a qual e extraida a partir do codificador de estrutura fina. Pode tambem ser possivel de fazer correr completamente o descodif icador de estrutura fina para extrair Xi.(b) a partir dos indices Ιχ, mas uma sintese local, em geral, pode ser extraida com menos complexidade computacional a partir do codificador. Um espectro de banda baixa localmente sintetizado ΫώΦ) e gerado ao modelar a estrutura de banda baixa decodificada com a envolvente quantificada:
(39) 0 espectro de banda baixa do sinal de entrada yL(b) e extraido a partir do espectro completo ao encontrar a liltima banda quantif icada, utilizando a alocagao de bit R(b). Um sinal de erro de banda baixa e formado como o racio entre o log (logaritmo) da energia do sinal de entrada e a distancia Euclidiana entre o espectro de banda baixa sintetizado a partir do espectro da banda baixa de entrada, ou seja, uma medida DL de um racio de sinal-ruido (SNR) na sintese de banda baixa definida como:
(40) A SNR de banda baixa e quantificada e os indices de quantificagao Ierr sao multiplexados em conjunto com os indices Ie da envolvente e os indices da estrutura fina Ιχ para serem armazenados ou transmitidos a um descodificador. A codificagao de SNR baixa pode ser efectuada, por exemplo, utilizando um quantificador uniforme escalar. 0 descodificador 200 e semelhante ao descodificador descrito na Fig. 9, mas tern ainda um controlo combinado de uma compressao de excitagao de banda alta, que e controlada em conjunto com um expansor de envolvente espectral como mostrado na Fig. 10. Tal como nos modelos de realizagao no dominio do tempo, e utilizado um parametro f e [0,1] de controlo para orientar tanto o compressor como o expansor.
Utilizando o parametro f de controlo a intensidade do compressor de excitagao de banda alta e adaptada de acordo com:
(41) onde Δτ] orig ina o factor de compressao maximo τ\+Δΐ\ quando f = 1. Se η=0,5, entao um valor adequado para pode ser = 0,3 ou no intervalo Δι\ e [0,01, 1 — η 1 *
Note-se que η-Μη^1. A excitagao de banda alta comprimida e Λ obtida pela multiplicagao elemento a elemento de H e Xh em conformidade com:
(42) 0 expansor utilizado na envolvente de banda alta tern uma estrutura semelhante com a do compressor de excitagao de banda alta:
(43)
Aqui, o valor absoluto I · I pode ser omitido uma vez que os coeficientes da envolvente E(b)½ 0. Para f = 0 o expansor tera efeito minimo, com o coeficiente de expansao φ. Um valor adequado para φ pode ser φ = 0, uma vez que isto daria uma envolvente inalterada para f = 0. Se e sempre desejavel um efeito de expansao pequeno, os valores adequados podem por exemplo ser escolhidos a partir do intervalo de φ e [0, 0,5]. A expansao maxima e obtida para f = 1, o que origina o expoente de factor de expansao -(φ+2\φ) . 0 valor para ^<p pode ser definido como 4φ = 1, mas o valor adequado vai depender fortemente da estrutura da banda e pode ser escolhido a partir de um vasto intervalo, por exemplo, 4φ e [0,5, 10]. A envolvente E(b) expandida e obtida pela multiplicagao elemento a elemento da envolvente com a fungao de expansao G, ou seja:
(33)
onde Eh representa os elementos da envolvente de banda alta EH = [E (bm^x + 1) E (bmax +2)-. E (Nb) ] . A envolvente expandida e aplicada a estrutura fina de banda alta comprimida Xh(£>) para formar o espectro de banda alta YH(b) de acordo com:
(34) 0 espectro de baixa banda sintetizado Yi.(b) e o espectro de banda alta sintetizado ΫηΦ) sao combinados no combinador de espectro para formar o espectro de sintese Ϋ o qual constitui a entrada para o transformador de frequencia inversa para formar o sinal de saida y.
Neste modo de realizagao o parametro f de controlo e baseado na SNR de banda baixa a partir da Λ analise de codificador. Primeiro, e obtida uma SNR DL de banda baixa reconstruida a partir do indice de erro I err de banda baixa. A SNR de banda baixa reconstruida e mapeada para um parametro f de controlo utilizando uma fungao linear por etapas sucessivas:
(46) onde as constantes D^n e Dmax dependem dos valores de distorgao de banda baixa tipicos para este sistema. Um valor adequado para Dmin podem ser Dmin = 10 ou qualquer valor no intervalo Dmin e [5, 20], enquanto os valores adequados para Dmax podem ser Dmx = 2 0 ou no intervalo Dmax e [10, 50]. Esta relagao ira originar a modificagao mais forte para valores de SNR elevados, correspondendo a baixa distorgao na banda baixa. Tambem pode ser desejavel ter a relagao oposta, de tal forma que a modificagao forte seria utilizada para SNR's baixas (valores de distorgao elevados) . Uma tal relagao pode ser obtida atraves da inversao da relagao acima descrita, ou seja:
(47)
Deve notar-se que a fungao de compressao e de expansao pode alterar a energia global dos vectores. De preferencia, a energia deve ser mantida estavel e existem muitos metodos disponiveis para lidar com isso. Uma solugao possivel e a de medir a energia antes e depois da modificagao e restaurar a energia para o valor antes da compressao ou da expansao. A medigao de energia pode tambem ser limitada a uma certa banda ou para regioes de energia mais elevadas do espectro, permitindo a perda de energia nas depressoes do espectro. Neste modelo de realizagao exemplificativo, presume-se que e utilizada alguma compensagao de energia e que e uma parte integrante das fungoes do compressor e do expansor.
As etapas, fungoes, procedimentos e/ou blocos aqui descritos podem ser implementados em hardware utilizando qualquer tecnologia convencional, tal como circuitos discretos ou tecnologia de circuitos integrados, incluindo ambos, os circuitos electronicos de utilizagao geral e circuitos para aplicagao especifica.
Em alternativa, pelo menos algumas das etapas, fungoes, procedimentos e/ou blocos aqui descritos podem ser implementados em software para execugao por equipamento de processamento apropriado. Este equipamento pode incluir, por exemplo, um ou varios micro-processadores, um ou varios Processadores de Sinais Digitais (DSP) ("Digital Signal Processors"), um ou varios Circuitos Integrados de Aplicagao Especificos (ASIC) ("Application Specific Integrated Circuits"), hardware acelerado de video ou um de varios dispositivos logicos programaveis adequados, tais como dispositivos de Arranjo Disposicional de Portas Programavel em Campo (FPGA) ("Field Programmable Gate Arrays"). Sao tambem viaveis as combinagoes de tais elementos de processamento.
Deve tambem ser entendido que pode ser possivel reutilizar as capacidades de processamento gerais ja presentes no codificador/descodificador. Isto pode, por exemplo, ser efectuado por reprogramagao do software existente ou atraves da adigao de novos componentes de software . A Fig. 13 ilustra um exemplo de modelo de realizagao de um dispositivo de arranjo de controlo. Este modelo de realizagao e baseado num processador 210, por exemplo, um micro-processador, que executa o software 220 para controlar em conjunto a forma de envolvente e o indice de ruido de excitagao com um parametro de controlo comum. 0 software e armazenado na memoria 230. 0 processador 210 comunica com a memoria do sistema atraves de um "bus" (barramento). Os sinais de entrada sao recebidos por um controlador de entrada/saida (I/O) (Input/Output
Entrada/Saida) 240 que controla um "bus" (barramento) de I/O, com o qual estao ligados o processador 210 e a memoria 230. Os sinais de saida obtidos a partir do software 220 sao cololcados na saida a partir da memoria 230 pelo controlador de I/O 240 sobre o "bus" (barramento) de I/O. Os sinais de entrada e de saida dentro de parentesis correspondem a BWE no dominio do tempo e os sinais de entrada e de saida sem parentesis correspondem a BWE no dominio da frequencia.
Urn modo de realizagao com base numa medida de nivelamento espectral φ pode ser estruturalmente configurado como na Fig. 13 com urn processador, memoria, bus (barramento) de sistema, controlador de entrada/saida I/O e "bus" (barramento) de I/O. A tecnologia acima descrita destina-se a ser utilizada num codificador/descodificador de audio, que pode ser utilizado num dispositivo movel (por exemplo, o telefone movel, o portatil) ou num dispositivo estacionario, tal como urn computador pessoal. Aqui, o termo Equipamento de Utilizador (UE) ("User Equipment") ira ser utilizado como uma designagao generica para tais dispositivos. A FIG. 14 ilustra urn UE incluindo urn descodificador proporcionado com urn dispositivo de arranjo de controlo. Urn sinal de radio recebido por uma unidade de radio 300 e convertido para banda de base, o canal descodificado e encaminhado para urn descodificador de audio 200. 0 descodificador de audio e proporcionado com urn dispositivo de arranjo de controlo 310 que actua nos dominios do tempo ou da frequencia, como acima descrito. As amostras de audio de larguras de banda estendidas e descodificadas sao encaminhadas para uma unidade de amplificagao e de conversao D/A 320, a qual encaminha o sinal de audio final para um altifalante 330. A Fig. 15 e um fluxograma que ilustra a tecnologia proposta. A etapa SI controla conjuntamente a forma de envolvente e a de indice de ruido de excitagao com um parametro f de controlo comum. A Fig. 16 e um fluxograma que ilustra um exemplo de modelo de realizagao da tecnologia proposta. Neste modelo de realizagao a etapa SI inclui uma etapa S1A que controla a forma da envolvente pela utilizagao de um filtro posterior formante de H(z), por exemplo tendo a forma definida pela equagao (6). As constantes pre-determinadas Yir Y2, pode, por exemplo, serem determinadas de acordo com uma das equagoes (7) - (10) . A Fig. 17 e um fluxograma que ilustra um modelo de realizagao da tecnologia proposta. Neste modelo de realizagao a etapa SI inclui uma etapa SIB que controla o indice de ruido de excitagao pela mistura de uma excitagao de banda alta Xh,± de uma sub-trama i com ruido n± de acordo com a equagao (1), em que os factores de mistura gx(i) e gn(i) sao definidos, por exemplo, a equagao (11) ou (12), dependendo da escolha das constantes pre-determinadas γ±, Y2- A Fig. 18 e um fluxograma que ilustra um modelo de realizagao da tecnologia proposta. Neste modelo de realizagao a etapa SI inclui uma etapa SIC que adapta o parametro f de controlo a uma sinalizagao espectral de banda alta tm da trama m, por exemplo, em conformidade com a equagao (18) . Num modelo de realizagao a sinalizagao espectral de banda alta tm pode ser aproximada utilizando o segundo coeficiente aim, do filtro de previsao linear descodificado An = {1, ai,m, &2,m, ..., ap,m} da trama m, onde Pea ordem do filtro. Em geral, e tambem benefico para suavizar a sinalizagao espectral de banda alta tm, por exemplo, de acordo com uma das equagoes (13), (15) - (17).
Um modo de realizagao com base numa medigao do nivelamento espectral φ pode desempenhar a etapa SIC utilizando a abordagem descrita com referenda as equagoes (19) - (22) A Fig. 19 e um fluxograma que ilustra um modelo de realizagao da tecnologia proposta. Este modelo de realizagao combina as etapas descritas S1A, SIB, SIC. Tipicamente o parametro f de controlo e determinado em primeiro lugar. Em seguida, e utilizado para desempenhar as etapas S1A e SIB. Outras combinagoes incluindo S1A+S1C ou S1B+S1C tambem sao possiveis.
Sera entendido pelos peritos na materia que, para a tecnologia proposta, varias modificagbes e alteragoes podem ser efectuadas sem afastamento do ambito da mesma, a qual e definida pelas reivindicagbes anexas.
ABREVIATURAS ASIC Application Specific Integrated Circuit (Circuitos Integrados de Aplicagao Especificos) BWE Bandwidth Extension (Extensao da Largura de Banda) CELP Code Excited Linear Predictor (Dispositivo de Previsao por Excitagao de Codigo) DCT Discrete Cosine Transform (Transformada de Cosseno Discreta) DFT Discrete Fourier Transform (Transformada Discreta de Fourier) DSP Digital Signal Processor (Processador de Sinai Digital) FFT Fast-Fourier Transform (Transformada Rapida de Fourier) FPGA Field Programmable Gate Arrays (Arranjo Disposicional de Portas Programavel em Campo) HF High Frequency (Alta Frequencia) LF Low Frequency (Baixa Frequencia) LP Linear Predictor (Dispositivo de Previsao Linear) LPC Linear Predictive Coding (Codificagao Linear de Previsao) MDCT Modified Discrete Cosine Transform (Transformada do Cosseno Discreto Modificado) QMF Quadrature Mirror Filter (Filtro de Espelho em Quadratura) SBR Spectral Band Replication (Replicaqao da Banda Espectral) SNR Signal-to-Noise Ratio (Racio/Relagao Sinal-Ruido) TCX Transform coded residual (Transformada Codificada Residual) UE User Equipment (Equipamento de Utilizador)
REFERENCIAS
[1] "AMR-WB+: A new audio coding standard for 3rd generation mobile audio services", J. Makinen, B. Bessette, S. Bruhn, P. Ojala, R. Salami, A. Taleb, ICASSP 2005 [2] "Enhanced aacPlus encoder Spectral Band Replication (SBR) part", 3GPP TS 26.404 V10.0.0 (2011-03), sections 5.6.1 - 5.6.3, pp. 22-25.
Claims (15)
1. Metodo de geragao de uma extensao de banda alta de um sinal de audio a partir de uma envolvente e de uma excitagao, em que o metodo inclui a etapa (SI) de em conjunto controlar a forma de envolvente e de indice de ruido de excitagao com um parametro f de controlo comum, sendo a referida forma de envolvente controlada (S1A) pela utilizagao de um filtro posterior formante H(z) da forma:
onde A e um filtro de previsao linear representando a envolvente, e Vi, Y2 sao fungoes do parametro f de controlo.
2. 0 metodo da reivindicagao 1, em que
onde γο, Δγ sao constantes pre-determinadas.
3. 0 metodo da reivindicagao 1 ou 2, incluindo a etapa de controlo (SIB) do indice de ruido de excitagao por mistura de uma excitagao de banda alta xH/i de uma sub-trama i com ruido rij de de acordo com:
onde os factores de mistura gx(i) e gn(i) sao definidos por:
onde v(i) e um parametro de sonorizagao que controla parcialmente o indice de ruido de excitagao, a e uma constante de ajustamento pre-determinada, Ei e a energia de trama de excitagoes de banda alta xH,i para todas as sub-tramas i, e E2 e a energia de trama do ruido n± para todas as sub-tramas i.
4. 0 metodo da reivindicagao 1, em que
onde γο, &Yf]at e AYSharp sao constantes pre-determinadas.
5. 0 metodo da reivindicagao 4, incluindo a etapa de controlo (SIB) do indice de ruido de excitagao por mistura de uma excitagao de banda alta, xH± de uma sub-trama i com ruido n± de acordo com:
onde os factores de mistura gx(i) e gn(i) sao definidos por:
onde v(i) e urn parametro de sonorizagao que controla parcialmente o indice de ruido de excitagao, a e uma constante de ajustamento pre-determinada, E]_ e a energia de trama de excitagoes de banda alta xH,i para todas as sub-tramas i, e E2 e a energia de trama do ruido n± para todas as sub-tramas i.
6. 0 metodo de qualquer uma das reivindicagoes precedentes, incluindo a etapa de adaptagao (SIC) 0 parametro f de controlo para uma sinalizagao espectral de banda alta tm da trama m, e em que 0 parametro f de controlo depende da sinalizagao espectral de banda alta tm de acordo com:
onde Cmin e Cmax sao constantes pre-determinados.
7. 0 metodo da reivindicagao 6, em que a sinalizagao espectral de banda alta tm e aproximada utilizando o segundo coeficiente de ai,m do filtro de previsao linear descodificado Am = {1, ai,mr a2rm, ···, ap,m} da trama m, onde Pea ordem do filtro, e em que onde
tm e o valor de sinalizagao espectral da trama m, tm-i e o valor de sinalizagao espectral da trama precedente m-1, e β e uma constante no intervalo β = [0, 0,5] .
8. Urn descodificador de audio (200) configurado para gerar uma extensao de banda alta de urn sinal de audio a partir de uma envolvente e uma excitagao, incluindo urn dispositivo de arranjo de controlo (41, 42, 44; 88, 90, 92; 310) configurado para em conjunto controlar a forma de envolvente e o indice de ruido de excitagao com urn parametro f de controlo comum, incluindo o referido dispositivo de arranjo de controlo (41, 42, 44) urn filtro posterior de conjunto e controlador de excitagao (44) configurado para controlar a forma da envolvente utilizando um filtro posterior formante (42) H(z) da forma: onde
A e um filtro de previsao linear representando a envolvente, e yj, γ2 sao fungoes do parametro f de controlo.
9. 0 descodificador de acordo com a reivindicagao 8, em que
onde Yo, Δγ sao constantes pre-determinadas.
10. 0 descodificador das reivindicagtes 8 ou 9, incluindo um controlador de mix (41) configurado para controlar o indice de ruido de excitagao por mistura de uma excitagao de banda alta, xh,i de uma sub-trama i com ruido n± de acordo com:
onde os factores de mistura gx(i) e gn(i) sao definidos por:
onde v(i) e um parametro de sonorizagao que controla parcialmente o indice de ruido de excitagao, a. e uma constante de ajustamento pre-determinada, Ei e a energia de trama de excitagoes de banda alta xH,i para todas as sub-tramas i, e E2 e a energia de trama do ruido n± para todas as sub-tramas i.
11. 0 descodif icador de acordo com a reivindicagao 8, em que
onde γο, AYfiat e AYSharp sao constantes pre-determinadas.
12. 0 descodif icador de acordo com a reivindicagao 11, incluindo um controlador de mix (41) configurado para controlar o indice de ruido de excitagao por mistura de uma excitagao de banda alta xHi, de uma sub-trama i com ruido n± de acordo com:
onde os factores de mistura gx(i) e gn(i) sao definidos por : onde
v(i) e urn parametro de sonorizagao que controla parcialmente o indice de ruido de excitagao, a e uma constante de ajustamento pre-determinada, Ei e a energia de trama de excitagoes de banda alta xHf± para todas as sub-tramas i, e E2 e a energia de trama do ruido n± para todas as sub-tramas i.
13. 0 descodif icador de qualquer uma das reivindicagoes precedentes 8 a 12, em que o filtro posterior de conjunto e de excitagao do controlador (44) esta configurado para adaptar o parametro f de controlo para uma sinalizagao espectral de banda alta tm da trama m, e em que o parametro f de controlo depende da sinalizagao espectral de banda alta tm de acordo com:
onde Cmin e Cmax sao constantes pre-determinadas.
14. 0 descodif icador de acordo com a reivindicagao 13, em que o filtro posterior de conjunto e de excitagao do controlador (44) esta configurado para aproximar a sinalizagao espectral de banda alta tm pela utilizagao do segundo coeficiente de ai/m do filtro de previsao linear descodificado Am = {1, ai,mr a2,m, ···/ ap,m} da trama m, onde Pea ordem do filtro, e em que onde
tm e o valor de sinalizagao espectral da trama m, tm-i e o valor de sinalizagao espectral da trama precedente m-1, e β e uma constante no intervalo β = [0, 0,5].
15. Urn equipamento de utilizador (UE) que inclui um descodificador de audio de acordo com qualquer uma das reivindicagdes anteriores 8 a 14. Lisboa, 8 de Setembro de 2016
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161554573P | 2011-11-02 | 2011-11-02 | |
US201261589618P | 2012-01-23 | 2012-01-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
PT2791937T true PT2791937T (pt) | 2016-09-19 |
Family
ID=48192965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PT128457439T PT2791937T (pt) | 2011-11-02 | 2012-09-04 | Geração de uma extensão da banda alta de um sinal de áudio de largura de banda estendida |
Country Status (9)
Country | Link |
---|---|
US (1) | US9251800B2 (pt) |
EP (2) | EP2791937B1 (pt) |
CN (1) | CN104221081B (pt) |
DK (1) | DK2791937T3 (pt) |
ES (1) | ES2582475T3 (pt) |
MX (1) | MX2014004670A (pt) |
PL (1) | PL2791937T3 (pt) |
PT (1) | PT2791937T (pt) |
WO (1) | WO2013066238A2 (pt) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9082398B2 (en) * | 2012-02-28 | 2015-07-14 | Huawei Technologies Co., Ltd. | System and method for post excitation enhancement for low bit rate speech coding |
CN104221082B (zh) | 2012-03-29 | 2017-03-08 | 瑞典爱立信有限公司 | 谐波音频信号的带宽扩展 |
CN103928029B (zh) | 2013-01-11 | 2017-02-08 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CN105551497B (zh) | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
EP2981958B1 (en) * | 2013-04-05 | 2018-03-07 | Dolby International AB | Audio encoder and decoder |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
US9666202B2 (en) | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
FR3017484A1 (fr) | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
WO2015162500A2 (ko) | 2014-03-24 | 2015-10-29 | 삼성전자 주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
PL3550563T3 (pl) * | 2014-03-31 | 2024-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enkoder, dekoder, sposób enkodowania, sposób dekodowania oraz powiązane programy |
US9697843B2 (en) | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN106409304B (zh) * | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
CN105225671B (zh) * | 2014-06-26 | 2016-10-26 | 华为技术有限公司 | 编解码方法、装置及系统 |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
CN110556122B (zh) * | 2019-09-18 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
RU2747368C1 (ru) * | 2020-07-13 | 2021-05-04 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Способ мониторинга и управления информационной безопасностью подвижной сети связи |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW326070B (en) * | 1996-12-19 | 1998-02-01 | Holtek Microelectronics Inc | The estimation method of the impulse gain for coding vocoder |
US7512535B2 (en) * | 2001-10-03 | 2009-03-31 | Broadcom Corporation | Adaptive postfiltering methods and systems for decoding speech |
DE60214027T2 (de) * | 2001-11-14 | 2007-02-15 | Matsushita Electric Industrial Co., Ltd., Kadoma | Kodiervorrichtung und dekodiervorrichtung |
US20050004803A1 (en) | 2001-11-23 | 2005-01-06 | Jo Smeets | Audio signal bandwidth extension |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
KR100707174B1 (ko) * | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
BR122017003818B1 (pt) * | 2008-07-11 | 2024-03-05 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | Instrumento e método para geração de sinal estendido de largura de banda |
US8942388B2 (en) * | 2008-08-08 | 2015-01-27 | Yamaha Corporation | Modulation device and demodulation device |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2502230B1 (en) * | 2009-11-19 | 2014-05-21 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved excitation signal bandwidth extension |
KR101423737B1 (ko) * | 2010-01-21 | 2014-07-24 | 한국전자통신연구원 | 오디오 신호의 디코딩 방법 및 장치 |
-
2012
- 2012-09-04 PT PT128457439T patent/PT2791937T/pt unknown
- 2012-09-04 EP EP12845743.9A patent/EP2791937B1/en active Active
- 2012-09-04 WO PCT/SE2012/050937 patent/WO2013066238A2/en active Application Filing
- 2012-09-04 MX MX2014004670A patent/MX2014004670A/es active IP Right Grant
- 2012-09-04 EP EP16172897.7A patent/EP3089164A1/en active Pending
- 2012-09-04 US US14/355,811 patent/US9251800B2/en active Active
- 2012-09-04 PL PL12845743.9T patent/PL2791937T3/pl unknown
- 2012-09-04 DK DK12845743.9T patent/DK2791937T3/en active
- 2012-09-04 ES ES12845743.9T patent/ES2582475T3/es active Active
- 2012-09-04 CN CN201280053336.3A patent/CN104221081B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
US20140257827A1 (en) | 2014-09-11 |
EP2791937A2 (en) | 2014-10-22 |
EP2791937B1 (en) | 2016-06-08 |
EP3089164A1 (en) | 2016-11-02 |
WO2013066238A2 (en) | 2013-05-10 |
CN104221081B (zh) | 2017-03-15 |
MX2014004670A (es) | 2014-05-28 |
CN104221081A (zh) | 2014-12-17 |
DK2791937T3 (en) | 2016-09-12 |
US9251800B2 (en) | 2016-02-02 |
WO2013066238A3 (en) | 2013-08-01 |
ES2582475T3 (es) | 2016-09-13 |
PL2791937T3 (pl) | 2016-11-30 |
EP2791937A4 (en) | 2015-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PT2791937T (pt) | Geração de uma extensão da banda alta de um sinal de áudio de largura de banda estendida | |
PT1864282T (pt) | Sistemas, métodos, e aparelho para codificação de fala em banda larga | |
DK3174051T3 (en) | SYSTEMS AND PROCEDURE FOR CARRYING OUT NOISE MODULATION AND AMPLIFY ADJUSTMENT | |
EP3471098A1 (en) | High-band signal modeling | |
DK3055861T3 (en) | ASSESSMENT OF MIXTURE FACTORS TO GENERATE HIGHBAND EXCITATION SIGNAL | |
JP2016541032A5 (pt) | ||
TWI529701B (zh) | 用於使用增強信號成形技術產生頻率增強信號之裝置及方法 | |
TW201521020A (zh) | 用於高頻帶時間特性改善追踪之增益形狀估計 | |
US20150149157A1 (en) | Frequency domain gain shape estimation | |
TWI544482B (zh) | 用於使用能量限制操作產生頻率增強信號之裝置及方法 |