[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

BRPI0717484B1 - Método e aparelho para processar um sinal de áudio - Google Patents

Método e aparelho para processar um sinal de áudio Download PDF

Info

Publication number
BRPI0717484B1
BRPI0717484B1 BRPI0717484-5A BRPI0717484A BRPI0717484B1 BR PI0717484 B1 BRPI0717484 B1 BR PI0717484B1 BR PI0717484 A BRPI0717484 A BR PI0717484A BR PI0717484 B1 BRPI0717484 B1 BR PI0717484B1
Authority
BR
Brazil
Prior art keywords
audio signal
audio
level
signal
dynamics
Prior art date
Application number
BRPI0717484-5A
Other languages
English (en)
Inventor
Alan Jeffrey Seefeldt
Kenneth James Gundry
Original Assignee
Dolby Laboratories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation filed Critical Dolby Laboratories Licensing Corporation
Publication of BRPI0717484A2 publication Critical patent/BRPI0717484A2/pt
Publication of BRPI0717484B1 publication Critical patent/BRPI0717484B1/pt

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/005Control by a pilot signal
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/09Arrangements for device control with a direct linkage to broadcast information or to broadcast space-time; Arrangements for control of broadcast-related services
    • H04H60/11Arrangements for counter-measures when a portion of broadcast information is unavailable
    • H04H60/12Arrangements for counter-measures when a portion of broadcast information is unavailable wherein another information is substituted for the portion of broadcast information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuits Of Receivers In General (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

método e aparelho para processar um sinal de áudio a presente invenção refere-se a um processador ou método de processamento de dinâmicas de áudio que usa um mecanismo ou processo de reinicialização para se adaptar rapidamente a mudanças de conteúdo no sinal de áudio. um sinal de reinicialização pode ser gerado pela análise do próprio sinal de áudio ou a reinicialização pode ser disparada de um evento externo como, por exemplo, uma mudança de canal em um aparelho de televisão ou uma mudança na seleção de entrada em um receptor de áudio/visual. no caso de um disparo externo, um ou mais indicadores do estado do processador de dinâmicas para uma fonte de áudio em curso pode ser salvo e associado àquela fonte de áudio antes de comutar para uma nova fonte de áudio. então, se o sistema comutar de volta para a primeira fonte de áudio, o processador de dinâmicas pode ser reinicialização para o estado anteriormente armazenado ou uma aproximação do mesmo.

Description

Relatório Descritivo da Patente de Invenção para MÉTODO E APARELHO PARA PROCESSAR UM SINAL DE ÁUDIO. Campo da Técnica [001] A presente invenção refere-se a um processamento de sinal de vídeo. Especificamente, a presente invenção refere-se a um processador ou método de processamento de dinâmicas de áudio que usa um mecanismo ou processo de reinicialização a fim de se adaptar rapidamente às mudanças de conteúdo no sinal de áudio. Um sinal de reinicialização pode ser gerado pela análise do próprio sinal de áudio ou a reinicialização pode ser disparada de um evento externo como, por exemplo, uma mudança de canal em um aparelho de televisão ou uma troca de seleção de entrada em um receptor de áudio/visual. No caso de um disparo externo, um ou mais indicadores do estado do processador de dinâmicas para uma fonte de áudio em curso pode ser salvo e associado àquela fonte de áudio antes de conectar uma nova fonte de áudio. Então, se o sistema tornar a conectar a primeira fonte de áudio, o processador de dinâmicas pode ser reinicializado para o estado anteriormente armazenado ou em uma aproximação do mesmo. A invenção também se refere a programas de computador para praticar tais métodos ou controlar tal aparelho.
Antecedentes da Técnica [002] Um objetivo do processamento de dinâmicas de áudio é alterar o nível ou as dinâmicas de um sinal de áudio para estar dentro de alguns limites desejados. Isso é geralmente alcançado pela criação de uma medida de variação de tempo de um nível de sinal de áudio (nível rms ou nível de pico, por exemplo) e então computar e aplicar uma modificação de sinal de variação de tempo (uma mudança de ganho, por exemplo) que seja uma função da estimativa de nível. Os processadores de dinâmicas que empregam esse modo de operação incluem controles de ganho automáticos (AGCs), controles de variação
Petição 870180133215, de 24/09/2018, pág. 6/44
2/30 de dinâmica (DRCs), expansores, limitadores, portas de ruído, etc. Vários tipos de processamento de dinâmicas de sinal estão descritos no Pedido de Patente Internacional PCT/US 2005/038579 de Alan Jeffrey Seefeldt, publicado como WO 2006/047600 em 4 de maio de 2006. O pedido designa os Estados Unidos dentre outras entidades. A descrição do pedido está inteiramente incorporada ao presente por referência.
[003] A figura 1 descreve um diagrama em bloco de nível alto de um processador de dinâmicas de áudio genérico. O processador pode ser considerado como sendo dotado de dois caminhos, um caminho de sinal superior 2 e um caminho de controle inferior 4. No caminho de controle inferior, um processo ou controlador de controle de dinâmicas (“Controle de Dinâmicas”) 6 mede o nível do sinal de áudio e gera um ou mais parâmetros de modificação de variação de tempo como uma função da medição de nível. Conforme ilustrado, os parâmetros de modificação são derivados do sinal de áudio de entrada. Alternativamente, os parâmetros de modificação podem ser derivados do áudio processado (saída) ou de uma combinação de sinais de áudio de entrada e de saída. No caminho de áudio superior 2, os parâmetros de modificação gerados pelo Controle de Dinâmicas 6 são aplicados ao áudio para gerar o áudio processado. A aplicação dos parâmetros de modificação em um sinal de áudio pode ser realizada de várias maneiras conhecidas e está geralmente ilustrada pelo símbolo multiplicador
8. Por exemplo, no caso de um dispositivo ou processo de controle de ganho automático simples, pode haver um parâmetro de modificação de ganho de banda larga simples que controle o ganho de um dispositivo ou processo de ganho/perda variável no caminho principal. Na prática, o áudio pode ser também retardado antes da aplicação dos parâmetros de modificação a fim de compensar qualquer retardo associado à computação dos parâmetros de modificação no processo de
Petição 870180133215, de 24/09/2018, pág. 7/44
3/30 controle de dinâmicas. Para simplificação na apresentação, aqui não está ilustrado um retardo na figura 1 ou em qualquer outra figura.
[004] Em um processo de controle de dinâmicas, é típico que tanto a medida de nível de sinal quanto os parâmetros de modificação resultantes sejam computados continuamente além do tempo. Além disso, qualquer um dos ou tanto a medição de nível de sinal quanto os parâmetros de modificação sejam usualmente regularizados através do tempo para minimizar a introdução de artefatos perceptíveis no áudio processado. A regularização é frequentemente realizada usando um ataque rápido e uma liberação lenta, significando que os parâmetros de modificação mudam relativamente rápido em resposta a um aumento no nível de sinal e respondem mais lentamente à medida que o nível de sinal diminui. Tal regularização está de acordo com as dinâmicas de sons naturais e com o modo no qual os seres humanos percebem as mudanças na sonoridade além do tempo. Consequentemente, tal regularização de tempo é quase universal nos processadores de dinâmicas de áudio.
[005] Para algumas aplicações de processamento de dinâmicas, as constantes de tempo associadas a tal regularização podem ser bem grandes; da ordem de um ou mais segundos. Um AGC, por exemplo, pode computar uma estimativa do nível médio de longo prazo de um sinal usando constantes de tempo grandes e então usar a estimativa resultante para gerar parâmetros de modificação variando vagarosamente que movam o nível médio do áudio mais próximo a um nívelalvo desejado. Nesse caso, as constantes de tempo grandes podem ser desejáveis a fim de preservar as dinâmicas de curto prazo do sinal de áudio. Supondo que tal AGC esteja operando no áudio de um aparelho de televisão com a intenção de manter um nível médio consistente através da programação e através de vários canais. Em tal situação, o conteúdo do sinal de áudio sendo processado pelo AGC pode mudar
Petição 870180133215, de 24/09/2018, pág. 8/44
4/30 abruptamente ou interromper, quando um canal é trocado, por exemplo, e o nível médio associado do sinal de áudio pode, portanto, também mudar abruptamente ou interromper. Com suas constantes de tempo grandes, contudo, o AGC despende um tempo considerável para convergir para um novo nível e levar o nível modificado do áudio processado em linha com o nível-alvo desejado. Durante esse tempo de adaptação, um telespectador pode perceber o nível do áudio como alto ou baixo demais. Como um resultado, o telespectador pode rapidamente alcançar o controle remoto apenas para ajustar o volume para se encontrar lutando com o AGC à medida que o mesmo converge. [006] Uma solução típica do estado da técnica para o problema há pouco descrito envolve o uso de constantes de tempo que se adaptam com base nas dinâmicas do sinal. Por exemplo, se o nível de curto prazo do sinal for significativamente maior ou menor do que o nível regularizado conforme definido por alguns limites limiares em torno do nível regularizado, então a operação de regularização conecta para ataque mais rápido e/ou libera constantes de tempo, respectivamente, até que o nível de curto prazo retorne para limites limiares em torno do nível regularizado. Subsequentemente, o sistema se conecta de volta para as constantes de tempo mais lentas originais. Tal sistema pode reduzir o tempo de adaptação do AGC, mas os limiares e as constantes de tempo mais curtos devem ser escolhidos cuidadosamente. Em geral, para limiares razoáveis, podem existir sinais nos quais as dinâmicas de sinal desejadas originais flutuem fora dos limites limiares em torno do nível médio, levando, assim o processo de regularização a se conectar falsamente no ataque rápido ou no modo de liberação. Devido à possibilidade de ocorrência frequente de tal comutação falsa, o ataque rápido ou as constantes de tempo de modo de liberação não devem ser escolhidos para serem curtos demais a fim de evitar a instabilidade do AGC durante material de programa normal. Como um
Petição 870180133215, de 24/09/2018, pág. 9/44
5/30 resultado, a convergência do AGC durante transições abruptas ou descontinuidades no conteúdo de áudio pode ainda não ser tão rápida quanto desejado.
[007] É, portanto, o objetivo da presente invenção proporcionar uma solução melhor para o problema de tempo de adaptação de processamento de dinâmicas durante mudanças de conteúdo de áudio. Descrição da Invenção [008] De acordo com um aspecto da invenção, um método para processar um sinal de áudio (ou aparelho praticando o método) inclui alterar as dinâmicas do sinal de áudio de acordo com um processo de controle de dinâmicas, detectar uma mudança no conteúdo do sinal de áudio, e reinicializar o processo de controle de dinâmicas em resposta à detecção de tal mudança. A detecção de uma mudança no conteúdo do sinal de áudio pode compreender um ou ambos de (1) detectar uma ocorrência na evolução temporal do sinal de áudio, na qual o nível do sinal de áudio permaneça abaixo de um limiar, Lsilence, durante um intervalo de tempo não mais curto do que um primeiro limiar de tempo, tsilence, e (2) detectar uma ocorrência na evolução temporal do sinal de áudio, na qual o nível do sinal de áudio diminua por uma quantidade maior do que o limiar de diferença Ldrop, durante um intervalo de tempo não maior do que um segundo limiar de tempo, tdrop.
[009] De acordo com outro aspecto da invenção, um método para processar um sinal de áudio (ou aparelho praticando o método) inclui alterar as dinâmicas do sinal de áudio de acordo com um processo de controle de dinâmicas, receber um sinal de disparo de reinicialização suprido externamente indicando uma mudança no sinal de áudio, e reinicializar o processo de controle de dinâmicas em resposta ao sinal de disparo de reinicialização. O sinal de disparo de reinicialização pode indicar um ou mais de (1) o ato de um usuário alterar um canal, (2) o ato de um usuário mudar as fontes de entrada, (3) o ato de um usuá
Petição 870180133215, de 24/09/2018, pág. 10/44
6/30 rio selecionando uma função de executar, retroceder ou avançar, (4) a comutação de um arquivo para outro, (5) uma mudança no programa, (6) a comutação de um formato de codificação de áudio para outro, e (7) uma mudança nos parâmetros de codificação.
[0010] De acordo com qualquer um dos aspectos acima, a reinicialização do processo de controle de dinâmicas pode acelerar a taxa na qual o processamento de dinâmicas se adapta às mudanças no sinal de entrada. A reinicialização do processo de controle de dinâmicas pode ajustar o valor de um ou mais parâmetros de controle de processos ou um sinal de que um ou mais parâmetros de processos de controle de processo seja uma função para um valor armazenado ou predefinido. A reinicialização do processo de controle de dinâmicas pode encurtar o valor de uma ou mais constantes de tempo empregadas na determinação de um ou mais parâmetros de controle de processo ou um sinal de que tal um ou mais parâmetros de controle de processo seja uma função.
[0011] Apesar da abordagem das constantes de tempo adaptáveis acima descrita ser, de algum modo, útil na redução do tempo de adaptação de um processador ou processo de dinâmicas de áudio e poder ser usada juntamente com aspectos da presente invenção, tal processador ou processo pode ser significativamente aperfeiçoado pelo aumento do mesmo com um mecanismo ou processo de reinicialização explicito que seja ativado ao ocorrer determinadas mudanças ou interrupções abruptas no conteúdo do sinal de áudio sendo processado. A figura 2 descreve a presente invenção em uma forma geral na qual um caminho de controle adicional, um caminho de controle de reinicialização 10, é adicionado ao processador de dinâmicas genérico da figura
1. Um mecanismo ou processo de controle de reinicialização (Controle de reinicialização) 12 pode responder a um tanto ao próprio sinal de áudio (o sinal de áudio de entrada ou uma combinação dos sinais de
Petição 870180133215, de 24/09/2018, pág. 11/44
7/30 entrada e saída de áudio) quanto um sinal de disparo externo. Assim, há três possibilidades de configurações: (1) o próprio sinal de áudio (que sucessivamente pode compreender o sinal de áudio de entrada ou uma combinação dos sinais de áudio de entrada e de saída), (2) um sinal de disparo externo, e (3) tanto o próprio sinal de áudio quanto um sinal de disparo externo. Se for decidido reinicializar pelo Controle de reinicialização 12, o mecanismo ou processo de controle de reinicialização envia uma mensagem de reinicialização para o Controle de Dinâmicas 6, instruindo o mesmo a reinicializar determinados aspectos de seu estado de controle de dinâmicas em uma maneira que permita o processamento de dinâmicas de áudio a rapidamente se adaptar para o novo nível de sinal de áudio que chega. A reinicialização de determinados aspectos do estado de controle de dinâmicas pode, por exemplo, (1) ajustar uma ou mais constantes de tempo para um valor mais curto por um curto período de tempo (acelerando por meio disso a taxa de adaptação do processamento de áudio), e/ou (2) ajustar uma medição regularizada do nível de sinal de áudio ou um ou mais parâmetros de modificação para um valor armazenado ou para uma média de valor predefinido.
[0012] Analisando o Sinal de Áudio para Determinar a Ocorrência de uma Mudança ou Interrupção Abrupta no Conteúdo de Sinal [0013] Uma decisão de reinicialização pode ser iniciada pelo Controle de reinicialização 12 de várias maneiras, por exemplo, analisando o próprio sinal de áudio que chega ou recebendo um sinal de disparo de reinicialização externo. Ao analisar o sinal de áudio, o Controle de reinicialização 12 tenta detectar condições no sinal indicativas de uma mudança ou interrupção abrupta no conteúdo. Ao detectar tal condição com um determinado grau de confiança, o Controle de Reinicialização 12 decide reinicializar e, subsequentemente, instrui o Controle de Dinâmicas 16 a reinicializar um ou mais aspectos em seu estado de con
Petição 870180133215, de 24/09/2018, pág. 12/44
8/30 trole de dinâmicas. Apesar de poderem ser utilizada outras técnicas para detectar mudanças ou interrupções abruptas no conteúdo, estão descritos abaixo dois exemplos práticos e eficazes para realizar isso. [0014] Usando um Disparo Externo para Determinar a Ocorrência de uma Mudança ou Interrupção Abrupta no Conteúdo de Sinal [0015] Em muitas aplicações, pode estar disponível informação externa altamente confiável para disparar uma reinicialização. Por exemplo, em um aparelho de televisão ou cabo conversor para televisão (set-top box), o ato de um usuário mudar um canal pode servir como um disparo externo de uma reinicialização. Ainda, em uma televisão ou receptor de áudio/vídeo, o ato de um usuário mudar as fontes de entrada, por exemplo, de Vídeo 1 para Vídeo 2, pode servir para disparar uma reinicialização. Outros exemplos incluem um media player baseado em arquivo, por exemplo, um dispositivo de áudio portátil ou um gravador de vídeo digital. Em tais casos, uma reinicialização pode ser disparada externamente quando o sistema termina a execução de um arquivo e se conecta a outro. Uma reinicialização pode ser também disparada quando o próprio usuário muda explicitamente arquivos, pressiona executar, ou avança ou retrocede rápido para um novo local em uma parte de conteúdo. No caso em que o áudio sendo processado tenha sido decodificado de um fluxo comprimido de dados digitais, por exemplo, áudio Dolby Digital, podem existir outras fontes de um sinal de disparo de reinicialização externo. Dolby e Dolby Digital são marcas da Dolby Laboratories Licensing Corporation. Por exemplo, o sistema de codificação de áudio Dolby Digital é um formato de áudio obrigatório para Televisão de Alta Definição nos Estados Unidos. Em um determinado canal de programação, o áudio é enviado continuamente, mas o formato Dolby Digital pode mudar nos limites de programa. Por exemplo, o programa principal pode estar codificado no formato de canal 5.1, mas um comercial pode estar codificado em um
Petição 870180133215, de 24/09/2018, pág. 13/44
9/30 formato estéreo. Um decodificador Dolby Digital necessariamente detecta tais mudanças e pode passar a informação para o processador de dinâmicas de áudio da presente invenção como um disparo de reinicialização. Podem também ser empregadas outras mudanças nos parâmetros de codificação, por exemplo, mudanças no parâmetro de normalização de diálogo Dolby Digital, DIALNORM, que é geralmente mantido constante para uma parte simples de conteúdo. Pode também ser gerado um disparo de reinicialização externo similar de outros formatos de codificação de áudio, como, por exemplo, um MP3 e AAC. Além das fontes de disparos de reinicialização externos há pouco listadas, são possíveis outras, e a invenção não pretende estar limitada àquelas listadas.
[0016] No caso onde a invenção é usada em um dispositivo no qual o áudio possa se originar de um conjunto de fontes conhecidas, a invenção pode também ser ampliada conforme ilustrado na figura 3. Ao longo da parte mais baixa da figura são descritas as fontes de áudio N (da Fonte de Áudio 1 a Fonte de Áudio N) de 14-1 a 14-N, onde é presumido que uma das fontes de áudio N seja selecionada para reprodução através do sistema de processamento de dinâmicas por meio de um dispositivo ou processo de seleção de fonte (Seleção de Fonte) 16. Tais fontes de áudio podem representar, mas não se limitam a, vários canais de uma televisão ou conversor para televisão, as várias entradas no receptor de áudio/vídeo, ou vários arquivos em um media player portátil. Armazenados com cada fonte de áudio estão os indicadores do estado de um ou mais aspectos do processo de controle de dinâmicas como o mesmo existia na última vez que a fonte particular de áudio foi executada. Tais aspectos do estado do controle de dinâmicas podem incluir, por exemplo, um ou mais de (1) medida regularizada do nível de sinal de áudio, (2) um ou mais parâmetros de modificação resultante da medida regularizada do nível de sinal de áu
Petição 870180133215, de 24/09/2018, pág. 14/44
10/30 dio, e (3) uma ou mais constantes de tempo empregadas na obtenção de uma medida regularizada do nível de sinal de áudio. Em uma modalidade exemplificativa abaixo descrita, é empregada a medida regularizada do nível de sinal de áudio, que indiretamente afeta o parâmetro de modificação de ganho (no exemplo, o ganho é uma função do nível de sinal de áudio regularizado). Quando é selecionada uma fonte de áudio diferente através do processo de seleção de fonte, antes de realmente conectar a nova fonte de áudio, a Seleção de Fonte 16 envia um disparo de reinicialização externo para o Controle de Reinicialização 12'. Isso sucessivamente leva o Controle de Reinicialização 12' a capturar indicadores do estado em curso do processo de controle de dinâmicas para a fonte de áudio executando no momento. O Controle de reinicialização 12' então salva os indicadores do estado de controle de dinâmicas nos locais de armazenamento do estado de controle de dinâmicas N associados à seleção de áudio em curso (Armazenamento do Estado de Controle de Dinâmica de 1 a N) de 18-1 a 18-N. A seguir, a Seleção de Fonte 16 se conecta à nova fonte de áudio e envia os indicadores armazenados associados do estado de controle de dinâmicas para o processo de controle de reinicialização que sucessivamente reinicializa o processo de controle de dinâmicas usando os indicadores de estado armazenados.
[0017] Usando esses aspectos do último estado de controle de dinâmicas de uma fonte de áudio para reinicialização do processo de controle de dinâmicas ao comutar para aquela fonte, pode ser alcançado melhor desempenho do que a ausência do emprego de tal estado inicial. Sem tal informação, o processo de controle de dinâmicas confia no sinal de áudio que chega após a reinicialização porque o mesmo se adapta à nova fonte de áudio. Em curto prazo, o nível de áudio pode flutuar rapidamente, e, portanto, os parâmetros de modificação podem também flutuar rapidamente à medida que o processo
Petição 870180133215, de 24/09/2018, pág. 15/44
11/30 de controle de dinâmicas tenta se adaptar rapidamente ao novo áudio. Usando os aspectos do último estado do processador de dinâmicas associado à fonte de áudio para reinicializar o processador de dinâmicas, é provável que o processador de dinâmicas inicie em um estado que seja mais próximo ao estado no qual o mesmo irá, eventualmente, convergir para aquela fonte de áudio. Como um resultado, as constantes de tempo de adaptação rápida após a reinicialização não precisam ser diminuídas tanto quanto de outro modo requerido, por meio disso proporcionando estabilidade aperfeiçoada sem sacrificar o tempo de adaptação geral. Como um exemplo, considere a comutação entre duas estações de televisão, a primeira com áudio em um nível médio de -15 dB com relação à digital de escala cheia e a segunda com um áudio em um nível médio de -30 dB, ambas com uma variação mais ou menos de 5 dB em torno de sua média respectiva. Suponha que exatamente antes da comutação para a segunda estação, o nível médio da primeira estação esteja em -13 dB. Suponha também que o nível médio da segunda estação esteja em -33 dB após a conexão. Essa é uma diferença de -20 dB. Se for desejado que o sistema de processamento de dinâmicas se adapte em metade de um segundo, por exemplo, é requerida uma taxa de adaptação de -40 dB por segundo na ausência de qualquer outra informação. Tal índice é bem rápido e pode introduzir instabilidade no áudio processado. Por outro lado, suponha que o último estado de processamento de dinâmicas armazenado com a segunda estação corresponda a um nível de -28 dB. Então, após a reinicialização, o processo de controle de dinâmicas pode ser reinicialização com esse estado e exista apenas uma diferença de apenas -33 dB - (-28 dB) = -5 dB. Assim, é requerida uma taxa de adaptação de apenas -10 dB por segundo (requerendo menos de um encurtamento da constante de tempo) para convergir para o nível desejado em metade de um segundo. Esse exemplo ilustra as vantagens no armaze
Petição 870180133215, de 24/09/2018, pág. 16/44
12/30 namento do último estado do processo de controle de dinâmicas com a fonte de áudio que resultou em tal estado.
O Efeito Quando é Disparada uma Reinicialização [0018] O disparo de uma reinicialização acelera a taxa de adaptação do processamento de dinâmicas de áudio (a taxa na qual o processamento de dinâmicas se adapta para mudar o sinal de entrada). Por exemplo, quando é disparada uma reinicialização, ou uma ou mais constantes de tempo associada à taxa de adaptação pode rapidamente comutar para valores significativamente menores e então retornar regularmente para os seus valores grandes originais durante um período específico de tempo. Alternativamente, as uma ou mais constantes de tempo podem comutar para valores significativamente menores e permanecer em tais valores por um período específico de tempo. Em uma disposição AGC, um sinal de controle de constante de tempo c[t] pode diminuir momentaneamente as constantes de tempo usadas na computação de nível médio regularizado. Por exemplo, as constantes de tempo de regularização podem ser diminuídas acima de uma duração de aproximadamente um segundo após uma reinicialização. Em uma modalidade de exemplo, o sinal de controle de constante de tempo c[t] pode iniciar em um valor de 1 (indicando um efeito de mudança máxima em uma ou mais constantes de tempo) na ocorrência de um disparo de reinicialização; quando está em 1 os coeficientes de ataque e de liberação são ajustados para valores significativamente menores do que seus valores nominais. À medida que c[t] decai para zero em um curto período de tempo como, por exemplo, um segundo (a extensão do período de tempo não é decisiva), os coeficientes são interpolados de volta para seus valores normais nominais (sem reinicialização). Alternativa ou adicionalmente, na ocorrência de um disparo de reinicialização, o valor de um nível médio regularizado computado pelo processo de controle de dinâmicas pode ser reinicializado para
Petição 870180133215, de 24/09/2018, pág. 17/44
13/30 um estado armazenado com uma fonte de áudio específica ou para um valor predefinido.
Descrição dos Desenhos [0019] A figura 1 é um diagrama em bloco funcional esquemático ilustrando, e um nível alto, um processador de dinâmicas de áudio genérico.
[0020] A figura 2 é um diagrama em bloco funcional esquemático ilustrando, de acordo com os aspectos da presente invenção, um exemplo de uma modalidade da presente invenção, na qual, de forma geral, um caminho de controle adicional, um caminho de controle de reinicialização, é adicionado ao processador de dinâmicas genérico da figura 1.
[0021] A figura 3 é um diagrama em bloco funcional esquemático ilustrando, de acordo com os aspectos da presente invenção, um exemplo de uma modalidade da presente invenção, na qual um processador de dinâmicas de áudio é também aumentado.
[0022] A figura 4 ilustra uma função de entrada/saída exemplificativa para um controle de ganho automático típico (AGC).
[0023] A figura 5 ilustra um ajuste de respostas de frequência de passagem de banda escolhido para imitar a filtragem de banda decisiva observada ao longo de uma membrana basilar no ouvido humano.
[0024] A figura 6 é um diagrama em bloco funcional esquemático ilustrando, de acordo com os aspectos da presente invenção, um exemplo de uma modalidade AGC da presente invenção.
Melhores Modos de Realizar a Invenção [0025] A invenção descrita é aplicável a uma ampla variedade de aplicações de processamentos dinâmicos, como, por exemplo, o controle de variação dinâmico, compressores, limitadores, expansores, etc. Contudo, é particularmente útil quando aplicadas a um AGC no qual, tipicamente, constantes de tempo grandes resultam em adaptaPetição 870180133215, de 24/09/2018, pág. 18/44
14/30 ção lenta na ausência da presente invenção. Portanto, a modalidade preferida descreve, como um exemplo, a aplicação da invenção em um AGC.
Implementação AGC Básica [0026] Uma implementação básica de um AGC computa uma estimativa de variação de tempo de um nível médio de sinal e computa um nível de saída modificado desejado que seja uma função do nível de entrada e um nível-alvo desejado. Uma modificação de sinal de variação de tempo pode então ser computada como uma função da diferença entre o nível de entrada e um nível de saída desejado. A entrada de mapeamento de função para saída é projetada para levar o nível do áudio modificado mais próximo ao nível-alvo desejado, e a figura 4 descreve uma função de entrada/saída desse tipo. Para uma entrada acima do nível-alvo, o AGC requer atenuação de sinal, e para uma entrada abaixo do nível-alvo, o AGC requer impulso de sinal. O grau de atenuação ou de impulso pode ser controlado variando o declive da linha na figura 4.
[0027] Idealmente, a medida usada para computar o nível médio do áudio deve se correlacionar com a percepção humana de sonoridade. Isso pode ser alcançado de várias maneiras; por exemplo, por uma medida de força quadrada média pesada ou uma medida de sonoridade físico-acústica. Uma medida de força quadrada média não pesada simples é ligeiramente menos precisa do que os dois métodos recém mencionados, mas ainda demonstra um alto grau de correlação com a percepção humana de sonoridade para a maioria dos sinais de áudio do mundo real. Devido a sua simplicidade computacional, uma medida de força quadrada média não pesada é usada em uma modalidade preferida, mas não deve ser vista como limitadora da invenção.
[0028] Em princípio, apesar dos aspectos da invenção poderem ser implementados em domínios analógicos e/ou digitais, as implePetição 870180133215, de 24/09/2018, pág. 19/44
15/30 mentações práticas são prováveis a serem implementadas no domínio digital, no qual cada sinal de áudio é representado por amostras individuais ou amostras em blocos de dados. A estimativa de nível de entrada e o nível de saída desejado correspondente e os parâmetros de modificação podem ser computados continuamente para um sinal de áudio analógico ou em uma amostra por base de amostra de um sinal digital, mas para essa modalidade de exemplo é em vez disso desejável computar tais quantidades para blocos de sobreposição consecutivos de amostras de um sinal de áudio digital. Isso se deve principalmente ao fato de que o processamento de bloco digital é útil para detectar condições de reinicialização do próprio sinal, conforme está descrito posteriormente. Permitindo que o sinal de áudio digital seja representado por x[n], os blocos de sobreposição do sinal de áudio podem ser computados como:
x[n, t] = w[n]x[n + tN /2] para 0 < n < N -1 (1) onde N é a extensão de bloco, N/2 é o grau de sobreposição entre os blocos consecutivos, t é o índice de bloco, e w[n] é uma função de janela, como, por exemplo, uma janela seno. Para as amostras de sinais em 44100Hz, ajustando N=512 ou N=1024 funciona bem. Detalhes adicionais de uma disposição de processamento de áudio digital empregando blocos de sobreposição de amostras estão relatados na Patente U.S. N° 5.899.969 de Fielder et al (Áudio Baseado em Estrutura com Palavras de Controle de Ganho), cuja descrição encontra-se inteiramente incorporada ao presente. Conforme descrito abaixo, o AGC computa um ganho de variação de tempo G[t] que é então multiplicado com cada bloco do sinal. Cada um desses blocos modificados é então adicionado por sobreposição para produzir um sinal de áudio modificado final y[n + tN /2]:
y[n + tN/2] = G[t]x[n, t] + G[t - 1]x[n + N/2, t -1] para 0 < n < N /2 .
Petição 870180133215, de 24/09/2018, pág. 20/44
16/30 (2) [0029] Como uma primeira etapa na computação de ganho G[t], o nível instantâneo de variação de tempo do sinal L[t] é computado como a força quadrada média de cada bloco x[n,t]. Em decibéis, o nível é computado como:
i n-1 λ
L\t] = 10logi0| -Σx2[«,t]|
VN n=0 J (3) onde 0 dB corresponde ao nível de uma onda quadrada digital de escala cheia.
[0030] A seguir, o nível instantâneo pode ser regularizado com um ataque rápido e uma liberação lenta para gerar um nível médio regularizado do sinal de áudio L [t ]:
L [t] = a[t ] L [t -1] + (1 - a[t ])L[t ] L[t -1]
L[t] > L min
L[t] < L min (4a) onde
a 'cittack a'release
L[t] > L[t -1]
L[t] < L[t -1] (4b) e
arelease > ^attack (4c) [0031] Os coeficientes de regularização aattack e areleaee são escolhi dos para proporcionar os tempos de ataque e liberação desejados. Um modo para especificar isso é a metade do tempo de declínio do filtro de regularização, isto é, o tempo que leva a resposta de impulso do filtro de regularização de tempo para declinar para uma metade de seu valor inicial. Apesar de escolher aattack correspondente à metade do tempo de declínio de 1 segundo e areleaee correspondente à metade do tempo de declínio de 4 segundos funciona bem para um AGC, os valo
Petição 870180133215, de 24/09/2018, pág. 21/44
17/30 res não são decisivos. O valor Lmin na equação 4a representa um nível mínimo acima do qual o nível de sinal instantâneo L[t] deve estar em ordem para que o nível regularizado seja atualizado. Isso evita que o nível médio regularizado caia baixo demais, e o ganho correspondente se eleve alto demais, quando o sinal cai em silêncio relativo. Presumindo que 0 dB represente o nível de uma onda quadrada digital de escala cheia, ajustar Lmin = -60 dB é uma escolha razoável, apesar do nível não ser decisivo.
[0032] Do nível médio regularizado L [t] e da função AGC de entrada/saída Fagc, conforme ilustrado na figura 4, o nível de saída desejado Lout[t] é computado:
L,., [t ] = Fagc {L[t ]} (5) [0033] Finalmente, o ganho G[t] é computado da diferença entre o nível de saída Lout [t ] e o nível de entrada L [t ]:
G[, ] = 10 [t ]-L [t ])/2° (6) [0034] Quando Lout[t] >L[t], o ganho é maior do que um, significando que o sinal está impulsionado, e quando L,ut [t] < L [t], o ganho é menor do que um, significando que o sinal está atenuado.
AGC com Reinicialização [0035] conforme mencionado acima, o mecanismo ou função de reinicialização pode provocar uma de duas ou ambas as ações: (1) ajustar uma ou mais constantes de tempo para um valor mais curto por um curto período de tempo (por meio disso acelerando a taxa de adaptação do processamento de áudio), e (2) ajustar uma medida equilibrada do nível de sinal de áudio ou um ou mais parâmetros de modificação para um valor armazenado ou para um valor médio ou valor predefinido, que pode ser expresso como Linit (ver equação 8a abaixo
Petição 870180133215, de 24/09/2018, pág. 22/44
18/30 e as descrições antes e após dessa equação). Primeiro, está descrita a reinicialização de uma ou mais constantes de tempo.
[0036] Devido ao parâmetro de modificação, o ganho G[t], é uma função do nível médio regularizado L [t ], em cuja taxa o AGC descrito se adapta ao áudio é governado pelos tempos de ataque e liberação usados na computação L [t ]. Conforme declarado acima, tais constantes de tempo de regularização são escolhidas para serem relativamente grandes, na ordem de vários segundos, de maneira que o AGC não mude o nível do áudio rápido demais durante a evolução temporal do conteúdo de áudio normal. Contudo, se o conteúdo de áudio mudar abruptamente ou tiver uma parada, o AGC pode demorar muito para se adaptar, especialmente se o novo conteúdo estiver em um nível significativamente diferente do conteúdo anterior. Para acelerar a adaptação, o sinal de reinicialização descrito anteriormente pode ser usado para disparar uma modificação de uma ou mais constantes de tempo associadas à regularização de nível. Nesse caso, quando é disparada uma reinicialização, as constantes de tempo comutam rapidamente para valores significativamente menores e então retorna regularmente para seus valores grandes originais (ou aproximações dos mesmos) acima de um período de tempo especificado. São possíveis outros métodos para acelerar a taxa de adaptação após uma reinicialização ser disparada. Por exemplo, em vez de retornar regularmente para os seus valores originais ou aproximações dos mesmos as constantes de tempo podem ser mantidas em seus valores menores durante um período específico de tempo e então retornadas diretamente aos seus valores originais ou aproximações dos mesmos. Outra possibilidade é prover um retorno passo a passo das constantes de tempo durante um período de tempo especificado. A invenção não pretende ser de maneira limitada na qual as constantes de tempo retornam aos seus valores originais ou aproximações dos mesmos.
Petição 870180133215, de 24/09/2018, pág. 23/44
19/30 [0037] Para disparar uma reinicialização pode existir um sinal de reinicialização binário R[t] como o R[t]=0 durante operação normal e R[t]=1 quando é desejada uma reinicialização no bloco de tempo t. A reinicialização pode ser disparada pela análise do sinal de áudio ou por uma fonte externa, conforme descrito anteriormente. Os detalhes dos exemplos do disparo de uma reinicialização através de análise de sinal estão descritos abaixo. No caso de um disparo externo, pode existir um estado armazenado com o qual o processo de dinâmicas pode ser reinicializado, conforme ilustrado na figura 3. Para a modalidade preferida descrita, tal estado armazenado pode consistir no valor do nível médio regularizado L [t] na última vez em que o bloco no qual uma fonte de áudio particular foi processada. Esse estado inicial, recuperado do armazenamento durante uma reinicialização disparada externamente (ou, alternativamente, um estado inicial pode ser um valor predefinido se for ou não empregada uma reinicialização disparada externamente), pode ser representado pelo valor Ltmt.
[0038] Do sinal de reinicialização binário R[t], pode ser gerado um sinal de controle de constante de tempo e subsequentemente usado para encurtar momentaneamente as constantes de tempo usadas na computação do nível médio regularizado L[t], acelerando por meio disso a taxa de adaptação de processamento. Um sinal de controle de constante de tempo c[t] pode ser computado de maneira que seja igual a 1 no momento da ocorrência de uma reinicialização (R[t ] =1), e então declinar exponencialmente para 0 em uma taxa controlada por um coeficiente de declínio l< 1:
c[t ] = 1 se R[t ] = 1
(7a)
[0039] de outro modo
c[t ] = <
lc[t -1] c[t -1]
L[t] > L
L[t] < Lmin
Petição 870180133215, de 24/09/2018, pág. 24/44
20/30 (7b) [0040] O coeficiente de declínio l pode ser escolhido para proporcionar uma metade de tempo de declínio de um segundo, por exemplo, que significa que as constantes de tempo de regularização são encurtadas acima de uma duração de aproximadamente um segundo após uma reinicialização. Deve ser também observado que o sinal de controle pode ser atualizado apenas se o nível de sinal L[t ] > Lmin a fim de evitar a ocorrência de uma adaptação rápida durante um silêncio relativo.
[0041] Em vez de usar coeficientes de ataque e liberação fixos para regularizar o nível de sinal, conforme ilustrado na equação 4b, os coeficientes podem agora variar além do tempo como uma função do sinal de controle de constante de tempo c[t]. Quando c[t]=1, significando que acabou de ocorrer uma reinicialização, os coeficientes de ataque e liberação podem ser ajustados iguais aos valores significativamente menores do que os valores aattakk e areleaee da equação 4b (em torno de dez por cento dos valores originais ou menos, por exemplo). Como c[t] então decai para 0, os coeficientes podem ser interpolados de volta para os seus valores nominais de aattakk e areleaee. Opcionalmente, além disso, os valores de coeficiente pequeno usados imediatamente após uma reinicialização podem também variar dependendo se existe ou não um valor inicial L .t. Se não existir nenhum valor inicial armazenado, então podem ser usados valores de coeficiente muito pequeno, e se não existir um estado inicial armazenado, então podem ser usados valores de coeficiente ligeiramente maiores. No último caso é presumido que a inicialização L[t] com Ltmt inicie L[t] em um valor mais próximo ao valor para o qual irá eventualmente convergir. Portanto, um tempo de adaptação ligeiramente mais lento, correspondente aos coeficientes maiores, podem ser utilizados em comparação ao caso onde nenhum estado inicial esteja disponível. O processo de regu
Petição 870180133215, de 24/09/2018, pág. 25/44
21/30 larização adaptável pode ser expresso como:
L[t] = Linit se R[t] = 1 e Limt sai (8a) de outro modo, gt] L[t -1] + (1 -gt])L[t] L [t -1]
L[t] > L min
L[t] < L min (8b) onde gt] =<
gattack [t ] grelease [t ]
L[t] > L[t -1]
L[t] < L[t -1]’ (8c)
Yattack [t] = c[tWattack [t] + (1 - c[t l)a'attack (8d)
Yrelease [t] = c[t]b'release [t] + (1 - c[t])«release (8e) battack [t] (8f) brelease [t ] (8g)
b aslow battack [t 1] β rfast βrslow βrelease [t 1] βafast < βaslow << aattack (8h) β rfast < βrslow << arelease R[t] = 1 e Linit eXiste
R[t] = 1 e Linit não existe caso contrário R[t] = 1 e Linit eXiste
R[t] = 1 e Linit não existe caso contrário (8i) [0042] Os valores rafiiSt e rfas. representam os coeficientes de re gularização de ataque e liberação imediatamente após uma reiniciali
Petição 870180133215, de 24/09/2018, pág. 26/44
22/30 zação quando não é provido nenhum estado inicial L. Os valores correspondentes à metade dos tempos de declínio de 50 milissegundos e 200 milissegundos, respectivamente, foram considerados úteis. Os valores específicos não são decisivos. Os valores baslow e brsíw representam os coeficientes de regularização de ataque e liberação inicial maior imediatamente após uma reinicialização quando é proporcionado o estado Limt inicial. Nesse caso, os valores correspondentes à metade dos tempos de declínio iguais a duas vezes aqueles de suas contrapartes mais rápidas; 100 milissegundos e 400 milissegundos, respectivamente, foram considerados úteis. Ainda nesse caso, os valores específicos não são decisivos.
Detecção de Reinicialização Através da Análise de Sinal [0043] O método mais confiável para disparar uma reinicialização na invenção descrita deve receber um disparo externamente de um mecanismo ou processo que é conhecido como sendo diretamente ligado à mudança de conteúdo de áudio. Vários mecanismos desse tipo foram comentados anteriormente; uma mudança em canal em um aparelho de televisão ou uma mudança de seleção de entrada em um receptor de áudio/visual, por exemplo. Contudo, em muitos casos, nenhum desses mecanismos externos pode estar disponível, e, portanto, o sistema deve confiar na análise do próprio sinal de áudio para determinar se deve ser disparada uma reinicialização. Suponha, por exemplo, que a invenção descrita resida em um aparelho de televisão no qual um usuário tenha conectado um cabo conversor para televisão externo. O cabo conversor para televisão é responsável pela sintonização e mudança de canais, e o áudio decodificado é meramente passado na televisão como um fluxo de áudio contínuo. A televisão, portanto, não recebe nenhuma informação explícita a respeito de quando um novo canal é selecionado. A única informação disponível é aquela que pode ser inferida do fluxo de áudio que receba.
Petição 870180133215, de 24/09/2018, pág. 27/44
23/30 [0044] Uma maneira relativamente simples, mas eficaz, de disparar uma reinicialização através de análise de sinal é detectar uma ocorrência na evolução temporal do sinal de áudio no qual o nível de sinal de áudio permaneça abaixo de um limiar, Lsiience, por um período de tempo mínimo (um intervalo de tempo não mais curto do que um limiar de tempo tsiience). Em outras palavras, para detectar um período de silêncio relativo sendo dotado de uma duração pelo menos tão longo quanto um intervalo de tempo limiar especificado. Tal ocorrência é provavelmente para indicar uma mudança ou interrupção abrupta no conteúdo de áudio. Muitos dispositivos, em particular cabos conversores para televisão, diminuem o volume do sinal de áudio por um curto período de tempo quando a fonte de sinal de áudio muda. O ato de diminuir o volume reduz o sinal de áudio para um nível muito mais baixo do que é geralmente encontrado em um conteúdo de áudio normal. No caso de um áudio digital, por exemplo, pode reduzir as amostras do sinal para zero. Tais condições na evolução temporal do sinal podem ser detectadas através da análise nível de curto prazo L[t] anteriormente comentado. Se L[t] permanecer abaixo de um limiar Lsiience por um intervalo de tempo de pelo menos tsilence, então pode ser disparada uma reinicialização. Essa abordagem pode ser expressa como:
Γο
Ψ] < silence ] t silence (9a) onde um sinal de contagem de silêncio s\t] é atualizado de acordo pa ra:
s\t -1] +1 L\-[] > Lsilence
L\t] £ Lsüence (9b) [0045] Presumindo que 0 dB corresponda ao nível de uma onda quadrada digital de escala cheia, então Lsiience igual a -90 dB, por exemplo, funciona bem na prática, apesar do nível não ser decisivo. O ajuste de Lsiience para um tempo de 0,25 segundos, por exemplo, é uma
Petição 870180133215, de 24/09/2018, pág. 28/44
24/30 escolha razoável para muitas aplicações, apesar do período de tempo não ser decisivo.
[0046] Em algumas situações, pode não ser introduzido um intervalo de silêncio relativo quando o conteúdo de áudio muda abruptamente ou é interrompido, e, portanto, a técnica acima pode não ser eficaz no disparo de uma reinicialização. É, portanto, desejável uma ocorrência de disparo de reinicialização alternativo para lidar com casos adicionais. Em qualquer situação na qual o conteúdo de áudio mude abruptamente ou seja interrompido, o nível do novo áudio será maior do que, igual a, ou menor do que o nível do conteúdo de áudio anterior. Devido ao fato da maioria dos processadores de dinâmica empregar um ataque que é significativamente mais rápido do que sua liberação, quando o nível de um novo conteúdo de áudio é maior do que ou igual ao antigo é menos problemático do que quando o novo conteúdo de áudio, por exemplo, significativamente inferior ao anterior. No último caso, o tempo de liberação lento pode resultar em um tempo de adaptação desagradavelmente longo. Portanto, o disparo de uma reinicialização quando o novo conteúdo de áudio é significativamente inferior ao antigo pode ser considerado particularmente desejável. Para realizar isso, é preciso explorar uma característica comum à maioria dos sinais de áudio compostos de sons naturais. Os sons naturais podem exibir aumentos abruptos em nível, mas geralmente exibem um declínio mais gradual. Os sons que são abruptamente cortados não são muito comuns na maioria das gravações de áudio. Contudo, se o conteúdo de áudio comutar rapidamente, através de uma mudança de seleção de entrada, por exemplo, e o nível da nova entrada de áudio for significativamente mais baixa do que o antigo, então o fluxo de áudio resultante exibe uma queda no nível drástica, não natural, instantânea. Tal queda no nível pode ser detectada do nível de curto prazo L[t] e usada para disparar uma reinicialização.
Petição 870180133215, de 24/09/2018, pág. 29/44
25/30 [0047] Portanto, outra maneira eficaz de disparar uma reinicialização através de uma análise de sinal e detectar uma ocorrência na evolução temporal do sinal de áudio no qual o nível do sinal de áudio diminua por uma quantidade maior do que um limiar de diferença Ldrop em um intervalo de tempo não maior do que um limiar de tempo tdrop.
Especificamente, se a diferença entre L[t] e L[t-1] for maior do que um limiar especificado Ldrop em um intervalo de tempo tdrop, então é dispa rada uma reinicialização.
L[t] - L[t -1] < Ldrop caso contrário (10) [0048] Uma diferença de tempo adequada tdrop, é um tempo de um bloco de processamento digital. Por exemplo, com uma sobreposição de bloco de uma metade, um tempo de bloco corresponde a N/2 amostras. Se N=512 e a taxa de amostragem for 48000 Hz, tdrop, é em torno de 5 milissegundos. Se N=1024, tdrop é em torno de 10 milisse gundos. Uma diferença de nível Ldrop em torno de -10 a -20 foi conside rada adequado, apesar da diferença de nível não ser decisiva.
[0049] A técnica acima é eficaz no disparo de uma reinicialização quando o nível de um novo conteúdo de áudio for significativamente mais baixo do que o antigo, mas, algumas vezes, pode ser suscetível a um disparo errôneo de uma reinicialização durante um conteúdo de áudio normal. A técnica descrita procura uma queda no nível total do sinal, e algumas vezes uma parte dominante do sinal de áudio, um bumbo (kick drum), por exemplo, pode exibir tal comportamento, ao mesmo tempo em que a parte remanescente do sinal não o faça. O componente de sinal dominante, contudo, contribui significativamente para o nível geral e, portanto, pode provocar um disparo de reinicialização. Para lidar com tal disparo não intencionado, o esquema de detecção pode ser aperfeiçoado pela detecção de uma reinicialização
Petição 870180133215, de 24/09/2018, pág. 30/44
26/30 quando o nível do sinal exibir uma queda de nível significante simultaneamente através de uma pluralidade de bandas de frequência (por exemplo, todas as bandas de frequência) no período de tempo limiar. Dessa maneira, todas essas bandas de frequência contribuem igualmente para o processo de detecção de reinicialização, indiferente ao nível absoluto em qualquer banda fornecida. Para implementar essa técnica, é primeiro computado o nível instantâneo em uma pluralidade de bandas de frequência. Esse nível é representado como L[b,t], onde b indica o índice de banda. Pode ser eficientemente gerado pela computação do Discret Fourier Transform (DTF) de cada bloco de áudio x\n, t ] e multiplicando o DTF com uma resposta de frequência de passagem de banda Cb \k ] para cada banda b:
L\b, t ] = 10log10 (σ Cb\k ]| X\k, t ]|2) (11a) onde X\k, t ], o DFT de x\n, t ], é computado como:
N—1 2Ptn
X\k, t ] = Σ x\n, t k (11b) n=0 [0050] O conjunto de respostas de frequência de passagem de banda Cb \k ] pode ser vantajosamente escolhido para imitar a filtragem de banda decisiva observada ao longo de uma membrana basilar no ouvido humano. Conforme sugerido por Moore e Glasberg (Um Modelo para a Previsão de Limiares, Sonoridade, e Sonoridade Parcial, Brian Moore, Brian Glasberg, e Thomas Baer, J. Audio Eng.Soc., Volume 45, N° 4, abril, 1997), tais filtros exibem uma forma exponencial aproximadamente arredondada e são espaçados uniformemente na escala de Largura de Banda Retangular Equivalente (ERB). A figura 5 descreve um conjunto de filtros adequados com um espaçamento de 1 ERB, resultando em um total de 40 bandas.
[0051] Do nível instantâneo por banda, L\b, t], pode ser computada a diferença entre os blocos de tempo sucessivos, medidos através de
Petição 870180133215, de 24/09/2018, pág. 31/44
27/30 todas as bandas:
B
D Ή = - Σ L[b, t] - L[b, t -1] (12) B b=1 [0052] Para sinais de áudio do mundo real, D[t] é extremamente pequeno apenas se o nível do sinal cair significativamente na maioria das bandas b. Se a diferença for menor do que algum limiar, Ddrop, en tão é detectada uma reinicialização:
D[t] < Ddrop caso contrário (13) [0053] Na prática, o ajuste de Ddrop entre -10 e -20 dB funciona bem, apesar do ajuste não ser decisivo. A técnica de múltiplas bandas resultante é menos suscetível de disparar erroneamente uma reinicialização do que a técnica mais simples que olha apenas a diferença no nível de sinal total.
[0054] A figura 6 ilustra um diagrama em bloco de um AGC incorporando aspectos da presente invenção. Um sinal de entrada de áudio digital x[n,t] (ver equação 1) é aplicado a dois caminhos de um dispositivo ou processo AGC. No caminho de controle, um dispositivo ou processo de Computar Nível 20 computa uma medida do áudio, que pode ser um nível instantâneo de variante variação de tempo do sinal L[t], computado como uma força quadrada média de cada bloco do sinal de entrada x[n,t] (ver equação 3). A seguir, o nível instantâneo L[t] é tempo regularizado em um dispositivo ou processo de Regularizar Nível 22 para gerar um nível médio regularizado do sinal de áudio L [t ] (ver equação 4a). Na ausência de uma reinicialização, o tempo de regularização pode ser dotado de uma característica de ataque rápido e uma liberação lenta. O Regularizar Nível 22 pode ser controlado por uma entrada de Sinal de Controle de Constante de Tempo c[t] e/ou uma entrada Inicializar L[t]. O Sinal de Controle de Constante de
Petição 870180133215, de 24/09/2018, pág. 32/44
28/30
Tempo c[t] pode levar uma ou mais constantes de tempo empregadas no Regularizar Nível 22 a ser alterada na ocorrência de uma reinicialização, conforme descrito acima. A entrada Inicializar L \t ] pode levar a saída do Regularizar Nível 22 a assumir um valor Linit armazenado ou valor predefinido na ocorrência de uma reinicialização, conforme descrito acima. A saída do Regularizar Nível 22 L \t ] é aplicada a um dispositivo ou função Aplicar Função de Entrada/Saída Fago 24 e a um dispositivo ou função Computar Ganho 26. O dispositivo ou função 24 aplica a função descrita com relação à figura 4 para prover um nível de saída desejado Lout\t] (ver equação 5). O Computar Ganho 26 computa o ganho G\t] da diferença entre o nível de saída Lout\t] e o nível de entrada L \t] (ver equação 6). Quando Lout\t] > L \t], o ganho é maior do que um, significando que o sinal é impulsionado, e quando Lout\t] < L \t], o ganho é menor do que um, significando que o sinal é atenuado. O ganho de variação de tempo G\t ], um parâmetro de modificação, é então aplicado ao dispositivo ou processo Multiplicar 28 onde é então multiplicado com cada bloco do sinal x[n,t] para produzir um sinal de áudio modificado y[n + tN/2] (ver equação 2). Apesar de como descrito, o parâmetro de modificação de ganho G\t] ser independente de frequência, pode ser computado um parâmetro de modificação de ganho dependente de frequência G\b,t] no qual b é um índice de banda. Nesse caso o Computar Nível 20 pode computar um nível de sinal instantâneo dependente de frequência L \b, t ]. O Regularizar Nível 22 pode proporcionar uma saída dependente de frequência L \b, t ] (seu controle recebe Sinal de Controle de Constante de Tempo c[t] e Inicializar L \t ] pode ser também dependente de frequência), Aplicar Função fagc pode aplicar uma função dependente de frequência, e Computar Ganho 26 proporciona um ganho de variação de temPetição 870180133215, de 24/09/2018, pág. 33/44
29/30 po dependente de frequência G[b, t ].
Implementação [0055] A invenção pode ser implementada em hardware ou software, ou em uma combinação de ambos (por exemplo, arranjos lógicos programáveis). A menos que especificado de outro modo, os algoritmos incluídos como parte da invenção não estão inerentemente relacionados a qualquer computador específico ou a outros aparelhos. Especificamente, podem ser usadas várias maquinas de propósito geral com programas gravados de acordo com os ensinamentos da invenção, ou pode ser mais conveniente construir um aparelho mais especializado (por exemplo, circuitos integrados) para realizar as etapas do método requerido. Assim, a invenção pode ser implementada em um ou mais programas de computador ou em um ou mais sistemas de computador programáveis cada um compreendendo pelo menos um processador, pelo menos um sistema de armazenamento de dados (incluindo memória e/ou elementos de armazenagem voláteis e não voláteis), pelo menos um dispositivo ou porta de entrada, e pelo menos um dispositivo ou porta de saída. O código de programa é aplicado aos dados de entrada para realizar as funções aqui descritas e gerar informação de saída. A informação de saída é aplicada a um ou mais dispositivos de saída, de modo conhecido.
[0056] Cada programa desse tipo pode ser implementado em qualquer linguagem de computador desejada (incluindo máquina, montagem, ou procedimento de nível alto, lógico, ou linguagens de programação de objetivo orientado) para se comunicar com um sistema de computador. Em qualquer caso, a linguagem pode ser uma linguagem compilada ou interpretada.
[0057] Cada programa de computador é preferivelmente armazenado em ou carregado em um meio ou dispositivo de armazenamento (por exemplo, um meio ou memória de estado solido, ou meio magnéPetição 870180133215, de 24/09/2018, pág. 34/44
30/30 tico ou ótico) legível por um computador programável com propósito geral ou especial, para configurar e operar o computador quando o meio ou dispositivo de armazenamento for lido pelo sistema de computador para realizar os procedimentos aqui descritos. O sistema inventivo pode também ser considerado a ser implementado como um meio de armazenamento legível de computador, configurado com um programa de computador, onde o meio de armazenamento assim configurado leve um sistema de computador a operar em uma maneira específica e predefinida para realizar as funções aqui descritas.
[0058] Foi aqui descrita uma série de modalidades da invenção. Todavia, deve ser compreendido que podem ser feitas várias modificações sem se afastar do escopo da invenção. Por exemplo, algumas das etapas aqui descritas podem ser ordenadas independentes, e, assim, podem ser realizadas em uma ordem diferente daquela descrita.
Petição 870180133215, de 24/09/2018, pág. 35/44
1/5

Claims (12)

  1. REIVINDICAÇÕES
    1. Método para processar um sinal de áudio, compreendendo as etapas de:
    controlar as dinâmicas do sinal de áudio de acordo com um processo de controle de dinâmicas, em que o processo ou controlador de controle de dinâmicas regulariza o nível do sinal de áudio e/ou um parâmetro de modificação de ganho de dinâmica com um filtro de regularização que emprega uma constante de tempo adaptativa β;
    detectar um primeiro tipo de ocorrência na evolução temporal do sinal de áudio, no qual o nível do sinal de áudio diminua por uma quantidade maior do que um limiar de diferença, Ldrop, em um intervalo de tempo não maior do que um segundo limiar de tempo, tdrop, em que a detecção detecta a diminuição no nível do sinal de áudio em uma pluralidade de bandas de frequência;
    detectar um segundo tipo de ocorrência na evolução temporal do sinal de áudio, no qual o nível do sinal de áudio permanece abaixo de um limiar, Lsiience, durante um intervalo de tempo não mais curto do que um primeiro limiar de tempo, tsilence; e reinicializar, usando um mecanismo ou processo de reinicialização explícito, o controle do processo de controle de dinâmicas do sinal de áudio em resposta à detecção do primeiro tipo de ocorrência ou do segundo tipo de ocorrência, caracterizado pelo fato de que reinicializar o controle do processo de controle de dinâmicas inclui configurar a constante de tempo do filtro de regularização para um valor predefinido efast, interpolando a constante de tempo β de volta a um valor eslow sobre um período de tempo seguido da reinicialização, efast, sendo uma constante de tempo mais rápida do que eslow.
  2. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a reinicialização do processo de controle de dinâmicas acelera a taxa na qual o processamento de dinâmicas se adapta
    Petição 870180133215, de 24/09/2018, pág. 36/44
    2/5 às mudanças no sinal de entrada.
  3. 3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a reinicialização do processo de controle de dinâmicas ajusta o valor de um ou mais parâmetros de controle de processo ou um sinal de que tal um ou mais parâmetros de controle de processo seja uma função para um valor armazenado ou predefinido.
  4. 4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a reinicialização do processo de controle de dinâmicas encurta o valor de uma ou mais constantes de tempo empregadas na determinação de um ou mais parâmetros de controle de processo ou um sinal de que tal um ou mais parâmetros de controle de processo seja uma função.
  5. 5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende as etapas de:
    receber um sinal de disparo de reinicialização suprido externamente indicando uma mudança no sinal de áudio, e reinicializar o processo de controle de dinâmicas em resposta ao sinal de disparo de reinicialização.
  6. 6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que o sinal de disparo de reinicialização indica um ou mais de:
    o ato de um usuário mudar um canal, o ato de um usuário mudar as fontes de entrada, o ato de um usuário selecionar uma função executar, retroceder ou avançar, a comutação de um arquivo para outro, uma mudança no programa, a comutação de um formato de codificação de áudio para outro, e uma mudança nos parâmetros de codificação.
    Petição 870180133215, de 24/09/2018, pág. 37/44
    3/5
  7. 7. Aparelho para processar um sinal de áudio, compreendendo:
    meios para controlar as dinâmicas do sinal de áudio utilizando um processo de controle de dinâmicas, em que o processo ou controlador de controle de dinâmicas regulariza o nível do sinal de áudio e/ou um parâmetro de modificação de ganho de dinâmica com um filtro de regularização que emprega uma constante de tempo adaptativa β;
    meios para detectar um primeiro tipo de ocorrência na evolução temporal do sinal de áudio, no qual o nível do sinal de áudio diminua por uma quantidade maior do que um limiar de diferença, Ldrop, em um intervalo de tempo não maior do que um segundo limiar de tempo, tdrop, em que os meios de detecção detectam a diminuição no nível do sinal de áudio em uma pluralidade de bandas de frequência;
    detectar um segundo tipo de ocorrência na evolução temporal do sinal de áudio, no qual o nível do sinal de áudio permanece abaixo de um limiar, Lsiience, durante um intervalo de tempo não mais curto do que um primeiro limiar de tempo, tsilence; e meios para reinicializar, usando um mecanismo ou processo de reinicialização explícito, o controle do processo de controle de dinâmicas do sinal de áudio em resposta à detecção do primeiro tipo de ocorrência ou do segundo tipo de ocorrência, caracterizado pelo fato de que os meios para reinicializar o controle do processo de controle de dinâmicas incluem meios para configurar a constante de tempo do filtro de regularização para um valor predefinido frast, meios para interpolar a constante de tempo β de volta a um valor eslow sobre um período de tempo seguido da reinicialização, efast, sendo uma constante de tempo mais rápida do que eslow.
  8. 8. Aparelho, de acordo com a reivindicação 7, caracterizado pelo fato de que os meios para a reinicialização do processo de
    Petição 870180133215, de 24/09/2018, pág. 38/44
    4/5 controle de dinâmicas aceleram a taxa na qual o processamento de dinâmicas se adapta às mudanças no sinal de entrada.
  9. 9. Aparelho, de acordo com a reivindicação 7, caracterizado pelo fato de que os meios para a reinicialização do processo de controle de dinâmicas ajustam o valor de um ou mais parâmetros de controle de processo ou um sinal de que tal um ou mais parâmetros de controle de processo seja uma função para um valor armazenado ou predefinido.
  10. 10. Aparelho, de acordo com a reivindicação 7, caracterizado pelo fato de que os meios para a reinicialização do processo de controle de dinâmicas encurtam o valor de uma ou mais constantes de tempo empregadas na determinação de um ou mais parâmetros de controle de processo ou um sinal de que tal um ou mais parâmetros de controle de processo seja uma função.
  11. 11. Aparelho, de acordo com a reivindicação 7, caracterizado pelo fato de que ainda compreende:
    meios para receber um sinal de disparo de reinicialização suprido externamente indicando uma mudança no sinal de áudio, e meios para reinicializar o processo de controle de dinâmicas em resposta ao sinal de disparo de reinicialização.
  12. 12. Aparelho, de acordo com a reivindicação 11, caracterizado pelo fato de que o sinal de disparo de reinicialização indica um ou mais de:
    o ato de um usuário mudar um canal, o ato de um usuário mudar as fontes de entrada, o ato de um usuário selecionar uma função executar, retroceder ou avançar, a comutação de um arquivo para outro, uma mudança no programa, a comutação de um formato de codificação de áudio para
    Petição 870180133215, de 24/09/2018, pág. 39/44
    5/5 outro, e uma mudança nos parâmetros de codificação.
BRPI0717484-5A 2006-10-20 2007-09-25 Método e aparelho para processar um sinal de áudio BRPI0717484B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US85312706P 2006-10-20 2006-10-20
US60/853,127 2006-10-20
PCT/US2007/020747 WO2008051347A2 (en) 2006-10-20 2007-09-25 Audio dynamics processing using a reset

Publications (2)

Publication Number Publication Date
BRPI0717484A2 BRPI0717484A2 (pt) 2013-10-15
BRPI0717484B1 true BRPI0717484B1 (pt) 2019-05-21

Family

ID=38961076

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0717484-5A BRPI0717484B1 (pt) 2006-10-20 2007-09-25 Método e aparelho para processar um sinal de áudio

Country Status (16)

Country Link
US (1) US8849433B2 (pt)
EP (1) EP2082480B1 (pt)
JP (1) JP4940308B2 (pt)
KR (1) KR101137715B1 (pt)
CN (1) CN101529721B (pt)
AU (1) AU2007309691B2 (pt)
BR (1) BRPI0717484B1 (pt)
CA (1) CA2665153C (pt)
IL (1) IL197856A (pt)
MX (1) MX2009004175A (pt)
MY (1) MY144271A (pt)
NO (1) NO342161B1 (pt)
RU (1) RU2413357C2 (pt)
TW (1) TWI415481B (pt)
UA (1) UA94968C2 (pt)
WO (1) WO2008051347A2 (pt)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2581810C (en) 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
BRPI0711063B1 (pt) 2006-04-27 2023-09-26 Dolby Laboratories Licensing Corporation Método e aparelho para modificar um parâmetro de processamento de dinâmicas de áudio
BRPI0717484B1 (pt) 2006-10-20 2019-05-21 Dolby Laboratories Licensing Corporation Método e aparelho para processar um sinal de áudio
US9009032B2 (en) * 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
EP2168122B1 (en) 2007-07-13 2011-11-30 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
PL2232700T3 (pl) 2007-12-21 2015-01-30 Dts Llc System regulacji odczuwanej głośności sygnałów audio
CN101608947B (zh) * 2008-06-19 2012-05-16 鸿富锦精密工业(深圳)有限公司 声音测试方法
US20090323985A1 (en) * 2008-06-30 2009-12-31 Qualcomm Incorporated System and method of controlling power consumption in response to volume control
US8761415B2 (en) 2009-04-30 2014-06-24 Dolby Laboratories Corporation Controlling the loudness of an audio signal in response to spectral localization
WO2010126709A1 (en) 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
TWI503816B (zh) 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
WO2010131470A1 (ja) * 2009-05-14 2010-11-18 シャープ株式会社 ゲイン制御装置及びゲイン制御方法、音声出力装置
US8406431B2 (en) * 2009-07-23 2013-03-26 Sling Media Pvt. Ltd. Adaptive gain control for digital audio samples in a media stream
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
GB0919673D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Gain control for an audio signal
GB0919672D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Noise suppression
KR20110065095A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 디바이스를 제어하는 방법 및 그 장치
CN102098606A (zh) * 2009-12-10 2011-06-15 腾讯科技(深圳)有限公司 一种音量动态调节的方法及装置
EP2610865B1 (en) * 2010-08-23 2014-07-23 Panasonic Corporation Audio signal processing device and audio signal processing method
JP5707219B2 (ja) * 2011-05-13 2015-04-22 富士通テン株式会社 音響制御装置
JP5702666B2 (ja) * 2011-05-16 2015-04-15 富士通テン株式会社 音響装置および音量補正方法
US20120294457A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function
US20120294459A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function
WO2012161717A1 (en) * 2011-05-26 2012-11-29 Advanced Bionics Ag Systems and methods for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels
FR2976748B1 (fr) * 2011-06-17 2013-12-27 Arkamys Procede de normalisation de la puissance d'un signal sonore et dispositif de traitement associe.
EP2624449B1 (en) * 2012-02-01 2016-12-07 Harman Becker Automotive Systems GmbH Peak detection when adapting a signal gain based on signal loudness
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US10027303B2 (en) * 2012-11-13 2018-07-17 Snell Advanced Media Limited Management of broadcast audio loudness
TWI528777B (zh) 2012-12-28 2016-04-01 鴻海精密工業股份有限公司 音量調節方法與系統
US9570093B2 (en) * 2013-09-09 2017-02-14 Huawei Technologies Co., Ltd. Unvoiced/voiced decision for speech processing
CN103745734B (zh) * 2014-01-02 2017-01-11 青岛海信电器股份有限公司 一种设置声音曲线的设备及方法
WO2018231185A1 (ru) * 2017-06-16 2018-12-20 Василий Васильевич ДУМА Способ синхронизации звуковых сигналов
CN113037428B (zh) * 2019-12-09 2022-01-25 大唐移动通信设备有限公司 一种对数据流程的处理方法及装置

Family Cites Families (146)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
GB2215927A (en) 1988-03-16 1989-09-27 British Broadcasting Corp Improvements to RDS radio receivers
US4953112A (en) * 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (pt) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) * 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
AU653582B2 (en) 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
EP0517233B1 (en) 1991-06-06 1996-10-30 Matsushita Electric Industrial Co., Ltd. Music/voice discriminating apparatus
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
JPH0590857A (ja) 1991-09-28 1993-04-09 Victor Co Of Japan Ltd 音響効果装置
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
JPH065212U (ja) * 1992-06-15 1994-01-21 国際電気株式会社 Am・fm用受信機のagc回路
JP2727883B2 (ja) * 1992-08-20 1998-03-18 ヤマハ株式会社 楽音合成装置
GB2272615A (en) * 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5548638A (en) 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (pt) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
ZA95605B (en) * 1994-04-28 1995-12-20 Qualcomm Inc Method and apparatus for automatic gain control and dc offset cancellation in quadrature receiver
TW247390B (en) 1994-04-29 1995-05-11 Audio Products Int Corp Apparatus and method for adjusting levels between channels of a sound system
JPH07307058A (ja) 1994-05-10 1995-11-21 Sony Corp レベルコントロール回路及び録音装置
US5422602A (en) * 1994-06-20 1995-06-06 Aphex Systems, Ltd. Frequency discriminate leveler
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
DK0661905T3 (da) 1995-03-13 2003-04-07 Phonak Ag Fremgangsmåde til tilpasnning af et høreapparat, anordning hertil og høreapparat
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
AU5663296A (en) 1995-04-10 1996-10-30 Corporate Computer Systems, Inc. System for compression and decompression of audio signals fo r digital transmission
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US5642075A (en) * 1995-12-21 1997-06-24 Itt Corporation Sampled data automatic gain control
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
DK0820212T3 (da) 1996-07-19 2010-08-02 Bernafon Ag Lydstyrkestyret bearbejdning af akustiske signaler
US5832444A (en) * 1996-09-10 1998-11-03 Schmidt; Jon C. Apparatus for dynamic range compression of an audio signal
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
US5903655A (en) * 1996-10-23 1999-05-11 Telex Communications, Inc. Compression systems for hearing aids
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5923710A (en) * 1997-02-05 1999-07-13 Tektronix, Inc. Synchronous switching of digital audio while maintaining block alignment
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6535846B1 (en) * 1997-03-19 2003-03-18 K.S. Waves Ltd. Dynamic range compressor-limiter and low-level expander with look-ahead for maximizing and stabilizing voice level in telecommunication applications
DE19713862A1 (de) * 1997-04-04 1998-10-08 Bosch Gmbh Robert Verfahren zur automatischen Lautstärkesteuerung in einer Audiosignal-Wiedergabevorrichtung und Anordnung dazu
US6792119B1 (en) * 1997-05-05 2004-09-14 Koninklijke Philips Electronics N.V. Audio system
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) * 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
JP2002518912A (ja) * 1998-06-08 2002-06-25 コックレア リミティド 聴覚装置
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
DE69933929T2 (de) 1999-04-09 2007-06-06 Texas Instruments Inc., Dallas Bereitstellen von digitalen Audio- und Videoprodukten
AU4278300A (en) 1999-04-26 2000-11-10 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6985594B1 (en) 1999-06-15 2006-01-10 Hearing Enhancement Co., Llc. Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US6778966B2 (en) * 1999-11-29 2004-08-17 Syfx Segmented mapping converter system and method
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) * 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
EP1206104B1 (en) 2000-11-09 2006-07-19 Koninklijke KPN N.V. Measuring a talking quality of a telephone link in a telecommunications network
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
WO2001049068A2 (de) 2001-04-10 2001-07-05 Phonak Ag Verfahren zur anpassung eines hörgerätes an ein individuum
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
ATE318062T1 (de) 2001-04-18 2006-03-15 Gennum Corp Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7242784B2 (en) * 2001-09-04 2007-07-10 Motorola Inc. Dynamic gain control of audio in a communication device
US7177803B2 (en) 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
JP3899904B2 (ja) 2001-11-16 2007-03-28 日本ビクター株式会社 オートマチックレベルコントロール回路
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
EP1881486B1 (en) 2002-04-22 2009-03-18 Koninklijke Philips Electronics N.V. Decoding apparatus with decorrelator unit
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP2004133051A (ja) * 2002-10-08 2004-04-30 Wave Come:Kk 音声入力装置
JP2006518049A (ja) 2003-02-06 2006-08-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 連続的な予備オーディオ
DE10308483A1 (de) 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7590251B2 (en) * 2003-03-21 2009-09-15 D2Audio Corporation Clip detection in PWM amplifier
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
ATE371246T1 (de) 2003-05-28 2007-09-15 Dolby Lab Licensing Corp Verfahren, vorrichtung und computerprogramm zur berechung und einstellung der wahrgenommenen lautstärke eines audiosignals
ES2324926T3 (es) 2004-03-01 2009-08-19 Dolby Laboratories Licensing Corporation Descodificacion de audio multicanal.
GB2413906A (en) * 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
CA2581810C (en) 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
US7844059B2 (en) * 2005-03-16 2010-11-30 Microsoft Corporation Dereverberation of multi-channel audio streams
EP1869948B1 (en) * 2005-03-29 2016-02-17 GN Resound A/S Hearing aid with adaptive compressor time constants
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
EP2002429B1 (en) 2006-04-04 2012-11-21 Dolby Laboratories Licensing Corporation Controlling a perceived loudness characteristic of an audio signal
CN101410892B (zh) 2006-04-04 2012-08-08 杜比实验室特许公司 改进的离散余弦变换域中的音频信号响度测量及修改
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
BRPI0711063B1 (pt) 2006-04-27 2023-09-26 Dolby Laboratories Licensing Corporation Método e aparelho para modificar um parâmetro de processamento de dinâmicas de áudio
US7813825B2 (en) * 2006-07-10 2010-10-12 Apple Inc. Multiband dynamic range control graphical interface
BRPI0717484B1 (pt) 2006-10-20 2019-05-21 Dolby Laboratories Licensing Corporation Método e aparelho para processar um sinal de áudio
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
KR101106031B1 (ko) 2007-01-03 2012-01-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 하이브리드 디지털/아날로그 음향 세기―보상 볼륨 제어 장치 및 그 제어 방법
KR101163411B1 (ko) 2007-03-19 2012-07-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 지각 모델을 사용한 스피치 개선
DK2162879T3 (da) 2007-06-19 2013-07-22 Dolby Lab Licensing Corp Lydstyrkemåling med spektrale ændringer
EP2009786B1 (en) * 2007-06-25 2015-02-25 Harman Becker Automotive Systems GmbH Feedback limiter with adaptive control of time constants

Also Published As

Publication number Publication date
JP2010507330A (ja) 2010-03-04
IL197856A (en) 2014-03-31
AU2007309691A1 (en) 2008-05-02
NO20091518L (no) 2009-05-18
JP4940308B2 (ja) 2012-05-30
RU2413357C2 (ru) 2011-02-27
CA2665153A1 (en) 2008-05-02
EP2082480B1 (en) 2019-07-24
RU2009118955A (ru) 2010-11-27
TW200830890A (en) 2008-07-16
WO2008051347A2 (en) 2008-05-02
CN101529721A (zh) 2009-09-09
AU2007309691B2 (en) 2011-03-10
EP2082480A2 (en) 2009-07-29
CA2665153C (en) 2015-05-19
IL197856A0 (en) 2009-12-24
UA94968C2 (ru) 2011-06-25
TWI415481B (zh) 2013-11-11
MY144271A (en) 2011-08-29
KR20090078834A (ko) 2009-07-20
BRPI0717484A2 (pt) 2013-10-15
US8849433B2 (en) 2014-09-30
MX2009004175A (es) 2009-04-30
KR101137715B1 (ko) 2012-04-25
NO342161B1 (no) 2018-04-09
WO2008051347A3 (en) 2008-07-17
US20100198377A1 (en) 2010-08-05
CN101529721B (zh) 2012-05-23

Similar Documents

Publication Publication Date Title
BRPI0717484B1 (pt) Método e aparelho para processar um sinal de áudio
US9559656B2 (en) System for adjusting loudness of audio signals in real time
KR101852892B1 (ko) 음성 인식 방법, 음성 인식 장치 및 전자 장치
US10192564B2 (en) Signal quality-based enhancement and compensation of compressed audio signals
JP5248625B2 (ja) オーディオ信号の知覚ラウドネスを調節するシステム
BRPI1006010B1 (pt) Método e aparelho para controlar execução de dados e vídeo-áudio
US11164592B1 (en) Responsive automatic gain control
CN102422349A (zh) 增益控制装置和增益控制方法、声音输出装置
CN107333076B (zh) 电视机及其音频信号中频点数据的调整方法、装置
US11538486B2 (en) Echo estimation and management with adaptation of sparse prediction filter set
US20120323585A1 (en) Artifact Reduction in Time Compression
WO2014101713A1 (zh) 检测语音信号的方法和装置
US10741196B2 (en) Signal quality-based enhancement and compensation of compressed audio signals
US10027303B2 (en) Management of broadcast audio loudness
JP5091290B2 (ja) オーディオデータストリーム中のクリック音の除去
WO2017106281A1 (en) Nuisance notification
WO2019045909A1 (en) ACCELERATION OF LOW-SPEED AUDIO STREAMS BY SELECTIVELY ACHIEVING ABANDONMENT AND MIXTURE OF AUDIO BLOCKS
EP4114013A1 (en) Intrasegment adjustment of video transmission rate
JP2022552456A (ja) アーチファクトを低減したダイナミックレンジ圧縮

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B06G Technical and formal requirements: other requirements [chapter 6.7 patent gazette]

Free format text: PARECER 6.7

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 21/05/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 21/05/2019, OBSERVADAS AS CONDICOES LEGAIS