[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

RU2580924C2 - Представление информационного сигнала с использованием преобразования с перекрытием - Google Patents

Представление информационного сигнала с использованием преобразования с перекрытием Download PDF

Info

Publication number
RU2580924C2
RU2580924C2 RU2012148250/08A RU2012148250A RU2580924C2 RU 2580924 C2 RU2580924 C2 RU 2580924C2 RU 2012148250/08 A RU2012148250/08 A RU 2012148250/08A RU 2012148250 A RU2012148250 A RU 2012148250A RU 2580924 C2 RU2580924 C2 RU 2580924C2
Authority
RU
Russia
Prior art keywords
information signal
region
transform
sampling
conversion
Prior art date
Application number
RU2012148250/08A
Other languages
English (en)
Other versions
RU2012148250A (ru
Inventor
Маркус ШНЕЛЛЬ
Ральф ГАЙГЕР
Эммануэль РАВЕЛЛИ
Элени ФОТОПОУЛОУ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2012148250A publication Critical patent/RU2012148250A/ru
Application granted granted Critical
Publication of RU2580924C2 publication Critical patent/RU2580924C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

Изобретение относится к средствам представления информационных сигналов с использованием преобразования с перекрытием. Технический результат заключается в повышении эффективности кодирования. Модуль восстановления информационных сигналов сконфигурирован с возможностью восстанавливать, с использованием подавления наложения спектров, информационный сигнал из представления преобразования с перекрытием информационного сигнала, содержащего для каждой из последовательных перекрывающихся областей информационного сигнала преобразование обработанной методом окна версии соответствующей области, при этом модуль восстановления информационных сигналов сконфигурирован с возможностью восстанавливать информационный сигнал на частоте дискретизации, которая изменяется на границе между предшествующей областью и последующей областью информационного сигнала. Модуль восстановления информационных сигналов содержит повторный преобразователь, сконфигурированный с возможностью применять повторное преобразование к преобразованию обработанной методом окна версии предшествующей области, с тем чтобы получать повторное преобразование для предшествующей области, и применять повторное преобразование к преобразованию обработанной методом окна версии последующей области. 9 н. и 14 з.п. ф-лы, 13 ил.

Description

Настоящая заявка относится к представлению информационного сигнала с использованием преобразований с перекрытием и, в частности, к представлению информационного сигнала с использованием представления преобразования с перекрытием информационного сигнала, требующего подавления наложения спектров, к примеру, используемого, например, в технологиях сжатия аудио.
Большинство технологий сжатия спроектированы для определенного типа информационного сигнала и конкретных условий передачи сжатого потока данных, таких как максимальная разрешенная задержка и доступная скорость передачи битов. Например, при сжатии аудио кодеки на основе преобразования, такие как AAC, зачастую превосходят по характеристикам кодеки временной области на основе линейного прогнозирования, такие как ACELP, в случае более высокой доступной скорости передачи битов и в случае кодирования музыки вместо речи. USAC-кодек, например, нацелен на охват большего числа сценариев применения посредством унификации различных принципов кодирования аудио в одном кодеке. Тем не менее, является предпочтительным дополнительно повышать адаптивность к различным условиям кодирования, таким как изменяющаяся доступная скорость передачи битов, чтобы иметь возможность воспользоваться их преимуществом для того, чтобы достигать, например, более высокой эффективности кодирования и т.п.
Соответственно, задача настоящего изобретения заключается в том, чтобы предоставлять такой принцип посредством предоставления схемы представления информационного сигнала в виде преобразования с перекрытием, которая обеспечивает представление информационного сигнала посредством представления преобразования с перекрытием требующего подавления наложения спектров, так что можно адаптировать представление преобразования с перекрытием к фактической потребности, тем самым предоставляя возможность достигать более высокой эффективности кодирования.
Эта задача решается посредством объекта изобретения в находящихся на рассмотрении независимых пунктах формулы изобретения.
Основные идеи, которые приводят к настоящему изобретению, заключаются в следующем. Представления преобразования с перекрытием информационных сигналов зачастую используются для того, чтобы формировать предварительное состояние при эффективном кодировании информационного сигнала с точки зрения, например, восприятия отношения скорости передачи к искажению. Примерами таких кодеков являются AAC или TCX и т.п. Представления преобразования с перекрытием, тем не менее, также могут использоваться для того, чтобы выполнять повторную дискретизацию посредством конкатенации преобразования и повторного преобразования с различными спектральными разрешениями. В общем, представления преобразования с перекрытием, вызывающие наложение спектров в перекрывающихся частях отдельных повторных преобразований из преобразований обработанных методом окна последовательных временных областей информационного сигнала, имеют преимущество с точки зрения меньшего числа уровней коэффициентов преобразования, которые должны быть кодированы, с тем чтобы представлять представление преобразования с перекрытием. В крайней форме, преобразования с перекрытием являются "критически дискретизированными". Иными словами, не увеличивается число коэффициентов в представлении преобразования с перекрытием по сравнению с числом временных выборок информационного сигнала. Примером представления преобразования с перекрытием является гребенка фильтров MDCT (модифицированного дискретного косинусного преобразования) или QMF (квадратурных зеркальных фильтров). Соответственно, зачастую предпочтительно использовать такие представления преобразования с перекрытием в качестве предварительного состояния при эффективном кодировании информационных сигналов. Тем не менее, также должно быть предпочтительным иметь возможность разрешать изменение во времени частоты дискретизации, на которой представляется информационный сигнал с использованием представления преобразования с перекрытием, так что она адаптируется, например, к доступной скорости передачи битов или другим окружающим условиям. Представим себе изменяющуюся доступную скорость передачи битов. Каждый раз, когда доступная скорость передачи битов опускается ниже некоторого предварительно определенного порогового значения, например, может быть предпочтительным понижать частоту дискретизации, а когда доступная скорость передачи снова повышается, должно быть предпочтительным иметь возможность повышать частоту дискретизации, на которой представление преобразования с перекрытием представляет информационный сигнал. К сожалению, перекрывающиеся части с наложением спектров повторных преобразований представления преобразования с перекрытием, вероятно, образуют препятствие для таких изменений частоты дискретизации, причем это препятствие, вероятно, преодолевается только посредством полного прерывания представления преобразования с перекрытием в случаях изменений частоты дискретизации.
Авторы настоящего изобретения, тем не менее, реализовали решение вышеуказанной проблемы, тем самым обеспечивая эффективное использование представлений преобразования с перекрытием, заключающих в себе рассматриваемое наложение спектров и изменение частоты дискретизации. В частности, посредством интерполяции предшествующая и/или последующая область информационного сигнала повторно дискретизируется в части подавления наложения спектров согласно изменению частоты дискретизации на границе между обеими областями. Модуль комбинирования затем имеет возможность выполнять подавление наложения спектров на границе между повторными преобразованиями для предшествующей и последующей областей, полученных посредством повторной дискретизации в части подавления наложения спектров. Посредством этой меры изменения частоты дискретизации фактически обходятся с исключением разрывностей представления преобразования с перекрытием при изменениях/переходах частоты дискретизации. Аналогичные меры также осуществимы на стороне преобразования, чтобы надлежащим образом формировать преобразование с перекрытием.
С использованием вышеприведенной идеи можно предоставлять технологии сжатия информационных сигналов, к примеру технологии сжатия аудио, которые имеют высокую эффективность кодирования в широком диапазоне окружающих условий кодирования, таких как доступная полоса пропускания передачи, посредством адаптации передаваемой частоты дискретизации к этим условиям без штрафа за счет самих случаев изменений частоты дискретизации.
Преимущественные аспекты настоящего изобретения представляют собой предмет зависимых пунктов формулы изобретения для заданных независимых пунктов формулы изобретения. Кроме того, предпочтительные варианты осуществления настоящего изобретения описываются ниже относительно чертежей, на которых:
фиг. 1a показывает блок-схему информационного кодера, в котором могут быть реализованы варианты осуществления настоящего изобретения;
фиг. 1b показывает блок-схему декодера информационных сигналов, в котором могут быть реализованы варианты осуществления настоящего изобретения;
фиг. 2a показывает блок-схему возможной внутренней структуры базового кодера по фиг. 1a;
фиг. 2b показывает блок-схему возможной внутренней структуры базового декодера по фиг. 1b;
фиг. 3a показывает блок-схему возможной реализации модуля повторной дискретизации по фиг. 1a;
фиг. 3b показывает блок-схему возможной внутренней структуры модуля повторной дискретизации по фиг. 1b;
фиг. 4a показывает блок-схему кодера информационных сигналов, в котором могут быть реализованы варианты осуществления настоящего изобретения;
фиг. 4b показывает блок-схему декодера информационных сигналов, в котором могут быть реализованы варианты осуществления настоящего изобретения;
фиг. 5 показывает блок-схему модуля восстановления информационных сигналов в соответствии с вариантом осуществления;
фиг. 6 показывает блок-схему преобразователя информационных сигналов в соответствии с вариантом осуществления;
фиг. 7a показывает блок-схему кодера информационных сигналов в соответствии с дополнительным вариантом осуществления, в котором может быть использован модуль восстановления информационных сигналов согласно фиг. 5;
фиг. 7b показывает блок-схему декодера информационных сигналов в соответствии с дополнительным вариантом осуществления, в котором может быть использован модуль восстановления информационных сигналов согласно фиг. 5;
фиг. 8 показывает схематический вид, показывающий сценарии переключения частоты дискретизации, возникающие в кодере и декодере информационных сигналов по фиг. 6a и 6b в соответствии с вариантом осуществления.
Чтобы обуславливать варианты осуществления настоящего изобретения, дополнительно описанные ниже, предварительно поясняются варианты осуществления, в которых могут быть использованы варианты осуществления настоящей заявки и которые проясняют намерение и преимущества вариантов осуществления настоящей заявки, подробнее изложенных ниже.
Фиг. 1a и 1b показывают, например, пару из кодера и декодера, в которой преимущественно могут быть использованы варианты осуществления поясненные далее. Фиг. 1a показывает кодер, в то время как фиг. 1b показывает декодер. Кодер 10 информационных сигналов по фиг. 1a содержит вход 12, на который поступает информационный сигнал, модуль 14 повторной дискретизации и базовый кодер 16, при этом модуль 14 повторной дискретизации и базовый кодер 16 последовательно соединяются между входом 12 и выходом 18 кодера 10. На выходе 18 кодер 10 выводит поток данных, представляющий информационный сигнал входа 12. Аналогично, декодер, показанный на фиг. 1b с условным обозначением 20, содержит базовый декодер 22 и модуль 24 повторной дискретизации, которые последовательно соединяются между входом 26 и выходом 28 декодера 20 способом, показанным на фиг. 1b.
Если доступная скорость передачи битов для передачи потока данных, выводимого на выходе 18, на вход 26 декодера 20 является высокой, с точки зрения эффективности кодирования может быть предпочтительным представлять информационный сигнал 12 в потоке данных на высокой частоте дискретизации, тем самым покрывая широкую полосу спектра информационного сигнала. Иными словами, показатель эффективности кодирования, такой как показатель отношения скорости передачи к искажениям, может раскрывать, что эффективность кодирования является более высокой, если базовый кодер 16 сжимает входной сигнал 12 на более высокой частоте дискретизации по сравнению со сжатием версии с более низкой частотой дискретизации информационного сигнала 12. С другой стороны, на более низких доступных скоростях передачи битов может возникать такая ситуация, что показатель эффективности кодирования является более высоким при кодировании информационного сигнала 12 на более низкой частоте дискретизации. В этом отношении следует отметить, что искажение может измеряться психоакустически обусловленным способом, т.е. с более интенсивным учетом искажений в перцепционно более релевантных частотных областях, чем в перцепционно менее релевантных частотных областях, т.е. в частотных областях, в которых человеческое ухо является, например, менее чувствительным. В общем, области низких частот зачастую являются более релевантными, чем области верхних частот, и соответственно кодирование на более низкой частоте дискретизации исключает из кодирования частотные компоненты сигнала на входе 12, находящиеся выше частоты Найквиста, но, с другой стороны, экономия по скорости передачи битов, возникающая в результате этого, может, в восприятии отношения скорости передачи к искажениям, приводить к тому, что такое кодирование на более низкой частоте дискретизации должно предпочитаться по сравнению с кодированием на более высокой частоте дискретизации. Аналогичные несоответствия в значимости искажений между частями нижних и верхних частот также существуют в других информационных сигналах, к примеру измерительных сигналах и т.п.
Соответственно, модуль 14 повторной дискретизации служит для изменения частоты дискретизации, на которой дискретизируется информационный сигнал 12. Посредством надлежащего управления частотой дискретизации в зависимости от внешних условий передачи, к примеру, заданных, в числе прочего, посредством доступной скорости передачи битов между выходом 18 и входом 26, кодер 10 имеет возможность достигать повышенной эффективности кодирования, несмотря на изменение во времени внешних условий передачи. Декодер 20, в свою очередь, содержит базовый декодер 22, который распаковывает поток данных, при этом модуль 24 повторной дискретизации проверяет то, чтобы восстановленный информационный сигнал, выводимый на выходе 28, снова имел постоянную частоту дискретизации.
Тем не менее, проблемы в результате возникают каждый раз, когда представление преобразования с перекрытием используется в паре кодера/декодера по фиг. 1a и 1b. Представление преобразования с перекрытием, заключающее в себе наложение спектров в перекрывающихся областях повторных преобразований, образует эффективное средство для кодирования, но вследствие обязательного подавления наложения спектров во времени возникают проблемы, если частота дискретизации изменяется. См. подробности, например, на фиг. 2a и 2b. Фиг. 2a и 2b показывают возможные реализации для базового кодера 16 и базового декодера 22 при условии, что оба имеют тип кодирования с преобразованием. Соответственно, базовый кодер 16 содержит преобразователь 30, после которого следует модуль 32 сжатия, а базовый декодер, показанный на фиг. 2b, содержит модуль 34 распаковки, после которого, в свою очередь, следует повторный преобразователь 36. Фиг. 2a и 2b не должны интерпретироваться таким образом, что другие модули не могут присутствовать в базовом кодере 16 и базовом декодере 22. Например, фильтр может предшествовать преобразователю 30, так что второй должен преобразовывать повторно дискретизированный информационный сигнал, полученный посредством модуля 14 повторной дискретизации, не непосредственно, а в предварительно фильтрованной форме. Аналогично, фильтр, имеющий обратную передаточную функцию, может следовать после повторного преобразователя 36, так что сигнал повторного преобразования может обратно фильтроваться после этого.
Модуль 32 сжатия должен сжимать результирующее представление преобразования с перекрытием, выводимое посредством преобразователя 30, к примеру, посредством использования кодирования без потерь, к примеру энтропийного кодирования, включающего в себя такие примеры, как кодирование методом Хаффмана или арифметическое кодирование, и модуль 34 распаковки может выполнять обратный процесс, т.е. распаковку, посредством, например, энтропийного декодирования, к примеру декодирования методом Хаффмана или арифметического декодирования, чтобы получать представление преобразования с перекрытием, которое затем подается в повторный преобразователь 36.
В окружении кодирования с преобразованием, показанном на фиг. 2a и 2b, проблемы возникают каждый раз, когда модуль 14 повторной дискретизации изменяет частоту дискретизации. Проблема является менее серьезной на стороне кодирования, поскольку информационный сигнал 12 присутствует в любом случае и соответственно в преобразователь 30 могут предоставляться непрерывно дискретизированные области для отдельных преобразований с использованием обработанной методом окна версии соответствующих областей даже для случаев изменения частоты дискретизации.
Возможный вариант осуществления для реализации преобразователя 30 соответственно описан далее относительно фиг. 6. В общем, в преобразователь 30 может предоставляться обработанная методом окна версия предшествующей области информационного сигнала на текущей частоте дискретизации, при этом затем в преобразователь 30 подается, посредством модуля 14 повторной дискретизации, следующая частично перекрывающаяся область информационного сигнала, преобразование обработанной методом окна версии которой затем формируется посредством преобразователя 30. Дополнительные проблемы не возникают, поскольку обязательное подавление наложения спектров во времени должно осуществляться в повторном преобразователе 36, а не в преобразователе 30. В повторном преобразователе 36, тем не менее, изменение частоты дискретизации вызывает проблему в том, что повторный преобразователь 36 не имеет возможности выполнять подавление наложения спектров во времени, поскольку повторные преобразования вышеуказанных непосредственно следующих областей связаны с различными частотами дискретизации. Варианты осуществления, подробнее описанные ниже, преодолевают эти проблемы. Повторный преобразователь 36, согласно этим вариантам осуществления, может заменяться посредством модуля восстановления информационных сигналов, дополнительно описанного ниже.
Тем не менее, в окружении, описанном относительно фиг. 1a и 1b, проблемы возникают не только в случае базового кодера 16 и базового декодера 22, имеющих тип кодирования с преобразованием. Наоборот, проблемы также могут возникать в случае использования гребенок фильтров на основе преобразования с перекрытием для формирования модулей 14 и 24 повторной дискретизации, соответственно. См. подробности, например, на фиг. 3a и 3b. Фиг. 3a и 3b показывают один конкретный вариант осуществления для реализации модулей 14 и 24 повторной дискретизации. В соответствии с вариантом осуществления по фиг. 3a и 3b оба модуля повторной дискретизации реализуются посредством использования конкатенации гребенок 38 и 40 фильтров анализа, после которых соответственно следуют гребенки 42 и 44 фильтров синтеза соответственно. Как проиллюстрировано на фиг. 3a и 3b, гребенки 38-44 фильтров анализа и синтеза могут быть реализованы как QMF-гребенки фильтров, т.е. гребенки фильтров на основе MDCT с использованием QMF для разбиения заранее информационного сигнала и повторного объединения сигнала снова. QMF может быть реализован аналогично QMF, используемому в SBR-части MPEG HE-AAC или AAC-ELD, означающему многоканальную модулированную гребенку фильтров с перекрытием в 10 блоков, где 10 является просто примером. Таким образом, представление преобразования с перекрытием формируется посредством гребенок 38 и 40 фильтров анализа, и повторно дискретизированный сигнал восстанавливается из этого представления преобразования с перекрытием в случае гребенок 42 и 44 фильтров синтеза. Чтобы в результате обеспечивать изменение частоты дискретизации, гребенка 42 фильтров синтеза и гребенка 40 фильтров анализа могут быть реализованы, чтобы работать при изменяющейся длине преобразования, при этом, тем не менее, скорость гребенки фильтров или QMF, т.е. скорость, на которой последовательные преобразования формируются посредством гребенок 38 и 40 фильтров анализа соответственно, с одной стороны, и повторно преобразуются посредством гребенок 42 и 44 фильтров синтеза соответственно, с другой стороны, является постоянной и идентичной для всех компонентов 38-44. Изменение длины преобразования, тем не менее, приводит к изменению частоты дискретизации. Рассмотрим, например, пару из гребенки 38 фильтров анализа и гребенки 42 фильтров синтеза. Предположим, что гребенка 38 фильтров анализа работает с использованием постоянной длины преобразования и постоянной скорости гребенки фильтров или преобразования. В этом случае представление преобразования с перекрытием входного сигнала, выводимого посредством гребенки 38 фильтров анализа, содержит для каждой из последовательных перекрывающихся областей входного сигнала, имеющих постоянную примерную длину, преобразование обработанной методом окна версии соответствующей области, причем преобразования также имеют постоянную длину. Другими словами, гребенка 38 фильтров анализа должна перенаправлять в гребенку 42 фильтров синтеза спектрограмму постоянного частотно-временного разрешения. Длина преобразования гребенки фильтров синтеза, тем не менее, должна изменяться. Рассмотрим, например, случай понижающей дискретизации от первой частоты понижающей дискретизации между входной частотой дискретизации на входе гребенки 38 фильтров анализа и частотой дискретизации сигнала, выводимого на выходе гребенки 42 фильтров синтеза, ко второй частоте понижающей дискретизации. При условии, что первая частота понижающей дискретизации является допустимой, представление преобразования с перекрытием или спектрограмма, выводимая посредством гребенки 38 фильтров анализа, затем должна быть частично использована просто для того, чтобы подавать при повторных преобразованиях в гребенке 42 фильтров синтеза. Повторное преобразование гребенки 42 фильтров синтеза должно применяться просто к части нижних частот последовательных преобразований в спектрограмме гребенки 38 фильтров анализа. Вследствие меньшей длины преобразования, используемой в повторном преобразовании гребенки 42 фильтров синтеза, число выборок в повторных преобразованиях гребенки 42 фильтров синтеза также должно быть меньше по сравнению с числом выборок, подвергаемых, в кластерах перекрывающихся временных частей, преобразованиям в гребенке 38 фильтров, тем самым приводя к более низкой частоте дискретизации по сравнению с исходной частотой дискретизации информационного сигнала, поступающего на вход гребенки 38 фильтров анализа. Проблемы не должны возникать при условии, что частота понижающей дискретизации остается идентичной, поскольку по-прежнему для гребенки 42 фильтров синтеза не представляет проблемы выполнять подавление наложения спектров во времени на перекрытии между последовательными повторными преобразованиями и последовательными перекрывающимися областями выходного сигнала на выходе гребенки фильтров 42.
Проблема возникает каждый раз, когда происходит изменение частоты понижающей дискретизации, такое как изменение с первой частоты понижающей дискретизации на вторую большую частоту понижающей дискретизации. В этом случае длина преобразования, используемая в повторном преобразовании гребенки 42 фильтров синтеза, должна быть дополнительно уменьшена, тем самым приводя к еще более низкой частоте дискретизации для соответствующих последующих областей после момента времени изменения частоты дискретизации. С другой стороны, проблемы возникают для гребенки 42 фильтров синтеза, поскольку подавление наложения спектров во времени между повторным преобразованием относительно области, непосредственно предшествующей моменту времени изменения частоты дискретизации, и повторным преобразованием относительно области повторно дискретизированного сигнала, непосредственно следующей после момента времени изменения частоты дискретизации, нарушает подавление наложения спектров во времени между рассматриваемыми повторными преобразованиями. Соответственно, несильно помогает то, что аналогичные проблемы не возникают на стороне декодирования, на которой гребенка 40 фильтров анализа с изменяющейся длиной преобразования предшествует гребенке 44 фильтров синтеза с постоянной длиной преобразования. Здесь, гребенка 44 фильтров синтеза применяется к спектрограмме с постоянной скоростью QMF/преобразования, но с различным частотным разрешением, т.е. к последовательным преобразованиям, перенаправляемым из гребенки 40 фильтров анализа в гребенку 44 фильтров синтеза на постоянной скорости, но с различной или изменяющейся во времени длиной преобразования, чтобы сохранять часть нижних частот всей длины преобразования гребенки 44 фильтров синтеза с дополнением части верхних частот всей длины преобразования нулями. Подавление наложения спектров во времени между последовательными повторными преобразованиями, выводимыми посредством гребенки 44 фильтров синтеза, не является проблематичным, поскольку частота дискретизации восстановленного сигнала, выводимого на выходе гребенки 44 фильтров синтеза, имеет постоянную частоту дискретизации.
Таким образом, снова существует проблема в попытке реализовывать изменение/адаптацию частоты дискретизации, представленная выше относительно фиг. 1a и 1b, но эти проблемы могут преодолеваться посредством реализации гребенки 42 обратных или фильтров синтеза по фиг. 3a в соответствии с некоторыми поясненными далее вариантами осуществления для модуля восстановления информационных сигналов.
Вышеуказанные идеи относительно адаптации/изменения частоты дискретизации даже более интересны при рассмотрении принципов кодирования, согласно которым часть верхних частот информационного сигнала, который должен быть кодирован, кодируется параметрическим способом, например, посредством использования дублирования полос спектра (SBR), тогда как его часть нижних частот кодируется с использованием кодирования с преобразованием и/или прогнозирующего кодирования и т.п. См. подробности, например, на фиг. 4a и 4b, показывающих пару кодера информационных сигналов и декодера информационных сигналов. На стороне кодирования базовый кодер 16 следует после модуля повторной дискретизации, осуществленного так, как показано на фиг. 3a, т.е. как конкатенация гребенки 38 фильтров анализа и гребенки 42 фильтров синтеза с изменяющейся длиной преобразования. Как отмечено выше, чтобы достигать изменяющейся во времени частоты понижающей дискретизации между входом гребенки 38 фильтров анализа и выходом гребенки 42 фильтров синтеза, гребенка 42 фильтров синтеза применяет свое повторное преобразование к подчасти спектра с постоянным диапазоном, т.е. преобразования с постоянной длиной и постоянной скоростью преобразования 46, выводимые посредством гребенки 38 фильтров анализа, подчасти которой имеют изменяющуюся во времени длину для длины преобразования гребенки 42 фильтров синтеза. Изменение во времени проиллюстрировано посредством двунаправленной стрелки 48. Хотя часть 50 нижних частот, повторно дискретизированная посредством конкатенации гребенки 38 фильтров анализа и гребенки 42 фильтров синтеза, кодируется посредством базового кодера 16, остаток, т.е. часть 52 верхних частот, составляющая оставшуюся частотную часть спектра 46, может подвергаться параметрическому кодированию по огибающей в параметрическом кодере 54 по огибающей. Базовый поток 56 данных тем самым сопровождается посредством потока 58 данных параметрического кодирования, выводимого посредством параметрического кодера 54 по огибающей. На стороне декодирования декодер аналогично содержит базовый декодер 22, после которого следует модуль повторной дискретизации, реализованный так, как показано на фиг. 3b, т.е. содержит гребенку 40 фильтров анализа, после которой следует гребенка 44 фильтров синтеза, при этом гребенка 40 фильтров анализа имеет изменяющуюся во времени длину преобразования, синхронизированную с изменением во времени длины преобразования гребенки 42 фильтров синтеза на стороне кодирования. Хотя базовый декодер 22 принимает базовый поток 56 данных, чтобы декодировать его, параметрический декодер 60 по огибающей предоставляется, чтобы принимать параметрический поток 58 данных и извлекать из него часть 52' верхних частот, дополняющую часть 50 нижних частот с изменяющейся длиной преобразования, а именно с длиной, синхронизированной с изменением во времени длины преобразования, используемой посредством гребенки 42 фильтров синтеза на стороне кодирования, и синхронизированной с изменением частоты дискретизации, выводимой посредством базового декодера 22.
В случае кодера по фиг. 4a преимущественно, если гребенка 38 фильтров анализа присутствует в любом случае, так что формирование модуля повторной дискретизации требует просто добавления гребенки 42 фильтров синтеза. Посредством переключения частоты дискретизации можно адаптировать отношение LF-части спектра 46, которая подвергается более точному базовому кодированию по сравнению с HF-частью, которая подвергается просто параметрическому кодированию по огибающей. В частности, отношение может управляться эффективным способом в зависимости от внешних условий, таких как доступная полоса пропускания передачи для передачи полного потока данных и т.п. Изменение во времени, управляемое на стороне кодирования, легко сигнализировать на сторону декодирования, например, через соответствующие вспомогательные информационные данные.
Таким образом, относительно фиг. 1a-4b показано, что должно быть предпочтительным, если для использования доступен принцип, который фактически предоставляет изменение частоты дискретизации, несмотря на использование представлений преобразования с перекрытием, требующих подавления наложения спектров во времени. Фиг. 5 показывает вариант осуществления модуля восстановления информационных сигналов, который должен, в случае применения для реализации гребенки 42 фильтров синтеза или повторного преобразователя 36 на фиг. 2b, преодолевать вышеприведенные проблемы и достигать преимуществ пользования преимуществами такого изменения частоты дискретизации, как указано выше.
Модуль восстановления информационных сигналов, показанный на фиг. 5, содержит повторный преобразователь 70, модуль 72 повторной дискретизации и модуль 74 комбинирования, которые последовательно соединяются в порядке их упоминания между входом 76 и выходом 78 модуля 80 восстановления информационных сигналов.
Модуль восстановления информационных сигналов, показанный на фиг. 5, служит для восстановления, с использованием подавления наложения спектров, информационного сигнала из представления преобразования с перекрытием информационного сигнала, поступающего на вход 76. Иными словами, модуль восстановления информационных сигналов служит для вывода на выходе 78 информационного сигнала с изменяющейся во времени частотой дискретизации с использованием представления преобразования с перекрытием этого информационного сигнала, поступающего на вход 76. Представление преобразования с перекрытием информационного сигнала содержит, для каждой из последовательных перекрывающихся временных областей (или временных интервалов) информационного сигнала, преобразование обработанной методом окна версии соответствующей области. Как подробнее указано ниже, модуль 80 восстановления информационных сигналов сконфигурирован с возможностью восстанавливать информационный сигнал на частоте дискретизации, которая изменяется на границе 82 между предшествующей областью 84 и последующей областью 86 информационного сигнала 90.
Чтобы пояснять функциональность отдельных модулей 70-74 модуля 80 восстановления информационных сигналов, предварительно предполагается, что представление преобразования с перекрытием информационного сигнала, поступающего на вход 76, имеет постоянное частотно-временное разрешение, т.е. разрешение, постоянное во времени и частоте. Ниже поясняется другой сценарий.
Согласно вышеупомянутому допущению представление преобразования с перекрытием может рассматриваться так, как показано на 92 на фиг. 5. Как показано, представление преобразования с перекрытием содержит последовательность преобразований, которые являются последовательными во времени с определенной скоростью Δt преобразования. Каждое преобразование 94 представляет преобразование обработанной методом окна версии соответствующей временной области i информационного сигнала. В частности, поскольку частотное разрешение является постоянным во времени для представления 92, каждое преобразование 94 содержит постоянное число коэффициентов преобразования, а именно Nk. Это фактически означает, что представление 92 является спектрограммой информационного сигнала, содержащей Nk спектральных компонентов или поддиапазонов частот, которые могут строго упорядочиваться вдоль спектральной оси k, как проиллюстрировано на фиг. 5. В каждом спектральном компоненте или поддиапазоне частот коэффициенты преобразования в спектрограмме возникают на скорости Δt преобразования.
Представление 92 преобразования с перекрытием, имеющее такое постоянное частотно-временное разрешение, например, выводится посредством QMF-гребенки фильтров анализа, как показано на фиг. 3a. В этом случае каждый коэффициент преобразования должен быть комплекснозначным, т.е. каждый коэффициент преобразования должен иметь, например, вещественную и мнимую часть. Тем не менее, коэффициенты преобразования представления 92 преобразования с перекрытием не обязательно являются комплекснозначными, а также могут быть исключительно вещественнозначными, к примеру, в случае чистого MDCT. Помимо этого следует отметить, что вариант осуществления по фиг. 5 также является переносимым на другие представления преобразования с перекрытием, вызывающие наложение спектров в перекрывающихся частях временных областей, причем преобразования 94, которые последовательно размещаются в представлении 92 преобразования с перекрытием.
Повторный преобразователь 70 сконфигурирован с возможностью применять повторное преобразование для преобразований 94 с тем, чтобы получать, для каждого преобразования 94, повторное преобразование, проиллюстрированное посредством соответствующей временной огибающей 96 для последовательных временных областей 84 и 86, причем временная огибающая примерно соответствует взвешивающей функции, применяемой к вышеуказанным временным частям информационного сигнала, чтобы в результате обеспечивать последовательность преобразований 94. Что касается предшествующей временной области 84, фиг. 5 предполагает то, что повторный преобразователь 70 применяет повторное преобразование к полному преобразованию 94, ассоциированному с этой областью 84 в представлении 92 преобразования с перекрытием, так что повторное преобразование 96 для области 84 содержит, например, Nk выборок или два раза по Nk выборок (в любом случае столько выборок, сколько составляет обработанная методом окна часть, из которой получено соответствующее преобразование 94), дискретизирующих полную временную длину Δt*a временной области 84, при этом коэффициент представляет собой коэффициент, определяющий перекрытие между последовательными временными областями, в единицах которых сформированы преобразования 94 представления 92. Здесь следует отметить, что равенство (или двойственность) числа временных выборок во временной области 84 и числа коэффициентов преобразования в преобразовании 94, принадлежащих этой временной области 84, выбраны просто в качестве иллюстрации и что равенство (или двойственность) также может заменяться посредством другого постоянного отношения между обоими числами в соответствии с альтернативным вариантом осуществления, в зависимости от используемого подробного преобразования с перекрытием.
Теперь предполагается, что модуль восстановления информационных сигналов нацелен на изменение частоты дискретизации информационного сигнала между временной областью 84 и временной областью 86. Обуславливающий фактор для этого может предоставляться посредством внешнего сигнала 98. Если, например, модуль 80 восстановления информационных сигналов используется для реализации гребенки 42 фильтров синтеза по фиг. 3a и фиг. 4a соответственно, сигнал 98 может предоставляться каждый раз, когда изменение частоты дискретизации предполагает более эффективное кодирование, к примеру, в ходе изменения условий передачи потока данных.
В данном случае в качестве иллюстрации предполагается, что модуль 80 восстановления информационных сигналов нацелен на уменьшение частоты дискретизации между временными областями 84 и 86. Соответственно, повторный преобразователь 70 также применяет повторное преобразование для преобразования обработанной методом окна версии последующей области 86, с тем чтобы получать повторное преобразование 100 для последующей области 86, но на этот раз повторный преобразователь 70 использует меньшую длину преобразования для выполнения повторного преобразования. Если точнее, повторный преобразователь 70 выполняет повторное преобразование в наименьшие Nk'<Nk коэффициентов преобразования для преобразования только для последующей области 86, т.е. в коэффициенты преобразования 1...Nk', так что полученное повторное преобразование 100 содержит более низкую частоту дискретизации, т.е. оно дискретизируется просто с помощью Nk' вместо Nk (или соответствующей доли второго числа).
Как проиллюстрировано на фиг. 5, проблема, возникающая между повторными преобразованиями 96 и 100, заключается в следующем. Повторное преобразование 96 для предшествующей области 84 и повторное преобразование 100 для последующей области 86 перекрываются в части 102 подавления наложения спектров на границе 82 между предшествующей и последующей областями 84 и 86, при этом продолжительность части подавления наложения спектров составляет, например, (a-1)*Δt, но число выборок повторного преобразования 96 в этой части 102 подавления наложения спектров отличается от (конкретно в этом примере, выше) числа выборок повторного преобразования 100 в идентичной части 102 подавления наложения спектров. Таким образом, подавление наложения спектров во времени посредством выполнения суммирования с перекрытием обоих повторных преобразований 96 и 100 в этом временном интервале 102 не является простым.
Соответственно, модуль 72 повторной дискретизации соединяется между повторным преобразователем 70 и модулем 74 комбинирования, второй из которых отвечает за выполнение подавления наложения спектров во времени. В частности, модуль 72 повторной дискретизации сконфигурирован с возможностью повторно дискретизировать, посредством интерполяции, повторное преобразование 96 для предшествующей области 84 и/или повторное преобразование 100 для последующей области 86 в части 102 подавления наложения спектров согласно изменению частоты дискретизации на границе 82. Поскольку повторное преобразование 96 достигает входа модуля 72 повторной дискретизации раньше повторного преобразования 100, может быть предпочтительным, чтобы модуль 72 повторной дискретизации выполнял повторную дискретизацию для повторного преобразования 96 для предшествующей области 84. Иными словами, посредством интерполяции 104 должна повторно дискретизироваться соответствующая часть повторного преобразования 96, содержащаяся в части 102 подавления наложения спектров, с тем чтобы соответствовать условию дискретизации или позициям выборок повторного преобразования 100 в идентичной части 102 подавления наложения спектров. Модуль 74 комбинирования затем может просто суммировать совместно размещаемые выборки из повторно дискретизированной версии повторного преобразования 96 и повторного преобразования 100, чтобы получать восстановленный сигнал 90 в этом временном интервале 102 на новой частоте дискретизации. В этом случае частота дискретизации в выходном восстановленном сигнале должна переключаться с первой на новую частоту дискретизации в начальном сегменте (начале) временной части 86. Тем не менее, интерполяция также может применяться по-разному для начальной и завершающей половины временного интервала 102 с тем, чтобы достигать другого момента 82 во времени для переключения частоты дискретизации в восстановленном сигнале 90. Таким образом, момент 82 времени изображен на фиг. 5 как находящийся в середине перекрытия между частью 84 и 86, просто в качестве иллюстрации, и в соответствии с другими вариантами осуществления идентичный момент времени может находиться где-то в другом месте между началом части 86 и концом части 84 включительно.
Соответственно, модуль 74 комбинирования затем имеет возможность выполнять подавление наложения спектров между повторными преобразованиями 96 и 100 для предшествующей и последующей областей 84 и 86 соответственно, полученных посредством повторной дискретизации в части 102 подавления наложения спектров. Если точнее, чтобы подавлять наложение спектров в части 102 подавления наложения спектров, модуль 74 комбинирования выполняет процесс суммирования с перекрытием между повторными преобразованиями 96 и 100 в части 102 с использованием повторно дискретизированной версии, полученной посредством модуля 72 повторной дискретизации. Процесс суммирования с перекрытием в результате обеспечивает, вместе с обработкой методом окна для формирования преобразований 94, постоянно усиленное представление без наложения спектров информационного сигнала 90 на выходе 78 даже на границе 82, даже если частота дискретизации информационного сигнала 90 изменяется в момент 82 времени с более высокой частоты дискретизации на более низкую частоту дискретизации.
Таким образом, как вытекает из вышеприведенного описания по фиг. 5, отношение длины преобразования для повторного преобразования, применяемого к преобразованию 94 обработанной методом окна версии предшествующей временной области 84, к временной длине предшествующей области 84 отличается от отношения длины преобразования для повторного преобразования, применяемого к обработанной методом окна версии последующей области 86, к временной длине последующей области 86 на коэффициент, который соответствует изменению частоты дискретизации на границе 82 между обеими областями 84 и 86. В вышеописанном примере это изменение отношения инициировано иллюстративно посредством внешнего сигнала 98. Временная длина предшествующей и последующей временных областей 84 и 86 предположительно равны друг другу, и повторный преобразователь 70 сконфигурирован с возможностью ограничивать применение повторного преобразования к преобразованию 94 обработанной методом окна версии последующей области 86 его частью низких частот, например, вплоть до Nk'-го коэффициента преобразования для преобразования. Естественно, такой захват уже может осуществляться также относительно преобразования 94 обработанной методом окна версии предшествующей области 84. Кроме того, в отличие от вышеуказанной иллюстрации, изменение частоты дискретизации на границе 82 может выполняться в другом направлении, и тем самым захват может выполняться не относительно последующей области 86, а вместо этого просто относительно преобразования 94 обработанной методом окна версии предшествующей области 84.
Если точнее, выше режим работы модуля восстановления информационных сигналов по фиг. 5 иллюстративно описан для случая, в котором длина преобразования для преобразования 94 обработанной методом окна версии областей информационного сигнала и временная длина областей информационного сигнала являются постоянными, т.е. представление 92 преобразования с перекрытием является спектрограммой, имеющей постоянное частотно-временное разрешение. Чтобы находить границу 82, модуль 80 восстановления информационных сигналов примерно описан как чувствительный к управляющему сигналу 98.
Соответственно, в этой конфигурации модуль 80 восстановления информационных сигналов по фиг. 5 может быть частью модуля 14 повторной дискретизации по фиг. 3a. Другими словами, модуль 14 повторной дискретизации по фиг. 3a может состоять из конкатенации гребенки 38 фильтров для предоставления представления преобразования с перекрытием информационного сигнала и гребенки обратных фильтров, содержащей модуль 80 восстановления информационных сигналов, сконфигурированный с возможностью восстанавливать, с использованием подавления наложения спектров, информационный сигнал из представления преобразования с перекрытием информационного сигнала, как описано выше. Повторный преобразователь 70 по фиг. 5, соответственно, может быть сконфигурирован как QMF-гребенка фильтров синтеза, при этом гребенка 38 фильтров реализуется, например, как QMF-гребенка фильтров анализа.
Как очевидно из описания фиг. 1a и 4a, кодер информационных сигналов может содержать такой модуль повторной дискретизации наряду с каскадом сжатия, таким как базовый кодер 16 или объединенный базовый кодер 16 и параметрический кодер 54 по огибающей. Каскад сжатия должен быть сконфигурирован с возможностью сжимать восстановленный информационный сигнал. Как показано на фиг. 1 и 4a, такой кодер информационных сигналов дополнительно может содержать контроллер частоты дискретизации, сконфигурированный с возможностью управлять управляющим сигналом 98, например, в зависимости от внешней информации относительно доступной скорости передачи битов.
Тем не менее, альтернативно, модуль восстановления информационных сигналов по фиг. 5 может быть сконфигурирован с возможностью находить границу 82 посредством обнаружения изменения в длине преобразования обработанной методом окна версии областей информационного сигнала в представлении преобразования с перекрытием. Чтобы прояснить эту возможную реализацию, см. 92' на фиг. 5, на котором показан пример входящего представления преобразования с перекрытием, согласно которому последовательные преобразования 94 в представлении 92' по-прежнему поступают в повторный преобразователь 70 на постоянной скорости Δt преобразования, но длина преобразования отдельного преобразования изменяется. На фиг. 5, например, предполагается, что длина преобразования для преобразования обработанной методом окна версии предшествующей временной области 84 превышает (а именно, Nk) длину преобразования для преобразования обработанной методом окна версии последующей области 86, которая предполагается равной просто Nk'. Так или иначе, повторный преобразователь 70 имеет возможность корректно синтаксически анализировать информацию относительно представления 92' преобразования с перекрытием из входного потока данных, и соответственно повторный преобразователь 70 может адаптировать длину преобразования для повторного преобразования, применяемого к преобразованию обработанной методом окна версии последовательных областей информационного сигнала, к длине преобразования для последовательных преобразований представления 92' преобразования с перекрытием. Соответственно, повторный преобразователь 70 может использовать длину преобразования в Nk для повторного преобразования для преобразования 94 обработанной методом окна версии предшествующей временной области 84 и длину преобразования в Nk' для повторного преобразования для преобразования обработанной методом окна версии последующей временной области 86, тем самым получая несоответствие частоты дискретизации между повторными преобразованиями, которое уже пояснено выше и показано на фиг. 5 сверху в середине этого чертежа. Соответственно, что касается режима работы модуля 80 восстановления информационных сигналов по фиг. 5, этот режим работы совпадает с вышеприведенным описанием за исключением вышеупомянутого отличия в адаптации длины преобразования для повторного преобразования к длине преобразования для преобразований в представлении 92' преобразования с перекрытием.
Таким образом, в соответствии со второй функциональностью, модуль восстановления информационных сигналов не должен быть чувствительным к внешнему управляющему сигналу 98. Наоборот, входящее представление 92' преобразования с перекрытием может быть достаточным для того, чтобы сообщать модулю восстановления информационных сигналов относительно моментов времени изменения частоты дискретизации.
Модуль 80 восстановления информационных сигналов, работающий так, как описано выше, может быть использован для того, чтобы формировать повторный преобразователь 36 по фиг. 2b. Иными словами, декодер информационных сигналов может содержать модуль 34 распаковки, сконфигурированный с возможностью восстанавливать представление 92' преобразования с перекрытием информационного сигнала из потока данных. Восстановление, как уже описано выше, может заключать в себе энтропийное декодирование. Изменяющаяся во времени длина преобразования для преобразований 94 может быть сигнализирована в потоке данных, поступающем в модуль 34 распаковки, надлежащим способом. Модуль восстановления информационных сигналов, как показано на фиг. 5, может быть использован в качестве модуля 36 восстановления. Он может быть сконфигурирован с возможностью восстанавливать, с использованием подавления наложения спектров, информационный сигнал из представления преобразования с перекрытием в соответствии с модулем 34 распаковки. Во втором случае повторный преобразователь 70, например, может быть выполнен с возможностью использовать IMDCT для того, чтобы выполнять повторные преобразования, и преобразование 94 может быть представлено посредством вещественнозначных коэффициентов, а не комплекснозначных.
Таким образом, вышеописанные варианты осуществления обеспечивают достижение многих преимуществ. Для аудиокодеков, работающих в полном диапазоне скорости передачи битов, таком как, к примеру, 8-128 кбит в секунду, оптимальная частота дискретизации может зависеть от скорости передачи битов, как описано выше относительно фиг. 4a и 4b. Для более низких скоростей передачи битов только нижняя частота, например, должна быть кодирована с помощью более точных способов кодирования, таких как ACELP или кодирование с преобразованием, в то время как верхние частоты должны быть кодированы параметрическим способом. Для высоких скоростей передачи битов полный спектр, например, должен быть кодирован с помощью точных способов. Это должно означать, например, что эти точные способы всегда должны кодировать сигналы при оптимальном представлении. Частота дискретизации этих сигналов должна быть оптимизирована с обеспечением возможности транспортировки самых релевантных частотных компонентов сигнала согласно теореме Найквиста. Таким образом, посмотрим на фиг. 4a. Контроллер 120 частоты дискретизации, показанный в данном документе, может быть сконфигурирован с возможностью управлять примерной скоростью передачи битов, на которой информационный сигнал подается в базовый кодер 16 в зависимости от доступной скорости передачи битов. Это соответствует подаче только субфрагмента нижних частот спектра гребенки фильтров анализа в базовый кодер 16. Оставшаяся часть верхних частот может быть подана в параметрический кодер 54 по огибающей. Изменение во времени частоты дискретизации и скорости передачи битов соответственно, как описано выше, не является проблемой.
Описание фиг. 5 относится к восстановлению информационных сигналов, которое может быть использовано для того, чтобы преодолевать проблему подавления наложения спектров во времени в моменты времени изменения частоты дискретизации. Как уже упомянуто выше относительно фиг. 1-4b, некоторые меры также должны быть предприняты в интерфейсах между последовательными модулями в сценариях фиг. 1-4b, в которых преобразователь должен формировать представление преобразования с перекрытием, затем поступающее в модуль восстановления информационных сигналов по фиг. 5.
Фиг. 6 показывает этот вариант осуществления для преобразователя информационных сигналов. Преобразователь информационных сигналов по фиг. 6 содержит вход 105 для приема информационного сигнала в виде последовательности выборок, модуль 106 захвата, сконфигурированный с возможностью захватывать последовательные перекрывающиеся области информационного сигнала, модуль 107 повторной дискретизации, сконфигурированный с возможностью применять повторную дискретизацию, по меньшей мере, к поднабору последовательных перекрывающихся областей, так что каждая из последовательных перекрывающихся областей имеет постоянную частоту дискретизации, при этом, тем не менее, постоянная частота дискретизации варьируется между последовательными перекрывающимися областями, модуль 108 обработки методом окна, сконфигурированный с возможностью применять обработку методом окна к последовательным перекрывающимся областям, и преобразователь, сконфигурированный с возможностью применять преобразование по отдельности к обработанным методом окна частям, с тем чтобы получать последовательность преобразований 94, формирующую представление 92' преобразования с перекрытием, которое затем выводится на выходе 110 преобразователя информационных сигналов по фиг. 6. Модуль 108 обработки методом окна может использовать обработку методом окна Хэмминга и т.п.
Модуль 106 захвата может быть сконфигурирован с возможностью осуществлять захват, так что последовательные перекрывающиеся области информационного сигнала имеют равную длину во времени, например, по 20 мс.
Таким образом, модуль 106 захвата перенаправляет в модуль 107 повторной дискретизации последовательность частей информационного сигнала. При условии, что входящий информационный сигнал имеет изменяющуюся во времени частоту дискретизации, которая переключается с первой частоты дискретизации на вторую частоту дискретизации в предварительно определенный момент времени, например, модуль 107 повторной дискретизации может быть сконфигурирован с возможностью повторно дискретизировать, посредством интерполяции, части входящего информационного сигнала, охватывающие во времени предварительно определенный момент времени, так что последовательная частота дискретизации изменяется один раз с первой частоты дискретизации на вторую частоту дискретизации, как проиллюстрировано на 111 на фиг. 6. Для прояснения, фиг. 6 иллюстративно показывает последовательность выборок 112, в которых частота дискретизации переключается в некоторый момент 113 времени, при этом области 114a-114d с постоянной продолжительностью примерно захватываются с постоянным смещением 115 Δt для области, задающим (наряду с постоянной продолжительностью для области) предварительно определенное перекрытие между последовательными областями 114a-114d, к примеру перекрытие 50% в расчете на число последовательных пар областей, хотя это следует понимать просто как пример.
Первая частота дискретизации перед моментом 113 времени проиллюстрирована с помощью δt1, а частота дискретизации после момента 113 времени указывается посредством δt2. Как проиллюстрировано на 111, модуль 107 повторной дискретизации, например, может быть сконфигурирован с возможностью повторно дискретизировать область 114b так, что она имеет постоянную частоту δt1 дискретизации, при этом, тем не менее, область 114c, следующая во времени, повторно дискретизируется так, что она имеет постоянную частоту δt2 дискретизации. В принципе, может быть достаточным, если модуль 107 повторной дискретизации повторно дискретизирует, посредством интерполяции, подчасть соответствующих областей 114b и 114c, охватывающую во времени момент 113 времени, который еще не имеет целевой частоты дискретизации. В случае области 114b, например, может быть достаточным, если модуль 107 повторной дискретизации повторно дискретизирует подчасть, следующую во времени после момента 113 времени, тогда как в случае области 114c может повторно дискретизироваться только подчасть, предшествующая моменту 113 времени. В этом случае, вследствие постоянной продолжительности захваченных областей 114a-114d, каждая повторно дискретизированная область имеет число временных выборок N1,2, соответствующее соответствующей постоянной частоте δt1,2 дискретизации. Модуль 108 обработки методом окна может адаптировать свое окно или длину окна к этому числу выборок для каждой входящей части, и это применимо и к преобразователю 109, который может адаптировать свою длину преобразования для преобразования соответственно. Иными словами, в случае примера, проиллюстрированного в 111 на фиг. 6, представление преобразования с перекрытием на выходе 110 имеет последовательность преобразований, длина преобразования которых варьируется, т.е. увеличивается и уменьшается, в соответствии, т.е. в линейной зависимости, от числа выборок последовательных областей и, в свою очередь, от постоянной частоты дискретизации, на которой повторно дискретизирована соответствующая область. Следует отметить, что модуль 107 повторной дискретизации может быть сконфигурирован таким образом, что он регистрирует изменение частоты дискретизации между последовательными областями 114a-114d так, что число выборок, которые должны повторно дискретизироваться в соответствующих областях, является минимальным. Тем не менее, модуль 107 повторной дискретизации альтернативно может быть сконфигурирован по-иному. Например, модуль 107 повторной дискретизации может быть сконфигурирован с возможностью предпочитать повышающую дискретизацию по сравнению с понижающей дискретизацией или наоборот, т.е. выполнять повторную дискретизацию, так что все области, перекрывающиеся с моментом 113 времени, повторно дискретизируются либо на первой частоте δt1 дискретизации, либо на второй частоте δt2 дискретизации.
Преобразователь информационных сигналов по фиг. 6 может быть использован, например, чтобы реализовывать преобразователь 30 по фиг. 2a. В этом случае, например, преобразователь 109 может быть сконфигурирован с возможностью осуществлять MDCT.
В этом отношении следует отметить, что длина преобразования для преобразования, применяемого посредством преобразователя 109, может даже превышать размер областей 114c, измеряемый в числе повторно дискретизированных выборок. В этом случае области длины преобразования, которые выходят за рамки обработанных методом окна областей, выводимых посредством модуля 108 обработки методом окна, могут задаваться равными нулю до применения преобразования к ним посредством преобразователя 109.
Перед продолжением более подробного описания возможных реализаций для реализации интерполяции 104 на фиг. 5 и интерполяции в модуле 107 повторной дискретизации на фиг. 6, следует обратиться к фиг. 7a и 7b, которые показывают возможные реализации для кодеров и декодеров по фиг. 1a и 1b. В частности, модули 14 и 24 повторной дискретизации осуществляются так, как показано на фиг. 3a и 3b, тогда как базовый кодер 16 и базовый декодер 22 соответственно осуществляются как кодек, способный переключаться между кодированием с преобразованием на основе MDCT, с одной стороны, и CELP-кодированием, к примеру ACELP-кодированием, с другой стороны. Ветви 122 и 124 кодирования/декодирования на основе MDCT соответственно могут быть, например, TCX-кодером и TCX-декодером соответственно. Альтернативно, может быть использована пара AAC-кодера/декодера. Для CELP-кодирования ACELP-кодер 126 может формировать другую ветвь кодирования базового кодера 16, при этом ACELP-декодер 128 формирует другую ветвь декодирования базового декодера 22. Переключение между обеими ветвями кодирования может выполняться на покадровой основе, как имеет место в USAC [2] или AMR-WB+ [1] для текста с описанием стандарта, ссылка на который приводится для дополнительных подробностей в отношении этих модулей кодирования.
При рассмотрении кодера и декодера фиг. 7a и 7b в качестве дополнительного конкретного примера ниже подробнее описывается схема для предоставления возможности переключения внутренней частоты дискретизации для поступления в ветви 122 и 126 кодирования и для восстановления посредством ветвей 124 и 128 декодирования. В частности, входной сигнал, поступающий на вход 12, может иметь постоянную частоту дискретизации, такую как, например, 32 кГц. Сигнал может повторно дискретизироваться с использованием пары 38 и 42 QMF-гребенок фильтров анализа и синтеза способом, описанным выше, т.е. с подходящим отношением анализа и синтеза в отношении числа полос частот, к примеру, 1,25 или 2,5, приводящим к поступлению внутреннего сигнала времени в базовый кодер 16, который имеет выделенную частоту дискретизации, например, 25,6 кГц или 12,8 кГц. Сигнал после понижающей дискретизации тем самым кодируется с использованием одной из ветвей кодирования режимов кодирования, к примеру с использованием MDCT-представления и классической схемы кодирования с преобразованием в случае ветви 122 кодирования либо во временной области с использованием ACELP, например, в ветви 126 кодирования. Такой поток данных, сформированный посредством ветвей 126 и 122 кодирования базового кодера 16, выводится и транспортируется на сторону декодирования, на которой он подвергается восстановлению.
Для переключения внутренней частоты дискретизации гребенки 38-44 фильтров должны быть адаптированы на покадровой основе согласно внутренней частоте дискретизации, на которой должны работать базовый кодер 16 и базовый декодер 22. Фиг. 8 показывает некоторые возможные сценарии переключения, при этом фиг. 8 просто показывает тракт MDCT-кодирования кодера и декодера.
В частности, фиг. 8 показывает то, что входная частота дискретизации, которая предполагается равной 32 кГц, может понижающе дискретизироваться до любого из значений 25,6 кГц, 12,8 кГц или 8 кГц с дополнительной возможностью поддержания входной частоты дискретизации. В зависимости от выбранного отношения частот дискретизации между входной частотой дискретизации и внутренней частотой дискретизации существует отношение длин преобразования между анализом гребенки фильтров, с одной стороны, и синтезом гребенки фильтров, с другой стороны. Отношения извлекаются из фиг. 8 в серых затененных прямоугольниках: 40 поддиапазонов частот в гребенках 38 и 44 фильтров соответственно независимо от выбранной внутренней частоты дискретизации и 40, 32, 16 или 10 поддиапазонов частот в гребенках 42 и 40 фильтров соответственно в зависимости от выбранной внутренней частоты дискретизации. Длина преобразования MDCT, используемого в базовом кодере, адаптируется к результирующей внутренней частоте дискретизации, так что результирующая скорость преобразования или интервал шага преобразования, измеряемая во времени, является постоянной или независимой от выбранной внутренней частоты дискретизации. Она, например, может постоянно составлять 20 мс, приводя к длине преобразования в 640, 512, 256 и 160 соответственно в зависимости от выбранной внутренней частоты дискретизации.
С использованием вышеприведенных базовых принципов можно переключать внутреннюю частоту дискретизации согласно следующим ограничениям в отношении переключения гребенки фильтров:
- дополнительная задержка не вызывается во время переключения;
- переключение или изменение частоты дискретизации может происходить мгновенно;
- артефакты переключения минимизируются или, по меньшей мере, уменьшаются и
- вычислительная сложность является низкой.
По существу, гребенки 38-44 фильтров и MDCT в базовом кодере представляют собой преобразования с перекрытием, при этом гребенки фильтров могут использовать большее перекрытие обработанных методом окна областей по сравнению с MDCT базового кодера и декодера. Например, 10-кратное перекрытие может применяться к гребенкам фильтров, тогда как 2-кратное перекрытие может применяться к MDCT 122 и 124. Для преобразований с перекрытием буферы состояния могут описываться как буфер окна анализа для анализа для гребенок фильтров анализа и MDCT и буфер суммирования с перекрытием для гребенок фильтров синтеза и IMDCT. В случае переключения скорости эти буферы состояния должны регулироваться согласно переключению частоты дискретизации способом, описанным выше относительно фиг. 5 и фиг. 6. Далее предоставляется более подробное пояснение относительно интерполяции, которая также может выполняться на стороне анализа, поясненной на фиг. 6, а не для случая синтеза, поясненного относительно фиг. 5. Прототип или окно преобразования с перекрытием может быть адаптировано. Чтобы уменьшать артефакты переключения, компоненты сигнала в буферах состояния должны сохраняться так, чтобы поддерживать свойство подавления наложения спектров преобразования с перекрытием.
Далее предоставляется более подробное описание в отношении того, как выполнять интерполяцию 104 в модуле 72 повторной дискретизации.
Два случая могут различаться:
1) Повышающее переключение является процессом, согласно которому частота дискретизации увеличивается от предшествующей временной части 84 к следующей или последующей временной части 86.
2) Понижающее переключение является процессом, согласно которому частота дискретизации снижается от предшествующей временной области 84 к последующей временной области 86.
При условии повышающего переключения, т.е., к примеру, с 12,8 кГц (256 выборок каждые 20 мс) на 32 кГц (640 выборок каждые 20 мс), буферы состояния, к примеру буфер состояния модуля 72 повторной дискретизации, иллюстративно показанный с условным обозначением 130 на фиг. 5, или его контент должен быть расширен на коэффициент, соответствующий изменению частоты дискретизации, к примеру 2,5 в данном примере. Возможные решения для расширения без вызывания дополнительной задержки представляют собой, например, линейную интерполяцию или сплайн-интерполяцию. Иными словами, модуль 72 повторной дискретизации может "на лету" интерполировать выборки "хвоста" повторного преобразования 96 относительно предшествующей временной области 84 как расположенные во временном интервале 102 в буфере 130 состояния. Буфер состояния, как проиллюстрировано на фиг. 5, может выступать в качестве буфера "первый на входе - первый на выходе". Естественно, не все частотные компоненты, которые требуются для полного подавления наложения спектров, могут быть получены посредством этой процедуры, но, по меньшей мере, нижняя частота, такая как, например, от 0 до 6,4 кГц, может быть сформирована без искажений, и с психоакустической точки зрения эти частоты являются самыми релевантными.
Для случаев понижающего переключения на более низкие частоты дискретизации линейная или сплайн-интерполяция также может быть использована для того, чтобы прореживать буфер состояния соответственно без вызывания дополнительной задержки. Иными словами, модуль 72 повторной дискретизации может прореживать частоту дискретизации посредством интерполяции. Тем не менее, понижающее переключение на частоты дискретизации, на которых коэффициент прореживания является большим, к примеру переключение с 32 кГц (640 выборок каждые 20 мс) на 12,8 кГц (256 выборок каждые 20 мс), где коэффициент прореживания составляет 2,5, может вызывать сильно мешающее наложение спектров, если не удаляются высокочастотные компоненты. Чтобы обходить это явление, может привлекаться фильтрация синтеза, при которой компоненты верхних частот могут удаляться посредством "очистки" гребенки фильтров или повторного преобразователя. Это означает то, что гребенка фильтров синтезирует меньше частотных компонентов в момент переключения и, следовательно, очищает буфер суммирования с перекрытием от высоких спектральных компонентов. Если точнее, представим себе понижающее переключение с первой частоты дискретизации для предшествующей временной области 84 на более низкую частоту дискретизации для последующей временной области 86. Если отступить от вышеприведенного описания, повторный преобразователь 70 может быть сконфигурирован с возможностью подготавливать понижающее переключение посредством недопущения участия всех частотных компонентов преобразования 94 обработанной методом окна версии предшествующей временной области 84 в повторном преобразовании. Наоборот, повторный преобразователь 70 может исключать нерелевантные высокочастотные компоненты преобразования 94 из повторного преобразования посредством задавания их равными 0, например, или иным образом уменьшения их влияния на повторное преобразование, к примеру, посредством постепенного возрастающего ослабления этих компонентов верхних частот. Например, затронутые высокочастотные компоненты могут быть частотными компонентами выше частотного компонента Nk'. Соответственно, в результирующем информационном сигнале временная область 84 преднамеренно восстановлена в спектральной полосе пропускания, которая меньше полосы пропускания, которая должна быть доступна в представлении преобразования с перекрытием, вводимом на вход 76. С другой стороны, тем не менее, исключаются проблемы наложения спектров, в противном случае возникающие при процессе суммирования с перекрытием посредством непреднамеренного введения частей верхних частот в процесс подавления наложения спектров в модуле 74 комбинирования, несмотря на интерполяцию 104.
В качестве альтернативы, дополнительное представление на низкой частоте дискретизации может быть одновременно сформировано для использования в надлежащем буфере состояния для переключения с представления на более высокой частоте дискретизации. Это должно обеспечивать то, что коэффициент прореживания (в случае, если требуется прореживание) всегда поддерживается относительно низким (т.е. меньшим 2), и, следовательно, не возникают мешающие артефакты, вызываемые в результате наложения спектров. Как упомянуто выше, это сохраняет не все частотные компоненты, а, по меньшей мере, нижние частоты, которые представляют интерес в отношении психоакустической релевантности.
Таким образом, в соответствии с конкретным вариантом осуществления может быть возможным модифицировать USAC-кодек следующим образом, чтобы получать версию с низкой задержкой USAC. Во-первых, только режимы TCX- и ACELP-кодирования могут разрешаться. AAC-режимы могут исключаться. Длина кадра может быть выбрана таким образом, чтобы получать кадрирование в 20 мс. Затем, следующие системные параметры могут быть выбраны в зависимости от рабочего режима (сверхширокополосный (SWB), широкополосный (WB), узкополосный (NB), полная полоса пропускания (FB)) и скорости передачи битов. Общее представление системных параметров приведено в следующей таблице.
Режим Входная частота дискретизации [кГц] Внутренняя частота дискретизации [кГц] Длина кадра [выборки]
NB 8 кГц 12,8 кГц 256
WB 16 кГц 12,8 кГц 256
SWB, низкие частоты (12-32 кбит/с) 32 кГц 12,8 кГц 256
SWB, высокие частоты (48-64 кбит/с) 32 кГц 25,6 кГц 512
SWB, очень высокие частоты (96-128 кбит/с) 32 кГц 32 кГц 640
FB 48 кГц 48 кГц 960
Что касается узкополосного режима, повышение частоты дискретизации может исключаться и заменяться заданием внутренней частоты дискретизации равной входной частоте дискретизации, т.е. 8 кГц при выборе соответствующей длины кадра, т.е. в 160 выборок. Аналогично, 16 кГц могут выбираться для широкополосного рабочего режима при выборе длины кадра MDCT для TCX в 320 выборок вместо 256.
В частности, должно быть возможным поддерживать операцию переключения по всему списку рабочих точек, т.е. поддерживаемым частотам дискретизации, скоростям передачи битов и полосам пропускания. Следующая таблица приводит различные конфигурации, связанные с внутренней частотой дискретизации вышеуказанной ожидаемой версии с низкой задержкой USAC-кодека.
Полоса пропускания Входная частота дискретизации
8 кГц 16 кГц 32 кГц 48 кГц
NB 12,8 кГц 12,8 кГц 12,8 кГц 12,8 кГц
WB 12,8 кГц 12,8 кГц 12,8 кГц
SWB 12,8, 25,6,
32 кГц
12,8, 25,6, 32 кГц
FB 12,8, 25,6, 32, 48 кГц
Таблица, показывающая матрицу режимов внутренней частоты дискретизации USAC-кодека с низкой задержкой
В качестве вспомогательной информации следует отметить, что модуль повторной дискретизации согласно фиг. 2a и 2b не обязательно должен использоваться. Набор IIR-фильтров альтернативно может предоставляться, чтобы принимать на себя ответственность за функциональность повторной дискретизации от входной частоты дискретизации к выделенной базовой частоте дискретизации. Задержка этих IIR-фильтров составляет меньше 0,5 мс, но вследствие неокругленного отношения между входной и выходной частотой сложность является довольно значительной. При условии идентичной задержки для всех IIR-фильтров может разрешаться переключение между различными частотами дискретизации.
Соответственно, может быть предпочтительным использование варианта осуществления модуля повторной дискретизации по фиг. 2a и 2b. QMF-гребенка фильтров параметрического модуля формирования огибающей (т.е. SBR) может участвовать во взаимодействии, чтобы активировать функциональность повторной дискретизации, как описано выше. В случае SWB она должна добавлять каскад гребенки фильтров синтеза в кодер, в то время как аналитический каскад уже используется вследствие модуля SBR-кодера. На стороне декодера уже QMF отвечает за предоставление функциональности повышающей дискретизации, когда разрешается SBR. Эта схема может быть использована во всех других режимах полосы пропускания. Следующая таблица предоставляет общее представление обязательных QMF-конфигураций.
Таблица. Список QMF-конфигураций на стороне кодера (число аналитических полос частот/число синтетических полос частот). Другая возможная конфигурация может быть получена посредством деления всех чисел на коэффициент 2.
При условии постоянной входной частоты дискретизации переключение между внутренними частотами дискретизации разрешается посредством переключения прототипа QMF-синтеза. На стороне декодирования может применяться обратная операция. Следует отметить, что полоса пропускания одной QMF-полосы частот является идентичной по всему диапазону рабочих точек.
Хотя некоторые аспекты описаны в контексте аппарата, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока, или элемента, или признака соответствующего аппарата. Некоторые или все этапы способа могут быть выполнены посредством (или с использованием) аппарата, такого как, например, микропроцессор, программируемый компьютер или электронная схема. В некоторых вариантах осуществления часть из одного или более наиболее важных этапов способа может выполняться посредством этого аппарата.
В зависимости от определенных требований к реализации варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием цифрового носителя данных, например гибкого диска, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронно считываемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой, так что осуществляется соответствующий способ. Следовательно, цифровой носитель данных может быть машиночитаемым.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронно считываемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.
В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, при этом программный код выполнен с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, сохраненных на машиночитаемом носителе.
Другими словами, следовательно, вариант осуществления изобретаемого способа представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.
Следовательно, дополнительный вариант осуществления изобретаемых способов представляет собой носитель данных (цифровой носитель данных или машиночитаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе. Носитель данных, цифровой носитель данных или носитель с записанными данными типично является материальным и/или энергонезависимым.
Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, может быть сконфигурирована с возможностью передачи через соединение для передачи данных, например через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например компьютер или программируемое логическое устройство, сконфигурированное с возможностью осуществлять один из способов, описанных в данном документе.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для осуществления одного из способов, описанных в данном документе.
Дополнительный вариант осуществления согласно изобретению содержит аппарат или систему, сконфигурированную с возможностью передавать (например, электронно или оптически) компьютерную программу для осуществления одного из способов, описанных в данном документе, в приемное устройство. Приемное устройство, например, может быть компьютером, мобильным устройством, запоминающим устройством и т.п. Аппарат или система, например, может содержать файловый сервер для передачи компьютерной программы в приемное устройство.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для того, чтобы выполнять часть или все функциональности способов, описанных в данном документе. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого аппарата.
Вышеописанные варианты осуществления являются просто иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Следовательно, они подразумеваются как ограниченные только посредством объема нижеприведенной формулы изобретения, а не посредством конкретных подробностей, представленных посредством описания и пояснения вариантов осуществления в данном документе.
Документы
[1]: 3GPP, "Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions", 2009 год, 3GPP TS 26.290.
[2]: USAC codec (Unified Speech and Audio Codec), ISO/IEC CD 23003-3, 24 сентября 2010 года.

Claims (23)

1. Модуль восстановления информационных сигналов, выполненный с возможностью восстанавливать, с использованием устранения помехи дискретизации, информационный сигнал из представления информационного сигнала с использованием преобразования с перекрытием, содержащего для каждой из последовательных перекрывающихся областей информационного сигнала преобразование обработанной методом окна версии соответствующей области, при этом модуль восстановления информационных сигналов выполнен с возможностью восстанавливать информационный сигнал на частоте дискретизации, которая изменяется на границе (82) между предшествующей областью (84) и последующей областью (86) информационного сигнала, при этом модуль восстановления информационных сигналов содержит:
- обратный преобразователь (70), выполненный с возможностью применять обратное преобразование к преобразованию (94) обработанной методом окна версии предшествующей области (84), с тем чтобы получать обратное преобразование (96) для предшествующей области (84), и применять обратное преобразование к преобразованию обработанной методом окна версии последующей области (86), с тем чтобы получать обратное преобразование (100) для последующей области (86), при этом обратное преобразование (96) для предшествующей области (84) и обратное преобразование (106) для последующей области (86) перекрываются в части (102) устранения помехи дискретизации на границе (82) между предшествующей и последующей областями;
- модуль (72) повторной дискретизации, выполненный с возможностью повторно дискретизировать, посредством интерполяции, обратное преобразование (96) для предшествующей области (84) и/или обратное преобразование (100) для последующей области (86) в части (102) устранения помехи дискретизации согласно изменению частоты дискретизации на границе (82); и
- модуль (74) комбинирования, выполненный с возможностью осуществлять устранение помехи дискретизации между обратными преобразованиями (96, 100) для предшествующей и последующей областей (84, 86), которые получены посредством повторной дискретизации в части (102) устранения помехи дискретизации.
2. Модуль восстановления информационных сигналов по п. 1, в котором модуль повторной дискретизации выполнен с возможностью повторно дискретизировать обратное преобразование (96) для предшествующей области в части устранения помехи дискретизации согласно изменению частоты дискретизации на границе.
3. Модуль восстановления информационных сигналов по п. 1, в котором отношение длины преобразования для обратного преобразования, применяемого к преобразованию (94) обработанной методом окна версии предшествующей области (84), к временной длине предшествующей области (84) отличается от отношения длины преобразования для обратного преобразования, применяемого к обработанной методом окна версии последующей области (86), к временной длине последующей области (86) на коэффициент, соответствующий изменению частоты дискретизации.
4. Модуль восстановления информационных сигналов по п. 3, в котором временные длины предшествующей и последующей областей (84, 86) равны друг другу и обратный преобразователь (70) выполнен с возможностью ограничивать применение обратного преобразования к преобразованию обработанной методом окна версии предшествующей области (84) частью низких частот преобразования обработанной методом окна версии предшествующей области и/или ограничивать применение обратного преобразования к преобразованию обработанной методом окна версии последующей области частью низких частот преобразования обработанной методом окна версии последующей области.
5. Модуль восстановления информационных сигналов по п. 1, в котором длина преобразования для преобразования обработанной методом окна версии областей информационного сигнала и временная длина областей информационного сигнала являются постоянными и модуль восстановления информационных сигналов выполнен с возможностью находить границу (82) в ответ на управляющий сигнал (98).
6. Модуль восстановления информационных сигналов по п. 1, в котором длина преобразования для преобразования обработанной методом окна версии областей информационного сигнала варьируется, в то время как временная длина областей информационного сигнала является постоянной, при этом модуль восстановления информационных сигналов выполнен с возможностью находить границу (82) посредством обнаружения изменения в длине преобразования обработанной методом окна версии областей информационного сигнала.
7. Модуль восстановления информационных сигналов по п. 6, в котором обратный преобразователь выполнен с возможностью адаптировать длину преобразования для обратного преобразования, применяемого к преобразованию обработанной методом окна версии предшествующей и последующей областей, к длине преобразования для преобразования обработанной методом окна версии предшествующей и последующей областей.
8. Модуль восстановления информационных сигналов по п. 1, в котором преобразование с перекрытием является критически дискретизированным, таким как MDCT.
9. Модуль восстановления информационных сигналов по п. 1, в котором представление с использованием преобразования с перекрытием является гребенкой фильтров с комплексным значением.
10. Модуль восстановления информационных сигналов по п. 1, в котором модуль повторной дискретизации выполнен с возможностью использовать линейную или сплайн-интерполяцию для интерполяции.
11. Модуль восстановления информационных сигналов по п. 1, в котором частота дискретизации снижается на границе (82) и обратный преобразователь (70) выполнен с возможностью, при применении обратного преобразования к преобразованию (94) обработанной методом окна версии предшествующей области (84), ослаблять или обнулять верхние частоты преобразования (94) обработанной методом окна версии предшествующей области (84).
12. Модуль повторной дискретизации, состоящий из конкатенации гребенки (38) фильтров для предоставления представления информационного сигнала с использованием преобразования с перекрытием и гребенки (42) обратных фильтров, содержащей модуль (80) восстановления информационных сигналов, выполненный с возможностью восстанавливать, с использованием устранения помехи дискретизации, информационный сигнал из представления информационного сигнала с использованием преобразования с перекрытием по п. 5.
13. Кодер информационных сигналов, содержащий модуль повторной дискретизации по п. 12 и каскад (16) сжатия, выполненный с возможностью сжимать восстановленный информационный сигнал, причем кодер информационных сигналов дополнительно содержит управление частотой дискретизации, выполненное с возможностью управлять управляющим сигналом (98) в зависимости от внешней информации относительно доступной скорости передачи битов.
14. Модуль восстановления информационных сигналов, содержащий модуль (34) распаковки, выполненный с возможностью восстанавливать представление информационного сигнала с использованием преобразования с перекрытием из потока данных, и модуль восстановления информационных сигналов по п. 7, выполненный с возможностью восстанавливать, с использованием устранения помехи дискретизации, информационный сигнал из представления с использованием преобразования с перекрытием.
15. Преобразователь информационных сигналов, выполненный с возможностью формировать представление информационного сигнала с использованием преобразования с перекрытием с помощью преобразования с перекрытием, вызывающего помеху дискретизации, содержащий:
- вход (105) для приема информационного сигнала в виде последовательности выборок;
- модуль (106) захвата, выполненный с возможностью захватывать последовательные перекрывающиеся области информационного сигнала;
- модуль (107) повторной дискретизации, выполненный с возможностью применять, посредством интерполяции, повторную дискретизацию, по меньшей мере, к поднабору последовательных перекрывающихся областей информационных сигналов так, что каждая из последовательных перекрывающихся частей имеет соответствующую постоянную частоту дискретизации, но соответствующая постоянная частота дискретизации варьируется между последовательными перекрывающимися областями;
- модуль (108) обработки методом окна, выполненный с возможностью применять обработку методом окна к последовательным перекрывающимся областям информационного сигнала; и
- преобразователь (109), выполненный с возможностью по отдельности применять преобразование с перекрытием к обработанным методом окна областям.
16. Преобразователь информационных сигналов по п. 15, в котором модуль (106) захвата выполнен с возможностью осуществлять захват последовательных перекрывающихся областей информационного сигнала, так что последовательные перекрывающиеся области информационного сигнала имеют постоянную продолжительность.
17. Преобразователь информационных сигналов по п. 15, в котором модуль (106) захвата выполнен с возможностью осуществлять захват последовательных перекрывающихся областей информационного сигнала, так что последовательные перекрывающиеся области информационного сигнала имеют постоянный сдвиг по времени.
18. Преобразователь информационных сигналов по п. 16, в котором последовательность выборок имеет изменяющееся переключение частоты дискретизации с первой частоты дискретизации на вторую частоту дискретизации в предварительно определенный момент (113) времени, при этом модуль (107) повторной дискретизации выполнен с возможностью применять повторную дискретизацию к последовательным перекрывающимся областям (114b, с), перекрывающимся с предварительно определенным моментом времени, так что их постоянная частота дискретизации переключается только один раз с первой частоты дискретизации на вторую частоту дискретизации.
19. Преобразователь информационных сигналов по п. 18, причем преобразователь выполнен с возможностью адаптировать длину преобразования для преобразования каждой обработанной методом окна области к числу выборок соответствующей обработанной методом окна области.
20. Способ восстановления информационного сигнала, с использованием устранения помехи дискретизации, из представления информационного сигнала с использованием преобразования с перекрытием, содержащего для каждой из последовательных перекрывающихся областей информационного сигнала преобразование обработанной методом окна версии соответствующей области, при этом модуль восстановления информационных сигналов выполнен с возможностью восстанавливать информационный сигнал на частоте дискретизации, которая изменяется на границе (82) между предшествующей областью (84) и последующей областью (86) информационного сигнала, при этом способ содержит этапы, на которых:
- применяют обратное преобразование к преобразованию (94) обработанной методом окна версии предшествующей области (84), с тем чтобы получать обратное преобразование (96) для предшествующей области (84), и применяют обратное преобразование к преобразованию обработанной методом окна версии последующей области (86), с тем чтобы получать обратное преобразование (100) для последующей области (86), при этом обратное преобразование (96) для предшествующей области (84) и обратное преобразование (100) для последующей области (86) перекрываются в части (102) устранения помехи дискретизации на границе (82) между предшествующей и последующей областями;
- повторно дискретизируют, посредством интерполяции, обратное преобразование (96) для предшествующей области (84) и/или обратное преобразование (100) для последующей области (86) в части (102) устранения помехи дискретизации согласно изменению частоты дискретизации на границе (82) и
- выполняют устранение помехи дискретизации между обратными преобразованиями (96, 100) для предшествующей и последующей областей (84, 86), которые получены посредством повторной дискретизации в части (102) устранения помехи дискретизации.
21. Способ формирования представления информационного сигнала с использованием преобразования с перекрытием с помощью преобразования с перекрытием, вызывающего помеху дискретизации, содержащий этапы, на которых:
- принимают информационный сигнал в виде последовательности выборок;
- захватывают последовательные перекрывающиеся области информационного сигнала;
- применяют, посредством интерполяции, повторную дискретизацию, по меньшей мере, к поднабору последовательных перекрывающихся областей информационных сигналов так, что каждая из последовательных перекрывающихся частей имеет соответствующую постоянную частоту дискретизации, но соответствующая постоянная частота дискретизации варьируется между последовательными перекрывающимися областями;
- применяют обработку методом окна к последовательным перекрывающимся областям информационного сигнала и
- по отдельности применяют преобразование к обработанным методом окна областям.
22. Компьютерно-считываемый носитель, имеющий сохраненную на нем компьютерную программу, имеющую программный код для осуществления, при выполнении на компьютере, способа по п. 20.
23. Компьютерно-считываемый носитель, имеющий сохраненную на нем компьютерную программу, имеющую программный код для осуществления, при выполнении на компьютере, способа по п. 21.
RU2012148250/08A 2011-02-14 2012-02-14 Представление информационного сигнала с использованием преобразования с перекрытием RU2580924C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052458 WO2012110478A1 (en) 2011-02-14 2012-02-14 Information signal representation using lapped transform

Publications (2)

Publication Number Publication Date
RU2012148250A RU2012148250A (ru) 2014-07-27
RU2580924C2 true RU2580924C2 (ru) 2016-04-10

Family

ID=71943597

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012148250/08A RU2580924C2 (ru) 2011-02-14 2012-02-14 Представление информационного сигнала с использованием преобразования с перекрытием

Country Status (18)

Country Link
US (1) US9536530B2 (ru)
EP (1) EP2550653B1 (ru)
JP (2) JP5712288B2 (ru)
KR (1) KR101424372B1 (ru)
CN (1) CN102959620B (ru)
AR (1) AR085222A1 (ru)
AU (1) AU2012217158B2 (ru)
BR (1) BR112012029132B1 (ru)
CA (1) CA2799343C (ru)
ES (1) ES2458436T3 (ru)
HK (1) HK1181541A1 (ru)
MX (1) MX2012013025A (ru)
MY (1) MY166394A (ru)
PL (1) PL2550653T3 (ru)
RU (1) RU2580924C2 (ru)
SG (1) SG185519A1 (ru)
TW (2) TWI564882B (ru)
WO (1) WO2012110478A1 (ru)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2014003610A (es) * 2011-09-26 2014-11-26 Sirius Xm Radio Inc Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2").
US9842598B2 (en) 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
ES2934646T3 (es) 2013-04-05 2023-02-23 Dolby Int Ab Sistema de procesamiento de audio
WO2015025051A1 (en) * 2013-08-23 2015-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a combination in an overlap range
EP3000110B1 (en) 2014-07-28 2016-12-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
US10770082B2 (en) * 2016-06-22 2020-09-08 Dolby International Ab Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
WO2018201112A1 (en) 2017-04-28 2018-11-01 Goodwin Michael M Audio coder window sizes and time-frequency transformations
EP3644313A1 (en) * 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction
US11456007B2 (en) 2019-01-11 2022-09-27 Samsung Electronics Co., Ltd End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization
CN115299075B (zh) 2020-03-20 2023-08-18 杜比国际公司 扬声器的低音增强

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007051548A1 (en) * 2005-11-03 2007-05-10 Coding Technologies Ab Time warped modified transform coding of audio signals
RU2335809C2 (ru) * 2004-02-13 2008-10-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодирование
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
RU2009107161A (ru) * 2006-07-31 2010-09-10 Квэлкомм Инкорпорейтед (US) Системы и способы для изменения окна с кадром, ассоциированным с аудио сигналом
RU2009118384A (ru) * 2006-10-18 2010-11-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. (De) Кодирование информационного сигнала

Family Cites Families (212)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE272883T1 (de) 1991-06-11 2004-08-15 Qualcomm Inc Vorrichtung und methode zur maskierung von fehlern in datenrahmen
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
KR100419545B1 (ko) 1994-10-06 2004-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 다른코딩원리들을이용한전송시스템
JP3304717B2 (ja) * 1994-10-28 2002-07-22 ソニー株式会社 ディジタル信号圧縮方法及び装置
US5537510A (en) 1994-12-30 1996-07-16 Daewoo Electronics Co., Ltd. Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ES2247741T3 (es) 1998-01-22 2006-03-01 Deutsche Telekom Ag Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio.
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
AU5032000A (en) 1999-06-07 2000-12-28 Ericsson Inc. Methods and apparatus for generating comfort noise using parametric noise model statistics
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
ATE341074T1 (de) 2000-02-29 2006-10-15 Qualcomm Inc Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US7901873B2 (en) 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
KR100464369B1 (ko) 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) * 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP3815323B2 (ja) * 2001-12-28 2006-08-30 日本ビクター株式会社 周波数変換ブロック長適応変換装置及びプログラム
DE10200653B4 (de) * 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
US20040010329A1 (en) * 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
BRPI0306434B1 (pt) 2002-09-19 2018-06-12 Nec Corporation Aparelho e método de decodificação de áudio
KR100711280B1 (ko) 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10321983A1 (de) * 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
US7548852B2 (en) 2003-06-30 2009-06-16 Koninklijke Philips Electronics N.V. Quality of decoded audio by adding noise
DE10331803A1 (de) * 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
CA2475283A1 (en) 2003-07-17 2005-01-17 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre Method for recovery of lost speech data
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
US7418396B2 (en) * 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091044A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
EP1683133B1 (en) 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
KR20070001115A (ko) * 2004-01-28 2007-01-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 복소수 값 데이터를 이용하는 오디오 신호 디코딩
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
CN1930607B (zh) 2004-03-05 2010-11-10 松下电器产业株式会社 差错隐藏装置以及差错隐藏方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CN1954364B (zh) 2004-05-17 2011-06-01 诺基亚公司 带有不同编码帧长度的音频编码
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
CN101120400B (zh) 2005-01-31 2013-03-27 斯凯普有限公司 在通信系统中生成隐藏帧的方法
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
EP1845520A4 (en) 2005-02-02 2011-08-10 Fujitsu Ltd SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
CA2603246C (en) 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
JP2008546341A (ja) 2005-06-18 2008-12-18 ノキア コーポレイション 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
EP1895511B1 (en) * 2005-06-23 2011-09-07 Panasonic Corporation Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
CN101371296B (zh) 2006-01-18 2012-08-29 Lg电子株式会社 用于编码和解码信号的设备和方法
US20110057818A1 (en) 2006-01-18 2011-03-10 Lg Electronics, Inc. Apparatus and Method for Encoding and Decoding Signal
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) * 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
US8255213B2 (en) 2006-07-12 2012-08-28 Panasonic Corporation Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method
EP2040251B1 (en) 2006-07-12 2019-10-09 III Holdings 12, LLC Audio decoding device and audio encoding device
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
WO2008013788A2 (en) 2006-07-24 2008-01-31 Sony Corporation A hair motion compositor system and optimization techniques for use in a hair/fur pipeline
EP2054879B1 (en) 2006-08-15 2010-01-20 Broadcom Corporation Re-phasing of decoder states after packet loss
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
WO2008049590A1 (en) * 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
EP2052548B1 (en) 2006-12-12 2012-02-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8364472B2 (en) 2007-03-02 2013-01-29 Panasonic Corporation Voice encoding device and voice encoding method
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP5241701B2 (ja) 2007-03-02 2013-07-17 パナソニック株式会社 符号化装置および符号化方法
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
BRPI0811384A2 (pt) * 2007-06-11 2017-08-01 Fraunhofer Ges Forschung "codificador de áudio para codificar um sinal de áudio tendo uma porção tipo impulso e porção fixa, métodos de codificação, decodificador, método de decodificação, e sinal de áudio codificado"
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
MX2010001763A (es) 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Analisis/sintesis espectral de baja complejidad utilizando la resolucion temporal seleccionable.
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
JP5264913B2 (ja) 2007-09-11 2013-08-14 ヴォイスエイジ・コーポレーション 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
WO2009109373A2 (en) * 2008-03-04 2009-09-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
US8423852B2 (en) 2008-04-15 2013-04-16 Qualcomm Incorporated Channel decoding-based error detection
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
EP2144171B1 (en) 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
CN103000177B (zh) 2008-07-11 2015-03-25 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
MY159110A (en) 2008-07-11 2016-12-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
JP5551693B2 (ja) * 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ エイリアシングスイッチスキームを用いてオーディオ信号を符号化/復号化するための装置および方法
CA2871268C (en) 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8380498B2 (en) * 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
JP5555707B2 (ja) 2008-10-08 2014-07-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
EP3992966B1 (en) 2009-01-16 2022-11-23 Dolby International AB Cross product enhanced harmonic transposition
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
CN102334160B (zh) 2009-01-28 2014-05-07 弗劳恩霍夫应用研究促进协会 音频编码器,音频解码器,编码和解码音频信号的方法
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
WO2010093224A2 (ko) 2009-02-16 2010-08-19 한국전자통신연구원 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
ES2374486T3 (es) 2009-03-26 2012-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo y método para manipular una señal de audio.
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
JP5699141B2 (ja) * 2009-06-23 2015-04-08 ヴォイスエイジ・コーポレーション 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
WO2011048094A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec and celp coding adapted therefore
KR101411759B1 (ko) 2009-10-20 2014-06-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법
BR122020024243B1 (pt) 2009-10-20 2022-02-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio e método para prover uma representação decodificada de um conteúdo de áudio.
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
CN103069484B (zh) 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
TW201214415A (en) 2010-05-28 2012-04-01 Fraunhofer Ges Forschung Low-delay unified speech and audio codec
AU2012217269B2 (en) 2011-02-14 2015-10-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
EP3373296A1 (en) 2011-02-14 2018-09-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2335809C2 (ru) * 2004-02-13 2008-10-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодирование
WO2007051548A1 (en) * 2005-11-03 2007-05-10 Coding Technologies Ab Time warped modified transform coding of audio signals
RU2009107161A (ru) * 2006-07-31 2010-09-10 Квэлкомм Инкорпорейтед (US) Системы и способы для изменения окна с кадром, ассоциированным с аудио сигналом
RU2009118384A (ru) * 2006-10-18 2010-11-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. (De) Кодирование информационного сигнала
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction

Also Published As

Publication number Publication date
MY166394A (en) 2018-06-25
EP2550653A1 (en) 2013-01-30
AU2012217158A1 (en) 2012-12-13
EP2550653B1 (en) 2014-04-02
TW201506906A (zh) 2015-02-16
ES2458436T3 (es) 2014-05-05
SG185519A1 (en) 2012-12-28
TWI564882B (zh) 2017-01-01
JP2013531820A (ja) 2013-08-08
AU2012217158B2 (en) 2014-02-27
BR112012029132B1 (pt) 2021-10-05
US9536530B2 (en) 2017-01-03
CN102959620B (zh) 2015-05-13
CA2799343A1 (en) 2012-08-23
CA2799343C (en) 2016-06-21
WO2012110478A1 (en) 2012-08-23
CN102959620A (zh) 2013-03-06
RU2012148250A (ru) 2014-07-27
JP6099602B2 (ja) 2017-03-22
JP5712288B2 (ja) 2015-05-07
TW201246186A (en) 2012-11-16
JP2014240973A (ja) 2014-12-25
AR085222A1 (es) 2013-09-18
TWI483245B (zh) 2015-05-01
KR101424372B1 (ko) 2014-08-01
HK1181541A1 (en) 2013-11-08
BR112012029132A2 (pt) 2020-11-10
KR20130007651A (ko) 2013-01-18
US20130064383A1 (en) 2013-03-14
PL2550653T3 (pl) 2014-09-30
MX2012013025A (es) 2013-01-22

Similar Documents

Publication Publication Date Title
RU2580924C2 (ru) Представление информационного сигнала с использованием преобразования с перекрытием
US11837246B2 (en) Harmonic transposition in an audio coding method and system
CA3076203C (en) Improved harmonic transposition
CA3210604A1 (en) Improved harmonic transposition
AU2021204779B2 (en) Improved Harmonic Transposition
AU2023282303B2 (en) Improved Harmonic Transposition