RU2580924C2 - Представление информационного сигнала с использованием преобразования с перекрытием - Google Patents
Представление информационного сигнала с использованием преобразования с перекрытием Download PDFInfo
- Publication number
- RU2580924C2 RU2580924C2 RU2012148250/08A RU2012148250A RU2580924C2 RU 2580924 C2 RU2580924 C2 RU 2580924C2 RU 2012148250/08 A RU2012148250/08 A RU 2012148250/08A RU 2012148250 A RU2012148250 A RU 2012148250A RU 2580924 C2 RU2580924 C2 RU 2580924C2
- Authority
- RU
- Russia
- Prior art keywords
- information signal
- region
- transform
- sampling
- conversion
- Prior art date
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 99
- 238000005070 sampling Methods 0.000 claims abstract description 160
- 238000011084 recovery Methods 0.000 claims abstract description 50
- 238000012952 Resampling Methods 0.000 claims description 53
- 230000009466 transformation Effects 0.000 claims description 53
- 238000000034 method Methods 0.000 claims description 44
- 230000008859 change Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 12
- 238000007906 compression Methods 0.000 claims description 10
- 230000006835 compression Effects 0.000 claims description 10
- 230000002441 reversible effect Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000008030 elimination Effects 0.000 claims 7
- 238000003379 elimination reaction Methods 0.000 claims 7
- 238000001228 spectrum Methods 0.000 abstract description 33
- 230000001629 suppression Effects 0.000 abstract description 26
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 230000015572 biosynthetic process Effects 0.000 description 44
- 238000003786 synthesis reaction Methods 0.000 description 43
- 238000000844 transformation Methods 0.000 description 24
- 230000003595 spectral effect Effects 0.000 description 15
- 239000000872 buffer Substances 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000006837 decompression Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000001831 conversion spectrum Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
Изобретение относится к средствам представления информационных сигналов с использованием преобразования с перекрытием. Технический результат заключается в повышении эффективности кодирования. Модуль восстановления информационных сигналов сконфигурирован с возможностью восстанавливать, с использованием подавления наложения спектров, информационный сигнал из представления преобразования с перекрытием информационного сигнала, содержащего для каждой из последовательных перекрывающихся областей информационного сигнала преобразование обработанной методом окна версии соответствующей области, при этом модуль восстановления информационных сигналов сконфигурирован с возможностью восстанавливать информационный сигнал на частоте дискретизации, которая изменяется на границе между предшествующей областью и последующей областью информационного сигнала. Модуль восстановления информационных сигналов содержит повторный преобразователь, сконфигурированный с возможностью применять повторное преобразование к преобразованию обработанной методом окна версии предшествующей области, с тем чтобы получать повторное преобразование для предшествующей области, и применять повторное преобразование к преобразованию обработанной методом окна версии последующей области. 9 н. и 14 з.п. ф-лы, 13 ил.
Description
Настоящая заявка относится к представлению информационного сигнала с использованием преобразований с перекрытием и, в частности, к представлению информационного сигнала с использованием представления преобразования с перекрытием информационного сигнала, требующего подавления наложения спектров, к примеру, используемого, например, в технологиях сжатия аудио.
Большинство технологий сжатия спроектированы для определенного типа информационного сигнала и конкретных условий передачи сжатого потока данных, таких как максимальная разрешенная задержка и доступная скорость передачи битов. Например, при сжатии аудио кодеки на основе преобразования, такие как AAC, зачастую превосходят по характеристикам кодеки временной области на основе линейного прогнозирования, такие как ACELP, в случае более высокой доступной скорости передачи битов и в случае кодирования музыки вместо речи. USAC-кодек, например, нацелен на охват большего числа сценариев применения посредством унификации различных принципов кодирования аудио в одном кодеке. Тем не менее, является предпочтительным дополнительно повышать адаптивность к различным условиям кодирования, таким как изменяющаяся доступная скорость передачи битов, чтобы иметь возможность воспользоваться их преимуществом для того, чтобы достигать, например, более высокой эффективности кодирования и т.п.
Соответственно, задача настоящего изобретения заключается в том, чтобы предоставлять такой принцип посредством предоставления схемы представления информационного сигнала в виде преобразования с перекрытием, которая обеспечивает представление информационного сигнала посредством представления преобразования с перекрытием требующего подавления наложения спектров, так что можно адаптировать представление преобразования с перекрытием к фактической потребности, тем самым предоставляя возможность достигать более высокой эффективности кодирования.
Эта задача решается посредством объекта изобретения в находящихся на рассмотрении независимых пунктах формулы изобретения.
Основные идеи, которые приводят к настоящему изобретению, заключаются в следующем. Представления преобразования с перекрытием информационных сигналов зачастую используются для того, чтобы формировать предварительное состояние при эффективном кодировании информационного сигнала с точки зрения, например, восприятия отношения скорости передачи к искажению. Примерами таких кодеков являются AAC или TCX и т.п. Представления преобразования с перекрытием, тем не менее, также могут использоваться для того, чтобы выполнять повторную дискретизацию посредством конкатенации преобразования и повторного преобразования с различными спектральными разрешениями. В общем, представления преобразования с перекрытием, вызывающие наложение спектров в перекрывающихся частях отдельных повторных преобразований из преобразований обработанных методом окна последовательных временных областей информационного сигнала, имеют преимущество с точки зрения меньшего числа уровней коэффициентов преобразования, которые должны быть кодированы, с тем чтобы представлять представление преобразования с перекрытием. В крайней форме, преобразования с перекрытием являются "критически дискретизированными". Иными словами, не увеличивается число коэффициентов в представлении преобразования с перекрытием по сравнению с числом временных выборок информационного сигнала. Примером представления преобразования с перекрытием является гребенка фильтров MDCT (модифицированного дискретного косинусного преобразования) или QMF (квадратурных зеркальных фильтров). Соответственно, зачастую предпочтительно использовать такие представления преобразования с перекрытием в качестве предварительного состояния при эффективном кодировании информационных сигналов. Тем не менее, также должно быть предпочтительным иметь возможность разрешать изменение во времени частоты дискретизации, на которой представляется информационный сигнал с использованием представления преобразования с перекрытием, так что она адаптируется, например, к доступной скорости передачи битов или другим окружающим условиям. Представим себе изменяющуюся доступную скорость передачи битов. Каждый раз, когда доступная скорость передачи битов опускается ниже некоторого предварительно определенного порогового значения, например, может быть предпочтительным понижать частоту дискретизации, а когда доступная скорость передачи снова повышается, должно быть предпочтительным иметь возможность повышать частоту дискретизации, на которой представление преобразования с перекрытием представляет информационный сигнал. К сожалению, перекрывающиеся части с наложением спектров повторных преобразований представления преобразования с перекрытием, вероятно, образуют препятствие для таких изменений частоты дискретизации, причем это препятствие, вероятно, преодолевается только посредством полного прерывания представления преобразования с перекрытием в случаях изменений частоты дискретизации.
Авторы настоящего изобретения, тем не менее, реализовали решение вышеуказанной проблемы, тем самым обеспечивая эффективное использование представлений преобразования с перекрытием, заключающих в себе рассматриваемое наложение спектров и изменение частоты дискретизации. В частности, посредством интерполяции предшествующая и/или последующая область информационного сигнала повторно дискретизируется в части подавления наложения спектров согласно изменению частоты дискретизации на границе между обеими областями. Модуль комбинирования затем имеет возможность выполнять подавление наложения спектров на границе между повторными преобразованиями для предшествующей и последующей областей, полученных посредством повторной дискретизации в части подавления наложения спектров. Посредством этой меры изменения частоты дискретизации фактически обходятся с исключением разрывностей представления преобразования с перекрытием при изменениях/переходах частоты дискретизации. Аналогичные меры также осуществимы на стороне преобразования, чтобы надлежащим образом формировать преобразование с перекрытием.
С использованием вышеприведенной идеи можно предоставлять технологии сжатия информационных сигналов, к примеру технологии сжатия аудио, которые имеют высокую эффективность кодирования в широком диапазоне окружающих условий кодирования, таких как доступная полоса пропускания передачи, посредством адаптации передаваемой частоты дискретизации к этим условиям без штрафа за счет самих случаев изменений частоты дискретизации.
Преимущественные аспекты настоящего изобретения представляют собой предмет зависимых пунктов формулы изобретения для заданных независимых пунктов формулы изобретения. Кроме того, предпочтительные варианты осуществления настоящего изобретения описываются ниже относительно чертежей, на которых:
фиг. 1a показывает блок-схему информационного кодера, в котором могут быть реализованы варианты осуществления настоящего изобретения;
фиг. 1b показывает блок-схему декодера информационных сигналов, в котором могут быть реализованы варианты осуществления настоящего изобретения;
фиг. 2a показывает блок-схему возможной внутренней структуры базового кодера по фиг. 1a;
фиг. 2b показывает блок-схему возможной внутренней структуры базового декодера по фиг. 1b;
фиг. 3a показывает блок-схему возможной реализации модуля повторной дискретизации по фиг. 1a;
фиг. 3b показывает блок-схему возможной внутренней структуры модуля повторной дискретизации по фиг. 1b;
фиг. 4a показывает блок-схему кодера информационных сигналов, в котором могут быть реализованы варианты осуществления настоящего изобретения;
фиг. 4b показывает блок-схему декодера информационных сигналов, в котором могут быть реализованы варианты осуществления настоящего изобретения;
фиг. 5 показывает блок-схему модуля восстановления информационных сигналов в соответствии с вариантом осуществления;
фиг. 6 показывает блок-схему преобразователя информационных сигналов в соответствии с вариантом осуществления;
фиг. 7a показывает блок-схему кодера информационных сигналов в соответствии с дополнительным вариантом осуществления, в котором может быть использован модуль восстановления информационных сигналов согласно фиг. 5;
фиг. 7b показывает блок-схему декодера информационных сигналов в соответствии с дополнительным вариантом осуществления, в котором может быть использован модуль восстановления информационных сигналов согласно фиг. 5;
фиг. 8 показывает схематический вид, показывающий сценарии переключения частоты дискретизации, возникающие в кодере и декодере информационных сигналов по фиг. 6a и 6b в соответствии с вариантом осуществления.
Чтобы обуславливать варианты осуществления настоящего изобретения, дополнительно описанные ниже, предварительно поясняются варианты осуществления, в которых могут быть использованы варианты осуществления настоящей заявки и которые проясняют намерение и преимущества вариантов осуществления настоящей заявки, подробнее изложенных ниже.
Фиг. 1a и 1b показывают, например, пару из кодера и декодера, в которой преимущественно могут быть использованы варианты осуществления поясненные далее. Фиг. 1a показывает кодер, в то время как фиг. 1b показывает декодер. Кодер 10 информационных сигналов по фиг. 1a содержит вход 12, на который поступает информационный сигнал, модуль 14 повторной дискретизации и базовый кодер 16, при этом модуль 14 повторной дискретизации и базовый кодер 16 последовательно соединяются между входом 12 и выходом 18 кодера 10. На выходе 18 кодер 10 выводит поток данных, представляющий информационный сигнал входа 12. Аналогично, декодер, показанный на фиг. 1b с условным обозначением 20, содержит базовый декодер 22 и модуль 24 повторной дискретизации, которые последовательно соединяются между входом 26 и выходом 28 декодера 20 способом, показанным на фиг. 1b.
Если доступная скорость передачи битов для передачи потока данных, выводимого на выходе 18, на вход 26 декодера 20 является высокой, с точки зрения эффективности кодирования может быть предпочтительным представлять информационный сигнал 12 в потоке данных на высокой частоте дискретизации, тем самым покрывая широкую полосу спектра информационного сигнала. Иными словами, показатель эффективности кодирования, такой как показатель отношения скорости передачи к искажениям, может раскрывать, что эффективность кодирования является более высокой, если базовый кодер 16 сжимает входной сигнал 12 на более высокой частоте дискретизации по сравнению со сжатием версии с более низкой частотой дискретизации информационного сигнала 12. С другой стороны, на более низких доступных скоростях передачи битов может возникать такая ситуация, что показатель эффективности кодирования является более высоким при кодировании информационного сигнала 12 на более низкой частоте дискретизации. В этом отношении следует отметить, что искажение может измеряться психоакустически обусловленным способом, т.е. с более интенсивным учетом искажений в перцепционно более релевантных частотных областях, чем в перцепционно менее релевантных частотных областях, т.е. в частотных областях, в которых человеческое ухо является, например, менее чувствительным. В общем, области низких частот зачастую являются более релевантными, чем области верхних частот, и соответственно кодирование на более низкой частоте дискретизации исключает из кодирования частотные компоненты сигнала на входе 12, находящиеся выше частоты Найквиста, но, с другой стороны, экономия по скорости передачи битов, возникающая в результате этого, может, в восприятии отношения скорости передачи к искажениям, приводить к тому, что такое кодирование на более низкой частоте дискретизации должно предпочитаться по сравнению с кодированием на более высокой частоте дискретизации. Аналогичные несоответствия в значимости искажений между частями нижних и верхних частот также существуют в других информационных сигналах, к примеру измерительных сигналах и т.п.
Соответственно, модуль 14 повторной дискретизации служит для изменения частоты дискретизации, на которой дискретизируется информационный сигнал 12. Посредством надлежащего управления частотой дискретизации в зависимости от внешних условий передачи, к примеру, заданных, в числе прочего, посредством доступной скорости передачи битов между выходом 18 и входом 26, кодер 10 имеет возможность достигать повышенной эффективности кодирования, несмотря на изменение во времени внешних условий передачи. Декодер 20, в свою очередь, содержит базовый декодер 22, который распаковывает поток данных, при этом модуль 24 повторной дискретизации проверяет то, чтобы восстановленный информационный сигнал, выводимый на выходе 28, снова имел постоянную частоту дискретизации.
Тем не менее, проблемы в результате возникают каждый раз, когда представление преобразования с перекрытием используется в паре кодера/декодера по фиг. 1a и 1b. Представление преобразования с перекрытием, заключающее в себе наложение спектров в перекрывающихся областях повторных преобразований, образует эффективное средство для кодирования, но вследствие обязательного подавления наложения спектров во времени возникают проблемы, если частота дискретизации изменяется. См. подробности, например, на фиг. 2a и 2b. Фиг. 2a и 2b показывают возможные реализации для базового кодера 16 и базового декодера 22 при условии, что оба имеют тип кодирования с преобразованием. Соответственно, базовый кодер 16 содержит преобразователь 30, после которого следует модуль 32 сжатия, а базовый декодер, показанный на фиг. 2b, содержит модуль 34 распаковки, после которого, в свою очередь, следует повторный преобразователь 36. Фиг. 2a и 2b не должны интерпретироваться таким образом, что другие модули не могут присутствовать в базовом кодере 16 и базовом декодере 22. Например, фильтр может предшествовать преобразователю 30, так что второй должен преобразовывать повторно дискретизированный информационный сигнал, полученный посредством модуля 14 повторной дискретизации, не непосредственно, а в предварительно фильтрованной форме. Аналогично, фильтр, имеющий обратную передаточную функцию, может следовать после повторного преобразователя 36, так что сигнал повторного преобразования может обратно фильтроваться после этого.
Модуль 32 сжатия должен сжимать результирующее представление преобразования с перекрытием, выводимое посредством преобразователя 30, к примеру, посредством использования кодирования без потерь, к примеру энтропийного кодирования, включающего в себя такие примеры, как кодирование методом Хаффмана или арифметическое кодирование, и модуль 34 распаковки может выполнять обратный процесс, т.е. распаковку, посредством, например, энтропийного декодирования, к примеру декодирования методом Хаффмана или арифметического декодирования, чтобы получать представление преобразования с перекрытием, которое затем подается в повторный преобразователь 36.
В окружении кодирования с преобразованием, показанном на фиг. 2a и 2b, проблемы возникают каждый раз, когда модуль 14 повторной дискретизации изменяет частоту дискретизации. Проблема является менее серьезной на стороне кодирования, поскольку информационный сигнал 12 присутствует в любом случае и соответственно в преобразователь 30 могут предоставляться непрерывно дискретизированные области для отдельных преобразований с использованием обработанной методом окна версии соответствующих областей даже для случаев изменения частоты дискретизации.
Возможный вариант осуществления для реализации преобразователя 30 соответственно описан далее относительно фиг. 6. В общем, в преобразователь 30 может предоставляться обработанная методом окна версия предшествующей области информационного сигнала на текущей частоте дискретизации, при этом затем в преобразователь 30 подается, посредством модуля 14 повторной дискретизации, следующая частично перекрывающаяся область информационного сигнала, преобразование обработанной методом окна версии которой затем формируется посредством преобразователя 30. Дополнительные проблемы не возникают, поскольку обязательное подавление наложения спектров во времени должно осуществляться в повторном преобразователе 36, а не в преобразователе 30. В повторном преобразователе 36, тем не менее, изменение частоты дискретизации вызывает проблему в том, что повторный преобразователь 36 не имеет возможности выполнять подавление наложения спектров во времени, поскольку повторные преобразования вышеуказанных непосредственно следующих областей связаны с различными частотами дискретизации. Варианты осуществления, подробнее описанные ниже, преодолевают эти проблемы. Повторный преобразователь 36, согласно этим вариантам осуществления, может заменяться посредством модуля восстановления информационных сигналов, дополнительно описанного ниже.
Тем не менее, в окружении, описанном относительно фиг. 1a и 1b, проблемы возникают не только в случае базового кодера 16 и базового декодера 22, имеющих тип кодирования с преобразованием. Наоборот, проблемы также могут возникать в случае использования гребенок фильтров на основе преобразования с перекрытием для формирования модулей 14 и 24 повторной дискретизации, соответственно. См. подробности, например, на фиг. 3a и 3b. Фиг. 3a и 3b показывают один конкретный вариант осуществления для реализации модулей 14 и 24 повторной дискретизации. В соответствии с вариантом осуществления по фиг. 3a и 3b оба модуля повторной дискретизации реализуются посредством использования конкатенации гребенок 38 и 40 фильтров анализа, после которых соответственно следуют гребенки 42 и 44 фильтров синтеза соответственно. Как проиллюстрировано на фиг. 3a и 3b, гребенки 38-44 фильтров анализа и синтеза могут быть реализованы как QMF-гребенки фильтров, т.е. гребенки фильтров на основе MDCT с использованием QMF для разбиения заранее информационного сигнала и повторного объединения сигнала снова. QMF может быть реализован аналогично QMF, используемому в SBR-части MPEG HE-AAC или AAC-ELD, означающему многоканальную модулированную гребенку фильтров с перекрытием в 10 блоков, где 10 является просто примером. Таким образом, представление преобразования с перекрытием формируется посредством гребенок 38 и 40 фильтров анализа, и повторно дискретизированный сигнал восстанавливается из этого представления преобразования с перекрытием в случае гребенок 42 и 44 фильтров синтеза. Чтобы в результате обеспечивать изменение частоты дискретизации, гребенка 42 фильтров синтеза и гребенка 40 фильтров анализа могут быть реализованы, чтобы работать при изменяющейся длине преобразования, при этом, тем не менее, скорость гребенки фильтров или QMF, т.е. скорость, на которой последовательные преобразования формируются посредством гребенок 38 и 40 фильтров анализа соответственно, с одной стороны, и повторно преобразуются посредством гребенок 42 и 44 фильтров синтеза соответственно, с другой стороны, является постоянной и идентичной для всех компонентов 38-44. Изменение длины преобразования, тем не менее, приводит к изменению частоты дискретизации. Рассмотрим, например, пару из гребенки 38 фильтров анализа и гребенки 42 фильтров синтеза. Предположим, что гребенка 38 фильтров анализа работает с использованием постоянной длины преобразования и постоянной скорости гребенки фильтров или преобразования. В этом случае представление преобразования с перекрытием входного сигнала, выводимого посредством гребенки 38 фильтров анализа, содержит для каждой из последовательных перекрывающихся областей входного сигнала, имеющих постоянную примерную длину, преобразование обработанной методом окна версии соответствующей области, причем преобразования также имеют постоянную длину. Другими словами, гребенка 38 фильтров анализа должна перенаправлять в гребенку 42 фильтров синтеза спектрограмму постоянного частотно-временного разрешения. Длина преобразования гребенки фильтров синтеза, тем не менее, должна изменяться. Рассмотрим, например, случай понижающей дискретизации от первой частоты понижающей дискретизации между входной частотой дискретизации на входе гребенки 38 фильтров анализа и частотой дискретизации сигнала, выводимого на выходе гребенки 42 фильтров синтеза, ко второй частоте понижающей дискретизации. При условии, что первая частота понижающей дискретизации является допустимой, представление преобразования с перекрытием или спектрограмма, выводимая посредством гребенки 38 фильтров анализа, затем должна быть частично использована просто для того, чтобы подавать при повторных преобразованиях в гребенке 42 фильтров синтеза. Повторное преобразование гребенки 42 фильтров синтеза должно применяться просто к части нижних частот последовательных преобразований в спектрограмме гребенки 38 фильтров анализа. Вследствие меньшей длины преобразования, используемой в повторном преобразовании гребенки 42 фильтров синтеза, число выборок в повторных преобразованиях гребенки 42 фильтров синтеза также должно быть меньше по сравнению с числом выборок, подвергаемых, в кластерах перекрывающихся временных частей, преобразованиям в гребенке 38 фильтров, тем самым приводя к более низкой частоте дискретизации по сравнению с исходной частотой дискретизации информационного сигнала, поступающего на вход гребенки 38 фильтров анализа. Проблемы не должны возникать при условии, что частота понижающей дискретизации остается идентичной, поскольку по-прежнему для гребенки 42 фильтров синтеза не представляет проблемы выполнять подавление наложения спектров во времени на перекрытии между последовательными повторными преобразованиями и последовательными перекрывающимися областями выходного сигнала на выходе гребенки фильтров 42.
Проблема возникает каждый раз, когда происходит изменение частоты понижающей дискретизации, такое как изменение с первой частоты понижающей дискретизации на вторую большую частоту понижающей дискретизации. В этом случае длина преобразования, используемая в повторном преобразовании гребенки 42 фильтров синтеза, должна быть дополнительно уменьшена, тем самым приводя к еще более низкой частоте дискретизации для соответствующих последующих областей после момента времени изменения частоты дискретизации. С другой стороны, проблемы возникают для гребенки 42 фильтров синтеза, поскольку подавление наложения спектров во времени между повторным преобразованием относительно области, непосредственно предшествующей моменту времени изменения частоты дискретизации, и повторным преобразованием относительно области повторно дискретизированного сигнала, непосредственно следующей после момента времени изменения частоты дискретизации, нарушает подавление наложения спектров во времени между рассматриваемыми повторными преобразованиями. Соответственно, несильно помогает то, что аналогичные проблемы не возникают на стороне декодирования, на которой гребенка 40 фильтров анализа с изменяющейся длиной преобразования предшествует гребенке 44 фильтров синтеза с постоянной длиной преобразования. Здесь, гребенка 44 фильтров синтеза применяется к спектрограмме с постоянной скоростью QMF/преобразования, но с различным частотным разрешением, т.е. к последовательным преобразованиям, перенаправляемым из гребенки 40 фильтров анализа в гребенку 44 фильтров синтеза на постоянной скорости, но с различной или изменяющейся во времени длиной преобразования, чтобы сохранять часть нижних частот всей длины преобразования гребенки 44 фильтров синтеза с дополнением части верхних частот всей длины преобразования нулями. Подавление наложения спектров во времени между последовательными повторными преобразованиями, выводимыми посредством гребенки 44 фильтров синтеза, не является проблематичным, поскольку частота дискретизации восстановленного сигнала, выводимого на выходе гребенки 44 фильтров синтеза, имеет постоянную частоту дискретизации.
Таким образом, снова существует проблема в попытке реализовывать изменение/адаптацию частоты дискретизации, представленная выше относительно фиг. 1a и 1b, но эти проблемы могут преодолеваться посредством реализации гребенки 42 обратных или фильтров синтеза по фиг. 3a в соответствии с некоторыми поясненными далее вариантами осуществления для модуля восстановления информационных сигналов.
Вышеуказанные идеи относительно адаптации/изменения частоты дискретизации даже более интересны при рассмотрении принципов кодирования, согласно которым часть верхних частот информационного сигнала, который должен быть кодирован, кодируется параметрическим способом, например, посредством использования дублирования полос спектра (SBR), тогда как его часть нижних частот кодируется с использованием кодирования с преобразованием и/или прогнозирующего кодирования и т.п. См. подробности, например, на фиг. 4a и 4b, показывающих пару кодера информационных сигналов и декодера информационных сигналов. На стороне кодирования базовый кодер 16 следует после модуля повторной дискретизации, осуществленного так, как показано на фиг. 3a, т.е. как конкатенация гребенки 38 фильтров анализа и гребенки 42 фильтров синтеза с изменяющейся длиной преобразования. Как отмечено выше, чтобы достигать изменяющейся во времени частоты понижающей дискретизации между входом гребенки 38 фильтров анализа и выходом гребенки 42 фильтров синтеза, гребенка 42 фильтров синтеза применяет свое повторное преобразование к подчасти спектра с постоянным диапазоном, т.е. преобразования с постоянной длиной и постоянной скоростью преобразования 46, выводимые посредством гребенки 38 фильтров анализа, подчасти которой имеют изменяющуюся во времени длину для длины преобразования гребенки 42 фильтров синтеза. Изменение во времени проиллюстрировано посредством двунаправленной стрелки 48. Хотя часть 50 нижних частот, повторно дискретизированная посредством конкатенации гребенки 38 фильтров анализа и гребенки 42 фильтров синтеза, кодируется посредством базового кодера 16, остаток, т.е. часть 52 верхних частот, составляющая оставшуюся частотную часть спектра 46, может подвергаться параметрическому кодированию по огибающей в параметрическом кодере 54 по огибающей. Базовый поток 56 данных тем самым сопровождается посредством потока 58 данных параметрического кодирования, выводимого посредством параметрического кодера 54 по огибающей. На стороне декодирования декодер аналогично содержит базовый декодер 22, после которого следует модуль повторной дискретизации, реализованный так, как показано на фиг. 3b, т.е. содержит гребенку 40 фильтров анализа, после которой следует гребенка 44 фильтров синтеза, при этом гребенка 40 фильтров анализа имеет изменяющуюся во времени длину преобразования, синхронизированную с изменением во времени длины преобразования гребенки 42 фильтров синтеза на стороне кодирования. Хотя базовый декодер 22 принимает базовый поток 56 данных, чтобы декодировать его, параметрический декодер 60 по огибающей предоставляется, чтобы принимать параметрический поток 58 данных и извлекать из него часть 52' верхних частот, дополняющую часть 50 нижних частот с изменяющейся длиной преобразования, а именно с длиной, синхронизированной с изменением во времени длины преобразования, используемой посредством гребенки 42 фильтров синтеза на стороне кодирования, и синхронизированной с изменением частоты дискретизации, выводимой посредством базового декодера 22.
В случае кодера по фиг. 4a преимущественно, если гребенка 38 фильтров анализа присутствует в любом случае, так что формирование модуля повторной дискретизации требует просто добавления гребенки 42 фильтров синтеза. Посредством переключения частоты дискретизации можно адаптировать отношение LF-части спектра 46, которая подвергается более точному базовому кодированию по сравнению с HF-частью, которая подвергается просто параметрическому кодированию по огибающей. В частности, отношение может управляться эффективным способом в зависимости от внешних условий, таких как доступная полоса пропускания передачи для передачи полного потока данных и т.п. Изменение во времени, управляемое на стороне кодирования, легко сигнализировать на сторону декодирования, например, через соответствующие вспомогательные информационные данные.
Таким образом, относительно фиг. 1a-4b показано, что должно быть предпочтительным, если для использования доступен принцип, который фактически предоставляет изменение частоты дискретизации, несмотря на использование представлений преобразования с перекрытием, требующих подавления наложения спектров во времени. Фиг. 5 показывает вариант осуществления модуля восстановления информационных сигналов, который должен, в случае применения для реализации гребенки 42 фильтров синтеза или повторного преобразователя 36 на фиг. 2b, преодолевать вышеприведенные проблемы и достигать преимуществ пользования преимуществами такого изменения частоты дискретизации, как указано выше.
Модуль восстановления информационных сигналов, показанный на фиг. 5, содержит повторный преобразователь 70, модуль 72 повторной дискретизации и модуль 74 комбинирования, которые последовательно соединяются в порядке их упоминания между входом 76 и выходом 78 модуля 80 восстановления информационных сигналов.
Модуль восстановления информационных сигналов, показанный на фиг. 5, служит для восстановления, с использованием подавления наложения спектров, информационного сигнала из представления преобразования с перекрытием информационного сигнала, поступающего на вход 76. Иными словами, модуль восстановления информационных сигналов служит для вывода на выходе 78 информационного сигнала с изменяющейся во времени частотой дискретизации с использованием представления преобразования с перекрытием этого информационного сигнала, поступающего на вход 76. Представление преобразования с перекрытием информационного сигнала содержит, для каждой из последовательных перекрывающихся временных областей (или временных интервалов) информационного сигнала, преобразование обработанной методом окна версии соответствующей области. Как подробнее указано ниже, модуль 80 восстановления информационных сигналов сконфигурирован с возможностью восстанавливать информационный сигнал на частоте дискретизации, которая изменяется на границе 82 между предшествующей областью 84 и последующей областью 86 информационного сигнала 90.
Чтобы пояснять функциональность отдельных модулей 70-74 модуля 80 восстановления информационных сигналов, предварительно предполагается, что представление преобразования с перекрытием информационного сигнала, поступающего на вход 76, имеет постоянное частотно-временное разрешение, т.е. разрешение, постоянное во времени и частоте. Ниже поясняется другой сценарий.
Согласно вышеупомянутому допущению представление преобразования с перекрытием может рассматриваться так, как показано на 92 на фиг. 5. Как показано, представление преобразования с перекрытием содержит последовательность преобразований, которые являются последовательными во времени с определенной скоростью Δt преобразования. Каждое преобразование 94 представляет преобразование обработанной методом окна версии соответствующей временной области i информационного сигнала. В частности, поскольку частотное разрешение является постоянным во времени для представления 92, каждое преобразование 94 содержит постоянное число коэффициентов преобразования, а именно Nk. Это фактически означает, что представление 92 является спектрограммой информационного сигнала, содержащей Nk спектральных компонентов или поддиапазонов частот, которые могут строго упорядочиваться вдоль спектральной оси k, как проиллюстрировано на фиг. 5. В каждом спектральном компоненте или поддиапазоне частот коэффициенты преобразования в спектрограмме возникают на скорости Δt преобразования.
Представление 92 преобразования с перекрытием, имеющее такое постоянное частотно-временное разрешение, например, выводится посредством QMF-гребенки фильтров анализа, как показано на фиг. 3a. В этом случае каждый коэффициент преобразования должен быть комплекснозначным, т.е. каждый коэффициент преобразования должен иметь, например, вещественную и мнимую часть. Тем не менее, коэффициенты преобразования представления 92 преобразования с перекрытием не обязательно являются комплекснозначными, а также могут быть исключительно вещественнозначными, к примеру, в случае чистого MDCT. Помимо этого следует отметить, что вариант осуществления по фиг. 5 также является переносимым на другие представления преобразования с перекрытием, вызывающие наложение спектров в перекрывающихся частях временных областей, причем преобразования 94, которые последовательно размещаются в представлении 92 преобразования с перекрытием.
Повторный преобразователь 70 сконфигурирован с возможностью применять повторное преобразование для преобразований 94 с тем, чтобы получать, для каждого преобразования 94, повторное преобразование, проиллюстрированное посредством соответствующей временной огибающей 96 для последовательных временных областей 84 и 86, причем временная огибающая примерно соответствует взвешивающей функции, применяемой к вышеуказанным временным частям информационного сигнала, чтобы в результате обеспечивать последовательность преобразований 94. Что касается предшествующей временной области 84, фиг. 5 предполагает то, что повторный преобразователь 70 применяет повторное преобразование к полному преобразованию 94, ассоциированному с этой областью 84 в представлении 92 преобразования с перекрытием, так что повторное преобразование 96 для области 84 содержит, например, Nk выборок или два раза по Nk выборок (в любом случае столько выборок, сколько составляет обработанная методом окна часть, из которой получено соответствующее преобразование 94), дискретизирующих полную временную длину Δt*a временной области 84, при этом коэффициент представляет собой коэффициент, определяющий перекрытие между последовательными временными областями, в единицах которых сформированы преобразования 94 представления 92. Здесь следует отметить, что равенство (или двойственность) числа временных выборок во временной области 84 и числа коэффициентов преобразования в преобразовании 94, принадлежащих этой временной области 84, выбраны просто в качестве иллюстрации и что равенство (или двойственность) также может заменяться посредством другого постоянного отношения между обоими числами в соответствии с альтернативным вариантом осуществления, в зависимости от используемого подробного преобразования с перекрытием.
Теперь предполагается, что модуль восстановления информационных сигналов нацелен на изменение частоты дискретизации информационного сигнала между временной областью 84 и временной областью 86. Обуславливающий фактор для этого может предоставляться посредством внешнего сигнала 98. Если, например, модуль 80 восстановления информационных сигналов используется для реализации гребенки 42 фильтров синтеза по фиг. 3a и фиг. 4a соответственно, сигнал 98 может предоставляться каждый раз, когда изменение частоты дискретизации предполагает более эффективное кодирование, к примеру, в ходе изменения условий передачи потока данных.
В данном случае в качестве иллюстрации предполагается, что модуль 80 восстановления информационных сигналов нацелен на уменьшение частоты дискретизации между временными областями 84 и 86. Соответственно, повторный преобразователь 70 также применяет повторное преобразование для преобразования обработанной методом окна версии последующей области 86, с тем чтобы получать повторное преобразование 100 для последующей области 86, но на этот раз повторный преобразователь 70 использует меньшую длину преобразования для выполнения повторного преобразования. Если точнее, повторный преобразователь 70 выполняет повторное преобразование в наименьшие Nk'<Nk коэффициентов преобразования для преобразования только для последующей области 86, т.е. в коэффициенты преобразования 1...Nk', так что полученное повторное преобразование 100 содержит более низкую частоту дискретизации, т.е. оно дискретизируется просто с помощью Nk' вместо Nk (или соответствующей доли второго числа).
Как проиллюстрировано на фиг. 5, проблема, возникающая между повторными преобразованиями 96 и 100, заключается в следующем. Повторное преобразование 96 для предшествующей области 84 и повторное преобразование 100 для последующей области 86 перекрываются в части 102 подавления наложения спектров на границе 82 между предшествующей и последующей областями 84 и 86, при этом продолжительность части подавления наложения спектров составляет, например, (a-1)*Δt, но число выборок повторного преобразования 96 в этой части 102 подавления наложения спектров отличается от (конкретно в этом примере, выше) числа выборок повторного преобразования 100 в идентичной части 102 подавления наложения спектров. Таким образом, подавление наложения спектров во времени посредством выполнения суммирования с перекрытием обоих повторных преобразований 96 и 100 в этом временном интервале 102 не является простым.
Соответственно, модуль 72 повторной дискретизации соединяется между повторным преобразователем 70 и модулем 74 комбинирования, второй из которых отвечает за выполнение подавления наложения спектров во времени. В частности, модуль 72 повторной дискретизации сконфигурирован с возможностью повторно дискретизировать, посредством интерполяции, повторное преобразование 96 для предшествующей области 84 и/или повторное преобразование 100 для последующей области 86 в части 102 подавления наложения спектров согласно изменению частоты дискретизации на границе 82. Поскольку повторное преобразование 96 достигает входа модуля 72 повторной дискретизации раньше повторного преобразования 100, может быть предпочтительным, чтобы модуль 72 повторной дискретизации выполнял повторную дискретизацию для повторного преобразования 96 для предшествующей области 84. Иными словами, посредством интерполяции 104 должна повторно дискретизироваться соответствующая часть повторного преобразования 96, содержащаяся в части 102 подавления наложения спектров, с тем чтобы соответствовать условию дискретизации или позициям выборок повторного преобразования 100 в идентичной части 102 подавления наложения спектров. Модуль 74 комбинирования затем может просто суммировать совместно размещаемые выборки из повторно дискретизированной версии повторного преобразования 96 и повторного преобразования 100, чтобы получать восстановленный сигнал 90 в этом временном интервале 102 на новой частоте дискретизации. В этом случае частота дискретизации в выходном восстановленном сигнале должна переключаться с первой на новую частоту дискретизации в начальном сегменте (начале) временной части 86. Тем не менее, интерполяция также может применяться по-разному для начальной и завершающей половины временного интервала 102 с тем, чтобы достигать другого момента 82 во времени для переключения частоты дискретизации в восстановленном сигнале 90. Таким образом, момент 82 времени изображен на фиг. 5 как находящийся в середине перекрытия между частью 84 и 86, просто в качестве иллюстрации, и в соответствии с другими вариантами осуществления идентичный момент времени может находиться где-то в другом месте между началом части 86 и концом части 84 включительно.
Соответственно, модуль 74 комбинирования затем имеет возможность выполнять подавление наложения спектров между повторными преобразованиями 96 и 100 для предшествующей и последующей областей 84 и 86 соответственно, полученных посредством повторной дискретизации в части 102 подавления наложения спектров. Если точнее, чтобы подавлять наложение спектров в части 102 подавления наложения спектров, модуль 74 комбинирования выполняет процесс суммирования с перекрытием между повторными преобразованиями 96 и 100 в части 102 с использованием повторно дискретизированной версии, полученной посредством модуля 72 повторной дискретизации. Процесс суммирования с перекрытием в результате обеспечивает, вместе с обработкой методом окна для формирования преобразований 94, постоянно усиленное представление без наложения спектров информационного сигнала 90 на выходе 78 даже на границе 82, даже если частота дискретизации информационного сигнала 90 изменяется в момент 82 времени с более высокой частоты дискретизации на более низкую частоту дискретизации.
Таким образом, как вытекает из вышеприведенного описания по фиг. 5, отношение длины преобразования для повторного преобразования, применяемого к преобразованию 94 обработанной методом окна версии предшествующей временной области 84, к временной длине предшествующей области 84 отличается от отношения длины преобразования для повторного преобразования, применяемого к обработанной методом окна версии последующей области 86, к временной длине последующей области 86 на коэффициент, который соответствует изменению частоты дискретизации на границе 82 между обеими областями 84 и 86. В вышеописанном примере это изменение отношения инициировано иллюстративно посредством внешнего сигнала 98. Временная длина предшествующей и последующей временных областей 84 и 86 предположительно равны друг другу, и повторный преобразователь 70 сконфигурирован с возможностью ограничивать применение повторного преобразования к преобразованию 94 обработанной методом окна версии последующей области 86 его частью низких частот, например, вплоть до Nk'-го коэффициента преобразования для преобразования. Естественно, такой захват уже может осуществляться также относительно преобразования 94 обработанной методом окна версии предшествующей области 84. Кроме того, в отличие от вышеуказанной иллюстрации, изменение частоты дискретизации на границе 82 может выполняться в другом направлении, и тем самым захват может выполняться не относительно последующей области 86, а вместо этого просто относительно преобразования 94 обработанной методом окна версии предшествующей области 84.
Если точнее, выше режим работы модуля восстановления информационных сигналов по фиг. 5 иллюстративно описан для случая, в котором длина преобразования для преобразования 94 обработанной методом окна версии областей информационного сигнала и временная длина областей информационного сигнала являются постоянными, т.е. представление 92 преобразования с перекрытием является спектрограммой, имеющей постоянное частотно-временное разрешение. Чтобы находить границу 82, модуль 80 восстановления информационных сигналов примерно описан как чувствительный к управляющему сигналу 98.
Соответственно, в этой конфигурации модуль 80 восстановления информационных сигналов по фиг. 5 может быть частью модуля 14 повторной дискретизации по фиг. 3a. Другими словами, модуль 14 повторной дискретизации по фиг. 3a может состоять из конкатенации гребенки 38 фильтров для предоставления представления преобразования с перекрытием информационного сигнала и гребенки обратных фильтров, содержащей модуль 80 восстановления информационных сигналов, сконфигурированный с возможностью восстанавливать, с использованием подавления наложения спектров, информационный сигнал из представления преобразования с перекрытием информационного сигнала, как описано выше. Повторный преобразователь 70 по фиг. 5, соответственно, может быть сконфигурирован как QMF-гребенка фильтров синтеза, при этом гребенка 38 фильтров реализуется, например, как QMF-гребенка фильтров анализа.
Как очевидно из описания фиг. 1a и 4a, кодер информационных сигналов может содержать такой модуль повторной дискретизации наряду с каскадом сжатия, таким как базовый кодер 16 или объединенный базовый кодер 16 и параметрический кодер 54 по огибающей. Каскад сжатия должен быть сконфигурирован с возможностью сжимать восстановленный информационный сигнал. Как показано на фиг. 1 и 4a, такой кодер информационных сигналов дополнительно может содержать контроллер частоты дискретизации, сконфигурированный с возможностью управлять управляющим сигналом 98, например, в зависимости от внешней информации относительно доступной скорости передачи битов.
Тем не менее, альтернативно, модуль восстановления информационных сигналов по фиг. 5 может быть сконфигурирован с возможностью находить границу 82 посредством обнаружения изменения в длине преобразования обработанной методом окна версии областей информационного сигнала в представлении преобразования с перекрытием. Чтобы прояснить эту возможную реализацию, см. 92' на фиг. 5, на котором показан пример входящего представления преобразования с перекрытием, согласно которому последовательные преобразования 94 в представлении 92' по-прежнему поступают в повторный преобразователь 70 на постоянной скорости Δt преобразования, но длина преобразования отдельного преобразования изменяется. На фиг. 5, например, предполагается, что длина преобразования для преобразования обработанной методом окна версии предшествующей временной области 84 превышает (а именно, Nk) длину преобразования для преобразования обработанной методом окна версии последующей области 86, которая предполагается равной просто Nk'. Так или иначе, повторный преобразователь 70 имеет возможность корректно синтаксически анализировать информацию относительно представления 92' преобразования с перекрытием из входного потока данных, и соответственно повторный преобразователь 70 может адаптировать длину преобразования для повторного преобразования, применяемого к преобразованию обработанной методом окна версии последовательных областей информационного сигнала, к длине преобразования для последовательных преобразований представления 92' преобразования с перекрытием. Соответственно, повторный преобразователь 70 может использовать длину преобразования в Nk для повторного преобразования для преобразования 94 обработанной методом окна версии предшествующей временной области 84 и длину преобразования в Nk' для повторного преобразования для преобразования обработанной методом окна версии последующей временной области 86, тем самым получая несоответствие частоты дискретизации между повторными преобразованиями, которое уже пояснено выше и показано на фиг. 5 сверху в середине этого чертежа. Соответственно, что касается режима работы модуля 80 восстановления информационных сигналов по фиг. 5, этот режим работы совпадает с вышеприведенным описанием за исключением вышеупомянутого отличия в адаптации длины преобразования для повторного преобразования к длине преобразования для преобразований в представлении 92' преобразования с перекрытием.
Таким образом, в соответствии со второй функциональностью, модуль восстановления информационных сигналов не должен быть чувствительным к внешнему управляющему сигналу 98. Наоборот, входящее представление 92' преобразования с перекрытием может быть достаточным для того, чтобы сообщать модулю восстановления информационных сигналов относительно моментов времени изменения частоты дискретизации.
Модуль 80 восстановления информационных сигналов, работающий так, как описано выше, может быть использован для того, чтобы формировать повторный преобразователь 36 по фиг. 2b. Иными словами, декодер информационных сигналов может содержать модуль 34 распаковки, сконфигурированный с возможностью восстанавливать представление 92' преобразования с перекрытием информационного сигнала из потока данных. Восстановление, как уже описано выше, может заключать в себе энтропийное декодирование. Изменяющаяся во времени длина преобразования для преобразований 94 может быть сигнализирована в потоке данных, поступающем в модуль 34 распаковки, надлежащим способом. Модуль восстановления информационных сигналов, как показано на фиг. 5, может быть использован в качестве модуля 36 восстановления. Он может быть сконфигурирован с возможностью восстанавливать, с использованием подавления наложения спектров, информационный сигнал из представления преобразования с перекрытием в соответствии с модулем 34 распаковки. Во втором случае повторный преобразователь 70, например, может быть выполнен с возможностью использовать IMDCT для того, чтобы выполнять повторные преобразования, и преобразование 94 может быть представлено посредством вещественнозначных коэффициентов, а не комплекснозначных.
Таким образом, вышеописанные варианты осуществления обеспечивают достижение многих преимуществ. Для аудиокодеков, работающих в полном диапазоне скорости передачи битов, таком как, к примеру, 8-128 кбит в секунду, оптимальная частота дискретизации может зависеть от скорости передачи битов, как описано выше относительно фиг. 4a и 4b. Для более низких скоростей передачи битов только нижняя частота, например, должна быть кодирована с помощью более точных способов кодирования, таких как ACELP или кодирование с преобразованием, в то время как верхние частоты должны быть кодированы параметрическим способом. Для высоких скоростей передачи битов полный спектр, например, должен быть кодирован с помощью точных способов. Это должно означать, например, что эти точные способы всегда должны кодировать сигналы при оптимальном представлении. Частота дискретизации этих сигналов должна быть оптимизирована с обеспечением возможности транспортировки самых релевантных частотных компонентов сигнала согласно теореме Найквиста. Таким образом, посмотрим на фиг. 4a. Контроллер 120 частоты дискретизации, показанный в данном документе, может быть сконфигурирован с возможностью управлять примерной скоростью передачи битов, на которой информационный сигнал подается в базовый кодер 16 в зависимости от доступной скорости передачи битов. Это соответствует подаче только субфрагмента нижних частот спектра гребенки фильтров анализа в базовый кодер 16. Оставшаяся часть верхних частот может быть подана в параметрический кодер 54 по огибающей. Изменение во времени частоты дискретизации и скорости передачи битов соответственно, как описано выше, не является проблемой.
Описание фиг. 5 относится к восстановлению информационных сигналов, которое может быть использовано для того, чтобы преодолевать проблему подавления наложения спектров во времени в моменты времени изменения частоты дискретизации. Как уже упомянуто выше относительно фиг. 1-4b, некоторые меры также должны быть предприняты в интерфейсах между последовательными модулями в сценариях фиг. 1-4b, в которых преобразователь должен формировать представление преобразования с перекрытием, затем поступающее в модуль восстановления информационных сигналов по фиг. 5.
Фиг. 6 показывает этот вариант осуществления для преобразователя информационных сигналов. Преобразователь информационных сигналов по фиг. 6 содержит вход 105 для приема информационного сигнала в виде последовательности выборок, модуль 106 захвата, сконфигурированный с возможностью захватывать последовательные перекрывающиеся области информационного сигнала, модуль 107 повторной дискретизации, сконфигурированный с возможностью применять повторную дискретизацию, по меньшей мере, к поднабору последовательных перекрывающихся областей, так что каждая из последовательных перекрывающихся областей имеет постоянную частоту дискретизации, при этом, тем не менее, постоянная частота дискретизации варьируется между последовательными перекрывающимися областями, модуль 108 обработки методом окна, сконфигурированный с возможностью применять обработку методом окна к последовательным перекрывающимся областям, и преобразователь, сконфигурированный с возможностью применять преобразование по отдельности к обработанным методом окна частям, с тем чтобы получать последовательность преобразований 94, формирующую представление 92' преобразования с перекрытием, которое затем выводится на выходе 110 преобразователя информационных сигналов по фиг. 6. Модуль 108 обработки методом окна может использовать обработку методом окна Хэмминга и т.п.
Модуль 106 захвата может быть сконфигурирован с возможностью осуществлять захват, так что последовательные перекрывающиеся области информационного сигнала имеют равную длину во времени, например, по 20 мс.
Таким образом, модуль 106 захвата перенаправляет в модуль 107 повторной дискретизации последовательность частей информационного сигнала. При условии, что входящий информационный сигнал имеет изменяющуюся во времени частоту дискретизации, которая переключается с первой частоты дискретизации на вторую частоту дискретизации в предварительно определенный момент времени, например, модуль 107 повторной дискретизации может быть сконфигурирован с возможностью повторно дискретизировать, посредством интерполяции, части входящего информационного сигнала, охватывающие во времени предварительно определенный момент времени, так что последовательная частота дискретизации изменяется один раз с первой частоты дискретизации на вторую частоту дискретизации, как проиллюстрировано на 111 на фиг. 6. Для прояснения, фиг. 6 иллюстративно показывает последовательность выборок 112, в которых частота дискретизации переключается в некоторый момент 113 времени, при этом области 114a-114d с постоянной продолжительностью примерно захватываются с постоянным смещением 115 Δt для области, задающим (наряду с постоянной продолжительностью для области) предварительно определенное перекрытие между последовательными областями 114a-114d, к примеру перекрытие 50% в расчете на число последовательных пар областей, хотя это следует понимать просто как пример.
Первая частота дискретизации перед моментом 113 времени проиллюстрирована с помощью δt1, а частота дискретизации после момента 113 времени указывается посредством δt2. Как проиллюстрировано на 111, модуль 107 повторной дискретизации, например, может быть сконфигурирован с возможностью повторно дискретизировать область 114b так, что она имеет постоянную частоту δt1 дискретизации, при этом, тем не менее, область 114c, следующая во времени, повторно дискретизируется так, что она имеет постоянную частоту δt2 дискретизации. В принципе, может быть достаточным, если модуль 107 повторной дискретизации повторно дискретизирует, посредством интерполяции, подчасть соответствующих областей 114b и 114c, охватывающую во времени момент 113 времени, который еще не имеет целевой частоты дискретизации. В случае области 114b, например, может быть достаточным, если модуль 107 повторной дискретизации повторно дискретизирует подчасть, следующую во времени после момента 113 времени, тогда как в случае области 114c может повторно дискретизироваться только подчасть, предшествующая моменту 113 времени. В этом случае, вследствие постоянной продолжительности захваченных областей 114a-114d, каждая повторно дискретизированная область имеет число временных выборок N1,2, соответствующее соответствующей постоянной частоте δt1,2 дискретизации. Модуль 108 обработки методом окна может адаптировать свое окно или длину окна к этому числу выборок для каждой входящей части, и это применимо и к преобразователю 109, который может адаптировать свою длину преобразования для преобразования соответственно. Иными словами, в случае примера, проиллюстрированного в 111 на фиг. 6, представление преобразования с перекрытием на выходе 110 имеет последовательность преобразований, длина преобразования которых варьируется, т.е. увеличивается и уменьшается, в соответствии, т.е. в линейной зависимости, от числа выборок последовательных областей и, в свою очередь, от постоянной частоты дискретизации, на которой повторно дискретизирована соответствующая область. Следует отметить, что модуль 107 повторной дискретизации может быть сконфигурирован таким образом, что он регистрирует изменение частоты дискретизации между последовательными областями 114a-114d так, что число выборок, которые должны повторно дискретизироваться в соответствующих областях, является минимальным. Тем не менее, модуль 107 повторной дискретизации альтернативно может быть сконфигурирован по-иному. Например, модуль 107 повторной дискретизации может быть сконфигурирован с возможностью предпочитать повышающую дискретизацию по сравнению с понижающей дискретизацией или наоборот, т.е. выполнять повторную дискретизацию, так что все области, перекрывающиеся с моментом 113 времени, повторно дискретизируются либо на первой частоте δt1 дискретизации, либо на второй частоте δt2 дискретизации.
Преобразователь информационных сигналов по фиг. 6 может быть использован, например, чтобы реализовывать преобразователь 30 по фиг. 2a. В этом случае, например, преобразователь 109 может быть сконфигурирован с возможностью осуществлять MDCT.
В этом отношении следует отметить, что длина преобразования для преобразования, применяемого посредством преобразователя 109, может даже превышать размер областей 114c, измеряемый в числе повторно дискретизированных выборок. В этом случае области длины преобразования, которые выходят за рамки обработанных методом окна областей, выводимых посредством модуля 108 обработки методом окна, могут задаваться равными нулю до применения преобразования к ним посредством преобразователя 109.
Перед продолжением более подробного описания возможных реализаций для реализации интерполяции 104 на фиг. 5 и интерполяции в модуле 107 повторной дискретизации на фиг. 6, следует обратиться к фиг. 7a и 7b, которые показывают возможные реализации для кодеров и декодеров по фиг. 1a и 1b. В частности, модули 14 и 24 повторной дискретизации осуществляются так, как показано на фиг. 3a и 3b, тогда как базовый кодер 16 и базовый декодер 22 соответственно осуществляются как кодек, способный переключаться между кодированием с преобразованием на основе MDCT, с одной стороны, и CELP-кодированием, к примеру ACELP-кодированием, с другой стороны. Ветви 122 и 124 кодирования/декодирования на основе MDCT соответственно могут быть, например, TCX-кодером и TCX-декодером соответственно. Альтернативно, может быть использована пара AAC-кодера/декодера. Для CELP-кодирования ACELP-кодер 126 может формировать другую ветвь кодирования базового кодера 16, при этом ACELP-декодер 128 формирует другую ветвь декодирования базового декодера 22. Переключение между обеими ветвями кодирования может выполняться на покадровой основе, как имеет место в USAC [2] или AMR-WB+ [1] для текста с описанием стандарта, ссылка на который приводится для дополнительных подробностей в отношении этих модулей кодирования.
При рассмотрении кодера и декодера фиг. 7a и 7b в качестве дополнительного конкретного примера ниже подробнее описывается схема для предоставления возможности переключения внутренней частоты дискретизации для поступления в ветви 122 и 126 кодирования и для восстановления посредством ветвей 124 и 128 декодирования. В частности, входной сигнал, поступающий на вход 12, может иметь постоянную частоту дискретизации, такую как, например, 32 кГц. Сигнал может повторно дискретизироваться с использованием пары 38 и 42 QMF-гребенок фильтров анализа и синтеза способом, описанным выше, т.е. с подходящим отношением анализа и синтеза в отношении числа полос частот, к примеру, 1,25 или 2,5, приводящим к поступлению внутреннего сигнала времени в базовый кодер 16, который имеет выделенную частоту дискретизации, например, 25,6 кГц или 12,8 кГц. Сигнал после понижающей дискретизации тем самым кодируется с использованием одной из ветвей кодирования режимов кодирования, к примеру с использованием MDCT-представления и классической схемы кодирования с преобразованием в случае ветви 122 кодирования либо во временной области с использованием ACELP, например, в ветви 126 кодирования. Такой поток данных, сформированный посредством ветвей 126 и 122 кодирования базового кодера 16, выводится и транспортируется на сторону декодирования, на которой он подвергается восстановлению.
Для переключения внутренней частоты дискретизации гребенки 38-44 фильтров должны быть адаптированы на покадровой основе согласно внутренней частоте дискретизации, на которой должны работать базовый кодер 16 и базовый декодер 22. Фиг. 8 показывает некоторые возможные сценарии переключения, при этом фиг. 8 просто показывает тракт MDCT-кодирования кодера и декодера.
В частности, фиг. 8 показывает то, что входная частота дискретизации, которая предполагается равной 32 кГц, может понижающе дискретизироваться до любого из значений 25,6 кГц, 12,8 кГц или 8 кГц с дополнительной возможностью поддержания входной частоты дискретизации. В зависимости от выбранного отношения частот дискретизации между входной частотой дискретизации и внутренней частотой дискретизации существует отношение длин преобразования между анализом гребенки фильтров, с одной стороны, и синтезом гребенки фильтров, с другой стороны. Отношения извлекаются из фиг. 8 в серых затененных прямоугольниках: 40 поддиапазонов частот в гребенках 38 и 44 фильтров соответственно независимо от выбранной внутренней частоты дискретизации и 40, 32, 16 или 10 поддиапазонов частот в гребенках 42 и 40 фильтров соответственно в зависимости от выбранной внутренней частоты дискретизации. Длина преобразования MDCT, используемого в базовом кодере, адаптируется к результирующей внутренней частоте дискретизации, так что результирующая скорость преобразования или интервал шага преобразования, измеряемая во времени, является постоянной или независимой от выбранной внутренней частоты дискретизации. Она, например, может постоянно составлять 20 мс, приводя к длине преобразования в 640, 512, 256 и 160 соответственно в зависимости от выбранной внутренней частоты дискретизации.
С использованием вышеприведенных базовых принципов можно переключать внутреннюю частоту дискретизации согласно следующим ограничениям в отношении переключения гребенки фильтров:
- дополнительная задержка не вызывается во время переключения;
- переключение или изменение частоты дискретизации может происходить мгновенно;
- артефакты переключения минимизируются или, по меньшей мере, уменьшаются и
- вычислительная сложность является низкой.
По существу, гребенки 38-44 фильтров и MDCT в базовом кодере представляют собой преобразования с перекрытием, при этом гребенки фильтров могут использовать большее перекрытие обработанных методом окна областей по сравнению с MDCT базового кодера и декодера. Например, 10-кратное перекрытие может применяться к гребенкам фильтров, тогда как 2-кратное перекрытие может применяться к MDCT 122 и 124. Для преобразований с перекрытием буферы состояния могут описываться как буфер окна анализа для анализа для гребенок фильтров анализа и MDCT и буфер суммирования с перекрытием для гребенок фильтров синтеза и IMDCT. В случае переключения скорости эти буферы состояния должны регулироваться согласно переключению частоты дискретизации способом, описанным выше относительно фиг. 5 и фиг. 6. Далее предоставляется более подробное пояснение относительно интерполяции, которая также может выполняться на стороне анализа, поясненной на фиг. 6, а не для случая синтеза, поясненного относительно фиг. 5. Прототип или окно преобразования с перекрытием может быть адаптировано. Чтобы уменьшать артефакты переключения, компоненты сигнала в буферах состояния должны сохраняться так, чтобы поддерживать свойство подавления наложения спектров преобразования с перекрытием.
Далее предоставляется более подробное описание в отношении того, как выполнять интерполяцию 104 в модуле 72 повторной дискретизации.
Два случая могут различаться:
1) Повышающее переключение является процессом, согласно которому частота дискретизации увеличивается от предшествующей временной части 84 к следующей или последующей временной части 86.
2) Понижающее переключение является процессом, согласно которому частота дискретизации снижается от предшествующей временной области 84 к последующей временной области 86.
При условии повышающего переключения, т.е., к примеру, с 12,8 кГц (256 выборок каждые 20 мс) на 32 кГц (640 выборок каждые 20 мс), буферы состояния, к примеру буфер состояния модуля 72 повторной дискретизации, иллюстративно показанный с условным обозначением 130 на фиг. 5, или его контент должен быть расширен на коэффициент, соответствующий изменению частоты дискретизации, к примеру 2,5 в данном примере. Возможные решения для расширения без вызывания дополнительной задержки представляют собой, например, линейную интерполяцию или сплайн-интерполяцию. Иными словами, модуль 72 повторной дискретизации может "на лету" интерполировать выборки "хвоста" повторного преобразования 96 относительно предшествующей временной области 84 как расположенные во временном интервале 102 в буфере 130 состояния. Буфер состояния, как проиллюстрировано на фиг. 5, может выступать в качестве буфера "первый на входе - первый на выходе". Естественно, не все частотные компоненты, которые требуются для полного подавления наложения спектров, могут быть получены посредством этой процедуры, но, по меньшей мере, нижняя частота, такая как, например, от 0 до 6,4 кГц, может быть сформирована без искажений, и с психоакустической точки зрения эти частоты являются самыми релевантными.
Для случаев понижающего переключения на более низкие частоты дискретизации линейная или сплайн-интерполяция также может быть использована для того, чтобы прореживать буфер состояния соответственно без вызывания дополнительной задержки. Иными словами, модуль 72 повторной дискретизации может прореживать частоту дискретизации посредством интерполяции. Тем не менее, понижающее переключение на частоты дискретизации, на которых коэффициент прореживания является большим, к примеру переключение с 32 кГц (640 выборок каждые 20 мс) на 12,8 кГц (256 выборок каждые 20 мс), где коэффициент прореживания составляет 2,5, может вызывать сильно мешающее наложение спектров, если не удаляются высокочастотные компоненты. Чтобы обходить это явление, может привлекаться фильтрация синтеза, при которой компоненты верхних частот могут удаляться посредством "очистки" гребенки фильтров или повторного преобразователя. Это означает то, что гребенка фильтров синтезирует меньше частотных компонентов в момент переключения и, следовательно, очищает буфер суммирования с перекрытием от высоких спектральных компонентов. Если точнее, представим себе понижающее переключение с первой частоты дискретизации для предшествующей временной области 84 на более низкую частоту дискретизации для последующей временной области 86. Если отступить от вышеприведенного описания, повторный преобразователь 70 может быть сконфигурирован с возможностью подготавливать понижающее переключение посредством недопущения участия всех частотных компонентов преобразования 94 обработанной методом окна версии предшествующей временной области 84 в повторном преобразовании. Наоборот, повторный преобразователь 70 может исключать нерелевантные высокочастотные компоненты преобразования 94 из повторного преобразования посредством задавания их равными 0, например, или иным образом уменьшения их влияния на повторное преобразование, к примеру, посредством постепенного возрастающего ослабления этих компонентов верхних частот. Например, затронутые высокочастотные компоненты могут быть частотными компонентами выше частотного компонента Nk'. Соответственно, в результирующем информационном сигнале временная область 84 преднамеренно восстановлена в спектральной полосе пропускания, которая меньше полосы пропускания, которая должна быть доступна в представлении преобразования с перекрытием, вводимом на вход 76. С другой стороны, тем не менее, исключаются проблемы наложения спектров, в противном случае возникающие при процессе суммирования с перекрытием посредством непреднамеренного введения частей верхних частот в процесс подавления наложения спектров в модуле 74 комбинирования, несмотря на интерполяцию 104.
В качестве альтернативы, дополнительное представление на низкой частоте дискретизации может быть одновременно сформировано для использования в надлежащем буфере состояния для переключения с представления на более высокой частоте дискретизации. Это должно обеспечивать то, что коэффициент прореживания (в случае, если требуется прореживание) всегда поддерживается относительно низким (т.е. меньшим 2), и, следовательно, не возникают мешающие артефакты, вызываемые в результате наложения спектров. Как упомянуто выше, это сохраняет не все частотные компоненты, а, по меньшей мере, нижние частоты, которые представляют интерес в отношении психоакустической релевантности.
Таким образом, в соответствии с конкретным вариантом осуществления может быть возможным модифицировать USAC-кодек следующим образом, чтобы получать версию с низкой задержкой USAC. Во-первых, только режимы TCX- и ACELP-кодирования могут разрешаться. AAC-режимы могут исключаться. Длина кадра может быть выбрана таким образом, чтобы получать кадрирование в 20 мс. Затем, следующие системные параметры могут быть выбраны в зависимости от рабочего режима (сверхширокополосный (SWB), широкополосный (WB), узкополосный (NB), полная полоса пропускания (FB)) и скорости передачи битов. Общее представление системных параметров приведено в следующей таблице.
Режим | Входная частота дискретизации [кГц] | Внутренняя частота дискретизации [кГц] | Длина кадра [выборки] |
NB | 8 кГц | 12,8 кГц | 256 |
WB | 16 кГц | 12,8 кГц | 256 |
SWB, низкие частоты (12-32 кбит/с) | 32 кГц | 12,8 кГц | 256 |
SWB, высокие частоты (48-64 кбит/с) | 32 кГц | 25,6 кГц | 512 |
SWB, очень высокие частоты (96-128 кбит/с) | 32 кГц | 32 кГц | 640 |
FB | 48 кГц | 48 кГц | 960 |
Что касается узкополосного режима, повышение частоты дискретизации может исключаться и заменяться заданием внутренней частоты дискретизации равной входной частоте дискретизации, т.е. 8 кГц при выборе соответствующей длины кадра, т.е. в 160 выборок. Аналогично, 16 кГц могут выбираться для широкополосного рабочего режима при выборе длины кадра MDCT для TCX в 320 выборок вместо 256.
В частности, должно быть возможным поддерживать операцию переключения по всему списку рабочих точек, т.е. поддерживаемым частотам дискретизации, скоростям передачи битов и полосам пропускания. Следующая таблица приводит различные конфигурации, связанные с внутренней частотой дискретизации вышеуказанной ожидаемой версии с низкой задержкой USAC-кодека.
Полоса пропускания | Входная частота дискретизации | |||
8 кГц | 16 кГц | 32 кГц | 48 кГц | |
NB | 12,8 кГц | 12,8 кГц | 12,8 кГц | 12,8 кГц |
WB | 12,8 кГц | 12,8 кГц | 12,8 кГц | |
SWB | 12,8, 25,6, 32 кГц |
12,8, 25,6, 32 кГц | ||
FB | 12,8, 25,6, 32, 48 кГц |
Таблица, показывающая матрицу режимов внутренней частоты дискретизации USAC-кодека с низкой задержкой
В качестве вспомогательной информации следует отметить, что модуль повторной дискретизации согласно фиг. 2a и 2b не обязательно должен использоваться. Набор IIR-фильтров альтернативно может предоставляться, чтобы принимать на себя ответственность за функциональность повторной дискретизации от входной частоты дискретизации к выделенной базовой частоте дискретизации. Задержка этих IIR-фильтров составляет меньше 0,5 мс, но вследствие неокругленного отношения между входной и выходной частотой сложность является довольно значительной. При условии идентичной задержки для всех IIR-фильтров может разрешаться переключение между различными частотами дискретизации.
Соответственно, может быть предпочтительным использование варианта осуществления модуля повторной дискретизации по фиг. 2a и 2b. QMF-гребенка фильтров параметрического модуля формирования огибающей (т.е. SBR) может участвовать во взаимодействии, чтобы активировать функциональность повторной дискретизации, как описано выше. В случае SWB она должна добавлять каскад гребенки фильтров синтеза в кодер, в то время как аналитический каскад уже используется вследствие модуля SBR-кодера. На стороне декодера уже QMF отвечает за предоставление функциональности повышающей дискретизации, когда разрешается SBR. Эта схема может быть использована во всех других режимах полосы пропускания. Следующая таблица предоставляет общее представление обязательных QMF-конфигураций.
Таблица. Список QMF-конфигураций на стороне кодера (число аналитических полос частот/число синтетических полос частот). Другая возможная конфигурация может быть получена посредством деления всех чисел на коэффициент 2.
При условии постоянной входной частоты дискретизации переключение между внутренними частотами дискретизации разрешается посредством переключения прототипа QMF-синтеза. На стороне декодирования может применяться обратная операция. Следует отметить, что полоса пропускания одной QMF-полосы частот является идентичной по всему диапазону рабочих точек.
Хотя некоторые аспекты описаны в контексте аппарата, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока, или элемента, или признака соответствующего аппарата. Некоторые или все этапы способа могут быть выполнены посредством (или с использованием) аппарата, такого как, например, микропроцессор, программируемый компьютер или электронная схема. В некоторых вариантах осуществления часть из одного или более наиболее важных этапов способа может выполняться посредством этого аппарата.
В зависимости от определенных требований к реализации варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием цифрового носителя данных, например гибкого диска, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронно считываемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой, так что осуществляется соответствующий способ. Следовательно, цифровой носитель данных может быть машиночитаемым.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронно считываемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.
В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, при этом программный код выполнен с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, сохраненных на машиночитаемом носителе.
Другими словами, следовательно, вариант осуществления изобретаемого способа представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.
Следовательно, дополнительный вариант осуществления изобретаемых способов представляет собой носитель данных (цифровой носитель данных или машиночитаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе. Носитель данных, цифровой носитель данных или носитель с записанными данными типично является материальным и/или энергонезависимым.
Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, может быть сконфигурирована с возможностью передачи через соединение для передачи данных, например через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например компьютер или программируемое логическое устройство, сконфигурированное с возможностью осуществлять один из способов, описанных в данном документе.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для осуществления одного из способов, описанных в данном документе.
Дополнительный вариант осуществления согласно изобретению содержит аппарат или систему, сконфигурированную с возможностью передавать (например, электронно или оптически) компьютерную программу для осуществления одного из способов, описанных в данном документе, в приемное устройство. Приемное устройство, например, может быть компьютером, мобильным устройством, запоминающим устройством и т.п. Аппарат или система, например, может содержать файловый сервер для передачи компьютерной программы в приемное устройство.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для того, чтобы выполнять часть или все функциональности способов, описанных в данном документе. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого аппарата.
Вышеописанные варианты осуществления являются просто иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Следовательно, они подразумеваются как ограниченные только посредством объема нижеприведенной формулы изобретения, а не посредством конкретных подробностей, представленных посредством описания и пояснения вариантов осуществления в данном документе.
Документы
[1]: 3GPP, "Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions", 2009 год, 3GPP TS 26.290.
[2]: USAC codec (Unified Speech and Audio Codec), ISO/IEC CD 23003-3, 24 сентября 2010 года.
Claims (23)
1. Модуль восстановления информационных сигналов, выполненный с возможностью восстанавливать, с использованием устранения помехи дискретизации, информационный сигнал из представления информационного сигнала с использованием преобразования с перекрытием, содержащего для каждой из последовательных перекрывающихся областей информационного сигнала преобразование обработанной методом окна версии соответствующей области, при этом модуль восстановления информационных сигналов выполнен с возможностью восстанавливать информационный сигнал на частоте дискретизации, которая изменяется на границе (82) между предшествующей областью (84) и последующей областью (86) информационного сигнала, при этом модуль восстановления информационных сигналов содержит:
- обратный преобразователь (70), выполненный с возможностью применять обратное преобразование к преобразованию (94) обработанной методом окна версии предшествующей области (84), с тем чтобы получать обратное преобразование (96) для предшествующей области (84), и применять обратное преобразование к преобразованию обработанной методом окна версии последующей области (86), с тем чтобы получать обратное преобразование (100) для последующей области (86), при этом обратное преобразование (96) для предшествующей области (84) и обратное преобразование (106) для последующей области (86) перекрываются в части (102) устранения помехи дискретизации на границе (82) между предшествующей и последующей областями;
- модуль (72) повторной дискретизации, выполненный с возможностью повторно дискретизировать, посредством интерполяции, обратное преобразование (96) для предшествующей области (84) и/или обратное преобразование (100) для последующей области (86) в части (102) устранения помехи дискретизации согласно изменению частоты дискретизации на границе (82); и
- модуль (74) комбинирования, выполненный с возможностью осуществлять устранение помехи дискретизации между обратными преобразованиями (96, 100) для предшествующей и последующей областей (84, 86), которые получены посредством повторной дискретизации в части (102) устранения помехи дискретизации.
- обратный преобразователь (70), выполненный с возможностью применять обратное преобразование к преобразованию (94) обработанной методом окна версии предшествующей области (84), с тем чтобы получать обратное преобразование (96) для предшествующей области (84), и применять обратное преобразование к преобразованию обработанной методом окна версии последующей области (86), с тем чтобы получать обратное преобразование (100) для последующей области (86), при этом обратное преобразование (96) для предшествующей области (84) и обратное преобразование (106) для последующей области (86) перекрываются в части (102) устранения помехи дискретизации на границе (82) между предшествующей и последующей областями;
- модуль (72) повторной дискретизации, выполненный с возможностью повторно дискретизировать, посредством интерполяции, обратное преобразование (96) для предшествующей области (84) и/или обратное преобразование (100) для последующей области (86) в части (102) устранения помехи дискретизации согласно изменению частоты дискретизации на границе (82); и
- модуль (74) комбинирования, выполненный с возможностью осуществлять устранение помехи дискретизации между обратными преобразованиями (96, 100) для предшествующей и последующей областей (84, 86), которые получены посредством повторной дискретизации в части (102) устранения помехи дискретизации.
2. Модуль восстановления информационных сигналов по п. 1, в котором модуль повторной дискретизации выполнен с возможностью повторно дискретизировать обратное преобразование (96) для предшествующей области в части устранения помехи дискретизации согласно изменению частоты дискретизации на границе.
3. Модуль восстановления информационных сигналов по п. 1, в котором отношение длины преобразования для обратного преобразования, применяемого к преобразованию (94) обработанной методом окна версии предшествующей области (84), к временной длине предшествующей области (84) отличается от отношения длины преобразования для обратного преобразования, применяемого к обработанной методом окна версии последующей области (86), к временной длине последующей области (86) на коэффициент, соответствующий изменению частоты дискретизации.
4. Модуль восстановления информационных сигналов по п. 3, в котором временные длины предшествующей и последующей областей (84, 86) равны друг другу и обратный преобразователь (70) выполнен с возможностью ограничивать применение обратного преобразования к преобразованию обработанной методом окна версии предшествующей области (84) частью низких частот преобразования обработанной методом окна версии предшествующей области и/или ограничивать применение обратного преобразования к преобразованию обработанной методом окна версии последующей области частью низких частот преобразования обработанной методом окна версии последующей области.
5. Модуль восстановления информационных сигналов по п. 1, в котором длина преобразования для преобразования обработанной методом окна версии областей информационного сигнала и временная длина областей информационного сигнала являются постоянными и модуль восстановления информационных сигналов выполнен с возможностью находить границу (82) в ответ на управляющий сигнал (98).
6. Модуль восстановления информационных сигналов по п. 1, в котором длина преобразования для преобразования обработанной методом окна версии областей информационного сигнала варьируется, в то время как временная длина областей информационного сигнала является постоянной, при этом модуль восстановления информационных сигналов выполнен с возможностью находить границу (82) посредством обнаружения изменения в длине преобразования обработанной методом окна версии областей информационного сигнала.
7. Модуль восстановления информационных сигналов по п. 6, в котором обратный преобразователь выполнен с возможностью адаптировать длину преобразования для обратного преобразования, применяемого к преобразованию обработанной методом окна версии предшествующей и последующей областей, к длине преобразования для преобразования обработанной методом окна версии предшествующей и последующей областей.
8. Модуль восстановления информационных сигналов по п. 1, в котором преобразование с перекрытием является критически дискретизированным, таким как MDCT.
9. Модуль восстановления информационных сигналов по п. 1, в котором представление с использованием преобразования с перекрытием является гребенкой фильтров с комплексным значением.
10. Модуль восстановления информационных сигналов по п. 1, в котором модуль повторной дискретизации выполнен с возможностью использовать линейную или сплайн-интерполяцию для интерполяции.
11. Модуль восстановления информационных сигналов по п. 1, в котором частота дискретизации снижается на границе (82) и обратный преобразователь (70) выполнен с возможностью, при применении обратного преобразования к преобразованию (94) обработанной методом окна версии предшествующей области (84), ослаблять или обнулять верхние частоты преобразования (94) обработанной методом окна версии предшествующей области (84).
12. Модуль повторной дискретизации, состоящий из конкатенации гребенки (38) фильтров для предоставления представления информационного сигнала с использованием преобразования с перекрытием и гребенки (42) обратных фильтров, содержащей модуль (80) восстановления информационных сигналов, выполненный с возможностью восстанавливать, с использованием устранения помехи дискретизации, информационный сигнал из представления информационного сигнала с использованием преобразования с перекрытием по п. 5.
13. Кодер информационных сигналов, содержащий модуль повторной дискретизации по п. 12 и каскад (16) сжатия, выполненный с возможностью сжимать восстановленный информационный сигнал, причем кодер информационных сигналов дополнительно содержит управление частотой дискретизации, выполненное с возможностью управлять управляющим сигналом (98) в зависимости от внешней информации относительно доступной скорости передачи битов.
14. Модуль восстановления информационных сигналов, содержащий модуль (34) распаковки, выполненный с возможностью восстанавливать представление информационного сигнала с использованием преобразования с перекрытием из потока данных, и модуль восстановления информационных сигналов по п. 7, выполненный с возможностью восстанавливать, с использованием устранения помехи дискретизации, информационный сигнал из представления с использованием преобразования с перекрытием.
15. Преобразователь информационных сигналов, выполненный с возможностью формировать представление информационного сигнала с использованием преобразования с перекрытием с помощью преобразования с перекрытием, вызывающего помеху дискретизации, содержащий:
- вход (105) для приема информационного сигнала в виде последовательности выборок;
- модуль (106) захвата, выполненный с возможностью захватывать последовательные перекрывающиеся области информационного сигнала;
- модуль (107) повторной дискретизации, выполненный с возможностью применять, посредством интерполяции, повторную дискретизацию, по меньшей мере, к поднабору последовательных перекрывающихся областей информационных сигналов так, что каждая из последовательных перекрывающихся частей имеет соответствующую постоянную частоту дискретизации, но соответствующая постоянная частота дискретизации варьируется между последовательными перекрывающимися областями;
- модуль (108) обработки методом окна, выполненный с возможностью применять обработку методом окна к последовательным перекрывающимся областям информационного сигнала; и
- преобразователь (109), выполненный с возможностью по отдельности применять преобразование с перекрытием к обработанным методом окна областям.
- вход (105) для приема информационного сигнала в виде последовательности выборок;
- модуль (106) захвата, выполненный с возможностью захватывать последовательные перекрывающиеся области информационного сигнала;
- модуль (107) повторной дискретизации, выполненный с возможностью применять, посредством интерполяции, повторную дискретизацию, по меньшей мере, к поднабору последовательных перекрывающихся областей информационных сигналов так, что каждая из последовательных перекрывающихся частей имеет соответствующую постоянную частоту дискретизации, но соответствующая постоянная частота дискретизации варьируется между последовательными перекрывающимися областями;
- модуль (108) обработки методом окна, выполненный с возможностью применять обработку методом окна к последовательным перекрывающимся областям информационного сигнала; и
- преобразователь (109), выполненный с возможностью по отдельности применять преобразование с перекрытием к обработанным методом окна областям.
16. Преобразователь информационных сигналов по п. 15, в котором модуль (106) захвата выполнен с возможностью осуществлять захват последовательных перекрывающихся областей информационного сигнала, так что последовательные перекрывающиеся области информационного сигнала имеют постоянную продолжительность.
17. Преобразователь информационных сигналов по п. 15, в котором модуль (106) захвата выполнен с возможностью осуществлять захват последовательных перекрывающихся областей информационного сигнала, так что последовательные перекрывающиеся области информационного сигнала имеют постоянный сдвиг по времени.
18. Преобразователь информационных сигналов по п. 16, в котором последовательность выборок имеет изменяющееся переключение частоты дискретизации с первой частоты дискретизации на вторую частоту дискретизации в предварительно определенный момент (113) времени, при этом модуль (107) повторной дискретизации выполнен с возможностью применять повторную дискретизацию к последовательным перекрывающимся областям (114b, с), перекрывающимся с предварительно определенным моментом времени, так что их постоянная частота дискретизации переключается только один раз с первой частоты дискретизации на вторую частоту дискретизации.
19. Преобразователь информационных сигналов по п. 18, причем преобразователь выполнен с возможностью адаптировать длину преобразования для преобразования каждой обработанной методом окна области к числу выборок соответствующей обработанной методом окна области.
20. Способ восстановления информационного сигнала, с использованием устранения помехи дискретизации, из представления информационного сигнала с использованием преобразования с перекрытием, содержащего для каждой из последовательных перекрывающихся областей информационного сигнала преобразование обработанной методом окна версии соответствующей области, при этом модуль восстановления информационных сигналов выполнен с возможностью восстанавливать информационный сигнал на частоте дискретизации, которая изменяется на границе (82) между предшествующей областью (84) и последующей областью (86) информационного сигнала, при этом способ содержит этапы, на которых:
- применяют обратное преобразование к преобразованию (94) обработанной методом окна версии предшествующей области (84), с тем чтобы получать обратное преобразование (96) для предшествующей области (84), и применяют обратное преобразование к преобразованию обработанной методом окна версии последующей области (86), с тем чтобы получать обратное преобразование (100) для последующей области (86), при этом обратное преобразование (96) для предшествующей области (84) и обратное преобразование (100) для последующей области (86) перекрываются в части (102) устранения помехи дискретизации на границе (82) между предшествующей и последующей областями;
- повторно дискретизируют, посредством интерполяции, обратное преобразование (96) для предшествующей области (84) и/или обратное преобразование (100) для последующей области (86) в части (102) устранения помехи дискретизации согласно изменению частоты дискретизации на границе (82) и
- выполняют устранение помехи дискретизации между обратными преобразованиями (96, 100) для предшествующей и последующей областей (84, 86), которые получены посредством повторной дискретизации в части (102) устранения помехи дискретизации.
- применяют обратное преобразование к преобразованию (94) обработанной методом окна версии предшествующей области (84), с тем чтобы получать обратное преобразование (96) для предшествующей области (84), и применяют обратное преобразование к преобразованию обработанной методом окна версии последующей области (86), с тем чтобы получать обратное преобразование (100) для последующей области (86), при этом обратное преобразование (96) для предшествующей области (84) и обратное преобразование (100) для последующей области (86) перекрываются в части (102) устранения помехи дискретизации на границе (82) между предшествующей и последующей областями;
- повторно дискретизируют, посредством интерполяции, обратное преобразование (96) для предшествующей области (84) и/или обратное преобразование (100) для последующей области (86) в части (102) устранения помехи дискретизации согласно изменению частоты дискретизации на границе (82) и
- выполняют устранение помехи дискретизации между обратными преобразованиями (96, 100) для предшествующей и последующей областей (84, 86), которые получены посредством повторной дискретизации в части (102) устранения помехи дискретизации.
21. Способ формирования представления информационного сигнала с использованием преобразования с перекрытием с помощью преобразования с перекрытием, вызывающего помеху дискретизации, содержащий этапы, на которых:
- принимают информационный сигнал в виде последовательности выборок;
- захватывают последовательные перекрывающиеся области информационного сигнала;
- применяют, посредством интерполяции, повторную дискретизацию, по меньшей мере, к поднабору последовательных перекрывающихся областей информационных сигналов так, что каждая из последовательных перекрывающихся частей имеет соответствующую постоянную частоту дискретизации, но соответствующая постоянная частота дискретизации варьируется между последовательными перекрывающимися областями;
- применяют обработку методом окна к последовательным перекрывающимся областям информационного сигнала и
- по отдельности применяют преобразование к обработанным методом окна областям.
- принимают информационный сигнал в виде последовательности выборок;
- захватывают последовательные перекрывающиеся области информационного сигнала;
- применяют, посредством интерполяции, повторную дискретизацию, по меньшей мере, к поднабору последовательных перекрывающихся областей информационных сигналов так, что каждая из последовательных перекрывающихся частей имеет соответствующую постоянную частоту дискретизации, но соответствующая постоянная частота дискретизации варьируется между последовательными перекрывающимися областями;
- применяют обработку методом окна к последовательным перекрывающимся областям информационного сигнала и
- по отдельности применяют преобразование к обработанным методом окна областям.
22. Компьютерно-считываемый носитель, имеющий сохраненную на нем компьютерную программу, имеющую программный код для осуществления, при выполнении на компьютере, способа по п. 20.
23. Компьютерно-считываемый носитель, имеющий сохраненную на нем компьютерную программу, имеющую программный код для осуществления, при выполнении на компьютере, способа по п. 21.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052458 WO2012110478A1 (en) | 2011-02-14 | 2012-02-14 | Information signal representation using lapped transform |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2012148250A RU2012148250A (ru) | 2014-07-27 |
RU2580924C2 true RU2580924C2 (ru) | 2016-04-10 |
Family
ID=71943597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012148250/08A RU2580924C2 (ru) | 2011-02-14 | 2012-02-14 | Представление информационного сигнала с использованием преобразования с перекрытием |
Country Status (18)
Country | Link |
---|---|
US (1) | US9536530B2 (ru) |
EP (1) | EP2550653B1 (ru) |
JP (2) | JP5712288B2 (ru) |
KR (1) | KR101424372B1 (ru) |
CN (1) | CN102959620B (ru) |
AR (1) | AR085222A1 (ru) |
AU (1) | AU2012217158B2 (ru) |
BR (1) | BR112012029132B1 (ru) |
CA (1) | CA2799343C (ru) |
ES (1) | ES2458436T3 (ru) |
HK (1) | HK1181541A1 (ru) |
MX (1) | MX2012013025A (ru) |
MY (1) | MY166394A (ru) |
PL (1) | PL2550653T3 (ru) |
RU (1) | RU2580924C2 (ru) |
SG (1) | SG185519A1 (ru) |
TW (2) | TWI564882B (ru) |
WO (1) | WO2012110478A1 (ru) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2014003610A (es) * | 2011-09-26 | 2014-11-26 | Sirius Xm Radio Inc | Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2"). |
US9842598B2 (en) | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
ES2934646T3 (es) | 2013-04-05 | 2023-02-23 | Dolby Int Ab | Sistema de procesamiento de audio |
WO2015025051A1 (en) * | 2013-08-23 | 2015-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a combination in an overlap range |
EP3000110B1 (en) | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
US10770082B2 (en) * | 2016-06-22 | 2020-09-08 | Dolby International Ab | Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain |
WO2018201112A1 (en) | 2017-04-28 | 2018-11-01 | Goodwin Michael M | Audio coder window sizes and time-frequency transformations |
EP3644313A1 (en) * | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
US11456007B2 (en) | 2019-01-11 | 2022-09-27 | Samsung Electronics Co., Ltd | End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization |
CN115299075B (zh) | 2020-03-20 | 2023-08-18 | 杜比国际公司 | 扬声器的低音增强 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007051548A1 (en) * | 2005-11-03 | 2007-05-10 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
RU2335809C2 (ru) * | 2004-02-13 | 2008-10-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодирование |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
RU2009107161A (ru) * | 2006-07-31 | 2010-09-10 | Квэлкомм Инкорпорейтед (US) | Системы и способы для изменения окна с кадром, ассоциированным с аудио сигналом |
RU2009118384A (ru) * | 2006-10-18 | 2010-11-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. (De) | Кодирование информационного сигнала |
Family Cites Families (212)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE272883T1 (de) | 1991-06-11 | 2004-08-15 | Qualcomm Inc | Vorrichtung und methode zur maskierung von fehlern in datenrahmen |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
KR100419545B1 (ko) | 1994-10-06 | 2004-06-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다른코딩원리들을이용한전송시스템 |
JP3304717B2 (ja) * | 1994-10-28 | 2002-07-22 | ソニー株式会社 | ディジタル信号圧縮方法及び装置 |
US5537510A (en) | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) * | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ES2247741T3 (es) | 1998-01-22 | 2006-03-01 | Deutsche Telekom Ag | Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio. |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
AU5032000A (en) | 1999-06-07 | 2000-12-28 | Ericsson Inc. | Methods and apparatus for generating comfort noise using parametric noise model statistics |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
ATE341074T1 (de) | 2000-02-29 | 2006-10-15 | Qualcomm Inc | Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US7901873B2 (en) | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
KR100464369B1 (ko) | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) * | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP3815323B2 (ja) * | 2001-12-28 | 2006-08-30 | 日本ビクター株式会社 | 周波数変換ブロック長適応変換装置及びプログラム |
DE10200653B4 (de) * | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) * | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
BRPI0306434B1 (pt) | 2002-09-19 | 2018-06-12 | Nec Corporation | Aparelho e método de decodificação de áudio |
KR100711280B1 (ko) | 2002-10-11 | 2007-04-25 | 노키아 코포레이션 | 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치 |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
KR20040058855A (ko) | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
AU2003208517A1 (en) * | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (de) * | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
US7548852B2 (en) | 2003-06-30 | 2009-06-16 | Koninklijke Philips Electronics N.V. | Quality of decoded audio by adding noise |
DE10331803A1 (de) * | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
CA2475283A1 (en) | 2003-07-17 | 2005-01-17 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre | Method for recovery of lost speech data |
DE10345996A1 (de) * | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
DE10345995B4 (de) * | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
US7418396B2 (en) * | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
EP1683133B1 (en) | 2003-10-30 | 2007-02-14 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
KR20070001115A (ko) * | 2004-01-28 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 복소수 값 데이터를 이용하는 오디오 신호 디코딩 |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
CN1930607B (zh) | 2004-03-05 | 2010-11-10 | 松下电器产业株式会社 | 差错隐藏装置以及差错隐藏方法 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
CN1954364B (zh) | 2004-05-17 | 2011-06-01 | 诺基亚公司 | 带有不同编码帧长度的音频编码 |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
CN101120400B (zh) | 2005-01-31 | 2013-03-27 | 斯凯普有限公司 | 在通信系统中生成隐藏帧的方法 |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
EP1845520A4 (en) | 2005-02-02 | 2011-08-10 | Fujitsu Ltd | SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
CA2603246C (en) | 2005-04-01 | 2012-07-17 | Qualcomm Incorporated | Systems, methods, and apparatus for anti-sparseness filtering |
WO2006126844A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
JP2008546341A (ja) | 2005-06-18 | 2008-12-18 | ノキア コーポレイション | 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法 |
EP1895511B1 (en) * | 2005-06-23 | 2011-09-07 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus |
KR100851970B1 (ko) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN101371296B (zh) | 2006-01-18 | 2012-08-29 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US20110057818A1 (en) | 2006-01-18 | 2011-03-10 | Lg Electronics, Inc. | Apparatus and Method for Encoding and Decoding Signal |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) * | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
US8255213B2 (en) | 2006-07-12 | 2012-08-28 | Panasonic Corporation | Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method |
EP2040251B1 (en) | 2006-07-12 | 2019-10-09 | III Holdings 12, LLC | Audio decoding device and audio encoding device |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
WO2008013788A2 (en) | 2006-07-24 | 2008-01-31 | Sony Corporation | A hair motion compositor system and optimization techniques for use in a hair/fur pipeline |
EP2054879B1 (en) | 2006-08-15 | 2010-01-20 | Broadcom Corporation | Re-phasing of decoder states after packet loss |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8126721B2 (en) * | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8041578B2 (en) * | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
WO2008049590A1 (en) * | 2006-10-25 | 2008-05-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
EP2052548B1 (en) | 2006-12-12 | 2012-02-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
US8364472B2 (en) | 2007-03-02 | 2013-01-29 | Panasonic Corporation | Voice encoding device and voice encoding method |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP5241701B2 (ja) | 2007-03-02 | 2013-07-17 | パナソニック株式会社 | 符号化装置および符号化方法 |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
BRPI0811384A2 (pt) * | 2007-06-11 | 2017-08-01 | Fraunhofer Ges Forschung | "codificador de áudio para codificar um sinal de áudio tendo uma porção tipo impulso e porção fixa, métodos de codificação, decodificador, método de decodificação, e sinal de áudio codificado" |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
MX2010001763A (es) | 2007-08-27 | 2010-03-10 | Ericsson Telefon Ab L M | Analisis/sintesis espectral de baja complejidad utilizando la resolucion temporal seleccionable. |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
JP5264913B2 (ja) | 2007-09-11 | 2013-08-14 | ヴォイスエイジ・コーポレーション | 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
WO2009109373A2 (en) * | 2008-03-04 | 2009-09-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for mixing a plurality of input data streams |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
US8423852B2 (en) | 2008-04-15 | 2013-04-16 | Qualcomm Incorporated | Channel decoding-based error detection |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
EP2144171B1 (en) | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
CN103000177B (zh) | 2008-07-11 | 2015-03-25 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
MY159110A (en) | 2008-07-11 | 2016-12-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
JP5551693B2 (ja) * | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | エイリアシングスイッチスキームを用いてオーディオ信号を符号化/復号化するための装置および方法 |
CA2871268C (en) | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
JP5555707B2 (ja) | 2008-10-08 | 2014-07-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチ分解能切替型のオーディオ符号化及び復号化スキーム |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
EP3992966B1 (en) | 2009-01-16 | 2022-11-23 | Dolby International AB | Cross product enhanced harmonic transposition |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
CN102334160B (zh) | 2009-01-28 | 2014-05-07 | 弗劳恩霍夫应用研究促进协会 | 音频编码器,音频解码器,编码和解码音频信号的方法 |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
WO2010093224A2 (ko) | 2009-02-16 | 2010-08-19 | 한국전자통신연구원 | 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 |
ES2374486T3 (es) | 2009-03-26 | 2012-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dispositivo y método para manipular una señal de audio. |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
JP5699141B2 (ja) * | 2009-06-23 | 2015-04-08 | ヴォイスエイジ・コーポレーション | 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
WO2011048094A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec and celp coding adapted therefore |
KR101411759B1 (ko) | 2009-10-20 | 2014-06-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법 |
BR122020024243B1 (pt) | 2009-10-20 | 2022-02-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio e método para prover uma representação decodificada de um conteúdo de áudio. |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
CN103069484B (zh) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
AU2012217269B2 (en) | 2011-02-14 | 2015-10-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
EP3373296A1 (en) | 2011-02-14 | 2018-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
-
2012
- 2012-02-14 RU RU2012148250/08A patent/RU2580924C2/ru active
- 2012-02-14 MY MYPI2012004908A patent/MY166394A/en unknown
- 2012-02-14 CN CN201280001344.3A patent/CN102959620B/zh active Active
- 2012-02-14 TW TW103134392A patent/TWI564882B/zh active
- 2012-02-14 WO PCT/EP2012/052458 patent/WO2012110478A1/en active Application Filing
- 2012-02-14 ES ES12705255.3T patent/ES2458436T3/es active Active
- 2012-02-14 AR ARP120100476A patent/AR085222A1/es active IP Right Grant
- 2012-02-14 PL PL12705255T patent/PL2550653T3/pl unknown
- 2012-02-14 MX MX2012013025A patent/MX2012013025A/es active IP Right Grant
- 2012-02-14 EP EP12705255.3A patent/EP2550653B1/en active Active
- 2012-02-14 SG SG2012083069A patent/SG185519A1/en unknown
- 2012-02-14 TW TW101104678A patent/TWI483245B/zh active
- 2012-02-14 AU AU2012217158A patent/AU2012217158B2/en active Active
- 2012-02-14 BR BR112012029132-7A patent/BR112012029132B1/pt active IP Right Grant
- 2012-02-14 CA CA2799343A patent/CA2799343C/en active Active
- 2012-02-14 JP JP2013519117A patent/JP5712288B2/ja active Active
- 2012-02-14 KR KR1020127029497A patent/KR101424372B1/ko active IP Right Grant
- 2012-11-09 US US13/672,935 patent/US9536530B2/en active Active
-
2013
- 2013-07-24 HK HK13108708.1A patent/HK1181541A1/xx unknown
-
2014
- 2014-08-04 JP JP2014158475A patent/JP6099602B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2335809C2 (ru) * | 2004-02-13 | 2008-10-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодирование |
WO2007051548A1 (en) * | 2005-11-03 | 2007-05-10 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
RU2009107161A (ru) * | 2006-07-31 | 2010-09-10 | Квэлкомм Инкорпорейтед (US) | Системы и способы для изменения окна с кадром, ассоциированным с аудио сигналом |
RU2009118384A (ru) * | 2006-10-18 | 2010-11-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. (De) | Кодирование информационного сигнала |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
Also Published As
Publication number | Publication date |
---|---|
MY166394A (en) | 2018-06-25 |
EP2550653A1 (en) | 2013-01-30 |
AU2012217158A1 (en) | 2012-12-13 |
EP2550653B1 (en) | 2014-04-02 |
TW201506906A (zh) | 2015-02-16 |
ES2458436T3 (es) | 2014-05-05 |
SG185519A1 (en) | 2012-12-28 |
TWI564882B (zh) | 2017-01-01 |
JP2013531820A (ja) | 2013-08-08 |
AU2012217158B2 (en) | 2014-02-27 |
BR112012029132B1 (pt) | 2021-10-05 |
US9536530B2 (en) | 2017-01-03 |
CN102959620B (zh) | 2015-05-13 |
CA2799343A1 (en) | 2012-08-23 |
CA2799343C (en) | 2016-06-21 |
WO2012110478A1 (en) | 2012-08-23 |
CN102959620A (zh) | 2013-03-06 |
RU2012148250A (ru) | 2014-07-27 |
JP6099602B2 (ja) | 2017-03-22 |
JP5712288B2 (ja) | 2015-05-07 |
TW201246186A (en) | 2012-11-16 |
JP2014240973A (ja) | 2014-12-25 |
AR085222A1 (es) | 2013-09-18 |
TWI483245B (zh) | 2015-05-01 |
KR101424372B1 (ko) | 2014-08-01 |
HK1181541A1 (en) | 2013-11-08 |
BR112012029132A2 (pt) | 2020-11-10 |
KR20130007651A (ko) | 2013-01-18 |
US20130064383A1 (en) | 2013-03-14 |
PL2550653T3 (pl) | 2014-09-30 |
MX2012013025A (es) | 2013-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2580924C2 (ru) | Представление информационного сигнала с использованием преобразования с перекрытием | |
US11837246B2 (en) | Harmonic transposition in an audio coding method and system | |
CA3076203C (en) | Improved harmonic transposition | |
CA3210604A1 (en) | Improved harmonic transposition | |
AU2021204779B2 (en) | Improved Harmonic Transposition | |
AU2023282303B2 (en) | Improved Harmonic Transposition |