RU2386179C2 - Способ и устройство для кодирования речевых сигналов с расщеплением полосы - Google Patents
Способ и устройство для кодирования речевых сигналов с расщеплением полосы Download PDFInfo
- Publication number
- RU2386179C2 RU2386179C2 RU2007140381/09A RU2007140381A RU2386179C2 RU 2386179 C2 RU2386179 C2 RU 2386179C2 RU 2007140381/09 A RU2007140381/09 A RU 2007140381/09A RU 2007140381 A RU2007140381 A RU 2007140381A RU 2386179 C2 RU2386179 C2 RU 2386179C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- highband
- speech
- frequency band
- speech signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 38
- 230000005284 excitation Effects 0.000 claims description 216
- 238000001228 spectrum Methods 0.000 claims description 93
- 238000005070 sampling Methods 0.000 claims description 36
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 230000003321 amplification Effects 0.000 claims description 4
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 4
- 238000003672 processing method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 230000003595 spectral effect Effects 0.000 description 54
- 230000006870 function Effects 0.000 description 51
- 238000010586 diagram Methods 0.000 description 48
- 238000004458 analytical method Methods 0.000 description 21
- 230000003044 adaptive effect Effects 0.000 description 19
- 239000013598 vector Substances 0.000 description 18
- 230000007774 longterm Effects 0.000 description 14
- 238000003786 synthesis reaction Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 238000009432 framing Methods 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 230000007704 transition Effects 0.000 description 12
- 230000002087 whitening effect Effects 0.000 description 12
- 238000001914 filtration Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 238000009499 grossing Methods 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000002194 synthesizing effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 239000004606 Fillers/Extenders Substances 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000007480 spreading Effects 0.000 description 3
- 238000003892 spreading Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000006386 memory function Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004061 bleaching Methods 0.000 description 1
- 239000007844 bleaching agent Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Control Of Amplification And Gain Control (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Control Of Eletrric Generators (AREA)
- Amplitude Modulation (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Image Analysis (AREA)
- Finish Polishing, Edge Sharpening, And Grinding By Specific Grinding Devices (AREA)
- Filters And Equalizers (AREA)
- Peptides Or Proteins (AREA)
- Solid-Sorbent Or Filter-Aiding Compositions (AREA)
- Air Conditioning Control Device (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Filtration Of Liquid (AREA)
- Crystals, And After-Treatments Of Crystals (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
- Ticket-Dispensing Machines (AREA)
- Filtering Of Dispersed Particles In Gases (AREA)
- Telephonic Communication Services (AREA)
- Transmitters (AREA)
- Developing Agents For Electrophotography (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
- Stereo-Broadcasting Methods (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
Abstract
Изобретение относится к обработке широкополосных речевых сигналов. Широкополосный речевой кодер согласно варианту осуществления включает в себя гребенку фильтров, имеющую тракт обработки полосы низких частот и тракт обработки полосы высоких частот. Тракты обработки имеют перекрывающиеся частотные характеристики. Узкополосный речевой кодер выполнен с возможностью кодирования речевого сигнала, сформированного посредством тракта обработки полосы низких частот, согласно первой методологии кодирования. Высокополосный речевой кодер выполнен с возможностью кодирования речевого сигнала, сформированного посредством тракта обработки полосы высоких частот, согласно второй методологии кодирования, которая отличается от первой методологии кодирования. Технический результат - улучшение качества кодирования широкополосных речевых сигналов. 3 н. и 30 з.п. ф-лы, 58 ил.
Description
Область техники, к которой относится изобретение
Данное изобретение относится к обработке сигналов.
Уровень техники
Речевая связь по коммутируемой телефонной сети общего пользования (PSTN) традиционно ограничена по полосе пропускания в частотном диапазоне 300-3400 кГц. Новые сети для речевой связи, такие как сотовая телефония и "речь-по-IP" (Интернет-протокол, VoIP) может не иметь такие же ограничения по полосе пропускания, и могут быть предпочтительными для того, чтобы передавать и принимать речевую связь, которая включает в себя широкополосный частотный диапазон, по таким сетям. Например, может быть желательным поддерживать диапазон звуковых частот, который идет вниз до 50 Гц и/или вверх до 7 или 8 кГц. Также может быть желательным поддерживать другие приложения, например высококачественную аудио- или аудио/видеоконференцсвязь, которые могут иметь звуковое речевое содержимое в диапазонах за пределами традиционных ограничений PSTN.
Расширение диапазона, поддерживаемое посредством речевого кодера, до более высоких частот позволяет повысить разборчивость. Например, информация, которая различает фрикативные звуки, такие как "s" и "f", в большей степени представлена в высоких частотах. Высокополосное расширение также позволяет улучшить другие качества речи, такие как эффект присутствия. Например, даже вокализованный гласный звук может иметь спектральную энергию гораздо больше ограничения PSTN.
Один подход к широкополосному кодированию речи влечет за собой масштабирование методики узкополосного кодирования речи (к примеру, сконфигурированной так, чтобы кодировать диапазон 0-4 кГц), чтобы покрывать широкополосный спектр. Например, речевой сигнал может дискретизироваться на более высокой скорости, чтобы включать в себя компоненты на высоких частотах, и методика узкополосного кодирования может быть переконфигурирована, чтобы использовать большее число коэффициентов фильтра, чтобы представлять этот широкополосный сигнал. Методики узкополосного кодирования, такие как CELP (кодирование методом линейного предсказания с кодовым возбуждением) являются вычислительно-емкими, тем не менее, и широкополосный CELP-кодер может потреблять слишком большое число циклов обработки, чтобы быть практичным для большинства мобильных и других вложенных приложений. Кодирование всего спектра широкополосного сигнала до требуемого качества с помощью этой методики также может приводить к недопустимо большому увеличению полосы пропускания. Более того, перекодировка этого закодированного сигнала должна требоваться до того, как даже его узкополосная часть может быть передана и/или декодирована посредством системы, которая поддерживает только узкополосное кодирование.
Другой подход к широкополосному кодированию речи влечет за собой экстраполирование огибающей высокополосного спектра из кодированной огибающей узкополосного спектра. Хотя этот подход может быть реализован без какого-либо увеличения полосы пропускания и без необходимости перекодировки, приблизительная спектральная огибающая или формантная структура высокополосной части речевого сигнала, как правило, не может быть предсказана точно из спектральной огибающей узкополосной части.
Может быть желательным реализовать широкополосное кодирование речи таким образом, что, по меньшей мере, узкополосная часть кодированного сигнала может быть отправлена посредством узкополосного канала (такого как PSTN-канал) без перекодировки или какой-либо другой существенной модификации. Эффективность расширения широкополосного кодирования также может быть желательной, например, чтобы не допустить существенного снижения числа пользователей, которые могут обслуживаться в таких приложениях, как беспроводная сотовая телефонная связь и широковещательная передача по проводным и беспроводным каналам.
Сущность изобретения
В одном варианте осуществления устройство включает в себя первый речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы низких частот (низкополосного речевого сигнала); второй речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы высоких частот (высокополосного речевого сигнала); и гребенку фильтров, имеющую (A) тракт обработки полосы низких частот (тракт низкополосной обработки), выполненный с возможностью приема широкополосного речевого сигнала, имеющего частотный спектр (частотное содержимое), по меньшей мере, между 1000 и 6000 Гц, и формирования речевого сигнала полосы низких частот, и (B) тракт обработки полосы высоких частот (тракт высокополосной обработки), выполненный с возможностью приема широкополосного речевого сигнала и формирования речевого сигнала полосы высоких частот. Речевой сигнал полосы низких частот основан на первой части частотного спектра широкополосного сигнала, причем первая часть включает в себя часть широкополосного сигнала между 1000 и 2000 Гц. Речевой сигнал полосы высоких частот основан на второй части частотного спектра широкополосного сигнала, причем вторая часть включает в себя часть широкополосного сигнала между 5000 и 6000 Гц. Каждый из речевого сигнала полосы низких частот и речевого сигнала полосы высоких частот основан на третьей части частотного спектра широкополосного сигнала, причем третья часть включает в себя часть широкополосного сигнала между 2000 и 5000 Гц, которая имеет ширину, по меньшей мере, 250 Гц.
В другом варианте осуществления устройство включает в себя гребенку фильтров, имеющую (A) тракт обработки полосы низких частот, выполненный с возможностью приема широкополосного речевого сигнала и формирования речевого сигнала полосы низких частот на основе низкочастотной части широкополосного речевого сигнала, и (B) тракт обработки полосы высоких частот, выполненный с возможностью приема широкополосного речевого сигнала и формирования речевого сигнала полосы высоких частот на основе высокочастотной части широкополосного речевого сигнала. Полоса пропускания тракта обработки полосы низких частот перекрывает полосу пропускания тракта обработки полосы высоких частот. Устройство также включает в себя первый речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы низких частот, по меньшей мере, в кодированный сигнал возбуждения полосы низких частот (низкополосный сигнал возбуждения) и множество параметров фильтра полосы низких частот (фильтра нижних частот); и второй речевой кодер, выполненный с возможностью формирования сигнала возбуждения полосы высоких частот (высокополосного сигнала возбуждения) на основе кодированного сигнала возбуждения полосы низких частот и кодирования сигнала полосы высоких частот, согласно сигналу возбуждения полосы высоких частот, по меньшей мере, во множество параметров фильтра полосы высоких частот (фильтра верхних частот).
В другом варианте осуществления способ обработки сигналов включает в себя этапы, на которых формируют речевой сигнал полосы низких частот на основе широкополосного речевого сигнала, имеющего частотный спектр, по меньшей мере, между 1000 и 6000 Гц; кодируют речевой сигнал полосы низких частот; формируют речевой сигнал полосы высоких частот на основе широкополосного речевого сигнала и кодируют речевой сигнал полосы высоких частот. В этом способе этап формирования речевого сигнала полосы низких частот включает в себя этап, на котором формируют речевой сигнал полосы низких частот на основе (A) первой части частотного спектра широкополосного сигнала, при этом первая часть включает в себя часть широкополосного сигнала между 1000 и 2000 Гц, и (B) третьей части частотного спектра широкополосного сигнала, при этом третья часть включает в себя часть широкополосного сигнала между 2000 и 5000 Гц, которая имеет ширину, по меньшей мере, 250 Гц. В этом способе этап формирования речевого сигнала полосы высоких частот включает в себя этап, на котором формируют речевой сигнал полосы высоких частот на основе (C) второй части частотного спектра широкополосного сигнала, при этом вторая часть включает в себя часть широкополосного сигнала между 5000 и 6000 Гц, и (D) третьей части частотного спектра широкополосного сигнала.
Краткое описание чертежей
Фиг.1a иллюстрирует блок-схему широкополосного речевого кодера A100 согласно варианту осуществления.
Фиг.1b иллюстрирует блок-схему реализации A102 широкополосного речевого кодера A100.
Фиг.2a иллюстрирует блок-схему широкополосного речевого декодера B100 согласно варианту осуществления.
Фиг.2b иллюстрирует реализацию B102 широкополосного речевого кодера B100.
Фиг.3a иллюстрирует блок-схему реализации A112 гребенки A110 фильтров.
Фиг.3B иллюстрирует блок-схему реализации B122 гребенки B120 фильтров.
Фиг.4a иллюстрирует охват полосы пропускания по полосам низких и высоких частот для одного примера гребенки A110 фильтров.
Фиг.4b иллюстрирует охват полосы частот по полосам низких и высоких частот для другого примера гребенки A110 фильтров.
Фиг.4c иллюстрирует блок-схему реализации A114 гребенки A112 фильтров.
Фиг.4d иллюстрирует блок-схему реализации B124 гребенки B122 фильтров.
Фиг.5a иллюстрирует пример графика частоты и логарифмической амплитуды для речевого сигнала.
Фиг.5b иллюстрирует блок-схему базовой системы кодирования с линейным предсказанием.
Фиг.6 иллюстрирует блок-схему реализации A122 узкополосного кодера A120.
Фиг.7 иллюстрирует блок-схему реализации B112 узкополосного декодера B110.
Фиг.8a иллюстрирует пример графика частоты и логарифмической амплитуды для остаточного сигнала вокализованной речи.
Фиг.8b иллюстрирует пример графика времени и логарифмической амплитуды для остаточного сигнала вокализованной речи.
Фиг.9 иллюстрирует блок-схему базовой системы кодирования с линейным предсказанием, которая также выполняет долгосрочное предсказание.
Фиг.10 иллюстрирует блок-схему реализации A202 кодера A200 полосы высоких частот (высокополосного кодера A200).
Фиг.11 иллюстрирует блок-схему реализации A302 генератора A300 возбуждения полосы высоких частот (высокополосного генератора A300 возбуждения).
Фиг.12 иллюстрирует блок-схему реализации A402 расширителя A400 спектра.
Фиг.12a иллюстрирует графики спектра сигнала в различных точках в одном примере операции расширения спектра.
Фиг.12b иллюстрирует графики спектра сигнала в различных точках в другом примере операции расширения спектра.
Фиг.13 иллюстрирует блок-схему реализации A304 генератора A302 возбуждения полосы высоких частот (высокополосного генератора A302 возбуждения).
Фиг.14 иллюстрирует блок-схему реализации A306 генератора A302 возбуждения полосы высоких частот (высокополосного генератора A302 возбуждения).
Фиг.15 иллюстрирует блок-схему последовательности операций задачи (программного модуля) T100 вычисления огибающей.
Фиг.16 иллюстрирует блок-схему реализации 492 объединителя 490.
Фиг.17 иллюстрирует подход к вычислению показателя периодичности сигнала S30 полосы высоких частот (высокополосного сигнала S30).
Фиг.18 иллюстрирует блок-схему реализации A312 генератора A302 возбуждения полосы высоких частот (высокополосного генератора A302 возбуждения).
Фиг.19 иллюстрирует блок-схему реализации A314 генератора A302 возбуждения полосы высоких частот (высокополосного генератора A302 возбуждения).
Фиг.20 иллюстрирует блок-схему реализации A316 генератора A302 возбуждения полосы высоких частот (высокополосного генератора A302 возбуждения).
Фиг.21 иллюстрирует блок-схему последовательности операций задачи T200 вычисления усиления.
Фиг.22 иллюстрирует блок-схему последовательности операций для реализации T210 задачи T200 вычисления усиления.
Фиг.23a иллюстрирует схему функции кадрирования.
Фиг.23b иллюстрирует применение функции кадрирования, показанной на фиг. 23a, к субкадрам речевого сигнала.
Фиг.24 иллюстрирует блок-схему реализации B202 декодера B200 полосы высоких частот (высокополосного декодера B200).
Фиг.25 иллюстрирует блок-схему реализации AD10 широкополосного речевого кодера A100.
Фиг.26a иллюстрирует схематичное представление реализации D122 линии D120 задержки.
Фиг.26b иллюстрирует схематичное представление реализации D124 линии D120 задержки.
Фиг.27 иллюстрирует схематичное представление реализации D130 линии D120 задержки.
Фиг.28 иллюстрирует блок-схему реализации AD12 широкополосного речевого кодера AD10.
Фиг.29 иллюстрирует блок-схему последовательности операций способа обработки MD100 сигналов согласно варианту осуществления.
Фиг.30 иллюстрирует блок-схему последовательности операций способа M100 согласно варианту осуществления.
Фиг.31a иллюстрирует блок-схему последовательности операций способа M200 согласно варианту осуществления.
Фиг.31b иллюстрирует блок-схему последовательности операций для реализации M210 способа M200.
Фиг.32 иллюстрирует блок-схему последовательности операций способа M300 согласно варианту осуществления.
Фиг. 33-36b показывают частотную и импульсную характеристики для операций фильтрации, показанных на фиг.4с.
Фиг.37а-39b показывают частотную и импульсную характеристики для операций фильтрации, показанных на фиг.4d.
На чертежах и в прилагаемом описании одинаковые обозначения ссылок ссылаются на те же или аналогичные элементы или сигналы.
Подробное описание
Описанные в данном документе варианты осуществления включают в себя системы, способы и устройства, которые могут быть сконфигурированы так, чтобы предоставлять расширение для узкополосного речевого сигнала, чтобы поддерживать передачу и/или хранения широкополосных речевых сигналов при увеличении пропускной способности только до 800-1000 бит/с (битов в секунду). Потенциальные преимущества этих реализаций включают в себя встроенное кодирование, чтобы поддерживать совместимость с узкополосными системами, относительно простое распределение и перераспределение битов между каналами узкополосного и высокополосного кодирования, исключение вычислительно-емкой операции широкополосного синтеза и поддержание низкой частоты дискретизации для сигналов, которые должны обрабатываться посредством вычислительно-емких процедур кодирования формы сигналов.
Если не ограничен в явной форме контекстом, термин "вычисление" используется в данном документе, чтобы обозначать любое из своих обычных значений, например расчет, формирование и выбор из списка значений. Если термин "содержащий" используется в настоящем описании и формуле изобретения, он не исключает других элементов или операций. Термин "A основан на B" используется для того, чтобы обозначать любое из своих обычных значений, в том числе случаи (i) "A равен B" и (ii) "A основан, по меньшей мере, на B". Термин "Интернет-протокол" включает в себя версию 4, как описано в IETF (Инженерная группа по развитию Интернета) RFC (Рабочие предложения) 791, и последующие версии, такие как версия 6.
Фиг.1a иллюстрирует блок-схему широкополосного речевого кодера A100 согласно варианту осуществления. Гребенка A110 фильтров сконфигурирована таким образом, чтобы фильтровать широкополосный речевой сигнал S10, чтобы формировать узкополосный сигнал S20 и высокополосный сигнал S30. Узкополосный кодер A120 выполнен с возможностью кодировать узкополосный сигнал S20, чтобы формировать параметры S40 узкополосного (NB) фильтра и узкополосный остаточный сигнал S50. Как подробнее описано в данном документе, узкополосный кодер A120 в типичном варианте выполнен с возможностью формировать параметры S40 узкополосного фильтра и кодированный узкополосный сигнал S50 возбуждения в качестве индексов таблицы кодирования или в другой квантованной форме. Высокополосный кодер A200 выполнен с возможностью кодировать высокополосный сигнал S30 согласно информации в кодированном узкополосном сигнале S50 возбуждения, чтобы сформировать параметры S60 высокополосного кодирования. Как подробнее описывается в данном документе, высокополосный кодер A200 в типичном варианте выполнен с возможностью формировать параметры S60 высокополосного кодирования в качестве индексов таблицы кодирования или в другой квантованной форме. Один конкретный пример широкополосного речевого кодера A100 выполнен с возможностью кодировать широкополосный речевой сигнал S10 на скорости примерно 8,55 кбит/с (килобит в секунду), при этом примерно 7,55 кбит/с используются для параметров S40 узкополосного фильтра и кодированного узкополосного сигнала возбуждения S50, а примерно 1 кбит/с используется для параметров S60 высокополосного кодирования.
Может быть желательным комбинировать кодированные узкополосные и высокополосные сигналы в один поток битов. Например, может быть желательным мультиплексировать кодированные сигналы вместе для передачи (к примеру, по проводному, оптическому или беспроводному каналу передачи) либо для хранения в качестве кодированного широкополосного речевого сигнала. Фиг. 1b иллюстрирует блок-схему реализации A102 широкополосного речевого кодера A100, который включает в себя мультиплексор A130, выполненный с возможностью комбинировать параметры S40 узкополосного фильтра, кодированный узкополосный сигнал S50 возбуждения и параметры S60 высокополосного фильтра в мультиплексированный сигнал S70.
Устройство, включающее в себя кодер A102, также может включать в себя схему, сконфигурированную так, чтобы передавать мультиплексированный сигнал S70 в канал передачи, такой как проводной, оптический или беспроводной канал. Это устройство также может быть сконфигурировано так, чтобы выполнять одну или более операций канального кодирования с сигналом, таких как кодирование с коррекцией ошибок (к примеру, согласованное по скорости сверточное кодирование) и/или кодирование с обнаружением ошибок (к примеру, кодирование циклическим избыточным кодом), и/или кодирование одного или более уровней сетевых протоколов (к примеру, Ethernet (Эзернет), TCP/IP, cdma2000).
Может быть желательным сконфигурировать мультиплексор A130 так, чтобы встраивать кодированный узкополосный сигнал (включающий в себя параметры S40 узкополосного фильтра и кодированный узкополосный сигнал S50 возбуждения) в качестве разделяемого субпотока мультиплексированного сигнала S70, с тем чтобы кодированный узкополосный сигнал может быть восстановлен и декодирован независимо от другой части мультиплексированного сигнала S70, такого как высокополосный и/или низкополосный сигнал. Например, мультиплексированный сигнал S70 может быть скомпонован таким образом, что кодированный узкополосный сигнал может быть восстановлен посредством отсечения параметров S60 высокополосного фильтра. Одно потенциальное преимущество такого признака состоит в том, чтобы избегать необходимости перекодировки кодированного широкополосного сигнала до передачи его в систему, которая поддерживает декодирование узкополосного сигнала, но не поддерживает декодирование высокополосной части.
Фиг.2a - это блок-схема широкополосного речевого декодера B100 согласно варианту осуществления. Узкополосный декодер B110 выполнен с возможностью кодировать параметры S40 узкополосного фильтра и декодированный узкополосный сигнал S50 возбуждения, чтобы формировать узкополосный сигнал S90. Высокополосный декодер B200 выполнен с возможностью декодировать параметры S60 высокополосного кодирования согласно узкополосному сигналу S80 возбуждения на основе кодированного узкополосного сигнала S50 возбуждения, чтобы сформировать высокополосный сигнал S100. В этом примере узкополосный декодер B110 выполнен с возможностью предоставлять узкополосный сигнал S80 возбуждения в высокополосный декодер B200. Гребенка B120 фильтров сконфигурирована так, чтобы комбинировать узкополосный сигнал S90 и высокополосный сигнал S100, чтобы формировать широкополосный речевой сигнал S110.
Фиг.2b - это блок-схема реализации B102 широкополосного речевого декодера B100, который включает в себя демультиплексор B130, выполненный с возможностью формировать кодированные сигналы S40, S50 и S60 из мультиплексированного сигнала S70. Устройство, включающее в себя декодер B102, может включать в себя схему, сконфигурированную так, чтобы принимать мультиплексированный сигнал S70 из канала передачи, такого как проводной, оптический или беспроводной канал. Это устройство также может быть сконфигурировано так, чтобы выполнять одну или более операций канального декодирования с сигналом, таких как декодирование с коррекцией ошибок (к примеру, согласованное по скорости сверточное декодирование) и/или декодирование с обнаружением ошибок (к примеру, декодирование циклическим избыточным кодом), и/или декодирование одного или более уровней сетевых протоколов (к примеру, Ethernet, TCP/IP, cdma2000).
Гребенка A110 фильтров сконфигурирована так, чтобы фильтровать входной сигнал согласно схеме расщепления полосы, чтобы формировать низкочастотный поддиапазон и высокочастотный поддиапазон. В зависимости от проектных критериев конкретного приложения выходные поддиапазоны могут иметь равные или неравные полосы пропускания и могут быть перекрывающимися или неперекрывающимися. Конфигурация гребенки A110 фильтров, которая формирует более двух поддиапазонов, также возможна. Например, эта гребенка фильтров может быть сконфигурирована так, чтобы формировать один или более низкополосных сигналов, которые включают в себя компоненты в частотном диапазоне ниже частотного диапазона узкополосного сигнала S20 (например, диапазона 50-300 Гц). Также можно сконфигурировать эту гребенку фильтров таким образом, чтобы формировать один или более дополнительных высокополосных сигналов, которые включают в себя компоненты в частотном диапазоне выше частотного диапазона высокополосного сигнала S30 (например, диапазона 14-20, 16-20 или 16-32 кГц). В этом случае широкополосный речевой кодер A100 может быть реализован таким образом, чтобы кодировать этот сигнал или сигналы отдельно, и мультиплексор A130 может быть выполнен с возможностью включать дополнительный кодированный сигнал или сигналы в мультиплексированный сигнал S70 (к примеру, в качестве разделяемой части).
Фиг.3a иллюстрирует блок-схему реализации A112 гребенки A110 фильтров, которая сконфигурирована так, чтобы формировать сигналы двух поддиапазонов, имеющие меньшие частоты дискретизации. Гребенка A110 фильтров выполнена с возможностью принимать широкополосный речевой сигнал S10, имеющий высокочастотную (или высокополосную) часть и низкочастотную (или низкополосную) часть. Гребенка A112 фильтров включает в себя тракт низкополосной обработки, выполненный с возможностью принимать широкополосный речевой сигнал S10 и формировать узкополосный речевой сигнал S20, и тракт высокополосной обработки, выполненный с возможностью принимать широкополосный речевой сигнал S10 и формировать высокополосный речевой сигнал S30. Низкочастотный фильтр 110 (фильтр нижних частот) фильтрует широкополосный речевой сигнал S10, чтобы пропускать выбранный низкочастотный поддиапазон, а высокочастотный фильтр (фильтр верхних частот) 130 фильтрует широкополосный речевой сигнал S10, чтобы пропускать выбранный высокочастотный поддиапазон. Поскольку сигналы обоих поддиапазов имеют более узкую полосу пропускания, чем широкополосный речевой сигнал S10, их частоты дискретизации могут быть снижены в некоторой степени без потери информации. Понижающий дискретизатор 120 снижает частоту дискретизации низкочастотного сигнала согласно требуемому коэффициенту прореживания (к примеру, посредством удаления выборок сигнала и/или замены выборок средними значениями), а понижающий дискретизатор 140 аналогично снижает частоту дискретизации сигнала верхних частот согласно другому требуемому коэффициенту прореживания.
Фиг.3b иллюстрирует блок-схему соответствующей реализации B122 гребенки B120 фильтров. Повышающий дискретизатор 150 повышает частоту дискретизации узкополосного сигнала S90 (к примеру, посредством заполнения нулями и/или посредством дублирования выборок), и низкочастотный фильтр 160 фильтрует сигнал с повышенной дискретизацией, чтобы пропускать только низкополосную часть (к примеру, чтобы избежать наложения спектров). Аналогично, повышающий дискретизатор 170 увеличивает частоту дискретизации высокополосного сигнала S100, а высокочастотный фильтр 180 фильтрует сигнал с повышенной дискретизацией, чтобы пропускать только высокополосную часть. Сигналы двух полос пропускания затем суммируются, чтобы сформировать широкополосный речевой сигнал S110. В некоторых реализациях декодера B100 гребенка B120 фильтров сконфигурирована так, чтобы формировать взвешенную сумму сигналов двух полос пропускания согласно одному или более весовых коэффициентов, принятых и/или вычисленных посредством высокополосного декодера B200. Конфигурация гребенки B120 фильтров, которая комбинирует сигналы более чем двух полос пропускания, также возможна.
Каждый из фильтров 110, 130, 160, 180 может быть реализован как фильтр с конечной импульсной характеристикой (FIR) или как фильтр с бесконечной импульсной характеристикой (IIR). Частотные характеристики фильтров 110 и 130 кодера могут иметь симметричные переходные области или переходные области непохожей формы между полосой режекции и полосой пропускания. Аналогично, частотные характеристики фильтров 160 и 180 декодера могут иметь симметричные переходные области или переходные области непохожей формы между полосой режекции и полосой пропускания. Может быть желательным, но не обязательным реализовать фильтр 110 низких частот с такой же характеристикой, как и у фильтра 160 низких частот, и реализовать фильтр 130 высоких частот с такой же характеристикой, как и у фильтра 180 высоких частот. В одном примере две пары 110, 130 и 160, 180 фильтров являются гребенками квадратурных зеркальных фильтров (QMF), при этом пара 110, 130 фильтров имеет такие же коэффициенты, что и пара 160, 180 фильтров.
В типичном примере низкочастотный фильтр 110 имеет полосу пропускания, которая включает в себя ограниченный PSTN-диапазон в 300-3400 Гц (к примеру, полосу от 0 до 4 кГц). Фиг.4a и 4b иллюстрируют относительные полосы пропускания широкополосного речевого сигнала S10, узкополосного сигнала S20 и высокополосного сигнала S30 в двух различных примерах реализации. В обоих из этих примеров широкополосный речевой сигнал S10 имеет частоту дискретизации в 16 кГц (представляя частотные компоненты в диапазоне 0-8 кГц), а узкополосный сигнал S20 имеет частоту дискретизации в 8 кГц (представляя частотные компоненты в диапазоне 0-4 кГц).
В примере на фиг.4a нет существенного перекрытия между двумя поддиапазонами. Высокополосный сигнал S30, как показано в данном примере, может быть получен с помощью высокочастотного фильтра 130 с полосой пропускания в 4-8 кГц. В этом случае может быть желательным снизить частоту дискретизации до 8 кГц посредством снижения дискретизации фильтрованного сигнала на коэффициент два. Эта операция, которая, как ожидается, может существенно снизить вычислительную сложность дополнительных операций обработки сигнала, уменьшает энергию полосы пропускания до диапазона в 0-4 кГц без потери информации.
В альтернативном примере по фиг.4b верхние и нижние поддиапазоны имеют заметное перекрытие, так что область 3,5-4 кГц описывается посредством сигналов обоих поддиапазонов. Высокополосный сигнал S30, как показано в данном примере, может быть получен с помощью высокочастотного фильтра 130 с полосой пропускания в 3,5-7 кГц. В этом случае может быть желательным снизить частоту дискретизации до 7 кГц посредством понижающей дискретизации фильтрованного сигнала на коэффициент 16/7. Эта операция, которая, как ожидается, может существенно снизить вычислительную сложность дополнительных операций обработки сигнала, уменьшает энергию полосы пропускания до диапазона 0-3,5 кГц без потери информации.
В типичной телефонной трубке для телефонной связи один или более преобразователей (т.е. микрофон и наушник или динамик) имеет в значительной степени недостаточную характеристику в частотном диапазоне 7-8 кГц. В примере по фиг.4b часть широкополосного речевого сигнала S10 между 7 и 8 кГц не включена в кодированный сигнал. Другие конкретные примеры высокочастотного фильтра 130 имеют полосы пропускания в 3,5-7,5 кГц и 3,5-8 кГц.
В некоторых реализациях обеспечение перекрытия между поддиапазонами, как в примере по фиг.4b, дает возможность использования низкочастотного и/или высокочастотного фильтра, имеющего плавный спад в перекрывающейся области. Эти фильтры в типичном варианте проще проектировать, они менее вычислительно сложные и/или вносят меньшую задержку, чем фильтры с более резкими или "крутыми" характеристиками. Фильтры, имеющие резкие переходные области, зачастую имеют более высокие боковые лепестки (которые могут приводить к наложению спектров), чем фильтры аналогичного порядка, которые имеют плавный спад. Фильтры, имеющие резкие переходные области, также могут иметь импульсные характеристики большой длительности, которые могут приводить к реверберирующим помехам. Для реализаций гребенок фильтров, имеющих один или более IIR-фильтров, предоставляющих плавный спад в перекрывающейся области, можно позволить использование фильтра или фильтров, полюса которых находятся дальше от единичной окружности, что может быть важным для того, чтобы обеспечивать стабильную реализацию с фиксированной запятой.
Перекрытие поддиапазонов предоставляет плавное сопряжение полосы низких частот и полосы высоких частот, что может приводить к меньшим слышимым помехам, снижению наложения спектров и/или менее заметному переходу от одной полосы к другой. Более того, эффективность кодирования узкополосного кодера A120 (например, кодера формы сигналов) может падать с повышением частоты. Например, качество кодирования узкополосного кодера может снижаться при низких скоростях передачи битов, особенно при наличии фонового шума. В этих случаях обеспечение перекрытия поддиапазонов позволяет повышать качество воспроизводимых частотных компонентов в перекрывающейся области.
Кроме того, перекрытие поддиапазонов обеспечивает плавное сопряжение полосы низких частот и полосы высоких частот, что может приводить к меньшим слышимым помехам, снижению наложения спектров и/или менее заметному переходу от одной полосы к другой. Этот признак может быть особенно желательным для реализации, в которой узкополосный кодер A120 и высокополосный кодер A200 функционируют согласно различным методологиям кодирования. Например, различные методики кодирования могут формировать сигналы, которые звучат немного по-разному. Кодер, который кодирует спектральную огибающую в форме индексов таблицы кодирования, может формировать сигнал, имеющий звук, отличающийся от звука кодера, который кодирует вместо этого амплитудный спектр. Кодер временной области (к примеру, кодер по импульсно-кодовой модуляции, PCM) может формировать сигнал, имеющий звук, отличающийся от звука кодера частотной области. Кодер, который кодирует сигнал с представлением спектральной огибающей и соответствующего остаточного сигнала, может формировать сигнал, имеющий звук, отличающийся от звука кодера, который кодирует сигнал только с представлением спектральной огибающей. Кодер, который кодирует сигнал как представление его формы, может формировать вывод, имеющий звук, отличающийся от звука синусоидального кодера. В этих случаях использование фильтров, имеющих резкие переходные области, чтобы задавать неперекрывающиеся поддиапазоны, может приводить к внезапному и перцепционно заметному переходу между поддиапазонами в синтезированном широкополосном сигнале.
Хотя гребенки QMF-фильтров, имеющие дополняющие перекрывающиеся частотные характеристики, зачастую используются в поддиапазонных методиках, такие фильтры не подходят, по меньшей мере, для некоторых реализаций широкополосного кодирования, описанных в данном документе. Гребенка QMF-фильтров в кодере сконфигурирована так, чтобы создавать значительную степень наложения спектров, которое компенсируется в соответствующей гребенке QMF-фильтров в декодере. Такая компоновка может не подходить для варианта применения, в котором сигнал подвергается значительной величине искажения между гребенками фильтров, поскольку искажение может снижать эффективность свойства компенсации наложения спектров. Например, варианты применения, описываемые в данном документе, включают в себя реализации кодирования, сконфигурированные так, чтобы функционировать при очень низких скоростях передачи битов. Как следствие очень низкой скорости передачи битов, декодированный сигнал с большой долей вероятности является в значительной степени искаженным в сравнении с исходным сигналом, так что использование гребенок QMF-фильтров может приводить к некомпенсируемому наложению спектров. Варианты применения, которые используют гребенки QMF-фильтров, в типичном варианте имеют более высокие скорости передачи битов (к примеру, более 12 кбит/с для AMR и 64 кбит/с для G.722).
Дополнительно кодер может быть выполнен с возможностью формировать синтезированный сигнал, который перцепционно аналогичен исходному сигналу, но который фактически значительно отличается от исходного сигнала. Например, кодер, который извлекает высокополосное возбуждение из узкополосного остатка, как описано в данном документе, может формировать такой сигнал, поскольку фактический высокополосный остаток может полностью отсутствовать в декодированном сигнале. Использование гребенок QMF-фильтров в этих приложениях может приводить к значительной степени искажения, вызываемого посредством некомпенсируемого наложения спектров.
Величина искажения, вызываемого посредством QMF-наложения спектров, может быть снижена, если затрагиваемый поддиапазон узкий, поскольку эффект от наложения спектров ограничен полосой пропускания, равной ширине поддиапазона. Например, как описано в данном документе, каждый поддиапазон включает в себя примерно половину широкополосной полосы пропускания, тем не менее, искажение, вызываемое посредством некомпенсируемого наложения спектров, может затрагивать значительную часть сигнала. Качество сигнала может также затрагиваться посредством размещения частотного диапазона, в котором возникает некомпенсируемое наложение спектров. Например, искажение, создаваемое рядом с центром широкополосного речевого сигнала (к примеру, между 3 и 4 кГц), может быть гораздо более нежелательным, чем искажение, которое возникает рядом с краем сигнала (к примеру, выше 6 кГц).
Хотя характеристики фильтров гребенки QMF-фильтров тесно связаны друг с другом, низкополосные и высокополосные тракты и гребенок A110 и B120 фильтров могут быть сконфигурированы так, чтобы иметь спектры, которые полностью не связаны, не считая перекрытия двух поддиапазонов. Мы задаем перекрытие двух поддиапазонов как расстояние от точки, в которой частотная характеристика высокополосного фильтра падает до -20 дБ, до точки, в которой частотная характеристика низкополосного фильтра падает до -20 дБ. В различных примерах гребенки A110 и/или B120 фильтров это перекрытие варьируется от примерно 200 Гц до примерно 1 кГц. Диапазон от примерно 400 до примерно 600 Гц может представлять требуемый компромисс между эффективностью кодирования и перцепционной плавностью. В одном конкретном примере, как упоминалось выше, перекрытие составляет порядка 500 Гц.
Может быть желательным реализовать гребенку A112 и/или B122 фильтров, чтобы выполнить операции, проиллюстрированные на фиг.4a и 4b, в несколько стадий. Например, фиг.4c иллюстрирует блок-схему реализации A114 гребенки A112 фильтров, которая выполняет функциональный эквивалент операций высокочастотной фильтрации и понижающей дискретизации, используя набор из интерполяции, повторной дискретизации и прореживания и других операций. Такую реализацию может быть проще спроектировать, и/или она может предоставлять возможность повторного использования блоков логики и/или кода. Например, один функциональный блок может быть использован для того, чтобы выполнять операции прореживания до 14 кГц и прореживания до 7 кГц, как показано на фиг.4c. Операция обращения спектра может быть реализована посредством умножения сигнала на функцию e
jnπ или последовательность (-1)n, значения которой чередуются между +1 и -1. Операция формирования спектра может быть реализована как фильтр нижних частот, выполненный с возможностью сформировать сигнал, чтобы получить требуемую общую характеристику фильтра.
Фиг.33, 34a, 34b и 35a показывают частотную и импульсную характеристики для примеров осуществления, соответственно, низкочастотного фильтра, интерполяции до 34 кГц, передискретизацию до 28 кГц и прореживания до 14 кГц, как показано на фиг.4с. Фиг.35b показывает объединенные частотную и импульсную характеристики для таких вариантов осуществления при интерполяции до 34 кГц, передискретизации до 28 кГц и прореживания до 14 кГц. Фиг.36a и 36b показывают частотную и импульсную характеристики для примеров осуществления, соответственно, прореживания до 7 кГц и операции формирования спектра, как показано на фиг.4с.
Следует отметить, что как следствие операции обращения спектра, спектр высокополосного сигнала S30 меняется на противоположный. Последующие операции в кодере и соответствующем декодере могут быть сконфигурированы надлежащим образом. Например, высокополосный генератор A300 возбуждения, описанный в данном документе, может быть выполнен с возможностью формировать сигнал S120 высокополосного возбуждения, который также имеет спектрально обращенную форму.
Фиг.4в иллюстрирует блок-схему реализации B124 гребенки B12 фильтров, которая выполняет функциональный эквивалент операций повышающей дискретизации и высокочастотной фильтрации, используя набор из интерполяции, повторной дискретизации и других операций. Гребенка B124 фильтров включает в себя операцию обращения спектра в полосе высоких частот, которая обращает аналогичную операцию, которая выполняется, например, в гребенке фильтров кодера, такой как гребенка A114 фильтров. В этом конкретном примере гребенка B124 фильтров также включает в себя режекторные фильтры в полосе низких частот и полосе высоких частот, которые ослабляют компонент сигнала при 7100 Гц, хотя эти фильтры являются необязательными и необязательно должны быть включены.
Фиг.36a и 36b показывают частотную и импульсную характеристики для примеров осуществления, соответственно, низкочастотного фильтра и низкополосного режекторного фильтра, как показано на фиг.4d. Фиг.38a, 38b, 39a и 39b показывают частотную и импульсную характеристики для примеров осуществления, соответственно, интерполяции до 14 кГц, интерполяции до 28 кГц, передискретизации до 16 кГц и высокополосного режекторного фильтра, как показано на фиг.4d.
Узкополосный кодер A120 реализован согласно модели входного фильтра, которая кодирует входной речевой сигнал как (A) набор параметров, которые описывают фильтр, и (B) сигнал возбуждения, который приводит в действие описанный фильтр, чтобы сформировать синтезированное воспроизведение входного речевого сигнала. Фиг.5a иллюстрирует пример спектральной огибающей речевого сигнала. Пики, которые характеризуют эту спектральную огибающую, представляют резонансы речевого тракта и называются формантами. Большинство речевых кодеров кодируют, по меньшей мере, эту приблизительную спектральную структуру как набор параметров, таких как коэффициенты фильтра.
Фиг.5b иллюстрирует пример базовой компоновки входного фильтра, применяемой к кодированию спектральной огибающей узкополосного сигнала S20. Анализирующий модуль вычисляет набор параметров, которые характеризуют фильтр, соответствующий речевому звуку, за период времени (типично 20 мс). Отбеливающий фильтр (также называемый анализирующим фильтром или фильтром ошибок предсказания), сконфигурированный согласно этим параметрам фильтра, удаляет спектральную огибающую, чтобы спектрально сгладить сигнал. Результирующий отбеленный сигнал (также называемый остатком) имеет меньше энергии и тем самым меньше дисперсию, и его проще кодировать, чем исходный речевой сигнал. Ошибки, возникающие в результате кодирования остаточного сигнала, также могут быть распределены более равномерно по спектру. Параметры фильтра и остаток в типичном варианте квантуются для эффективной передачи по каналу. В декодере синтезирующий фильтр, сконфигурированный согласно параметрам фильтра, возбуждается посредством сигнала на основе остатка, чтобы сформировать синтезированную версию исходного речевого звука. Синтезирующий фильтр в типичном варианте выполнен с возможностью иметь передаточную функцию, которая является инверсией передаточной функции отбеливающего фильтра.
Фиг.6 иллюстрирует блок-схему базовой реализации A122 узкополосного кодера A120. В этом примере анализирующий модуль 210 кодирования с линейным предсказанием (LPC) кодирует спектральную огибающую узкополосного сигнала S20 как набор коэффициентов линейного предсказания (LP) (к примеру, коэффициентов полюсного фильтра 1/A(z)). Анализирующий модуль в типичном варианте обрабатывает входной сигнал как последовательность неперекрывающихся кадров, при этом новый набор коэффициентов вычисляется для каждого кадра. Период кадра - это, как правило, период в течение которого, как ожидается, сигнал может быть локально стационарным; один общий пример - это 20 миллисекунд (эквивалентно 160 выборкам при частоте дискретизации 8 кГц). В одном примере анализирующий LPC-модуль 210 выполнен с возможностью вычислять набор из десяти коэффициентов LP-фильтра, чтобы охарактеризовать формантную структуру каждого 20-миллисекундного кадра. Также можно реализовать анализирующий модуль так, чтобы обрабатывать входной сигнал как последовательность перекрывающихся кадров.
Анализирующий модуль может быть выполнен с возможностью анализировать выборки каждого кадра непосредственно, либо выборки могут быть сначала взвешены согласно функции кадрирования (например, взвешивающей функции Хэмминга). Анализ также может выполняться для окна, превышающего кадр, например, 30-миллисекундного окна. Это окно может быть симметричным (к примеру, 5-20-5, так что оно включает в себя 5 миллисекунд сразу перед и после 20-миллисекундного кадра) или асимметричным (к примеру, 10-20, так что оно включает в себя последние 10 миллисекунд предыдущего кадра). Анализирующий LPC-модуль в типичном варианте выполнен с возможностью вычислять коэффициенты LP-фильтра с помощью рекурсии Левинсона-Дурбина или алгоритма Леро-Гогена. В другой реализации анализирующий модуль может быть выполнен с возможностью вычислять набор коэффициентов косинусного преобразования Фурье для каждого кадра вместо набора коэффициентов LP-фильтра.
Выходная скорость кодера A120 может быть значительно снижена, с относительно небольшим влиянием на качество воспроизведения, посредством квантования параметров фильтра. Коэффициенты фильтра с линейным предсказанием трудно эффективно квантовать, и обычно они преобразуются к другому представлению, к примеру, парам спектральных линий (LSP) или частотам спектральных линий (LSF) для квантования и/или кодирования по энтропии. В примере по фиг.6, преобразование 220 коэффициентов LP-фильтра в LSF преобразует набор коэффициентов LP-фильтра в соответствующий набор LSF. Другие представления "один-к-одному" коэффициентов LP-фильтра включают в себя коэффициенты паркора; значения отношения логарифмической площади; спектральные пары иммитансов (ISP); и спектральные частоты иммитансов (ISF), которые используются в кодеке AMR-WB (адаптивное многоскоростное широкополосное кодирование) для GSM (глобальная система мобильной связи). Типично преобразование между набором коэффициентов LP-фильтра и соответствующим набором LSF является обратимым, но варианты осуществления также включают в себя реализации кодера A120, в которых преобразование является необратимым без ошибок.
Квантователь 230 выполнен с возможностью квантовать набор узкополосных LSF (или другого представления коэффициентов), а узкополосный кодер A122 выполнен с возможностью выводить результат этого квантования в качестве параметров S40 узкополосного фильтра. Данный квантователь в типичном варианте включает в себя векторный квантователь, который кодирует входной вектор как индекс к соответствующей записи вектора в таблице или таблице кодирования.
Как показано на фиг.6, узкополосный кодер A122 также формирует остаточный сигнал посредством передачи узкополосного сигнала S20 через отбеливающий фильтр 260 (также называемый анализирующим фильтром или фильтром ошибок предсказания), который сконфигурирован согласно набору коэффициентов фильтра. В этом конкретном примере отбеливающий фильтр 260 реализован как FIR-фильтр, хотя также могут быть использованы IIR-реализации. Данный остаточный сигнал в типичном варианте содержит перцепционно важную информацию речевого кадра, такую как долгосрочная структура, связанная с шагом, которая не представлена в параметрах S40 узкополосного фильтра. Квантователь 270 выполнен с возможностью вычислять оцифрованное представление этого остаточного сигнала для вывода в качестве кодированного узкополосного сигнала S50 возбуждения. Данный квантователь в типичном варианте включает в себя векторный квантователь, который кодирует входной вектор как индекс к соответствующей записи вектора в таблице или таблице кодирования. Альтернативно, данный квантователь может быть выполнен с возможностью отправлять один или более параметров, из которых вектор может быть сформирован динамически в декодере, а не извлечен из устройства хранения, как в способе разреженной таблицы кодирования. Этот способ используется в схемах кодирования, таких как алгебраическое CELP (кодирование методом линейного предсказания с кодовым возбуждением), и кодеках, таких как EVRC (усовершенствованный кодек с переменной скоростью) для 3GPP2 (Партнерский проект третьего поколения 2).
Желательно, чтобы узкополосный кодер A120 формировал кодированный узкополосный сигнал возбуждения согласно тем же параметрам фильтра, которые доступны для соответствующего узкополосного декодера. Таким образом, результирующий кодированный узкополосный сигнал возбуждения может уже в некоторой степени учитывать неидеальности в этих значениях параметров, например ошибку квантования. Следовательно, желательно конфигурировать отбеливающий фильтр с использованием тех же значений коэффициентов, что и доступны в кодере. В базовом примере кодера A122, как показано на фиг.6, обратный квантователь 240 деквантует параметры S40 узкополосного кодирования, преобразование 250 LSF в коэффициенты LP-фильтра преобразует результирующие значения обратно к соответствующему набору коэффициентов LP-фильтра, и этот набор коэффициентов используется для того, чтобы конфигурировать отбеливающий фильтр 260, чтобы формировать остаточный сигнал, который квантуется посредством квантователя 270.
Некоторые реализации узкополосного кодера A120 сконфигурированы так, чтобы вычислять кодированный узкополосный сигнал S50 возбуждения посредством идентификации одного из набора векторов таблицы кодирования, который в наибольшей степени совпадает с остаточным сигналом. Тем не менее, следует отметить, что узкополосный кодер A120 также может быть реализован так, чтобы вычислять квантованное представление остаточного сигнала без фактического формирования остаточного сигнала. Например, узкополосный кодер A120 может быть выполнен с возможностью использовать ряд векторов таблицы кодирования, чтобы формировать соответствующие синтезированные сигналы (к примеру, согласно текущему набору параметров фильтра) и выбирать вектор таблицы кодирования, ассоциативно связанный со сформированным сигналом, который в наибольшей степени совпадает с исходным узкополосным сигналом S20 в перцепционно взвешенной области.
Фиг.7 иллюстрирует блок-схему реализации B112 узкополосного декодера B110. Обратный квантователь 310 деквантует параметры S40 узкополосного фильтра (в данном случае, до набора LSF), а преобразование 320 LSF в параметры LP-фильтра преобразует LSF в набор коэффициентов фильтра (например, как описано выше со ссылкой на обратный квантователь 240 и преобразование 250 узкополосного кодера A122). Обратный квантователь 340 деквантует узкополосный остаточный сигнал S40, чтобы сформировать узкополосный сигнал S80 возбуждения. На основе коэффициентов фильтра и узкополосного сигнала S80 возбуждения узкополосный синтезирующий фильтр 330 синтезирует узкополосный сигнал S90. Другими словами, узкополосный синтезирующий фильтр 330 выполнен с возможностью спектрально формировать узкополосный сигнал S80 возбуждения согласно деквантованным коэффициентам фильтра, чтобы сформировать узкополосный сигнал S90. Узкополосный декодер B112 также предоставляет узкополосный сигнал S80 возбуждения в высокополосный кодер A200, который использует его для того, чтобы извлекать высокополосный сигнал S120 возбуждения, как описано в данном документе. В некоторых реализациях, описанных ниже, узкополосный декодер B110 может быть выполнен с возможностью предоставлять дополнительную информацию в высокополосный декодер B200, которая связана с узкополосным сигналом, такую как наклон спектра, усиление и запаздывание основного тона и режим речи.
Система узкополосного кодера A122 и узкополосного декодера B112 является базовым примером речевого кодера анализа посредством синтеза. Кодирование методом линейного предсказания с кодовым возбуждением (CELP) является одним популярным семейством кодирования на основе анализа посредством синтеза, и реализации таких кодеров могут выполнять кодирование формы сигнала остатка, в том числе такие операции, как выбор записей из фиксированных и адаптивных таблиц кодирования, операции минимизации ошибок и/или операции перцепционного взвешивания. Другие реализации кодирования на основе анализа посредством синтеза включают в себя кодирование методом линейного предсказания со смешанным возбуждением (MELP), алгебраического CELP (ACELP), релаксационного CELP (RCELP), регулярного возбуждения импульсами (RPE), многоимпульсного CELP (MPE) и линейного предсказания с возбуждением векторной суммой (VSELP). Связанные способы кодирования включают в себя кодирование с многополосным возбуждением (MBE) и интерполяцией прототипа формы сигнала (PWI). Примеры стандартизированных речевых кодеков на основе анализа посредством синтеза включают в себя полноскоростной GSM-кодек ETSI-GSM (Европейский институт телекоммуникационных стандартов) (GSM 06.10), который использует линейное предсказание с остаточным возбуждением (RELP); улучшенный полноскоростной GSM-кодек (ETSI-GSM 06.60); кодер по стандарту ITU (Международный союз телекоммуникаций) 11,8 кбит/с G.729 Приложение E; кодеки IS (Interim Standard)-641 для IS-136 (схема множественного доступа с временным разделением каналов); адаптивные многоскоростные GSM-кодеки (GSM-AMR); и кодек 4GV™ (вокодер четвертого поколения) (QUALCOMM Incorporated, San Diego, CA). Узкополосный кодер A120 и соответствующий декодер B110 могут быть реализованы согласно одной из этих методологий либо любой другой технологии речевого кодирования (известной или находящейся в разработке), которая представляет речевой сигнал как (A) набор параметров, которые описывают фильтр, и (B) сигнал возбуждения, используемый для того, чтобы приводить в действие описанный фильтр, чтобы воспроизвести речевой сигнал.
Даже после того, как отбеливающий фильтр удалил приблизительную спектральную огибающую из узкополосного сигнала S20, значительная часть тонкой гармонической структуры может оставаться, особенно для вокализованной речи. Фиг.8a иллюстрирует спектральный график одного примера остаточного сигнала, который может быть сформирован посредством отбеливающего фильтра, для речевого сигнала, к примеру гласных звуков. Периодическая структура, показанная в этом примере, связана с основным тоном, и различные вокализованные звуки, произносимые одним и тем же говорящим, могут иметь различные формантные структуры, но похожие структуры основного тона. Фиг.8b иллюстрирует график временной области примера такого остаточного сигнала, который показывает последовательность импульсов основного тона во времени.
Эффективность кодирования и/или качество речи может быть повышено посредством использования одного или более значений параметров для того, чтобы кодировать характеристики структуры основного тона. Одной важной характеристикой структуры основного тона является эффективность первой гармоники (также называемой собственной частотой), которая в типичном варианте находится в диапазоне 60-400 Гц. Эта характеристика в типичном варианте кодируется как инверсия собственной частоты, также называемая запаздыванием основного тона. Запаздывание основного тона указывает число выборок в одном периоде основного тона и может кодироваться как один или более индексов таблицы кодирования. Речевые сигналы от мужчин зачастую имеют большее запаздывание основного тона, чем речевые сигналы от женщин.
Другой характеристикой сигнала, связанной со структурой основного тона, является периодичность, которая указывает интенсивность гармонической структуры или, другими словами, степень, в которой сигнал является гармоническим или негармоническим. Двумя типичными индикаторами периодичности являются переходы через нуль и функции нормализованной автокорреляции (NACF). Периодичность также может показываться посредством усиления основного тона, которое, как правило, кодируется как усиление таблицы кодирования (к примеру, усиление квантованной адаптивной таблицы кодирования).
Узкополосный кодер A120 может включать в себя один или более модулей, сконфигурированных так, чтобы кодировать долгосрочную гармоническую структуру узкополосного сигнала S20. Как показано на фиг.9, одна типичная парадигма CELP, которая может быть использована, включает в себя анализирующий LPC-модуль с разомкнутым контуром, который кодирует краткосрочную характеристику или приблизительную спектральную огибающую, после чего следует анализирующая стадия долгосрочного предсказания с замкнутым контуром, которая кодирует точный основной тон или гармоническую структуру. Краткосрочные характеристики кодируются как коэффициенты фильтра, а долгосрочные характеристики кодируются как значения параметров, например запаздывание основного тона и усиление основного тона. Например, узкополосный кодер A120 может быть выполнен с возможностью выводить кодированный узкополосный сигнал S50 возбуждения в форме, которая включает в себя один или более индексов таблицы кодирования (к примеру, индекс фиксированной таблицы кодирования или индекс адаптивной таблицы кодирования) и соответствующие значения усиления. Вычисление этого квантованного представления узкополосного остаточного сигнала (к примеру, посредством квантователя 270) может включать в себя выбор таких индексов и вычисление таких значений. Кодирование структуры основного тона также может включать в себя интерполяцию формы сигнала прототипа основного тона, причем эта операция может включать в себя вычисление разности между последовательными импульсами основного тона. Моделирование долгосрочной структуры может быть отключено для кадров, соответствующих невокализованной речи, которые в типичном варианте являются шумоподобными и неструктурированными.
Реализация узкополосного декодера B110 согласно парадигме, проиллюстрированной на фиг.9, может быть сконфигурирована так, чтобы выводить узкополосный сигнал S80 возбуждения в высокополосный декодер B200 после того, как долгосрочная структура (основной тон или гармоническая структура) восстановлена. Например, этот декодер может быть выполнен с возможностью выводить узкополосный сигнал S80 возбуждения в качестве деквантованной версии кодированного узкополосного сигнала S50 возбуждения. Разумеется, также можно реализовать узкополосный декодер B110, так что высокополосный декодер B200 выполняет деквантование кодированного узкополосного сигнала S50 возбуждения, чтобы получить узкополосный сигнал возбуждения S80.
В реализации широкополосного речевого кодера A100 согласно парадигме, показанной на фиг.9, высокополосный кодер A200 может быть выполнен с возможностью принимать узкополосный сигнал возбуждения, формируемый посредством краткосрочного анализирующего или отбеливающего фильтра. Другими словами, узкополосный кодер A120 может быть выполнен с возможностью выводить узкополосный сигнал возбуждения в высокополосный кодер A200 до кодирования долгосрочной структуры. Тем не менее, желательно для высокополосного кодера A200 принимать из узкополосного канала такую же информацию кодирования, которая принимается посредством высокополосного декодера B200, с тем чтобы параметры кодирования, формируемые посредством высокополосного кодера A200, могли уже в некоторой степени учитывать неидеальности в этой информации. Таким образом, может быть предпочтительным для высокополосного кодера A200 восстанавливать узкополосный сигнал S80 возбуждения из такого же параметризованного и/или квантованного кодированного узкополосного сигнала S50 возбуждения, который должен быть выведен посредством широкополосного речевого кодера A100. Одно потенциальное преимущество этого подхода заключается в более точном вычислении коэффициентов S60b высокополосного усиления, описанных ниже.
Помимо параметров, которые характеризуют краткосрочную и/или долгосрочную структуру узкополосного сигнала S20, узкополосный кодер A120 может формировать значения параметров, которые связаны с другими характеристиками узкополосного сигнала S20. Эти значения, которые могут быть надлежащим образом квантованы для вывода посредством широкополосного речевого кодера A100, могут быть включены в параметры S40 узкополосного фильтра или выведены отдельно. Высокополосный кодер A200 также может быть выполнен с возможностью вычислять параметры S60 высокополосного кодирования согласно одному или более этих дополнительных параметров (к примеру, после деквантования). В широкополосном речевом кодере B100 высокополосный декодер B200 может быть выполнен с возможностью принимать значения параметров посредством узкополосного кодера B110 (к примеру, после деквантования). Альтернативно, высокополосный кодер B200 может быть выполнен с возможностью принимать (и, возможно, деквантовать) значения параметров непосредственно.
В одном примере дополнительных параметров узкополосного кодирования, узкополосный кодер A120 формирует значения для параметров наклона спектра и речевого режима для каждого кадра. Наклон спектра связан с формой спектральной огибающей в полосе пропускания и в типичном варианте представляется посредством квантованного первого коэффициента отражения. Для большинства вокализованных звуков спектральная энергия снижается с увеличением частоты, так что первый коэффициент отражения является отрицательным и может достигать -1. Большинство невокализованных звуков имеют спектр, который либо плоский, так что первый коэффициент отражения близок к нулю, либо имеет больше энергии при высоких частотах, так что первый коэффициент отражения является положительным и может достигать +1.
Речевой режим (также называемый голосовым режимом) указывает то, представляет текущий кадр вокализованную или невокализованную речь. Этот параметр может иметь двоичное значение на основе одного или двух показателей периодичности (к примеру, переходов через нуль, NACF, усиления основного тона) и/или активности речи для кадра, например, отношения между таким показателем и пороговым значением. В других реализациях параметр речевого режима имеет одно или более состояний, чтобы указывать такие режимы, как молчание или фоновый шум либо переход между молчанием и вокализованной речью.
Высокополосный кодер A200 выполнен с возможностью кодировать высокополосный сигнал S30 согласно модели входного фильтра, при этом возбуждение для этого фильтра основано на кодированном узкополосном сигнале возбуждения. Фиг.10 иллюстрирует блок-схему реализации A202 высокополосного кодера A200, который выполнен с возможностью формировать поток параметров S60 высокополосного кодирования, в том числе параметров S60a высокополосного фильтра и коэффициентов S60b высокополосного усиления. Высокополосный A300 генератор возбуждения извлекает высокополосный сигнал S120 возбуждения из кодированного узкополосного сигнала S50 возбуждения. Анализирующий модуль A210 формирует набор значений параметров, которые характеризуют спектральную огибающую высокополосного сигнала S30. В данном конкретном примере анализирующий модуль A210 выполнен с возможностью выполнять LPC-анализ, чтобы формировать набор коэффициентов LP-фильтра для каждого кадра высокополосного сигнала S30. Преобразование 410 коэффициентов фильтра с линейным предсказанием в LSF преобразует набор коэффициентов LP-фильтра в соответствующий набор LSF. Как указано выше со ссылкой на анализирующий модуль 210 и преобразование 220, анализирующий модуль A210 и/или преобразование 410 могут быть сконфигурированы так, чтобы использовать другие наборы коэффициентов (к примеру, коэффициентов косинусного преобразования Фурье) и/или представления коэффициентов (к примеру, ISP).
Квантователь 420 выполнен с возможностью квантовать набор высокополосных LSF (или другого представления коэффициентов, например, ISP), а высокополосный кодер A102 выполнен с возможностью выводить результат этого квантования в качестве параметров S60a высокополосного фильтра. Данный квантователь в типичном варианте включает в себя векторный квантователь, который кодирует входной вектор как индекс к соответствующей записи вектора в таблице или таблице кодирования.
Высокополосный кодер A202 также включает в себя синтезирующий фильтр A220, выполненный с возможностью формировать синтезированный высокополосный сигнал S130 согласно высокополосному сигналу S120 возбуждения и кодированной спектральной огибающей (к примеру, набор коэффициентов LP-фильтра), сформированной посредством анализирующего модуля A210. Синтезирующий фильтр A220 в типичном варианте реализован как IIR-фильтр, хотя также могут быть использованы FIR-реализации. В конкретном примере синтезирующий фильтр A220 реализован как линейный авторегрессивый фильтр шестого порядка.
Вычислитель A230 коэффициентов высокополосного усиления вычисляет одну или более разностей между уровнями исходного высокополосного сигнала S30 и синтезированного высокополосного сигнала S130, чтобы задавать огибающую усиления для кадра. Квантователь 430, который может быть реализован как векторный квантователь, который кодирует входной вектор в качестве индекса в соответствующую запись вектора в таблице или таблице кодирования, квантует значение или значения, задающие огибающую усиления, а высокополосный кодер A202 выполнен с возможностью выводить результат этого квантования в качестве коэффициентов S60b высокополосного усиления.
В реализации, показанной на фиг.10, синтезирующий фильтр A220 выполнен с возможностью принимать коэффициенты фильтра из анализирующего модуля A210. Альтернативная реализация высокополосного кодера A202 включает в себя обратный квантователь и обратное преобразование, сконфигурированное так, чтобы декодировать коэффициенты фильтра из параметров S60a высокополосного фильтра, и в этом случае синтезирующий фильтр A220 выполнен с возможностью принимать вместо этого декодированные коэффициенты фильтра. Такая альтернативная компоновка может поддерживать более точное вычисление огибающей усиления посредством вычислителя A230 высокополосного усиления.
В одном конкретном примере анализирующий модуль A210 и вычислитель A230 высокополосного усиления выводят набор из шести LSF и набор из пяти значений усиления на кадр, соответственно, с тем чтобы широкополосное расширение узкополосного сигнала S20 могло осуществляться только с помощью одиннадцати дополнительных значений на кадр. Слух зачастую менее чувствителен к погрешностям частоты при высоких частотах, так что высокополосное кодирование при LPC низкого порядка может формировать сигнал, имеющий сравнимое перцепционное качество с узкополосным кодированием при LPC более высокого порядка. Типичная реализация высокополосного кодера A200 может быть сконфигурирована так, чтобы выводить 8-12 битов на кадр для высококачественного восстановления спектральной огибающей и еще 8-12 битов на кадр для высококачественного воспроизведения временной огибающей. В другом конкретном примере анализирующий модуль A210 выводит набор из LSF на кадр.
Некоторые реализации высокополосного кодера A200 сконфигурированы так, чтобы формировать высокополосный сигнал S120 возбуждения посредством формирования сигнала случайного шума, имеющего высокополосные частотные компоненты, и амплитудной модуляции сигнала шума согласно огибающей временной области узкополосного сигнала S20, узкополосного сигнала S80 возбуждения или высокополосного сигнала S30. Хотя этот основанный на шуме способ может формировать достаточные результаты для невокализованных звуков, тем не менее, он может не подходить для вокализованных звуков, остатки которых обычно гармонические и, следовательно, имеют некоторую периодическую структуру.
Высокополосный A300 генератор возбуждения выполнен с возможностью формировать высокополосный сигнал S120 возбуждения посредством продления спектра узкополосного сигнала S80 возбуждения до высокополосного частотного диапазона. Фиг. 11 иллюстрирует блок-схему реализации A302 высокополосного генератора A300 возбуждения. Обратный квантователь 450 выполнен с возможностью деквантовать кодированный узкополосный сигнал S50 возбуждения, чтобы формировать узкополосный сигнал S80 возбуждения. Расширитель A400 спектра выполнен с возможностью формировать гармонически расширенный сигнал S160 на основе узкополосного сигнала S80 возбуждения. Объединитель 470 выполнен с возможностью комбинировать сигнал случайного шума, формируемый посредством генератора 480 шума, и огибающую временной области, вычисленную посредством вычислителя 460 огибающий, чтобы сформировать модулированный сигнал S170 шума. Объединитель 490 выполнен с возможностью смешивать гармонически расширенный сигнал S60 и модулированный сигнал S170 шума, чтобы сформировать высокополосный сигнал S120 возбуждения.
В одном примере расширитель A400 спектра выполнен с возможностью выполнять операцию спектрального наложения (также называемого зеркалированием) для узкополосного сигнала S80 возбуждения, чтобы формировать гармонически расширенный сигнал S160. Спектральное наложение может выполняться посредством дополнения нулями сигнала S80 возбуждения и последующего применения высокочастотного фильтра, чтобы сохранить побочную низкочастотную составляющую. В другом примере расширитель A400 спектра выполнен с возможностью формировать гармонически расширенный сигнал S160 посредством спектрального преобразования узкополосного сигнала S80 возбуждения в высокополосный (к примеру, посредством повышающей дискретизации и последующего умножения с косинусоидальным сигналом постоянной частоты).
Способы спектрального наложения и преобразования могут формировать спектрально расширенные сигналы, гармоническая структура которых является непрерывной с исходной гармонической структурой узкополосного сигнала S80 возбуждения по фазе и/или частоте. Например, эти способы могут формировать сигналы, имеющие пики, которые, как правило, не являются кратными собственной частоте, что может вызывать помехи резких звуков в восстановленном речевом сигнале. Эти способы также зачастую формируют высокочастотные гармоники, которые имеют неестественно сильные тональные характеристики. Кроме того, поскольку PSTN-сигнал может дискретизироваться при 8 кГц, но ограничен по полосе пропускания не более чем 3400 Гц, верхний спектр узкополосного сигнала S80 возбуждения может содержать мало или вообще не содержать энергии, так что расширенный сигнал, сформированный согласно операции спектрального наложения или спектрального преобразования, может иметь спектральный провал выше 3400 Гц.
Другие способы формирования гармонически расширенного сигнала S160 включают в себя идентификацию одной или более собственных частот узкополосного сигнала S80 возбуждения и формирование гармонических тонов согласно этой информации. Например, гармоническая структура сигнала возбуждения может характеризоваться посредством собственной частоты наряду с информацией по амплитуде и фазе. Другая реализация высокополосного генератора A300 возбуждения формирует гармонически расширенный сигнал S160 на основе собственной частоты и амплитуды (как указано, к примеру, посредством запаздывания основного тона и усиления основного тона). Тем не менее, кроме случаев, когда гармонически расширенный сигнал является фазово-когерентным с узкополосным сигналом S80 возбуждения, качество результирующей декодированной речи может быть неприемлемым.
Нелинейная функция может быть использована для того, чтобы создать высокополосный сигнал возбуждения, который является фазово-когерентным с узкополосным возбуждением и сохраняет гармоническую структуру без скачка фазы. Нелинейная функция также может предоставлять повышенный уровень шума между высокочастотными гармониками, которые зачастую звучат более естественно, чем тональные высокочастотные гармоники, формируемые посредством таких способов, как спектральное наложение и спектральное преобразование. Типичные нелинейные функции без запоминания, которые могут быть применены посредством различных реализаций расширителя A400 спектра, включают в себя функцию абсолютных значений (также называемую полнопериодным выпрямлением), полупериодное выпрямление, возведение в квадрат, возведение в куб и отсечение. Другие реализации расширителя A400 спектра могут быть сконфигурированы так, чтобы применять нелинейную функцию с запоминанием.
Фиг.12 - это блок-схема реализации A402 расширителя A400 спектра, который выполнен с возможностью применять нелинейную функцию для того, чтобы расширить узкополосный сигнал S80 возбуждения. Повышающий дискретизатор 510 выполнен с возможностью выполнять повышающую дискретизацию узкополосного сигнала S80 возбуждения. Может быть желательным провести повышающую дискретизацию сигнал в достаточной степени для того, чтобы минимизировать наложение спектров при применении нелинейной функции. В одном конкретном примере повышающий дискретизатор 510 выполняет повышающую дискретизацию сигнала на коэффициент 8. Повышающий дискретизатор 510 может быть выполнен с возможностью выполнять операцию повышающей дискретизации посредством заполнения нулями входного сигнала и низкочастотной фильтрации результата. Вычислитель 520 нелинейных функций выполнен с возможностью применять нелинейную функцию к сигналу с повышенной дискретизацией. Одно потенциальное преимущество функции абсолютных значений над другими нелинейными функциями для спектрального расширения, такими как возведение в квадрат, состоит в том, что не требуется нормализация энергии. В некоторых реализациях функция абсолютных значений может быть эффективно применена посредством отсечения или очистки знакового бита для каждой выборки. Вычислитель 520 нелинейных функций также может быть выполнен с возможностью выполнять амплитудное деформирование сигнала с повышенной дискретизацией или расширенным спектром.
Понижающий дискретизатор 530 выполнен с возможностью выполнять понижающую дискретизацию спектрально расширенного результата применения нелинейной функции. Может быть желательным для понижающего дискретизатора 530 выполнить операцию полосовой фильтрации, чтобы выбрать требуемую полосу частот спектрально расширенного сигнала до понижения частоты дискретизации (например, чтобы уменьшить или устранить наложение спектров или повреждение посредством зеркальной боковой полосы частот). Также может быть желательным для понижающего дискретизатора 530 снижать частоту дискретизации за несколько стадий.
Фиг.12a - это схема, которая иллюстрирует спектр сигнала в различных точках в одном примере операции спектрального расширения, при этом шкала частоты одинаковая для всех графиков. График (a) иллюстрирует спектр одного примера узкополосного сигнала S80 возбуждения. График (b) иллюстрирует спектр после того, как над сигналом S80 выполнена повышающая дискретизация с коэффициентом 8. График (c) иллюстрирует пример расширенного спектра после применения нелинейной функции. График (d) иллюстрирует спектр после низкочастотной фильтрации. В этом примере полоса пропускания идет до верхнего частотного предела высокополосного сигнала S30 (к примеру, 7 кГц или 8 кГц).
График (e) иллюстрирует спектр после первой стадии понижающей дискретизации, при которой частота дискретизации снижается на коэффициент 2 или 4, чтобы получить широкополосный сигнал. График (f) иллюстрирует спектр после операции высокочастотной фильтрации, чтобы выбрать высокочастотную часть расширенного сигнала, а график (g) иллюстрирует спектр после второй стадии понижающей дискретизации, на которой частота дискретизации снижается на коэффициент 2. В одном конкретном примере понижающий дискретизатор 530 выполняет высокочастотную фильтрацию и вторую стадию понижающей дискретизации посредством передачи широкополосного сигнала через высокочастотный фильтр 130 и понижающий дискретизатор 140 гребенки A112 фильтров (или другие структуры, или процедуры, имеющие такую же характеристику), чтобы сформировать спектрально расширенный сигнал, имеющий частотный диапазон и частоту дискретизации высокополосного сигнала S30.
Как можно видеть на графике (g), понижающая дискретизация высокочастотного сигнала, показанного на графике (f), вызывает обращение спектра. В этом примере понижающий дискретизатор 530 также выполнен с возможностью выполнять операцию спектрального обращения для сигнала. График (h) иллюстрирует результат применения операции спектрального обращения, которая может быть выполнена посредством умножения сигнала на функцию e
jnπ или последовательность (-1)n, значения которой чередуются между +1 и -1. Эта операция эквивалентна сдвигу цифрового спектра сигнала в частотной области на интервал π. Следует отметить, что такой же результат также может быть получен посредством применения операций понижающей дискретизации и спектрального обращения в другом порядке. Операции повышающей дискретизации и/или понижающей дискретизации также могут быть сконфигурированы так, чтобы включать в себя повторную дискретизацию, чтобы получить спектрально расширенный сигнал, имеющий частоту дискретизации высокополосного сигнала S30 (к примеру, 7 кГц).
Как указано выше, гребенки A110 и B120 фильтров могут быть реализованы, так чтобы один или оба из узкополосного и широкополосного сигнала S20, S30 имели спектрально обращенную форму на выходе гребенки A110 фильтров, кодировались и декодировались в спектрально обращенной форме и повторно спектрально обращались в гребенке B120 фильтров до вывода в широкополосном речевом сигнале S110. В этом случае, разумеется, операция спектрального обращения, проиллюстрированная на фиг. 12a, необязательна, поскольку желательно для высокополосного сигнала S120 возбуждения также иметь спектрально обращенную форму.
Различные задачи повышающей дискретизации и понижающей дискретизации операции спектрального расширения, выполняемой посредством расширителя A402 спектра, могут быть сконфигурированы и скомпонованы множеством различных способов. Например, фиг. 12b - это схема, которая иллюстрирует спектр сигнала в различных точках в одном примере операции спектрального расширения, при этом шкала частоты одинаковая для всех графиков. График (a) иллюстрирует спектр одного примера узкополосного сигнала S80 возбуждения. График (b) иллюстрирует спектр после того, как над сигналом S80 выполнена повышающая дискретизация с коэффициентом 2. График (c) иллюстрирует пример расширенного спектра после применения нелинейной функции. В этом случае наложение спектров, которое может возникать при более высоких частотах, допускается.
График (d) иллюстрирует спектр после операции спектрального обращения. График (e) иллюстрирует спектр после одной стадии понижающей дискретизации, при которой частота дискретизации снижается на коэффициент 2, чтобы получить требуемый спектрально расширенный сигнал. В этом примере сигнал находится в спектрально обращенной форме и может быть использован в реализации высокополосного кодера A200, который обработал высокополосный сигнал S30 в этой форме.
Спектрально расширенный сигнал, сформированный посредством вычислителя 520 нелинейных функций, с большой долей вероятности имеет заметное падение амплитуды по мере того, как частота возрастает. Расширитель A402 спектра включает в себя блок 540 сглаживания спектра, выполненный с возможностью выполнять операцию отбеливания для сигнала с пониженной дискретизацией. Блок 540 сглаживания спектра может быть выполнен с возможностью выполнять фиксированную операцию отбеливания или выполнять адаптивную операцию отбеливания. В конкретном примере адаптивного отбеливания блок 540 сглаживания спектра включает в себя анализирующий LPC-модуль, выполненный с возможностью вычислять набор из четырех коэффициентов фильтра из сигнала с пониженной дискретизацией, и анализирующий модуль четвертого порядка, выполненный с возможностью отбеливать сигнал согласно этим коэффициентам. Другие реализации расширителя A400 спектра включают в себя конфигурации, в которых блок 540 сглаживания спектра управляет спектрально расширенным сигналом до понижающего дискретизатора 530.
Высокополосный генератор A300 возбуждения может быть реализован так, чтобы выводить гармонически расширенный сигнал S160 в качестве высокополосного сигнала S120 возбуждения. Тем не менее, в некоторых случаях использование только гармонически расширенного сигнала в качестве высокополосного возбуждения может приводить к слышимым помехам. Гармоническая структура речи, как правило, менее резко выражена в полосе высоких частот, чем в полосе низких частот, и чрезмерное использование гармонической структуры в высокополосном сигнале возбуждения может приводить к зашумленному звуку. Эта помеха может быть особенно заметной в речевых сигналах от женщин.
Варианты осуществления включают в себя реализации высокополосного генератора A300 возбуждения, которые сконфигурированы так, чтобы смешивать гармонически расширенный сигнал S160 с сигналом шума. Как проиллюстрировано на фиг.11, высокополосный генератор A302 возбуждения включает в себя генератор 480 шума, который выполнен с возможностью формировать сигнал случайного шума. В одном примере генератор 480 шума выполнен с возможностью формировать сигнал белого псевдослучайного шума с единичной дисперсией, хотя в других вариантах осуществления сигнал шума необязательно должен быть белым и может иметь плотность мощности, которая варьируется с частотой. Может быть желательным для генератора 480 шума быть сконфигурированным так, чтобы выводить сигнал шума как детерминированную функцию, с тем чтобы его состояние могло дублироваться в декодере. Например, генератор 480 шума может быть выполнен с возможностью выводить сигнал шума как детерминированную функцию информации, закодированной ранее в рамках того же кадра, к примеру, параметров S40 узкополосного фильтра и/или кодированного узкополосного сигнала S50 возбуждения.
До смешения с гармонически расширенным сигналом S160 сигнал случайного шума, формируемый посредством генератора 480 шума, может амплитудно модулироваться, чтобы иметь огибающую временной области, которая аппроксимирует распределение во времени энергии узкополосного сигнала S20, высокополосного сигнала S30, узкополосного сигнала S80 возбуждения или гармонически расширенного сигнала S160. Как проиллюстрировано на фиг. 11, высокополосный генератор A302 возбуждения включает в себя объединитель 470, выполненный с возможностью выполнять амплитудную модуляцию сигнала шума, сформированного посредством генератора 480 шума, согласно огибающей временной области, вычисленной посредством вычислителя 460 огибающей. Например, объединитель 470 может быть реализован как умножитель, выполненный с возможностью масштабировать вывод генератора 480 шума согласно огибающей временной области, вычисленной посредством вычислителя 460 огибающей, чтобы сформировать модулированный сигнал S170 шума.
В реализации A304 высокополосного генератора A302 возбуждения, как показано на блок-схеме по фиг.13, вычислитель 460 огибающей выполнен с возможностью вычислять огибающую гармонически расширенного сигнала S160. В реализации A306 высокополосного генератора A302 возбуждения, как показано на блок-схеме по фиг.14, вычислитель 460 огибающей выполнен с возможностью вычислять огибающую узкополосного сигнала S80 возбуждения. Дополнительные реализации высокополосного генератора A302 возбуждения могут быть сконфигурированы иным образом, чтобы добавлять шум в гармонически расширенный сигнал S160 согласно позициям узкополосных импульсов основного тона во времени.
Вычислитель 460 огибающей может быть выполнен с возможностью выполнять вычисление огибающей в качестве задачи, которая имеет последовательность подзадач. Фиг.15 иллюстрирует блок-схему последовательности операций примера T100 такой задачи. Подзадача T110 вычисляет квадрат каждой выборки в кадре сигнала, огибающая которого должна быть смоделирована (например, узкополосного сигнала S80 возбуждения или гармонически расширенного сигнала S160), чтобы сформировать последовательность возведенных в квадрат значений. Подзадача T120 выполняет операцию сглаживания над последовательностью возведенных в квадрат значений. В одном примере подзадача T120 применяет низкочастотный IIR-фильтр первого порядка к последовательности согласно выражению:
y(n)=ax(n)+(1-a)y(n-1), | (1) |
где x - это входной сигнал фильтра, y - это выходной сигнал фильтра, n - это индекс временной области, а a - это коэффициент сглаживания, имеющий значение между 0,5 и 1. Значение коэффициента сглаживания a может быть фиксированным либо, в альтернативной реализации, может быть адаптивным согласно индикации шума во входном сигнале, так чтобы a было ближе к 1 при отсутствии шума и ближе к 0,5 при наличии шума. Подзадача T130 применяет функцию квадратного корня к каждой выборке сглаженной последовательности, чтобы сформировать огибающую временной области.
Эта реализация вычислителя 460 огибающей может быть сконфигурирована так, чтобы выполнять различные подзадачи задачи T100 последовательно и/или параллельно. В дополнительных реализациях задачи T100 подзадача T110 может предваряться операцией полосы пропускания, сконфигурированной так, чтобы выбирать требуемую часть частоты сигнала, огибающая которого должна быть смоделирована, к примеру, в диапазоне 3-4 кГц.
Объединитель 490 выполнен с возможностью смешивать гармонически расширенный сигнал S160 и модулированный сигнал S170 шума, чтобы сформировать высокополосный сигнал S120 возбуждения. Реализации объединителя 490 могут быть сконфигурированы, например, так, чтобы вычислять высокополосный сигнал S120 возбуждения как сумму гармонически расширенного сигнала S160 и модулированного сигнала S170 шума. Такая реализация объединителя 490 может быть сконфигурирована так, чтобы вычислять высокополосный сигнал S120 возбуждения как взвешенную сумму посредством применения весового коэффициента к гармонически расширенному сигналу S160 и/или модулированному сигналу S170 шума до суммирования. Каждый подобный весовой коэффициент может быть вычислен согласно одному или более критериев и может быть фиксированным значением либо, альтернативно, может быть адаптивным значением, которое вычисляется на основе кадр-за-кадром или субкадр-за-субкадром.
Фиг.16 иллюстрирует блок-схему реализации 492 объединителя 490, который выполнен с возможностью вычислять высокополосный сигнал S120 возбуждения как взвешенную сумму гармонически расширенного сигнала S160 и модулированного сигнала S170 шума. Объединитель 492 выполнен с возможностью взвешивать гармонически расширенный сигнал S160 согласно весовому коэффициенту S180 гармоник, чтобы взвешивать модулированный сигнал S170 шума согласно весовому коэффициенту S190 шума и выводить высокополосный сигнал S120 возбуждения как сумму взвешенных сигналов. В этом примере объединитель 492 включает в себя вычислитель 550 весовых коэффициентов, который выполнен с возможностью вычислять весовой коэффициент S180 гармоник и весовой коэффициент 190 шума.
Вычислитель 550 весовых коэффициентов может быть выполнен с возможностью вычислять весовые коэффициенты S180 и S190 согласно требуемому соотношению уровня гармоник к уровню шума в высокополосном сигнале S120 возбуждения. Например, может быть желательным для объединителя 492 формировать высокополосный сигнал S120 возбуждения так, чтобы иметь соотношение энергии гармоник к энергии шума аналогичным этому соотношению высокополосного сигнала S30. В некоторых реализациях вычислителя 550 весовых коэффициентов, весовые коэффициенты S180, S190 вычисляются согласно одному или более параметров, относящихся к периодичности узкополосного сигнала S20 или узкополосного остаточного сигнала, например усиление основного тона и/или речевой режим. Такая реализация вычислителя 550 весовых коэффициентов может быть сконфигурирована так, чтобы назначать значение весовому коэффициенту S180 гармоник, которое пропорционально усилению основного тона, например, и/или назначать более высокое значение весовому коэффициенту S190 шума для сигналов невокализованной речи, чем для сигналов вокализованной речи.
В других реализациях вычислитель 550 весовых коэффициентов выполнен с возможностью вычислять значения весового коэффициента S180 гармоник и/или весового коэффициента S190 шума согласно показателю периодичности высокополосного сигнала S30. В одном таком примере вычислитель 550 весовых коэффициентов вычисляет весовой коэффициент S180 гармоник как максимальное значение коэффициента автокорреляции высокополосного сигнала S30 для текущего кадра или субкадра, где автокорреляция выполняется для диапазона поиска, который включает в себя задержку в одно запаздывание основного тона и не включает в себя задержку в нулевые выборки. Фиг.17 иллюстрирует пример такого диапазона поиска длиной n выборок, который центрирован вокруг задержки в одно запаздывание основного тона и имеет ширину не больше одного запаздывания основного тона.
Фиг.17 также иллюстрирует пример другого подхода, в котором вычислитель 550 весовых коэффициентов вычисляет показатель периодичности высокополосного сигнала S30 за несколько стадий. На первой стадии текущий кадр делится на ряд субкадров, и задержка, для которой коэффициент автокорреляции является максимальным, идентифицируется отдельно для каждого субкадра. Как упоминалось выше, автокорреляция выполняется для диапазона поиска, который включает в себя задержку в одно запаздывание основного тона и не включает в себя задержку в нулевые выборки.
На второй стадии задержанный кадр составляется посредством применения соответствующей идентифицированной задержки к каждому субкадру, конкатенации результирующих субкадров, чтобы составить оптимально задержанный кадр, и вычисления весового коэффициента S180 гармоник в качестве коэффициента корреляции между исходным кадром и оптимально задержанным кадром. В дополнительной альтернативе вычислитель 550 весовых коэффициентов вычисляет весовой коэффициент S180 гармоник как среднее максимальных коэффициентов автокорреляции, полученное на первой стадии для каждого субкадра. Реализации вычислителя 550 весовых коэффициентов также могут быть сконфигурированы так, чтобы масштабировать коэффициент корреляции и/или объединять его с другим значением, чтобы вычислять значение весового коэффициента S180 гармоник.
Может быть желательным для вычислителя 550 весовых коэффициентов вычислять показатель периодичности высокополосного сигнала S30 только в случаях, когда наличие периодичности в кадре указано иным образом. Например, вычислитель 550 весовых коэффициентов может быть выполнен с возможностью вычислять показатель периодичности высокополосного сигнала S30 согласно отношению между другим индикатором периодичности текущего кадра, к примеру, усилением основного тона, и пороговым значением. В одном примере вычислитель 550 весовых коэффициентов выполнен с возможностью выполнять операцию автокорреляции для высокополосного сигнала S30, только если усиление основного тона кадра (к примеру, усиление адаптивной таблицы кодирования узкополосного остатка) имеет значение более 0,5 (альтернативно, по меньшей мере, 0,5). В другом примере вычислитель 550 весовых коэффициентов выполнен с возможностью выполнять операцию автокорреляции для высокополосного сигнала S30 только для кадров, имеющих конкретные состояния речевого режима (к примеру, только для вокализованных сигналов). В этих случаях вычислитель 550 весовых коэффициентов может быть выполнен с возможностью назначать весовой коэффициент по умолчанию для кадров, имеющих другие состояния речевого режима и/или меньшие значения усиления основного тона.
Варианты осуществления включают в себя дополнительные реализации вычислителя 550 весовых коэффициентов, которые сконфигурированы так, чтобы вычислять весовые коэффициенты согласно характеристикам, отличным или в добавление к периодичности. Например, эта реализация может быть сконфигурирована так, чтобы назначать более высокое значение коэффициенту S190 усиления шума для речевых сигналов, имеющих большое запаздывание основного тона, чем для речевых сигналов, имеющих небольшое запаздывание основного тона. Другая такая реализация вычислителя 550 весовых коэффициентов сконфигурирована так, чтобы определять показатель гармоничности широкополосного речевого сигнала S10 или высокополосного сигнала S30 согласно показателю энергии сигнала в кратных значениях собственной частоты относительно энергии сигнала в других частотных компонентах.
Некоторые реализации широкополосного речевого кодера A100 сконфигурированы так, чтобы выводить индикацию периодичности или гармоничности (к примеру, однобитовый признак, указывающий то, является кадр гармоническим или негармоническим), на основе усиления основного тона и/или другого показателя периодичности или гармоничности, описанного в данном документе. В одном примере соответствующий широкополосный речевой декодер B100 использует эту индикацию для того, чтобы конфигурировать такую операцию, как вычисление весовых коэффициентов. В другом примере эта индикация используется в кодере и/или декодере при вычислении значения параметра речевого режима.
Может быть желательным для высокополосного генератора A302 возбуждения формировать высокополосный сигнал S120 возбуждения, так чтобы на энергию сигнала возбуждения практически не влияли конкретные значения весовых коэффициентов S180 и S190. В этом случае вычислитель 550 весовых коэффициентов может быть выполнен с возможностью вычислять значение весового коэффициента S180 гармоник для весового коэффициента S190 шума (или принимать это значение из запоминающего устройства либо другого элемента высокополосного кодера A200) и извлекать значение другого весового коэффициента согласно, например, такому выражению:
(W harmmic ) 2 +(W noise ) 2 =1, | (2) |
где W
harmonic обозначает весовой коэффициент S180 гармоник, а W
noise обозначает весовой коэффициент S190 шума. Альтернативно, вычислитель 550 весовых коэффициентов может быть выполнен с возможностью выбирать, согласно значению показателя периодичности текущего кадра или субкадра, соответствующую одну из множества пар весовых коэффициентов S180, S190, где пары предварительно вычисляются так, чтобы удовлетворять отношению постоянства энергии, такому как выражение (2). Для реализации вычислителя 550 весовых коэффициентов, в которой наблюдается выражение (2), типичные значения весового коэффициента S180 гармоник варьируются от примерно 0,7 до примерно 1,0, а типичные значения весового коэффициента S190 шума варьируются от примерно 0,1 до примерно 0,7. Другие реализации вычислителя 550 весовых коэффициентов могут быть сконфигурированы так, чтобы функционировать согласно версии выражения (2), которая модифицирована согласно требуемому базовому взвешиванию между гармонически расширенным сигналом S160 и модулированным сигналом S170 шума.
Помехи могут возникать в синтезированном сигнале, когда разреженная таблица кодирования (таблица, записи которой большей частью являются нулевыми значениями) использована для того, чтобы вычислять квантованное представление остатка. Разреженность таблицы кодирования возникает особенно тогда, когда узкополосный сигнал кодируется с низкой скоростью передачи битов. Помехи, вызываемые разреженностью таблицы кодирования, в типичном варианте являются квазипериодическими во времени и возникают, главным образом, выше 3 кГц. Поскольку человеческий слух имеет лучшую временную разрешающую способность при более высоких частотах, эти помехи могут быть более заметны в полосе высоких частот.
Варианты осуществления включают в себя реализации высокополосного генератора A300 возбуждения, которые сконфигурированы так, чтобы выполнять устраняющую разреженность фильтрацию. Фиг.18 иллюстрирует блок-схему реализации A312 высокополосного генератора A302 возбуждения, который включает в себя устраняющий разреженность фильтр 600, выполненный с возможностью фильтровать деквантованный узкополосный сигнал возбуждения, сформированный посредством обратного квантователя 450. Фиг. 19 иллюстрирует блок-схему реализации A314 высокополосного генератора A302 возбуждения, который включает в себя устраняющий разреженность фильтр 600, выполненный с возможностью фильтровать спектрально расширенный сигнал, сформированный посредством расширителя A400 спектра. Фиг.20 иллюстрирует блок-схему реализации A316 высокополосного генератора A302 возбуждения, который включает в себя устраняющий разреженность фильтр 600, выполненный с возможностью фильтровать вывод объединителя 490, чтобы сформировать высокополосный сигнал S120 возбуждения. Разумеется, реализации высокополосного генератора A300 возбуждения, которые комбинируют признаки любой из реализаций A304 и A306 с признаками любой из реализаций A312, A314 и A316, подразумеваются и тем самым явно раскрываются. Устраняющий разреженность фильтр 600 может быть также выполнен в составе расширителя А400 спектра: например, после любого из элементов 510, 520, 530 и 540 в расширителе А402 спектра. Следует особо подчеркнуть, что устраняющий разреженность фильтр 600 также может быть использован с реализациями расширителя A400 спектра, которые выполняют спектральное наложение, спектральное преобразование или гармоническое продолжение.
Устраняющий разреженность фильтр 600 может быть выполнен с возможностью изменять фазу своего входного сигнала. Например, может быть желательным для устраняющего разреженность фильтра 600 быть сконфигурированным и размещенным так, чтобы фаза высокополосного сигнала S120 возбуждения была рандомизирована или иным образом более равномерно распределена во времени. Также может быть желательным для характеристики устраняющего разреженность фильтра 600 быть более спектрально плоской, с тем чтобы спектр громкости фильтрованного сигнала не изменялся в значительной степени. В одном примере устраняющий разреженность фильтр 600 реализован как всечастотный фильтр, имеющий передаточную функцию согласно следующему выражению:
Один эффект такого фильтра может заключаться в том, чтобы распространять энергию входного сигнала так, что она более не концентрируется только в небольшом числе выборок.
Помехи, вызываемые разреженностью таблицы кодирования, обычно более заметны для шумоподобных сигналов, где остаток включает в себя меньше информации основного тона, а также для речи в фоновом шуме. Разреженность в типичном варианте вызывает меньше помех в случаях, если возбуждение имеет долгосрочную структуру, и фактическая модификация фазы может вызывать зашумленность в вокализованных сигналах. Таким образом, может быть желательным сконфигурировать устраняющий разреженность фильтр 600, чтобы фильтровать невокализованные сигналы и пропускать, по меньшей мере, некоторые вокализованные сигналы без изменения. Невокализованные сигналы отличаются низким усилением основного тона (к примеру, усилением квантованной узкополосной адаптивной таблицы кодирования) и наклоном спектра (к примеру, квантованным первым коэффициентом отражения), который близок к нулю или положительный, показывая спектральную огибающую, которая плоская или наклоняется вверх с повышением частоты. Типичные реализации устраняющего разреженность фильтра 600 сконфигурированы так, чтобы фильтровать невокализованные звуки (к примеру, как указано посредством значения наклона спектра), фильтровать вокализованные звуки, когда усиление основного тона ниже порогового значения (альтернативно, не превышает пороговое значение), а в противном случае пропускать сигнал без изменения.
Дополнительные реализации устраняющего разреженность фильтра 600 включают в себя два или более фильтров, которые сконфигурированы так, чтобы иметь различные максимальные углы модификации фазы (к примеру, до 180 градусов). В этом случае устраняющий разреженность фильтр 600 может быть выполнен с возможностью выбирать из этих компонентных фильтров согласно значению усиления основного тона (к примеру, усиления квантованной адаптивной таблицы кодирования или LTP), с тем чтобы больший максимальный угол модификации фазы использовался для кадров, имеющих меньшие значения усиления основного тона. Реализация устраняющего разреженность фильтра 600 также может включать в себя различные компонентные фильтры, которые сконфигурированы так, чтобы модифицировать фазу по большей или меньшей части частотного спектра, с тем чтобы фильтр, выполненный с возможностью модифицировать фазу по более широкому частотному диапазону входного сигнала, использовался для кадров, имеющих меньшие значения усиления основного тона.
Для точного воспроизведения кодированного речевого сигнала может быть желательным для соотношения между уровнями высокополосной и узкополосной частей синтезированного речевого сигнала S100 быть аналогичным этому соотношению в исходном широкополосном речевом сигнале S10. Помимо спектральной огибающей, представленной посредством параметров S60a высокополосного кодирования, высокополосный кодер A200 может быть выполнен с возможностью характеризовать высокополосный сигнал S30 посредством задания огибающей времени или усиления. Как проиллюстрировано на фиг. 10, высокополосный кодер A202 включает в себя вычислитель A230 коэффициентов высокополосного усиления, который сконфигурирован и выполнен с возможностью вычислять один или более коэффициентов усиления согласно отношению между высокополосным сигналом S30 и синтезированным высокополосным сигналом S130, таким как разность или соотношение между энергиями двух сигналов в течение кадра или какой-либо его части. В других реализациях высокополосного кодера A202 вычислитель A230 высокополосного усиления может быть аналогично сконфигурирован, но выполнен с возможностью вычислять вместо этого огибающую усиления согласно данному изменяющемуся во времени отношению между высокополосным сигналом S30 и узкополосным сигналом S80 возбуждения или высокополосным сигналом S120 возбуждения.
Временные огибающие узкополосного сигнала S80 возбуждения и высокополосного сигнала S30 с большой долей вероятности аналогичны. Следовательно, кодирование огибающей усиления, которое основано на отношении между высокополосным сигналом S30 и узкополосным сигналом S80 возбуждения (или сигналом, извлеченным из него, например, высокополосным сигналом S120 возбуждения или синтезированным высокополосным сигналом S130), как правило, более эффективно, чем кодирование огибающей усиления на основе только высокополосного сигнала S30. В типичной реализации высокополосный кодер A202 выполнен с возможностью выводить квантованный индекс из восьми-двенадцати битов, который задает пять коэффициентов усиления для каждого кадра.
Вычислитель A230 коэффициентов высокополосного усиления может быть выполнен с возможностью выполнять вычисление коэффициентов усиления в качестве задачи, которая включает в себя одну или более последовательностей подзадач. Фиг. 21 иллюстрирует блок-схему последовательности операций примера T200 такой задачи, которая вычисляет значение усиления для соответствующего субкадра согласно относительным энергиям высокополосного сигнала S30 и синтезированного высокополосного сигнала S130. Задачи 220a и 220b вычисляют энергии соответствующих субкадров надлежащих сигналов. Например, задачи 220a и 220b могут быть сконфигурированы так, чтобы вычислять энергию как сумму квадратов выборок соответствующего субкадра. Задача T230 вычисляет коэффициент усиления для субкадра как квадратный корень соотношения этих энергий. В этом примере задача T230 вычисляет коэффициент усиления как квадратный корень отношения энергии высокополосного сигнала S30 к энергии синтезированного высокополосного сигнала S130 в течение субкадра.
Может быть желательным для вычислителя A230 коэффициентов высокополосного усиления быть сконфигурированным так, чтобы вычислять энергии субкадров согласно функции кадрирования. Фиг. 22 иллюстрирует блок-схему последовательности операций такой реализации T210 задачи T200 вычисления коэффициента усиления. Задача T215a применяет функцию кадрирования к высокополосному сигналу S30, а задача T215b применяет такую же функцию кадрирования к синтезированному высокополосному сигналу S130. Реализации 222a и 222b задач 220a и 220b вычисляют энергии соответствующих окон, а задача T230 вычисляет коэффициент усиления для субкадра как квадратный корень отношения энергий.
Может быть желательным применять функцию кадрирования, которая перекрывает соседние окна. Например, функция кадрирования, которая формирует коэффициенты усиления, которые могут быть применены посредством перекрытия с суммированием, может помочь снизить или устранить разрывность между субкадрами. В одном примере вычислитель A230 коэффициентов высокополосного усиления выполнен с возможностью применять трапециевидную функцию кадрирования, как показано на фиг. 23a, в которой окно перекрывает каждый из двух соседних субкадров на одну миллисекунду. Фиг. 23b иллюстрирует применение этой функции кадрирования к каждому из пяти субкадров 20-миллисекундного кадра. Другие реализации вычислителя A230 коэффициентов высокополосного усиления могут быть сконфигурированы так, чтобы применять функции кадрирования, имеющие другие периоды перекрытия и/или другие формы окон (к примеру, прямоугольное, Хэмминга), которые могут быть симметричными или асимметричными. Также возможно для реализации вычислителя A230 коэффициентов высокополосного усиления быть сконфигурированным так, чтобы применять различные функции кадрирования к различным субкадрам в рамках кадра и/или для кадра, чтобы включать в себя субкадры различной длины.
Без ограничения, следующие значения представлены в качестве примеров для конкретных реализаций. 20-миллисекундный кадр предполагается для этих случаев, хотя любая другая длительность может быть использована. Для высокополосного сигнала, дискретизированного при 7 кГц, каждый кадр имеет 140 выборок. Если такой кадр делится на пять субкадров равной длины, каждый кадр должен иметь 28 выборок, и окно, показанное на фиг.23a, должно иметь ширину 42 выборки. Для высокополосного сигнала, дискретизированного при 8 кГц, каждый кадр имеет 160 выборок. Если такой кадр делится на пять субкадров равной длины, каждый кадр должен иметь 32 выборок, и окно, показанное на фиг.23a, должно иметь ширину 48 выборок. В других реализациях субкадры любой ширины могут быть использованы, и даже возможно для реализации вычислителя A230 высокополосного усиления быть сконфигурированной так, чтобы формировать различный коэффициент усиления для каждой выборки кадра.
Фиг.24 иллюстрирует блок-схему реализации B202 высокополосного декодера B200. Высокополосный декодер B202 включает в себя высокополосный декодер B300 возбуждения, который выполнен с возможностью формировать высокополосный сигнал S120 возбуждения на основе узкополосного сигнала S80 возбуждения. В зависимости от конкретных вариантов проектирования системы, высокополосный генератор B300 возбуждения может быть реализован согласно любой из реализаций высокополосного генератора A300 возбуждения, описанных в данном документе. Типично желательно реализовать высокополосный генератор B300 возбуждения, чтобы иметь такую же характеристику, как высокополосный генератор возбуждения высокополосного кодера конкретной системы кодирования. Поскольку узкополосный декодер B110 в типичном варианте выполняет деквантование кодированного узкополосного сигнала S50 возбуждения, тем не менее, в большинстве случаев высокополосный генератор B300 возбуждения может быть реализован так, чтобы принимать узкополосный сигнал S80 возбуждения от узкополосного кодера B110, и необязательно должен включать в себя обратный квантователь, выполненный с возможностью деквантовать кодированный узкополосный сигнал S50 возбуждения. Также можно для узкополосного декодера B110 быть реализованным так, чтобы включать в себя экземпляр устраняющего разреженность фильтра 600, выполненного с возможностью фильтрации деквантованного узкополосного сигнала возбуждения до того, как он входит в узкополосный синтезирующий фильтр, такой как фильтр 330.
Обратный квантователь 560 выполнен с возможностью деквантовать параметры S60a высокополосного фильтра (в данном примере, до набора LSF), а преобразование 570 LSF в параметры LP-фильтра преобразует LSF в набор коэффициентов фильтра (например, как описано выше со ссылкой на обратный квантователь 240 и преобразование 250 узкополосного кодера A122). В других реализациях, как упоминалось выше, другие наборы коэффициентов (к примеру, коэффициентов косинусного преобразования Фурье) и/или представления коэффициентов (к примеру, ISP) могут быть использованы. Высокополосный синтезирующий фильтр B200 выполнен с возможностью формировать синтезированный высокополосный сигнал согласно высокополосному сигналу S120 возбуждения и набору коэффициентов фильтра. Для системы, в которой высокополосный кодер включает в себя синтезирующий фильтр (к примеру, как в случае кодера A202, описанного выше), может быть желательным реализовать высокополосный синтезирующий фильтр B200 так, чтобы иметь такую же характеристику (к примеру, такую же передаточную функцию), что и характеристика синтезирующего фильтра.
Высокополосный декодер B202 также включает в себя обратный квантователь 580, выполненный с возможностью деквантовать коэффициенты S60b высокополосного усиления, и элемент 590 регулировки усиления (к примеру, умножитель или усилитель), сконфигурированный и выполненный с возможностью применять деквантованные коэффициенты усиления к синтезированному высокополосному сигналу, чтобы формировать высокополосный сигнал S100. Для случая, в котором огибающая усиления кадра задана посредством нескольких коэффициентов усиления, элемент 590 регулировки усиления может включать в себя логику, сконфигурированную так, чтобы применять коэффициенты усиления к соответствующим субкадрам, возможно, согласно функции кадрирования, которая может быть такой же или другой функцией кадрирования, как применяемая посредством вычислителя усиления (к примеру, вычислителя A230 высокополосного усиления) соответствующего высокополосного кодера. В других реализациях высокополосного кодера B202 элемент 590 регулировки усиления сконфигурирован аналогично, но выполнен с возможностью применять вместо этого деквантованные коэффициенты усиления к узкополосному сигналу S80 возбуждения или высокополосному сигналу S120 возбуждения.
Как упоминалось выше, может быть желательным получить одно состояние в высокополосном кодере и высокополосном декодере (к примеру, посредством использования деквантованных значений в ходе кодирования). Таким образом, может быть желательным в системе кодирования согласно этой реализации обеспечить одинаковое состояние соответствующих генераторов шума в высокополосных генераторах A300 и B300 возбуждения. Например, высокополосные генераторы A300 и B300 возбуждения этой реализации могут быть сконфигурированы так, чтобы режим генератора шума является детерминированной функцией от информации, уже закодированной в рамках этого кадра (к примеру, параметров S40 узкополосного фильтра или их части и/или кодированного узкополосного сигнала S50 возбуждения или его части).
Один или более квантователей элементов, описанных в данном документе (к примеру, квантователь 230, 420 или 430), могут быть сконфигурированы так, чтобы выполнять классифицированное векторное квантование. Например, этот квантователь может быть выполнен с возможностью выбирать одну из набора таблиц кодирования на основе информации, которая уже закодирована в том же кадре в узкополосном канале и/или в высокополосном канале. Данная методика в типичном варианте предоставляет большую эффективность кодирования за счет дополнительного места для хранения таблицы кодирования.
Как описано выше со ссылкой, к примеру, на фиг.8 и 9, значительная часть периодичной структуры может оставаться в остаточном сигнале после удаления приблизительной спектральной огибающей из узкополосного речевого сигнала S20. Например, остаточный сигнал может содержать последовательность примерно периодических импульсов или выбросов во времени. Эта структура, которая в типичном варианте связана с основным тоном, с особенно большой вероятностью может возникать в вокализованных речевых сигналах. Вычисление квантованного представления узкополосного остаточного сигнала может включать в себя кодирование этой структуры основного тона согласно модели долгосрочной периодичности, как представленная посредством, например, одной или более таблиц кодирования.
Структура основного тона фактического остаточного сигнала может не совпадать точно с моделью периодичности. Например, остаточный сигнал может включать в себя небольшие дрожания фазы касательно регулярности позиций импульсов основного тона так, что расстояния между последовательными импульсами основного тона в кадре не совпадают в точности, и структура не является достаточно регулярной. Эти нерегулярности зачастую снижают эффективность кодирования.
Некоторые реализации узкополосного кодера A120 сконфигурированы так, чтобы выполнять регуляризацию структуры основного тона посредством применения адаптивного предыскажения шкалы времени к остатку до или в ходе квантования, либо посредством включения в противном случае адаптивного предыскажения шкалы времени в кодированный сигнал возбуждения. Например, этот кодер может быть выполнен с возможностью выбирать или иным образом вычислять степень предыскажения шкалы времени (к примеру, согласно одному или более критериев перцепционного взвешивания и/или минимизации ошибок), с тем чтобы результирующий сигнал возбуждения оптимально соответствовал модели долгосрочной периодичности. Регуляризация структуры основного тона выполняется посредством поднабора CELP-кодеров, называемых кодерами с помощью линейного предсказания с возбуждением релаксационным кодом (RCELP).
RCELP-кодер в типичном варианте выполнен с возможностью выполнять предыскажение шкалы времени как адаптивный сдвиг по времени. Сдвигом по времени может быть задержка, варьирующаяся от нескольких миллисекунд со знаком минус до нескольких миллисекунд со знаком плюс, а она обычно изменяется плавно, чтобы не допустить слышимых разрывностей. В некоторых реализациях этот кодер выполнен с возможностью применять регуляризацию кусочно-линейным методом, при котором каждый кадр или субкадр предыскажается посредством соответствующего фиксированного сдвига по времени. В других реализациях кодер выполнен с возможностью применять регуляризацию как непрерывную функцию предыскажения шкалы, с тем чтобы кадр или субкадр предыскажался согласно контуру основного тона (также называемому траекторией основного тона). В некоторых случаях (к примеру, как описано в Патентной заявке (США) 2004/0098255) кодер выполнен с возможностью включать предыскажение шкалы времени в кодированный сигнал возбуждения посредством применения сдвига к перцепционно взвешенному входному сигналу, который используется для того, чтобы вычислять кодированный сигнал возбуждения.
Кодер вычисляет кодированный сигнал возбуждения, который регуляризован и квантован, а декодер деквантует кодированный сигнал возбуждения, чтобы получить сигнал возбуждения, который используется для того, чтобы синтезировать декодированный речевой сигнал. Таким образом, декодированный выходной сигнал предоставляет такую же задержку варьирования, что и включенная в кодированный сигнал возбуждения посредством регуляризации. В типичном варианте, информация, задающая величины регуляризации, не передается в декодер.
Регуляризация зачастую упрощает кодирование остаточного сигнала, что увеличивает производительность кодирования долгосрочного предсказателя и тем самым повышает общую эффективность кодирования, как правило, без формирования помех. Может быть желательным выполнять регуляризацию только для кадров, которые являются вокализованными. Например, узкополосный кодер A124 может быть выполнен с возможностью сдвигать только кадры или субкадры, имеющие долгосрочную структуру, такие как вокализованные сигналы. Может быть желательным даже выполнять регуляризацию только для субкадров, которые включают в себя энергию импульсов основного тона. Различные реализации RCELP-кодирования описаны в Патентах (США) номера 5704003 (Kleijn и др.) и 6879955 (Rao), а также в Патентной заявке (США) 2004/0098255 (Kovesi и др.). Существующие реализации RCELP-кодеров включают в себя усовершенствованный кодек с переменной скоростью (EVRC), описанный в Ассоциации промышленности средств связи (TIA) IS-127, и вокодер с выбираемым режимом (SMV) для Партнерского проекта третьего поколения 2 (3GPP2).
К сожалению, регуляризация может вызывать проблемы для широкополосного речевого кодера, в котором высокополосное возбуждение извлекается из кодированного узкополосного сигнала возбуждения (например, системы, включающей в себя широкополосный речевой кодер A100 и широкополосный речевой декодер B100). Вследствие его извлечения из сигнала с предыскаженной шкалой времени высокополосный сигнал возбуждения, в общем, может иметь временную зависимость, которая отличается от временной зависимости исходного высокополосного речевого сигнала. Другими словами, высокополосный сигнал возбуждения более не является синхронным с исходным высокополосным речевым сигналом.
Рассогласование по времени между предыскаженным высокополосным сигналом возбуждения и исходным высокополосным речевым сигналом может вызывать некоторые проблемы. Например, предыскаженный высокополосный сигнал возбуждения может более не предоставлять надлежащего входного возбуждения для синтезирующего фильтра, который сконфигурирован согласно параметрам фильтра, извлеченным из исходного высокополосного речевого сигнала. Как результат, синтезированный высокополосный сигнал может содержать слышимые помехи, которые снижают воспринимаемое качество декодированного широкополосного речевого сигнала.
Рассогласование во времени также может приводить к неэффективности кодирования огибающей усиления. Как упоминалось выше, корреляция с большой долей вероятности существует между огибающими времени узкополосного сигнала S80 возбуждения и высокополосного сигнала S30. Посредством кодирования огибающей усиления высокополосного сигнала согласно отношению между этими двумя временными огибающими повышение эффективности кодирования может быть реализовано в сравнении с кодированием непосредственно огибающей усиления. Когда кодированный узкополосный сигнал возбуждения регуляризован, тем не менее, эта корреляция может быть ослаблена. Рассогласование во времени между узкополосным сигналом S80 возбуждения и высокополосным сигналом S30 может заставлять флуктуации появляться в коэффициентах S60b высокополосного усиления, и эффективность кодирования может упасть.
Варианты осуществления включают в себя способы широкополосного кодирования речи, которые выполняют предыскажение шкалы времени высокополосного речевого сигнала согласно предыскажению шкалы времени, включенному в соответствующий кодированный узкополосный сигнал возбуждения. Потенциальные преимущества этих способов включают в себя повышение качества декодированного широкополосного речевого сигнала и/или повышение эффективности кодирования огибающей высокополосного усиления.
Фиг.25 иллюстрирует блок-схему реализации AD10 широкополосного речевого кодера A100. Кодер AD10 включает в себя реализацию A124 узкополосного кодера A120, которая сконфигурирована так, чтобы выполнять регуляризацию в ходе вычисления кодированного узкополосного сигнала S50 возбуждения. Например, узкополосный кодер A124 может быть сконфигурирован согласно одной или более реализаций RCELP, поясненных выше.
Узкополосный кодер A124 также выполнен с возможностью выводить сигнал SD10 данных регуляризации, который задает степень применяемого предыскажения шкалы времени. Для различных случаев, в которых узкополосный кодер A124 выполнен с возможностью применять фиксированный сдвиг по времени к каждому кадру или субкадру, сигнал SD10 данных регуляризации может включать в себя последовательность значений, указывающих величину каждого сдвига по времени как целое или нецелое значение в показателях выборок, миллисекунд или какого-либо другого приращения времени. Для случая, когда узкополосный кодер A124 выполнен с возможностью иным образом модифицировать временную шкалу кадра или другой последовательности выборок (к примеру, посредством сжатия одной части и расширения другой части), сигнал SD10 информации регуляризации может включать в себя соответствующее описание модификации, например набор параметров функции. В одном конкретном примере узкополосный кодер A124 выполнен с возможностью разделить кадр на три субкадра и вычислить фиксированный сдвиг по времени для каждого субкадра, с тем чтобы сигнал SD10 данных регуляризации указывал три величины сдвига по времени для каждого регуляризованного кадра кодированного узкополосного сигнала.
Широкополосный речевой кодер AD10 включает в себя линию D120 задержки, сконфигурированную так, чтобы продвигать вперед или замедлять части высокополосного речевого сигнала S30 согласно величинам задержки, указанным посредством входного сигнала, чтобы формировать высокополосный речевой сигнал S30a с предыскажением шкалы времени. В примере, показанном на фиг. 25, линия D120 задержки сконфигурирована так, чтобы предыскажать шкалу времени высокополосного речевого сигнала S30 согласно предыскажению, указанному посредством сигнала SD10 данных регуляризации. Таким образом, такое же значение предыскажения шкалы времени, что включено в кодированный узкополосный сигнал S50 возбуждения, также применяется к соответствующей части высокополосного речевого сигнала S30 до анализа. Хотя этот пример иллюстрирует линию D120 задержки как элемент, отдельный от высокополосного кодера A200, в других реализациях линия D120 задержки размещена как часть высокополосного кодера.
Дополнительные реализации высокополосного кодера A200 могут быть сконфигурированы так, чтобы выполнять спектральный анализ (к примеру, LPC-анализ) неискаженного высокополосного речевого сигнала S30, чтобы осуществлять предыскажение шкалы времени высокополосного речевого сигнала S30 до вычисления параметров S60b высокополосного усиления. Данный кодер может включать в себя, например, реализацию линии D120 задержки, выполненную с возможностью выполнять предыскажение шкалы времени. В этих случаях, тем не менее, параметры S60a высокополосного фильтра на основе сигнала S30 без предыскажения шкалы времени могут описывать спектральную огибающую, которая рассогласована по времени с высокополосным сигналом S120 возбуждения.
Линия D120 задержки может быть сконфигурирована согласно любой комбинации логических элементов и элементов запоминающего устройства, подходящей для применения требуемых операций предыскажения шкалы времени к высокополосному речевому сигналу S30. Например, линия D120 задержки может быть сконфигурирована так, чтобы считывать высокополосный речевой сигнал S30 из буфера согласно требуемым сдвигам по времени. Фиг.26a иллюстрирует схематичное представление такой реализации D122 линии D120 задержки, которая включает в себя сдвиговый регистр SR1. Сдвиговый регистр SR1 - это буфер некоторой длины m, который выполнен с возможностью принимать и сохранять m последних выборок высокополосного речевого сигнала S30. Значение m равно, по меньшей мере, сумме максимальных положительных (или "продвижение вперед") и отрицательных (или "замедление") сдвигов по времени, которые должны поддерживаться. Может быть удобным, чтобы значение m было равно длине кадра или субкадра высокополосного сигнала S30.
Линия D122 задержки сконфигурирована так, чтобы выводить высокополосный сигнал S30a с предыскаженной шкалой времени из позиции OL смещения сдвигового регистра SR1. Позиция OL смещения изменяется относительно опорной позиции (нулевой сдвиг по времени) согласно текущему сдвигу по времени, указанному, например, посредством сигнала SD10 данных регуляризации. Линия D122 задержки может быть сконфигурирована так, чтобы поддерживать одинаковые ограничения на продвижение вперед и замедление либо, альтернативно, одно ограничение большим другого, так чтобы мог выполняться больший сдвиг в одном, чем в другом направлении. Фиг.26a иллюстрирует конкретный пример, который поддерживает больший положительный, чем отрицательный сдвиг по времени. Линия D122 задержки может быть сконфигурирована так, чтобы выводить одну или более выборок одновременно (в зависимости, например, от ширины выходной шины).
Сдвиг по времени регуляризации, имеющий громкость более нескольких миллисекунд, может приводить к слышимым помехам в декодированном сигнале. В типичном варианте громкость сдвига по времени регуляризации, выполняемого посредством узкополосного кодера A124, не превышает нескольких миллисекунд, так чтобы сдвиги по времени, указанные посредством сигнала SD10 данных регуляризации, ограничивались. Тем не менее, в этих случаях может быть желательным для линии D122 задержки быть сконфигурированной так, чтобы накладывать максимальное ограничение на сдвиги по времени в положительном и/или отрицательном направлении (например, чтобы предоставлять более строгое ограничение, чем налагаемое посредством узкополосного кодера).
Фиг.26b иллюстрирует схематичное представление реализации D124 линии D122 задержки, которая включает в себя сдвиговое окно SW. В этом примере позиция OL смещения ограничена сдвиговым окном SW. Хотя фиг.26b иллюстрирует случай, в котором длина буфера m превышает ширину сдвигового окна SW, линия D124 задержки также может быть реализована таким образом, чтобы ширина сдвигового окна SW равнялась m.
В других реализациях линия D120 задержки сконфигурирована так, чтобы записывать высокополосный речевой сигнал S30 в буфер согласно требуемым сдвигам по времени. Фиг.27 иллюстрирует схематичное представление такой реализации D130 линии D120 задержки, которая включает в себя два сдвиговых регистра SR2 и SR3, сконфигурированных так, чтобы принимать и сохранять высокополосный речевой сигнал S30. Линия D130 задержки сконфигурирована так, чтобы записывать кадр или субкадр из сдвигового регистра SR2 в сдвиговый регистр SR3 согласно сдвигу по времени, указанному, к примеру, посредством сигнала SD10 данных регуляризации. Сдвиговый регистр SR3 сконфигурирован как FIFO-буфер, выполненный с возможностью выводить высокополосный сигнал S30 с предыскажением шкалы времени.
В конкретном примере, показанном на фиг.27, сдвиговый регистр SR2 включает в себя часть FB1 буфера кадров и часть DB буфера задержки, а сдвиговый регистр SR3 включает в себя часть FB2 буфера кадров, часть AB буфера продвижения вперед и часть буфера RB замедления. Длина буфера AB продвижения вперед и буфера RB замедления может совпадать либо один может быть длиннее другого, так что поддерживается больший сдвиг в одном направлении, чем в другом. Буфер DB задержки и часть RB буфера замедления могут быть сконфигурированы так, чтобы иметь одинаковую длину. Альтернативно, буфер DB задержки может быть короче буфера RB замедления, чтобы учитывать интервал времени, требуемый для того, чтобы передавать выборки из буфера FB1 кадров в сдвиговый регистр SR3, который может включать в себя другие операции обработки, такие как предыскажение выборок до сохранения в сдвиговый регистр SR3.
В примере по фиг.27 буфер FB1 кадров выполнен с возможностью иметь длину, равную длине одного кадра высокополосного сигнала S30. В другом примере буфер FB1 кадров выполнен с возможностью иметь длину, равную длине субкадра высокополосного сигнала S30. В этом случае линия D130 задержки может быть сконфигурирована так, чтобы включать в себя логику, чтобы применять одинаковую (к примеру, среднюю) задержку ко всем субкадрам кадра, который должен быть сдвинут. Линия D130 задержки также может включать в себя логику, чтобы усреднять значения из буфера FB1 кадров со значениями, которые должны быть перезаписаны в буфер RB замедления или буфер AB продвижения вперед. В дополнительном примере сдвиговый регистр SR3 может быть выполнен с возможностью принимать значения высокополосного сигнала S30 только посредством буфера FB1 кадров, и в этом случае линия D130 задержки может включать в себя логику, чтобы интерполировать по промежуткам между последовательными кадрами или субкадрами, записанными в сдвиговый регистр SR3. В других реализациях линия D130 задержки может быть сконфигурирована так, чтобы выполнять операцию предыскажения для выборок из буфера FB1 кадров до записи их в сдвиговый регистр SR3 (к примеру, согласно функции, описанной посредством сигнала SD10 данных регуляризации).
Может быть желательным для линии D120 задержки применять предыскажение шкалы времени, которое основано на, но не идентично, предыскажении, заданном посредством сигнала SD10 данных регуляризации. Фиг.28 иллюстрирует блок-схему реализации AD12 широкополосного речевого кодера AD10, которая включает в себя преобразователь (средство отображения) D110 значений задержки. Преобразователь D110 значений задержки выполнен с возможностью отображать предыскажение, указанное посредством сигнала SD10 данных регуляризации, в отображенные значения SD10a задержки. Линия D120 задержки выполнена с возможностью формировать высокополосный речевой сигнал S30a с предыскажением шкалы времени согласно предыскажению, указанному посредством отображенных значений SD10a задержки.
Сдвиг по времени, применяемый посредством узкополосного кодера, как ожидается, может плавно развиваться со временем. Следовательно, в типичном варианте достаточно вычислить средний узкополосный сдвиг по времени, применяемый к субкадрам в течение кадра речи, и сдвинуть соответствующий кадр высокополосного речевого сигнала S30 согласно этому среднему. В одном таком примере преобразователь D110 значений задержки выполнен с возможностью вычислять среднее значений задержки субкадров для каждого кадра, а линия D120 задержки сконфигурирована так, чтобы применять вычисленное среднее к соответствующему кадру высокополосного сигнала S30. В других примерах среднее за более короткий период (например, два субкадра или половина кадра) или более длинный период (например, два кадра) может быть вычислено и применено. В случае если среднее является нецелым значением выборок, преобразователь D110 значений задержки может быть выполнен с возможностью округлять значение до целого числа выборок до вывода его в линию D120 задержки.
Узкополосный кодер A124 может быть выполнен с возможностью включать в себя сдвиг по времени регуляризации нецелого числа выборок в кодированном узкополосном сигнале возбуждения. В этом случае может быть желательным для преобразователя D110 значений задержки быть сконфигурированным так, чтобы округлять узкополосный сдвиг по времени целым числом выборов, а для линии D120 задержки - применять округленный сдвиг по времени к высокополосному речевому сигналу S30.
В некоторых реализациях широкополосного речевого кодера AD10 частоты дискретизации узкополосного речевого сигнала S20 и широкополосного речевого сигнала S30 могут различаться. В этих случаях преобразователь D110 значений задержки может быть выполнен с возможностью корректировать величины сдвига по времени, указанные в сигнале SD10 данных регуляризации, чтобы учитывать разность между частотами дискретизации узкополосного речевого сигнала S20 (или узкополосного сигнала S80 возбуждения) и высокополосного речевого сигнала S30. Например, преобразователь D110 значений задержки может быть выполнен с возможностью масштабировать величины сдвига по времени согласно соотношению частот дискретизации. В одном конкретном примере, приведенном выше, узкополосный речевой сигнал S20 дискретизируется при 8 кГц, а высокополосный речевой сигнал S30 дискретизируется при 7 кГц. В этом случае преобразователь D110 значений задержки выполнен с возможностью умножать каждую величину задержки на 7/8. Реализации преобразователя D110 значений задержки также могут быть сконфигурированы так, чтобы выполнять эту операцию масштабирования вместе с операцией округления до целого числа и/или усреднения сдвигов по времени, описанной в данном документе.
В дополнительных реализациях линия D120 задержки сконфигурирована так, чтобы иным образом модифицировать шкалу времени кадра или другой последовательности выборок (к примеру, посредством сжатия одной части и расширения другой части). Например, узкополосный кодер A124 может быть выполнен с возможностью выполнять регуляризацию согласно такой функции, как контур или траектория основного тона. В этом случае сигнал SD10 данных регуляризации может включать в себя соответствующее описание функции, например набор параметров, а линия D120 задержки может включать в себя логику, сконфигурированную так, чтобы предыскажать кадры или субкадры высокополосного речевого сигнала S30 согласно функции. В других реализациях преобразователь D110 значений задержки выполнен с возможностью усреднять, масштабировать и/или округлять функцию до того, как она применяется к высокополосному речевому сигналу S30 посредством линии D120 задержки. Например, преобразователь D110 значений задержки может быть выполнен с возможностью вычислять одно или более значений задержки согласно функции, причем каждое значение задержки включает в себя ряд выборок, которые затем применяются посредством линии D120 задержки, чтобы предыскажать шкалу времени одного или более соответствующих кадров или субкадров высокополосного сигнала S30.
Фиг.29 иллюстрирует блок-схему последовательности операций способа MD100 предыскажения шкалы времени высокополосного речевого сигнала согласно предыскажению шкалы времени, включенному в соответствующий кодированный узкополосный сигнал возбуждения. Задача TD100 обрабатывает широкополосный речевой сигнал, чтобы получить узкополосный речевой сигнал и высокополосный речевой сигнал. Например, задача TD100 может быть сконфигурирована так, чтобы фильтровать широкополосный речевой сигнал с помощью гребенки фильтров, имеющей низкочастотные и высокочастотные фильтры, например, реализации гребенки фильтров A110. Задача TD200 кодирует узкополосный речевой сигнал, по меньшей мере, в кодированный узкополосный сигнал возбуждения и множество параметров узкополосного фильтра. Кодированный узкополосный сигнал возбуждения и/или параметры фильтра могут быть квантованы, и кодированный узкополосный речевой сигнал также может включать в себя другие параметры, например параметр речевого режима. Задача TD200 также включает в себя предыскажение шкалы времени в кодированном узкополосном сигнале возбуждения.
Задача TD300 формирует высокополосный сигнал возбуждения на основе узкополосного сигнала возбуждения. В этом случае узкополосный сигнал возбуждения основан на кодированном узкополосном сигнале возбуждения. Согласно, по меньшей мере, высокополосному сигналу возбуждения, задача TD400 кодирует высокополосный речевой сигнал, по меньшей мере, во множество параметров высокополосного фильтра. Например, задача TD400 может быть сконфигурирована так, чтобы кодировать высокополосный речевой сигнал, по меньшей мере, во множество квантованных LSF. Задача TD500 применяет сдвиг по времени к высокополосному речевому сигналу, который основан на информации, связанной с предыскажением шкалы времени, включенной в кодированный узкополосный сигнал возбуждения.
Задача TD400 может быть сконфигурирована так, чтобы выполнять спектральный анализ (например, LPC-анализ) высокополосного речевого сигнала и/или вычислять огибающую усиления высокополосного речевого сигнала. В этих случаях задача TD500 может быть сконфигурирована так, чтобы применять сдвиг по времени к высокополосному речевому сигналу до анализа и/или вычисления огибающей усиления.
Другие реализации широкополосного речевого кодера A100 сконфигурированы так, чтобы выполнять противоположное предыскажение шкалы времени высокополосного сигнала S120 возбуждения, вызванное посредством предыскажения шкалы времени, включенного в кодированный узкополосный сигнал возбуждения. Например, высокополосный генератор A300 возбуждения может быть реализован так, чтобы включать в себя реализацию линии D120 задержки, которая сконфигурирована так, чтобы принимать сигнал SD10 данных регуляризации или преобразованные значения SD10a задержки или применять соответствующий обратный сдвиг по времени к узкополосному сигналу S80 возбуждения и/или к последующему сигналу на основе него, такому как гармонически расширенный сигнал S160 или высокополосный сигнал S120 возбуждения.
Дополнительные реализации широкополосного речевого кодера могут быть сконфигурированы так, чтобы кодировать узкополосный речевой сигнал S20 и высокополосный речевой сигнал S30 независимо друг от друга, с тем чтобы высокополосный речевой сигнал S30 кодировался как представление высокополосной спектральной огибающей и высокополосного сигнала возбуждения. Эта реализация может быть сконфигурирована так, чтобы выполнять предыскажение шкалы времени высокополосного остаточного сигнала или иным образом включать предыскажение шкалы времени в кодированный высокополосный сигнал возбуждения согласно информации, связанной с предыскажением шкалы времени, включенной в кодированный узкополосный сигнал возбуждения. Например, высокополосный кодер может включать в себя реализацию линии D120 задержки и/или преобразователь D110 значений задержки, описанные в данном документе, которые сконфигурированы так, чтобы применять предыскажение шкалы времени к высокополосному остаточному сигналу. Потенциальные преимущества этой операции включают в себя более эффективное кодирование высокополосного остаточного сигнала и лучшее совпадение между синтезированными узкополосным и высокополосным речевыми сигналами.
Как упоминалось выше, варианты осуществления, описанные в данном документе, включают в себя реализации, которые могут быть использованы для того, чтобы выполнять встроенное кодирование, поддерживая совместимость с узкополосными системами и устраняя потребность в перекодировке. Поддержка высокополосного кодирования также может служить для того, чтобы проводить различия на основе затрат между микросхемами, наборами микросхем, устройствами и/или сетями, имеющими широкополосную поддержку с обратной совместимостью, а также имеющими только узкополосную поддержку. Поддержка высокополосного кодирования, описанная в данном документе, также может быть использована в связи с методикой поддержки низкополосного кодирования, и система, способ либо устройство согласно этому варианту осуществления могут поддерживать кодирование частотных компонентов, например, от примерно 50 или 100 Гц до примерно 7 или 8 кГц.
Как упоминалось выше, добавление высокополосной поддержки в речевой кодер позволяет повысить разборчивость, особенно в отношении различения фрикативных звуков. Хотя это различение обычно может быть извлечено слушающей стороной из конкретного содержимого, поддержка полосы высоких частот может выступать в качестве разрешающего признака в распознавании речи и других приложениях машинной интерпретации, например систем автоматической речевой навигации по меню и/или автоматической обработки вызовов.
Устройство согласно варианту осуществления может быть встроено в портативное устройство мобильной связи, например сотовый телефон или личное цифровое устройство (PDA). Альтернативно, это устройство может быть включено в другие устройства связи, такие как телефонная трубка VoIP, персональная вычислительная машина, сконфигурированная так, чтобы поддерживать VoIP-связь, либо сетевое устройство, сконфигурированное так, чтобы маршрутизировать телефонную или VoIP-связь. Например, устройство согласно варианту осуществления может быть реализовано в микросхеме или наборе микросхем для устройства связи. В зависимости от конкретного варианта применения это устройство также может включать в себя такие признаки, как аналогово-цифровое и/или цифроаналоговое преобразование речевого сигнала, схема для осуществления усиления и/или других операций обработки речевого сигнала и/или радиочастотная схема для передачи и/или приема кодированного речевого сигнала.
Явно предполагается и раскрывается, что варианты осуществления могут включать в себя и/или быть использованы с одним или более других признаков, раскрытых в Предварительных патентных заявках (США) номера 60/667901 и 60/673965, для которых данная заявка притязает на приоритет. Эти признаки включают в себя удаление выбросов высокой энергии короткой длительности, которые возникают в полосе высоких частот и практически отсутствуют в полосе узких частот. Такие признаки включают в себя фиксированное или адаптивное сглаживание представлений коэффициентов, например, высокополосных LSF. Такие признаки включают в себя фиксированное или адаптивное формирование шума, ассоциативно связанного с квантованием представлений коэффициентов, таких как LSF. Такие признаки также включают в себя фиксированное или адаптивное сглаживание огибающей усиления и адаптивное ослабление огибающей усиления.
Вышеприведенное представление описанных вариантов осуществления предоставлено для того, чтобы дать возможность любому специалисту в данной области техники создавать или использовать настоящее изобретение. Различные модификации в этих вариантах осуществления допускаются, а представленные в данном документе общие принципы могут быть применены также к другим вариантам осуществления. Например, вариант осуществления может быть реализован частично или как проводная схема, как схемная конфигурация, изготовленная в специализированной интегральной схеме, либо как микропрограммное обеспечение, загруженное в энергонезависимое запоминающее устройство, либо программное приложение, загруженное с или в носитель хранения данных в качестве машиночитаемого кода, причем таким кодом являются инструкции, приводимые в исполнение посредством матрицы логических элементов, такой как микропроцессор или другой блок обработки цифровых сигналов. Носителем хранения данных может быть матрица элементов хранения, например полупроводниковое запоминающее устройство (которое может включать в себя, без ограничений, динамическое или статическое ОЗУ (оперативное запоминающее устройство), ПЗУ (постоянное запоминающее устройство) и/или флэш-ОЗУ) либо сегнетоэлектрическое, магниторезистивное, на аморфных полупроводниках, полимерное или фазосдвигающее запоминающее устройство; либо дисковый носитель, например магнитный или оптический диск. Термин "программное обеспечение" должен пониматься так, чтобы включать в себя исходный код, код языка ассемблера, машинный код, двоичный код, микропрограммное обеспечение, макрокод, микрокод, любой один или более наборов или последовательностей инструкций, приводимых в исполнение посредством матрицы логических элементов, и любое сочетание вышеозначенных примеров.
Различные элементы реализаций высокополосных генераторов A300 и B300 возбуждения, высокополосный кодер A200, высокополосный декодер B200, широкополосный речевой кодер A100 и широкополосный речевой декодер B100 могут быть реализованы как электронные и/или оптические устройства, постоянно размещающиеся, например, на одной микросхеме или на двух или более микросхемах в наборе микросхем, хотя другие компоновки без ограничения также подразумеваются. Один или более элементов такого устройства могут быть реализованы полностью или частично как один или более наборов инструкций, выполненных с возможностью приводиться в исполнение на одной или более фиксированных или программируемых матриц логических элементов (к примеру, транзисторов, логических схем), таких как микропроцессоры, встроенные процессоры, IP-сердечники, процессоры цифровых сигналов, FPGA (программируемые пользователем матричные БИС), ASSP (специализированные стандартные продукты) и ASIC (специализированные интегрированные схемы). Также возможно для одного или более таких элементов иметь общую структуру (к примеру, процессор, используемый для того, чтобы приводить в исполнение части кода, соответствующие различным элементам в различные моменты времени, набор инструкций, приводимый в исполнение для того, чтобы выполнять задачи, соответствующие различным элементам в различные моменты времени, или компоновку электронных и/или оптических устройств, выполняющих операции для различных элементов в различные моменты времени). Более того, возможно для одного или более таких элементов выполнять задачи или приводить в исполнение другие наборы инструкций, которые не связаны непосредственно с работой устройства, например задачу, связанную с другой операцией устройства или системы, в которую встроено устройство.
Фиг.30 иллюстрирует блок-схему последовательности операций способа M100, согласно варианту осуществления, кодирования высокополосной части речевого сигнала, имеющего узкополосную часть и высокополосную часть. Задача X100 вычисляет набор параметров фильтра, которые характеризуют спектральную огибающую высокополосной части. Задача X200 вычисляет спектрально расширенный сигнал посредством применения нелинейной функции к сигналу, извлеченному из узкополосной части. Задача X300 формирует синтезированный высокополосный сигнал согласно (A) набору параметров фильтра и (B) высокополосному сигналу возбуждения на основе спектрально расширенного сигнала. Задача X400 вычисляет спектральную огибающую на основе отношения между (C) энергией высокочастотной части и (D) энергией сигнала, извлеченного из узкополосной части.
Фиг.31a иллюстрирует блок-схему последовательности операций способа M200 формирования высокополосного сигнала возбуждения согласно варианту осуществления. Задача Y100 вычисляет гармонически расширенный сигнал посредством применения нелинейной функции к узкополосному сигналу возбуждения, извлеченному из узкополосной части речевого сигнала. Задача Y200 смешивает гармонически расширенный сигнал с модулированным сигналом шума, чтобы сформировать высокополосный сигнал возбуждения. Фиг.31b иллюстрирует блок-схему последовательности операций способа M210 формирования высокополосного сигнала возбуждения согласно другому варианту осуществления, включающему в себя задачи Y300 и Y400. Задача Y300 вычисляет огибающую временной области согласно энергии во времени одного из узкополосного сигнала возбуждения и гармонически расширенного сигнала. Задача Y400 модулирует сигнал шума согласно огибающей временной области, чтобы сформировать модулированный сигнал шума.
Фиг.32 иллюстрирует блок-схему последовательности операций способа M300, согласно варианту осуществления, декодирования высокополосной части речевого сигнала, имеющего узкополосную часть и высокополосную часть. Задача Z100 принимает набор параметров фильтра, которые характеризуют спектральную огибающую высокополосной части, и набор коэффициентов усиления, которые характеризуют временную огибающую высокополосной части. Задача Z200 вычисляет спектрально расширенный сигнал посредством применения нелинейной функции к сигналу, извлеченному из узкополосной части. Задача Z300 формирует синтезированный высокополосный сигнал согласно (A) набору параметров фильтра и (B) высокополосному сигналу возбуждения на основе спектрально расширенного сигнала. Задача Z400 модулирует огибающую усиления синтезированного высокополосного сигнала на основе набора коэффициентов усиления. Например, задача Z400 может быть сконфигурирована так, чтобы модулировать огибающую усиления синтезированного высокополосного сигнала посредством применения набора коэффициентов усиления к сигналу возбуждения, извлеченному из узкополосной части, к спектрально расширенному сигналу, к высокополосному сигналу возбуждения или к синтезированному высокополосному сигналу.
Варианты осуществления также включают в себя дополнительные способы речевого кодирования, шифрования и декодирования как явно раскрытые в данном документе, к примеру, посредством описания структурных вариантов осуществления, сконфигурированных так, чтобы выполнять эти способы. Каждый из этих способов также может быть материально осуществлен (например, на одном или более носителей данных, перечисленных выше) как один или более наборов команд, читаемых и/или приводимых в исполнение посредством машины, включающей в себя матрицу логических элементов (к примеру, процессор, микропроцессор, микроконтроллер или другой конечный автомат). Таким образом, настоящее изобретение не предназначено для того, чтобы быть ограниченным проиллюстрированными выше вариантами осуществления, а, наоборот, должно допускать наиболее широкий объем, согласованный с принципами и новыми признаками, раскрытыми каким-либо образом в данном документе, в том числе в прилагаемой формуле изобретения, которая составляет часть первоначального раскрытия.
Claims (33)
1. Устройство для кодирования широкополосного речевого сигнала, содержащее гребенку фильтров, имеющую (А) тракт обработки полосы низких частот, выполненный с возможностью приема широкополосного речевого сигнала, имеющего частотный спектр, по меньшей мере, между 1000 и 6000 Гц, и формирования речевого сигнала полосы низких частот, и (В) тракт обработки полосы высоких частот, выполненный с возможностью приема широкополосного речевого сигнала и формирования речевого сигнала полосы высоких частот;
узкополосный речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы низких частот;
высокополосный речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы высоких частот;
причем речевой сигнал полосы низких частот основан на первой части частотного спектра широкополосного сигнала, при этом первая часть включает в себя часть широкополосного сигнала между 1000 и 2000 Гц, а
речевой сигнал полосы высоких частот основан на второй части частотного спектра широкополосного сигнала, причем вторая часть включает в себя часть широкополосного сигнала между 5000 и 6000 Гц, и
при этом каждый из речевого сигнала полосы низких частот и речевого сигнала полосы высоких частот основан на третьей части частотного спектра широкополосного сигнала, причем третья часть включает в себя часть широкополосного сигнала между 2000 и 5000 Гц, которая имеет ширину, по меньшей мере, 250 Гц.
узкополосный речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы низких частот;
высокополосный речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы высоких частот;
причем речевой сигнал полосы низких частот основан на первой части частотного спектра широкополосного сигнала, при этом первая часть включает в себя часть широкополосного сигнала между 1000 и 2000 Гц, а
речевой сигнал полосы высоких частот основан на второй части частотного спектра широкополосного сигнала, причем вторая часть включает в себя часть широкополосного сигнала между 5000 и 6000 Гц, и
при этом каждый из речевого сигнала полосы низких частот и речевого сигнала полосы высоких частот основан на третьей части частотного спектра широкополосного сигнала, причем третья часть включает в себя часть широкополосного сигнала между 2000 и 5000 Гц, которая имеет ширину, по меньшей мере, 250 Гц.
2. Устройство по п.1, в котором третья часть широкополосного сигнала включает в себя часть широкополосного сигнала между 3000 и 4000 Гц, которая имеет ширину, по меньшей мере, 250 Гц.
3. Устройство по п.2, в котором третья часть имеет ширину, по меньшей мере, 400 Гц.
4. Устройство по п.2, в котором речевой сигнал полосы низких частот включает в себя частотный спектр первой части и частотный спектр третьей части, а речевой сигнал полосы высоких частот включает в себя частотный спектр второй части и частотный спектр третьей части.
5. Устройство по п.1, в котором речевой сигнал полосы низких частот и речевой сигнал полосы высоких частот имеют различные частоты дискретизации.
6. Устройство по п.1, в котором сумма частот дискретизации речевого сигнала полосы низких частот и речевого сигнала полосы высоких частот не превышает частоту дискретизации широкополосного сигнала.
7. Устройство по п.1, причем упомянутое устройство содержит сотовый телефон.
8. Устройство по п.1, в котором узкополосный речевой кодер выполнен с возможностью кодирования речевого сигнала полосы низких частот, по меньшей мере, в кодированный сигнал возбуждения полосы низких частот и множество параметров фильтра полосы низких частот, и высокополосный речевой кодер выполнен с возможностью формирования сигнала возбуждения полосы высоких частот на основе кодированного сигнала возбуждения полосы низких частот и кодирования сигнала полосы высоких частот, согласно сигналу возбуждения полосы высоких частот, по меньшей мере, во множество параметров фильтра полосы высоких частот.
9. Устройство по п.8, в котором высокополосный речевой кодер выполнен с возможностью кодирования сигнала полосы высоких частот, по меньшей мере, во множество параметров фильтра полосы высоких частот и множество коэффициентов усиления.
10. Устройство по п.8, при этом упомянутое устройство содержит устройство, сконфигурированное с возможностью передачи множества пакетов, совместимых с версией Интернет-протокола, при этом множество пакетов описывает кодированный сигнал возбуждения полосы низких частот, множество параметров фильтра полосы низких частот и множество параметров фильтра полосы высоких частот.
11. Устройство для кодирования широкополосного речевого сигнала, содержащее
гребенку фильтров, имеющую (А) тракт обработки полосы низких частот, выполненный с возможностью приема широкополосного речевого сигнала и формирования речевого сигнала полосы низких частот на основе низкочастотной части широкополосного речевого сигнала, и (В) тракт обработки полосы высоких частот, выполненный с возможностью приема широкополосного речевого сигнала и формирования речевого сигнала полосы высоких частот на основе высокочастотной части широкополосного речевого сигнала, при этом полоса пропускания тракта обработки полосы низких частот перекрывает полосу пропускания тракта обработки полосы высоких частот;
узкополосный речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы низких частот, по меньшей мере, в кодированный сигнал возбуждения полосы низких частот и множество параметров фильтра полосы низких частот; и
высокополосный речевой кодер, выполненный с возможностью формирования сигнала возбуждения полосы высоких частот на основе кодированного сигнала возбуждения полосы низких частот и кодирования сигнала полосы высоких частот, согласно сигналу возбуждения полосы высоких частот, по меньшей мере, во множество параметров фильтра полосы высоких частот.
гребенку фильтров, имеющую (А) тракт обработки полосы низких частот, выполненный с возможностью приема широкополосного речевого сигнала и формирования речевого сигнала полосы низких частот на основе низкочастотной части широкополосного речевого сигнала, и (В) тракт обработки полосы высоких частот, выполненный с возможностью приема широкополосного речевого сигнала и формирования речевого сигнала полосы высоких частот на основе высокочастотной части широкополосного речевого сигнала, при этом полоса пропускания тракта обработки полосы низких частот перекрывает полосу пропускания тракта обработки полосы высоких частот;
узкополосный речевой кодер, выполненный с возможностью кодирования речевого сигнала полосы низких частот, по меньшей мере, в кодированный сигнал возбуждения полосы низких частот и множество параметров фильтра полосы низких частот; и
высокополосный речевой кодер, выполненный с возможностью формирования сигнала возбуждения полосы высоких частот на основе кодированного сигнала возбуждения полосы низких частот и кодирования сигнала полосы высоких частот, согласно сигналу возбуждения полосы высоких частот, по меньшей мере, во множество параметров фильтра полосы высоких частот.
12. Устройство по п.11, в котором высокополосный речевой кодер выполнен с возможностью формирования сигнала возбуждения полосы высоких частот посредством применения нелинейной функции к сигналу, который основан на кодированном сигнале возбуждения полосы низких частот для формирования спектрально расширенного сигнала, и
при этом сигнал возбуждения полосы высоких частот основан на спектрально расширенном сигнале.
при этом сигнал возбуждения полосы высоких частот основан на спектрально расширенном сигнале.
13. Устройство по п.11, в котором высокополосный речевой кодер выполнен с возможностью кодирования огибающей усиления сигнала полосы высоких частот.
14. Устройство по п.13, в котором высокополосный речевой кодер выполнен с возможностью формирования синтезированного сигнала полосы высоких частот согласно сигналу возбуждения полосы высоких частот и множеству параметров фильтра полосы высоких частот, и при этом высокополосный речевой кодер выполнен с возможностью кодирования огибающей усиления на основе синтезированного сигнала полосы высоких частот.
15. Устройство по п.14, в котором высокополосный кодер выполнен с возможностью кодирования огибающей усиления на основе соотношения между сигналом полосы высоких частот и синтезированным сигналом полосы высоких частот.
16. Устройство по п.11, в котором полоса пропускания тракта обработки полосы низких частот перекрывает полосу пропускания тракта обработки полосы высоких частот, по меньшей мере, на 200 Гц.
17. Устройство по п.11, в котором полоса пропускания тракта обработки полосы низких частот перекрывает полосу пропускания тракта обработки полосы высоких частот примерно на 500 Гц.
18. Устройство по п.11, в котором полоса пропускания тракта обработки полосы низких частот перекрывает полосу пропускания тракта обработки полосы высоких частот примерно на 400-600 Гц.
19. Устройство по п.11, в котором полоса пропускания тракта обработки полосы низких частот перекрывает полосу пропускания тракта обработки полосы высоких частот примерно на 400-1000 Гц.
20. Устройство по п.11, в котором перекрытие включает в себя, по меньшей мере, часть частотного диапазона примерно в 2000-5000 Гц.
21. Устройство по п.11, в котором перекрытие включает в себя, по меньшей мере, часть частотного диапазона примерно в 3000-4000 Гц.
22. Устройство по п.11, в котором речевой сигнал полосы низких частот и речевой сигнал полосы высоких частот имеют различные частоты дискретизации.
23. Устройство по п.11, в котором сумма частот дискретизации речевого сигнала полосы низких частот и речевого сигнала полосы высоких частот не превышает частоту дискретизации широкополосного сигнала.
24. Устройство по п.11, причем упомянутое устройство содержит сотовый телефон.
25. Устройство по п.11, причем упомянутое устройство содержит устройство, сконфигурированное с возможностью передачи множества пакетов, совместимых с версией Интернет-протокола, при этом множество пакетов описывает кодированный сигнал возбуждения полосы низких частот, множество параметров фильтра полосы низких частот и множество параметров фильтра полосы высоких частот.
26. Способ обработки сигналов, содержащий этапы, на которых формируют речевой сигнал полосы низких частот на основе широкополосного речевого сигнала, имеющего частотный спектр, по меньшей мере, между 1000 и 6000 Гц;
кодируют речевой сигнал полосы низких частот;
формируют речевой сигнал полосы высоких частот на основе широкополосного речевого сигнала; и
кодируют речевой сигнал полосы высоких частот;
при этом этап формирования речевого сигнала полосы низких частот включает в себя этап, на котором формируют речевой сигнал полосы низких частот на основе (А) первой части частотного спектра широкополосного сигнала, при этом первая часть включает в себя часть широкополосного сигнала между 1000 и 2000 Гц, и (В) третьей части частотного спектра широкополосного сигнала, при этом третья часть включает в себя часть широкополосного сигнала между 2000 и 5000 Гц, которая имеет ширину, по меньшей мере, 250 Гц, а
этап формирования речевого сигнала полосы высоких частот включает в себя этап, на котором формируют речевой сигнал полосы высоких частот на основе (С) второй части частотного спектра широкополосного сигнала, при этом вторая часть включает в себя часть широкополосного сигнала между 5000 и 6000 Гц, и (D) третьей части частотного спектра широкополосного сигнала.
кодируют речевой сигнал полосы низких частот;
формируют речевой сигнал полосы высоких частот на основе широкополосного речевого сигнала; и
кодируют речевой сигнал полосы высоких частот;
при этом этап формирования речевого сигнала полосы низких частот включает в себя этап, на котором формируют речевой сигнал полосы низких частот на основе (А) первой части частотного спектра широкополосного сигнала, при этом первая часть включает в себя часть широкополосного сигнала между 1000 и 2000 Гц, и (В) третьей части частотного спектра широкополосного сигнала, при этом третья часть включает в себя часть широкополосного сигнала между 2000 и 5000 Гц, которая имеет ширину, по меньшей мере, 250 Гц, а
этап формирования речевого сигнала полосы высоких частот включает в себя этап, на котором формируют речевой сигнал полосы высоких частот на основе (С) второй части частотного спектра широкополосного сигнала, при этом вторая часть включает в себя часть широкополосного сигнала между 5000 и 6000 Гц, и (D) третьей части частотного спектра широкополосного сигнала.
27. Способ по п.26, в котором третья часть широкополосного сигнала включает в себя часть широкополосного сигнала между 3000 и 4000 Гц, которая имеет ширину, по меньшей мере, 250 Гц.
28. Способ по п.26, в котором третья часть имеет ширину, по меньшей мере, 400 Гц.
29. Способ по п.26, в котором речевой сигнал полосы низких частот включает в себя частотный спектр первой части и частотный спектр третьей части, и речевой сигнал полосы высоких частот включает в себя частотный спектр второй части и частотный спектр третьей части.
30. Способ по п.26, в котором речевой сигнал полосы низких частот и речевой сигнал полосы высоких частот имеют различные частоты дискретизации.
31. Способ по п.26, в котором сумма частот дискретизации речевого сигнала полосы низких частот и речевого сигнала полосы высоких частот не превышает частоту дискретизации широкополосного сигнала.
32. Способ по п.26, дополнительно содержит этапы, на которых:
кодируют речевой сигнал полосы низких частот, по меньшей мере, в кодированный сигнал возбуждения полосы низких частот и множество параметров фильтра полосы низких частот;
формируют сигнал возбуждения полосы высоких частот на основе кодированного сигнала возбуждения полосы низких частот; и
кодируют сигнал полосы высоких частот, согласно сигналу возбуждения полосы высоких частот, по меньшей мере, во множество параметров фильтра полосы высоких частот.
кодируют речевой сигнал полосы низких частот, по меньшей мере, в кодированный сигнал возбуждения полосы низких частот и множество параметров фильтра полосы низких частот;
формируют сигнал возбуждения полосы высоких частот на основе кодированного сигнала возбуждения полосы низких частот; и
кодируют сигнал полосы высоких частот, согласно сигналу возбуждения полосы высоких частот, по меньшей мере, во множество параметров фильтра полосы высоких частот.
33. Способ по п.26, в котором сигнал полосы высоких частот кодируют, по меньшей мере, во множество параметров фильтра полосы высоких частот и множество коэффициентов усиления.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66790105P | 2005-04-01 | 2005-04-01 | |
US60/667,901 | 2005-04-01 | ||
US67396505P | 2005-04-22 | 2005-04-22 | |
US60/673,965 | 2005-04-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2007140381A RU2007140381A (ru) | 2009-05-10 |
RU2386179C2 true RU2386179C2 (ru) | 2010-04-10 |
Family
ID=36588741
Family Applications (9)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2009131435/08A RU2491659C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140394/09A RU2413191C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для устраняющей разреженность фильтрации |
RU2007140383/09A RU2402826C2 (ru) | 2005-04-01 | 2006-04-03 | Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот |
RU2007140426/09A RU2402827C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот |
RU2007140429/09A RU2387025C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для векторного квантования спектрального представления огибающей |
RU2007140382/09A RU2381572C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство широкополосного речевого кодирования |
RU2007140406/09A RU2390856C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для подавления высокополосных всплесков |
RU2007140381/09A RU2386179C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для кодирования речевых сигналов с расщеплением полосы |
RU2007140365/09A RU2376657C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
Family Applications Before (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2009131435/08A RU2491659C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140394/09A RU2413191C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для устраняющей разреженность фильтрации |
RU2007140383/09A RU2402826C2 (ru) | 2005-04-01 | 2006-04-03 | Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот |
RU2007140426/09A RU2402827C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот |
RU2007140429/09A RU2387025C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для векторного квантования спектрального представления огибающей |
RU2007140382/09A RU2381572C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство широкополосного речевого кодирования |
RU2007140406/09A RU2390856C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для подавления высокополосных всплесков |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007140365/09A RU2376657C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
Country Status (24)
Country | Link |
---|---|
US (8) | US8484036B2 (ru) |
EP (8) | EP1866915B1 (ru) |
JP (8) | JP5129118B2 (ru) |
KR (8) | KR100956877B1 (ru) |
CN (1) | CN102411935B (ru) |
AT (4) | ATE492016T1 (ru) |
AU (8) | AU2006232357C1 (ru) |
BR (8) | BRPI0608305B1 (ru) |
CA (8) | CA2603255C (ru) |
DE (4) | DE602006017050D1 (ru) |
DK (2) | DK1864101T3 (ru) |
ES (3) | ES2636443T3 (ru) |
HK (5) | HK1113848A1 (ru) |
IL (8) | IL186439A0 (ru) |
MX (8) | MX2007012184A (ru) |
NO (7) | NO20075503L (ru) |
NZ (6) | NZ562183A (ru) |
PL (4) | PL1864282T3 (ru) |
PT (2) | PT1864282T (ru) |
RU (9) | RU2491659C2 (ru) |
SG (4) | SG161224A1 (ru) |
SI (1) | SI1864282T1 (ru) |
TW (8) | TWI321777B (ru) |
WO (8) | WO2006107833A1 (ru) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9472208B2 (en) | 2012-08-31 | 2016-10-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
RU2642894C2 (ru) * | 2013-06-21 | 2018-01-29 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии |
RU2801960C1 (ru) * | 2010-09-16 | 2023-08-21 | Долби Интернешнл Аб | Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями |
US11817110B2 (en) | 2010-09-16 | 2023-11-14 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
Families Citing this family (322)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7987095B2 (en) * | 2002-09-27 | 2011-07-26 | Broadcom Corporation | Method and system for dual mode subband acoustic echo canceller with integrated noise suppression |
US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
JP4679049B2 (ja) | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
US7668712B2 (en) | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
WO2005111568A1 (ja) * | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
WO2006009074A1 (ja) * | 2004-07-20 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声復号化装置および補償フレーム生成方法 |
ATE488838T1 (de) * | 2004-08-30 | 2010-12-15 | Qualcomm Inc | Verfahren und vorrichtung für einen adaptiven de- jitter-puffer |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
WO2006103488A1 (en) * | 2005-03-30 | 2006-10-05 | Nokia Corporation | Source coding and/or decoding |
SG161224A1 (en) * | 2005-04-01 | 2010-05-27 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
SI1875463T1 (sl) * | 2005-04-22 | 2019-02-28 | Qualcomm Incorporated | Sistemi, postopki in naprava za glajenje faktorja ojačenja |
DK1869671T3 (da) * | 2005-04-28 | 2009-10-19 | Siemens Ag | Fremgangsmåde og anordning til stöjundertrykkelse |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
JP2009501353A (ja) * | 2005-07-14 | 2009-01-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号合成 |
WO2007013973A2 (en) * | 2005-07-20 | 2007-02-01 | Shattil, Steve | Systems and method for high data rate ultra wideband communication |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
US8326614B2 (en) * | 2005-09-02 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement system |
CA2558595C (en) * | 2005-09-02 | 2015-05-26 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
WO2007037361A1 (ja) * | 2005-09-30 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
EP1953737B1 (en) | 2005-10-14 | 2012-10-03 | Panasonic Corporation | Transform coder and transform coding method |
JPWO2007043643A1 (ja) * | 2005-10-14 | 2009-04-16 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、及び音声復号化方法 |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8135047B2 (en) | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
DE602007012116D1 (de) * | 2006-08-15 | 2011-03-03 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
KR101008508B1 (ko) * | 2006-08-15 | 2011-01-17 | 브로드콤 코포레이션 | 패킷 손실 후의 디코더 상태의 리페이징 |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US8046218B2 (en) * | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
JP4972742B2 (ja) * | 2006-10-17 | 2012-07-11 | 国立大学法人九州工業大学 | 高域信号補間方法及び高域信号補間装置 |
USRE50132E1 (en) | 2006-10-25 | 2024-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
USRE50158E1 (en) | 2006-10-25 | 2024-10-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
KR101375582B1 (ko) | 2006-11-17 | 2014-03-20 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8639500B2 (en) | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
US20080147389A1 (en) * | 2006-12-15 | 2008-06-19 | Motorola, Inc. | Method and Apparatus for Robust Speech Activity Detection |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
PL3591650T3 (pl) * | 2007-08-27 | 2021-07-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Sposób i urządzenie do wypełniania dziur widmowych |
FR2920545B1 (fr) * | 2007-09-03 | 2011-06-10 | Univ Sud Toulon Var | Procede de trajectographie de plusieurs cetaces par acoustique passive |
RU2449386C2 (ru) * | 2007-11-02 | 2012-04-27 | Хуавэй Текнолоджиз Ко., Лтд. | Способ и устройство для аудиодекодирования |
WO2009059632A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
US20100274555A1 (en) * | 2007-11-06 | 2010-10-28 | Lasse Laaksonen | Audio Coding Apparatus and Method Thereof |
CN101896967A (zh) * | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 编码器 |
KR101444099B1 (ko) * | 2007-11-13 | 2014-09-26 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
US8504377B2 (en) * | 2007-11-21 | 2013-08-06 | Lg Electronics Inc. | Method and an apparatus for processing a signal using length-adjusted window |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8050934B2 (en) * | 2007-11-29 | 2011-11-01 | Texas Instruments Incorporated | Local pitch control based on seamless time scale modification and synchronized sampling rate conversion |
TWI356399B (en) * | 2007-12-14 | 2012-01-11 | Ind Tech Res Inst | Speech recognition system and method with cepstral |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
US20100280833A1 (en) * | 2007-12-27 | 2010-11-04 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
WO2009116815A2 (en) * | 2008-03-20 | 2009-09-24 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding using bandwidth extension in portable terminal |
WO2010003068A1 (en) * | 2008-07-03 | 2010-01-07 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
CA2972808C (en) * | 2008-07-10 | 2018-12-18 | Voiceage Corporation | Multi-reference lpc filter quantization and inverse quantization device and method |
RU2536679C2 (ru) | 2008-07-11 | 2014-12-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
AU2009267529B2 (en) * | 2008-07-11 | 2011-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101614160B1 (ko) | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
WO2010011963A1 (en) * | 2008-07-25 | 2010-01-28 | The Board Of Trustees Of The University Of Illinois | Methods and systems for identifying speech sounds using multi-dimensional analysis |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
US8532998B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
US8407046B2 (en) * | 2008-09-06 | 2013-03-26 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
US20100070550A1 (en) * | 2008-09-12 | 2010-03-18 | Cardinal Health 209 Inc. | Method and apparatus of a sensor amplifier configured for use in medical applications |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
EP2224433B1 (en) * | 2008-09-25 | 2020-05-27 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
DE102008058496B4 (de) * | 2008-11-21 | 2010-09-09 | Siemens Medical Instruments Pte. Ltd. | Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
JP5423684B2 (ja) * | 2008-12-19 | 2014-02-19 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
ES2904373T3 (es) * | 2009-01-16 | 2022-04-04 | Dolby Int Ab | Transposición armónica mejorada de producto cruzado |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2555191A1 (en) * | 2009-03-31 | 2013-02-06 | Huawei Technologies Co., Ltd. | Method and device for audio signal denoising |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
JP4921611B2 (ja) * | 2009-04-03 | 2012-04-25 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102460574A (zh) * | 2009-05-19 | 2012-05-16 | 韩国电子通信研究院 | 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备 |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
WO2011029484A1 (en) * | 2009-09-14 | 2011-03-17 | Nokia Corporation | Signal enhancement processing |
US9595257B2 (en) * | 2009-09-28 | 2017-03-14 | Nuance Communications, Inc. | Downsampling schemes in a hierarchical neural network structure for phoneme recognition |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102667921B (zh) | 2009-10-20 | 2014-09-10 | 弗兰霍菲尔运输应用研究公司 | 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法 |
CN102257567B (zh) | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
CN103559890B (zh) * | 2009-10-21 | 2017-05-24 | 杜比国际公司 | 组合换位滤波器组的过采样 |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
EP2502230B1 (en) * | 2009-11-19 | 2014-05-21 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved excitation signal bandwidth extension |
EP2502231B1 (en) * | 2009-11-19 | 2014-06-04 | Telefonaktiebolaget L M Ericsson (PUBL) | Bandwidth extension of a low band audio signal |
US8489393B2 (en) * | 2009-11-23 | 2013-07-16 | Cambridge Silicon Radio Limited | Speech intelligibility |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
RU2464651C2 (ru) * | 2009-12-22 | 2012-10-20 | Общество с ограниченной ответственностью "Спирит Корп" | Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов |
US8559749B2 (en) * | 2010-01-06 | 2013-10-15 | Streaming Appliances, Llc | Audiovisual content delivery system |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
EP2517200B1 (en) | 2010-01-12 | 2015-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value |
US8699727B2 (en) | 2010-01-15 | 2014-04-15 | Apple Inc. | Visually-assisted mixing of audio using a spectral analyzer |
US9525569B2 (en) * | 2010-03-03 | 2016-12-20 | Skype | Enhanced circuit-switched calls |
CA2792500C (en) * | 2010-03-10 | 2016-05-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding |
US8700391B1 (en) * | 2010-04-01 | 2014-04-15 | Audience, Inc. | Low complexity bandwidth expansion of speech |
EP2559026A1 (en) * | 2010-04-12 | 2013-02-20 | Freescale Semiconductor, Inc. | Audio communication device, method for outputting an audio signal, and communication system |
JP5719922B2 (ja) * | 2010-04-13 | 2015-05-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | サンプルごとに正確なオーディオ信号表現のための方法、エンコーダ及びデコーダ |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
MY162594A (en) * | 2010-04-14 | 2017-06-30 | Voiceage Corp | Flexible and scalable combined innovation codebook for use in celp coder and decoder |
WO2011128399A1 (en) * | 2010-04-16 | 2011-10-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9378754B1 (en) | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101660843B1 (ko) * | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
ES2372202B2 (es) * | 2010-06-29 | 2012-08-08 | Universidad De Málaga | Sistema de reconocimiento de sonidos de bajo consumo. |
CN105244035B (zh) | 2010-07-02 | 2019-03-12 | 杜比国际公司 | 选择性低音后置滤波器 |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
US8977542B2 (en) | 2010-07-16 | 2015-03-10 | Telefonaktiebolaget L M Ericsson (Publ) | Audio encoder and decoder and methods for encoding and decoding an audio signal |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US20130310422A1 (en) | 2010-09-01 | 2013-11-21 | The General Hospital Corporation | Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US8924200B2 (en) | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
WO2012053149A1 (ja) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
WO2012110447A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
AR085221A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada |
ES2458436T3 (es) | 2011-02-14 | 2014-05-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Representación de señal de información utilizando transformada superpuesta |
SG192747A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Encoding and decoding of pulse positions of tracks of an audio signal |
MY160272A (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Audio Codec Using Noise Synthesis During Inactive Phases |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
AR085362A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral |
WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
KR101624019B1 (ko) * | 2011-02-14 | 2016-06-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코덱에서 잡음 생성 |
US9343076B2 (en) | 2011-02-16 | 2016-05-17 | Dolby Laboratories Licensing Corporation | Methods and systems for generating filter coefficients and configuring filters |
DK3407352T3 (da) * | 2011-02-18 | 2022-06-07 | Ntt Docomo Inc | Taleafkoder, talekoder, taleafkodningsfremgangsmåde, talekodningsfremgangsmåde, taleafkodningsprogram og talekodningsprogram |
US9026450B2 (en) | 2011-03-09 | 2015-05-05 | Dts Llc | System for dynamically creating and rendering audio objects |
US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9298287B2 (en) | 2011-03-31 | 2016-03-29 | Microsoft Technology Licensing, Llc | Combined activation for natural user interface systems |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
CN102811034A (zh) | 2011-05-31 | 2012-12-05 | 财团法人工业技术研究院 | 信号处理装置及信号处理方法 |
EP2709103B1 (en) * | 2011-06-09 | 2015-10-07 | Panasonic Intellectual Property Corporation of America | Voice coding device, voice decoding device, voice coding method and voice decoding method |
US9070361B2 (en) * | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
AU2012276367B2 (en) * | 2011-06-30 | 2016-02-04 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
US9059786B2 (en) * | 2011-07-07 | 2015-06-16 | Vecima Networks Inc. | Ingress suppression for communication systems |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
RU2486636C1 (ru) * | 2011-11-14 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2486637C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486638C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2496222C2 (ru) * | 2011-11-17 | 2013-10-20 | Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486639C1 (ru) * | 2011-11-21 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2496192C2 (ru) * | 2011-11-21 | 2013-10-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2490727C2 (ru) * | 2011-11-28 | 2013-08-20 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) | Способ передачи речевых сигналов (варианты) |
RU2487443C1 (ru) * | 2011-11-29 | 2013-07-10 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ согласования комплексных сопротивлений и устройство его реализации |
JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
US9972325B2 (en) * | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
US9082398B2 (en) * | 2012-02-28 | 2015-07-14 | Huawei Technologies Co., Ltd. | System and method for post excitation enhancement for low bit rate speech coding |
US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
ES2762325T3 (es) | 2012-03-21 | 2020-05-22 | Samsung Electronics Co Ltd | Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda |
WO2013147667A1 (en) * | 2012-03-29 | 2013-10-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Vector quantizer |
US10448161B2 (en) | 2012-04-02 | 2019-10-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field |
JP5998603B2 (ja) * | 2012-04-18 | 2016-09-28 | ソニー株式会社 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
KR101343768B1 (ko) * | 2012-04-19 | 2014-01-16 | 충북대학교 산학협력단 | 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법 |
RU2504898C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
RU2504894C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
US20140006017A1 (en) * | 2012-06-29 | 2014-01-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
WO2014062859A1 (en) * | 2012-10-16 | 2014-04-24 | Audiologicall, Ltd. | Audio signal manipulation for speech enhancement before sound reproduction |
KR101413969B1 (ko) | 2012-12-20 | 2014-07-08 | 삼성전자주식회사 | 오디오 신호의 복호화 방법 및 장치 |
CN105551497B (zh) | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
CN106847297B (zh) | 2013-01-29 | 2020-07-07 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
RU2641461C2 (ru) * | 2013-01-29 | 2018-01-17 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер, аудиодекодер, способ обеспечения кодированной аудиоинформации, способ обеспечения декодированной аудиоинформации, компьютерная программа и кодированное представление с использованием сигнально-адаптивного расширения полосы пропускания |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
BR112015018023B1 (pt) * | 2013-01-29 | 2022-06-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema |
US20140213909A1 (en) * | 2013-01-31 | 2014-07-31 | Xerox Corporation | Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data |
US9741350B2 (en) | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9601125B2 (en) * | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US9336789B2 (en) * | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
US9715885B2 (en) * | 2013-03-05 | 2017-07-25 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
EP2784775B1 (en) * | 2013-03-27 | 2016-09-14 | Binauric SE | Speech signal encoding/decoding method and apparatus |
US9613660B2 (en) | 2013-04-05 | 2017-04-04 | Dts, Inc. | Layered audio reconstruction system |
EP2981958B1 (en) * | 2013-04-05 | 2018-03-07 | Dolby International AB | Audio encoder and decoder |
CN117253498A (zh) * | 2013-04-05 | 2023-12-19 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
PT3011554T (pt) * | 2013-06-21 | 2019-10-24 | Fraunhofer Ges Forschung | Estimação de atraso de tom. |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP3014290A4 (en) | 2013-06-27 | 2017-03-08 | The General Hospital Corporation | Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data |
US10383574B2 (en) | 2013-06-28 | 2019-08-20 | The General Hospital Corporation | Systems and methods to infer brain state during burst suppression |
CN104282308B (zh) * | 2013-07-04 | 2017-07-14 | 华为技术有限公司 | 频域包络的矢量量化方法和装置 |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830063A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for decoding an encoded audio signal |
EP3503095A1 (en) * | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
JP6586093B2 (ja) | 2013-09-13 | 2019-10-02 | ザ ジェネラル ホスピタル コーポレイション | 全身麻酔および鎮静中の改良された脳監視のためのシステム |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
US9224402B2 (en) | 2013-09-30 | 2015-12-29 | International Business Machines Corporation | Wideband speech parameterization for high quality synthesis, transformation and quantization |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) * | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
KR102271852B1 (ko) | 2013-11-02 | 2021-07-01 | 삼성전자주식회사 | 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 |
EP2871641A1 (en) * | 2013-11-12 | 2015-05-13 | Dialog Semiconductor B.V. | Enhancement of narrowband audio signals using a single sideband AM modulation |
JP6345780B2 (ja) | 2013-11-22 | 2018-06-20 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ハイバンドコーディングにおける選択的位相補償 |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
US9564141B2 (en) | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
JP6281336B2 (ja) * | 2014-03-12 | 2018-02-21 | 沖電気工業株式会社 | 音声復号化装置及びプログラム |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
PL3550563T3 (pl) * | 2014-03-31 | 2024-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enkoder, dekoder, sposób enkodowania, sposób dekodowania oraz powiązane programy |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN106409304B (zh) * | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
CN107424622B (zh) | 2014-06-24 | 2020-12-25 | 华为技术有限公司 | 音频编码方法和装置 |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9626983B2 (en) * | 2014-06-26 | 2017-04-18 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
CN105225670B (zh) * | 2014-06-27 | 2016-12-28 | 华为技术有限公司 | 一种音频编码方法和装置 |
US9721584B2 (en) * | 2014-07-14 | 2017-08-01 | Intel IP Corporation | Wind noise reduction for audio reception |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP3182412B1 (en) * | 2014-08-15 | 2023-06-07 | Samsung Electronics Co., Ltd. | Sound quality improving method and device, sound decoding method and device, and multimedia device employing same |
CN104217730B (zh) * | 2014-08-18 | 2017-07-21 | 大连理工大学 | 一种基于k‑svd的人工语音带宽扩展方法及装置 |
US9978388B2 (en) | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
TWI550945B (zh) * | 2014-12-22 | 2016-09-21 | 國立彰化師範大學 | 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器 |
US9595269B2 (en) * | 2015-01-19 | 2017-03-14 | Qualcomm Incorporated | Scaling for gain shape circuitry |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
CN107517593B (zh) * | 2015-02-26 | 2021-03-12 | 弗劳恩霍夫应用研究促进协会 | 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US9830921B2 (en) * | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
NO339664B1 (en) | 2015-10-15 | 2017-01-23 | St Tech As | A system for isolating an object |
CN107924683B (zh) * | 2015-10-15 | 2021-03-30 | 华为技术有限公司 | 正弦编码和解码的方法和装置 |
BR112017024480A2 (pt) * | 2016-02-17 | 2018-07-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | pós-processador, pré-processador, codificador de áudio, decodificador de áudio e métodos relacionados para aprimoramento do processamento transiente |
FR3049084B1 (fr) | 2016-03-15 | 2022-11-11 | Fraunhofer Ges Forschung | Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code |
WO2017178329A1 (en) * | 2016-04-12 | 2017-10-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band |
US20170330575A1 (en) * | 2016-05-10 | 2017-11-16 | Immersion Services LLC | Adaptive audio codec system, method and article |
JP7005036B2 (ja) * | 2016-05-10 | 2022-01-21 | イマージョン・ネットワークス・インコーポレイテッド | 適応オーディオコーデックシステム、方法および媒体 |
US10770088B2 (en) * | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
US10699725B2 (en) * | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
US10756755B2 (en) * | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
US10264116B2 (en) * | 2016-11-02 | 2019-04-16 | Nokia Technologies Oy | Virtual duplex operation |
KR102507383B1 (ko) * | 2016-11-08 | 2023-03-08 | 한국전자통신연구원 | 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템 |
WO2018102402A1 (en) | 2016-11-29 | 2018-06-07 | The General Hospital Corporation | Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments |
PL3555885T3 (pl) | 2016-12-16 | 2021-01-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Sposób i koder do obsługi współczynników reprezentacji obwiedni |
PT3472964T (pt) | 2017-01-06 | 2020-04-03 | Ericsson Telefon Ab L M | Métodos e aparelhos para sinalização e determinação de deslocamentos de sinal de referência |
KR102687184B1 (ko) * | 2017-02-10 | 2024-07-19 | 삼성전자주식회사 | Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법 |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
US10304468B2 (en) * | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
TW202341126A (zh) * | 2017-03-23 | 2023-10-16 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
US10764101B2 (en) * | 2017-10-27 | 2020-09-01 | Terawave, Llc | High spectral efficiency data communications system using encoded sinusoidal waveforms |
US11876659B2 (en) | 2017-10-27 | 2024-01-16 | Terawave, Llc | Communication system using shape-shifted sinusoidal waveforms |
CN109729553B (zh) * | 2017-10-30 | 2021-12-28 | 成都鼎桥通信技术有限公司 | Lte集群通信系统的语音业务处理方法及设备 |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US10460749B1 (en) * | 2018-06-28 | 2019-10-29 | Nuvoton Technology Corporation | Voice activity detection using vocal tract area information |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
WO2020171034A1 (ja) * | 2019-02-20 | 2020-08-27 | ヤマハ株式会社 | 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム |
CN110610713B (zh) * | 2019-08-28 | 2021-11-16 | 南京梧桐微电子科技有限公司 | 一种声码器余量谱幅度参数重构方法及系统 |
US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
TWI723545B (zh) * | 2019-09-17 | 2021-04-01 | 宏碁股份有限公司 | 語音處理方法及其裝置 |
US11295751B2 (en) * | 2019-09-20 | 2022-04-05 | Tencent America LLC | Multi-band synchronized neural vocoder |
KR102201169B1 (ko) * | 2019-10-23 | 2021-01-11 | 성균관대학교 산학협력단 | 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법 |
CN114548442B (zh) * | 2022-02-25 | 2022-10-21 | 万表名匠(广州)科技有限公司 | 一种基于互联网技术的腕表维修管理系统 |
Family Cites Families (148)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US525147A (en) * | 1894-08-28 | Steam-cooker | ||
US596689A (en) * | 1898-01-04 | Hose holder or support | ||
US526468A (en) * | 1894-09-25 | Charles d | ||
US321993A (en) * | 1885-07-14 | Lantern | ||
US1126620A (en) * | 1911-01-30 | 1915-01-26 | Safety Car Heating & Lighting | Electric regulation. |
US1089258A (en) * | 1914-01-13 | 1914-03-03 | James Arnot Paterson | Facing or milling machine. |
US1300833A (en) * | 1918-12-12 | 1919-04-15 | Moline Mill Mfg Company | Idler-pulley structure. |
US1498873A (en) * | 1924-04-19 | 1924-06-24 | Bethlehem Steel Corp | Switch stand |
US2073913A (en) * | 1934-06-26 | 1937-03-16 | Wigan Edmund Ramsay | Means for gauging minute displacements |
US2086867A (en) * | 1936-06-19 | 1937-07-13 | Hall Lab Inc | Laundering composition and process |
US3044777A (en) * | 1959-10-19 | 1962-07-17 | Fibermold Corp | Bowling pin |
US3158693A (en) * | 1962-08-07 | 1964-11-24 | Bell Telephone Labor Inc | Speech interpolation communication system |
US3855416A (en) * | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
US3855414A (en) | 1973-04-24 | 1974-12-17 | Anaconda Co | Cable armor clamp |
JPS59139099A (ja) * | 1983-01-31 | 1984-08-09 | 株式会社東芝 | 音声区間検出装置 |
US4616659A (en) | 1985-05-06 | 1986-10-14 | At&T Bell Laboratories | Heart rate detection utilizing autoregressive analysis |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4747143A (en) | 1985-07-12 | 1988-05-24 | Westinghouse Electric Corp. | Speech enhancement system having dynamic gain control |
NL8503152A (nl) * | 1985-11-15 | 1987-06-01 | Optische Ind De Oude Delft Nv | Dosismeter voor ioniserende straling. |
US4862168A (en) * | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
US4805193A (en) * | 1987-06-04 | 1989-02-14 | Motorola, Inc. | Protection of energy information in sub-band coding |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
JP2707564B2 (ja) | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
US5285520A (en) * | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
US5077798A (en) * | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
US5086475A (en) | 1988-11-19 | 1992-02-04 | Sony Corporation | Apparatus for generating, recording or reproducing sound source data |
JPH02244100A (ja) | 1989-03-16 | 1990-09-28 | Ricoh Co Ltd | 駆動音源信号生成装置 |
BR9105987A (pt) | 1990-09-19 | 1993-02-02 | Philips Nv | Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro |
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3191457B2 (ja) * | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
PL173718B1 (pl) | 1993-06-30 | 1998-04-30 | Sony Corp | Sposób i urządzenie do kodowania sygnałów cyfrowych |
WO1995010760A2 (en) * | 1993-10-08 | 1995-04-20 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5487087A (en) * | 1994-05-17 | 1996-01-23 | Texas Instruments Incorporated | Signal quantizer with reduced output fluctuation |
US5797118A (en) | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
JP2770137B2 (ja) | 1994-09-22 | 1998-06-25 | 日本プレシジョン・サーキッツ株式会社 | 波形データ圧縮装置 |
US5699477A (en) * | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
FI97182C (fi) * | 1994-12-05 | 1996-10-25 | Nokia Telecommunications Oy | Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin |
JP3365113B2 (ja) * | 1994-12-22 | 2003-01-08 | ソニー株式会社 | 音声レベル制御装置 |
JP2956548B2 (ja) | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP2798003B2 (ja) * | 1995-05-09 | 1998-09-17 | 松下電器産業株式会社 | 音声帯域拡大装置および音声帯域拡大方法 |
JP3189614B2 (ja) * | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
EP0732687B2 (en) * | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US5706395A (en) | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
JP3334419B2 (ja) * | 1995-04-20 | 2002-10-15 | ソニー株式会社 | ノイズ低減方法及びノイズ低減装置 |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US6097824A (en) * | 1997-06-06 | 2000-08-01 | Audiologic, Incorporated | Continuous frequency dynamic range audio compressor |
EP0768569B1 (en) * | 1995-10-16 | 2003-04-02 | Agfa-Gevaert | New class of yellow dyes for use in photographic materials |
JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US5737716A (en) * | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
JP3073919B2 (ja) * | 1995-12-30 | 2000-08-07 | 松下電器産業株式会社 | 同期装置 |
US5689615A (en) | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
TW307960B (en) * | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
TW416044B (en) * | 1996-06-19 | 2000-12-21 | Texas Instruments Inc | Adaptive filter and filtering method for low bit rate coding |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
CN1170269C (zh) | 1996-11-07 | 2004-10-06 | 松下电器产业株式会社 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
US6009395A (en) | 1997-01-02 | 1999-12-28 | Texas Instruments Incorporated | Synthesizer and method using scaled excitation signal |
US6202046B1 (en) * | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US6041297A (en) | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
US5890126A (en) * | 1997-03-10 | 1999-03-30 | Euphonics, Incorporated | Audio data decompression and interpolation apparatus and method |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US6029125A (en) * | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US6231516B1 (en) * | 1997-10-14 | 2001-05-15 | Vacusense, Inc. | Endoluminal implant with therapeutic and diagnostic capability |
JPH11205166A (ja) * | 1998-01-19 | 1999-07-30 | Mitsubishi Electric Corp | ノイズ検出装置 |
US6301556B1 (en) | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6385573B1 (en) * | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
JP4170458B2 (ja) * | 1998-08-27 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
US6353808B1 (en) | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
KR20000047944A (ko) | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
JP4354561B2 (ja) | 1999-01-08 | 2009-10-28 | パナソニック株式会社 | オーディオ信号符号化装置及び復号化装置 |
US6223151B1 (en) | 1999-02-10 | 2001-04-24 | Telefon Aktie Bolaget Lm Ericsson | Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders |
US6829360B1 (en) | 1999-05-14 | 2004-12-07 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for expanding band of audio signal |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US6556950B1 (en) | 1999-09-30 | 2003-04-29 | Rockwell Automation Technologies, Inc. | Diagnostic method and apparatus for use with enterprise control |
US6715125B1 (en) | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
CN1192355C (zh) | 1999-11-16 | 2005-03-09 | 皇家菲利浦电子有限公司 | 宽带音频传输系统 |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US7260523B2 (en) * | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
AU2547201A (en) * | 2000-01-11 | 2001-07-24 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
US6757395B1 (en) | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US6704711B2 (en) | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6732070B1 (en) * | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
JP3681105B2 (ja) | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
US7330814B2 (en) * | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
ATE265732T1 (de) | 2000-05-22 | 2004-05-15 | Texas Instruments Inc | Vorrichtung und verfahren zur breitbandcodierung von sprachsignalen |
JP2002055699A (ja) * | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
KR100800373B1 (ko) | 2000-08-25 | 2008-02-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 디지털 입력신호의 워드 길이를 축소하는 방법 및 장치와, 그 디지털 입력신호를 회복시키는 방법 및 장치 |
US6515889B1 (en) * | 2000-08-31 | 2003-02-04 | Micron Technology, Inc. | Junction-isolated depletion mode ferroelectric memory |
US7386444B2 (en) * | 2000-09-22 | 2008-06-10 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
JP2002202799A (ja) | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3558031B2 (ja) * | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
WO2002039430A1 (en) | 2000-11-09 | 2002-05-16 | Koninklijke Philips Electronics N.V. | Wideband extension of telephone speech for higher perceptual quality |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
CA2733453C (en) | 2000-11-30 | 2014-10-14 | Panasonic Corporation | Lpc vector quantization apparatus |
GB0031461D0 (en) | 2000-12-22 | 2001-02-07 | Thales Defence Ltd | Communication sets |
US20040204935A1 (en) | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
WO2002093561A1 (de) * | 2001-05-11 | 2002-11-21 | Siemens Aktiengesellschaft | Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals |
CN1235192C (zh) * | 2001-06-28 | 2006-01-04 | 皇家菲利浦电子有限公司 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
JP2003036097A (ja) * | 2001-07-25 | 2003-02-07 | Sony Corp | 情報検出装置及び方法、並びに情報検索装置及び方法 |
TW525147B (en) | 2001-09-28 | 2003-03-21 | Inventec Besta Co Ltd | Method of obtaining and decoding basic cycle of voice |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
TW526468B (en) | 2001-10-19 | 2003-04-01 | Chunghwa Telecom Co Ltd | System and method for eliminating background noise of voice signal |
JP4245288B2 (ja) | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
US20050004803A1 (en) * | 2001-11-23 | 2005-01-06 | Jo Smeets | Audio signal bandwidth extension |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6751587B2 (en) * | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
JP3826813B2 (ja) | 2002-02-18 | 2006-09-27 | ソニー株式会社 | ディジタル信号処理装置及びディジタル信号処理方法 |
WO2004027368A1 (en) | 2002-09-19 | 2004-04-01 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
JP3756864B2 (ja) | 2002-09-30 | 2006-03-15 | 株式会社東芝 | 音声合成方法と装置及び音声合成プログラム |
KR100841096B1 (ko) | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7242763B2 (en) | 2002-11-26 | 2007-07-10 | Lucent Technologies Inc. | Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems |
CA2415105A1 (en) | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100480341B1 (ko) | 2003-03-13 | 2005-03-31 | 한국전자통신연구원 | 광대역 저전송률 음성 신호의 부호화기 |
WO2004097797A1 (en) | 2003-05-01 | 2004-11-11 | Nokia Corporation | Method and device for gain quantization in variable bit rate wideband speech coding |
WO2005004113A1 (ja) | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
FI118550B (fi) * | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
US7428490B2 (en) * | 2003-09-30 | 2008-09-23 | Intel Corporation | Method for spectral subtraction in speech enhancement |
US7698292B2 (en) * | 2003-12-03 | 2010-04-13 | Siemens Aktiengesellschaft | Tag management within a decision, support, and reporting environment |
KR100587953B1 (ko) | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4259401B2 (ja) | 2004-06-02 | 2009-04-30 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
US8000967B2 (en) | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
CN101184979B (zh) | 2005-04-01 | 2012-04-25 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
SG161224A1 (en) | 2005-04-01 | 2010-05-27 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
SI1875463T1 (sl) | 2005-04-22 | 2019-02-28 | Qualcomm Incorporated | Sistemi, postopki in naprava za glajenje faktorja ojačenja |
-
2006
- 2006-04-03 SG SG201002303-4A patent/SG161224A1/en unknown
- 2006-04-03 BR BRPI0608305-6A patent/BRPI0608305B1/pt active IP Right Grant
- 2006-04-03 WO PCT/US2006/012227 patent/WO2006107833A1/en active Application Filing
- 2006-04-03 EP EP06740357A patent/EP1866915B1/en active Active
- 2006-04-03 JP JP2008504480A patent/JP5129118B2/ja active Active
- 2006-04-03 WO PCT/US2006/012232 patent/WO2006107838A1/en active Application Filing
- 2006-04-03 EP EP06740354A patent/EP1866914B1/en active Active
- 2006-04-03 PL PL06740358T patent/PL1864282T3/pl unknown
- 2006-04-03 AT AT06740357T patent/ATE492016T1/de not_active IP Right Cessation
- 2006-04-03 EP EP06740355A patent/EP1869673B1/en active Active
- 2006-04-03 AU AU2006232357A patent/AU2006232357C1/en active Active
- 2006-04-03 AU AU2006252957A patent/AU2006252957B2/en active Active
- 2006-04-03 MX MX2007012184A patent/MX2007012184A/es active IP Right Grant
- 2006-04-03 TW TW095111800A patent/TWI321777B/zh active
- 2006-04-03 AU AU2006232361A patent/AU2006232361B2/en active Active
- 2006-04-03 PT PT67403584T patent/PT1864282T/pt unknown
- 2006-04-03 KR KR1020077025400A patent/KR100956877B1/ko active IP Right Grant
- 2006-04-03 MX MX2007012187A patent/MX2007012187A/es active IP Right Grant
- 2006-04-03 CN CN201110326747.2A patent/CN102411935B/zh active Active
- 2006-04-03 RU RU2009131435/08A patent/RU2491659C2/ru active
- 2006-04-03 TW TW095111797A patent/TWI316225B/zh active
- 2006-04-03 DE DE602006017050T patent/DE602006017050D1/de active Active
- 2006-04-03 CA CA2603255A patent/CA2603255C/en active Active
- 2006-04-03 AT AT06740355T patent/ATE482449T1/de not_active IP Right Cessation
- 2006-04-03 JP JP2008504474A patent/JP5203929B2/ja active Active
- 2006-04-03 TW TW095111852A patent/TWI324335B/zh active
- 2006-04-03 US US11/397,794 patent/US8484036B2/en active Active
- 2006-04-03 KR KR1020077025255A patent/KR100956624B1/ko active IP Right Grant
- 2006-04-03 KR KR1020077025422A patent/KR100956523B1/ko active IP Right Grant
- 2006-04-03 DK DK06784345.8T patent/DK1864101T3/da active
- 2006-04-03 WO PCT/US2006/012230 patent/WO2006107836A1/en active Application Filing
- 2006-04-03 SI SI200632188T patent/SI1864282T1/sl unknown
- 2006-04-03 MX MX2007012189A patent/MX2007012189A/es active IP Right Grant
- 2006-04-03 BR BRPI0609530-5A patent/BRPI0609530B1/pt active IP Right Grant
- 2006-04-03 CA CA2603219A patent/CA2603219C/en active Active
- 2006-04-03 BR BRPI0608306-4A patent/BRPI0608306A2/pt not_active Application Discontinuation
- 2006-04-03 US US11/397,370 patent/US8078474B2/en active Active
- 2006-04-03 WO PCT/US2006/012235 patent/WO2006107840A1/en active Application Filing
- 2006-04-03 WO PCT/US2006/012231 patent/WO2006107837A1/en active Application Filing
- 2006-04-03 BR BRPI0608270-0A patent/BRPI0608270A2/pt not_active Application Discontinuation
- 2006-04-03 SG SG201002300-0A patent/SG161223A1/en unknown
- 2006-04-03 AU AU2006232358A patent/AU2006232358B2/en not_active Expired - Fee Related
- 2006-04-03 PT PT06784345T patent/PT1864101E/pt unknown
- 2006-04-03 NZ NZ562183A patent/NZ562183A/en unknown
- 2006-04-03 EP EP06784345A patent/EP1864101B1/en active Active
- 2006-04-03 DK DK06740358.4T patent/DK1864282T3/en active
- 2006-04-03 CA CA2603231A patent/CA2603231C/en active Active
- 2006-04-03 WO PCT/US2006/012228 patent/WO2006107834A1/en active Application Filing
- 2006-04-03 JP JP2008504482A patent/JP5161069B2/ja active Active
- 2006-04-03 RU RU2007140394/09A patent/RU2413191C2/ru active
- 2006-04-03 CA CA2602806A patent/CA2602806C/en active Active
- 2006-04-03 EP EP06740356A patent/EP1864283B1/en active Active
- 2006-04-03 AU AU2006232360A patent/AU2006232360B2/en active Active
- 2006-04-03 BR BRPI0608269A patent/BRPI0608269B8/pt active IP Right Grant
- 2006-04-03 NZ NZ562182A patent/NZ562182A/xx not_active IP Right Cessation
- 2006-04-03 DE DE602006017673T patent/DE602006017673D1/de active Active
- 2006-04-03 JP JP2008504475A patent/JP5129115B2/ja active Active
- 2006-04-03 AT AT06740354T patent/ATE459958T1/de not_active IP Right Cessation
- 2006-04-03 ES ES06740358.4T patent/ES2636443T3/es active Active
- 2006-04-03 MX MX2007012183A patent/MX2007012183A/es active IP Right Grant
- 2006-04-03 PL PL06740357T patent/PL1866915T3/pl unknown
- 2006-04-03 KR KR1020077025421A patent/KR100956524B1/ko active IP Right Grant
- 2006-04-03 MX MX2007012185A patent/MX2007012185A/es active IP Right Grant
- 2006-04-03 AU AU2006232363A patent/AU2006232363B2/en active Active
- 2006-04-03 WO PCT/US2006/012233 patent/WO2006107839A2/en active Application Filing
- 2006-04-03 KR KR1020077025447A patent/KR101019940B1/ko active IP Right Grant
- 2006-04-03 ES ES06784345T patent/ES2391292T3/es active Active
- 2006-04-03 JP JP2008504481A patent/JP4955649B2/ja active Active
- 2006-04-03 PL PL06740355T patent/PL1869673T3/pl unknown
- 2006-04-03 RU RU2007140383/09A patent/RU2402826C2/ru active
- 2006-04-03 SG SG201004744-7A patent/SG163556A1/en unknown
- 2006-04-03 TW TW095111819A patent/TWI321315B/zh active
- 2006-04-03 SG SG201004741-3A patent/SG163555A1/en unknown
- 2006-04-03 PL PL06784345T patent/PL1864101T3/pl unknown
- 2006-04-03 CA CA2603187A patent/CA2603187C/en active Active
- 2006-04-03 MX MX2007012181A patent/MX2007012181A/es active IP Right Grant
- 2006-04-03 DE DE602006012637T patent/DE602006012637D1/de active Active
- 2006-04-03 RU RU2007140426/09A patent/RU2402827C2/ru active
- 2006-04-03 JP JP2008504478A patent/JP5129117B2/ja active Active
- 2006-04-03 CA CA2603246A patent/CA2603246C/en active Active
- 2006-04-03 BR BRPI0607690A patent/BRPI0607690A8/pt not_active Application Discontinuation
- 2006-04-03 RU RU2007140429/09A patent/RU2387025C2/ru active
- 2006-04-03 US US11/397,871 patent/US8140324B2/en active Active
- 2006-04-03 JP JP2008504479A patent/JP5203930B2/ja active Active
- 2006-04-03 RU RU2007140382/09A patent/RU2381572C2/ru active
- 2006-04-03 EP EP06740358.4A patent/EP1864282B1/en active Active
- 2006-04-03 BR BRPI0607646-7A patent/BRPI0607646B1/pt active IP Right Grant
- 2006-04-03 EP EP06740352A patent/EP1864281A1/en not_active Withdrawn
- 2006-04-03 NZ NZ562186A patent/NZ562186A/xx not_active IP Right Cessation
- 2006-04-03 US US11/397,432 patent/US8364494B2/en active Active
- 2006-04-03 NZ NZ562185A patent/NZ562185A/en not_active IP Right Cessation
- 2006-04-03 AU AU2006232362A patent/AU2006232362B2/en active Active
- 2006-04-03 JP JP2008504477A patent/JP5129116B2/ja active Active
- 2006-04-03 TW TW095111794A patent/TWI320923B/zh active
- 2006-04-03 NZ NZ562188A patent/NZ562188A/en not_active IP Right Cessation
- 2006-04-03 TW TW095111814A patent/TWI330828B/zh active
- 2006-04-03 KR KR1020077025432A patent/KR100956525B1/ko active IP Right Grant
- 2006-04-03 WO PCT/US2006/012234 patent/WO2006130221A1/en active Application Filing
- 2006-04-03 MX MX2007012182A patent/MX2007012182A/es active IP Right Grant
- 2006-04-03 BR BRPI0607691A patent/BRPI0607691B1/pt active IP Right Grant
- 2006-04-03 US US11/397,505 patent/US8332228B2/en active Active
- 2006-04-03 CA CA2602804A patent/CA2602804C/en active Active
- 2006-04-03 ES ES06740354T patent/ES2340608T3/es active Active
- 2006-04-03 US US11/397,870 patent/US8260611B2/en active Active
- 2006-04-03 KR KR1020077025293A patent/KR100982638B1/ko active IP Right Grant
- 2006-04-03 RU RU2007140406/09A patent/RU2390856C2/ru active
- 2006-04-03 KR KR1020077025290A patent/KR100956876B1/ko active IP Right Grant
- 2006-04-03 NZ NZ562190A patent/NZ562190A/en not_active IP Right Cessation
- 2006-04-03 EP EP06740351A patent/EP1869670B1/en active Active
- 2006-04-03 RU RU2007140381/09A patent/RU2386179C2/ru active
- 2006-04-03 MX MX2007012191A patent/MX2007012191A/es active IP Right Grant
- 2006-04-03 TW TW095111851A patent/TWI319565B/zh active
- 2006-04-03 US US11/397,872 patent/US8069040B2/en active Active
- 2006-04-03 US US11/397,433 patent/US8244526B2/en active Active
- 2006-04-03 DE DE602006018884T patent/DE602006018884D1/de active Active
- 2006-04-03 RU RU2007140365/09A patent/RU2376657C2/ru active
- 2006-04-03 TW TW095111804A patent/TWI321314B/zh active
- 2006-04-03 AU AU2006232364A patent/AU2006232364B2/en active Active
- 2006-04-03 AT AT06740351T patent/ATE485582T1/de not_active IP Right Cessation
- 2006-04-03 CA CA2603229A patent/CA2603229C/en active Active
-
2007
- 2007-10-07 IL IL186439A patent/IL186439A0/en unknown
- 2007-10-07 IL IL186438A patent/IL186438A/en active IP Right Grant
- 2007-10-07 IL IL186405A patent/IL186405A/en active IP Right Grant
- 2007-10-07 IL IL186436A patent/IL186436A0/en active IP Right Grant
- 2007-10-07 IL IL186441A patent/IL186441A0/en active IP Right Grant
- 2007-10-07 IL IL186404A patent/IL186404A/en active IP Right Grant
- 2007-10-07 IL IL186443A patent/IL186443A/en active IP Right Grant
- 2007-10-07 IL IL186442A patent/IL186442A/en active IP Right Grant
- 2007-10-31 NO NO20075503A patent/NO20075503L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075512A patent/NO20075512L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075513A patent/NO340428B1/no unknown
- 2007-10-31 NO NO20075515A patent/NO340566B1/no unknown
- 2007-10-31 NO NO20075510A patent/NO20075510L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075511A patent/NO20075511L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075514A patent/NO340434B1/no unknown
-
2008
- 2008-08-28 HK HK08109568.5A patent/HK1113848A1/xx unknown
- 2008-09-19 HK HK08110384.5A patent/HK1115023A1/xx unknown
- 2008-09-22 HK HK08110465.7A patent/HK1114901A1/xx unknown
- 2008-09-24 HK HK08110589.8A patent/HK1115024A1/xx unknown
- 2008-09-24 HK HK12110024.5A patent/HK1169509A1/xx unknown
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2801960C1 (ru) * | 2010-09-16 | 2023-08-21 | Долби Интернешнл Аб | Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями |
US12033645B2 (en) | 2010-09-16 | 2024-07-09 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
RU2822612C1 (ru) * | 2010-09-16 | 2024-07-09 | Долби Интернешнл Аб | Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями |
RU2810281C1 (ru) * | 2010-09-16 | 2023-12-25 | Долби Интернешнл Аб | Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями |
US11817110B2 (en) | 2010-09-16 | 2023-11-14 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
US9997174B2 (en) | 2012-08-31 | 2018-06-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
RU2670785C9 (ru) * | 2012-08-31 | 2018-11-23 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ и устройство для обнаружения голосовой активности |
US10607633B2 (en) | 2012-08-31 | 2020-03-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
US11417354B2 (en) | 2012-08-31 | 2022-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
RU2670785C1 (ru) * | 2012-08-31 | 2018-10-25 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ и устройство для обнаружения голосовой активности |
US9472208B2 (en) | 2012-08-31 | 2016-10-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
US11900962B2 (en) | 2012-08-31 | 2024-02-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for voice activity detection |
RU2609133C2 (ru) * | 2012-08-31 | 2017-01-30 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ и устройство для обнаружения голосовой активности |
US10096322B2 (en) | 2013-06-21 | 2018-10-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder having a bandwidth extension module with an energy adjusting module |
RU2642894C2 (ru) * | 2013-06-21 | 2018-01-29 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2386179C2 (ru) | Способ и устройство для кодирования речевых сигналов с расщеплением полосы |