KR100956524B1 - 스피치 신호의 고대역 부분을 인코딩 및 디코딩하는 방법및 장치 - Google Patents
스피치 신호의 고대역 부분을 인코딩 및 디코딩하는 방법및 장치 Download PDFInfo
- Publication number
- KR100956524B1 KR100956524B1 KR1020077025421A KR20077025421A KR100956524B1 KR 100956524 B1 KR100956524 B1 KR 100956524B1 KR 1020077025421 A KR1020077025421 A KR 1020077025421A KR 20077025421 A KR20077025421 A KR 20077025421A KR 100956524 B1 KR100956524 B1 KR 100956524B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- highband
- gain
- spectral
- high band
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 65
- 230000005284 excitation Effects 0.000 claims abstract description 219
- 230000003595 spectral effect Effects 0.000 claims description 130
- 238000001228 spectrum Methods 0.000 claims description 49
- 238000004458 analytical method Methods 0.000 claims description 34
- 238000003786 synthesis reaction Methods 0.000 claims description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 230000002123 temporal effect Effects 0.000 claims description 10
- 230000001413 cellular effect Effects 0.000 claims description 4
- 238000003672 processing method Methods 0.000 claims description 2
- 238000012886 linear function Methods 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 57
- 230000006870 function Effects 0.000 description 54
- 230000000875 corresponding effect Effects 0.000 description 39
- 238000005070 sampling Methods 0.000 description 22
- 230000004044 response Effects 0.000 description 19
- 239000013598 vector Substances 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 16
- 238000010606 normalization Methods 0.000 description 16
- 230000007774 longterm Effects 0.000 description 14
- 230000002087 whitening effect Effects 0.000 description 13
- 238000005259 measurement Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000013139 quantization Methods 0.000 description 11
- 238000001914 filtration Methods 0.000 description 9
- 230000007704 transition Effects 0.000 description 9
- 238000013459 approach Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000009499 grossing Methods 0.000 description 5
- 230000000737 periodic effect Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Control Of Amplification And Gain Control (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Control Of Eletrric Generators (AREA)
- Amplitude Modulation (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Image Analysis (AREA)
- Finish Polishing, Edge Sharpening, And Grinding By Specific Grinding Devices (AREA)
- Filters And Equalizers (AREA)
- Peptides Or Proteins (AREA)
- Solid-Sorbent Or Filter-Aiding Compositions (AREA)
- Air Conditioning Control Device (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Filtration Of Liquid (AREA)
- Crystals, And After-Treatments Of Crystals (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
- Ticket-Dispensing Machines (AREA)
- Filtering Of Dispersed Particles In Gases (AREA)
- Telephonic Communication Services (AREA)
- Transmitters (AREA)
- Developing Agents For Electrophotography (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
- Stereo-Broadcasting Methods (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
Abstract
일 실시예에 따른 광대역 스피치는 협대역 인코더 및 고대역 인코더를 포함한다. 협대역 인코더는 광대역 스피치 신호의 협대역 부분을 필터 파라미터들의 세트 및 대응하는 인코딩된 여기 신호로 인코딩하도록 구성된다. 고대역 인코더는 고대역 여기 신호에 따라서, 광대역 스피치 신호의 고대역 부분을 필터 파라미터들의 세트로 인코딩하도록 구성된다. 고대역 인코더는 인코딩된 협대역 여기 신호에 기반하여 신호에 비선형 펑션을 적용함으로써 고대역 여기 신호를 생성하여 스펙트럼 확장된 신호를 생성하도록 구성된다.
광대역 스피치 신호, 협대역 인코더, 고대역 인코더
Description
관련 출원
본 특허 출원은 "광대역 스피치의 고-주파수 대역 코딩 (CODING THE HIGH-FREQUENCY BAND OF WIDEBAND SPEECH)" 으로 명명되고 2005년 4월 1일자로 출원된 미국 가출원 제 60/667,901 호를 우선권 주장한다. 본 특허 출원은 "고-대역 스피치 코더에 있어서 파라미터 코딩 (PARAMETER CODING IN A HIGH-BAND SPEECH CODER)" 으로 명명되고 2005년 4월 22일자로 출원된 미국 가출원 제 60/673,965 호를 또한 우선권 주장한다.
기술 분야
본 발명은 신호 프로세싱에 관한 것이다.
배경 기술
공중 스위칭 전화 네트워크 (Public Switched Telephone Network; PSTN) 를 통한 음성 통신은 통상적으로 300-3400 kHz 의 주파수 대역으로 대역폭이 제한되어 왔다. 셀룰러 전화통신 및 IP (Internet Protocol) 상의 음성 (VoIP) 과 같은 음성 통신을 위한 새로운 네트워크는 동일한 대역폭 제한을 갖지 않을 수 있고, 이러한 네트워크들 상에서 광대역 주파수 영역을 포함하는 음성 통신을 전송 및 수신 하는 것이 바람직할 수 있다. 예를 들어, 하한 50 Hz 및/또는 상한 7 또는 8 kHz 까지 확장된 오디오 주파수 영역을 지원하는 것이 바람직할 수 있다. 또한 고-품질 오디오 및 오디오/비디오 회의와 같은, 다른 애플리케이션을 지원하는 것이 바람직할 수 있으며, 이는 통상의 PSTN 제한외의 영역에서 오디오 스피치 콘텐츠를 포함할 수도 있다.
더 높은 주파수로의 스피치 코더에 의해 지원되는 영역의 확장은 양해도 (intelligibility) 를 개선시킬 수 있다. 예를 들어, 고 주파수에서 's' 및 'f' 와 같은 마찰음들을 구별하는 정보는 풍부하다. 고대역 확장은 프레즌스 (presence) 와 같은 스피치의 다른 품질을 또한 개선시킬 수도 있다. 예를 들어, 심지어 음성화된 모음이 PSTN 제한보다 훨씬 높은 스펙트럼 에너지를 가질 수 있다.
광대역 스피치 코딩으로의 일 접근은 광대역 스펙트럼을 커버하기 위해 협대역 스피치 코딩 기술 (예를 들면 0-4 kHz의 범위를 인코딩하도록 구성된 기술) 을 스케일링하는 단계를 포함한다. 예를 들어, 스피치 신호는 고주파수에서의 컴포넌트를 포함하도록 더 높은 레이트에서 샘플링될 수 있으며, 협대역 코딩 기술은 더 많은 필터 계수를 사용하여 이 광대역 신호를 표현하도록 재구성될 수 있다. CELP (Codebook Excited Linear Prediction) 와 같은 협대역 코딩 기술은 계산적으로 집약적이지만, 광대역 CELP 코더는 많은 이동 및 다른 임베디드 애플리케이션에 실용적이기에는 너무 많은 프로세싱 사이클을 소비할 수 있다. 이러한 기술을 사용하는 원하는 품질로 광대역 신호의 전체 스팩트럼을 인코딩하는 것은 대역 폭에서 용인될 수 없는 방대한 증가를 또한 야기할 수 있다. 게다가, 이러한 인코딩된 신호의 트랜스코딩은, 그 신호의 협대역 부분이 오직 협대역 코딩만을 지원하는 시스템으로 전송 및/또는 이러한 시스템에 의해 디코딩될 수 있기 전에도 요구된다.
광대역 스피치 코딩에 대한 다른 접근은 인코딩된 협대역 스펙트럼 엔벌로프 (envelope) 로부터 고대역 스펙트럼 엔벌로프를 외삽 (extrapolate) 하는 단계를 포함한다. 이러한 접근은 어떠한 대역폭의 증가 없이 및 트랜스코딩의 필요 없이 구현될 수도 있지만, 코오스 (coarse) 스펙트럼 엔벌로프 또는 스피치 신호의 고대역 부분의 포르먼트 (formant) 구조는 일반적으로 협대역 부분의 스펙트럼 엔벌로프로부터 정확하게 예측될 수 없다.
인코딩된 신호의 적어도 협대역 부분이 트랜스코딩 또는 다른 중요한 변경없이 협대역 채널 (PSTN 채널과 같은) 을 통해 송신될 수도 있도록 광대역 스피치 코딩을 구현하는 것이 바람직하다. 예를 들면 유선 및 무선 채널상의 무선 셀룰러 전화 통신 및 방송과 같은 애플리케이션에서 서비스될 수 있는 사용자의 수를 현저하게 감소시키는 것을 회피하기 위해, 광대역 코딩 확장의 효율성이 또한 바람직할 수도 있다.
요약
일 실시형태에서, 저대역 부분 및 고대역 부분을 갖는 스피치 신호 중 고대역 부분을 인코딩하는 방법은, 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 복수의 필터 파라미터를 산출하는 단계, 저대역 부분으로부터 유도된 신호의 스펙트럼 을 확장함으로써 스펙트럼 확장된 신호를 산출하는 단계, 스펙트럼 확장된 신호에 기반한 고대역 여기 신호 (A) 및 복수의 필터 파라미터 (B) 에 따라서, 합성된 고대역 신호를 생성하는 단계 및 저대역 부분에 기반한 신호와 고대역 부분 사이의 관계에 기반하여 이득 엔벌로프를 산출하는 단계를 포함한다.
일 실시형태에서, 스피치 프로세싱은, 저대역 여기 신호에 기반하여 고대역 여기 신호를 생성하는 단계, 고대역 스피치 신호 및 고대역 여기 신호에 기반하여 합성된 고대역 신호를 생성하는 단계, 및 저대역 여기 신호에 기반한 신호와 고대역 스피치 신호의 관계에 기반하여 복수의 이득 팩터를 산출하는 단계를 포함한다.
또 다른 실시형태에서, 고대역 부분 및 저대역 부분을 갖는 스피치 신호의 고대역 부분을 디코딩하는 방법은, 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 복수의 필터 파라미터 및 고대역 부분의 일시적 엔벌로프를 특징짓는 복수의 이득 팩터를 수신하는 단계, 저대역 여기 신호에 기초하는 신호의 스펙트럼을 확장함으로써 스펙트럼 확장된 신호를 산출하는 단계, 복수의 필터 파라미터 (A) 및 스펙트럼 확장된 신호에 기반한 고대역 여기 신호 (B) 에 따라서, 합성된 고대역 신호를 생성하는 단계, 및 복수의 이득 팩터에 따라서, 합성된 고대역 신호의 이득 엔벌로프를 변조하는 단계를 포함한다.
또 다른 실시형태에서, 고대역 부분 및 저대역 부분을 갖는 스피치 신호의 고대역 부분을 인코딩하도록 구성된 장치는, 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 필터 파라미터 세트를 산출하도록 구성된 분석 모듈, 저대역 부분으로부터 유도된 신호의 스펙트럼을 확장함으로써 스펙트럼 확장된 신호를 산출하도록 구 성된 스펙트럼 확장기, 스펙트럼 확장된 신호에 기반한 고대역 여기 신호 (A) 및 필터 파라미터 세트 (B) 에 따라서, 합성된 고대역 신호를 생성하도록 구성된 합성 필터, 및 저대역 부분에 기반한 신호와 고대역 부분 사이의 시간에 따라서 변하는 관계에 기반하여 이득 엔벌로프를 산출하도록 구성된 이득 팩터 산출기를 구비한다.
또 다른 실시형태에서, 고대역 스피치 디코더는, 스피치 신호의 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 복수의 필터 파라미터 (A) 및 스피치 신호의 저대역 부분에 기반한 인코딩된 저대역 여기 신호 (B) 를 수신하도록 구성된다. 디코더는, 인코딩된 저대역 여기 신호에 기초하는 신호의 스펙트럼을 확장함으로써 스펙트럼 확장된 신호를 산출하도록 구성된 스펙트럼 확장기, 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 복수의 필터 파라미터 (A) 및 스펙트럼 확장된 신호에 기반한 고대역 여기 신호 (B) 에 따라서, 합성된 고대역 신호를 생성하도록 구성된 합성 필터, 및 고대역 부분의 일시적 엔벌로프를 특징짓는 복수의 이득 팩터에 따라서, 합성된 고대역 신호의 이득 엔벌로프를 변조하도록 구성된 이득 제어 소자를 구비한다.
도면의 간단한 설명
도 1a 는 일 실시예에 따른 광대역 스피치 인코더 (A100) 의 블록도를 도시한다.
도 1b 는 광대역 스피치 인코더 (A100) 의 일 구현 (A102) 의 블록도를 도시한다.
도 2a 는 일 실시예에 따른 광대역 스피치 디코더 (B100) 의 블록도를 도시한다.
도 2b 는 광대역 스피치 디코더 (B100) 의 일 구현 (B102) 의 블록도를 도시한다.
도 3a 는 필터 뱅크 (A110) 의 일 구현 (A112) 의 블록도를 도시한다.
도 3b 는 필터 뱅크 (B120) 의 일 구현 (B122) 의 블록도를 도시한다.
도 4a 는 필터 뱅크 (A110) 의 일 예에 대한 저대역 및 고대역의 대역폭 커버리지를 도시한다.
도 4b 는 필터 뱅크 (A110) 의 다른 예에 대한 저대역 및 고대역의 대역폭 커버리지를 도시한다.
도 4c 는 필터 뱅크 (A112) 의 일 구현 (A114) 의 블록도를 도시한다.
도 4d 는 필터 뱅크 (B122) 의 일 구현 (B124) 의 블록도를 도시한다.
도 5a 는 스피치 신호에 대한 로그 (Log) 진폭 대 주파수 플롯의 일 예를 도시한다.
도 5b 는 기본 선형 예측 코딩 시스템의 블록도를 도시한다.
도 6 은 협대역 인코더 (A120) 의 일 구현 (A122) 의 블록도를 도시한다.
도 7은 협대역 디코더 (B110) 의 일 구현 (B112) 의 블록도를 도시한다.
도 8a 는 음성화된 스피치의 잉여 신호에 대한 로그 진폭 대 주파수 플롯의 일 예를 도시한다.
도 8b 는 음성화된 스피치의 잉여 신호에 대한 로그 진폭 대 시간 플롯의 일 예를 도시한다.
도 9 는 장기 예측을 또한 수행하는 기본 선형 예측 코딩 시스템의 블록도를 도시한다.
도 10 은 고대역 인코더 (A200) 의 일 구현 (A202) 의 블록도를 도시한다.
도 11 은 고대역 여기 생성기 (A300) 의 일 구현 (A302) 의 블록도를 도시한다.
도 12 는 스펙트럼 확장기 (A400) 의 구현 (A402) 의 블록도를 도시한다.
도 12a 는 스펙트럼 확장 동작의 일 예에서 다양한 지점에서의 신호 스펙트럼들의 플롯을 도시한다.
도 12b 는 스펙트럼 확장 동작의 다른 예에서 다양한 지점에서의 신호 스펙트럼들의 플롯을 도시한다.
도 13 은 고대역 여기 생성기 (A302) 의 일 구현 (A304) 의 블록도를 도시한다.
도 14 는 고대역 여기 생성기 (A302) 의 일 구현 (A306) 의 블록도를 도시한다.
도 15 는 엔벌로프 산출 태스크 (T100) 에 대한 흐름도를 도시한다.
도 16 은 결합기 (490) 의 일 구현 (492) 의 블록도를 도시한다.
도 17 은 고대역 신호 (S30) 의 주기성 측정의 산출에 대한 접근을 도시한다.
도 18 은 고대역 여기 생성기 (A302) 의 일 구현 (A312) 의 블록도를 도시한 다.
도 19 는 고대역 여기 생성기 (A302) 의 일 구현 (A314) 의 블록도를 도시한다.
도 20 은 고대역 여기 생성기 (A302) 의 일 구현 (A316) 의 블록도를 도시한다.
도 21 은 이득 산출 태스크 (T200) 에 대한 흐름도를 도시한다.
도 22 는 이득 산출 태스크 (T200) 의 일 구현 (T210) 에 대한 흐름도를 도시한다.
도 23a 는 윈도우잉 펑션의 다이어그램을 도시한다.
도 23b 는 도 23a에서 도시된 바와 같은 윈도우잉 펑션의 스피치 신호의 서브프레임에의 적용을 도시한다.
도 24 는 고대역 디코더 (B200) 의 일 구현 (B202) 에 대한 블록도를 도시한다.
도 25 는 광대역 스피치 인코더 (A100) 의 일 구현 (AD10) 의 블록도를 도시한다.
도 26a 는 딜레이 라인 (D120) 의 일 구현 (D122) 의 개략도를 도시한다.
도 26b 는 딜레이 라인 (D120) 의 일 구현 (D124) 의 개략도를 도시한다.
도 27 은 딜레이 라인 (D120) 의 일 구현 (D130) 의 개략도를 도시한다.
도 28 은 광대역 스피치 인코더 (AD10) 의 일 구현 (AD12) 의 블록도를 도시한다.
도 29 는 일 실시예에 따른 신호 프로세싱 방법 (MD100) 의 흐름도를 도시한다.
도 30 은 일 실시예에 따른 방법 (M100) 에 대한 흐름도를 도시한다.
도 31a 는 일 실시예에 따른 방법 (M200) 에 대한 흐름도를 도시한다.
도 31b 는 방법 (M200) 의 일 구현 (M210) 에 대한 흐름도를 도시한다.
도 32 는 일 실시예에 따른 방법 (M300) 에 대한 흐름도를 도시한다.
도면 및 수반하는 설명에서, 동일한 참조 부호는 동일 또는 유사한 구성요소 및 신호를 지칭한다.
상세한 설명
여기에서 기술되는 실시예는 오직 약 800 내지 1000 bps (bit per second) 의 대역폭 증가에서 광대역 스피치 신호의 전송 및/또는 저장을 지원하도록 협대역 스피치 코더에 확장을 제공하도록 구성될 수 있는 시스템, 방법, 및 장치를 포함한다. 이러한 구성의 잠재적인 이점들은 협대역 시스템과의 호환성을 지원하는 임베디드 코딩, 협대역 및 고대역 코딩 채널간의 비트들의 상대적으로 쉬운 할당 및 재할당, 계산적으로 집약적인 광대역 합성 동작의 회피, 및 계산적으로 집약적인 파형 코딩 루틴 (routine) 에 의해 프로세싱되는 신호에 대한 낮은 샘플링 레이트의 유지를 포함한다.
문맥에 의해 명백하게 제한되지 않는 한, "산출 (calculating)" 이라는 용어는 여기에서 산출, 생성, 및 수치들의 리스트로부터의 선택과 같은 그 통상 의미들의 임의의 의미를 지칭하는데 사용된다. "포함 (comprising)" 이라는 용어가 본 명세서 및 청구항들에서 사용되는 경우, 다른 구성요소들 또는 동작들을 배제하지 않는다. "A 는 B 에 기반한다" 는 용어는, 케이스 (ⅰ) "A 는 B 와 같다" 및 케이스 (ⅱ) "A 는 적어도 B 에 기반한다" 를 포함하여, 그 통상 의미들의 임의의 의미를 지칭한다. "인터넷 프로토콜" 이라는 용어는 IETF (Internet Engineering Task Force) RFC (Request for Comments) 791 에서 기술된 바와 같은 버젼 4, 및 버젼 6 과 같은 후속 버젼들을 포함한다.
도 1a 는 일 실시예에 따른 광대역 스피치 인코더 (A100) 의 블록도를 도시한다. 필터 뱅크 (A110) 는 광대역 스피치 신호 (S10) 를 필터링하여 협대역 신호 (S20) 및 고대역 신호 (S30) 를 생성하도록 구성된다. 협대역 인코더 (A120) 는 협대역 신호 (S20) 를 인코딩하여 협대역 (NB) 필터 파라미터들 (S40) 및 협대역 잉여 신호 (S50) 를 생성한다. 여기에서 더욱 상세히 기술될 바와 같이, 통상적으로 협대역 인코더 (A120) 는 코드북 인덱스들 또는 다른 양자화된 형태로서 협대역 필터 파라미터들 (S40) 및 인코딩된 협대역 여기 신호 (S50) 를 생성하도록 구성된다. 고대역 인코더 (A200) 는 인코딩된 협대역 여기 신호 (S50) 내의 정보에 따라 고대역 신호 (S30) 를 인코딩하여 고대역 코딩 파라미터들 (S60) 을 생성하도록 구성된다. 여기에서 더욱 상세히 기술될 바와 같이, 고대역 인코더 (A200) 는 코드북 인덱스들 또는 다른 양자화된 형태로서 고대역 코딩 파라미터들 (S60) 을 생성하도록 구성된다. 광대역 스피치 인코더 (A100) 의 특정 일 예시는, 협대역 필터 파라미터들 (S40) 및 인코딩된 협대역 여기 신호 (S50) 에 대해 사용되는 약 7.55 kbps (kilobits per second) 및 고대역 코딩 파라 미터들 (S60) 에 대해 사용되는 약 1 kbps 를 갖는 약 8.55 kbps 의 레이트에서 광대역 스피치 신호 (S10) 를 인코딩하도록 구성된다.
인코딩된 협대역 및 고대역 신호들을 하나의 비트스트림으로 결합하는 것이 바람직할 수 있다. 예를 들어, 인코딩된 광대역 스피치 신호로서 (예를 들면 유선, 광, 무선 전송 채널로) 전송 또는 저장을 위해 인코딩된 신호들을 함께 멀티플렉싱하는 것이 바람직할 수 있다. 도 1b 는 협대역 필터 파라미터들 (S40), 인코딩된 협대역 여기 신호 (S50), 및 고대역 필터 파라미터들 (S60) 을 멀티플렉싱된 신호 (S70) 로 결합하도록 구성되는 멀티플렉서 (A130) 를 포함하는 광대역 스피치 인코더 (A100) 의 일 구현 (A102) 의 블록도를 도시한다.
인코더 (A102) 를 포함하는 장치는 또한 유선, 광, 및 무선 채널과 같은 전송 채널로 멀티플렉싱된 신호 (S70) 를 전송하도록 구성되는 회로를 포함할 수 있다. 이러한 장치는 에러 정정 인코딩 (예를 들면, 레이트-호환성인 (rate-compatible) 컨볼루셔널 인코딩) 및/또는 에러 검출 인코딩 (예를 들면, 사이클릭 리던던시 (cyclic redundancy) 인코딩), 및/또는 네트워크 프로토콜 인코딩의 하나 이상의 계층들 (예를 들면 이더넷 (Ethernet), TCP/IP, cdma2000) 과 같이 하나 이상의 채널 인코딩 동작을 신호상에 수행하도록 또한 구성될 수 있다.
멀티플렉서 (A130) 는 (협대역 필터 파라미터들 (S40) 및 인코딩된 협대역 여기 신호 (S50) 를 포함하는) 인코딩된 협대역 신호를 멀티플렉싱된 신호 (S70) 의 분리가능한 서브스트림으로서 임베딩하여, 인코딩된 협대역 신호가 고대역 및/또는 저대역 신호와 같이 멀티플렉싱된 신호 (S70) 의 또 다른 부분에 대해 독립적 으로 리커버링 및 디코딩될 수 있도록 구성되는 것이 바람직할 수도 있다. 예를 들어, 멀티플렉싱된 신호 (S70) 는 인코딩된 협대역 신호가 고대역 필터 파라미터들 (S60) 을 제거 (stripping away) 함으로써 리커버링될 수 있도록 배열될 수 있다. 이러한 구성의 일 잠재적인 이점은 협대역 신호에 대한 디코딩은 지원하나 고대역 부분의 디코딩은 지원하지 않는 시스템으로 인코딩된 광대역 신호를 전달하기 전에 인코딩된 광대역 신호의 트랜스코딩의 필요를 회피할 수 있다는 것이다.
도 2a 는 일 실시예에 따른 광대역 스피치 디코더 (B100) 의 블록도이다. 협대역 디코더 (B110) 는 협대역 필터 파라미터들 (S40) 및 인코딩된 협대역 여기 신호 (S50) 를 디코딩하여 협대역 신호 (S90) 를 생성하도록 구성된다. 고대역 디코더 (B200) 는 인코딩된 협대역 여기 신호 (S50) 에 기반하여 협대역 여기 신호 (S80) 에 따라서 고대역 코딩 파라미터들 (S60) 을 디코딩하여 고대역 신호 (S100) 를 생성하도록 구성된다. 이 예시에서, 협대역 디코더 (B110) 는 협대역 여기 신호 (S80) 를 고대역 디코더 (B200) 로 제공하도록 구성된다. 필터 뱅크 (B120) 는 협대역 신호 (S90) 및 고대역 신호 (S100) 를 결합하여 광대역 스피치 신호 (S110) 를 생성하도록 구성된다.
도 2b 는 멀티플렉싱된 신호 (S70) 로부터 인코딩된 신호들 (S40, S50, 및 S60) 을 생성하도록 구성되는 디멀티플렉서 (B130) 를 포함하는 광대역 스피치 디코더 (B100) 의 일 구현 (B102) 의 블록도이다. 디코더 (B102) 를 포함하는 장치는 유선, 광, 또는 무선 채널과 같은 전송 채널로부터 멀티플렉싱된 신호 (S70) 를 수신하도록 구성되는 회로를 포함할 수 있다. 이러한 장치는 또한 에러 정정 디코딩 (예를 들면, 레이트-호환성인 컨볼루셔널 디코딩) 및/또는 에러 검출 디코딩 (예를 들면, 사이클릭 리던던시 (cyclic redundancy) 디코딩), 및/또는 네트워크 프로토콜 디코딩의 하나 이상의 계층 (예를 들면 이더넷, TCP/IP, cdma2000) 과 같은 하나 이상의 채널 디코딩 동작을 신호상에 수행하도록 구성될 수 있다.
필터 뱅크 (A110) 는 입력 신호를 이격-대역 (split-band) 스킴에 따라 필터링하여 저-주파수 서브대역 및 고-주파수 서브대역을 생성하도록 구성된다. 특정 애플리케이션에 대한 설계 표준에 따라서, 출력 서브대역들은 동일 또는 상이한 대역폭을 가질 수도 있으며 오버래핑되거나 또는 오버래핑되지 않을 수도 있다. 2 이상의 서브대역을 생성하는 필터 뱅크 (A110) 의 구성이 또한 가능하다. 예를 들어, 이러한 필터 뱅크는 (50-300 Hz 의 범위와 같은) 협대역 신호 (S20) 주파수 범위 이하의 주파수 범위에서의 콤포넌트를 포함하는 일 이상의 저대역 신호들을 생성하도록 구성될 수 있다. 이러한 필터 뱅크는 (14-20, 16-20, 또는 16-32 kHz 의 범위와 같은) 고대역 신호 (S30) 주파수 범위 이상의 주파수 대역 에서의 콤포넌트를 포함하는 일 이상의 부가적인 고대역 신호들을 생성하도록 구성되는 것이 또한 가능하다. 이러한 경우, 광대역 스피치 인코더 (A100) 는 이 신호 또는 신호들을 별도로 인코딩하도록 구현될 수 있고, 멀티플렉서 (A130) 는 멀티플렉싱된 신호 (S70) 내에 부가적인 인코딩된 신호 또는 신호들을 (예를 들면, 분리가능한 부분으로서) 포함하도록 구성될 수도 있다.
도 3a 는 감소된 샘플링 레이트를 갖는 2 개의 서브대역 신호들을 생성하도 록 구성되는 필터 뱅크 (A110) 의 일 구현 (A112) 의 블록도를 도시한다. 필터 뱅크 (A110) 는 고-주파수 (또는 고대역) 부분 및 저-주파수 (또는 저대역) 부분을 포함하는 광대역 스피치 신호 (S10) 를 수신하도록 배열된다. 필터 뱅크 (A112) 는 광대역 스피치 신호 (S10) 를 수신하여 협대역 스피치 신호 (S20) 를 생성하도록 구성되는 저대역 프로세싱 경로, 및 광대역 스피치 신호 (S10) 를 수신하여 고대역 스피치 신호 (S30) 를 생성하도록 구성되는 고대역 프로세싱 경로를 포함한다. 저역통과 필터 (110) 는 선택된 저-주파수 서브대역을 통과시키도록 광대역 스피치 신호 (S10) 를 필터링하며, 고역통과 필터 (130) 는 선택된 고-주파수 서브대역을 통과시키도록 광대역 스피치 신호 (S10) 를 필터링한다. 양 서브대역 신호들이 광대역 스피치 신호 (S10) 보다 더 협소한 대역폭을 갖기 때문에, 이들의 샘플링 레이트는 정보의 손실없이 일정 범위로 감소될 수 있다. 다운샘플러 (120) 는 원하는 데시메이션 (decimation) 팩터에 따라서 저역통과 신호의 샘플링 레이트를 감소시키고 (예를 들면, 신호의 샘플들을 제거 및/또는 평균 값으로 샘플들을 대체함으로써) 유사하게, 다운샘플러 (140) 는 또 다른 원하는 데시메이션 팩터에 따라서 고역통과 신호들의 샘플링 레이트를 감소시킨다.
도 3b 는 필터 뱅크 (B120) 의 대응하는 구현 (B122) 의 블록도를 도시한다. 업샘플러 (150) 는 협대역 신호 (S90) 의 샘플링 레이트를 증가시키고 (예를 들면 샘플들을 제로-스터핑 (zero-stuffing) 및/또는 복제함으로써), 저역통과 필터 (160) 는 오직 저대역 부분만이 통과하도록 업샘플링된 신호를 필터링 (예를 들면 에일리어싱을 방지하도록) 한다. 유사하게, 업샘플러 (170) 는 고대역 신호 (S100) 의 샘플링 레이트를 증가시키고 고역통과 필터 (180) 는 오직 고대역 부분만을 통과시키도록 업샘플링된 신호를 필터링한다. 2 개의 대역통과 신호들은 이후 광대역 스피치 신호 (S110) 를 형성하도록 합산된다. 디코더 (B100) 의 일부 구현에 있어서, 필터 뱅크 (B120) 는 고대역 디코더 (B200) 에 의해 수신 및/또는 산출된 하나 이상의 웨이트 (weight) 들에 따라서 2 개의 대역통과 신호들의 웨이팅된 합을 생성하도록 구성된다. 2 이상의 대역통과 신호들을 결합하는 필터 뱅크 (B120) 의 구성이 또한 고려된다.
각각의 필터들 (110, 130, 160, 180) 은 유한-임펄스-응답 (FIR) 필터 또는 무한-임펄스-응답 (IIR) 필터로서 구현될 수 있다. 인코더 필터들 (110 및 130) 의 주파수 응답은 저지대역 및 통과대역 사이에서 대칭적 또는 비대칭적으로 쉐이핑된 전이 영역을 가질 수 있다. 유사하게, 디코더 필터들 (160 및 180) 의 주파수 응답들은 대칭적인 또는 상이하게 쉐이핑된 저지대역과 통과대역간의 전이 영역을 가질 수 있다. 저역통과 필터 (110) 는 저역통과 필터 (160) 와 동일한 응답을 갖고, 고역통과 필터 (130) 는 고역통과 필터 (180) 와 동일한 응답을 갖는 것이 바람직할 수 있지만, 엄격하게 요구되지는 않는다. 일 예에서, 2 개의 필터쌍들 (110, 130 및 160, 180) 은 필터쌍 (110,130) 이 필터쌍 (160, 180) 과 동일한 계수를 갖는 직교 미러 필터 (quadrature mirror filter; QMF) 뱅크들이다.
통상의 예에서, 저역통과 필터 (110) 는 300-3400 Hz 의 제한된 PSTN 범위 (예를 들면, 0 내지 4 kHz 대역) 를 포함하는 통과대역을 갖는다. 도 4a 및 도 4b 는 2 개의 상이한 구현 예에서 광대역 스피치 신호 (S10) , 협대역 신호 (S20), 및 고대역 신호 (S30) 의 상대적인 대역폭을 도시한다. 이 특정 예시들의 모두에서, 광대역 스피치 신호 (S10) 는 (0 내지 8 kHz 의 범위 내에서 주파수 컴포넌트를 표현하는) 16 kHz 의 샘플링 레이트를 갖고, 협대역 신호 (S20) 는 (0 내지 4 kHz 의 범위 내에서 주파수 컴포넌트를 표현하는) 8 kHz 의 샘플링 레이트를 갖는다.
도 4a 의 예에서, 2 개의 서브대역 신호간에 현저한 오버랩은 존재하지 않는다. 이 예에서 도시된 바와 같이 고대역 신호 (S30) 는 4-8 kHz 의 통과대역을 갖는 고역통과 필터 (130) 를 사용하여 획득될 수 있다. 이러한 경우, 2 의 팩터로 필터링된 신호를 다운샘플링함으로써 샘플링 레이트를 8 kHz 까지 감소시키는 것이 바람직할 수도 있다. 신호에 대한 추가적인 프로세싱 동작의 계산적인 복잡성을 현저하게 감소시키는 것이 기대될 수 있는 이러한 동작은, 정보 손실없이 0 내지 4 kHz 의 범위로 통과대역 에너지를 하향 이동시킬 수 있다.
도 4b 의 또 다른 예에서, 3.5 내지 4 kHz 의 범위가 양 서브대역 신호들에 의해 기술되도록, 상위 및 하위 서브대역들은 분명한 오버랩을 갖는다. 이 예시에서와 같은 고대역 신호 (S30) 는 3.5-7 kHz 의 통과 대역을 갖는 고역통과 필터 (130) 를 사용하여 획득될 수 있다. 이러한 예에서, 16/7 의 팩터로 필터링된 신호를 다운샘플링함으로써 샘플링 레이트를 감소시키는 것이 바람직할 수도 있다. 신호에 대한 추가적인 프로세싱 동작의 계산적인 복잡성을 현저하게 감소시키는 것이 기대될 수 있는 이러한 동작은, 정보 손실없이 0 내지 3.5 kHz 의 범 위로 통과 대역 에너지를 하향 이동시킬 수 있다.
전화 통신의 통상의 핸드셋에서, 하나 이상의 트랜스듀서 (예를 들어, 마이크로폰 및 이어피스 (earpiece) 또는 확성기) 는 7-8 kHz 의 주파수 범위에서 상당한 응답이 결여된다. 도 4b 의 예시에서, 7 내지 8 kHz 사이의 광대역 스피치 신호 (S10) 의 부분은 인코딩된 신호에 포함되지 않는다. 고역통과 필터 (130) 의 다른 특정 예시들은 3.5-7.5 kHz 및 3.5-8 kHz 의 통과대역을 갖는다.
일부 구현에서, 도 4b 의 예에서와 같이 서브대역간의 오버랩을 제공하는 것은 저역통과 및/또는 고역통과 필터를 사용함에 있어 오버래핑된 구간상에서 평활한 (smooth) 롤오프를 가질 수 있도록 한다. 이러한 필터들은 통상적으로 설계가 더욱 용이하고, 계산적으로 덜 복잡하며, 및/또는 더욱 가파른 또는 "브릭-월" 응답을 갖는 필터들보다 적은 딜레이를 나타낸다. 가파른 전이 영역을 갖는 필터들은 평탄한 롤오프를 갖는 유사 차수의 필터들에 비해 더 높은 사이드로브들 (에일리어싱을 유발할 수 있음) 을 갖는 경향이 있다. 가파른 전이 영역을 갖는 필터들은 링잉 현상 (ringing artifact) 을 유발할 수 있는 긴 임펄스 응답을 또한 갖는다. 적어도 IIR 필터들을 갖는 필터 뱅크 구현에 있어서, 오버래핑된 범위상에 평활한 롤오프를 허용하는 것은 폴 (pole) 들이 단위원 (unit circle) 에서 멀리 떨어진 필터 또는 필터들의 사용을 가능하게 할 수 있고, 이는 안정한 고정-포인트 (fixed-point) 의 구현을 보장하는데 있어 중요할 수 있다.
서브대역들의 오버래핑은 더 적은 가청 현상 (audible artifacts), 감소된 에일리어싱, 및/또는 일 대역에서 다른 대역으로의 덜 현저한 전이를 야기할 수 있 는 저대역 및 고대역의 평활한 블렌딩 (blending) 을 허용한다. 또한, 협대역 인코더 (A120) (예를 들면, 파형 코더) 의 코딩 효율은 주파수의 증가와 함께 저감할 수 있다. 예를 들면, 협대역 코더의 코딩 품질은 특히 배경 노이즈가 존재하는 경우 저 비트 레이트에서 감소될 수 있다. 이러한 경우, 서브대역의 오버랩의 제공은 오버래핑된 영역에서 재생된 주파수 컴포넌트의 품질을 증가시킬 수 있다.
또한, 서브대역들의 오버래핑은 더 적은 가청 현상, 감소된 에일리어싱, 및/또는 일 대역에서 다른 대역으로의 덜 현저한 전이를 야기할 수 있는 저대역 및 고대역의 평활한 블렌딩을 허용한다. 이러한 구성은 협대역 인코더 (A120) 및 고대역 인코더 (A200) 가 상이한 코딩 방법에 따라 동작하는 구현에 대해 특히 바람직하다. 예를 들면, 상이한 코딩 기술은 상당히 상이하게 들리는 신호들을 생성할 수 있다. 코드북 인덱스들의 형태로 스펙트럼 엔벌로프를 인코딩하는 코더는 대신 진폭 스펙트럼을 인코딩하는 코더에 대해 상이한 음향을 갖는 신호를 생성할 수도 있다. 시간-도메인 코더 (예를 들어 펄스-코드-변조 또는 PCM 코더) 는 주파수-도메인 코더에 비해 상이한 음향을 가질 수 있다. 스펙트럼 엔벌로프의 표현을 갖는 신호 및 대응하는 잔여 신호를 인코딩하는 코더는 스펙트럼 엔벌로프의 표현만을 갖는 신호를 인코딩하는 코더에 비해 상이한 음향을 갖는 신호를 생성할 수 있다. 그 파형의 표현으로서 신호를 인코딩하는 코더는 정현파 (sinusoidal) 코더로부터의 출력에 비해 상이한 음향을 갖는 출력을 생성할 수 있다. 이러한 경우, 오버래핑하지 않는 서브대역들을 정의하는 가파른 전이 영역 을 갖는 필터들의 사용은 합성된 광대역 신호에 있어서의 서브대역들 사이에 급격하고 지각적으로 (perceptually) 현저한 전이를 야기할 수도 있다.
비록 상보적인 (complementary) 오버래핑 주파수 응답을 갖는 QMF 필터 뱅크들이 서브대역 기술에 있어서 종종 사용되나, 이러한 필터들은 여기에서 기술된 광대역 코딩 구현의 적어도 일부에 대하여 부적절하다. 인코더의 QMF 필터 뱅크는 디코더의 대응하는 QMF 필터 뱅크에서 취소 (cancel) 되는 상당한 정도의 에일리어싱을 생성하도록 구성된다. 이러한 배열은, 왜곡 (distortion) 이 에일리어스 삭제 성질의 효율성을 감소시킬 수 있으므로, 신호가 필터 뱅크들간의 왜곡의 상당한 양을 발생시키는 애플리케이션에 대하여는 적합하지 않을 수 있다. 예를 들어, 여기에서 기술된 애플리케이션들은 매우 낮은 비트 레이트에서 수행하도록 구성되는 코딩 구현을 포함한다. 매우 낮은 비트 레이트의 결과로, QMF 필터 뱅크들의 사용이 삭제되지 않은 에일리어싱을 야기할 수 있도록, 디코딩된 신호가 원 신호에 비하여 심각하게 왜곡된 것으로 나타나기 쉽다. QMF 필터 뱅크들을 사용하는 애플리케이션들은 통상적으로 더 높은 비트 레이트 (예를 들면 AMR 에 대해 12 kbps 이상, 및 G.722 에 대해 64 kbps 이상) 갖는다.
추가적으로, 코더는 지각적으로는 원래의 신호에 유사하나 실질적으로는 원래의 신호와 상당히 다른 합성된 신호를 생성하도록 구성될 수 있다. 예를 들어, 여기에서 기술된 바와 같이 협대역 잉여로부터 고대역 여기를 도출하는 코더는, 실제 고대역 잉여가 디코딩된 신호로부터 완벽하게 부재 (absent) 될 수 있는 신호를 생성할 수 있다. 이러한 애플리케이션에서 QMF 필터의 사용은 삭제되지 않은 에일리어싱에 기인하는 심각한 정도의 왜곡을 야기할 수 있다.
QMF 에일리어싱에 기인하는 왜곡의 양은, 에일리어싱의 영향이 서브대역의 폭과 동일한 대역폭으로 제한되듯이, 영향을 받은 (affected) 서브대역이 협소하다면 감소될 수도 있다. 하지만, 각 서브대역이 광대역 대역폭의 약 절반을 포함하는 여기에서 기술된 바와 같은 예에 있어서, 삭제되지 않은 에일리어싱에 기인하는 왜곡은 신호의 상당한 부분에 영향을 줄 수 있다. 신호의 품질 또한 삭제되지 않은 에일리어싱이 발생한 주파수 대역의 위치에 의해 영향받을 수 있다. 예를 들어, 광대역 스피치 신호의 중심부 (예를 들어 3 내지 4 kHz 사이) 주변에 생성된 왜곡은 신호의 에지 (예를 들어 6kHz 이상) 주변에서 발생한 왜곡에 비해 훨씬 더 거부될 (objectionable) 수 있다.
QMF 필터 뱅크의 필터들의 응답들이 엄격하게 서로 연관되어 있으므로, 필터 뱅크들 (A110 및 B120) 의 저대역 및 고대역 경로들은 2개 서브대역들의 오버래핑으로부터 완전히 분리되어 연관되지 않는 스펙트럼들을 갖도록 구성될 수 있다. 2 개의 서브대역의 오버랩을, 고대역 필터의 주파수 응답이 -20 dB 로 떨어지는 지점에서 저대역 필터의 주파수 응답이 -20 dB 로 떨어지는 지점까지로 정의한다. 필터 뱅크 (A110 및/또는 B120) 의 다양한 예에서, 이 오버랩의 범위는 200 Hz 주변에서 1 kHz 주변까지이다. 약 400 내지 약 600 Hz 의 범위는 코딩 효율 및 지각적인 평활도 간의 바람직한 트레이드오프를 나타낼 수 있다. 상기 언급된 바와 같은 특정한 일 예에서, 오버랩은 500 Hz 주변이다.
도 4a 및 도 4b 에 도시된 바와 같이 복수의 단계들로 동작을 수행하도록 필 터 뱅크 (A112 및/또는 B122) 를 구현하는 것이 바람직할 수 있다. 예를 들어, 도 4c 는 일련의 인터폴레이션 (interpolation), 리샘플링, 데시메이션 (decimation), 및 다른 동작을 사용하여 고역통과 필터링 및 다운샘플링 동작의 기능적 등가를 수행하는 필터 뱅크 (A112) 의 일 구현 (A114) 의 블록도를 도시한다. 이러한 구현은 설계가 더욱 용이할 수 있고/또는 로직 및/또는 코드의 기능적 블록의 재사용을 가능하게 할 수도 있다. 예를 들어, 동일한 기능적 블록이 도 4c 에 도시된 바와 같이 14 kHz 의 데시메이션 및 7 kHz 의 데시메이션의 동작을 수행하는데 사용될 수 있다. 스펙트럼 반전 동작은 신호에 펑션 또는 시퀀스 를 승산함으로써 구현될 수도 있으며, 그 펑션 및 시퀀스의 값은 +1 및 -1 에서 교번한다. 스펙트럼 쉐이핑 (shaping) 동작은 원하는 전체 필터 응답을 획득하기 위해 신호를 쉐이핑하도록 구성되는 저역통과 필터로서 구현될 수 있다.
스펙트럼 반전 동작의 결과로서, 고대역 신호 (S30) 의 스펙트럼은 반전된다. 이에 따라, 인코더 및 대응하는 디코더에서의 후속 동작들이 구성될 수 있다. 예를 들어, 여기에서 기술된 바와 같이 고대역 여기 생성기 (A300) 는, 또한 스펙트럼 반전된 형태를 갖는 고대역 여기 신호 (S120) 를 생성하도록 구성된다.
도 4d 는 일련의 인터폴레이션, 리샘플링, 및 다른 동작을 사용하여 업샘플링 및 고역통과 필터링 동작의 기능적 등가를 수행하는 필터 뱅크 (B112) 의 일 구현 (B1244) 의 블록도를 도시한다. 필터 뱅크 (B124) 는 예를 들면 필터 뱅크 (A114) 에서와 같은 인코더의 필터뱅크에서 수행된 바와 같은 유사한 동작을 반전시킨 고대역에서의 스펙트럼 반전 동작을 포함한다. 이 특정 예시에서, 필터 뱅크 (B124) 는 7100 Hz 에서의 신호 콤포넌트를 감쇠시키는 저대역 및 고대역에서의 노치 (notch) 필터들을 포함하지만, 이러한 필터들은 선택적이며 반드시 포함되어야 하는 것은 아니다. 발명의 명칭이 "스피치 신호 필터링을 위한 시스템, 방법, 및 장치 (SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING)" 로 출원된, 현재 미국 출원 공개 공보 제 2007/0088558 호인, 특허 출원은 필터 뱅크들 (A110 및 B120) 의 특정 구현의 요소들의 응답에 관련된 추가적인 설명 및 도면을 포함하며, 이 자료는 여기에 참조로써 포함된다.
협대역 인코더 (A120) 는 (A) 필터를 설명하는 파라미터들의 세트 및 (B) 설명된 필터로 하여금 입력 스피치 신호의 합성된 재생물을 생성하게 하는 여기 신호로서 입력 스피치 신호를 인코딩하는 소스-필터 모델에 따라서 구현된다. 도 5a 는 스피치 신호의 스펙트럼 엔벌로프의 예를 도시한다. 이 스펙트럼 엔벌로프를 특성짓는 피크들은 음역 (vocal tract) 의 공명을 나타내며 포르먼트로 지칭된다. 대부분의 스피치 코더들은 적어도 이 코오스 스펙트럼 구조를 필터 계수들과 같은 파라미터들의 세트로서 인코딩한다.
도 5b 는 협대역 신호 (S20) 의 스펙트럼 엔벌로프의 코딩에 적용되는 기본 소스-필터 배열의 예를 도시한다. 분석 모듈 (analysis module) 은 일 시간 주기 (통상적으로 20 msec) 동안의 스피치 음향에 대응하는 필터를 특징짓는 파라미 터들의 세트를 산출한다. 이들 필터 파라미터들에 따라서 구성되는 화이트닝 필터 (분석 또는 예측 에러 필터로 또한 지칭됨) 는 스펙트럼 평탄화된 신호에 대한 스펙트럼 엔벌로프를 제거한다. 결과적인 화이트닝된 신호 (잉여로 또한 지칭됨) 는 원 스피치 신호보다 더 적은 에너지를 갖고 따라서 더 적은 변이 (variance) 를 가지며, 인코딩하기에 더욱 용이하다. 잉여 신호의 코딩에서 비롯된 에러들은 또한 스펙트럼상으로 도 균등하게 확산 (spread) 될 수 있다. 필터 파라미터들 및 잉여는 채널으로의 효율적인 전송을 위해 통상적으로 양자화된다. 디코더에서, 필터 파라미터들에 따라 구성되는 합성 필터는 잉여에 기반한 신호에 의해 여기되어 원래의 스피치 음향의 합성된 버젼을 생성한다. 통상적으로 합성 필터는 화이트닝 필터의 전달 함수의 반전에 해당하는 전달 함수를 갖도록 구성된다.
도 6 은 협대역 인코더 (A120) 의 기본 구현 (A122) 의 블록도를 도시한다. 이 예시에서, 선형 예측 코딩 (LPC) 분석 모듈 (210) 은 협대역 신호 (S20) 의 스펙트럼 엔벌로프를 선형 분석 (LP) 계수들 (예를 들면 올-폴 (all-pole) 필터 1/A(z) 의 계수들) 의 세트로서 인코딩한다. 통상적으로, 분석 모듈은 일련의 오버래핑하지 않는 프레임들로서 입력 신호를 프로세싱하여, 계수들의 신규한 세트는 각 프레임에 대해 산출된다. 프레임 주기는 일반적으로 신호가 지엽적으로 (locally) 정상상태 (stationary) 일 것으로 기대될 수도 있는 한 주기로서, 일반적인 일 예는 20 밀리초 (8 kHz 의 샘플링 레이트에서 160 개 샘플들과 등가임) 이다. 일 예에서, LPC 분석 모듈 (210) 은 각 20-밀리초 프레임의 포르먼트 구조 를 특성짓는 10 개의 LP 필터 계수들의 세트를 산출하도록 구성된다. 분석 모듈로 하여금 입력 신호를 일련의 오버래핑 프레임들로서 프로세싱하도록 구현하는 것이 또한 가능하다.
분석 모듈은 각 프레임의 샘플들을 직접 분석하도록 구성될 수 있으며, 또는 샘플들이 윈도우잉 펑션 (예를 들면, 해밍 (Hamming) 윈도우) 에 따라서 먼저 웨이팅될 (weighted) 될 수 있다. 또한, 분석은 30-msec 윈도우와 같이, 프레임보다 큰 윈도우상에서 수행될 수 있다. 이 윈도우는 대칭적 (예를 들면 20 msec 프레임 직전 및 직후에 5 msec 를 포함하도록 5-20-5) 또는 비대칭적 (예를 들면 선행 프레임의 최후 10 msec 를 포함도록 10-20) 일 수 있다. 통상적으로, LPC 분석 모듈은 레빈슨-더빈 (Levinson-Durbin) 재귀 (recursion) 또는 리룩스-구겐 (Loroux-Gueguen) 알고리즘을 사용하여 LP 필터 계수들을 산출하도록 구성된다. 다른 구현에서, 분석 모듈은 LP 필터 계수들의 세트 대신 각 프레임의 켑스트럼의 (cepstral) 계수의 세트를 산출하도록 구성될 수 있다.
인코더 (A120) 의 출력 레이트는 필터 파라미터의 양자화에 의해, 재생 품질에의 상대적으로 적은 영향과 함께, 현저하게 감소될 수 있다. 선형 예측 필터 계수들은 효율적으로 양자화하기 어렵고, 일반적으로, 양자화 및/또는 엔트로피 인코딩을 위해 선 스펙트럼 쌍 (LSP) 또는 선 스펙트럼 주파수 (LSF) 와 같이 다른 표현으로 맵핑된다. 도 6 의 예에서, LP필터계수-대-LSF 변환 (220) 은 LP 필터 계수들의 세트를 대응하는 LSF 의 세트로 변환시킨다. 다른 LP 필터 계수들의 일대일 표현들은 파코어 (parcor) 계수; 로그-영역-비 (log-area-ratio) 값; 이 미턴스 스펙트럼 쌍 (ISP) 및 이미턴스 스펙트럼 주파수 (ISF) 를 포함하며, GSM (Global System for Mobile Communications) AMR-WB (Adaptive Multirate-Wideband) 코덱에 사용된다. 통상적으로, LP 필터 계수들 및 대응하는 LSF 의 세트간의 변환은 가역적이지만, 실시예에서는 그 변환이 에러없이 가역적이지 않은 인코더 (A120) 의 구현을 또한 포함한다.
양자화기 (230) 는 협대역 LSF (또는 다른 계수 표현) 의 세트를 양자화하도록 구성되며, 협대역 인코더 (A122) 는 협대역 필터 파라미터 (S40) 로서 이 양자화 결과를 출력하도록 구성된다. 통상적으로, 이러한 양자화기는 테이블 또는 코드북에서의 대응하는 벡터에 대한 인덱스로서 입력 벡터를 인코딩하는 벡터 양자화기를 포함한다.
도 6 에서 보여지는 바와 같이, 협대역 인코더 (A122) 는 협대역 신호 (S20) 를 필터 계수들의 세트에 따라 구성되는 화이트닝 필터 (260) (분석 또는 예측 에러 필터로 또한 지칭됨) 를 통해 통과시킴으로써 잉여 신호를 또한 생성한다. 이 특정 예시에서, 화이트닝 필터 (260) 는, IIR 구현이 또한 사용될 수 있지만, FIR 필터로서 구현된다. 통상적으로, 이러한 잉여 신호는 협대역 필터 파라미터들 (S40) 에는 표현되지 않는, 피치에 연관된 장기 (long-term) 구조와 같은, 스피치 프레임의 지각적으로 중요한 정보를 포함한다. 양자화기 (270) 는 인코딩된 협대역 여기 신호 (S50) 로서의 출력을 위해 이 잉여 신호의 양자화된 표현을 산출하도록 구성된다. 통상적으로 이러한 양자화기는 테이블 또는 코드북에서 대응하는 벡터에 대한 인덱스로서 입력 벡터를 인코딩하는 벡터 양자화기를 포함한 다. 다른 방법으로, 이러한 양자화기는 희박한 (sparse) 코드북 방법에서과 같이 스토리지로부터 검색된 것 보다 디코더에서 벡터가 동적으로 생성될 수 있는 일 이상의 파라미터들을 전송하도록 구성될 수 있다. 이러한 방법은 대수적인 CELP (codebook excitation linear prediction) 및 3GPP2 (제 3 세대 파트너쉽 2) EVRC (Enhanced Variable Rate Codec) 와 같은 코덱과 같은 코덱 스킴에서 사용된다.
협대역 인코더 (A120) 는 대응하는 협대역 디코더에서 이용가능하게 되는 동일한 필터 파라미터 값들에 따라서 인코딩된 협대역 여기 신호를 생성하는 것이 바람직하다. 이러한 방식으로, 결과적인 인코딩된 협대역 여기 신호는 양자화 에러와 같은 파라미터 값들의 비이상성 (nonideality) 에 대해 일정 범위까지 이미 설명하고 있을 수도 있다. 따라서, 디코더에서 이용가능할 수 있는 동일한 계수 값들을 사용하여 화이트닝 필터를 구성하는 것이 바람직하다. 도 6 에서 도시된 바와 같은 인코더 (A122) 의 기본적인 예에서, 역 양자화기 (240) 는 협대역 코딩 파라미터 (S40) 를 양자화해제 (diquantize) 하고, LSF-대-LP 필터 계수 변환 (250) 은 결과 값들을 대응하는 LP 필터 계수들의 세트로 다시 맵핑시키며, 이 계수들의 세트가 화이트닝 필터 (260) 로 하여금 양자화기 (270) 에 의해 양자화된 잉여 신호를 생성하도록 구성하는데 사용된다.
협대역 인코더 (A120) 의 임의의 구현은 잉여 신호와 최상으로 매칭되는 코드북 백터들의 세트중에서 하나를 인식함으로써 인코딩된 협대역 여기 신호 (S50) 를 산출하도록 구성된다. 하지만 협대역 인코더 (A120) 는 잉여 신호를 실제로 생성함이 없이 잉여 신호의 양자화된 표현을 산출하도록 또한 구현될 수 있다. 예를 들면, 협대역 인코더 (A120) 는 대응하는 합성된 신호를 생성하기 위해 (예를 들면, 필터 파라미터들의 현재 세트에 따라서), 및 지각적으로 웨이팅된 도메인에서 원래의 협대역 신호 (S20) 에 최상으로 매칭되는 생성 신호에 관련된 코드북 벡터를 선택하기 위해 복수의 코드북 벡터들을 사용하도록 구성될 수 있다.
도 7 은 협대역 디코더 (B110) 의 일 구현 (B112) 의 블록도를 도시한다. 역 양자화기 (310) 는 협대역 필터 파라미터들 (S40) 을 양자화해제하고 (이 경우, LSF 의 세트로), LSF-대-Lp 필터 계수 변환 (320) 은 LSF 를 필터 계수의 세트로 변환한다 (예를 들어, 상기 기술된 바와 같이 협대역 인코더 (A122) 의 역 양자화기 (240) 및 변환 (250) 을 참조). 역 양자화기 (340) 는 인코딩된 협대역 여기 신호 (S50) 를 양자화해제하여 협대역 여기 신호 (S80) 를 생성한다. 필터 계수들 및 협대역 여기 신호 (S80) 에 기반하여, 협대역 합성 필터 (330) 는 협대역 신호 (S90) 를 합성한다. 즉, 협대역 합성 필터 (330) 는 협대역 신호 (S90) 를 생성하기 위해 양자화해제된 필터 계수들에 따라 협대역 여기 신호 (S80) 를 스펙트럼 쉐이핑하도록 구성된다. 협대역 디코더 (B112) 는 또한 협대역 여기 신호 (S80) 를 고대역 인코더 (A200) 로 제공하고, 인코더 (A200) 는 여기에 기술된 바와 같이 고대역 여기 신호 (S120) 를 도출하는데 사용한다. 이하에서 기술될 바와 같이 일부 구현에서, 협대역 디코더 (B110) 는 스펙트럼 경사 (tilt), 피치 이득 및 래그 (lag), 및 스피치 모드와 같은 협대역 신호에 관련된 추가적인 정보를 고대역 디코더 (B200) 에 제공하도록 구성될 수 있다.
협대역 인코더 (A122) 및 협대역 디코더 (B112) 의 시스템은 합성에-의한-분석 (analysis-by-synthesis) 스피치 코덱의 기본적인 예이다. CELP (codebook excitation linear prediction) 코딩은 합성에-의한-분석 코딩의 대중적인 일종이며, 이러한 코더들의 구현은 고정된 또는 적응성의 코드북으로부터의 엔트리들의 선택, 에러 최소화 동작, 및/또는 지각적인 웨이팅 동작과 같은 동작들을 포함하는 잉여의 파형 인코딩을 수행할 수 있다. 합성에-의한-분석 코딩의 다른 구현은 MELP (mixed excitation linear prediction), ACELP (algebraic CELP), RCELP (relaxation CELP), RPE (regular pulse excitation), MPE (multi-pulse CELP), 및 VSELP (vector-sum excited linear prediction) 코딩을 포함한다. 관련 코딩 방법들은 MBE (multi-band excitation) 및 PWI (prototype waveform interpolation) 코딩을 포함한다. 표준화된 합성에-의한-분석 스피치 코덱의 예시는 RELP (residual excited linear prediction) 를 사용하는 ETSI (European Telecommunications Standards Institute)-GSM 풀 레이트 코덱 (GSM 06.10), GSM 인핸스드 풀 레이트 코덱 (ESTI-GSM 06.60); ITU (International Telecommunication Union) 표준 11.8 kb/s G.729 애넥스 E 코더; IS-316 (시분할 다중 액세스 스킴) 을 위한 IS (Interim Standard) -641 코덱; GSM-AMR (GSM adaptive multirate) 코덱; 및 4GVTM (제 4 세대 보코더TM) 코덱 (퀄컴사, Sandiego, CA) 을 포함한다. 협대역 인코더 (A120) 및 대응하는 디코더 (B110) 는, 스피치 신호를 (A) 필터를 설명하는 파라미터들의 세트 및 (B) 그 설명된 필터로 하여 금 스피치 신호를 재생하게 하는데 사용되는 여기 신호로서 표현하는 임의의 이들 기술들 또는 임의의 다른 스피치 코딩 기술 (알려진 또는 개발될 기술) 에 따라서 구현될 수 있다.
화이트닝 필터가 협대역 신호 (S20) 로부터 코오스 스펙트럼 엔벌로프를 제거한 후에도, 특히 음성화된 스피치에 대한 상당한 양의 정밀한 고조파 구조가 남을 수도 있다. 도 8a 는 모음과 같은 음성화된 신호에 대한, 화이트닝 필터에 의해 재생성될 수 있는, 잉여 신호의 일 예의 스펙트럼의 플롯을 도시한다. 이 예에서 가시적인 주기적 구조는 피치에 관련되며, 동일 화자에 의해 발화된 상이한 음성화된 음향은 상이한 포르먼트 구조이나 유사한 피치 구조를 가질 수 있다. 도 8b 는 시간에서 피치 펄스들의 시퀀스를 나타내는 이러한 잉여 신호의 예시의 시간-도메인 플롯을 도시한다.
코딩 효율 및/또는 스피치 품질은 피치 구조의 특성을 인코딩하는 일 이상의 파라미터 값들을 사용함으로써 증가될 수 있다. 피치 구조의 중요한 일 특성은 통상 60 내지 400 Hz 의 범위에 있는 제 1 고조파의 주파수 (기초 주파수로 또한 지칭됨) 이다. 이 특성은 기초 주파수의 역으로서 통상 인코딩되며, 피치 래그라고 또한 지칭된다. 피치 래그는 일 피치 주기내의 샘플들의 수를 나타내며 적어도 코드북 인덱스들로서 인코딩될 수 있다. 남성 화자의 스피치 신호는 여성 화자의 스피치 신호보다 더욱 넓은 피치 래그를 갖는 경향이 있다.
피치 구조에 연관되는 다른 신호 특성은 주기성으로, 고조파 구조의 강도를 나타내며, 다시 말해, 신호가 고조파 또는 비고조파인 정도를 나타낸다. 주기 성의 2 개의 통상적인 표시자는 제로-크로싱 및 정규화된 자기 상관 함수 (NACF) 이다. 주기성은 코드북 이득으로서 (예를 들면 양자화된 적응성의 코드북 이득) 보통 인코딩되는, 피치 이득에 의해 또한 표시될 수 있다.
협대역 인코더 (A120) 는 협대역 신호 (S20) 의 장기 고조파 구조를 인코딩하도록 구성되는 적어도 모듈들을 포함할 수 있다. 도 9 에서 도시된 바와 같이, 사용될 수 있는 일 통상적인 CELP 패러다임은 단기 특성 또는 코오스 스펙트럼 엔벌로프를 인코딩하는 개-루프 LPC 분석 모듈을 포함하며, 정밀한 피치 또는 고조파 구조를 인코딩하는 폐-루프 장기 예측 분석 단계가 이어진다. 단기 특성은 필터 계수들로서 인코딩되며, 장기 특성은 피치 래그 및 피치 이득과 같은 파라미터들의 값들로서 인코딩된다. 예를 들면, 협대역 인코더 (A120) 는 적어도 코드북 인덱스들 (예를 들어, 고정된 코드북 인덱스 및 적응성의 코드북 인덱스) 및 대응하는 이득 값들을 포함하는 형태로 인코딩된 협대역 여기 신호 (S50) 를 출력하도록 구성될 수 있다. (예를 들어 양자화기 (270) 에 의한) 협대역 잉여 신호의 양자화된 표현의 산출은 이러한 인덱스들의 선택 및 이러한 값들의 산출을 포함할 수 있다. 피치 구조의 인코딩은 피치 프로토타입 파형의 인터폴레이션을 또한 포함하며, 이 동작은 연속적인 피치 펄스들간의 차이를 산출하는 것을 포함할 수 있다. 장기 구조의 모델링은 통상 노이즈와 같은 (noise-like) 및 구조화되지 않은, 비음성화 스피치에 대응하는 프레임에 대해 디스에이블될 (disable) 수 있다.
도 9 에서 도시된 바와 같은 패러다임에 따른 협대역 디코더 (B110) 의 구현 은 장기 구조 (피치 또는 고조파 구조) 가 저장된 후에 협대역 여기 신호 (S80) 를 고대역 디코더 (B200) 로 출력하도록 구성될 수 있다. 예를 들면, 이러한 디코더는 협대역 여기 신호 (S80) 를 인코딩된 협대역 여기 신호 (S50) 의 양자화해제된 버젼으로서 출력하도록 구성될 수 있다. 물론, 고대역 디코더 (B200) 가 인코딩된 협대역 여기 신호의 양자화해제를 수행하여 협대역 여기 신호 (S80) 를 획득하도록 협대역 디코더 (B110) 를 구성하는 것이 또한 가능하다.
도 9 에 도시된 바와 같은 패러다임에 따른 광대역 스피치 인코더 (A100) 의 구현에 있어서, 고대역 인코더 (A200) 는 단기 분석 또는 화이트닝 필터에 의해 생성된 바와 같은 협대역 여기 신호를 수신하도록 구성될 수 있다. 즉, 협대역 인코더 (A120) 는 장기 구조를 인코딩하기 전에 협대역 여기 신호를 고대역 인코더 (A200) 로 출력하도록 구성될 수 있다. 하지만, 고대역 인코더 (A200) 로 하여금 고대역 디코더(B200) 에 의해 수신될 동일한 코딩 정보를 협대역 채널로부터 수신하여, 고대역 인코더 (A200) 에 의해 생성된 코딩 파라미터들이 그 정보내의 비이상성 (nonidealities) 에 대해 일정 범위까지 이미 설명할 수 있도록 하는 것이 바람직하다. 따라서 고대역 인코더 (A200) 로 하여금 광대역 스피치 인코더 (A100) 에 의해 출력될, 동일하게 파라미터화 및/또는 양자화된 인코딩된 협대역 여기 신호 (S50) 로부터 협대역 여기 신호 (S80) 를 재구성하는 것이 바람직하다. 이러한 접근의 일 잠재적인 이점은 이하에서 설명될 고대역 이득 팩터 (S60b) 의 더욱 정확한 산출이다.
협대역 신호 (S20) 의 단기 및/또는 장기 구조를 특성짓는 파라미터들에 추 가로, 협대역 인코더 (A120) 는 협대역 신호 (S20) 의 다른 특성에 연관된 파라미터 값들을 생성할 수 있다. 광대역 스피치 인코더 (A100) 에 의한 출력에 대해 적합하게 양자화될 이 값들은, 협대역 필터 파라미터들 (S40) 에 포함되거나, 별도로 출력될 수 있다. 고대역 인코더 (A200) 는 적어도 이러한 추가적인 파라미터들에 따라서 (예를 들면, 양자화해제 후) 고대역 코딩 파라미터들 (S60) 을 산출하도록 또한 구성될 수 있다. 광대역 스피치 디코더 (B100) 에서, 고대역 디코더 (B200) 는 협대역 디코더 (B110) 를 통해 파라미터 값들을 수신하도록 (예를 들면, 양자화해제 후) 구성될 수 있다. 다른 방법으로, 고대역 디코더 (B200) 는 파라미터 값들을 직접 수신하도록 (및 양자화해제가 가능하도록) 구성될 수 있다.
추가적인 협대역 코딩 파라미터들의 일 예에서, 협대역 인코더 (A120) 는 각 프레임에 대한 스펙트럼 경사 및 스피치 모드 파라미터에 대한 값들을 생성한다. 스펙트럼 경사는 통과대역상의 스펙트럼 엔벌로프의 형상에 관련되며, 통상적으로, 양자화된 제 1 반사 계수에 의해 표현된다. 대부분의 음성화된 음향의 경우, 스펙트럼 에너지는 주파수의 증가와 함께 감소하여, 제 1 반사 계수는 음수이며 -1 에 접근할 수 있다. 대부분의 비음성화된 음향은 평탄한 스펨트럼을 갖게 되어 제 1 반사 계수는 0 에 가까우며, 또는 고 주파수에서 더 많은 에너지를 갖게 되어 제 1 반사 계수는 양수이며 +1 에 접근할 수도 있다.
스피치 모드 (음성화 모드로 또한 지칭됨) 는 현재 프레임이 음성화된 스피치 또는 비음성화된 스피치를 표현하는 지를 나타낸다. 이 파라미터는 주기성 (예를 들어, 제로 크로싱, NACF, 피치 이득) 의 하나 이상의 측정에 기반한 이진 값, 및/또는 이러한 측정 및 스레스홀드 값 간의 관계와 같은 프레임에 대한 음성 활성도를 가질 수도 있다. 다른 구현에 있어서, 스피치 모드 파라미터는 무음 또는 배경 노이즈, 또는 무음 및 음성화된 스피치간의 전이와 같은 모드들을 나타내는 적어도 다른 스테이트들을 갖는다.
고대역 인코더 (A200) 는 소스-필터 모델에 따라서 고대역 신호 (S30) 를 인코딩하도록 구성되며, 이 필터에 대한 여기는 인코딩된 협대역 여기 신호에 기반한다. 도 10 은 고대역 필터 파라미터들 (S60a) 및 고대역 이득 팩터들 (S60b) 을 포함하는 고대역 코딩 파라미터들 (S60) 의 스트림을 생성하도록 구성되는 고대역 인코더 (A200) 의 일 구현 (A202) 의 블록도를 도시한다. 고대역 여기 생성기 (A300) 는 인코딩된 협대역 여기 신호 (S50) 로부터 고대역 여기 신호 (S120) 를 도출한다. 분석 모듈 (A210) 은 고대역 신호 (S30) 의 스펙트럼 엔벌로프를 특성짓는 파라미터 값들의 세트를 생성한다. 이 특정 예시에서, 분석 모듈 (A210) 은 LPC 분석을 수행하여 고대역 신호 (S30) 의 각 프레임에 대한 LP 필터 계수들의 세트를 생성하도록 구성된다. 선형 예측 필터 계수-대-LSF 변환 (410) 은 LP 필터 계수의 세트를 LSF 의 대응하는 세트로 변환시킨다. 분석 모듈 (210) 및 변환 (220) 을 참조하여 상술된 바와 같이, 분석 모듈 (A210) 및/또는 변환 (410) 은 다른 계수 세트들 (예를 들어 켑스트럼 계수) 및/또는 계수 표현들 (예를 들면 ISP) 을 사용하도록 구성될 수 있다.
양자화기 (420) 는 고대역 LSF (또는 ISP 와 같은 다른 계수 표현) 의 세트를 양자화하도록 구성되고, 고대역 인코더 (A202) 는 이 양자화의 결과를 고대역 필터 파라미터 (S60a) 로서 출력하도록 구성된다. 통상적으로, 이러한 양자화기는 테이블 또는 코드북의 대응하는 벡터 엔트리에 대한 인덱스로서 입력 벡터를 인코딩하는 벡터 양자화기를 포함한다.
고대역 인코더 (A202) 는 분석 모듈 (A210) 에 의해 생성된 고대역 여기 신호 (S120) 및 인코딩된 스펙트럼 엔벌로프 (예를 들면 LP 필터 계수들의 세트) 에 따라서 합성된 고대역 신호 (S130) 를 생성하도록 구성되는 합성 필터 (A220) 을 또한 포함한다. 합성 필터 (A220) 는 IIR 필터로서 통상 구현되지만, FIR 구현이 또한 사용될 수 있다. 특정 예시에서, 합성 필터 (A220) 는 6 차 선형 자기회귀 (autoregressive) 필터로서 구현된다.
고대역 이득 팩터 산출기 (A230) 는 원래의 고대역 신호 (S30) 및 합성된 고대역 신호 (S130) 간의 적어도 차이를 산출하여 프레임에 대한 이득 엔벌로프를 특정한다. 테이블 또는 코드북 내의 벡터 엔트리의 대응하는 인덱스로서 입력 벡터를 인코딩하는 벡터 양자화기로 구현될 수 있는 양자화기 (430) 는, 이득 엔벌로프를 특정하는 값 또는 값들을 양자화하고, 고대역 인코더 (A202) 는 이 양자화의 결과를 고대역 이득 팩터 (S60b) 로서 출력하도록 구성된다.
도 10 에 도시된 바와 같은 구현에 있어서, 합성 필터 (A220) 는 분석 모듈 (A210) 로부터 필터 계수들을 수신하도록 배열된다. 고대역 인코더 (A202) 의 또 다른 구현은 고대역 필터 파라미터들 (S60a) 로부터 필터 계수들을 디코딩하도록 구성되는 역 양자화기 및 역 변환을 포함하며, 이 경우 합성 필터 (A220) 는 대신 디코딩된 필터 계수들을 수신하도록 배열된다. 이러한 또 다른 배열은 고대 역 이득 산출기 (A230) 에 의한 이득 엔벌로프의 더욱 정확한 산출을 지원할 수 있다.
일 특정 예시에서, 분석 모듈 (A210) 및 고대역 이득 산출기 (A230) 는 프레임당 6 개 LSF 의 세트 및 5 개 이득 값들의 세트를 각각 출력하여, 협대역 신호 (S20) 의 광대역 확장이 오직 프레임당 11 개의 추가적 값들로 달성될 수 있다. 귀는 고 주파수에서의 주파수 에러에 덜 민감한 경향이 있으므로, 낮은 LPC 차수의 고대역 코딩은 높은 LPC 차수의 저대역 코딩에 필적하는 지각적인 품질을 갖는 신호를 생성할 수 있다. 고대역 인코더 (A200) 의 통상의 구현은 스펙트럼 엔벌로프의 고-품질 재구성을 위한 8 내지 12 비트 및 일시적인 (temporal) 엔벌로프의 고-품질 재구성을 위한 또 다른 8 내지 12 비트를 출력하도록 구성될 수 있다. 다른 특정 예시에서, 분석 모듈 (A210) 은 프레임당 8 개 LSF 의 세트를 출력한다.
고대역 인코더 (A200) 의 일부 구현은 협대역 신호 (S20), 협대역 여기 신호 (S80), 또는 고대역 신호 (S30) 의 시간-도메인 엔벌로프에 따라서, 노이즈 신호의 진폭-변조 및 고대역 주파수 컴포넌트를 갖는 랜덤 노이즈 신호의 생성에 의해 고대역 여기 신호 (S120) 를 생성하도록 구성된다. 이러한 노이즈-기반 방법은 비음성화된 음향에 대해 적절한 결과를 생성할 수 있지만, 잉여가 보통 고조파이며 따라서 임의의 주기적 구조를 갖는 음성화된 음향에 대하여는 바람직하지 않을 수 있다.
고대역 여기 생성기 (A300) 는 협대역 여기 신호 (S80) 의 스펙트럼을 고대역 주파수 범위로 확장시킴으로써 고대역 여기 신호 (S120) 를 생성하도록 구성된다. 도 11 은 고대역 여기 생성기 (A300) 의 일 구현 (A302) 의 블록도를 도시한다. 역 양자화기 (450) 는 인코딩된 협대역 여기 신호 (S50) 를 양자화해제하여 협대역 여기 신호 (S80) 를 생성하도록 구성된다. 스펙트럼 확장기 (A400) 는 협대역 여기 신호 (S80) 에 기반하여 고조파로 확산된 신호 (S160) 를 생성하도록 구성된다. 결합기 (470) 는 노이즈 생성기 (480) 에 의해 생성된 랜덤 노이즈 신호 및 엔벌로프 산출기 (460) 에 의해 산출된 시간-도메인 엔벌로프를 결합하여 변조된 노이즈 신호 (S170) 를 생성하도록 구성된다. 결합기 (490) 는 고조파로 확장된 신호 (S160) 및 변조된 노이즈 신호 (S170) 를 믹싱하여 고대역 여기 신호 (S120) 를 생성하도록 구성된다.
일 예시에서, 스펙트럼 확장기 (A400) 는 협대역 여기 신호 (S80) 에 스펙트럼 폴딩 동작 (미러잉 (mirroring) 으로 또한 지칭됨) 을 수행하여 고조파로 확장된 신호 (S160) 생성하도록 구성된다. 스펙트럼 폴딩은 에일리어싱을 보존하도록 여기 신호 (S80) 를 제로-스터핑 (zero-stuffing) 한 후 고역통과 필터를 적용함으로써 수행될 수 있다. 다른 예시에서, 스펙트럼 확장기 (A400) 는 고대역으로 협대역 여기 신호 (S80) 를 스펙트럼적으로 변환시킴으로써 (예를 들면 정-주파수 (constant-frequency) 코사인 신호의 승산이 이어지는 업샘플링을 통해) 고조파로 확장된 신호 (S160) 를 생성하도록 구성된다.
스펙트럼 폴딩 및 변환 방법은, 그 고조파 구조가 위상 및/또는 주파수에서 협대역 여기 신호 (S80) 의 원래의 고조파 구조와 불연속인, 스펙트럼 확장된 신호 를 생성할 수 있다. 예를 들어, 이러한 방법들은 일반적으로 기초 주파수의 배수에 위치하지 않는 피크들을 갖는 신호를 생성할 수 있고, 이는 재구성된 스피치 신호에서 무의미한 음향 산물을 유발할 수 있다. 이 방법들은 또한 비자연적으로 강한 음조의 특성을 갖는 고-주파수 고조파를 생성하는 경향이 있다. 또한, PSTN 신호는 8 kHz 에서 샘플링되지만 단지 3400 Hz 로 대역제한될 수 있으므로, 협대역 여기 신호 (S80) 의 상위 스펙트럼은 적은 에너지를 포함하거나 에너지가 없을 수 있어, 스펙트럼 폴딩 또는 변환 동작에 따라 생성되는 확장된 신호는 3400 Hz 초과의 스펙트럼 홀 (hole) 을 가질 수 있다.
고조파로 확장된 신호 (S160) 를 생성하는 다른 방법들은 협대역 여기 신호 (S80) 의 적어도 기초 주파수들을 식별하고 이 주파수에 따라 고조파 톤들을 생성하는 것을 포함한다. 예를 들어, 여기 신호의 고조파 구조는 진폭 및 위상 정보를 함께 갖는 기초 주파수에 의해 특징지어질 수 있다. 고대역 여기 생성기 (A300) 의 다른 구현은 기초 주파수 및 진폭에 기반하여 (나타낸 바와 같이, 예를 들어, 피치 래그 및 피치 이득에 의해) 고조파로 확장된 신호 (S160) 를 생성한다. 하지만, 고조파로 확장된 신호가 협대역 여기 신호 (S80) 와 위상-코히어런트 (phase-coherent) 가 아니면, 결과적인 디코딩된 스피치의 품질은 용인될 수 없을 수 있다.
비선형 펑션이 협대역 여기와 위상-코이어런트이며 위상 불연속성이 없는 고조파 구조를 보존하는 고대역 여기를 생성하는데 사용될 수 있다. 비선형 펑션은 고-주파수 고조파들 간에 증가된 노이즈 레벨을 또한 제공하고, 이는 스펙트럼 폴딩 및 스펙트럼 변환과 같은 방법들에 의해 생성되는 음조의 고-주파수 고조파들에 비해 더 자연스럽게 들리는 경향이 있다. 스펙트럼 확장기 (A400) 의 다양한 구현에 의해 적용될 수 있는 통상적인 무기억 (memoryless) 비선형 펑션들은 절대값 펑션 (전파 정류 (fullwave rectification) 로 또한 지칭됨), 반파 정류, 스퀘어링 (squaring), 커빙 (cubing), 및 클리핑 (clipping) 을 포함한다. 스펙트럼 확장기 (A400) 의 다른 구현들은 메모리를 갖는 비선형 펑션을 적용하도록 구성될 수 있다.
도 12 는 협대역 여기 신호 (S80) 의 스펙트럼을 확장하기 위해 비선형 펑션을 적용하도록 구성되는 스펙트럼 확장기 (A400) 의 일 구현 (A402) 의 블록도이다. 업샘플러 (510) 는 협대역 여기 신호 (S80) 를 업샘플링하도록 구성된다. 비선형 펑션의 적용시에 에일리어싱을 최소화하도록 신호를 충분히 업샘플링하는 것이 바람직할 수 있다. 일 특정 예시에서, 업샘플러 (510) 는 신호를 8 의 팩터로 업샘플링한다. 업샘플러 (510) 는 입력 신호의 제로-스터핑 및 결과의 저역통과 필터링에 의해 업샘플링 동작을 수행하도록 구성될 수 있다. 비선형 펑션 산출기 (520) 는 업샘플링된 신호에 비선형 펑션을 적용하도록 구성된다. 스퀘어링과 같은 스펙트럼 확장을 위한 다른 비선형 펑션들에 대한 절대값 펑션의 일 잠재적인 이점은, 에너지 정규화가 요구되지 않는다는 것이다. 일부 구현에 있어서, 절대값 펑션은 각 샘플의 사인 (sign) 비트를 삭제 또는 제거함으로써 효율적으로 적용될 수 있다. 비선형 펑션 산출기 (520) 는 업샘플링된 또는 스펙트럼 확장된 신호의 진폭 와핑 (warping) 을 수행하도록 또한 구성될 수 있다.
다운샘플러 (530) 는 적용하는 비선형 펑션의 스펙트럼 확장된 결과를 다운샘플링하도록 구성된다. 다운샘플러 (530) 는 샘플링 레이트를 감소시키기 전에 스펙트럼 확장된 신호의 원하는 주파수 대역을 선택하도록 대역통과 필터링 동작을 수행하는 것이 바람직할 수 있다 (예를 들면, 원하지 않는 이미지에 의한 에일리어싱 또는 손상을 감소 또는 회피하기 위해). 다운 샘플러 (530) 는 하나 이상의 스테이지에서 샘플링 레이트를 감소시키는 것이 또한 바람직할 수 있다.
도 12a 는 스펙트럼 확장 동작의 일 예에서 다양한 지점에서의 신호 스펙트럼을 도시하는 도면이며, 여기서 다양한 플롯에 걸쳐 주파수 스케일은 동일하다. 플롯 (a) 는 협대역 여기 신호 (S80) 의 일 예시의 스펙트럼을 도시한다. 플롯 (b) 는 신호 (S80) 가 8 의 팩터에 의해 업샘플링된 후의 스펙트럼을 도시한다. 플롯 (c) 는 비선형 펑션을 적용한 후에 확장된 스펙트럼의 예시를 도시한다. 플롯 (d) 는 저역통과 필터링 후의 스펙트럼을 도시한다. 이 예시에서, 통과대역은 고대역 신호 (S30) 의 상위 주파수 제한 (예를 들어, 7 kHz 또는 8 kHz) 까지 확장된다.
플롯 (e) 는 다운샘플링의 제 1 스테이지 후의 스펙트럼을 도시하며, 여기서, 샘플링 레이트는 광대역 신호를 획득하도록 4 의 팩터로 감소된다. 플롯 (f) 는 확장된 신호의 고대역 부분을 선택하는 고역통과 필터링 동작 후의 스펙트럼을 도시하며, 플롯 (g) 는 샘플링 레이트가 2 의 팩터로 축소되는 다운샘플링의 제 2 스테이지 후의 스펙트럼을 도시한다. 일 특정 예에서, 다운샘플러 (530) 는 광대역 신호를 필터 뱅크 (A112) 의 고역 통과 필터 (130) 및 다운샘플러 (140) (또는 동일한 응답을 갖는 다른 구조 및 루틴) 를 통해 통과시킴으로써 고역통과 필터링 및 다운샘플링의 제 2 스테이지를 수행하여, 고대역 신호 (S30) 의 주파수 범위 및 샘플링 레이트를 갖는 스펙트럼 확장된 신호를 생성한다.
플롯 (g) 에서 알 수 있는 바와 같이, 플롯 (f) 에 도시된 고대역 신호의 다운샘플링은 그 스펙트럼의 반전 (reversal) 을 야기한다. 이 예시에서, 다운샘플러 (530) 는 신호상에 스펙트럼 플리핑 (fliping) 동작을 수행하도록 또한 구성된다. 플롯 (h) 는 스펙트럼 플리핑 동작을 적용한 결과를 도시하며, 이는 신호에 의 펑션 또는 의 시퀀스를 승산함으로써 수행될 수 있으며, 그 펑션 또는 시퀀스의 값이 +1 및 -1 사이에서 교번한다. 이러한 동작은 주파수 도메인에서 π 의 거리만큼 신호의 디지털 스펙트럼을 쉬프팅 (shifting) 하는 것과 동등하다. 동일한 결과는 상이한 순서로 다운샘플링 및 스펙트럼 플리핑 동작을 적용함에 의해서도 또한 획득될 수 있다. 업샘플링 및/또는 다운샘플링 동작은 고대역 신호 (S30) 의 샘플링 레이트 (예를 들면, 7 kHz) 를 갖는, 스펙트럼 확장된 신호를 획득하도록 리샘플링하는 것을 포함하도록 또한 구성될 수 있다.
상기 언급된 바와 같이, 필터 뱅크들 (A110 및 B120) 은, 협대역 및 고대역 신호들 (S20, S30) 중 하나 또는 그 양자 모두가 필터 뱅크 (A110) 의 출력에서 스펙트럼 반전된 형태를 갖고, 스펙트럼 반전된 형태로 인코딩 및 디코딩되며, 광대역 스피치 신호 (S110) 로 출력되기 전에 필터 뱅크 (B120) 에서 다시 스펙트럼 반전되도록 구현될 수 있다. 이러한 경우, 물론, 도 12a 에서 도시된 스펙트럼 플리핑 동작은 필요하지 않겠지만, 고대역 여기 신호 (S120) 가 마찬가지로 스펙트럼 반전된 형태를 갖도록 하는 것이 바람직할 것이다.
스펙트럼 확장기 (A402) 에 의해 수행되는 것과 같은 스펙트럼 확장 동작의 업샘플링 및 다운샘플링의 다양한 태스크는 다수의 상이한 방식으로 구성되고 배열될 수 있다. 예를 들어, 도 12b 는 스펙트럼 확장 동작의 다른 예시에서 다양한 지점에서의 신호 스펙트럼을 도시하는 도면으로, 여기서, 다양한 플롯들에서 주파수 스케일은 동일하다. 플롯 (a) 는 협대역 여기 신호 (S80) 의 일 예시의 스펙트럼을 도시한다. 플롯 (b) 는 신호 (S80) 가 2 의 팩터로 업샘플링된 후의 스펙트럼을 도시한다. 플롯 (c) 는 비선형 펑션의 적용후 확장된 스펙트럼의 예시를 도시한다. 이 경우, 더 높은 주파수에서 발생할 수 있는 에일리어싱은 용인된다.
플롯 (d) 는 스펙트럼 반전 동작 후의 스펙트럼을 도시한다. 플롯 (e) 는 다운샘플링의 일 스테이지 후의 스펙트럼을 도시하며, 여기서, 샘플링 레이트는 2 의 팩터로 감소되어 원하는 스펙트럼 확장 신호를 획득한다. 이 예시에서, 신호는 스펙트럼 반전된 형태이며 고대역 신호 (S30) 을 이러한 형태로 프로세싱하는 고대역 인코더 (A200) 의 구현에서 사용될 수 있다.
비선형 펑션 산출기 (520) 에 의해 생성된 스펙트럼 확장된 신호는 주파수가 증가됨에 따라 현저한 드롭오프 (dropoff) 를 갖기 쉽다. 스펙트럼 확장기 (A402) 는 다운샘플링된 신호에 화이트닝 동작을 수행하도록 구성되는 스펙트럼 평탄화기 (flattener) (540) 를 포함한다. 스펙트럼 평탄화기 (540) 는 고정된 화이트닝 동작 또는 적응성의 화이트닝 동작을 수행하도록 구성될 수 있다. 적응성 화이트닝의 일 특정 예시에서, 스펙트럼 평탄화기 (540) 는 다운샘플링된 신호로부터 4 개 필터 계수들의 세트를 산출하도록 구성되는 LPC 분석 모듈 및 이들 계수들에 따라서 신호를 화이트닝하도록 구성되는 4-차 분석 필터를 포함한다. 스펙트럼 확장기 (A400) 의 다른 구현은 스펙트럼 평탄화기 (540) 가 다운샘플러 (530) 전에 스펙트럼 확장된 신호에 대해 동작하는 구성을 포함한다.
고대역 여기 생성기 (A300) 는 고조파로 확장된 신호 (S160) 를 고대역 여기 신호 (S120) 로서 출력하도록 구현될 수 있다. 하지만, 일부 경우들에서, 오직 고조파로 확장된 신호만을 고대역 여기로서 사용하는 것은 가청 현상을 유발할 수 있다. 스피치의 고조파 구조는 일반적으로 저대역에서 보다 고대역에서 덜 현저하고, 고대역 여기 신호에서의 과도한 고조파구조의 사용은 소음 (buzzy sound) 을 유발할 수 있다. 이 현상은 여성 화자의 스피치 신호에서 특히 현저할 수 있다.
실시예는 고조파로 확장된 신호 (S160) 를 노이즈 신호와 믹싱하도록 구성되는 고대역 여기 생성기 (A300) 의 구현을 포함한다. 도 11 에서 도시된 바와 같이, 고대역 여기 생성기 (A302) 는 랜덤 노이즈 신호를 생성하도록 구성되는 노이즈 생성기 (480) 를 포함한다. 일 예시에서, 노이즈 생성기 (480) 는 단위-분산 (unit-variance) 화이트 슈도랜덤 노이즈 신호를 생성하도록 구성되지만, 다른 구현에서 노이즈 신호는 화이트일 필요는 없으며 주파수에 따라 변화하는 전력 밀도를 가질 수 있다. 노이즈 생성기 (480) 는 그 스테이트가 디코더에서 복제 될 수 있도록 노이즈 신호를 결정적 (deterministic) 펑션으로서 출력하도록 구성되는 것이 바람직할 수 있다. 예를 들어, 노이즈 생성기 (480) 는 협대역 필터 파라미터들 (S40) 및/또는 인코딩된 협대역 여기 신호 (S50) 와 같이, 동일 프레임 내에서 미리 코딩된 정보의 결정적 펑션으로서 노이즈 신호를 출력하도록 구성될 수 있다.
고조파로 확장된 신호 (S160) 와 믹싱되기 전에, 노이즈 생성기 (480) 에 의해 생성된 랜덤 노이즈 신호는 진폭-변조되어 협대역 신호 (S20), 고대역 신호 (S30), 협대역 여기 신호 (S80), 또는 고조파로 확장된 신호 (S160) 의 시간에 걸친 에너지 분포를 근사하는 시간-도메인 엔벌로프를 가질 수 있다. 도 11 에 도시된 바와 같이, 고대역 여기 생성기 (A302) 는 엔벌로프 산출기 (460) 에 의해 산출된 시간-영역 엔벌로프에 따라 노이즈 생성기 (480) 에 의해 생성된 노이즈 신호를 진폭-변조하도록 구성되는 결합기 (470) 를 포함한다. 예를 들어, 결합기 (470) 는 엔벌로프 산출기 (460) 에 의해 산출된 시간-도메인 엔벌로프에 따라 노이즈 생성기 (480) 의 출력을 스케일링하도록 배열된 승산기 (multiplier) 로서 구현되어 변조된 노이즈 신호 (S170) 를 생성할 수 있다.
고대역 여기 생성기 (A302) 의 일 구현 (A304) 에서, 도 13 의 블록도에서 도시된 바와 같이, 엔벌로프 산출기 (460) 는 고조파로 확장된 신호 (S160) 의 엔벌로프를 산출하도록 배열된다. 고대역 여기 생성기 (A302) 의 일 구현 (A306) 에서, 도 14 의 블록도에서 도시된 바와 같이, 엔벌로프 산출기 (460) 는 협대역 여기 신호 (S80) 의 엔벌로프를 산출하도록 배열된다. 그렇지 않으면, 고대역 여기 생성기 (A302) 의 또 다른 구현은 시간에서 협대역 피치 펄스의 위치에 따라서 고조파로 확장된 신호 (S160) 에 노이즈를 부가하도록 구성될 수 있다.
엔벌로프 산출기 (460) 는 일련의 서브태스크들을 포함하는 태스크로서 엔벌로프 산출을 수행하도록 구성될 수 있다. 도 15 는 이러한 태스크의 예시 (T100) 의 흐름도를 도시한다. 서브태스크 (T110) 는 엔벌로프가 모델링되는 신호 (예를 들어, 협대역 여기 신호 (S80) 또는 고조파로 확장된 신호 (S160)) 의 프레임의 각 샘플의 스퀘어를 산출하여 스퀘어링된 값들의 시퀀스를 생성한다. 서브태스크 (T120) 는 스퀘어링된 값들의 시퀀스 상에 스무딩 동작을 수행한다. 일 예시에서, 서브태스크 (T120) 는 다음의 수학식, 즉,
에 따라서 시퀀스에 1-차 IIR 저역통과 필터를 적용하며, 여기서, x 는 필터 입력, y 는 필터 출력, n 은 시간-영역 인덱스, 및 a 는 0.5 내지 1 사이의 값을 갖는 스무딩 계수이다. 스무딩 계수 a 의 값은 고정될 수 있으며, 또는 또 다른 구현에서, 입력 신호내의 노이즈의 표시에 따라서 적응성이 될 수 있어, 노이즈의 부재시 a 는 1 에 근접하고 노이즈의 존재시 0.5 에 근접한다. 서브태스크 (T130) 는 스무딩된 시퀀스의 각 샘플에 스퀘어 루트 펑션을 적용하여 시간-도메인 엔벌로프를 생성한다.
엔벌로프 산출기 (460) 의 이러한 구현은 태스크 (T100) 의 다양한 서브태스크들을 직렬 및/또는 병렬 방식으로 수행하도록 구성될 수도 있다. 태스크 (T100) 의 또 다른 구현에서, 서브태스크 (T110) 는 3-4 kHz 의 범위에서와 같이 엔벌로프가 모델링된 신호의 원하는 주파수 부분을 선택하도록 구성되는 대역통과 동작에 의해 선행될 수 있다.
결합기 (490) 는 고조파로 확장된 신호 (S160) 및 변조된 노이즈 신호 (S170) 를 믹싱하여 고대역 여기 신호 (S120) 를 생성하도록 구성된다. 결합기 (490) 의 구현은, 예를 들어 고대역 여기 신호 (S120) 를 고조파로 확장된 신호 (S160)) 및 변조된 노이즈 신호 (S170) 의 합으로서 산출하도록 구성될 수 있다. 결합기 (490) 의 이러한 구현은 합산 전에 고조파로 확장된 신호 (S160) 및/또는 변조된 노이즈 신호 (S170) 에 웨이팅 팩터를 적용함으로써 고대역 여기 신호 (S120) 를 웨이팅된 합으로서 산출하도록 구성될 수 있다. 이러한 웨이팅 팩터의 각각은 일 이상의 기준에 따라 산출될 수 있으며, 고정된 값일 수도 있거나, 다른 방법으로, 프레임-바이-프레임 또는 서브프레임-바이-서브프레임 기반에서 산출되는 적응성의 값이 될 수 있다.
도 16 은 고조파로 확장된 신호 (S160) 및 변조된 노이즈 신호 (S170) 의 웨이팅된 합으로서 고대역 여기 신호 (S120) 를 산출하도록 구성되는 결합기 (490) 의 일 구현 (492) 의 블록도를 도시한다. 결합기 (492) 는 고조파 웨이팅 팩터 (S180) 에 따라서 고조파로 확장된 신호 (S160) 를 웨이팅하고, 노이즈 웨이팅 팩터 (S190) 에 따라서 변조된 노이즈 신호 (S170) 를 웨이팅하여, 웨이팅된 신호들의 합으로서 고대역 여기 신호 (S120) 를 출력하도록 구성된다. 이 예시에서, 결합기 (492) 는 고조파 웨이팅 팩터 (S180) 및 노이즈 웨이팅 팩터 (S190) 를 산출하도록 구성되는 웨이팅 팩터 산출기 (550) 를 포함한다.
웨이팅 팩터 산출기 (550) 는 고대역 여기 신호 (S120) 내의 노이즈 콘텐츠에 대한 고조파 콘텐츠의 원하는 비율에 따라서 웨이팅 팩터들 (S180 및 S190) 을 산출하도록 구성된다. 예를 들어, 결합기 (492) 는 고대역 신호 (S30) 의 비율과 유사한 노이즈 에너지에 대한 고조파 에너지의 비율을 갖는 고대역 여기 신호 (S120) 를 생성하는 것이 바람직할 수 있다. 웨이팅 팩터 산출기 (550) 의 일부 구현에서, 웨이팅 팩터들 (S180, S190) 은 피치 이득 및/또는 스피치 모드와 같은 협대역 잉여 신호 또는 협대역 신호 (S20) 의 주기성에 관련된 일 이상의 파라미터들에 따라서 산출된다. 웨이팅 팩터 산출기 (550) 의 이러한 구현은, 예를 들어, 피치 이득에 비례하는 값을 고조파 웨이팅 팩터 (S180) 로 할당, 및/또는 음성화된 스피치 신호에 대해서 보다는 비음성화된 스피치 신호에 대해 더 높은 값을 노이즈 웨이팅 팩터 (S190) 로 할당하도록 구성될 수 있다.
다른 구현에 있어서, 웨이팅 팩터 산출기 (550) 는 고대역 신호 (S30) 의 주기성 측정에 따라서 고조파 웨이팅 팩터 (S180) 및/또는 노이즈 웨이팅 팩터 (S190) 에 대한 값을 산출하도록 구성된다. 이러한 일 예시에서, 웨이팅 팩터 산출기 (550) 는 현재 프레임 또는 서브프레임에 대한 고대역 신호 (S30) 의 자기 상관 (autocorrelation) 계수의 최대 값으로서 고조파 웨이팅 팩터 (S180) 를 산출하며, 여기서, 자기상관은 일 피치 래그의 딜레이를 포함하며 제로 샘플들의 딜레이는 포함하지 않는 검색 범위에 대해 수행된다. 도 17 은 일 피치 래그의 딜레이에 대하여 중심화되고 일 피치 래그 이하의 폭을 갖는, 길이 n 의 샘플의 이러한 탐색 범위의 예시를 도시한다.
도 17 은 수개의 스테이지에서 고대역 신호 (S30) 의 주기성 측정을 산출하는 웨이팅 팩터 산출기 (550) 에 대한 또 다른 접근의 일 예를 또한 도시한다. 제 1 스테이지에서, 현재의 프레임은 복수의 서브프레임으로 분할되고, 자기상관 계수가 최대인 딜레이는 각 서브프레임에 대하여 별도로 식별된다. 상기 언급된 바와 같이,자기상관은, 일 피치 래그의 딜레이를 포함하지만 제로 샘플들의 딜레이는 포함하지 않는 탐색 범위에 대해 수생된다.
제 2 스테이지에서, 딜레이된 프레임은 각 서브프레임에 대해 대응하는 식별된 딜레이를 적용하고, 결과적인 서브프레임들을 연결하여 최적의 딜레이된 프레임을 구성하고, 고조파 웨이팅 팩터 (S180) 를 원래의 프레임 및 최적으로 딜레이된 프레임간의 상관 계수로서 산출함으로써 구성된다. 또 다른 대안에서, 웨이팅 팩터 산출기 (550) 는 각 서브프레임에 대해 제 1 스테이지에서 획득된 최대 자기상관 계수들의 평균치로서 고조파 웨이팅 팩터 (S180) 를 산출한다. 웨이팅 팩터 산출기 (550) 의 구현은 자기상관 계수를 스케일링, 및/또는 이를 다른 값과 결합하여, 고조파 웨이팅 팩터 (S180) 에 대한 값을 산출하도록 또한 구성될 수 있다.
웨이팅 팩터 산출기 (550) 는 프레임의 주기성 존재가 표시된 경우에만 고대역 신호 (S30) 의 주기성 측정을 산출하는 것이 바람직할 수도 있다. 예를 들어, 웨이팅 팩터 산출기 (550) 는 피치 이득과 같은 현재 프레임의 주기성의 다른 표시자와 스레스홀드 값과의 관계에 따라, 고대역 신호 (S30) 의 주기성 측정을 산출하도록 구성될 수 있다. 일 예시에서, 웨이팅 팩터 산출기 (550) 는 프레 임의 피치 이득 (예를 들어, 협대역 잉여의 적응성의 코드북 이득) 이 0.5 초과의 (또 다른 방법으로, 적어도 0.5 의) 값을 갖는 경우에만, 고대역 신호 (S30) 에 자기상관 연산을 수행하도록 구성될 수 있다. 다른 예시에서, 웨이팅 팩터 산출기 (550) 는 프레임이 스피치 모드의 특정 스테이트를 갖는 경우에만 (예를 들어, 오직 음성화된 신호에 대하여만) 고대역 신호 (S30) 에 자기상관 동작을 수행하도록 구성될 수 있다. 이러한 경우, 웨이팅 팩터 산출기 (550) 는 스피치 모드의 다른 스테이트 및/또는 피치 이득의 더 작은 값들을 갖는 프레임들에 대한 디폴트 웨이팅 팩터를 할당하도록 구성될 수 있다.
실시예들은 주기성 외의 및/또는 주기성에 추가되는 특성에 따라 웨이팅 팩터들을 산출하도록 구성되는 웨이팅 팩터 산출기 (550) 의 또 다른 구현들을 포함한다. 예를 들어, 이러한 구현은 작은 피치 래그를 갖는 스피치 신호보다 큰 피치 래그를 갖는 스피치 신호에 대한 노이즈 이득 팩터 (S190) 에 더 높은 값을 할당하도록 구성될 수 있다. 웨이팅 팩터 산출기 (550) 의 또 다른 이러한 구현은, 다른 주파수 컴포넌트에서의 신호 에너지에 대한 기초 주파수의 배수에서의 신호 에너지의 측정에 따라서, 광대역 스피치 신호 (S10) 또는 고대역 신호 (S30) 의 고조파성 측정을 결정하도록 구성된다.
광대역 스피치 인코더 (A100) 의 일부 구현은 여기에서 기술된 바와 같이 피치 이득 및/또는 주기성 또는 고조파성의 다른 측정에 기반하여 주기성 또는 고조파성의 표시자 (예를 들면 프레임이 고조파인지 또는 비고조파인지를 표시하는 1-비트 플래그 (flag)) 를 출력하도록 구성된다. 일 예시에서, 대응하는 광대역 스피치 디코더 (B100) 는 이 표시를 사용하여 웨이팅 팩터 산출과 같은 동작을 구성한다. 다른 예시에서, 이러한 표시는 인코더 및/또는 디코더에서 스피치 모드 파라미터에 대한 값을 산출할 시에 사용된다.
고대역 여기 생성기 (A302) 는 여기 신호의 에너지가 웨이팅 팩터들 (S180 및 S190) 의 특정값에 의해 실질적으로 영향받지 않도록 고대역 여기 신호 (S120) 를 생성하는 것이 바람직할 수도 있다. 이러한 경우에서, 웨이팅 팩터 산출기 (550) 는 고조파 웨이팅 팩터 (S180) 또는 노이즈 웨이팅 팩터 (S190) 에 대한 값을 산출하고 (또는 스토리지 또는 고대역 인코더 (A200) 의 다른 요소로부터 이러한 값을 수신) 다음의 수학식에 따라 다른 웨이팅 팩터에 대한 값을 도출하며
여기에서, Wharmonic 은 고조파 웨이팅 팩터 (S180) 를 나타내며 Wnoise 는 노이즈 웨이팅 팩터 (S190) 를 나타낸다. 다른 방법으로, 웨이팅 팩터 산출기 (550) 는, 현재의 프레임 또는 서브프레임에 대한 주기성 측정의 값에 따라, 복수의 웨이팅 팩터들 (S180) 의 쌍중 대응하는 하나를 선택하도록 구성될 수 있으며, 여기서, 그 쌍들은 식 (2) 와 같은 일정한-에너지 비율을 만족하도록 미리 산출된다. 식 (2) 가 관찰되는 웨이팅 팩터 산출기 (550) 의 구현에 있어서, 고조파 웨이팅 팩터 (S180) 의 통상의 값들은 약 0.7 내지 약 1.0 의 범위를 가지며, 노이즈 웨이팅 팩터 (S190) 의 통상의 값들은 약 1.0 내지 약 0.7 의 범위를 갖는다. 웨이팅 팩터 산출기 (550) 의 다른 구현은 고조파로 확장된 신호 (S160) 와 변조된 노이즈 신호 (S170) 간의 원하는 베이스라인 (baseline) 웨이팅에 따라 변형된 식 (2) 의 버젼에 따라서 동작하도록 구성될 수 있다.
현상들은 희박한 (sparse) 코드북 엔트리들이 거의 제로 값인 코드북이 잉여의 양자화된 표현을 산출하도록 사용되는 경우 합성된 스피치 신호에서 발생할 수 있다. 코드북 희박성 (sparseness) 은 특히 협대역 신호가 낮은 비트 레이트로 인코딩되는 경우 발생한다. 통상적으로, 코드북 희박성에 의한 현상들은 시간에서 준-주기적 (quasi-periodic) 이며 3 kHz 초과에서 주로 발생한다. 인간의 귀는 더 높은 주파수에서 더욱 양호한 시간 해상도 (resolution) 를 가지므로, 이 현상들은 고대역에서 더욱 현저할 수 있다.
실시예는 반-희박성 (anti-sparseness) 필터링을 수행하는 고대역 여기 생성기 (A300) 의 구현을 포함한다. 도 18 은 역 양자화기 (450) 에 의해 생성된 양자화해제된 협대역 여기 신호를 필터링하도록 배열된 반-희박성 필터 (600) 를 포함하는, 고대역 여기 생성기 (A302) 의 일 구현 (A312) 의 블록도를 도시한다. 도 19 는 스펙트럼 확장기 (A400) 에 의해 생성된 고조파로 확장된 신호를 필터링하도록 배열된 반-희박성 필터 (600) 를 포함하는, 고대역 여기 생성기 (A302) 의 일 구현 (A314) 의 블록도를 도시한다. 도 20 은 결합기 (490) 의 출력을 필터링하여 고대역 여기 신호 (S120) 를 생성하도록 배열된 반-희박성 필터 (600) 를 포함하는, 고대역 여기 생성기 (A302) 의 일 구현 (A316) 의 블록도를 도시한다. 물론, 임의의 구현들 (A304 및 A306) 의 특징과 임의의 구현들 (A312, A314, 및 A316) 의 구현을 결합하는 고대역 여기 생성기 (A300) 의 구현들이 고려 되며 여기에서 명백히 개시된다. 반-희박성 필터 (600) 는, 예를 들면 스펙트럼 확장기 (A402) 의 임의의 구성요소 (510, 520, 530, 및 540) 이후에, 스펙트럼 확장기 (A400) 내에서 또한 배열될 수 있다. 반-희박성 필터 (600) 는 스펙트럼 폴딩, 스펙트럼 변환, 또는 고조파 확장을 수행하는 스펙트럼 확장기 (A400) 의 구현과 함께 또한 사용될 수 있다는 것이 특히 주목된다.
반-희박성 필터 (600) 는 그의 입력 신호의 위상을 변경시키도록 구성될 수 있다. 예를 들어, 반-희박성 필터 (600) 는 고대역 여기 신호 (S120) 의 위상이 랜덤화되거나, 아니면 시간에 걸쳐 더욱 균일하게 분산되도록 구성되고 배열되는 것이 바람직할 수 있다. 또한, 반-희박성 필터 (600) 의 응답은 필터링된 신호의 크기 스펙트럼이 상당히 변화하지 않도록, 스펙트럼적으로 평탄한 것이 바람직하다. 일 예에서, 반-희박성 필터 (600) 는 다음의 식에 따른 전달 함수를 갖는 전역-통과 필터로서 구현된다.
이러한 필터의 일 영향은 더 이상 소수의 샘플들에만 집중되지 않도록 입력 신호의 에너지를 확산시키는 것이 될 수 있다.
코드북 희박성에 의해 유발되는 현상들은 일반적으로, 잉여가 더 적은 피치 정보를 포함하는 노이즈-유사 신호, 및 또한 배경 노이즈에서의 스피치에 대해 더욱 현저하다. 희박성은 여기가 장기 구조를 갖는 경우들에서 더 적은 현상들을 통상 유발하며, 실제로 위상 변형은 음성화된 신호에 소음을 유발할 수 있다. 따라서, 비음성화된 신호를 필터링하고 적어도 일부 음성화된 신호들을 변경없이 통과시키도록 반-희박성 필터 (600) 를 구성하는 것이 바람직할 것이다. 비음성화된 신호들은 스펙트럼 엔벌로프가 주파수의 증가와 함께 평탄한지 또는 상향 경사화되었는지를 표시하는, 0 에 가깝거나 양수인 스펙트럼 경사 (예를 들면 양자화된 제 1 반사 계수) 및 낮은 피치 이득 (예를 들면, 양자화된 협대역 적응성 코드북 이득) 에 의해 특성지어진다. 반-희박성 필터 (600) 의 통상의 구현은 비-음성화된 사운드를 필터링하고 (예를 들어, 스펙트럼 경사 값에 의해 표시됨), 피치 이득이 스레스홀드 값 미만인 (다른 방법으로, 스레스홀드 값 이하) 경우 음성화된 음향을 필터링하며, 아니면 변경없이 신호를 통과시키도록 구성된다.
반-희박성 필터 (600) 의 또 다른 구현은 상이한 최대 위상 변형 각도 (예를 들어 180 도까지) 를 갖도록 구성되는 2 이상의 필터들을 포함한다. 이러한 경우, 반-희박성 필터 (600) 는 피치 이득의 값 (예를 들어, 양자화된 적응성 코드북 또는 LTP 이득) 에 따라서 컴포넌트 필터 중에서 선택하여, 더 큰 최대 위상 변형 각도가 더 낮은 피치 이득 값을 갖는 프레임에 대해 사용되도록 구성될 수 있다. 반-희박성 필터 (600) 는 더 많은 또는 더 적은 주파수 스펙트럼에 대한 위상을 변형하도록 구성되는 상이한 컴포넌트 필터들을 또한 포함하여, 입력 신호의 더 넓은 주파수 영역 상에서 위상을 변형하도록 구성되는 필터가 더 낮은 피치 이득 값을 갖는 프레임에 대해 사용되도록 할 수 있다.
인코딩된 스피치 신호의 정확한 재생을 위해, 합성된 광대역 스피치 신호 (S100) 의 고대역 및 협대역 부분의 레벨들간의 비율은 원래의 광대역 스피치 신호 (S10) 의 비율과 유사한 것이 바람직하다. 고대역 코딩 파라미터 (S60a) 에 의해 표현되는 바와 같은 스펙트럼 엔벌로프에 추가로, 고대역 인코더 (A200) 는 일시적 엔벌로프 또는 이득 엔벌로프를 특정함으로써 고대역 신호 (S30) 를 특징짓도록 구성될 수 있다. 도 10 에 도시된 바와 같이, 고대역 인코더 (A202) 는, 프레임 또는 그 일부에 대한 2 개 신호들의 에너지간의 차이 또는 비율과 같은, 고대역 신호 (S30) 와 합성된 고대역 신호 (S130) 간의 관계에 따라 적어도 이득 팩터를 산출하도록 구성 및 배열된 고대역 이득 팩터 산출기 (A230) 를 포함한다. 고대역 인코더 (A202) 의 다른 구현에 있어서, 고대역 이득 산출기 (A230) 는 유사하게 구성되나 다르게 배열되어 고대역 신호 (S30) 와 협대역 여기 신호 (S80) 또는 고대역 여기 신호 (S120) 간의 시변 (time-varying) 관계와 같은 관계에 따라 이득 엔벌로프를 산출할 수 있다.
협대역 여기 신호 (S80) 및 고대역 신호 (S30) 의 일시적 엔벌로프는 유사하기 쉽다. 따라서, 고대역 신호 (S30) 와 협대역 여기 신호 (S80) (또는 고대역 여기 신호 (S120) 또는 합성된 고대역 신호 (S130)와 같이, 그로부터 도출된 신호) 간의 관계에 기반한 이득 엔벌로프를 인코딩하는 것은 오직 고대역 신호 (S30) 에 기반한 이득 엔벌로프를 인코딩하는 것보다 일반적으로 효율적이다. 통상의 구현에서, 고대역 인코더 (A202) 는 각 프레임에 대해 5 의 이득 팩터들을 특정하는 8 내지 12 개 비트들의 양자화된 인덱스를 출력하도록 구성된다.
고대역 이득 팩터 산출기 (A230) 는 일 이상의 일련의 서브태스크들을 포함하는 태스크로서 이득 팩터 산출을 수행하도록 구성될 수 있다. 도 21 은 고대 역 신호 (S30) 및 합성된 고대역 신호 (S130) 의 상대적인 에너지에 따라서 대응하는 서브프레임에 대한 이득 값을 산출하는 이러한 태스크의 예시 (T200) 의 흐름도를 도시한다. 태스크들 (220a 및 220b) 은 각각의 신호들의 대응하는 서브프레임들의 에너지를 산출한다. 예를 들어, 태스크들 (220a 및 220b) 은 각각의 서브프레임의 샘플들의 스퀘어들의 합으로서 에너지를 산출하도록 구성될 수 있다. 태스크 (T230) 는 이러한 에너지들의 비율의 스퀘어 루트로서 서브프레임에 대한 이득 팩터를 산출한다. 이 예시에서, 태스크 (T230) 는 서브프레임상에서 합성된 고대역 신호 (S130) 의 에너지에 대한 고대역 신호 (S30) 의 에너지의 비율의 스퀘어 루트로서 이득 팩터를 산출한다.
고대역 이득 팩터 산출기 (A230) 는 윈도우잉 펑션에 따라서 서브프레임 에너지들을 산출하도록 구성되는 것이 바람직할 수 있다. 도 22 는 이득 팩터 산출 태스크 (T200) 의 이러한 구현 (T210) 의 흐름도를 도시한다. 태스크 (T215a) 는 고대역 신호 (S30) 에 윈도우잉 펑션을 적용하며, 태스크 (T215b) 는 합성된 고대역 신호 (S130) 에 동일한 윈도우잉 펑션을 적용한다. 태스크들 (220a 및 220b) 의 구현 (222a 및 222b) 은 각각의 윈도우의 에너지를 계산하며, 태스크 (T230) 은 에너지들의 비율의 스퀘어 루트로서 서브프레임에 대한 이득 팩터를 산출한다.
인접 서브프레임에 오버래핑하는 윈도우잉 펑션을 적용하는 것이 바람직할 수 있다. 예를 들어, 오버랩-추가 방식으로 적용될 수 있는 이득 팩터들을 생성하는 윈도우잉 펑션은 서브프레임들간의 불연속성을 감소 또는 회피하도록 도와 줄 수 있다. 일 예시에서, 고대역 이득 팩터 산출기 (A230) 는 윈도우가 2 개의 인접한 서브프레임 각각을 1 msec 만큼 오버래핑되는, 도 23a 에서 도시된 바와 같은 사다리꼴 윈도우잉 펑션을 적용하도록 구성된다. 도 23b 는 20-msec 프레임의 5 개의 서브프레임 각각에 대한 이 윈도우잉 펑션의 적용을 도시한다. 고대역 이득 팩터 산출기 (A230) 의 다른 구현들은 상이한 오버랩 기간 및/또는 대칭적 또는 비대칭적일 수 있는 상이한 윈도우 형상 (예를 들면 직사각형, 해밍) 을 갖는 윈도우잉 펑션을 적용하도록 구성될 수 있다. 고대역 이득 팩터 산출기 (A230) 의 구현은 프레임 내의 서브프레임에 대해 상이한 윈도우잉 펑션을 적용, 및/또는 프레임으로 하여금 상이한 길이의 서버프레임들을 포함하도록 구성하는 것이 또한 가능하다.
제한 없이, 다음의 값들이 특정 구현에 대한 예시로서 제공된다. 20-msec 의 프레임이 이들 경우에 대해 가정되나, 임의의 다른 주기가 사용될 수도 있다. 7 kHz 에서 샘플링된 고대역 신호에 대해, 각 프레임은 140 개의 샘플들을 갖는다. 이러한 프레임이 동일 길이의 5 개의 서브프레임들로 분할되는 경우, 각 서브프레임은 28 개의 샘플들을 가질 것이고, 도 23a 에서 도시된 바와 같은 윈도우는 42 개 샘플들의 폭이 될 것이다. 8 kHz 에서 샘플링된 고대역 신호에 대해, 각 프레임은 160 개의 샘플들을 갖는다. 이러한 프레임이 동일 길이의 5 개의 서브프레임들로 분할되는 경우, 각 서브프레임은 32 개의 샘플들을 가질 것이고, 도 23a 에 도시된 바와 같은 윈도우는 48 개 샘플들의 폭이 될 것이다. 다른 구현에 있어서, 임의의 폭을 갖는 서브프레임이 사용될 수 있으며, 고대역 이득 산출기 (A230) 의 구현은 프레임의 각 샘플에 대해 상이한 이득 팩터를 생성하도록 구성되는 것이 또한 가능하다.
도 24 는 고대역 디코더 (B200) 의 일 구현 (B202) 의 블록도를 도시한다. 고대역 디코더 (B202) 는 협대역 여기 신호 (S80) 에 기반하여 고대역 여기 신호 (S120) 를 생성하도록 구성되는 고대역 여기 생성기 (B300) 를 포함한다. 특정 시스템 설계 선택에 따라서, 고대역 여기 생성기 (B300) 는 여기에 설명된 것과 같은 고대역 여기 생성기 (A300) 의 임의의 구현에 따라서 구현될 수 있다. 통상적으로 특정 코딩 시스템의 고대역 인코더의 고대역 여기 생성기와 동일한 응답을 갖도록 고대역 여기 생성기 (B300) 를 구현하는 것이 바람직하다. 하지만, 통상적으로, 협대역 디코더 (B110) 는 인코딩된 협대역 여기 신호 (S50) 의 양자화를 수행기 때문에, 대부분의 경우에서 고대역 여기 생성기 (B300) 는 협대역 디코더 (B110) 로부터 협대역 여기 신호 (S80) 를 수신하도록 구현될 수 있고 인코딩된 협대역 여기 신호 (S50) 를 양자화해제하도록 구성되는 역 양자화기를 포함할 필요는 없다. 협대역 디코더 (B110) 는 필터 (330) 와 같은 협대역 합성 필터로 입력되기 전에 양자화해제된 협대역 여기 신호를 필터링하도록 배열된 반-희박성 필터 (600) 의 경우를 포함하는 것이 또한 가능하다.
역 양자화기 (560) 는 고대역 필터 파라미터들 (S60a) (이 예시에서, LSF 의 세트) 을 양자화해제하도록 구성되고, LSF-대-LP 필터 계수 변환 (570) 은 LSF 를 필터 계수들의 세트로 변환하도록 (예를 들어, 상기 설명된 바와 같이 협대역 인코더 (A122) 의 역 양자화기 (240) 및 변환 (250) 을 참조하여) 구성된다. 상기 언급된 바와 같이, 다른 구현에서, 상이한 계수 세트들 (예를 들어 켑스트럼의 계수) 및/또는 계수 표현들 (예를 들어, ISP) 이 사용될 수 있다. 고대역 합성 필터 (B204) 는 고대역 여기 신호 (S120) 및 필터 계수들의 세트에 따라서 합성된 고대역 신호를 생성하도록 구성된다. 고대역 인코더가 합성 필터를 포함하는 시스템에서 (예를 들면 상기 설명된 인코더 (A202) 의 예시에서와 같이), 고대역 합성 필터 (B204) 가 그 합성 필터와 동일한 응답 (예를 들어, 동일한 전달 함수) 을 갖도록 설계하는 것이 바람직할 수 있다.
고대역 디코더 (B202) 는 고대역 이득 팩터 (S60b) 를 양자화해제하도록 구성되는 역 양자화기 (580), 및 합성된 고대역 신호에 양자화해제된 이득 팩터를 적용하여 고대역 신호 (S100) 를 생성하도록 구성 및 배열된 이득 콘트롤 소자 (590) (예를 들면, 승산기 또는 증폭기) 를 또한 포함한다. 프레임의 이득 엔벌로프가 적어도 이득 팩터에 의해 명기되는 경우에서, 이득 콘트롤 소자 (590) 는, 가능한, 대응하는 고대역 인코더의 이득 산출기 (예를 들어, 고대역 이득 산출기 (A230)) 에 의해 적용되는 바와 동일하거나 대응하는 윈도우잉 펑션일 수 있는 윈도우잉 펑션에 따라서, 개별 서브프레임들에 대해 이득 팩터를 적용하도록 구성되는 로직을 포함할 수 있다. 고대역 디코더 (B202) 의 다른 구현에 있어서, 이득 콘트롤 소자 (590) 는 협대역 여기 신호 (S80) 또는 고대역 여기 신호 (S120) 에 양자화해제된 이득 팩터들을 적용하도록 유사하게 구성되나 대신 배열된다.
상기 언급된 바와 같이, (예를 들어, 인코딩중에 양자화해제된 값을 사용함으로써) 고대역 인코더 및 고대역 디코더에서 동일한 스테이트를 획득하는 것이 바 람직할 수 있다. 따라서 이러한 구현에 따른 코딩 시스템에서 고대역 여기 생성기들 (A300 및 B300) 의 대응하는 노이즈 생성기에 대해 동일한 스테이트를 보장하는 것이 바람직할 수 있다. 예를 들어, 이러한 구현의 고대역 여기 생성기들 (A300 및 B300) 은 노이즈 생성기의 스테이트가 동일 프레임 내에서 미리 코딩된 정보의 결정 펑션 (예를 들어, 협대역 필터 파라미터 (S40) 또는 그의 부분 및/또는 인코딩된 협대역 여기 신호 (S50) 또는 그의 부분) 이도록 구성될 수 있다.
여기에서 기술된 소자들의 일 이상의 양자화기들 (예를 들어, 양자화기들 (230, 420, 또는 430)) 은 분류된 벡터 양자화를 수행하도록 구성될 수 있다. 예를 들어, 이러한 양자화기는 협대역 채널 및/또는 고대역 채널에서 동일 프레임내의 이미 코딩된 정보에 기반하여 코드북의 세트중 하나를 선택하도록 구성될 수 있다. 통상, 이러한 기술은 추가적인 코드북 스토리지의 비용으로 증가된 코딩 효율을 제공한다.
예를 들면 도 8 및 도 9 에 참조하여 상기 논의된 바와 같이, 주기 구조의 상당한 양이 협대역 스피치 신호 (S20) 로부터 코오스 스펙트럼 엔벌로프의 삭제후에 잉여 신호내에 잔존할 수 있다. 예를 들어, 잉여 신호는 시간에서 거친 주기 펄스들 또는 스파이크들 (spikes) 의 시퀀스를 포함할 수 있다. 통상적으로 피치에 관련된 이러한 구조는, 음성화된 스피치 신호에서 특히 발생하기 쉽다. 협대역 잉여 신호의 양자화된 표현의 산출은, 예를 들면 적어도 코드북에 의해 표현되는 것과 같은 장기 (long-term) 주기성의 모델에 따라서 이 피치 구조를 인코딩하는 것을 포함할 수도 있다.
실제 잉여 신호의 피치 구조는 주기성 모델에 정확하게 매칭되지 않을 수 있다. 예를 들어, 잉여 신호는 피치 펄스들의 위치에서 작은 지터 (jitter) 들을 포함하여, 프레임내의 연속되는 피치 펄스간의 거리는 정확히 동일하지 않고 구조는 상당히 정규적이지 않을 수 있다. 이러한 비정규성은 코딩 효율을 감소시키는 경향이 있다.
협대역 인코더 (A120) 의 일부 구현은 양자화 전 또는 도중에 적응성 시간 와핑을 잉여에 적용함으로써, 또는 그렇지 않으면 인코딩된 여기 신호에서 적응성 시간 와핑을 포함함으로써 피치 구조의 정규화 (regularization) 를 수행하도록 구성된다. 예를 들면, 이러한 인코더는 시간에서 와핑의 정도를 선택 또는 아니면 산출 (예를 들어, 적어도 지각적인 웨이팅 및/또는 에러 최소화 기준에 따라서) 하여 결과적인 여기 신호가 장기 주기성의 모델에 최적으로 피팅되도록 구성될 수 있다. 피치 구조의 정규화는 RCELP (Relaxation Code Excited Linear Prediction) 인코더로 지칭되는 CELP 인코더들의 서브셋에 의해 수행된다.
통상적으로, RCELP 인코더는 적응성 시간 쉬프트로서 시간 와핑을 수행하도록 구성된다. 이 시간 쉬프트는 음의 수 밀리초에서 양의 수 밀리초까지의 범위인 딜레이 랭잉 (ranging) 일 수도 있고, 이는 가청 비연속성을 회피하기 위해 평활하게 변화한다. 일부 구현들에서, 이러한 인코더는 피스와이즈 (piecewise) 방식으로 정규화를 적용하도록 구성되며, 여기서, 각 프레임 및 서브프레임은 대응하는 고정된 시간 쉬프트에 의해 와핑된다. 다른 구현에 있어서, 인코더는 연속 와핑 펑션으로서 정규화를 적용하도록 구성되어, 프레임 또는 서브 프레임은 피치 컨투어 (contour) (피치 궤적 (trajectory) 으로 또한 치징됨) 에 따라서 와핑된다. 어떤 경우들 (예를 들면, 미국 특허 공개 제 2004/0098255 호에 기술된 바와 같이) 에서, 인코더는 인코딩된 여기 신호를 산출하는데 사용되는 지각적으로 웨이팅된 입력 신호에 쉬프트를 적용함으로써 인코딩된 여기 신호에서의 시간 와핑을 포함하도록 구성된다.
인코더는 정규화되고 양자화되는 인코딩된 여기 신호를 산출하고, 디코더는 인코딩된 여기 신호를 양자화해제하여 디코딩된 스피치 신호를 합성하는데 사용되는 여기 신호를 획득한다. 따라서, 디코딩된 출력 신호는 정규화에 의해 인코딩된 여기 신호에 포함되었던 동일하게 변화하는 딜레이를 나타낸다. 통상적으로, 정규화 양을 특정하는 정보는 디코더로 전송되지 않는다.
정규화는 잉여 신호를 인코딩하기에 더욱 용이하게 하는 경향이 있고, 이는 장기 예측자로부터 코딩 이득을 개선시키고 따라서 일반적으로 현상들의 생성이 없이 전체 코딩 효율을 증대시킨다. 오직 음성화된 프레임들에만 정규화를 수행하는 것이 바람직할 수 있다. 예를 들어, 협대역 인코더 (A124) 는 음성화된 신호와 같은, 장기 구조를 갖는 프레임들 또는 서브프레임들만을 쉬프팅시키도록 구성될 수 있다. 피치 펄스 에너지를 포함하는 서브프레임들만에 정규화를 수행하는 것이 더욱 바람직할 수 있다. RCELP 코딩의 다양한 구현이 미국 특허 제 5,704,003 (Kleijn et al.) 및 제 6,879,955 (Rao) 와 미국 특허 공개 제 2004/0098255 (Kovesi et al.) 에서 기술된다. RECELP 코더의 현존하는 구현들은 TIA (Telecommunition Industry Association) IS-127 에 기술된 바와 같은 EVRC (Enhanced Variable Rate Codec), 및 3GPP2 (제 3 세대 파트너십 프로젝트 2) SMV (Selectable Mode Vocoder) 를 포함한다.
불행히도, 정규화는 고대역 여기가 인코딩된 협대역 여기 신호로부터 유도되는 광대역 스피치 코더에 대해 (광대역 스피치 인코더 (A100) 및 광대역 스피치 디코더 (B100) 를 포함하는 시스템과 같이) 문제점을 유발할 수 있다. 시간-와핑된 신호로부터의 유도로 인해, 일반적으로, 고대역 여기 신호는 원래의 고대역 스피치 신호의 시간 프로파일과 다른 시간 프로파일을 갖게 된다. 다시 말해, 고대역 여기 신호는 원래의 고대역 스피치 신호와 더이상 동기 (synchronous) 이지 않다.
와핑된 고대역 여기 신호와 원래의 고대역 스피치 신호 사이의 시간에서의 오정렬 (misalignment) 은 수개의 문제점을 유발할 수 있다. 예를 들면, 와핑된 고대역 여기 신호는 원래의 고대역 스피치 신호로부터 추출된 필터 파라미터들에 따라서 합성 필터에 대해 적합한 소스 여기를 더 이상 제공하지 않을 수 있다. 결과적으로, 합성된 고대역 신호는 디코딩된 광대역 스피치 신호의 감지된 품질을 감소시키는 가청 현상들을 포함할 수 있다.
시간에서의 오정렬은 이득 엔벌로프 인코딩에 있어 비효율성을 또한 유발할 수 있다. 상기 언급된 바와 같이, 상관 (correlation) 이 협대역 여기 신호 (S80) 및 고대역 신호 (S30) 의 일시적 엔벌로프들 사이에서 존재하기 쉽다. 이 두 일시적 엔벌로프들간의 관계에 따라 고대역 신호의 이득 엔벌로프를 인코딩함으로써, 코딩 효율의 증가가 이득 엔벌로프를 직접 코딩하는 것과 비견되도록 실 현될 수 있다. 그러나, 인코딩된 협대역 여기 신호가 정규화되면, 이러한 상관은 약해질 수 있다. 협대역 여기 신호 (S80) 와 고대역 신호 (S30) 간의 시간에서의 오정렬은 고대역 이득 팩터들 (S60b) 에서 나타나는 요동 (fluctuation) 을 유발하고, 코딩 효율성은 저하될 수도 있다.
실시예는 대응하는 인코딩된 협대역 여기 신호에 포함된 시간 와핑에 따라 고대역 스피치 신호의 시간 와핑을 수행하는 광대역 스피치 인코딩 방법을 포함한다. 이러한 방법의 잠재적인 이점은 디코딩된 광대역 스피치 신호의 품질 개선 및/또는 광대역 이득 엔벌로프 코딩의 효율 개선을 포함한다.
도 25 는 광대역 스피치 인코더 (A100) 의 일 구현 (AD10) 의 블록도를 도시한다. 인코더 (AD10) 는 인코딩된 협대역 여기 신호 (S50) 의 산출 도중 정규화를 수행하도록 구성되는 협대역 인코더 (A120) 의 일 구현 (A124) 을 포함한다. 예를 들면, 협대역 인코더 (A124) 는 일 이상의 상술된 RCELP 구현에 따라서 구성될 수 있다.
협대역 인코더 (A124) 는 적용된 시간 와핑의 정도를 특정하는 정규화 데이터 신호 (SD10) 를 출력하도록 또한 구현된다. 협대역 인코더 (A124) 가 각 프레임 또는 서브프레임에 고정된 시간 쉬프트를 적용하도록 구성되는 다양한 경우에서, 정규화 데이터 신호 (SD10) 는 샘플, 밀리초, 또는 다른 임의 시간 증분의 관점에서 정수 또는 비정수 값으로서 각각의 시간 쉬프트를 나타내는 일련의 값들을 포함할 수 있다. 협대역 인코더 (A124) 가 샘플들의 다른 시퀀스 또는 프레임의 시간 스케일을 변형하도록 (예를 들어, 일 부분을 압축하고 다른 부분을 확장시 킴으로써) 구성되는 경우, 정규화 데이터 신호 (SD10) 는 펑션 파라미터들의 세트와 같은 변형의 대응하는 설명을 포함할 수 있다. 일 특정 예시에서, 협대역 인코더 (A124) 는 프레임을 3 개의 서브 프레임들로 분할하고 각 서브프레임에 대한 고정된 시간 쉬프트를 산출하도록 구성되어, 정규화 데이터 신호 (SD10) 는 인코딩된 협대역 신호의 각 정규화된 프레임에 대한 3 개의 시간 쉬프트를 표시한다.
광대역 스피치 인코더 (AD10) 는 입력 신호에 의해 표시된 딜레이 양에 따라 고대역 스피치 신호 (S30) 의 부분을 전진 또는 지연시켜, 시간-와핑된 고대역 스피치 신호 (S30a) 를 생성하도록 구성되는 딜레이 라인 (D120) 을 포함한다. 도 25 에 도시된 예시에서, 딜레이 라인 (D120) 은 정규화 데이터 신호 (SD10) 에 의해 표시되는 와핑에 따라 고대역 스피치 신호 (S30) 를 시간 와핑하도록 구성된다. 이런 방식으로, 인코딩된 협대역 여기 신호 (S50) 에 포함된 것과 같은 시간 와핑의 동일한 양이, 분석전에 고대역 스피치 신호 (S30) 의 대응하는 부분에 대해 또한 적용된다. 비록 이 예시는 딜레이 라인 (D120) 을 고대역 인코더 (A200) 로부터 별도의 소자로서 보여주지만, 다른 구현에서 딜레이 라인 (D120) 이 고대역 인코더의 부분으로서 배열된다.
고대역 인코더 (A200) 의 다른 구현은 와핑되지 않은 고대역 스피치 신호 (S30) 의 스펙트럼 분석 (예를 덜어, LPC 분석) 을 수행하고, 고대역 이득 파라미터 (S60b) 의 산출 전에 고대역 스피치 신호 (S30) 의 시간 와핑을 수행하도록 구성될 수 있다. 이러한 인코더는 예를 들면, 시간 와핑을 수행하도록 배열된 딜레이 라인 (D120) 의 구현을 포함할 수 있다. 하지만, 이러한 경우, 와핑되지 않은 신호 (S30) 의 분석에 기반하는 고대역 필터 파라미터들 (S60a) 은 고대역 여기 신호 (S120) 와 시간상에서 오정렬된 스펙트럼 엔벌로프를 설명할 수 있다.
딜레이 라인 (D120) 은 고대역 스피치 신호 (S30) 에 원하는 시간 와핑 동작을 적용하기 위한 로직 소자 및 저장 소자의 임의의 조합에 따라 구성될 수 있다. 예를 들면, 딜레이 라인 (D120) 은 원하는 시간 쉬프트에 따라 버퍼로부터 고대역 스피치 신호 (S30) 를 판독하도록 구성될 수 있다. 도 26a 는 쉬프트 레지스터 (SR1) 를 포함하는 딜레이 라인 (D120) 의 이러한 구현 (D122) 의 개략도를 도시한다. 쉬프트 레지스터 (SR1) 는 고대역 스피치 신호 (S30) 의 m 개의 가장 최근의 샘플들을 수신 및 저장하도록 구성되는 임의의 길이 m 의 버퍼이다. m 값은 지원되는 최대 양 (또는 "전진") 및 음 (또는 "지연") 의 시간 쉬프트의 합과 적어도 동일하다. m 값은 고대역 신호 (S30) 의 프레임 및 서브프레임의 길이와 동일한 것이 편리할 수 있다.
딜레이 라인 (D122) 은 쉬프트 레지스터 (SR1) 의 오프셋 위치 (OL) 로부터 시간-와핑된 고대역 신호 (S30a) 를 출력하도록 구성된다. 오프셋 위치 (OL) 의 포지션은, 예를 들면 정규화 데이터 신호 (SD10) 에 의해 표시된 바과 같이 현재 시간 쉬프트에 따라서 기준 포지션 (0 시간 쉬프트) 에 대하여 변화한다. 딜레이 라인 (D122) 은 동일한 전진 및 지연 제한을 지원하도록 구성될 수 있으며, 또는 다른 방법으로, 일 제한이 다른 제한보다 커져 일 방향에서 다른 방향에서보다 더 큰 쉬프트가 수행될 수 있다. 도 26a 는 음의 시간 쉬프트보다 더 큰 양의 쉬프트를 지원하는 특정 예시를 도시한다. 딜레이 라인 (D122) 은 (예를 들 면, 출력 버스 폭에 의존하여) 시간에서 적어도 샘플들을 출력하도록 구성될 수 있다.
수 밀리초 이상의 크기를 갖는 정규화 시간 쉬프트는 디코딩된 신호에서 가청 현상을 유발할 수 있다. 협대역 인코더 (A124) 에 의해 수행되듯이 정규화 시간 쉬프트의 크기는 통상적으로 수 밀리초를 초과하지 않아서, 정규화 데이터 신호 (SD10) 에 의해 표시된 시간 쉬프트는 제한되지 않을 것이다. 하지만, 딜레이 라인 (D122) 은 양의 및/또는 음의 방향의 시간 쉬프트에 최대 제한을 부과하도록 (예를 들면, 협대역 인코더에 의해 부과된 것보다 타이트한 제한을 관측하도록) 구성되는 것이 이러한 경우에서 바람직할 수 있다.
도 26b 는 쉬프트 윈도우 (SW) 를 포함하는 딜레이 라인 (D122) 의 일 구현 (D124) 의 개략도를 도시한다. 이 예시에서, 오프셋 위치 (OL) 의 포지션은 쉬프트 윈도우 (SW) 에 의해 제한된다. 비록 도 26b 는 쉬프트 윈도우 (SW) 의 폭보다 더 큰 버퍼 길이의 경우를 도시하지만, 딜레이 라인 (D124) 은 쉬프트 윈도우 (SW) 의 폭이 m 과 동일하도록 또한 구현될 수 있다.
다른 구현에서, 딜레이 라인 (D120) 은 원하는 시간 쉬프트에 따라 버퍼로 고대역 스피치 신호 (S30) 를 기입하도록 구성된다. 도 27 은 고대역 스피치 신호 (S30) 를 수신 및 저장하도록 구성되는 2 개의 쉬프트 레지스터들 (SR2 및 SR3) 을 포함하는 딜레이 라인 (D120) 의 이러한 구현 (D130) 의 개념도를 도시한다. 딜레이 라인 (D130) 은 예를 들면 정규화 데이터 신호 (SD10) 에 의해 표시되는 시간 쉬프트에 따라 쉬프트 레지스터 (SR2) 에서 쉬프트 레지스터 (SR3) 로 프레임 또는 서브프레임을 기입하도록 구성된다. 쉬프트 레지스터 (SR3) 는 시간-와핑된 고대역 신호 (S30a) 를 출력하도록 배열된 FIFO 버퍼로서 구성된다.
도 27 에 도시된 특정 예시에서, 쉬프트 레지스터 (SR2) 는 프레임 버퍼 부분 (FR1) 및 딜레이 버퍼 부분 (DB) 를 포함하며, 쉬프트 레지스터 (SR3) 는 프레임 버퍼 부분 (FB2), 전진 버퍼 부분 (AB), 및 지연 버퍼 부분 (RB) 을 포함한다. 전진 버퍼 (AB) 및 지연 버퍼 (RB) 의 길이는 동일할 수 있으며, 또는 한쪽이 다른 쪽보다 커서, 다른 방향보다 일 방향에서 더 큰 쉬프트가 지원될 수 있다. 딜레이 버퍼 (DB) 및 지연 버퍼 부분 (RB) 은 동일 길이를 갖도록 구성될 수 있다. 다른 방법으로, 딜레이 버퍼 (DB) 는 샘플들을 프레임 버퍼 (FB1) 로부터 쉬프트 레지스터 (SR3) 로 전송하는데 요구되는 시간 인터벌을 설명하도록 지연 버퍼 (RB) 보다 짧을 수 있고, 쉬프트 레지스터 (SR3) 로의 스토리지 전에 샘플들의 와핑과 같은 다른 프로세싱 동작을 포함할 수 있다.
도 27 의 예시에서, 프레임 버퍼 (FB1) 는 고대역 신호 (S30) 의 일 프레임의 길이와 동일한 길이를 갖도록 구성된다. 다른 예시에서, 프레임 버퍼 (FB1) 는 고대역 신호 (S30) 의 일 서브프레임의 길이와 동일한 길이를 갖도록 구성된다. 이러한 경우, 딜레이 라인 (D130) 은 쉬프팅될 프레임의 모든 서브프레임들에 대해 동일한 (예를 들면 평균인) 딜레이를 적용하는 로직을 포함하도록 구성될 수 있다. 딜레이 라인 (130) 은 지연 버퍼 (RB) 또는 전진 버퍼 (AB) 에 중복기입될 값들과 프레임 버퍼 (FB1) 로부터의 평균 값들에 대한 로직을 또한 포함한다. 또 다른 예시에서, 쉬프트 레지스터 (SR3) 는 오직 프레임 버퍼 (FB1) 를 경유하 여 고대역 신호 (S30) 의 값을 수신하도록 구성될 수 있고, 이러한 경우 딜레이 라인 (D130) 은 쉬프트 레지스터 (SR3) 에 기입된 연속된 프레임들 또는 서브프레임들간의 갭에 걸쳐 인터폴레이팅하는 로직을 포함할 수 있다. 다른 구현에서, 딜레이 라인 (D130) 은 샘플들을 쉬프트 레지스터 (SR3) 에 기입하기 전에 프레임 버퍼 (FB1) 로부터의 샘플들에 와핑 동작을 수행하도록 (예를 들면 정규화 데이터 신호 (SD10) 에 의해 설명되는 펑션에 따라) 구성될 수 있다.
딜레이 라인 (D120) 은 정규화 데이터 신호 (SD10) 에 의해 특정된 와핑에 기반하지만 동일하지는 않은 시간 와핑을 적용하는 것이 바람직할 수 있다. 도 28 은 딜레이 값 맵퍼 (D110) 를 포함하는 광대역 스피치 인코더 (AD10) 의 일 구현 (AD12) 의 블록도를 도시한다. 딜레이 값 맵퍼 (D110) 는 정규화 데이터 신호 (SD10) 에 의해 표시된 와핑을 매핑된 딜레이 값들 (SD10a) 로 맵핑하도록 구성된다. 딜레이 라인 (D120) 은 매핑된 딜레이 값들 (SD10a) 의해 표시된 와핑에 따라 시간-와핑된 고대역 스피치 신호 (S30a) 를 생성하도록 배열된다.
협대역 인코더에 의해 적용되는 시간 쉬프트는 시간상에서 평활하게 전개되도록 기대될 수 있다. 따라서, 스피치의 프레임동안 서브프레임에 적용되는 평균 협대역 시간 쉬프트를 계산하고, 이 평균에 따라 고대역 스피치 신호 (S30) 의 대응하는 프레임을 쉬프트하는 것이 통상적으로 충분하다. 이러한 일 예시에서, 딜레이 값 맵퍼 (D110) 는 각 프레임에 대한 서브프레임 딜레이 값의 평균을 산출하도록 구성되며, 딜레이 라인 (D120) 은 산출된 평균을 고대역 신호 (S30) 의 대응하는 프레임으로 적용하도록 구성된다. 다른 예시들에서, 더 짧은 기간에 서 (2개의 서브프레임들 또는 프레임의 절반과 같은) 또는 더 긴 기간 (2 개의 프레임들과 같은) 에서의 평균이 산출되고 적용될 수 있다. 평균이 샘플들의 비-정수 값인 경우, 딜레이 값 맵퍼 (D110) 는 값을 딜레이 라인 (D120) 으로 출력하기 전에 정수의 샘플들로 값을 라운딩 (round) 한다.
협대역 인코더 (A124) 는 인코딩된 협대역 여기 신호에서의 비-정수의 샘플들의 정규화 시간 쉬프트를 포함하도록 구성될 수 있다. 이러한 경우에서, 딜레이 값 맵퍼 (D110) 는 협대역 시간 쉬프트를 정수의 샘플들로 라운딩하도록 구성되고, 딜레이 라인 (D120) 은 라운딩된 시간 쉬프트를 고대역 스피치 신호 (S30) 로 적용시키는 것이 바람직하다.
광대역 스피치 인코더 (AD10) 의 일부 구현에서, 협대역 스피치 신호 (S20) 및 고대역 스피치 신호 (S30) 의 샘플링 레이트들은 상이할 수 있다. 이러한 경우들에서, 딜레이 값 맵퍼 (D110) 는 정규화 데이터 신호 (SD10) 에서 표시된 시간 쉬프트 양을 조정하여 협대역 스피치 신호 (S20) (또는 협대역 여기 신호 (S80)) 및 고대역 스피치 신호 (S30) 의 샘플링 레이트들간의 차이를 설명하도록 구성될 수 있다. 예를 들면, 딜레이 값 맵퍼 (D110) 는 샘플링 레이트들의 비율에 따라서 시간 쉬프트 양을 스케일링하도록 구성될 수 있다. 상기 언급된 바와 같은 일 특정 예시에서, 협대역 스피치 신호 (S20) 는 8 kHz 에서 샘플링되며, 고대역 스피치 신호 (S30) 는 7 kHz 에서 샘플링된다. 이 경우, 딜레이 값 맵퍼 (D110) 는 각 쉬프트 양을 7/8 과 승산하도록 구성된다. 딜레이 값 맵퍼 (D110) 의 구현은 이러한 스케일링 동작을 여기에서 설명된 바와 같이 정수-라운딩 및/또는 시간 쉬프트 평균화 동작과 함께 수행하도록 또한 구성될 수 있다.
또 다른 구현에서, 딜레이 라인 (D120) 은 프레임의 시간 스케일 또는 샘플들의 다른 시퀀스를 다른 방법으로 변형하도록 (예를 들어, 일 부분을 압축하고 다른 부분을 확장함으로써) 구성된다. 예를 들면, 협대역 인코더 (A124) 는 피치 컨투어 (contour) 또는 궤적 (trajectory) 과 같은 펑션에 따라서 정규화를 수행하도록 구현될 수 있다. 이러한 경우에서, 정규화 데이터 신호 (SD10) 는 파라미터들의 세트와 같은, 펑션의 대응하는 설명을 포함할 수 있고, 딜레이 라인 (D120) 은 그 펑션에 따라서 고대역 스피치 신호 (S30) 의 프레임들 또는 서브프레임들을 와핑하도록 구성되는 로직을 포함할 수 있다. 다른 구현들에서, 딜레이 값 맵퍼 (D110) 는 펑션이 딜레이 라인 (D120) 에 의해 고대역 스피치 신호 (S30) 에 적용되기 전에 이를 평균화, 스케일링, 및/또는 라운딩하도록 구성된다. 예를 들면, 딜레이 값 맵퍼 (D110) 는 펑션에 따라 적어도 딜레이 값들을 산출하도록 구성되고, 각 딜레이 값들은 다수의 샘플들을 표시하여, 딜레이 라인 (D120) 에 의해 그 후 적용되어 고대역 스피치 신호 (S30) 의 일 이상의 대응하는 프레임들 또는 서브프레임들을 시간 와핑한다.
도 29 는 대응하는 인코딩된 협대역 여기 신호에 포함된 시간 와핑에 따라서 고대역 스피치 신호를 시간 와핑하는 방법 (MD100) 에 대한 흐름도를 도시한다. 태스크 (TD100) 는 광대역 스피치 신호를 프로세싱하여 협대역 스피치 신호 및 고대역 스피치 신호를 획득한다. 예를 들면, 태스크 (TD100) 는 필터 뱅크 (A100) 의 구현과 같은, 저역통과 및 고역통과 필터들을 갖는 필터 뱅크를 사용하 여 광대역 스피치 신호를 필터링하도록 구성될 수 있다. 태스크 (TD200) 는 협대역 스피치 신호를 일 이상의 인코딩된 협대역 여기 신호 및 복수의 협대역 필터 파라미터들로 인코딩한다. 인코딩된 협대역 여기 신호 및/또는 필터 파라미터들은 양자화될 수 있고, 인코딩된 협대역 스피치 신호는 스피치 모드 파라미터와 같은 다른 파라미터들을 또한 포함할 수 있다. 태스크 (TD200) 는 인코딩된 협대역 여기 신호에서의 시간 와핑을 또한 포함한다.
태스크 (TD300) 는 협대역 여기 신호에 기반하여 고대역 여기 신호를 생성한다. 이 경우, 협대역 여기 신호는 인코딩된 협대역 여기 신호에 기반한다. 적어도 고대역 여기 신호에 따라서, 태스크 (TD400) 는 고대역 스피치 신호를 적어도 복수의 고대역 필터 파라미터들로 인코딩한다. 예를 들면, 태스크 (TD400) 은 고대역 스피치 신호를 복수의 양자화된 LSF 로 인코딩하도록 구성될 수 있다. 태스크 (TD500) 는 인코딩된 협대역 여기 신호에 포함된 시간 와핑에 관련된 정보에 기반한 고대역 스피치 신호에 시간 쉬프트를 적용한다.
태스크 (TD400) 는 고대역 스피치 신호에 스펙트럼 분석 (LPC 분석과 같은) 을 수행하고/또는 고대역 스피치 신호의 이득 엔벌로프를 산출하도록 구성될 수 있다. 이러한 경우들에서, 태스크 (TD500) 는 분석 및/또는 이득 엔벌로프 산출에 앞서 고대역 스피치 신호에 시간 쉬프트를 적용하도록 구성될 수 있다.
광대역 스피치 인코더 (A100) 의 다른 구현은 인코딩된 협대역 여기 신호에 포함된 시간 와핑에 의해 야기되는 고대역 여기 신호 (S120) 의 시간 와핑을 반전시키도록 구성된다. 예를 들면, 고대역 여기 생성기 (A300) 는, 정규화 데이터 신호 (SD10) 또는 맵핑된 딜레이 값들 (SD10a) 을 수신하고, 협대역 여기 신호 (S80) 에 대해, 및/또는 고조파로 확장된 신호 (S160) 또는 고대역 여기 신호 (S120) 와 같은 신호에 기반하는 후속 신호에 대해 대응하는 반전 시간 쉬프트를 적용하도록 구성되는 딜레이 라인 (D120) 의 구현을 포함하도록 구현될 수 있다.
또 다른 광대역 스피치 인코더 구현들은 협대역 스피치 신호 (S20) 및 고대역 스피치 신호 (S30) 를 상호간에 독립적으로 인코딩하여, 고대역 스피치 신호 (S30) 는 고대역 스펙트럼 엔벌로프 및 고대역 여기 신호의 표현으로서 인코딩되도록 구성된다. 이러한 구현은 인코딩된 협대역 여기 신호에 포함된 시간 와핑에 관련된 정보에 따라서, 고대역 잉여 신호의 시간 와핑을 수행하거나, 아니면 인코딩된 고대역 여기 신호에서의 시간 와핑을 포함하도록 구성될 수 있다. 예를 들면, 고대역 인코더는 고대역 잉여 신호에 시간 와핑을 적용하도록 구성되는 여기에서 설명된 바와 같은 딜레이 라인 (D120) 및/또는 딜레이 값 맵퍼 (D110) 를 포함할 수 있다. 이러한 동작의 잠재적인 이점은 고대역 잉여 신호의 보다 효율적인 인코딩 및 합성된 협대역 및 고대역 스피치 신호간의 보다 양호한 매칭을 포함한다.
상기 언급된 바와 같이, 여기에서 설명된 바와 같은 실시예들은 임베디드 코딩, 협대역 시스템들과의 호환성 지원, 및 트랜스코딩 필요의 회피를 수행하는데 사용될 수도 있는 구현을 포함한다. 고대역 코딩의 지원은 역방향 호환성을 갖는 광대역 지원을 갖고, 또한 협대역 지원만을 갖는 칩들, 칩셋들, 디바이스들, 및/또는 네트워크들 사이의 비용 기반에서 식별하도록 또한 서빙할 수 있다. 여 기에서 설명된 바와 같은 고대역 코딩의 지원은 저대역 코딩을 지원하는 기술과 결합하여 또한 사용될 수 있고, 이러한 실시예에 따른 시스템, 방법, 또는 장치는 예를 들면 약 50 또는 100 Hz 로부터 약 7 또는 9 kHz 까지의 주파수 콤포넌트의 코딩을 지원할 수 있다.
상기 언급된 바와 같이, 스피치 코더로의 고대역 지원 추가는 특히 마찰음의 식별에 관하여, 양해도를 개선시킬 수 있다. 비록 이러한 식별은 특정 문맥으로부터 인간 청자에 의해 통상 유도될 수 있지만, 고대역 지원은 자동화된 음성 메뉴 내비게이션 및/또는 자동 콜 프로세싱과 같은 음성 인식 및 다른 기계 통역 애플리케이션에서 가능화하는 (enabling) 구성으로서 서빙할 수 있다.
실시예에 따른 장치는 휴대 전화 또는 PDA (personal digital assitant) 와 같은 무선 통신을 위한 휴대용 디바이스에 임베딩될 수 있다. 다른 방법으로, 이러한 장치는 VoIP 핸드셋, VoIP 통신을 지원하도록 구성되는 PC, 또는 전화 또는 VoIP 통신을 라우팅하도록 구성되는 네트워크 디바이스와 같은 다른 통신 디바이스들에 포함될 수 있다. 예를 들며, 일 실시예에 따른 장치는 통신 디바이스를 위한 칩 또는 칩셋으로 구현될 수 있다. 특정 애플리케이션에 따라서, 이러한 디바이스는 스피치 신호의 아날로그-대-디지털 및/또는 디지털-대-아날로그 컨버젼, 스피치 신호에 애플리케이션 및/또는 다른 신호 프로세싱 동작을 수행하는 회로, 및/또는 코딩된 스피치 신호의 송신 및/또는 수신을 위한 주파수 회로와 같은 구성들을 또한 포함할 수 있다.
이들 실시예들은 본 출원이 우선권 주장하는 미국 가특허 출원 제 60/667,901 및 제 60/673,965 (현재 미국 출원 공개 공보 제 2006/0282263, 2007/0088558, 2007/0088541, 2006/0277042, 2007/0088542, 2006/0277038, 2006/0271356 호, 및 미국 특허 출원 제 11/397,871 호) 에 개시된 임의의 적어도 다른 구성과 함께 사용되며/또는 포함할 수 있도록 명백히 고려되고 개시된다. 이러한 구성들은 고대역에서 발생하고 협대역으로부터는 실질상 존재하지 않는 단기의 고-에너지 버스트 (burst) 의 제거를 포함한다. 이러한 구성들은 고대역 LSF 와 같은 계수 표현들의 고정된 또는 적응성의 스무딩을 포함한다. 이러한 구성들은 LSF 와 같은 계수 표현의 양자화와 관련하여 노이즈의 고정된 또는 적응성의 쉐이핑을 포함한다. 이러한 구성들은 이득 엔벌로프의 고정된 또는 적응성의 스무딩, 및 이득 엔벌로프의 적응성 감쇠를 또한 포함한다.
설명된 발명의 앞서 말한 제시는 임의의 당업자로 하여금 본 발명을 제조 또는 사용할 수 있도록 제공된다. 이 실시예들에 다양한 변경이 가능하며, 여기에서 제시된 일반적인 원칙들이 다른 실시예들에 또한 적용될 수 있다. 예를 들면, 실시예는 애플리케이션-특정 집적 회로로 가공된 회로 구성으로서, 하드-와이어드 회로의 일부 또는 전체로서, 또는 비-휘발성 메모리에 탑재된 펌웨어 프로그램 또는 기계-판독 코드로서의 데이터 저장 매체로부터 또는 이것으로 탑재된 스프트웨어 프로그램으로서, 이러한 코드는 마이크로프로세서 또는 다른 디지털 신호 처리 유닛과 같은 로직 소자의 배열에 의해 실행될 수 있는 지시로, 구현될 수 있다. 데이터 저장 매체는 반도체 메모리 (동적 또는 정적 RAM (random-access memory), ROM (read-only memory), 및/또는 플래쉬 RAM 을 제한없이 포함할 수 있는), 또는 강유전성의 (ferroelectric), 자기저항성의 (magnetroresistive), 오보닉 (ovonic), 중합체의 (polymetric), 또는 상-변화의 메모리; 또는 자기 디스크 또는 광 디스트와 같은 디스크 매체와 같은 저장 소자의 배열일 수 있다. "소프트웨어" 라는 용어는 소스 코드, 어셈블리 언어 코드, 기계 코드, 이진 코드, 펌웨어, 매크로코드, 마이크로코드, 로직 소자의 배열에 의해 실행가능한 지시의 임의의 적어도 세트들 또는 시퀀스들, 및 이러한 예들의 임의의 조합을 포함하는 것으로 이해되어야 한다.
고대역 여기 생성기들 (A300 및 B300), 고대역 인코더 (A200), 고대역 디코더 (B200), 광대역 스피치 인코더 (A100), 및 광대역 스피치 디코더 (B100) 의 구현들의 다양한 소자들은, 예를 들면, 칩셋 내의 동일 칩 또는 2 이상의 칩들 상에서 상주하는 전자 및/또는 광 디바이스들로서 구현될 수 있지만, 이러한 제한없는 다른 배열들이 또한 고려될 수 있다. 이러한 장치의 적어도 소자들은 마이크로프로세서, 임베디드 프로세서, IP 코어, 디지털 신호 프로세서, FPGA (field-progammable gate arrays), ASSP (application-specific standard products), 및 ASIC (applcation-specific integrated circuits) 와 같은 로직 소자들 (예를 들어, 트랜지스터들, 게이트들) 의 적어도 고정된 또는 프로그램가능한 배열을 실행하도록 배열된 지시들의 적어도 세트들의 전체 또는 일부로 구현될 수 있다. 적어도 이러한 소자들이 공통의 구조를 갖는 것이 (예를 들어, 상이한 시간에서 상이한 소자에 대응하는 코드의 부분을 실생하도록 사용되는 프로세서, 사이한 시간에서 상이한 소자에 대응하는 태스크를 수행하도록 실행된 지시들의 세트, 또는 상이한 시간에서 상이한 소자에 대해 동작을 수행하는 전자 및/또는 광 디바이스의 배열) 또한 가능하다. 또한, 적어도 이러한 소자들은, 장치가 임베딩된 디바이 스 또는 시스템의 다른 동작에 관련된 태스크와 같은, 장치의 동작에 직접적으로 연관되지 않은, 지시들의 다른 세트들을 실행 또는 태스크들을 수행하도록 사용되는 것이 가능하다.
도 30 은 협대역 부분 및 고대역 부분을 갖는 스피치 신호의 고대역 부분을 인코딩하는 실시예에 따른 방법 (M100) 의 흐름도를 도시한다. 태스크 (X100) 는 고대역 부분의 스펙트럼 엔벌로프를 특성짓는 필터 계수들의 세트를 산출한다. 태스크 (X200) 는 협대역 부분으로부터 유도된 신호에 비선형 펑션을 적용함으로써 스펙트럼 확장된 신호를 산출한다. 태스크 (X300) 는 (A) 필터 파라미터들의 세트 및 (B) 스펙트럼 확장된 신호에 기반하는 고대역 여기 신호에 따라서 합성된 고대역 신호를 생성한다. 태스크 (X400) 는 (C) 고대역 부분의 에너지와 (D) 협대역 부분으로부터 유도된 신호의 에너지간의 관계에 기반하여 이득 엔벌로프를 산출한다.
도 31a 는 실시예에 따른 고대역 여기 신호의 생성 방법 (M200) 의 흐름도를 도시한다. 태스크 (Y100) 는 스피치 신호의 협대역 부분으로부터 유도된 협대역 여기 신호에 비선형 펑션을 적용함으로써 고조파로 확장된 신호를 산출한다. 태스크 (Y200) 는 고조파로 확장된 신호와 변조된 노이즈 신호를 믹싱하여 고대역 여기 신호를 생성한다. 도 31b 는 태스크들 (Y300 및 Y400) 을 포함하는 다른 실시예에 따라서 고대역 여기 신호를 생성하는 방법 (M210) 의 흐름도를 도시한다. 태스크 (Y300) 는 협대역 여기 신호 및 고조파로 확장된 신호 중 하나의 시간에 걸친 에너지에 따라서 시간-도메인 엔벌로프를 산출한다. 태스크 (Y400) 는 시 간-도메인 엔벌로프에 따라서 노이즈 신호를 변조하여 변조된 노이즈 신호를 생성한다.
도 32 는 협대역 부분 및 고대역 부분을 갖는 스피치 신호의 고대역 부분을 디코딩하는 실시예에 따른 방법 (M300) 의 흐름도를 도시한다. 태스크 (Z100) 는 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 필터 파라미터들의 세트 및 고대역 부분의 일시적 엔벌로프를 특징짓는 이득 팩터들의 세트를 수신한다. 태스크 (Z200) 는 협대역 부분에서 유도된 신호에 비선형 펑션을 적용함으로써 스펙트럼 확장된 신호를 산출한다. 태스크 (Z300) 는 (A) 필터 파라미터들의 세트 및 (B) 스펙트럼 확장된 신호에 기반하는 고대역 여기 신호에 따라서 합성된 고대역 신호를 생성한다. 태스크 (Z400) 는 이득 팩터들의 세트에 기반하여 합성된 고대역 신호의 이득 엔벌로프를 변조한다. 예를 들면, 태스크 (Z400) 는 이득 팩터들을 협대역 부분으로부터 유도된 여기 신호, 스펙트럼 확장된 신호, 고대역 여기 신호, 또는 합성된 고대역 신호에 적용함으로써 합성된 고대역 신호의 이득 엔벌로프를 변조하도록 구성될 수 있다.
실시예들은 여기에서 명백히 개시된 바와 같은 스피치 코딩, 인코딩, 및 디코딩의 추가적인 방법을 또한 포함하며, 이는 예를 들면 그러한 방법들을 수행하도록 구성되는 구조적 실시예들의 설명에 의함이다. 이들 방법들의 각각은 로직 소자들 (예를 들면 프로세서, 마이크로프로세서, 마이크로콘트롤러, 또는 다른 유한 스테이트 머신) 의 배열을 포함하는 기계에 의해 판독가능 및/또는 실행가능한 지시들의 적어도 세트들로서 명백히 또한 구현 (예를 들면, 상기 나열된 바와 같은 적어도 데이터 저장 매체에서) 될 수 있다. 따라서, 본 발명은 여기에서 설명된 실시형태들로 제한되는 것이 아니라, 원 명세서의 부분을 형성하는 첨부된 청구항을 포함하는 원리 및 신규한 특징들과 부합되는 최광의 범위를 부여하려는 것이다.
Claims (22)
- 저대역 부분 및 고대역 부분을 갖는 스피치 신호 중 고대역 부분을 인코딩하는 방법으로서,상기 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 복수의 필터 파라미터를 산출하는 단계;상기 저대역 부분으로부터 유도된 신호의 스펙트럼을 확장함으로써 스펙트럼 확장된 신호를 산출하는 단계;상기 스펙트럼 확장된 신호에 기반한 고대역 여기 신호 (A) 및 상기 복수의 필터 파라미터 (B) 에 따라서, 합성된 고대역 신호를 생성하는 단계; 및상기 저대역 부분에 기반한 신호와 상기 고대역 부분 사이의 관계에 기반하여 이득 엔벌로프를 산출하는 단계를 포함하는, 스피치 신호 고대역 부분 인코딩 방법.
- 제 1 항에 있어서,상기 스펙트럼 확장된 신호를 산출하는 단계는,상기 저대역 부분으로부터 유도된 신호의 스펙트럼을, 상기 신호에 비선형 펑션을 적용함으로써 확장하는 단계를 포함하는, 스피치 신호 고대역 부분 인코딩 방법.
- 제 1 항에 있어서,상기 이득 엔벌로프를 산출하는 단계는,상기 저대역 부분에 기반한 신호의 에너지와 상기 고대역 부분의 에너지 사이의 관계에 기반하는, 스피치 신호 고대역 부분 인코딩 방법.
- 제 3 항에 있어서,상기 이득 엔벌로프를 산출하는 단계는,상기 고대역 부분의 에너지와 상기 합성된 고대역 신호의 에너지 사이의 관계에 기반하는, 스피치 신호 고대역 부분 인코딩 방법.
- 저대역 여기 신호에 기반하여 고대역 여기 신호를 생성하는 단계;상기 고대역 여기 신호 및 고대역 스피치 신호에 기반하여, 합성된 고대역 신호를 생성하는 단계; 및상기 저대역 여기 신호에 기반한 신호와 상기 고대역 스피치 신호 사이의 관계에 기반하여 복수의 이득 팩터를 산출하는 단계를 포함하는, 스피치 신호 고대역 부분 프로세싱 방법.
- 제 5 항에 있어서,상기 복수의 이득 팩터 각각은, 상기 고대역 스피치 신호의 시간상에서의 일 부분의 에너지와, 상기 저대역 여기 신호에 기반한 신호의 시간상에서의 대응 부분의 에너지 사이의 관계에 기반하는, 스피치 신호 고대역 부분 프로세싱 방법.
- 제 5 항에 있어서,상기 복수의 이득 팩터를 산출하는 단계는,상기 고대역 스피치 신호와 상기 합성된 고대역 신호 사이의 관계에 기반하여 복수의 이득 팩터를 산출하는 단계를 포함하는, 스피치 신호 고대역 부분 프로세싱 방법.
- 제 7 항에 있어서,상기 복수의 이득 팩터 각각은, 상기 고대역 스피치 신호의 시간상에서의 일 부분의 에너지와 상기 합성된 고대역 신호의 시간상에서의 대응 부분의 에너지 사이의 관계에 기반하는, 스피치 신호 고대역 부분 프로세싱 방법.
- 제 5 항에 있어서,상기 합성된 고대역 신호를 생성하는 단계는,상기 고대역 스피치 신호로부터 유도된 복수의 필터 파라미터 및 상기 고대역 여기 신호에 기반하여, 상기 합성된 고대역 신호를 생성하는 단계를 포함하는, 스피치 신호 고대역 부분 프로세싱 방법.
- 저대역 부분 및 고대역 부분을 갖는 스피치 신호 중 고대역 부분을 디코딩하는 방법으로서,상기 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 복수의 필터 파라미터 및 상기 고대역 부분의 일시적 엔벌로프를 특징짓는 복수의 이득 팩터를 수신하는 단계;저대역 여기 신호에 기반하는 신호의 스펙트럼을 확장함으로써 스펙트럼 확장된 신호를 산출하는 단계;상기 복수의 필터 파라미터 (A) 및 상기 스펙트럼 확장된 신호에 기반한 고대역 여기 신호 (B) 에 따라서, 합성된 고대역 신호를 생성하는 단계; 및상기 복수의 이득 팩터에 따라서, 상기 합성된 고대역 신호의 이득 엔벌로프를 변조하는 단계를 포함하는, 스피치 신호 고대역 부분 디코딩 방법.
- 제 10 항에 있어서,상기 스펙트럼 확장된 신호를 산출하는 단계는,상기 저대역 여기 신호에 기반하는 신호의 스펙트럼을, 상기 신호에 비선형 펑션을 적용함으로써 확장하는 단계를 포함하는, 스피치 신호 고대역 부분 디코딩 방법.
- 제 10 항에 있어서,상기 이득 엔벌로프를 변조하는 단계는,상기 복수의 이득 팩터에 따라서, 상기 저대역 여기 신호에 기반한 신호, 상기 스펙트럼 확장된 신호, 상기 고대역 여기 신호, 및 상기 합성된 고대역 신호 중 하나 이상의 신호의 시간에 대한 진폭을 변경하는 단계를 포함하는, 스피치 신호 고대역 부분 디코딩 방법.
- 저대역 부분 및 고대역 부분을 갖는 스피치 신호 중 고대역 부분을 인코딩하도록 구성된 장치로서,상기 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 필터 파라미터 세트를 산출하도록 구성된 분석 모듈;상기 저대역 부분으로부터 유도된 신호의 스페트럼을 확장함으로써 스펙트럼 확장된 신호를 산출하도록 구성된 스펙트럼 확장기;상기 스펙트럼 확장된 신호에 기반한 고대역 여기 신호 (A) 및 상기 필터 파라미터 세트 (B) 에 따라서, 합성된 고대역 신호를 생성하도록 구성된 합성 필터; 및상기 저대역 부분에 기반한 신호와 상기 고대역 부분 사이의 시변 관계에 기반하여 이득 엔벌로프를 산출하도록 구성된 이득 팩터 산출기를 구비하는, 스피치 신호 고대역 부분 인코딩 장치.
- 제 13 항에 있어서,상기 스페트럼 확장기는, 상기 저대역 부분으로부터 유도된 신호의 스펙트럼을, 상기 신호에 비선형 펑션을 적용함으로써 확장하도록 구성되는, 스피치 신호 고대역 부분 인코딩 장치.
- 제 13 항에 있어서,상기 이득 팩터 산출기는, 상기 저대역 부분에 기반한 신호의 에너지와 상기 고대역 부분의 에너지 사이의 시변 관계에 기반하여 상기 이득 엔벌로프를 산출하도록 구성되는, 스피치 신호 고대역 부분 인코딩 장치.
- 제 15 항에 있어서,상기 이득 팩터 산출기는, 상기 고대역 부분의 에너지와 상기 합성된 고대역 신호의 에너지 사이의 시변 관계에 기반하여 상기 이득 엔벌로프를 산출하도록 구성되는, 스피치 신호 고대역 부분 인코딩 장치.
- 제 13 항에 있어서,상기 이득 팩터 산출기는 상기 이득 엔벌로프를 복수의 이득 팩터로서 산출하도록 구성되고,상기 복수의 이득 팩터 각각은, 상기 고대역 스피치 신호의 시간상에서의 일 부분의 에너지와 상기 합성된 고대역 신호의 시간상에서의 대응 부분의 에너지 사이의 관계에 기반하는, 스피치 신호 고대역 부분 인코딩 장치.
- 제 13 항에 있어서,상기 장치는 셀룰러 전화를 포함하는, 스피치 신호 고대역 부분 인코딩 장 치.
- 스피치 신호의 고대역 부분의 스펙트럼 엔벌로프를 특징짓는 복수의 필터 파라미터 (A) 및 상기 스피치 신호의 저대역 부분에 기반한 인코딩된 저대역 여기 신호 (B) 를 수신하도록 구성된 고대역 스피치 디코더로서,상기 인코딩된 저대역 여기 신호에 기반하는 신호의 스펙트럼을 확장함으로써 스펙트럼 확장된 신호를 산출하도록 구성된 스펙트럼 확장기;상기 스펙트럼 확장된 신호에 기반한 고대역 여기 신호 및 상기 복수의 필터 파라미터에 따라서, 합성된 고대역 신호를 생성하도록 구성된 합성 필터; 및상기 고대역 부분의 일시적 엔벌로프를 특징짓는 복수의 이득 팩터에 따라서 상기 합성된 고대역 신호의 이득 엔벌로프를 변조하도록 구성된 이득 제어 소자를 구비하는, 고대역 스피치 디코더.
- 제 19 항에 있어서,상기 스펙트럼 확장기는, 상기 인코딩된 저대역 여기 신호에 기반한 신호의 스펙트럼을, 상기 신호에 비선형 펑션을 적용함으로써 확장하도록 구성되는, 고대역 스피치 디코더.
- 제 19 항에 있어서,상기 이득 제어 소자는, 상기 복수의 이득 팩터에 따라서, 상기 인코딩된 저 대역 여기 신호, 상기 스펙트럼 확장된 신호, 상기 고대역 여기 신호, 및 상기 합성된 고대역 신호 중 하나 이상의 신호의 시간에 대한 진폭을 변경하도록 구성되는, 고대역 스피치 디코더.
- 제 19 항에 있어서,상기 이득 제어 소자는 승산기 및 증폭기 중 하나 이상을 포함하는, 고대역 스피치 디코더.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66790105P | 2005-04-01 | 2005-04-01 | |
US60/667,901 | 2005-04-01 | ||
US67396505P | 2005-04-22 | 2005-04-22 | |
US60/673,965 | 2005-04-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070118172A KR20070118172A (ko) | 2007-12-13 |
KR100956524B1 true KR100956524B1 (ko) | 2010-05-07 |
Family
ID=36588741
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077025400A KR100956877B1 (ko) | 2005-04-01 | 2006-04-03 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
KR1020077025255A KR100956624B1 (ko) | 2005-04-01 | 2006-04-03 | 고대역 버스트 억제를 위한 시스템, 방법, 및 장치 |
KR1020077025422A KR100956523B1 (ko) | 2005-04-01 | 2006-04-03 | 광대역 스피치 코딩을 위한 시스템, 방법, 및 장치 |
KR1020077025421A KR100956524B1 (ko) | 2005-04-01 | 2006-04-03 | 스피치 신호의 고대역 부분을 인코딩 및 디코딩하는 방법및 장치 |
KR1020077025447A KR101019940B1 (ko) | 2005-04-01 | 2006-04-03 | 대역폭 확장 스피치 예측 여기 신호의 반-희박성 필터링을위한 방법 및 장치 |
KR1020077025432A KR100956525B1 (ko) | 2005-04-01 | 2006-04-03 | 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치 |
KR1020077025293A KR100982638B1 (ko) | 2005-04-01 | 2006-04-03 | 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들 |
KR1020077025290A KR100956876B1 (ko) | 2005-04-01 | 2006-04-03 | 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077025400A KR100956877B1 (ko) | 2005-04-01 | 2006-04-03 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
KR1020077025255A KR100956624B1 (ko) | 2005-04-01 | 2006-04-03 | 고대역 버스트 억제를 위한 시스템, 방법, 및 장치 |
KR1020077025422A KR100956523B1 (ko) | 2005-04-01 | 2006-04-03 | 광대역 스피치 코딩을 위한 시스템, 방법, 및 장치 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077025447A KR101019940B1 (ko) | 2005-04-01 | 2006-04-03 | 대역폭 확장 스피치 예측 여기 신호의 반-희박성 필터링을위한 방법 및 장치 |
KR1020077025432A KR100956525B1 (ko) | 2005-04-01 | 2006-04-03 | 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치 |
KR1020077025293A KR100982638B1 (ko) | 2005-04-01 | 2006-04-03 | 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들 |
KR1020077025290A KR100956876B1 (ko) | 2005-04-01 | 2006-04-03 | 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들 |
Country Status (24)
Country | Link |
---|---|
US (8) | US8484036B2 (ko) |
EP (8) | EP1866915B1 (ko) |
JP (8) | JP5129118B2 (ko) |
KR (8) | KR100956877B1 (ko) |
CN (1) | CN102411935B (ko) |
AT (4) | ATE492016T1 (ko) |
AU (8) | AU2006232357C1 (ko) |
BR (8) | BRPI0608305B1 (ko) |
CA (8) | CA2603255C (ko) |
DE (4) | DE602006017050D1 (ko) |
DK (2) | DK1864101T3 (ko) |
ES (3) | ES2636443T3 (ko) |
HK (5) | HK1113848A1 (ko) |
IL (8) | IL186439A0 (ko) |
MX (8) | MX2007012184A (ko) |
NO (7) | NO20075503L (ko) |
NZ (6) | NZ562183A (ko) |
PL (4) | PL1864282T3 (ko) |
PT (2) | PT1864282T (ko) |
RU (9) | RU2491659C2 (ko) |
SG (4) | SG161224A1 (ko) |
SI (1) | SI1864282T1 (ko) |
TW (8) | TWI321777B (ko) |
WO (8) | WO2006107833A1 (ko) |
Families Citing this family (325)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7987095B2 (en) * | 2002-09-27 | 2011-07-26 | Broadcom Corporation | Method and system for dual mode subband acoustic echo canceller with integrated noise suppression |
US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
JP4679049B2 (ja) | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
US7668712B2 (en) | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
WO2005111568A1 (ja) * | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
WO2006009074A1 (ja) * | 2004-07-20 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声復号化装置および補償フレーム生成方法 |
ATE488838T1 (de) * | 2004-08-30 | 2010-12-15 | Qualcomm Inc | Verfahren und vorrichtung für einen adaptiven de- jitter-puffer |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
WO2006103488A1 (en) * | 2005-03-30 | 2006-10-05 | Nokia Corporation | Source coding and/or decoding |
SG161224A1 (en) * | 2005-04-01 | 2010-05-27 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
SI1875463T1 (sl) * | 2005-04-22 | 2019-02-28 | Qualcomm Incorporated | Sistemi, postopki in naprava za glajenje faktorja ojačenja |
DK1869671T3 (da) * | 2005-04-28 | 2009-10-19 | Siemens Ag | Fremgangsmåde og anordning til stöjundertrykkelse |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
JP2009501353A (ja) * | 2005-07-14 | 2009-01-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号合成 |
WO2007013973A2 (en) * | 2005-07-20 | 2007-02-01 | Shattil, Steve | Systems and method for high data rate ultra wideband communication |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
US8326614B2 (en) * | 2005-09-02 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement system |
CA2558595C (en) * | 2005-09-02 | 2015-05-26 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
WO2007037361A1 (ja) * | 2005-09-30 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
EP1953737B1 (en) | 2005-10-14 | 2012-10-03 | Panasonic Corporation | Transform coder and transform coding method |
JPWO2007043643A1 (ja) * | 2005-10-14 | 2009-04-16 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、及び音声復号化方法 |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8135047B2 (en) | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
DE602007012116D1 (de) * | 2006-08-15 | 2011-03-03 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
KR101008508B1 (ko) * | 2006-08-15 | 2011-01-17 | 브로드콤 코포레이션 | 패킷 손실 후의 디코더 상태의 리페이징 |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US8046218B2 (en) * | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
JP4972742B2 (ja) * | 2006-10-17 | 2012-07-11 | 国立大学法人九州工業大学 | 高域信号補間方法及び高域信号補間装置 |
USRE50132E1 (en) | 2006-10-25 | 2024-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
USRE50158E1 (en) | 2006-10-25 | 2024-10-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
KR101375582B1 (ko) | 2006-11-17 | 2014-03-20 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8639500B2 (en) | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
US20080147389A1 (en) * | 2006-12-15 | 2008-06-19 | Motorola, Inc. | Method and Apparatus for Robust Speech Activity Detection |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
PL3591650T3 (pl) * | 2007-08-27 | 2021-07-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Sposób i urządzenie do wypełniania dziur widmowych |
FR2920545B1 (fr) * | 2007-09-03 | 2011-06-10 | Univ Sud Toulon Var | Procede de trajectographie de plusieurs cetaces par acoustique passive |
RU2449386C2 (ru) * | 2007-11-02 | 2012-04-27 | Хуавэй Текнолоджиз Ко., Лтд. | Способ и устройство для аудиодекодирования |
WO2009059632A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
US20100274555A1 (en) * | 2007-11-06 | 2010-10-28 | Lasse Laaksonen | Audio Coding Apparatus and Method Thereof |
CN101896967A (zh) * | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 编码器 |
KR101444099B1 (ko) * | 2007-11-13 | 2014-09-26 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
US8504377B2 (en) * | 2007-11-21 | 2013-08-06 | Lg Electronics Inc. | Method and an apparatus for processing a signal using length-adjusted window |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8050934B2 (en) * | 2007-11-29 | 2011-11-01 | Texas Instruments Incorporated | Local pitch control based on seamless time scale modification and synchronized sampling rate conversion |
TWI356399B (en) * | 2007-12-14 | 2012-01-11 | Ind Tech Res Inst | Speech recognition system and method with cepstral |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
US20100280833A1 (en) * | 2007-12-27 | 2010-11-04 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
WO2009116815A2 (en) * | 2008-03-20 | 2009-09-24 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding using bandwidth extension in portable terminal |
WO2010003068A1 (en) * | 2008-07-03 | 2010-01-07 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
CA2972808C (en) * | 2008-07-10 | 2018-12-18 | Voiceage Corporation | Multi-reference lpc filter quantization and inverse quantization device and method |
RU2536679C2 (ru) | 2008-07-11 | 2014-12-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
AU2009267529B2 (en) * | 2008-07-11 | 2011-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101614160B1 (ko) | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
WO2010011963A1 (en) * | 2008-07-25 | 2010-01-28 | The Board Of Trustees Of The University Of Illinois | Methods and systems for identifying speech sounds using multi-dimensional analysis |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
US8532998B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
US8407046B2 (en) * | 2008-09-06 | 2013-03-26 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
US20100070550A1 (en) * | 2008-09-12 | 2010-03-18 | Cardinal Health 209 Inc. | Method and apparatus of a sensor amplifier configured for use in medical applications |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
EP2224433B1 (en) * | 2008-09-25 | 2020-05-27 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
DE102008058496B4 (de) * | 2008-11-21 | 2010-09-09 | Siemens Medical Instruments Pte. Ltd. | Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
JP5423684B2 (ja) * | 2008-12-19 | 2014-02-19 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
ES2904373T3 (es) * | 2009-01-16 | 2022-04-04 | Dolby Int Ab | Transposición armónica mejorada de producto cruzado |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2555191A1 (en) * | 2009-03-31 | 2013-02-06 | Huawei Technologies Co., Ltd. | Method and device for audio signal denoising |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
JP4921611B2 (ja) * | 2009-04-03 | 2012-04-25 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102460574A (zh) * | 2009-05-19 | 2012-05-16 | 韩国电子通信研究院 | 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备 |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
WO2011029484A1 (en) * | 2009-09-14 | 2011-03-17 | Nokia Corporation | Signal enhancement processing |
US9595257B2 (en) * | 2009-09-28 | 2017-03-14 | Nuance Communications, Inc. | Downsampling schemes in a hierarchical neural network structure for phoneme recognition |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102667921B (zh) | 2009-10-20 | 2014-09-10 | 弗兰霍菲尔运输应用研究公司 | 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法 |
CN102257567B (zh) | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
CN103559890B (zh) * | 2009-10-21 | 2017-05-24 | 杜比国际公司 | 组合换位滤波器组的过采样 |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
EP2502230B1 (en) * | 2009-11-19 | 2014-05-21 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved excitation signal bandwidth extension |
EP2502231B1 (en) * | 2009-11-19 | 2014-06-04 | Telefonaktiebolaget L M Ericsson (PUBL) | Bandwidth extension of a low band audio signal |
US8489393B2 (en) * | 2009-11-23 | 2013-07-16 | Cambridge Silicon Radio Limited | Speech intelligibility |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
RU2464651C2 (ru) * | 2009-12-22 | 2012-10-20 | Общество с ограниченной ответственностью "Спирит Корп" | Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов |
US8559749B2 (en) * | 2010-01-06 | 2013-10-15 | Streaming Appliances, Llc | Audiovisual content delivery system |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
EP2517200B1 (en) | 2010-01-12 | 2015-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value |
US8699727B2 (en) | 2010-01-15 | 2014-04-15 | Apple Inc. | Visually-assisted mixing of audio using a spectral analyzer |
US9525569B2 (en) * | 2010-03-03 | 2016-12-20 | Skype | Enhanced circuit-switched calls |
CA2792500C (en) * | 2010-03-10 | 2016-05-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding |
US8700391B1 (en) * | 2010-04-01 | 2014-04-15 | Audience, Inc. | Low complexity bandwidth expansion of speech |
EP2559026A1 (en) * | 2010-04-12 | 2013-02-20 | Freescale Semiconductor, Inc. | Audio communication device, method for outputting an audio signal, and communication system |
JP5719922B2 (ja) * | 2010-04-13 | 2015-05-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | サンプルごとに正確なオーディオ信号表現のための方法、エンコーダ及びデコーダ |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
MY162594A (en) * | 2010-04-14 | 2017-06-30 | Voiceage Corp | Flexible and scalable combined innovation codebook for use in celp coder and decoder |
WO2011128399A1 (en) * | 2010-04-16 | 2011-10-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9378754B1 (en) | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101660843B1 (ko) * | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
ES2372202B2 (es) * | 2010-06-29 | 2012-08-08 | Universidad De Málaga | Sistema de reconocimiento de sonidos de bajo consumo. |
CN105244035B (zh) | 2010-07-02 | 2019-03-12 | 杜比国际公司 | 选择性低音后置滤波器 |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
US8977542B2 (en) | 2010-07-16 | 2015-03-10 | Telefonaktiebolaget L M Ericsson (Publ) | Audio encoder and decoder and methods for encoding and decoding an audio signal |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US20130310422A1 (en) | 2010-09-01 | 2013-11-21 | The General Hospital Corporation | Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine |
CA3043428C (en) | 2010-09-16 | 2020-02-18 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US8924200B2 (en) | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
WO2012053149A1 (ja) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
WO2012110447A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
AR085221A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada |
ES2458436T3 (es) | 2011-02-14 | 2014-05-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Representación de señal de información utilizando transformada superpuesta |
SG192747A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Encoding and decoding of pulse positions of tracks of an audio signal |
MY160272A (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Audio Codec Using Noise Synthesis During Inactive Phases |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
AR085362A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral |
WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
KR101624019B1 (ko) * | 2011-02-14 | 2016-06-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코덱에서 잡음 생성 |
US9343076B2 (en) | 2011-02-16 | 2016-05-17 | Dolby Laboratories Licensing Corporation | Methods and systems for generating filter coefficients and configuring filters |
DK3407352T3 (da) * | 2011-02-18 | 2022-06-07 | Ntt Docomo Inc | Taleafkoder, talekoder, taleafkodningsfremgangsmåde, talekodningsfremgangsmåde, taleafkodningsprogram og talekodningsprogram |
US9026450B2 (en) | 2011-03-09 | 2015-05-05 | Dts Llc | System for dynamically creating and rendering audio objects |
US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9298287B2 (en) | 2011-03-31 | 2016-03-29 | Microsoft Technology Licensing, Llc | Combined activation for natural user interface systems |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
CN102811034A (zh) | 2011-05-31 | 2012-12-05 | 财团法人工业技术研究院 | 信号处理装置及信号处理方法 |
EP2709103B1 (en) * | 2011-06-09 | 2015-10-07 | Panasonic Intellectual Property Corporation of America | Voice coding device, voice decoding device, voice coding method and voice decoding method |
US9070361B2 (en) * | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
AU2012276367B2 (en) * | 2011-06-30 | 2016-02-04 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
US9059786B2 (en) * | 2011-07-07 | 2015-06-16 | Vecima Networks Inc. | Ingress suppression for communication systems |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
RU2486636C1 (ru) * | 2011-11-14 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2486637C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486638C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2496222C2 (ru) * | 2011-11-17 | 2013-10-20 | Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486639C1 (ru) * | 2011-11-21 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2496192C2 (ru) * | 2011-11-21 | 2013-10-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2490727C2 (ru) * | 2011-11-28 | 2013-08-20 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) | Способ передачи речевых сигналов (варианты) |
RU2487443C1 (ru) * | 2011-11-29 | 2013-07-10 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ согласования комплексных сопротивлений и устройство его реализации |
JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
US9972325B2 (en) * | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
US9082398B2 (en) * | 2012-02-28 | 2015-07-14 | Huawei Technologies Co., Ltd. | System and method for post excitation enhancement for low bit rate speech coding |
US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
ES2762325T3 (es) | 2012-03-21 | 2020-05-22 | Samsung Electronics Co Ltd | Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda |
WO2013147667A1 (en) * | 2012-03-29 | 2013-10-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Vector quantizer |
US10448161B2 (en) | 2012-04-02 | 2019-10-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field |
JP5998603B2 (ja) * | 2012-04-18 | 2016-09-28 | ソニー株式会社 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
KR101343768B1 (ko) * | 2012-04-19 | 2014-01-16 | 충북대학교 산학협력단 | 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법 |
RU2504898C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
RU2504894C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
US20140006017A1 (en) * | 2012-06-29 | 2014-01-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal |
CN104603874B (zh) * | 2012-08-31 | 2017-07-04 | 瑞典爱立信有限公司 | 用于语音活动性检测的方法和设备 |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
WO2014062859A1 (en) * | 2012-10-16 | 2014-04-24 | Audiologicall, Ltd. | Audio signal manipulation for speech enhancement before sound reproduction |
KR101413969B1 (ko) | 2012-12-20 | 2014-07-08 | 삼성전자주식회사 | 오디오 신호의 복호화 방법 및 장치 |
CN105551497B (zh) | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
CN106847297B (zh) | 2013-01-29 | 2020-07-07 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
RU2641461C2 (ru) * | 2013-01-29 | 2018-01-17 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер, аудиодекодер, способ обеспечения кодированной аудиоинформации, способ обеспечения декодированной аудиоинформации, компьютерная программа и кодированное представление с использованием сигнально-адаптивного расширения полосы пропускания |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
BR112015018023B1 (pt) * | 2013-01-29 | 2022-06-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema |
US20140213909A1 (en) * | 2013-01-31 | 2014-07-31 | Xerox Corporation | Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data |
US9741350B2 (en) | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9601125B2 (en) * | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US9336789B2 (en) * | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
US9715885B2 (en) * | 2013-03-05 | 2017-07-25 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
EP2784775B1 (en) * | 2013-03-27 | 2016-09-14 | Binauric SE | Speech signal encoding/decoding method and apparatus |
US9613660B2 (en) | 2013-04-05 | 2017-04-04 | Dts, Inc. | Layered audio reconstruction system |
EP2981958B1 (en) * | 2013-04-05 | 2018-03-07 | Dolby International AB | Audio encoder and decoder |
CN117253498A (zh) * | 2013-04-05 | 2023-12-19 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
JP6228298B2 (ja) * | 2013-06-21 | 2017-11-08 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | エネルギー調整モジュールを備えた帯域幅拡大モジュールを有するオーディオ復号器 |
PT3011554T (pt) * | 2013-06-21 | 2019-10-24 | Fraunhofer Ges Forschung | Estimação de atraso de tom. |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP3014290A4 (en) | 2013-06-27 | 2017-03-08 | The General Hospital Corporation | Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data |
US10383574B2 (en) | 2013-06-28 | 2019-08-20 | The General Hospital Corporation | Systems and methods to infer brain state during burst suppression |
CN104282308B (zh) * | 2013-07-04 | 2017-07-14 | 华为技术有限公司 | 频域包络的矢量量化方法和装置 |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830063A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for decoding an encoded audio signal |
EP3503095A1 (en) * | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
JP6586093B2 (ja) | 2013-09-13 | 2019-10-02 | ザ ジェネラル ホスピタル コーポレイション | 全身麻酔および鎮静中の改良された脳監視のためのシステム |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
US9224402B2 (en) | 2013-09-30 | 2015-12-29 | International Business Machines Corporation | Wideband speech parameterization for high quality synthesis, transformation and quantization |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) * | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
KR102271852B1 (ko) | 2013-11-02 | 2021-07-01 | 삼성전자주식회사 | 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 |
EP2871641A1 (en) * | 2013-11-12 | 2015-05-13 | Dialog Semiconductor B.V. | Enhancement of narrowband audio signals using a single sideband AM modulation |
JP6345780B2 (ja) | 2013-11-22 | 2018-06-20 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ハイバンドコーディングにおける選択的位相補償 |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
US9564141B2 (en) | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
JP6281336B2 (ja) * | 2014-03-12 | 2018-02-21 | 沖電気工業株式会社 | 音声復号化装置及びプログラム |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
PL3550563T3 (pl) * | 2014-03-31 | 2024-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enkoder, dekoder, sposób enkodowania, sposób dekodowania oraz powiązane programy |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN106409304B (zh) * | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
CN107424622B (zh) | 2014-06-24 | 2020-12-25 | 华为技术有限公司 | 音频编码方法和装置 |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9626983B2 (en) * | 2014-06-26 | 2017-04-18 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
CN105225670B (zh) * | 2014-06-27 | 2016-12-28 | 华为技术有限公司 | 一种音频编码方法和装置 |
US9721584B2 (en) * | 2014-07-14 | 2017-08-01 | Intel IP Corporation | Wind noise reduction for audio reception |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP3182412B1 (en) * | 2014-08-15 | 2023-06-07 | Samsung Electronics Co., Ltd. | Sound quality improving method and device, sound decoding method and device, and multimedia device employing same |
CN104217730B (zh) * | 2014-08-18 | 2017-07-21 | 大连理工大学 | 一种基于k‑svd的人工语音带宽扩展方法及装置 |
US9978388B2 (en) | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
TWI550945B (zh) * | 2014-12-22 | 2016-09-21 | 國立彰化師範大學 | 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器 |
US9595269B2 (en) * | 2015-01-19 | 2017-03-14 | Qualcomm Incorporated | Scaling for gain shape circuitry |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
CN107517593B (zh) * | 2015-02-26 | 2021-03-12 | 弗劳恩霍夫应用研究促进协会 | 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US9830921B2 (en) * | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
NO339664B1 (en) | 2015-10-15 | 2017-01-23 | St Tech As | A system for isolating an object |
CN107924683B (zh) * | 2015-10-15 | 2021-03-30 | 华为技术有限公司 | 正弦编码和解码的方法和装置 |
BR112017024480A2 (pt) * | 2016-02-17 | 2018-07-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | pós-processador, pré-processador, codificador de áudio, decodificador de áudio e métodos relacionados para aprimoramento do processamento transiente |
FR3049084B1 (fr) | 2016-03-15 | 2022-11-11 | Fraunhofer Ges Forschung | Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code |
WO2017178329A1 (en) * | 2016-04-12 | 2017-10-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band |
US20170330575A1 (en) * | 2016-05-10 | 2017-11-16 | Immersion Services LLC | Adaptive audio codec system, method and article |
JP7005036B2 (ja) * | 2016-05-10 | 2022-01-21 | イマージョン・ネットワークス・インコーポレイテッド | 適応オーディオコーデックシステム、方法および媒体 |
US10770088B2 (en) * | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
US10699725B2 (en) * | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
US10756755B2 (en) * | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
US10264116B2 (en) * | 2016-11-02 | 2019-04-16 | Nokia Technologies Oy | Virtual duplex operation |
KR102507383B1 (ko) * | 2016-11-08 | 2023-03-08 | 한국전자통신연구원 | 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템 |
WO2018102402A1 (en) | 2016-11-29 | 2018-06-07 | The General Hospital Corporation | Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments |
PL3555885T3 (pl) | 2016-12-16 | 2021-01-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Sposób i koder do obsługi współczynników reprezentacji obwiedni |
PT3472964T (pt) | 2017-01-06 | 2020-04-03 | Ericsson Telefon Ab L M | Métodos e aparelhos para sinalização e determinação de deslocamentos de sinal de referência |
KR102687184B1 (ko) * | 2017-02-10 | 2024-07-19 | 삼성전자주식회사 | Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법 |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
US10304468B2 (en) * | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
TW202341126A (zh) * | 2017-03-23 | 2023-10-16 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
US10764101B2 (en) * | 2017-10-27 | 2020-09-01 | Terawave, Llc | High spectral efficiency data communications system using encoded sinusoidal waveforms |
US11876659B2 (en) | 2017-10-27 | 2024-01-16 | Terawave, Llc | Communication system using shape-shifted sinusoidal waveforms |
CN109729553B (zh) * | 2017-10-30 | 2021-12-28 | 成都鼎桥通信技术有限公司 | Lte集群通信系统的语音业务处理方法及设备 |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US10460749B1 (en) * | 2018-06-28 | 2019-10-29 | Nuvoton Technology Corporation | Voice activity detection using vocal tract area information |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
WO2020171034A1 (ja) * | 2019-02-20 | 2020-08-27 | ヤマハ株式会社 | 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム |
CN110610713B (zh) * | 2019-08-28 | 2021-11-16 | 南京梧桐微电子科技有限公司 | 一种声码器余量谱幅度参数重构方法及系统 |
US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
TWI723545B (zh) * | 2019-09-17 | 2021-04-01 | 宏碁股份有限公司 | 語音處理方法及其裝置 |
US11295751B2 (en) * | 2019-09-20 | 2022-04-05 | Tencent America LLC | Multi-band synchronized neural vocoder |
KR102201169B1 (ko) * | 2019-10-23 | 2021-01-11 | 성균관대학교 산학협력단 | 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법 |
CN114548442B (zh) * | 2022-02-25 | 2022-10-21 | 万表名匠(广州)科技有限公司 | 一种基于互联网技术的腕表维修管理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0732687A2 (en) * | 1995-03-13 | 1996-09-18 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US20020052738A1 (en) * | 2000-05-22 | 2002-05-02 | Erdal Paksoy | Wideband speech coding system and method |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
EP1498873A1 (en) * | 2003-07-14 | 2005-01-19 | Nokia Corporation | Improved excitation for higher band coding in a codec utilizing band split coding methods |
Family Cites Families (144)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US525147A (en) * | 1894-08-28 | Steam-cooker | ||
US596689A (en) * | 1898-01-04 | Hose holder or support | ||
US526468A (en) * | 1894-09-25 | Charles d | ||
US321993A (en) * | 1885-07-14 | Lantern | ||
US1126620A (en) * | 1911-01-30 | 1915-01-26 | Safety Car Heating & Lighting | Electric regulation. |
US1089258A (en) * | 1914-01-13 | 1914-03-03 | James Arnot Paterson | Facing or milling machine. |
US1300833A (en) * | 1918-12-12 | 1919-04-15 | Moline Mill Mfg Company | Idler-pulley structure. |
US1498873A (en) * | 1924-04-19 | 1924-06-24 | Bethlehem Steel Corp | Switch stand |
US2073913A (en) * | 1934-06-26 | 1937-03-16 | Wigan Edmund Ramsay | Means for gauging minute displacements |
US2086867A (en) * | 1936-06-19 | 1937-07-13 | Hall Lab Inc | Laundering composition and process |
US3044777A (en) * | 1959-10-19 | 1962-07-17 | Fibermold Corp | Bowling pin |
US3158693A (en) * | 1962-08-07 | 1964-11-24 | Bell Telephone Labor Inc | Speech interpolation communication system |
US3855416A (en) * | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
US3855414A (en) | 1973-04-24 | 1974-12-17 | Anaconda Co | Cable armor clamp |
JPS59139099A (ja) * | 1983-01-31 | 1984-08-09 | 株式会社東芝 | 音声区間検出装置 |
US4616659A (en) | 1985-05-06 | 1986-10-14 | At&T Bell Laboratories | Heart rate detection utilizing autoregressive analysis |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4747143A (en) | 1985-07-12 | 1988-05-24 | Westinghouse Electric Corp. | Speech enhancement system having dynamic gain control |
NL8503152A (nl) * | 1985-11-15 | 1987-06-01 | Optische Ind De Oude Delft Nv | Dosismeter voor ioniserende straling. |
US4862168A (en) * | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
US4805193A (en) * | 1987-06-04 | 1989-02-14 | Motorola, Inc. | Protection of energy information in sub-band coding |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
JP2707564B2 (ja) | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
US5285520A (en) * | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
US5077798A (en) * | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
US5086475A (en) | 1988-11-19 | 1992-02-04 | Sony Corporation | Apparatus for generating, recording or reproducing sound source data |
JPH02244100A (ja) | 1989-03-16 | 1990-09-28 | Ricoh Co Ltd | 駆動音源信号生成装置 |
BR9105987A (pt) | 1990-09-19 | 1993-02-02 | Philips Nv | Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro |
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3191457B2 (ja) * | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
PL173718B1 (pl) | 1993-06-30 | 1998-04-30 | Sony Corp | Sposób i urządzenie do kodowania sygnałów cyfrowych |
WO1995010760A2 (en) * | 1993-10-08 | 1995-04-20 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5487087A (en) * | 1994-05-17 | 1996-01-23 | Texas Instruments Incorporated | Signal quantizer with reduced output fluctuation |
US5797118A (en) | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
JP2770137B2 (ja) | 1994-09-22 | 1998-06-25 | 日本プレシジョン・サーキッツ株式会社 | 波形データ圧縮装置 |
US5699477A (en) * | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
FI97182C (fi) * | 1994-12-05 | 1996-10-25 | Nokia Telecommunications Oy | Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin |
JP3365113B2 (ja) * | 1994-12-22 | 2003-01-08 | ソニー株式会社 | 音声レベル制御装置 |
JP2956548B2 (ja) | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP2798003B2 (ja) * | 1995-05-09 | 1998-09-17 | 松下電器産業株式会社 | 音声帯域拡大装置および音声帯域拡大方法 |
JP3189614B2 (ja) * | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US5706395A (en) | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
JP3334419B2 (ja) * | 1995-04-20 | 2002-10-15 | ソニー株式会社 | ノイズ低減方法及びノイズ低減装置 |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US6097824A (en) * | 1997-06-06 | 2000-08-01 | Audiologic, Incorporated | Continuous frequency dynamic range audio compressor |
EP0768569B1 (en) * | 1995-10-16 | 2003-04-02 | Agfa-Gevaert | New class of yellow dyes for use in photographic materials |
JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US5737716A (en) * | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
JP3073919B2 (ja) * | 1995-12-30 | 2000-08-07 | 松下電器産業株式会社 | 同期装置 |
US5689615A (en) | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
TW307960B (en) * | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
TW416044B (en) * | 1996-06-19 | 2000-12-21 | Texas Instruments Inc | Adaptive filter and filtering method for low bit rate coding |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
CN1170269C (zh) | 1996-11-07 | 2004-10-06 | 松下电器产业株式会社 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
US6009395A (en) | 1997-01-02 | 1999-12-28 | Texas Instruments Incorporated | Synthesizer and method using scaled excitation signal |
US6202046B1 (en) * | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US6041297A (en) | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
US5890126A (en) * | 1997-03-10 | 1999-03-30 | Euphonics, Incorporated | Audio data decompression and interpolation apparatus and method |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US6029125A (en) * | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US6231516B1 (en) * | 1997-10-14 | 2001-05-15 | Vacusense, Inc. | Endoluminal implant with therapeutic and diagnostic capability |
JPH11205166A (ja) * | 1998-01-19 | 1999-07-30 | Mitsubishi Electric Corp | ノイズ検出装置 |
US6301556B1 (en) | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6385573B1 (en) * | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
JP4170458B2 (ja) * | 1998-08-27 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
US6353808B1 (en) | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
KR20000047944A (ko) | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
JP4354561B2 (ja) | 1999-01-08 | 2009-10-28 | パナソニック株式会社 | オーディオ信号符号化装置及び復号化装置 |
US6223151B1 (en) | 1999-02-10 | 2001-04-24 | Telefon Aktie Bolaget Lm Ericsson | Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders |
US6829360B1 (en) | 1999-05-14 | 2004-12-07 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for expanding band of audio signal |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US6556950B1 (en) | 1999-09-30 | 2003-04-29 | Rockwell Automation Technologies, Inc. | Diagnostic method and apparatus for use with enterprise control |
US6715125B1 (en) | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
CN1192355C (zh) | 1999-11-16 | 2005-03-09 | 皇家菲利浦电子有限公司 | 宽带音频传输系统 |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US7260523B2 (en) * | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
AU2547201A (en) * | 2000-01-11 | 2001-07-24 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
US6757395B1 (en) | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US6704711B2 (en) | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6732070B1 (en) * | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
JP3681105B2 (ja) | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
US7330814B2 (en) * | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
ATE265732T1 (de) | 2000-05-22 | 2004-05-15 | Texas Instruments Inc | Vorrichtung und verfahren zur breitbandcodierung von sprachsignalen |
JP2002055699A (ja) * | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
KR100800373B1 (ko) | 2000-08-25 | 2008-02-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 디지털 입력신호의 워드 길이를 축소하는 방법 및 장치와, 그 디지털 입력신호를 회복시키는 방법 및 장치 |
US6515889B1 (en) * | 2000-08-31 | 2003-02-04 | Micron Technology, Inc. | Junction-isolated depletion mode ferroelectric memory |
US7386444B2 (en) * | 2000-09-22 | 2008-06-10 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
JP2002202799A (ja) | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3558031B2 (ja) * | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
WO2002039430A1 (en) | 2000-11-09 | 2002-05-16 | Koninklijke Philips Electronics N.V. | Wideband extension of telephone speech for higher perceptual quality |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
CA2733453C (en) | 2000-11-30 | 2014-10-14 | Panasonic Corporation | Lpc vector quantization apparatus |
GB0031461D0 (en) | 2000-12-22 | 2001-02-07 | Thales Defence Ltd | Communication sets |
US20040204935A1 (en) | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
WO2002093561A1 (de) * | 2001-05-11 | 2002-11-21 | Siemens Aktiengesellschaft | Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals |
CN1235192C (zh) * | 2001-06-28 | 2006-01-04 | 皇家菲利浦电子有限公司 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
JP2003036097A (ja) * | 2001-07-25 | 2003-02-07 | Sony Corp | 情報検出装置及び方法、並びに情報検索装置及び方法 |
TW525147B (en) | 2001-09-28 | 2003-03-21 | Inventec Besta Co Ltd | Method of obtaining and decoding basic cycle of voice |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
TW526468B (en) | 2001-10-19 | 2003-04-01 | Chunghwa Telecom Co Ltd | System and method for eliminating background noise of voice signal |
JP4245288B2 (ja) | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
US20050004803A1 (en) * | 2001-11-23 | 2005-01-06 | Jo Smeets | Audio signal bandwidth extension |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6751587B2 (en) * | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
JP3826813B2 (ja) | 2002-02-18 | 2006-09-27 | ソニー株式会社 | ディジタル信号処理装置及びディジタル信号処理方法 |
WO2004027368A1 (en) | 2002-09-19 | 2004-04-01 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
JP3756864B2 (ja) | 2002-09-30 | 2006-03-15 | 株式会社東芝 | 音声合成方法と装置及び音声合成プログラム |
KR100841096B1 (ko) | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7242763B2 (en) | 2002-11-26 | 2007-07-10 | Lucent Technologies Inc. | Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems |
CA2415105A1 (en) | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100480341B1 (ko) | 2003-03-13 | 2005-03-31 | 한국전자통신연구원 | 광대역 저전송률 음성 신호의 부호화기 |
WO2004097797A1 (en) | 2003-05-01 | 2004-11-11 | Nokia Corporation | Method and device for gain quantization in variable bit rate wideband speech coding |
WO2005004113A1 (ja) | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
US7428490B2 (en) * | 2003-09-30 | 2008-09-23 | Intel Corporation | Method for spectral subtraction in speech enhancement |
US7698292B2 (en) * | 2003-12-03 | 2010-04-13 | Siemens Aktiengesellschaft | Tag management within a decision, support, and reporting environment |
KR100587953B1 (ko) | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4259401B2 (ja) | 2004-06-02 | 2009-04-30 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
US8000967B2 (en) | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
CN101184979B (zh) | 2005-04-01 | 2012-04-25 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
SG161224A1 (en) | 2005-04-01 | 2010-05-27 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
SI1875463T1 (sl) | 2005-04-22 | 2019-02-28 | Qualcomm Incorporated | Sistemi, postopki in naprava za glajenje faktorja ojačenja |
-
2006
- 2006-04-03 SG SG201002303-4A patent/SG161224A1/en unknown
- 2006-04-03 BR BRPI0608305-6A patent/BRPI0608305B1/pt active IP Right Grant
- 2006-04-03 WO PCT/US2006/012227 patent/WO2006107833A1/en active Application Filing
- 2006-04-03 EP EP06740357A patent/EP1866915B1/en active Active
- 2006-04-03 JP JP2008504480A patent/JP5129118B2/ja active Active
- 2006-04-03 WO PCT/US2006/012232 patent/WO2006107838A1/en active Application Filing
- 2006-04-03 EP EP06740354A patent/EP1866914B1/en active Active
- 2006-04-03 PL PL06740358T patent/PL1864282T3/pl unknown
- 2006-04-03 AT AT06740357T patent/ATE492016T1/de not_active IP Right Cessation
- 2006-04-03 EP EP06740355A patent/EP1869673B1/en active Active
- 2006-04-03 AU AU2006232357A patent/AU2006232357C1/en active Active
- 2006-04-03 AU AU2006252957A patent/AU2006252957B2/en active Active
- 2006-04-03 MX MX2007012184A patent/MX2007012184A/es active IP Right Grant
- 2006-04-03 TW TW095111800A patent/TWI321777B/zh active
- 2006-04-03 AU AU2006232361A patent/AU2006232361B2/en active Active
- 2006-04-03 PT PT67403584T patent/PT1864282T/pt unknown
- 2006-04-03 KR KR1020077025400A patent/KR100956877B1/ko active IP Right Grant
- 2006-04-03 MX MX2007012187A patent/MX2007012187A/es active IP Right Grant
- 2006-04-03 CN CN201110326747.2A patent/CN102411935B/zh active Active
- 2006-04-03 RU RU2009131435/08A patent/RU2491659C2/ru active
- 2006-04-03 TW TW095111797A patent/TWI316225B/zh active
- 2006-04-03 DE DE602006017050T patent/DE602006017050D1/de active Active
- 2006-04-03 CA CA2603255A patent/CA2603255C/en active Active
- 2006-04-03 AT AT06740355T patent/ATE482449T1/de not_active IP Right Cessation
- 2006-04-03 JP JP2008504474A patent/JP5203929B2/ja active Active
- 2006-04-03 TW TW095111852A patent/TWI324335B/zh active
- 2006-04-03 US US11/397,794 patent/US8484036B2/en active Active
- 2006-04-03 KR KR1020077025255A patent/KR100956624B1/ko active IP Right Grant
- 2006-04-03 KR KR1020077025422A patent/KR100956523B1/ko active IP Right Grant
- 2006-04-03 DK DK06784345.8T patent/DK1864101T3/da active
- 2006-04-03 WO PCT/US2006/012230 patent/WO2006107836A1/en active Application Filing
- 2006-04-03 SI SI200632188T patent/SI1864282T1/sl unknown
- 2006-04-03 MX MX2007012189A patent/MX2007012189A/es active IP Right Grant
- 2006-04-03 BR BRPI0609530-5A patent/BRPI0609530B1/pt active IP Right Grant
- 2006-04-03 CA CA2603219A patent/CA2603219C/en active Active
- 2006-04-03 BR BRPI0608306-4A patent/BRPI0608306A2/pt not_active Application Discontinuation
- 2006-04-03 US US11/397,370 patent/US8078474B2/en active Active
- 2006-04-03 WO PCT/US2006/012235 patent/WO2006107840A1/en active Application Filing
- 2006-04-03 WO PCT/US2006/012231 patent/WO2006107837A1/en active Application Filing
- 2006-04-03 BR BRPI0608270-0A patent/BRPI0608270A2/pt not_active Application Discontinuation
- 2006-04-03 SG SG201002300-0A patent/SG161223A1/en unknown
- 2006-04-03 AU AU2006232358A patent/AU2006232358B2/en not_active Expired - Fee Related
- 2006-04-03 PT PT06784345T patent/PT1864101E/pt unknown
- 2006-04-03 NZ NZ562183A patent/NZ562183A/en unknown
- 2006-04-03 EP EP06784345A patent/EP1864101B1/en active Active
- 2006-04-03 DK DK06740358.4T patent/DK1864282T3/en active
- 2006-04-03 CA CA2603231A patent/CA2603231C/en active Active
- 2006-04-03 WO PCT/US2006/012228 patent/WO2006107834A1/en active Application Filing
- 2006-04-03 JP JP2008504482A patent/JP5161069B2/ja active Active
- 2006-04-03 RU RU2007140394/09A patent/RU2413191C2/ru active
- 2006-04-03 CA CA2602806A patent/CA2602806C/en active Active
- 2006-04-03 EP EP06740356A patent/EP1864283B1/en active Active
- 2006-04-03 AU AU2006232360A patent/AU2006232360B2/en active Active
- 2006-04-03 BR BRPI0608269A patent/BRPI0608269B8/pt active IP Right Grant
- 2006-04-03 NZ NZ562182A patent/NZ562182A/xx not_active IP Right Cessation
- 2006-04-03 DE DE602006017673T patent/DE602006017673D1/de active Active
- 2006-04-03 JP JP2008504475A patent/JP5129115B2/ja active Active
- 2006-04-03 AT AT06740354T patent/ATE459958T1/de not_active IP Right Cessation
- 2006-04-03 ES ES06740358.4T patent/ES2636443T3/es active Active
- 2006-04-03 MX MX2007012183A patent/MX2007012183A/es active IP Right Grant
- 2006-04-03 PL PL06740357T patent/PL1866915T3/pl unknown
- 2006-04-03 KR KR1020077025421A patent/KR100956524B1/ko active IP Right Grant
- 2006-04-03 MX MX2007012185A patent/MX2007012185A/es active IP Right Grant
- 2006-04-03 AU AU2006232363A patent/AU2006232363B2/en active Active
- 2006-04-03 WO PCT/US2006/012233 patent/WO2006107839A2/en active Application Filing
- 2006-04-03 KR KR1020077025447A patent/KR101019940B1/ko active IP Right Grant
- 2006-04-03 ES ES06784345T patent/ES2391292T3/es active Active
- 2006-04-03 JP JP2008504481A patent/JP4955649B2/ja active Active
- 2006-04-03 PL PL06740355T patent/PL1869673T3/pl unknown
- 2006-04-03 RU RU2007140383/09A patent/RU2402826C2/ru active
- 2006-04-03 SG SG201004744-7A patent/SG163556A1/en unknown
- 2006-04-03 TW TW095111819A patent/TWI321315B/zh active
- 2006-04-03 SG SG201004741-3A patent/SG163555A1/en unknown
- 2006-04-03 PL PL06784345T patent/PL1864101T3/pl unknown
- 2006-04-03 CA CA2603187A patent/CA2603187C/en active Active
- 2006-04-03 MX MX2007012181A patent/MX2007012181A/es active IP Right Grant
- 2006-04-03 DE DE602006012637T patent/DE602006012637D1/de active Active
- 2006-04-03 RU RU2007140426/09A patent/RU2402827C2/ru active
- 2006-04-03 JP JP2008504478A patent/JP5129117B2/ja active Active
- 2006-04-03 CA CA2603246A patent/CA2603246C/en active Active
- 2006-04-03 BR BRPI0607690A patent/BRPI0607690A8/pt not_active Application Discontinuation
- 2006-04-03 RU RU2007140429/09A patent/RU2387025C2/ru active
- 2006-04-03 US US11/397,871 patent/US8140324B2/en active Active
- 2006-04-03 JP JP2008504479A patent/JP5203930B2/ja active Active
- 2006-04-03 RU RU2007140382/09A patent/RU2381572C2/ru active
- 2006-04-03 EP EP06740358.4A patent/EP1864282B1/en active Active
- 2006-04-03 BR BRPI0607646-7A patent/BRPI0607646B1/pt active IP Right Grant
- 2006-04-03 EP EP06740352A patent/EP1864281A1/en not_active Withdrawn
- 2006-04-03 NZ NZ562186A patent/NZ562186A/xx not_active IP Right Cessation
- 2006-04-03 US US11/397,432 patent/US8364494B2/en active Active
- 2006-04-03 NZ NZ562185A patent/NZ562185A/en not_active IP Right Cessation
- 2006-04-03 AU AU2006232362A patent/AU2006232362B2/en active Active
- 2006-04-03 JP JP2008504477A patent/JP5129116B2/ja active Active
- 2006-04-03 TW TW095111794A patent/TWI320923B/zh active
- 2006-04-03 NZ NZ562188A patent/NZ562188A/en not_active IP Right Cessation
- 2006-04-03 TW TW095111814A patent/TWI330828B/zh active
- 2006-04-03 KR KR1020077025432A patent/KR100956525B1/ko active IP Right Grant
- 2006-04-03 WO PCT/US2006/012234 patent/WO2006130221A1/en active Application Filing
- 2006-04-03 MX MX2007012182A patent/MX2007012182A/es active IP Right Grant
- 2006-04-03 BR BRPI0607691A patent/BRPI0607691B1/pt active IP Right Grant
- 2006-04-03 US US11/397,505 patent/US8332228B2/en active Active
- 2006-04-03 CA CA2602804A patent/CA2602804C/en active Active
- 2006-04-03 ES ES06740354T patent/ES2340608T3/es active Active
- 2006-04-03 US US11/397,870 patent/US8260611B2/en active Active
- 2006-04-03 KR KR1020077025293A patent/KR100982638B1/ko active IP Right Grant
- 2006-04-03 RU RU2007140406/09A patent/RU2390856C2/ru active
- 2006-04-03 KR KR1020077025290A patent/KR100956876B1/ko active IP Right Grant
- 2006-04-03 NZ NZ562190A patent/NZ562190A/en not_active IP Right Cessation
- 2006-04-03 EP EP06740351A patent/EP1869670B1/en active Active
- 2006-04-03 RU RU2007140381/09A patent/RU2386179C2/ru active
- 2006-04-03 MX MX2007012191A patent/MX2007012191A/es active IP Right Grant
- 2006-04-03 TW TW095111851A patent/TWI319565B/zh active
- 2006-04-03 US US11/397,872 patent/US8069040B2/en active Active
- 2006-04-03 US US11/397,433 patent/US8244526B2/en active Active
- 2006-04-03 DE DE602006018884T patent/DE602006018884D1/de active Active
- 2006-04-03 RU RU2007140365/09A patent/RU2376657C2/ru active
- 2006-04-03 TW TW095111804A patent/TWI321314B/zh active
- 2006-04-03 AU AU2006232364A patent/AU2006232364B2/en active Active
- 2006-04-03 AT AT06740351T patent/ATE485582T1/de not_active IP Right Cessation
- 2006-04-03 CA CA2603229A patent/CA2603229C/en active Active
-
2007
- 2007-10-07 IL IL186439A patent/IL186439A0/en unknown
- 2007-10-07 IL IL186438A patent/IL186438A/en active IP Right Grant
- 2007-10-07 IL IL186405A patent/IL186405A/en active IP Right Grant
- 2007-10-07 IL IL186436A patent/IL186436A0/en active IP Right Grant
- 2007-10-07 IL IL186441A patent/IL186441A0/en active IP Right Grant
- 2007-10-07 IL IL186404A patent/IL186404A/en active IP Right Grant
- 2007-10-07 IL IL186443A patent/IL186443A/en active IP Right Grant
- 2007-10-07 IL IL186442A patent/IL186442A/en active IP Right Grant
- 2007-10-31 NO NO20075503A patent/NO20075503L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075512A patent/NO20075512L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075513A patent/NO340428B1/no unknown
- 2007-10-31 NO NO20075515A patent/NO340566B1/no unknown
- 2007-10-31 NO NO20075510A patent/NO20075510L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075511A patent/NO20075511L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075514A patent/NO340434B1/no unknown
-
2008
- 2008-08-28 HK HK08109568.5A patent/HK1113848A1/xx unknown
- 2008-09-19 HK HK08110384.5A patent/HK1115023A1/xx unknown
- 2008-09-22 HK HK08110465.7A patent/HK1114901A1/xx unknown
- 2008-09-24 HK HK08110589.8A patent/HK1115024A1/xx unknown
- 2008-09-24 HK HK12110024.5A patent/HK1169509A1/xx unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0732687A2 (en) * | 1995-03-13 | 1996-09-18 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US20020052738A1 (en) * | 2000-05-22 | 2002-05-02 | Erdal Paksoy | Wideband speech coding system and method |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
EP1498873A1 (en) * | 2003-07-14 | 2005-01-19 | Nokia Corporation | Improved excitation for higher band coding in a codec utilizing band split coding methods |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100956524B1 (ko) | 스피치 신호의 고대역 부분을 인코딩 및 디코딩하는 방법및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130329 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160330 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170330 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180329 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20190327 Year of fee payment: 10 |