KR960013961B1 - 코드북 여기 선형 예측 서치 루프에 사용하기 위한 적응적 피치 펄스 강화기 및 그 사용 방법 - Google Patents
코드북 여기 선형 예측 서치 루프에 사용하기 위한 적응적 피치 펄스 강화기 및 그 사용 방법 Download PDFInfo
- Publication number
- KR960013961B1 KR960013961B1 KR1019930022970A KR930022970A KR960013961B1 KR 960013961 B1 KR960013961 B1 KR 960013961B1 KR 1019930022970 A KR1019930022970 A KR 1019930022970A KR 930022970 A KR930022970 A KR 930022970A KR 960013961 B1 KR960013961 B1 KR 960013961B1
- Authority
- KR
- South Korea
- Prior art keywords
- codebook
- excitation vector
- adaptive codebook
- determining
- optimal
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 title claims description 88
- 238000000034 method Methods 0.000 title claims description 10
- 239000003623 enhancer Substances 0.000 title description 8
- 239000013598 vector Substances 0.000 claims description 98
- 230000005284 excitation Effects 0.000 claims description 90
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/04—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Electrically Operated Instructional Devices (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
내용 없음.
Description
제1도는 본 발명의 양호한 실시예에 따른 CELP 코더에 사용하기 이한 CELP 서치 루프의 블록도.
제2도는 제1도의 CELP 서치 루프의 음성 메저리(voicing measurer)의 블록도.
제3(a)도 및 제3(b)도는 제1도의 CELP 서치 루프의 동작 흐름도.
제4도는 제2도의 피치 펄스 강화기 및 음성 메저러의 동작 흐름도.
* 도면의 주요부분에 대한 부호의 설명
10 : CELP 서치 루프 20 : 프리프로세서
30, 40, 50 : 감산기 60 : 선형 예측 필터
70 : 적응적 코드북 80 : 고정 코드북
90, 100 : 승산기 110 : 가산기
120, 130 : 가중 필터 140, 150 : 합산기
160 : 서브프레임 지연 회로 180 : 리스케일러
190 : 음성 메저리
본 발명은 코드북 여기 선형 예측(codebook excited linear prediction ; CELP)코더에 관한 것이다.
본 발명은 디지탈 셀룰라 네트워크에서 특별히 응용되지만, 저속의 CELP 음성 코딩을 채택하는 텔레컴뮤니케이션 프로덕트 라인(telecommunications product line)에서 유리할 수도 있다.
북미 방식이 셀룰라 전기 통신 시스템은 현재의 아날로그 주파수 변조 형태에서 디지탈 시스템으로 급속도로 진화되어가고 있다. 전형적으로, 이러한 디지탈 셀룰라 전기 통신 시스템은 저속의 음성 코딩용으로 CELP 기술을 사용한다. 이 기술은 특정의 벡터에 대한 여기 벡터 테이블 또는 코드북을 서치하는 것을 필요로 하는데, 이 특정 벡터는 선형 예측 필터를 통해 필터링될때 입력 순차에 가장 가까운 출력 순차를 생성하는 벡터이다. 합성된 음성 코드들의 출력 순차는 아날로그 음성으로부터 그에 대응하는 디지탈 음성을 생성할때 발생하는 입력 순차를 여기시킴에 따라 발생한다.
종래의 CELP 기술은 대략 8.0kbps 부근에서는 고속의 품질을 유지할 수 있는 반면에, 약 4.0kbps의 저속에서는 품질이 저하된다. 특히, CELP 서치 루프의 적응적 코드북이 상당히 플랫(flat)함으로, 즉 무음성 통하 기간중에는 적응적 코드북 벡터의 변화가 제한되기 때문에 CELP 서치 루프의 음성 통화 개시시에 펄스를 주기적으로 발생시키기가 어렵다. 따라서, 자주 적응적 코드북이 음성을 합성시키기에 충분한 피치 펄스 구조로 집중(converge)되느데 걸리는 시간이 지연되다. 이로 인해 통상, 특히 짧은 통화 기간중에 통화 음성이 차단된다.
본 발명은 CELP 코더에 사용하기 위한 개량된 CELP 서치 루프와 그 사용 방법을 제공한다. 또한, 본 발명은 적응적 코드북의 집중 상태를 가속화시키므로써 CELP 서치 루프이 적응적 코드북의 피치 펄스 구조를 강화시키는 CELP 코더의 CELP 서치 루프에 사용하기 위한 피치 펄스 강화기(pitch pulse enhancer)및 그 사용 방법을 제공한다. 이것은 부분적으로 피치 펄스 강화기가 입력된 통화의 음성 메저(voicing measure)에 적응성이 있기 때문이다. 본 발명의 또 다른 장점들은 다음 설명에서 제시될 것이다.
구체적으로 기술되는 본 발명에 따르면, 입력 신호를 코딩시키기 위한 CELP 서치 루프는, 여기 벡터들의 가변 세트를 격납하기 위한 적응적 코드북 수단; 상기 여기 벡터들의 고정 세트를 격납하기 위한 고정 코드북 수단;최적의 적응적 코드북 여기 벡터를 결정하기 위해 적응적 코드북을 서치하고 최적의 고정 코드북 여기 벡터를 결정하기 위해 고정 코드북을 서치하기 이한 코드북 서치수단; 최적의 적응적 코드북 여기 벡터와 최적의 고정 코드북 여기 벡터로부터 전체 여기 벡터를 생성하기 위한 전체 여기 벡터 생성 수단; 입력 신호의 음성 메저를 결정하기 위한 음성 메저 결정 수단을 구비하며, 상기 음성 메저는 입력 신호가 음성화된 통화를 포함할때 음성화되고 입력 신호가 음성화된 통화를 포함하지 않을때 음성화되지 않으며; 입력 신호의 음성 메저에 따라 전체 여기 벡터를 변형시키기 위한 변형 수단; 및 상기 변형된 전체 여기 벡터를 상기 적응적 코드북 수단에 격납하여 적응적 코드북 수단을 갱신시키기 위한 갱신 수단 등을 포함한다.
구체적으로 기술되는 본 발명의 다른 특징에 따르면, CELP 서치 루프에 사용하기 위한 적응적 피치 벌스 강화기가 제공되는데, 상기 CELP 서치 루프는, 격납된 여기 벡터들의 가변 세트를 갖는 적응적 코드북; 격납된 여기 벡터들이 고정 세트를 갖는 고정 코드북; 최적의 적응적 코드북 여기 벡터를 결정하기 위해 적응적 코드북을 서치하기 위한 적응적 코드북 서치 루프; 및 최적이 고정 코드북 여기 벡터를 결정하기 위해 고정 코드북을 서치하기 위한 고정 코드북 서치 루프등을 포함하고, 또한 상기 CELP 서치 루프는, 최적의 적응적 코드북 여기 벡터와 최적이 고정 코드북 여기 벡터로부터 전체 여기 벡터를 생성하며, 상기 적응적 피치 펄스 강화기는 입력 신호의 음성 메저를 결정하기 위한 음성 메저 결정 수단을 구비하며, 상기 음성 메저는 입력 신호가 음성화된 통화를 포함할때 음성화되고 입력 신호가 음성화된 통화를 포함하지 않을때 음성화되지 않고; 입력 신호의 음성 메저에 따라 전체 여기 벡터를 변형시키기 위한 변형 수단; 및 상기 변형된 전체 여기 벡터를 적응적 코드북에 격납하여 적응적 코드북을 갱신시키기 위한 갱신 수단 등을 포함한다.
구체적으로 기술되는 본 발명이 또 다른 특징에 따르면, CELP 서치 루프를 사용하여 입력 신호를 코딩시키는 방법은, 여기 벡터들의 가변 세트를 적응적 코드북에 격납하기 위한 단계; 상기 여기 벡터들의 고정 세트를 고정 코드북에 격납하기 위한 단계; 최적의 적응적 코드북 여기 벡터 결정하기 위해 적응적 코드북을 서치하기 위한 단계; 최적의 고정 코드북 여기 벡터를 결정하기 위해 고정 코드북을 서치하기 위한 단계; 최적의 적응적 코드북 여기 벡터와 최적의 고정 코드북 여기 벡터로부터 전체 여기 벡터를 생성하는 단계; 입력 신호의 음성 메저를 결정하는 단계를 포함하며, 상기 음성 메저는 입력 신호가 음성화된 통화를 포함할때 음성화되고 입력 신호가 음성화된 통화를 포함하지 않을때 음성화되지 않으며; 입력 신호의 음성 메저에 따라 전체 여기 벡터를 변형시키는 단계; 및 상기 변형된 전체 여기 벡터를 적응적 코드북 수단에 격납하여 적응적 코드북 수단을 갱신시키기 위한 갱신 수단 등을 포함한다.
구체적으로 기술되는 본 발명의 또다른 특징에 따르면, 격납된 여기 벡터들의 가변 세트를 갖는 적응적 코드북; 격납된 여기 벡터들의 고정 세트를 갖는 고정 코드북; 최적의 적응적 코드북 여기 벡터 결정하기 위해 적응적 코드북을 서치하기 위한 적응적 코드북 서치 루프; 및 최적의 고정 코드북 여기 벡터를 결정하기 위해 고정 코드북을 서치하기 위한 고정 코드북 서치 루프등을 포함하고, 최적의 적응적 코드북 여기 벡터와 최적의 고정 코드북 여기 벡터로부터 전체 여기 벡터를 생성하는 CELP 서치 루프에 있어서, 적응적 코드북의 피치 펄스 구조를 강화시키는 방법은, 입력 신호의 음성 메저를 결정하는 단계를 포함하며, 상기 음성 메저는 입력 신호가 음성화된 통화를 포함할때 음성화되고 입력 신호가 음성화된 통화를 포함하지 않을때 음성화되지 않고; 입력 신호의 음성 메저에 따라 전체 여기 벡터를 변형시키는 단계; 및 상기 변형된 전체 여기 벡터를 적응적 코드북에 격납하여 적응적 코드북 수단을 갱신하는 단계 등을 포함한다.
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명하고자 한다.
제1도에 도시된 바와 같이, 본 발명의 교시를 포함하는 CELP 서치 루프(10)이 제공된다. CELP 서치 루프(10)은 프리프로세서(20), 감산기(30, 40 및 50), 선형 예측 필터(60), 적응적 코드북(780), 고정 코드부(80), 승산기(90와 100), 가산기(110), 가중 필터(120과 130), 합산기9140, 150), 서브프레임 지연 회로(160), 피치 펄스 강화기(170), 리스케일러(rescaler ; 180) 및 음성 메저러(measurer;190)등을 포함한다.
양호하게는, 제1도의 CELP 서치 루프(10)은, 본 기술 분야의 숙련자에게 잘 알려진 바와 같이, 텍사스인스트루먼츠사의 TMS320C30과 같은 디지탈 신호 프로세서에 의해 처리될 수 있는 펌웨어(firmware)를 포함한다. 제1도에 선형 예측 필터(60)가 3개의 개별 기능 블록으로 되어 있지만, 선형 예측 필터(60)은 단일 기능 유니트를 포함하는 것으로 이해해야 한다. 또한, 본 기술 분야의 숙련자에게 잘 알려져 있듯이, 점선으로 도시되어 있는 서브프레임 지연 회로(160)은 개념적 기능 블록이라는 것을 이해해야 한다.
이제, CELP 서치 루프(10)의 동작에 대해, 제1도의 블록도 그리고 제3(a)도 및 제3(b)도의 흐름도(1000)을 참조하여 상세히 설명하고자 한다. CELP 서치 루프(10)은, 양호하게 서브프레임 단위로 동작한다. 다시 말하면, 흐름도(1000)의 각각의 패스는 단일 서브프레임마다 디지탈화된 데이타의 서브프레임들의 순차로 행해진다. 더우기, 각각의 서브프레임은 입력된 아날로그 통화 신호의 40개의 샘플들의 블록을 포함한다.
제3(a0도 및 제3(b)도를 참조하며, 단계(S1010)에서는 n개의 서브프레임들의 순차중에서 디지탈화된 데이타의 n번째 서브프레임인이 입력된 디지탈화된 통화 신호 S(n)은 프리프로세서(20)에 의해 전처리된다.
양호하게는, 프리프로세서(20)가 본 기술 분야에 숙련자에게 잘 알려져 있는 바와 같이, S(n)을 하이패스 필터링하여 S'(n)을 생성하기 위한 하이패스 필터를 포함한다. 그 다음, 단계(S1020)으로 패스들을 제어한다.
단계(S1020)에서는 본 기술 분야의 숙련자에게 잘 알려져 있는 바와 같이, 선형 예측 필터(60)의 링 다운(ring down), 즉 제로-입력 응답이 S'(n)으로부터 감산되어 S∼(n)으로 된다. 그 다음에, 단계(S1030)으로 패스들을 제어한다.
단계(S1030)에서는 적응적 코드북 서치 루틴이 행해져서, 적응적 코드북(70)의 내용이 순차적으로 서치되고 분석되어, 선형 예측 필터(60)에 의해 처리될 때 거의 S∼(n)에 가장 가깝게 닮은 최적의 적응적 코드북 여기 벡터가 선택된다.
특히, 적응적 코드북(70)은 여기 벡터 VAm(n)[여기서, m은 1 내지 p이고, 적응적 코드북(70)내의 위치에 대응한다]들의 가변 세트를 격랍하지 위한 P위치들을 갖는 테이블을 포함한다. 이들 여기 벡터들은 대응하는 적응적 코드북 인댁스 ACindexm(n)에 따라 적응적 코드북(70)으로 부터 순차적으로 판독된다.
각각의 여기 벡터 VAm(n)이 적응적 코드북(70)으로 부터 판독될때, 승산기(90)에서 대응하는 GAm(n)만큼 승산된 다음 선형 예측 필터(60)에 인가된다. 선형 예측 필터(60)은 예를 들어, 본 기술 분야의 숙련자에게 잘 알려져 있는 바와 같이, 인입 여기 벡터를 합성된 통화 신호 SAm(n)으로 처리하는 전-극(all-pole)필터를 포함한다.
다음에, 합성된 통화 신호 SAm(n)은 감산기(40)에서 S∼(n)으로부터 감산되어 차 신호 DAm(n)로 된다.
차 신호 DAm(n)은, 여기 벡터 VAm(n)이 이득 GAm(n)만큼 승산되고 선형 예측 필터(60)에 의해 처리될때, S∼(n)과 어느 정도 근접한지를 나타내는 표시라는 것을 알 수 있다. 특히, 차 신호 DAm(n)이 작을수록, 여기 벡터 VAm(n)과 S∼(n)은 거의 같아진다. 이어서 이러한 차 신호는 가중 필터(120)에 의해 가중된 다음에 합산기(140)에 의해 서브프레임 S(n)의 길이에 합산된다. 합산기(140)의 출력은 본 기술 분야의 숙련자에게 잘 알려져 있는 바와 같이, 적응적 코드북 인댁스 ACindexm(n)을 변화시켜 적응적 코드북(70)으로 부터 다음 여기 벡터를 선택하도록 사용된다.
상기 적응적 코드북 서치 루틴은, 벡터 VAp(n) 내지 VAp(n)들 각각이 적응적 코드북(70)으로 부터 판독되고, 승산기(70)에서 각각의 이득만큼 슨상되며, 선형 예측 필터(60)에 의해 처리되고, S∼(n)과 비교될때까지 계속된다. 적응적 코드북 서치 루틴이 완료시에, 최적의 적응적 코드북 여기 벡터, 즉 각각의 이득만큼 승산되어 선형 예측 필터(60)에 의해 처리될때 거의 S∼(n)과 같은 여기 벡터 VAp(n) 내지 VAp(n)들은 가산기(110)에 인가된다. 최적의 적응적 코드북 여기 벡터는, 감산기(40)에서 각각의 여기 벡터 VAp(n) 내지 VAp(n)에 대하여 생성딘 차 신호들을 비교하여, 최소의 차 신호를 생성하는 여기 벡터를 선택하므로써 구해질 수 있다. 제1도에 도시된 바와 같이,최적의 적응적 코드북 여기 벡터는 VAopt(n)으로 표시된다. 그 다음, 단계(S1040)으로의 패스들을 제어한다.
단계(S1040)에서는, 적응적 코드북 잔재 신호, 즉 최적의 적응적 코드북 여기 벡터VAopt(n)에 대응하는 합성된 통화 신호를 감산기(40)에서 S∼(n)으로부터 감산하므로써 생성된 차 신호가 감산기(50)에 제공된다. 제1도에서 도시된 바와 같이, 이 잔재 신호는 R(n)으로 표시된다. 단계(S1040)의 완료 후에, 단계(S1050)으로 패스들을 제어한다.
단계(S1050)에서는, 고정 코드북 서치 루틴이 행해져서, 고정 코드북(80)의 내용이 순차적으로 서치되고 분석되어, 선형 예측 필터(60)에 의해 처리될때 거이 잔새 신호 R(n)와 거의 같게 되는 최적의 고정 코드북 여기 벡터가 선택된다. 다음 설명으로부터 명백한 바와 같이, 고정 코드북 서치 루틴은 적응적 코드북 서치 루틴과 어느 정도 유사함을 알 수 있을 것이다.
특히, 고정 코드북(80)은 여기 벡터 VFd(n)[여기에, d는 1내지 r이고, 고정 코드북(80)내의 위치에 대응한다]들의 고정 세트를 격납하기 이한 r위치들을 갖는 테이블을 포함한다. 이들 여기 벡터들은 대응하는 고정 인댁스 FCindexm(n)에 따라 적응적 코드북(80)으로 부터 순차적으로 판독된다.
각각의 여기 벡터 VFd(n)이 적응적 코드북(80)으로 부터 판독될때, 승산기(100)에서 대응하는 GFd(n)만큼 승산된 다음에 선형 예측 필터(60)에 인가된다. 앞에서 적응적 코드북 서치 루틴과 관련하여 설명한 바와 같이, 선형 예측 필터(60)은 예를 들어, 본 기술 분야의 숙련자에게 잘 알려져 있는 바와 같이, 인입 여기 벡터를 합성된 통화 신호 SFd(n)으로 처리하는 전-극(all-pole)필터를 포함한다.
다음에, 합성된 통화 신호 SFd(n)은 감산기(50)에서 잔재신호 R(n)으로 부턱 감산되어, 차 신호 DFd(n)을 생성한다. 또한, 적응적 코드북 서치 루틴이 경우에서와 같이, 차 신호 DFd(n)은, 여기 벡터 VFd(n)이 이득 GFd(n)만큼 승산되고 선형 예측 필터(60)에 의해 처리될때, R(n)과 어느 정도 근접한지를 나타내는 표시라는 것을 알 수 있다. 이러한 차 신호는 가중 필터(130)에 의해 가중된 다음에 합산기(150)에 의해 서브프레임 S(n)의 길이에 합산된다. 합산기(150)의 출력은 본 기술 분야의 숙련자에게 잘 알려져 있는 바와 같이, 고정 코드북 인댁스 FCindexd(n)을 변화시켜 고정 코드북(80)으로 부터 다음 여기 벡터를 선택하도록 사용된다.
상기 고정 코드북 서치 루틴은, 벡터 VFl(n) 내지 VFr(n)들 각각이 고정 코드북(80)으로 부터 판독되고, 승산기(100)에서 각각의 이득만큼 승산되며, 선형 예측 필터(60)에 의해 처리되고, 잔재 신호 R(n)과 비교될때까지 계속된다. 고정 코드북 서치 루틴이 완료시에, 최적의 고정 코드북 여기 벡터, 즉 각각의 이득만큼 승산되어 선형 예측 필터(60)에 의해 처리될때 거의 잔재 신호 R(n)과 같은 여기 벡터 VFl(n) 내지 VFr(n)들은 가산기(110)에 인가된다. 앞에서 적응적 코드북 서치 루틴과 관련하여 설명한 바와 같이, 최적의 고정 코드북 여기 벡터 VFl(n) 내지 VFr(n)에 대하여, 감산기(50)에서 생성된 차 신호들을 비교하여, 최소의 차 신호를 생성하는 여기 벡터를 선택하므로써 구해질 수 있다. 제1도에 도시된 바와 같이, 최적의 고정 코드북 여기 벡터는 VAopt(n)으로 표시된다. 그 다음, 단계(S1050)의 완료후에 단계(S1060)으로 패스들을 제어한다.
단계(S1060)에서는, 최적의 적응적 코드북 여기 벡터VAopt(n)과 최적의 고정 코드북 여기 벡터VFopt(n)가 함께 가산기(110)에 가산되어 전체 여기 벡터 X(n)을 생성한다.
단계(S1070)에서는, 전체 여기 벡터 X(n)은 비선형 함수를 사용하여 피치 펄스 강화기에 의해 변형되어, 다음과 같이 Y∼(n)을 생성한다.
여기서, PEFACT는 피치 강화 계수이고, 양호하게는 1보다 크거나 같은 양수이다.
후술하는 바와 같이, 피치 강화 계수 PEFACT는 음성 메저러(190)에 의해 결정된 음성 메저 VM(n)에 적응성이 있다.
단계(S1070)는 제2도의 블록도와 제4도의 흐름도(2000)을 참조하여 상세히 설명된다.
제2도에 도시된 바와 같이, 제1도의 음성 메저러(190)은 평균 피치 예측 이득 유니트(200), 평균 피치 래그 편차 유니트(210), 평균 적응적 코드북 이득 유니트(220)및 분류 논리 회로(230)등을 포함한다.
제4도를 참조하면, 후술하는 바와 같이, 단계(S2020, S2040 및 S2060)들에서는 평균 피치 예측 이득 유니트(200), 평균 피치 래그 편차 유니트(210)및평균 적응적 코드북 이득 유니트(220)이 여러가지 파라메타들을 결정한다. 단계(S2030, S2050 및 S2070)들에서, 이들 파라메타는 분류 논리 회로(230)에 의해 각각의 임계값들과 비교되어 서브프레임 S(n)의 음성 메저VM(n)을 결정한다. 음성 메저 VM(n)은 서브프레임 S(n)내에 음성화된 통화의 부재[음성화되지 않음; VM(n) = 0] 또는 존재[음성화됨; VM(n) = 1] 를 나타낸다는 것을 주목해야 한다.
단계(S2010)에서는, 음성 메저러(190)는 피치 강화 계수 PEFACT를 초기화시킨다. 양호하게는, 피치 강화 계수 PEFACT이 1이 되도록 최기화된다. 그 다음에, 단계(S2020)으로 패스들을 제어한다.
단계(S2020)에서는, 평균 피치 예측 이득 유니트(200)은 평균 피치 예측 이득 APG를 결정한다. 특히, 평균 피치 예측 이득 유니트(200)은 입력 신호들로서 전체 여기 벡터 X(n)과 적응적 코드북 여기 벡터 VAm(n)을 수신하고, 다음과 같이 평균 피치 예측 이득(PG)를 결정한다 :
여기서, N은 서브프레임 S(n)의 프레임 길이이고, 상술한 바와 같이, 양호하게는 40개의 샘플들에 달한다. 그 다음에, 평균 피치 예측 이득 유니트(200)은 M개의 서브프레임에 대해 피치 예측 이득(PG)를 평균화시키므로써 평균 피치 예측 이득 APG를 결정한다.
양호하게, M은 5 내지 10개의 서브프레임들이다. 단계(S2020)의 완료후에, 단계(S2030)으로 패스들을 제어한다.
단계(S2030)에서는, 분류 논리 회로(230)은 평균 피치 예측 이득(APG)를 제1 피치 예측 이득 APGthresh1에 비교한다. APGthresh1의 값이 본 발명의 응용에 따라 좌우되고, 본 기술 분야의 숙련자에 의해 결정될 수 있다는 것을 알 수 있다. 분류 논리 회로(230)이, APG가 APGthresh1보다 크다는 것을 결정하면, 단계(S2090)으로 패스들을 제어하는데, 여기에서 분류 논리 회로(230)은 음성 메저 VM(n)을 1[서브프레임 S(n)이 음성화되었다는 것을 표시]로 설정한 다음에, 단계(S2100)으로 패스들을 제어한다. 그렇지 않으면, 단계(S2040)으로 패스들을 제어한다.
단계(S2040)에서는, 평균 피치 래그 편차 유니트(210)가 평균 피치 래그 편차(APD)를 결정한다. 특히, 평균 피치 래그 편차 유니트(210)은 입력 신호로서 적응적 코드북 인댁스 ACindexm(n)을 수신하고 평균 피치 래그 편차APD를 다음과 같이 결정한다.
여기서, M은 평균이 취해지는 서브프레임들의 수이고, NINT는 최인접 정수 함수이며(nearest integer function), d(i)는 다음과 같이 결정된다:
여기서, MACindexm=Median[ACindexm(i), Oi)=1, 2, ....M]. 단계(S2040)의 완료후에, 단계(S2050)으로 패스들을 제어한다.
단계(S2050)에서는, 분류 논리 회로(230)은 평균 피치 래그 편차 APD를 제1 피치 래그 임계 APDthresh1에 비교한다. APDthresh1의 값이 본 발명의 응용에 따라 좌우되고, 본 기술 분야의 숙련자에 의해 결정될 수 있다는 것을 알 수 있다. 분류 논리 회로(230)이, APD가 APDthresh1보다 작다는 것을 결정하면, 단계(S2090)으로 패스들을 제어하는데, 여기에서 분류 논리 회로(230)은 음성 메저 VM(n)을 1[서브프레임 S(n)이 음성화되었다는 것을 표시]로 설정한 다음에, 단계(S2100)으로 패스들을 제어한다. 그렇지 않으면, 단계(S2060)으로 패스들을 제어한다.
단계(S2060)에서는, 평균 적응적 코드북 이득 유니트(220)가 평균 적응적 코드북 이득(ACG)를 결정한다. 특히, 평균 적응적 코드북 이득 유니트(220)은 입력 신호로서 적응적 코드북 이득 GAm(n)을 수신하고 평균 적응적 코드북 이득(ACG)를 다음과 결정한다.
여기서, 상술한 바와 같이, M은 평균이 취해지는 서브프레임들의 수이다. 이어서 단계(S2070)으로 패스들을 제어한다.
단계(S2070)에서는, 분류 논리 회로(230)은 평균 피치 예측 이득을 제2 피치 이득 임계 APGthresh2에 비교하고, 평균 피치 래그 편차(APD)를 제2피치 래그 임계 APGthresh2에 비교하여, 평균 적응적 코드북 이득 ACG를 제1적응적 코드북 이득 임계 ACGthresh1에 비교한다. 이들 임계값들은 본 발명의 응용에 따라 좌우되고 본 기술 분야의 숙련자에 의해 결정될 수 있다는 것을 알 수 있다.
분류 논리 회로(230)이, APG가 APGthresh12보다 크고, APD가 APDthresh11보다 작으며, ACG가 ACGthresh11보다 크다는것을 결정하면, 단계(S2090)으로 패스들을 제어하는데, 여기에서 분류 논리 회로(230)은 음성 메저 VM(n)을 1[서브프레임 S(n)이 음성화되었다는 것을 표시]로 설정한 다음에, 단계(S2100)으로 패스들을 제어한다. 그렇지 않으면, 단계(S2080)으로 패스들을 제어한다.
단계(S2080)에서는, 분류 논리 회로(230)은 음성 메저 VM(n)을 0으로 설정한다. 상술한 바와 같이, 이것은 서브프레임 S(n)이 음성화되지 않았다는 것을 표시한다. 그 다음에, 단계(S2100)으로 패스들을 제어한다.
단계(S2100)에서는, 피치 펄스 강화기(170)은 음성 메저 VM(n)에 따라서 피치 강화 계수 PEFACT를 다음과 같이 갱신한다 :
양호하게, PEFACT의 범위는 1.05/PEFACT/1.18로 고정된다. PEFACT의 상기 값들은 본 기술 분야에 잘 알려져 있는 바와 같이, 본 발명의 특정 응용에 적합하도록 적절히 변형될 수 있다는 것을 알 수 있다. 단계(S2100)의 완료후에, 단계(S2110)으로 패스들을 제어한다.
단계(S2110)에서는, 피치 펄스 강화기는 전체 여기 벡터 X(n)변형시켜, 상기 식 1.0에 도시된 바와 같이 Y∼(n)을 생성한다. 그 다음에, 제3(b)도의 단계(S1080)으로 패스들을 제어한다.
음성 메저러(190)의 설명에서 명백히 알 수 있듯이, 서브프레임 S(n)이 음성 메저는 합성 파라메타만에 의해 결정되기 때문에 음성 정보를 CELP 서치 루프(10)의 합성측에 확실히 전달할 필요성을 제거한다.
다시 제1도의 블록도와 제3(a)∼제3(b)도의 흐름도(1000)를 참조하면, 단계(S1080)에서, 리스케일러(180)은 Y∼(n)을 리스케이럴 하여, 다음과 같이 Y(n)을 생성한다.
여기에서,
이다.
또한, N은 서브프레임 S(n)의 프레임 길이이다. 단계(S1080)은 전체 여기 벡터 X(n)의 에너지 레벨을 Y(n)으로 유지하기 위해 제공된다는 것을 알 수 있다. 특히, 단계(S1070)은 전체 여기 벡터 X(n)의 전체 에너지 레벨을 변경시키는 효과를 갖고 있고, 단계(S1080)은 Y∼(n)의 전체 에너지를 상기 레벨로 재저장한다.
단계(S1080)의 완료후에, 단계(S1090)으로 패스들을 제어한다.
단계(S1090)에서는, 리스케일러는 Y(n)을 사용하여 적응적 코드북(70)을 갱신시킨다. 특히, Y(n)은 후속 입력 서브프레임, 즉 입력 신호 S(n+1)을 처리하기 위해 새로운 여기 벡터로서 적응적 코드북(70)내에 격납된다. 양호하게, Y(n)은 적응적 코드북(70)의 최종 위치, 즉 위치 p에 격납되므로, 앞의 위치들에 격납된 여기 벡터들을 앞쪽으로 이동시키고, 제1위치에 격납된 벡터를 제거한다. 단계(S1090)의 완료후에, 단계(S1010)으로 패스들을 제어하는데, 여기에서 제3(a)∼제3(b)도의 전체 공정은 후속 입력 서브프레임S(n+1)에 대해 수행된다.
본 발명의 추가적인 장점들과 변형은 본 분야의 숙련자들에게는 쉽게 이해될 것이다. 그러므로, 본 발명의 광범이한 특징은, 특정 설명, 대표적 장치 및 도시되고 기술된 예시적인 예들로 국한되지 않는다. 따라서, 본 발명의 개념 및 범위를 벗어나지 않는 한동서 다양한 변형이 가능하다.
Claims (5)
- 코드북 수단을 서치하여 최적의 코드북 여기 벡터들을 결정하기 위한 코드북 수단; 음성 메저(voicing measure)가 입력 신호가 음성화된 통화를 포함하고 있을때 음성화되고 입력 신호가 음성화된 통화를 포함하고 있지 않을때 음성화되지 않는, 입력 신호의 음성 메저를 결정하기 위한 음성 메저 결정수단; 및 상기 입력 신호의 음성 메저에 따라 상기 최적의 코드북 여기 벡터들로부터 전체 여기 벡터를 변형시키기 위한 변형 수단을 포함하는 것을 특징으로 하는 입력 신호를 코딩하기 위한 CELP 서치 루프.
- 제1항에 있어서, 상기 코드북 수단이 가변 세트를 격납하기 위한 적응적 코드북 수단과, 여기 벡터들의 고정 세트를 격납하기 위한 고정 코드북 수단을 더 포함하고; 상기 코드북 서치 수단이 최적의 적응적 코드북 여기 벡터를 결정하기 위해 적응적 코드북 수단을 서치하기 위한 수단, 최적의 고정 코드북 여기 벡터를 결정하기 위해 고정 코드북을 서치하기 위한 수단및 상기 최적의 적응적 코드북 여기 벡터와 최적의 고정 코드북 여기 벡터로부터 전체 여기 벡터를 생성하기 위한 전체 여기 벡터 생성 수단을 포함하며; 상기 CELP 서치 루프가, 상기 적응적 코드북 수단에 상기 변형된 전체 여기 벡터를 겨납하여 상기 적응적 코드북 수단을 갱신시키기 위한 갱신 수단을 더 포함하는 것을 특징으로 하는 입력 신호를 코딩하기 위한 CELP 서치 루프.
- 제1항 또는 제2항에 있어서, 상기 음성 메저를 결정 수단이, 상기 전체 여기 벡터와 상기 적응적 코드북 여기 벡터로부터 평균 피치 예측 이들을 결정하기 위한 평균 피치 예측 이득 결정수단; 상기 적응적 코드북 수단의 인댁스로부터 평균 피치 래그 편차(average pitch lag deviation)을 결정하기 위한 평균 피치 래그 편차 결정 수단; 적응적 코드북 이득으로부터 평균 적응적 코드북 이득을 결정하기 위한 평균 적응적 코드북 이득 결정수단; 및 상기 음성 메저를 결정하기 위해 상기 평균 피치 예측 이들을 결정하기 위한 상기 평균 피치 예측 이득, 상기 평균 피치 래그 편차및 상기 평균 적응적 코드북 이득을 각각의 임계값들과 비교하기 위한 논리수단을 포함하는 것을 특징으로 하는 입력 신호를 코딩하기 위한 CELP 서치 루프.
- 제1항에 있어서, 상기 변형 수단이 비선형 함수를 사용하여 상기 전체 여기 벡터를 변형시키기 위한 수단을 포함하는 것을 특징으로 하는 입력 신호를 코딩하기 위한 CELP 서치 루프.
- 제2항에 있어서, 상기 갱신 수단이 상기 변형된 전체 여기 벡터의 에너지 레벨을 유지하기 위해 상기 변형딘 전체 여기 벡터를 리스케일링 하기 위한 리스케일링 수단을 포함하는 것을 특징으로 하는 입력 신호를 코딩하기 위한 CELP 서치 루프.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US97044792A | 1992-11-02 | 1992-11-02 | |
US07/970,447 | 1992-11-02 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR940012931A KR940012931A (ko) | 1994-06-24 |
KR960013961B1 true KR960013961B1 (ko) | 1996-10-10 |
Family
ID=25516958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019930022970A KR960013961B1 (ko) | 1992-11-02 | 1993-11-01 | 코드북 여기 선형 예측 서치 루프에 사용하기 위한 적응적 피치 펄스 강화기 및 그 사용 방법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US5528727A (ko) |
EP (1) | EP0596847A3 (ko) |
JP (1) | JPH06214599A (ko) |
KR (1) | KR960013961B1 (ko) |
AU (1) | AU654094B2 (ko) |
CA (1) | CA2108623A1 (ko) |
FI (1) | FI934615A (ko) |
NO (1) | NO933940L (ko) |
TW (1) | TW242724B (ko) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
KR100389895B1 (ko) * | 1996-05-25 | 2003-11-28 | 삼성전자주식회사 | 음성 부호화 및 복호화방법 및 그 장치 |
US5799271A (en) * | 1996-06-24 | 1998-08-25 | Electronics And Telecommunications Research Institute | Method for reducing pitch search time for vocoder |
US6058359A (en) * | 1998-03-04 | 2000-05-02 | Telefonaktiebolaget L M Ericsson | Speech coding including soft adaptability feature |
CA2722196C (en) | 1997-12-24 | 2014-10-21 | Mitsubishi Denki Kabushiki Kaisha | A method for speech coding, method for speech decoding and their apparatuses |
US6470309B1 (en) * | 1998-05-08 | 2002-10-22 | Texas Instruments Incorporated | Subframe-based correlation |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US6714907B2 (en) | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
US6556966B1 (en) | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6449313B1 (en) * | 1999-04-28 | 2002-09-10 | Lucent Technologies Inc. | Shaped fixed codebook search for celp speech coding |
US6704701B1 (en) * | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
KR100546758B1 (ko) * | 2003-06-30 | 2006-01-26 | 한국전자통신연구원 | 음성의 상호부호화시 전송률 결정 장치 및 방법 |
US7536298B2 (en) | 2004-03-15 | 2009-05-19 | Intel Corporation | Method of comfort noise generation for speech communication |
KR100795727B1 (ko) * | 2005-12-08 | 2008-01-21 | 한국전자통신연구원 | Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법 |
RU2462769C2 (ru) * | 2006-10-24 | 2012-09-27 | Войсэйдж Корпорейшн | Способ и устройство кодирования кадров перехода в речевых сигналах |
EP2099025A4 (en) * | 2006-12-14 | 2010-12-22 | Panasonic Corp | AUDIO CODING DEVICE AND AUDIO CODING METHOD |
PL3058569T3 (pl) * | 2013-10-18 | 2021-06-14 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Koncepcja kodowania sygnału audio i dekodowania sygnału audio z wykorzystaniem informacji deterministycznych i podobnych do szumu |
JP6366706B2 (ja) * | 2013-10-18 | 2018-08-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スピーチ関連のスペクトル整形情報を使用したオーディオ信号符号化と復号化の概念 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4910781A (en) * | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
US5138661A (en) * | 1990-11-13 | 1992-08-11 | General Electric Company | Linear predictive codeword excited speech synthesizer |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
-
1993
- 1993-10-18 CA CA002108623A patent/CA2108623A1/en not_active Abandoned
- 1993-10-19 FI FI934615A patent/FI934615A/fi unknown
- 1993-10-25 AU AU50336/93A patent/AU654094B2/en not_active Ceased
- 1993-10-29 EP EP93850206A patent/EP0596847A3/en not_active Withdrawn
- 1993-11-01 KR KR1019930022970A patent/KR960013961B1/ko active IP Right Grant
- 1993-11-01 NO NO933940A patent/NO933940L/no unknown
- 1993-11-02 JP JP5274406A patent/JPH06214599A/ja active Pending
- 1993-11-02 TW TW082109136A patent/TW242724B/zh active
-
1995
- 1995-05-03 US US08/434,096 patent/US5528727A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0596847A2 (en) | 1994-05-11 |
US5528727A (en) | 1996-06-18 |
AU5033693A (en) | 1994-05-12 |
NO933940L (no) | 1994-05-03 |
AU654094B2 (en) | 1994-10-20 |
EP0596847A3 (en) | 1995-06-14 |
FI934615A0 (fi) | 1993-10-19 |
FI934615A (fi) | 1994-05-03 |
CA2108623A1 (en) | 1994-05-03 |
KR940012931A (ko) | 1994-06-24 |
TW242724B (ko) | 1995-03-11 |
JPH06214599A (ja) | 1994-08-05 |
NO933940D0 (no) | 1993-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR960013961B1 (ko) | 코드북 여기 선형 예측 서치 루프에 사용하기 위한 적응적 피치 펄스 강화기 및 그 사용 방법 | |
KR100417635B1 (ko) | 광대역 신호들 코딩에서 적응성 대역폭 피치 검색 방법 및디바이스 | |
US5933803A (en) | Speech encoding at variable bit rate | |
US6594626B2 (en) | Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook | |
US4852169A (en) | Method for enhancing the quality of coded speech | |
US5668925A (en) | Low data rate speech encoder with mixed excitation | |
KR100426514B1 (ko) | 복잡성이감소된신호전송시스템 | |
EP0762386A2 (en) | Method and apparatus for CELP coding an audio signal while distinguishing speech periods and non-speech periods | |
KR19980024631A (ko) | 음성 복호화 방법 및 장치 | |
KR20010024935A (ko) | 음성 코딩 | |
EP0450064B1 (en) | Digital speech coder having improved sub-sample resolution long-term predictor | |
KR100421648B1 (ko) | 음성코딩을 위한 적응성 표준 | |
US5173941A (en) | Reduced codebook search arrangement for CELP vocoders | |
AU669788B2 (en) | Method for generating a spectral noise weighting filter for use in a speech coder | |
EP1301018A1 (en) | Apparatus and method for modifying a digital signal in the coded domain | |
JPH11259100A (ja) | 励起ベクトルの符号化方法 | |
EP0660301B1 (en) | Removal of swirl artifacts from celp based speech coders | |
US5649051A (en) | Constant data rate speech encoder for limited bandwidth path | |
WO1997015046A9 (en) | Repetitive sound compression system | |
EP0856185A1 (en) | Repetitive sound compression system | |
EP0602826B1 (en) | Time shifting for analysis-by-synthesis coding | |
JPH0944195A (ja) | 音声符号化装置 | |
EP1083548A2 (en) | Method for gain control of a CELP speech decoder | |
EP0623916B1 (en) | A method and apparatus for implementing a long-term synthesis filter | |
GB2258978A (en) | Speech processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
NORF | Unpaid initial registration fee |