JP3541680B2 - 音声音楽信号の符号化装置および復号装置 - Google Patents
音声音楽信号の符号化装置および復号装置 Download PDFInfo
- Publication number
- JP3541680B2 JP3541680B2 JP16657398A JP16657398A JP3541680B2 JP 3541680 B2 JP3541680 B2 JP 3541680B2 JP 16657398 A JP16657398 A JP 16657398A JP 16657398 A JP16657398 A JP 16657398A JP 3541680 B2 JP3541680 B2 JP 3541680B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- linear prediction
- circuit
- audio
- music
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005284 excitation Effects 0.000 claims description 140
- 238000003786 synthesis reaction Methods 0.000 claims description 127
- 230000015572 biosynthetic process Effects 0.000 claims description 126
- 230000001131 transforming effect Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 description 280
- 238000013139 quantization Methods 0.000 description 63
- 238000010586 diagram Methods 0.000 description 50
- 238000005070 sampling Methods 0.000 description 42
- 238000004364 calculation method Methods 0.000 description 40
- 238000000034 method Methods 0.000 description 33
- 230000009466 transformation Effects 0.000 description 14
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、音声音楽信号を低ビットレートで伝送するための符号化装置および復号装置に関するものである。
【0002】
【従来の技術】
音声信号を中低ビットレートで高能率に符号化する方法として、音声信号を線形予測フィルタとその駆動音源信号(音源信号)に分離して符号化する方法が広く用いられている。
【0003】
その代表的な方法の一つにCELP(Code Excited Linear Prediction)がある。CELPでは、入力音声を線形予測分析して求めた線形予測係数が設定された線形予測フィルタを、音声のピッチ周期を表す信号と雑音的な信号との和で表される音源信号により駆動することで、合成音声信号(再生信号)が得られる。CELPに関してはM. Schroederらによる「Code excited linear prediction: High quality speech at very low bit rates」(Proc. ICASSP, pp.937-940, 1985 )(文献1)を参照できる。また、前記CELPを帯域分割構成とすることで、音楽信号に対する符号化性能を改善できる。この構成では、各帯域に対応する音源信号を加算して得られる励振信号で、線形予測合成フィルタを駆動することによって、再生信号を生成する。
【0004】
帯域分割構成のCELPに関しては、A. Ubaleらによる「Multi-band CELP Coding of Speech and Music」(IEEE Workshop on Speech Coding for Telecommunications, pp.101-102, 1997)(文献2)を参照できる。
【0005】
図31は従来の音声音楽信号符号化装置の一例を示すブロック図である。ここでは簡単のため、帯域数を2とする。音声または音楽信号をサンプリングし、この複数サンプルを1フレームとして一つのベクトルにまとめて生成した入力信号(入力ベクトル)は、入力端子10から入力される。
【0006】
線形予測係数計算回路170は、入力端子10から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、線形予測係数を求め、さらに前記線形予測係数を量子化し、量子化線形予測係数を求める。そして前記線形予測係数を重みづけフィルタ140と重みづけフィルタ141へ出力し、量子化線形予測係数に対応するインデックスを線形予測合成フィルタ130と線形予測合成フィルタ131および符号出力回路190へ出力する。
【0007】
第1の音源生成回路110は、第1の最小化回路150から出力されるインデックスを入力し、前記インデックスに対応する第1の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第1のゲイン回路160へ出力する。
【0008】
第2の音源生成回路111は、第2の最小化回路151から出力されるインデックスを入力し、前記インデックスに対応する第2の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第2のゲイン回路161へ出力する。
【0009】
第1のゲイン回路160は、第1の最小化回路150から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第3の音源ベクトルを生成し、前記第3の音源ベクトルを第1の帯域通過フィルタ120へ出力する。
【0010】
第2のゲイン回路161は、第2の最小化回路151から出力されるインデックスと第2の音源生成回路111から出力される第2の音源ベクトルとを入力し、前記インデックスに対応する第2のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第2のゲインと前記第2の音源ベクトルとを乗算し、第4の音源ベクトルを生成し、前記第4の音源ベクトルを第2の帯域通過フィルタ121へ出力する。
【0011】
第1の帯域通過フィルタ120は、第1のゲイン回路160から出力される第3の音源ベクトルを入力する。前記第3の音源ベクトルは、このフィルタにより第1の帯域に帯域制限され、第1の励振ベクトルを得る。第1の帯域通過フィルタ120は、前記第1の励振ベクトルを線形予測合成フィルタ130へ出力する。
【0012】
第2の帯域通過フィルタ121は、第2のゲイン回路161から出力される第4の音源ベクトルを入力する。前記第4の音源ベクトルは、このフィルタにより第2の帯域に帯域制限され、第2の励振ベクトルを得る。第2の帯域通過フィルタ121は、前記第2の励振ベクトルを線形予測合成フィルタ131へ出力する。
【0013】
線形予測合成フィルタ130は、第1の帯域通過フィルタ120から出力される第1の励振ベクトルと線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第1の励振ベクトルにより駆動することで、第1の再生信号(再生ベクトル)を得る。そして前記第1の再生ベクトルを第1の差分器180へ出力する。
【0014】
線形予測合成フィルタ131は、第2の帯域通過フィルタ121から出力される第2の励振ベクトルと線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第2の励振ベクトルにより駆動することで、第2の再生ベクトルを得る。そして前記第2の再生ベクトルを第2の差分器181へ出力する。
【0015】
第1の差分器180は、入力端子10を介して入力ベクトルを入力し、線形予測合成フィルタ130から出力される第1の再生ベクトルを入力し、それらの差分を計算し、これを第1の差分ベクトルとして、重みづけフィルタ140と第2の差分器181へ出力する。
【0016】
第2の差分器181は、第1の差分器180から第1の差分ベクトルを入力し、線形予測合成フィルタ131から出力される第2の再生ベクトルを入力し、それらの差分を計算し、これを第2の差分ベクトルとして、重みづけフィルタ141へ出力する。
【0017】
重みづけフィルタ140は、第1の差分器180から出力される第1の差分ベクトルと線形予測係数計算回路170から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタを生成し、前記重みづけフィルタを前記第1の差分ベクトルで駆動することで、第1の重みづけ差分ベクトルを得る。そして前記第1の重みづけ差分ベクトルを第1の最小化回路150へ出力する。
【0018】
重みづけフィルタ141は、第2の差分器181から出力される第2の差分ベクトルと線形予測係数計算回路170から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタを生成し、前記重みづけフィルタを前記第2の差分ベクトルで駆動することで、第2の重みづけ差分ベクトルを得る。そして前記第2の重みづけ差分ベクトルを第2の最小化回路151へ出力する。
【0019】
第1の最小化回路150は、第1の音源生成回路110に格納されている第1の音源ベクトル全てに対応するインデックスを、前記第1の音源生成回路110へ順次出力し、第1のゲイン回路160に格納されている第1のゲイン全てに対応するインデックスを、前記第1のゲイン回路160へ順次出力する。また、重みづけフィルタ140から出力される第1の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第1の音源ベクトルおよび前記第1のゲインを選択し、これらに対応するインデックスを符号出力回路190へ出力する。
【0020】
第2の最小化回路151は、第2の音源生成回路111に格納されている第2の音源ベクトル全てに対応するインデックスを、前記第2の音源生成回路111へ順次出力し、第2のゲイン回路161に格納されている第2のゲイン全てに対応するインデックスを、前記第2のゲイン回路161へ順次出力する。また、重みづけフィルタ141から出力される第2の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第2の音源ベクトルおよび前記第2のゲインを選択し、これらに対応するインデックスを符号出力回路190へ出力する。
【0021】
符号出力回路190は、線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスを入力する。また、第1の最小化回路150から出力される、第1の音源ベクトルおよび第1のゲインの各々に対応するインデックスを入力し、第2の最小化回路151から出力される、第2の音源ベクトルおよび第2のゲインの各々に対応するインデックスを入力する。そして各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0022】
図32は、従来の音声音楽信号復号装置の一例を示すブロック図である。入力端子30からビット系列の符号を入力する。
【0023】
符号入力回路310は、入力端子30から入力したビット系列の符号をインデックスに変換する。第1の音源ベクトルに対応するインデックスは、第1の音源生成回路110へ出力される。第2の音源ベクトルに対応するインデックスは、第2の音源生成回路111へ出力される。第1のゲインに対応するインデックスは、第1のゲイン回路160へ出力される。第2のゲインに対応するインデックスは、第2のゲイン回路161へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ130および線形予測合成フィルタ131へ出力される。
【0024】
第1の音源生成回路110は、符号入力回路310から出力されるインデックスを入力し、前記インデックスに対応する第1の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第1のゲイン回路160へ出力する。
【0025】
第2の音源生成回路111は、符号入力回路310から出力されるインデックスを入力し、前記インデックスに対応する第2の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第2のゲイン回路161へ出力する。
【0026】
第1のゲイン回路160は、符号入力回路310から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第3の音源ベクトルを生成し、前記第3の音源ベクトルを第1の帯域通過フィルタ120へ出力する。
【0027】
第2のゲイン回路161は、符号入力回路310から出力されるインデックスと第2の音源生成回路111から出力される第2の音源ベクトルとを入力し、前記インデックスに対応する第2のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第2のゲインと前記第2の音源ベクトルとを乗算し、第4の音源ベクトルを生成し、前記第4の音源ベクトルを第2の帯域通過フィルタ121へ出力する。
【0028】
第1の帯域通過フィルタ120は、第1のゲイン回路160から出力される第3の音源ベクトルを入力する。前記第3の音源ベクトルは、このフィルタにより第1の帯域に帯域制限され、第1の励振ベクトルを得る。第1の帯域通過フィルタ120は、前記第1の励振ベクトルを線形予測合成フィルタ130へ出力する。
【0029】
第2の帯域通過フィルタ121は、第2のゲイン回路161から出力される第4の音源ベクトルを入力する。前記第4の音源ベクトルは、このフィルタにより第2の帯域に帯域制限され、第2の励振ベクトルを得る。第2の帯域通過フィルタ121は、前記第2の励振ベクトルを線形予測合成フィルタ131へ出力する。
【0030】
線形予測合成フィルタ130は、第1の帯域通過フィルタ120から出力される第1の励振ベクトルと符号入力回路310から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第1の励振ベクトルにより駆動することで、第1の再生ベクトルを得る。そして前記第1の再生ベクトルを加算器182へ出力する。
【0031】
線形予測合成フィルタ131は、第2の帯域通過フィルタ121から出力される第2の励振ベクトルと符号入力回路310から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第2の励振ベクトルにより駆動することで、第2の再生ベクトルを得る。そして前記第2の再生ベクトルを加算器182へ出力する。
【0032】
加算器182は、線形予測合成フィルタ130から出力される第1の再生ベクトルと、線形予測合成フィルタ131から出力される第2の再生ベクトルを入力し、これらの和を計算し、これを第3の再生ベクトルとして、出力端子40を介して、出力する。
【0033】
【発明が解決しようとする課題】
問題点は、上述した従来の音声音楽信号符号化装置では、入力信号の低域に対応する帯域特性を有する励振信号と、前記入力信号の高域に対応する帯域特性を有する励振信号とを加算して得られる励振信号により、前記入力信号から求めた線形予測合成フィルタを駆動することで再生信号を生成する構成であることから、高周波数域に属する帯域においてCELPに基づく符号化を行うため、高周波数域に属する帯域において符号化性能が低下することにより、全帯域における音声音楽信号の符号化品質が劣化することである。
【0034】
その理由は、高周波数域に属する帯域における信号は、音声とは大きく異なる性質を有しているため、音声の生成過程をモデル化しているCELPでは高周波数域に属する帯域における信号を高精度に生成できないからである。本発明の目的は、上述の問題を解決し、音声音楽信号を全帯域にわたって良好に符号化できる音声音楽信号符号化装置を提供することである。
【0035】
【課題を解決するための手段】
本発明の第1の装置は、第1の帯域に対応する励振信号により入力信号から求めた線形予測合成フィルタを駆動することで第1の再生信号を生成し、入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第2の帯域に対応する成分を、直交変換後に符号化する。具体的には、第1の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1の再生信号を生成する手段(図1の110、160、120、130)と、入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成する手段(図1の180、230)と、前記残差信号における第2の帯域に対応する成分を直交変換後に符号化する手段(図1の240、250、260)とを有する。
【0036】
本発明の第2の装置は、第1と第2の帯域に対応する励振信号により、入力信号から求めた線形予測合成フィルタを駆動することで第1と第2の再生信号を生成し、前記第1と第2の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第3の帯域に対応する成分を、直交変換後に符号化する。具体的には、第1と第2の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1と第2の再生信号を生成する手段(図8の1001,1002)と、前記第1と第2の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第3の帯域に対応する成分を直交変換後に符号化する手段(図8の1003)とを有する。
【0037】
本発明の第3の装置は、第1から第N−1の帯域に対応する励振信号により、入力信号から求めた線形予測合成フィルタを駆動することで第1から第N−1の再生信号を生成し、前記第1から第N−1の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第Nの帯域に対応する成分を、直交変換後に符号化する。具体的には、第1から第N−1の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1から第N−1の再生信号を生成する手段(図9の1001、1004)と、前記第1から第N−1の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第Nの帯域に対応する成分を直交変換後に符号化する手段(図9の1005)とを有する。
【0038】
本発明の第4の装置は、第2の符号化において、第1の符号化復号信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第1の符号化復号信号と入力信号との差分を計算する手段(図11の180)と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段(図11の1002)とを有する。
【0039】
本発明の第5の装置は、第3の符号化において、第1と第2の符号化復号信号を加算した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第1と第2の符号化復号信号を加算した信号と入力信号との差分信号を計算する手段(図12の1801、1802)と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段(図12の1003)とを有する。
【0040】
本発明の第6の装置は、第Nの符号化において、第1から第N−1の符号化復号信号を加算した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第1から第N−1の符号化復号信号を加算した信号と入力信号との差分信号を計算する手段(図13の1801、1802)と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段(図13の1005)とを有する。
【0041】
本発明の第7の装置は、入力信号の第1の帯域に対応する励振信号を生成する際にピッチ予測フィルタを用いる。具体的には、ピッチ予測手段(図14の112、162、184、510)を有する。
【0042】
本発明の第8の装置は、第1のサンプリング周波数でサンプリングされた第1の入力信号を第2のサンプリング周波数にダウンサンプリングして第2の入力信号を生成し、前記第2の入力信号から求めた第1の線形予測係数が設定された合成フィルタを励振信号により駆動することで、第1の再生信号を生成し、前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより第2の再生信号を生成し、さらに、前記第1の入力信号から求めた線形予測係数と前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数との差分から第3の線形予測係数を計算し、前記第2の線形予測係数と前記第3の線形予測係数との和から第4の線形予測係数を計算し、前記第1の入力信号と前記第2の再生信号との差分信号により前記第4の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を、直交変換後に符号化する。具体的には、第1のサンプリング周波数でサンプリングされた第1の入力信号を第2のサンプリング周波数にダウンサンプリングして第2の入力信号を生成する手段(図15の780)と、前記第2の入力信号から求めた第1の線形予測係数が設定された合成フィルタを励振信号により駆動することで、第1の再生信号を生成する手段(図15の770、132)と、前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより第2の再生信号を生成する手段(図15の781)と、前記第1の入力信号から求めた線形予測係数と前記第1の線形予測係数と第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数との差分から第3の線形予測係数を計算する手段(図15の771、772)と、前記第2の線形予測係数と前記第3の線形予測係数との和から第4の線形予測係数を計算し、前記第1の入力信号と前記第2の再生信号との差分信号により前記第4の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成する手段(図15の180、730)と、前記残差信号における任意の帯域に対応する成分を、直交変換後に符号化する手段(図15の240、250、260)とを有する。
【0043】
本発明の第9の装置は、復号した直交変換係数を直交逆変換することにより、第2の帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第2の再生信号を生成し、さらに、復号した第1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1の再生信号を生成し、前記第1の再生信号と前記第2の再生信号を加算することで復号音声音楽を生成する。具体的には、復号信号と直交変換係数を直交逆変換することにより、第2の帯域に対応する励振信号を生成する手段(図16の440、460)と、線形予測合成フィルタを前記励振信号で駆動することにより第2の再生信号を生成する手段(図16の131)と、第1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1の再生信号を生成する手段(図16の110、120、130、160)と、前記第1の再生信号と前記第2の再生信号とを加算することで復号音声音楽を生成する手段(図16の182)とを有する。
【0044】
本発明の第10の装置は、復号した直交変換係数を直交逆変換することにより、第3の帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第3の再生信号を生成し、さらに、復号した第1と第2の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1と第2の再生信号を生成し、前記第1から第3の再生信号を加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、第3の帯域に対応する励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することより第3の再生信号を生成する手段(図22の1053)と、第1と第2の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1と第2の再生信号を生成する手段(図22の1051、1052)と、前記第1から第3の再生信号を加算することで復号音声音楽を生成する手段(図22の1821、1822)とを有する。
【0045】
本発明の第11の装置は、復号した直交変換係数を直交逆変換することにより、第Nの帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第Nの再生信号を生成し、さらに、復号した第1から第N−1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1から第Nn−1の再生信号を生成し、前記第1から第Nの再生信号を加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、第Nの帯域に対応する励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することより第Nの再生信号を生成する手段(図23の1055)と、第1から第N−1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1から第N−1の再生信号を生成する手段(図23の1051、1054)と、前記第1から第Nの再生信号を加算することで復号音声音楽を生成する手段(図23の1821、1822)とを有する。
【0046】
本発明の第12の装置は、第2の復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第1の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段(図24の1052)と、前記再生信号と第1の復号信号とを加算することで復号音声音楽を生成する手段(図24の182)とを有する。
【0047】
本発明の第13の装置は、第3の復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第1および第2の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段(図25の1053)と、前記再生信号と第1および第2の復号信号とを加算することで復号音声音楽を生成する手段(図25の1821、1822)とを有する。
【0048】
本発明の第14の装置は、第Nの復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第1から第N−1の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段(図26の1055)と、前記再生信号と第1から第N−1の復号信号とを加算することで復号音声音楽を生成する手段(図26の1821、1822)とを有する。
【0049】
本発明の第15の装置は、第1の帯域に対応する励振信号を生成する際にピッチ予測フに係るルタを用いる。具体的には、ピッチ予測手段(図27の112、162、184、510)を有する。
【0050】
本発明の第16の装置は、第1の帯域に対る第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を、第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、復号した直交変換係数を直交逆変換することにより、第2の帯域に対応する第2の励振信号を生成し、前記第2の励振信号により第2の線形予測合成フィルタを駆動することで第2の再生信号を生成し、前記第1の再生信号と前記第2の再生信号とを加算することで復号音声音楽を生成する。具体的には、第1の帯域に対応する第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を、第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成する手段(図28の132、781)と、復号した直交変換係数を直交逆変換することにより、第2の帯域に対応する第2の励振信号を生成し、前記第2の励振信号により第2の線形予測合成フィルタを駆動することで第2の再生信号を生成する手段(図28の440、831)と、前記第1の再生信号と前記第2の再生信号とを加算することで復号音声音楽を生成する手段(図28の182)とを有する。
【0051】
本発明17の装置は、本発明1の装置から出力される符号を、本発明9の装置で復号する。具体的には、音声音楽信号符号化手段(図1)と、音声音楽信号復号手段(図16)とを有する。
【0052】
本発明18の装置は、本発明2の装置から出力される符号を、本発明10の装置で復号する。具体的には、音声音楽信号符号化手段(図8)と、音声音楽信号復号手段(図22)とを有する。
【0053】
本発明19の装置は、本発明3の装置から出力される符号を、本発明11の装置で復号する。具体的には、音声音楽信号符号化手段(図9)と、音声音楽信号復号手段(図23)とを有する。
【0054】
本発明20の装置は、本発明4の装置から出力される符号を、本発明12の装置で復号する。具体的には、音声音楽信号符号化手段(図11)と、音声音楽信号復号手段(図24)とを有する。
【0055】
本発明21の装置は、本発明5の装置から出力される符号を、本発明13の装置で復号する。具体的には、音声音楽信号符号化手段(図12)と、音声音楽信号復号手段(図25)とを有する。
【0056】
本発明22の装置は、本発明6の装置から出力される符号を、本発明14の装置で復号する。具体的には、音声音楽信号符号化手段(図13)と、音声音楽信号復号手段(図26)とを有する。
【0057】
本発明23の装置は、本発明7の装置から出力される符号を、本発明15の装置で復号する。具体的には、音声音楽信号符号化手段(図14)と、音声音楽信号復号手段(図27)とを有する。
【0058】
本発明24の装置は、本発明8の装置から出力される符号を、本発明16の装置で復号する。具体的には、音声音楽信号符号化手段(図15)と、音声音楽信号復号手段(図28)とを有する。
【0059】
(作用)
本発明では、入力信号の低域に対応する帯域特性を有する励振信号により入力信号から求めた線形予測合成フィルタを駆動することで第1の再生信号を生成し、前記入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号の高域成分を、直交変換に基づく符号化方式を用いて符号化する。すなわち、高周波数域に属する帯域における、音声とは異なる性質を有する信号に対しては、CELPに代わり、直交変換に基づく符号化を行う。前記直交変換に基づく符号化は、音声と異なる性質を有する信号に対する符号化性能がCELPに比べて高い。このため、前記入力信号の高域成分に対する符号化性能が改善される。その結果、音声音楽信号を全帯域にわたって良好に符号化することが可能となる。
【0060】
【発明の実施の形態】
図1は、本発明の第1の実施例による音声音楽信号符号化装置の構成を示すブロック図である。ここでは、帯域数を2として説明する。音声または音楽信号をサンプリングし、この複数サンプルを1フレームとして一つのベクトルにまとめて生成した入力信号(入力ベクトル)は、入力端子10から入力される。入力ベクトルは、x(n),n=0,…,L−1と表される。ただし、Lは、ベクトル長である。また、入力信号はFs0[Hz]からFe0[Hz]に帯域制限される。例えば、サンプリング周波数を16[kHz]として、Fs0=50[Hz]、Fe0=7000[Hz]とする。
【0061】
線形予測係数計算回路170は、入力端子10から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、線形予測係数αi ,i=1,…,Np を求め、さらに前記線形予測係数を量子化し、量子化線形予測係数αi ′,i=1,…,Np を求める。ここで、Np は、線形予測次数であり、例えば、16である。また、線形予測係数計算回路170は、前記線形予測係数を重みづけフィルタ140へ出力し、前記量子化線形予測係数に対応するインデックスを線形予測合成フィルタ130と線形予測逆フィルタ230および符号出力回路290へ出力する。線形予測係数の量子化に関しては、例えば、線スペクトル対(Line Spectrum Pair, LSP )へ変換し、量子化する方法がある。線形予測係数のLSPへの変換に関しては、菅村らによる「線スペクトル対(LSP)音声分析合成方式による音声情報圧縮」(電子情報通信学会論文誌A,Vol.J64-A, No.8, pp.599-606, 1981 )(文献3)を、LSPの量子化に関しては、大室らによる「移動平均型フレーム間予測を用いるLSPパラメータのベクトル量子化」(電子情報通信学会論文誌A,Vol.J77-A, No.3, pp.303-312, 1994 )(文献4)を参照できる。
【0062】
第1の音源生成回路110は、第1の最小化回路150から出力されるインデックスを入力し、前記インデックスに対応する第1の音源ベクトルを、複数個の音源信号(音源ベクトル)が格納されたテーブルより読み出し、第1のゲイン回路160へ出力する。ここで、第1の音源生成回路110の構成について図2を用いて補足する。第1の音源生成回路110が備えているテーブル1101には、Ne 個の音源ベクトルが格納されている。例えば、Ne は256である。スイッチ1102は入力端子1103を介して、第1の最小化回路150から出力されるインデックスiを入力し、前記インデックスに対応する音源ベクトルを前記テーブルより選択し、これを第1の音源ベクトルとして出力端子1104を介して、第1のゲイン回路160へ出力する。また、音源信号の符号化については、複数のパルスから成り、パルスの位置とパルスの振幅により規定される、マルチパルス信号により音源信号を効率的に表現する方法を用いることができる。マルチパルス信号を用いた音源信号の符号化に関しては、小澤らによる「マルチパルスベクトル量子化音源と高速探索に基づくMP−CELP音声符号化」(電子情報通信学会論文誌A,pp.1655-1663, 1996)(文献5)を参照できる。以上で、第1の音源生成回路110の説明を終え、図1の説明に戻る。
【0063】
第1のゲイン回路160は、ゲインの値が格納されたテーブルを備えている。第1のゲイン回路160は、第1の最小化回路150から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを前記テーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第2の音源ベクトルを生成し、生成した前記第2の音源ベクトルを第1の帯域通過フィルタ120へ出力する。
【0064】
第1の帯域通過フィルタ120は、第1のゲイン回路160から出力される第2の音源ベクトルを入力する。前記第2の音源ベクトルは、このフィルタにより第1の帯域に帯域制限され、第1の励振ベクトルを得る。第1の帯域通過フィルタ120は、前記第1の励振ベクトルを線形予測合成フィルタ130へ出力する。ここで、第1の帯域は、Fs1[Hz]からFe1[Hz]とする。ただし、Fs0≦Fs1≦Fe1≦Fe0である。例えば、Fs1=50[Hz]、Fe1=4000[Hz]である。また、第1の帯域通過フィルタ120は、第1の帯域に帯域制限する特性をもち、かつ100次程度の線形予測次数をもつことを特徴とする高次線形予測フィルタ1/B(z)で実現することもできる。ここで、Nphを線形予測次数、線形予測係数をβi ,i=1,…,Nphとすると高次線形予測フィルタの伝達関数1/B(z)は、
【0065】
【数1】
【0066】
と表される。前記高次線形予測フィルタに関しては(文献2)を参照できる。
【0067】
線形予測合成フィルタ130は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ130は、第1の帯域通過フィルタ120から出力される第1の励振ベクトルと線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ1/A(z)を、前記第1の励振ベクトルにより駆動することで、第1の再生信号(再生ベクトル)を得る。そして前記第1の再生ベクトルを第1の差分器180へ出力する。ここで、合成フィルタの伝達関数1/A(z)は、
【0068】
【数2】
【0069】
と表される。
【0070】
第1の差分器180は、入力端子10を介して入力ベクトルを入力し、線形予測合成フィルタ130から出力される第1の再生ベクトルを入力し、それらの差分を計算し、これを第1の差分ベクトルとして、重みづけフィルタ140と線形予測逆フィルタ230へ出力する。
【0071】
第1の重みづけフィルタ140は、第1の差分器180から出力される第1の差分ベクトルと線形予測係数計算回路170から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタW(z)を生成し、前記重みづけフィルタを前記第1の差分ベクトルで駆動することで、第1の重みづけ差分ベクトルを得る。そして前記第1の重みづけ差分ベクトルを第1の最小化回路150へ出力する。ここで、重みづけフィルタの伝達関数W(z)は、W(z)=Q(z/γ1 )/Q(z/γ2 )と表される。ただし、
【0072】
【数3】
【0073】
である。γ1 およびγ2 は定数であり、例えば、γ1 =0.9、γ2 =0.6である。また、重みづけフィルタの詳細に関しては、(文献1)を参照できる。
【0074】
第1の最小化回路150は、第1の音源生成回路110に格納されている第1の音源ベクトル全てに対応するインデックスを、前記第1の音源生成回路110へ順次出力し、第1のゲイン回路160に格納されている第1のゲイン全てに対応するインデックスを、前記第1のゲイン回路160へ順次出力する。また、重みづけフィルタ140から出力される第1の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第1の音源ベクトルおよび前記第1のゲインを選択し、これらに対応するインデックスを符号出力回路290へ出力する。
【0075】
線形予測逆フィルタ230は、量子化線形予測係数が格納されたテーブルを備えている。線形予測逆フィルタ230は、線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスと第1の差分器180から出力される第1の差分ベクトルとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された逆フィルタA(z)を、前記第1の差分ベクトルにより駆動することで、第1の残差ベクトルを得る。そして前記第1の残差ベクトルを直交変換回路240へ出力する。ここで、逆フィルタの伝達関数A(z)は、
【0076】
【数4】
【0077】
と表される。
【0078】
直交変換回路240は、線形予測逆フィルタ230から出力される第1の残差ベクトルを入力し、前記第1の残差ベクトルを直交変換し、第2の残差ベクトルを得る。そして前記第2の残差ベクトルを帯域選択回路250へ出力する。ここで直交変換としては、離散コサイン変換(Discrete Cosine Transform, DCT)を用いることができる。
【0079】
帯域選択回路250は、直交変換回路240から出力される第2の残差ベクトルを入力し、図3に示すように、前記第2の残差ベクトルにおいて、第2の帯域に含まれる成分を用いてNsbv 個のサブベクトルを生成する。第2の帯域としては、任意の帯域が設定できるが、ここではFs2[Hz]からFe2[Hz]とする。ただし、Fs0≦Fs2≦Fe2≦Fe0である。ここでは、第1の帯域と第2の帯域が重ならない、すなわち、Fe1≦Fs2とする。例えば、Fs2=4000[Hz]、Fe2=7000[Hz]である。帯域選択回路250は、前記Nsbv 個のサブベクトルを直交変換係数量子化回路260へ出力する。
【0080】
直交変換係数量子化回路260は、帯域選択回路250から出力されるNsbv 個のサブベクトルを入力する。直交変換係数量子化回路260は、前記サブベクトルの形状に対する量子化値(形状コードベクトル)が格納されたテーブルと、前記サブベクトルのゲインに対する量子化値(量子化ゲイン)が格納されたテーブルとを備えており、入力された前記Nsbv 個のサブベクトル各々に対して、量子化誤差が最小となる、形状の量子化値とゲインの量子化値とを、前記テーブルより選択し、対応するインデックスを符号出力回路290へ出力する。ここで、直交変換係数量子化回路260の構成について図4を用いて補足する。図4において、点線で囲まれたブロックはNsbv 個あり、その各ブロックで前記Nsbv 個のサブベクトルが量子化される。前記Nsbv 個のサブベクトルを
【0081】
【数5】
【0082】
と表す。各サブベクトルに対する処理は共通であるので、esb,0(n),n=0,…,L−1に対する処理について説明する。
【0083】
サブベクトルesb,0(n),n=0,…,L−1は、入力端子2650を介して入力される。テーブル2610には、形状コードベクトルc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1がNc,0 個格納されている。ここで、Lはベクトル長を表し、jはインデックスを表す。テーブル2610は、最小化回路2630から出力されるインデックスを入力し、前記インデックスに対応する前記形状コードベクトルc0 [j](n),n=0,…,L−1をゲイン回路2620へ出力する。ゲイン回路2620が備えているテーブルには、量子化ゲインg0 [k],k=0,…,Ng,0 −1がNg,0 個格納されている。ここで、kはインデックスを表す。ゲイン回路2620は、テーブル2610から出力される前記形状コードベクトルc0 [j](n),n=0,…,L−1を入力し、最小化回路2630から出力されるインデックスを入力し、前記インデックスに対応する量子化ゲインg0 [k]を前記テーブルより読み出し、前記量子化ゲインg0 [k]と前記形状コードベクトルc0 [j](n),n=0,…,L−1とを乗算して得られる量子化サブベクトルe′sb,0(n),n=0,…,L−1を差分器2640へ出力する。差分器2640は、入力端子2650を介して入力される前記サブベクトルesb,0(n),n=0,…,L−1とゲイン回路2620から入力される前記量子化サブベクトルe′sb,0(n),n=0,…,L−1との差分を計算し、これを差分ベクトルとして最小化回路2630へ出力する。最小化回路2630は、テーブル2610に格納されている前記形状コードベクトルc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1全てに対応するインデックスを、前記テーブル2610へ順次出力し、ゲイン回路2620に格納されている前記量子化ゲインg0 [k],k=0,…,Ng,0 −1全てに対応するインデックスを、ゲイン回路2620へ順次出力する。また、差分器2640から前記差分ベクトルを順次入力し、そのノルムD0 を計算し、前記ノルムD0 が最小となる前記形状コードベクトルc0 [j](n),n=0,…,L−1および前記量子化ゲインg0 [k]を選択し、これらに対応するインデックスをインデックス出力回路2660へ出力する。サブベクトル
【0084】
【数6】
【0085】
に対しても同様の処理を行う。インデックス出力回路2660は、Nsbv 個の最小化回路から出力されるインデックスを入力し、これらをまとめたインデックスのセットを出力端子2670を介して符号出力回路290へ出力する。また、ノルムD0 が最小となる前記形状コードベクトルc0 [j](n),n=0,…,L−1および前記量子化ゲインg0 [k]の決定については、以下の方法を用いることもできる。ノルムD0 は、
【0086】
【数7】
【0087】
と表される。ここで、最適なゲインg′0 を
【0088】
【数8】
【0089】
と設定すると、ノルムD0 は、
【0090】
【数9】
【0091】
と変形できる。したがって、D0 が最小となるc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1を求めることは、(式3)の第2項が最大となるc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1を求めることと等価である。そこで、(式3)の第2項が最大となるc0 [j](n),n=0,…,L−1,j=jopt を求めた後、このc0 [j](n),n=0,…,L−1,j=jopt について(式1)が最小となるg0 [k],k=kopt を求める。ここで、c0 [j] (n),n=0,…,L−1,j=jopt としては、(式3)の第2項の値が大きいものから順に複数個の候補を選んでおき、その各々に対して(式1)が最小となるg0 [k],k=kopt を求め、それらの中からノルムD0 が最小となるc0 [j](n),n=0,…,L−1,j=jopt とg0 [k],k=kopt を最終的に選択することもできる。サブベクトル
【0092】
【数10】
【0093】
に対しても同様の方法を適用できる。以上で図4を用いた直交変換係数量子化回路260の説明を終え、図1の説明に戻る。
【0094】
符号出力回路290は、線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスを入力する。また、第1の最小化回路150から出力される、第1の音源ベクトルおよび第1のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路260から出力される、Nsbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして、図29に模式的に示すように各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0095】
図1を用いて説明した第1の実施例は、帯域数が2の場合であるが、帯域数を3以上に拡張した場合について以下で説明する。
【0096】
図1は、図5のように書き直すことができる。ここで、図5の第1の符号化回路1001は、図6と等価であり、図5の第2の符号化回路1002は、図7と等価であり、図6、図7を構成する各ブロックは、図1で説明した各ブロックと同じである。
【0097】
本発明の第2の実施例は、第1の実施例において帯域数を3に拡張することで実現される。本発明の第2の実施例による音声音楽信号符号化装置の構成は、図8に示すブロック図で表すことができる。ここで、第1の符号化回路1001は図6と等価であり、第2の符号化回路1002は図6と等価であり、第3の符号化回路1003は図7と等価である。符号出力回路2901は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1001から出力されるインデックスを入力し、第2の符号化回路1002から出力されるインデックスを入力し、第3の符号化回路1003から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0098】
本発明の第3の実施例は、第1の実施例において帯域数をNに拡張することで実現される。本発明の第3の実施例による音声音楽信号符号化装置の構成は、図9に示すブロック図で表すことができる。ここで、第1の符号化回路1001から第N−1の符号化回路1004は図6と等価であり、第Nの符号化回路1005は図7と等価である。符号出力回路2902は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1001から第N−1の符号化回路1004の各々より出力されるインデックスを入力し、第Nの符号化回路1005から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0099】
第1の実施例では、図5における第1の符号化回路1001がA−b−S(Analysis-by-Synthesis )法を用いた符号化方式に基づいているが、第1の符号化回路1001に対して、A−b−S法以外の符号化方式を適用することもできる。以下では、A−b−S法以外の符号化方式として時間周波数変換を用いた符号化方式を第1の符号化回路1001に対して適用した場合について説明する。
【0100】
本発明の第4の実施例は、第1の実施例において時間周波数変換を用いた符号化方式を適用することで実現される。本発明の第4の実施例による音声音楽信号符号化装置の構成は、図11に示すブロック図で表すことができる。ここで、第1の符号化回路1011は図10と等価であり、第2の符号化回路1002は図7と等価である。図10を構成するブロックのうち、線形予測逆フィルタ230、直交変換回路240、帯域選択回路250および直交変換係数量子化回路260は、図1で説明した各ブロックと同じである。また、直交変換係数逆量子化回路460、直交逆変換回路440および線形予測合成フィルタ131は、後述する第9の実施例による、第1の実施例に対応する音声音楽復号装置を構成するブロックと同じである。直交変換係数逆量子化回路460、直交逆変換回路440および線形予測合成フィルタ131の説明は、図13を用いた第9の実施例の説明において行うのでここでは割愛する。符号出力回路2903は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1011から出力されるインデックスのセットを入力し、第2の符号化回路1002から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0101】
本発明の第5の実施例は、第4の実施例において帯域数を3に拡張することで実現される。本発明の第5の実施例による音声音楽信号符号化装置の構成は、図12に示すブロック図で表すことができる。ここで、第1の符号化回路1011は図10と等価であり、第2の符号化回路1012は図10と等価であり、第3の符号化回路1003は図7と等価である。符号出力回路2904は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1011から出力されるインデックスのセットを入力し、第2の符号化回路1012から出力されるインデックスのセットを入力し、第3の符号化回路1003から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0102】
本発明の第6の実施例は、第4の実施例において帯域数をNに拡張することで実現される。本発明の第6の実施例による音声音楽信号符号化装置の構成は、図13に示すブロック図で表すことができる。ここで、第1の符号化回路1011から第N−1の符号化回路1014の各々は図10と等価であり、第Nの符号化回路1005は図7と等価である。符号出力回路2905は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1011から第N−1の符号化回路1014の各々より出力されるインデックスのセットを入力し、第Nの符号化回路1005から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0103】
図14は、本発明の第7の実施例による音声音楽信号符号化装置の構成を示すブロック図である。図中の点線で囲まれたブロックをピッチ予測フィルタといい、図1にピッチ予測フィルタを付加することで図14が得られる。以下では、図1と異なるブロックである、記憶回路510、ピッチ信号生成回路112、第3のゲイン回路162、加算器184、第1の最小化回路550、符号出力回路590について説明する。
【0104】
記憶回路510は、加算器184から第5の音源信号を入力し、保持する。記憶回路510は、過去に入力されて保持されている前記第5の音源信号をピッチ信号生成回路112へ出力する。
【0105】
ピッチ信号生成回路112は、記憶回路510に保持されている過去の第5の音源信号と第1の最小化回路550から出力されるインデックスとを入力する。前記インデックスは、遅延dを指定する。そして、図30に示すように、前記過去の第5の音源信号において、現フレームの始点よりdサンプル過去の点から、ベクトル長に相当するLサンプル分の信号を切り出し、第1のピッチベクトルを生成する。ここで、d<Lの場合にはdサンプル分の信号を切り出し、この切り出したdサンプルを繰り返し接続して、ベクトル長がLサンプルである第1のピッチベクトルを生成する。ピッチ信号生成回路112は、前記第1のピッチベクトルを第3のゲイン回路162へ出力する。
【0106】
第3のゲイン回路162は、ゲインの値が格納されたテーブルを備えている。第3のゲイン回路162は、第1の最小化回路550から出力されるインデックスとピッチ信号生成回路112から出力される第1のピッチベクトルとを入力し、前記インデックスに対応する第3のゲインを前記テーブルより読み出し、前記第3のゲインと前記第1のピッチベクトルとを乗算し、第2のピッチベクトルを生成し、生成した前記第2のピッチベクトルを加算器184へ出力する。
【0107】
加算器184は、第1のゲイン回路160から出力される第2の音源ベクトルと、第3のゲイン回路162から出力される第2のピッチベクトルを入力し、これらの和を計算し、これを第5の音源ベクトルとして、第1の帯域通過フィルタ120へ出力する。
【0108】
第1の最小化回路550は、第1の音源生成回路110に格納されている第1の音源ベクトル全てに対応するインデックスを、前記第1の音源生成回路110へ順次出力し、ピッチ信号生成回路112において規定された範囲内の遅延d全てに対応するインデックスを、前記ピッチ信号生成回路112へ順次出力し、第1のゲイン回路160に格納されている第1のゲイン全てに対応するインデックスを、前記第1のゲイン回路160へ順次出力し、第3のゲイン回路162に格納されている第3のゲイン全てに対応するインデックスを、前記第3のゲイン回路162へ順次出力する。また、重みづけフィルタ140から出力される第1の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第1の音源ベクトル、前記遅延d、前記第1のゲインおよび前記第3のゲインを選択し、これらに対応するインデックスをまとめて符号出力回路590へ出力する。
【0109】
符号出力回路590は、線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスを入力する。また、第1の最小化回路550から出力される、第1の音源ベクトル、遅延d、第1のゲインおよび第3のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路260から出力される、Nsbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0110】
図15は、本発明の第8の実施例による音声音楽信号符号化装置の構成を示すブロック図である。以下では、図14と異なるブロックである、ダウンサンプル回路780、第1の線形予測係数計算回路770、第1の線形予測合成フィルタ132、第3の差分器183、アップサンプル回路781、第1の差分器180、第2の線形予測係数計算回路771、第3の線形予測係数計算回路772、線形予測逆フィルタ730、符号出力回路790について説明する。
【0111】
ダウンサンプル回路780は、入力端子10から入力ベクトルを入力し、これをダウンサンプルして得られる、第1の帯域を有する第2の入力ベクトルを第1の線形予測係数計算回路770および第3の差分器183へ出力する。ここで、第1の帯域は、第1の実施例と同様にFs1[Hz]からFe1[Hz]とし、入力ベクトルの帯域はFs0[Hz]からFe0[Hz](第3の帯域)とする。ダウンサンプル回路の構成については、P. P. Vaidyanathanによる「Multirate Systems and Filter Banks」と題した文献(文献6)の4.1.1節を参照できる。
【0112】
第1の線形予測係数計算回路770は、ダウンサンプル回路780から第2の入力ベクトルを入力し、前記第2の入力ベクトルに対して線形予測分析を行い、第1の帯域を有する第1の線形予測係数を求め、さらに前記第1の線形予測係数を量子化し、第1の量子化線形予測係数を求める。第1の線形予測係数計算回路770は、前記第1の線形予測係数を第1の重みづけフィルタ140へ出力し、第1の量子化線形予測係数に対応するインデックスを第1の線形予測合成フィルタ132と線形予測逆フィルタ730と第3の線形予測係数計算回路772および符号出力回路790へ出力する。
【0113】
第1の線形予測合成フィルタ132は、第1の量子化線形予測係数が格納されたテーブルを備えている。第1の線形予測合成フィルタ132は、加算器184から出力される第5の音源ベクトルと第1の線形予測係数計算回路770から出力される第1の量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する第1の量子化線形予測係数を、前記テーブルより読み出し、前記第1の量子化線形予測係数が設定された合成フィルタを、前記第5の音源ベクトルにより駆動することで、第1の帯域を有する第1の再生ベクトルを得る。そして前記第1の再生ベクトルを第3の差分器183とアップサンプル回路781へ出力する。
【0114】
第3の差分器183は、第1の線形予測合成フィルタ132から出力される第1の再生ベクトルとダウンサンプル回路780から出力される第2の入力ベクトルとを入力し、それらの差分を計算し、これを第2の差分ベクトルとして重みづけフィルタ140へ出力する。
【0115】
アップサンプル回路781は、第1の線形予測合成フィルタ132から出力される第1の再生ベクトルを入力し、これをアップサンプルして第3の帯域を有する第3の再生ベクトルを得る。ここで、第3の帯域はFs0[Hz]からFe0[Hz]である。アップサンプル回路781は、前記第3の再生ベクトルを第1の差分器180へ出力する。アップサンプル回路の構成については、P. P. Vaidyanathanによる「Multirate Systems and Filter Banks」と題した文献(文献6)の4.1.1節を参照できる。
【0116】
第1の差分器180は、入力端子10を介して入力ベクトルを入力し、アップサンプル回路781から出力される第3の再生ベクトルを入力し、それらの差分を計算し、これを第1の差分ベクトルとして、線形予測逆フィルタ730へ出力する。
【0117】
第2の線形予測係数計算回路771は、入力端子10から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、第3の帯域を有する第2の線形予測係数を求め、前記第2の線形予測係数を第3の線形予測係数計算回路772へ出力する。
【0118】
第3の線形予測係数計算回路772は、第1の量子化線形予測係数が格納されたテーブルを備えている。第3の線形予測係数計算回路772は、第2の線形予測係数計算回路771から出力される第2の線形予測係数と、第1の線形予測係数計算回路770から出力される第1の量子化線形予測係数に対応するインデックスとを入力する。そして前記インデックスに対応する第1の量子化線形予測係数を、前記テーブルより読み出し、前記第1の量子化線形予測係数をLSPに変換し、さらに、これをサンプリング周波数変換することで、入力信号のサンプリング周波数に対応する第1のLSPを得る。また、前記第2の線形予測係数をLSPに変換し、第2のLSPを得る。前記第2のLSPと前記第1のLSPとの差分を計算し、これを第3のLSPとする。ここで、LSPのサンプリング周波数変換については、特願平9−202475号(文献7)を参照できる。前記第3のLSPを量子化し、これを線形予測係数に変換し、第3の帯域を有する第3の量子化線形予測係数を得る。そして前記第3の量子化線形予測係数に対応するインデックスを線形予測逆フィルタ730および符号出力回路790へ出力する。
【0119】
線形予測逆フィルタ730は、第1の量子化線形予測係数が格納された第1のテーブルと第3の量子化線形予測係数が格納された第2のテーブルとを備えている。線形予測逆フィルタ730は、第1の線形予測係数計算回路770から出力される第1の量子化線形予測係数に対応する第1のインデックスと第3の線形予測係数計算回路772から出力される第3の量子化線形予測係数に対応する第2のインデックスと第1の差分器180から出力される第1の差分ベクトルとを入力する。線形予測逆フィルタ730は、前記第1のインデックスに対応する第1の量子化線形予測係数を前記第1のテーブルより読み出し、LSPに変換し、さらに、これをサンプリング周波数変換することで、入力信号のサンプリング周波数に対応する第1のLSPを得る。そして前記第2のインデックスに対応する第3の量子化線形予測係数を、前記第2のテーブルより読み出し、LSPに変換し、第3のLSPを得る。次に、前記第1のLSPと前記第3のLSPとを加算し、第2のLSPを得る。線形予測逆フィルタ730は、前記第2のLSPを線形予測係数に変換し、第2の量子化線形予測係数を得、前記第2の量子化線形予測係数が設定された逆フィルタを、前記第1の差分ベクトルにより駆動することで、第1の残差ベクトルを得る。そして前記第1の残差ベクトルを直交変換回路240へ出力する。
【0120】
符号出力回路790は、第1の線形予測係数計算回路770から出力される第1の量子化線形予測係数に対応するインデックスを入力し、第3の線形予測係数計算回路772から出力される第3の量子化線形予測係数に対応するインデックスを入力し、第1の最小化回路550から出力される、第1の音源ベクトル、遅延d、第1のゲインおよび第3のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路260から出力される、Nsbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
【0121】
図16は、本発明の第9の実施例による、第1の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。本復号装置は、入力端子30からビット系列の符号を入力する。
【0122】
符号入力回路410は、入力端子30から入力したビット系列の符号をインデックスに変換する。第1の音源ベクトルに対応するインデックスは、第1の音源生成回路110へ出力される。第1のゲインに対応するインデックスは、第1のゲイン回路160へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ130および線形予測合成フィルタ131へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスNsbv を個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路460へ出力される。
【0123】
第1の音源生成回路110は、符号入力回路410から出力されるインデックスを入力し、前記インデックスに対応する第1の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第1のゲイン回路160へ出力する。
【0124】
第1のゲイン回路160は、量子化ゲインが格納されたテーブルを備えている。第1のゲイン回路160は、符号入力回路410から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを前記テーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第2の音源ベクトルを生成し、生成した前記第2の音源ベクトルを第1の帯域通過フィルタ120へ出力する。
【0125】
第1の帯域通過フィルタ120は、第1のゲイン回路160から出力される第2の音源ベクトルを入力する。前記第2の音源ベクトルは、このフィルタにより第1の帯域に帯域制限され、第1の励振ベクトルを得る。第1の帯域通過フィルタ120は、前記第1の励振ベクトルを線形予測合成フィルタ130へ出力する。
【0126】
直交変換係数逆量子化回路460の構成について図18を用いて説明する。図18において、点線で囲まれたブロックはNsbv 個ある。その各ブロックで図1の帯域選択回路250において規定されるNsbv 個の量子化サブベクトル
【0127】
【数11】
【0128】
が復号される。各量子化サブベクトルに対する復号処理は共通であるので、e′sb,0(n),n=0,…,L−1に対する処理について説明する。量子化サブベクトルe′sb,0(n),n=0,…,L−1は、図1における直交変換係数量子化回路260での処理と同様に、形状コードベクトルc0 [j](n),n=0,…,L−1と量子化ゲインg0 [k]との積で表される。ここで、j,kはインデックスを表す。インデックス入力回路4630は、入力端子4650を介して、符号入力回路410から出力されるNsbv 個の量子化サブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットif を入力する。そして前記インデックスのセットif から、形状コードベクトルc0 [j](n),n=0,…,L−1を指定するインデックスisbs,0 と量子化ゲインg0 [k]を指定するインデックスisbg,0 とを取り出し、isbs,0 をテーブル4610へ出力し、isbg,0 をゲイン回路4620へ出力する。テーブル4610には、c0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1が格納されている。テーブル4610は、インデックス入力回路4630から出力されるインデックスisbs,0 を入力し、isbs,0 に対応する形状コードベクトルc0 [j](n),n=0,…,L−1,j=isbs,0 をゲイン回路4620へ出力する。ゲイン回路4620が備えているテーブルには、g0 [k],k=0,…,Ng,0 −1が格納されている。ゲイン回路4620は、テーブル4610から出力されるc0 [j](n),n=0,…,L−1,j=isbs,0 を入力し、インデックス入力回路4630から出力されるインデックスisbg,0 を入力し、isbg,0 に対応する量子化ゲインg0 [k],k=isbg,0 を前記テーブルより読み出し、c0 [j](n),n=0,…,L−1,j=isbg,0 とg0 [k],k=isbg,0 とを乗算して得られる量子化サブベクトルe′sb,0(n),n=0,…,L−1を全帯域ベクトル生成回路4640へ出力する。全帯域ベクトル生成回路4640は、ゲイン回路4620から出力される量子化サブベクトルe′sb,0(n),n=0,…,L−1を入力する。また、全帯域ベクトル生成回路4640は、e′sb,0(n),n=0,…,L−1と同様の処理で得られる、
【0129】
【数12】
【0130】
を入力する。そして図17に示すように、前記Nsbv 個の量子化サブベクトル
【0131】
【数13】
【0132】
を、図1の帯域選択回路250において規定される第2の帯域に配置し、前記第2の帯域以外には零ベクトルを配置することにより、全帯域(例えば、再生信号のサンプリング周波数が16kHzのときは、8kHz帯域)に相当する第2の励振ベクトルを生成し、これを出力端子4660を介して直交逆変換回路440へ出力する。
【0133】
直交逆変換回路440は、直交変換係数逆量子化回路460から出力される第2の励振ベクトルを入力し、前記第2の励振ベクトルを直交逆変換し、第3の励振ベクトルを得る。そして前記第3の励振ベクトルを線形予測合成フィルタ131へ出力する。ここで、直交逆変換としては、離散コサイン逆変換(Inverse Discrete Cosine Transform, IDCT )を用いることができる。
【0134】
線形予測合成フィルタ130は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ130は、第1の帯域通過フィルタ120から出力される第1の励振ベクトルと符号入力回路410から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ1/A(z)を、前記第1の励振ベクトルにより駆動することで、第1の再生ベクトルを得る。そして前記第1の再生ベクトルを加算器182へ出力する。
【0135】
線形予測合成フィルタ131は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ131は、直交逆変換回路440から出力される第3の励振ベクトルと符号入力回路410から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ1/A(z)を、前記第3の励振ベクトルにより駆動することで、第2の再生ベクトルを得る。そして前記第2の再生ベクトルを加算器182へ出力する。
【0136】
加算器182は、線形予測合成フィルタ130から出力される第1の再生ベクトルと、線形予測合成フィルタ131から出力される第2の再生ベクトルとを入力し、これらの和を計算し、これを第3の再生ベクトルとして、出力端子40を介して、出力する。
【0137】
図16を用いて説明した第9の実施例は、帯域数が2の場合であるが、帯域数を3以上に拡張した場合について以下で説明する。
【0138】
図16は、図19のように書き直すことができる。ここで、図19の第1の復号回路1051は、図20と等価であり、図19の第2の復号回路1052は、図21と等価であり、図20、図21を構成する各ブロックは、図16で説明した各ブロックと同じである。
【0139】
本発明の第10の実施例は、第9の実施例において帯域数を3に拡張することで実現される。本発明の第10の実施例による音声音楽信号復号装置の構成は、図22に示すブロック図で表すことができる。ここで、第1の復号回路1051は図20と等価であり、第2の復号回路1052は図20と等価であり、第3の復号回路1053は図21と等価である。符号入力回路4101は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1051、第2の復号回路1052および第3の復号回路1053へ出力し、音源ベクトルとゲインに対応するインデックスを第1の復号回路1051および第2の復号回路1052へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第3の復号回路1053へ出力する。
【0140】
本発明の第11の実施例は、第9の実施例において帯域数をNに拡張することで実現される。本発明の第11の実施例による音声音楽信号復号装置の構成は、図23に示すブロック図で表すことができる。ここで、第1の復号回路1051から第N−1の復号回路1054の各々は図20と等価であり、第Nの復号回路1055は図21と等価である。符号入力回路4102は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1051から第N−1の復号回路1054および第Nの復号回路1055の各々へ出力し、音源ベクトルとゲインに対応するインデックスを第1の復号回路1051から第N−1の復号回路1054の各々へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第Nの復号回路1055へ出力する。
【0141】
第9の実施例では、図19における第1の復号回路1051がA−b−S法を用いた符号化方式に対応する復号方式に基づいているが、第1の復号回路1051に対して、A−b−S法以外の符号化方式に対応する復号方式を適用することもできる。以下では、時間周波数変換を用いた符号化方式に対応する復号方式を第1の復号回路1051に対して適用した場合について説明する。
【0142】
本発明の第12の実施例は、第9の実施例において時間周波数変換を用いた符号化方式に対応する復号方式を適用することで実現される。本発明の第12の実施例による音声音楽信号復号装置の構成は、図24に示すブロック図で表すことができる。ここで、第1の復号回路1061は図21と等価であり、第2の復号回路1052は図21と等価である。符号入力回路4103は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1061および第2の復号回路1052へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第1の復号回路1061および第2の復号回路1052へ出力する。
【0143】
本発明の第13の実施例は、第12の実施例において帯域数を3に拡張することで実現される。本発明の第13の実施例による音声音楽信号復号装置の構成は、図25に示すブロック図で表すことができる。ここで、第1の復号回路1061は図21と等価であり、第2の復号回路1062は図21と等価であり、第3の復号回路1053は図21と等価である。符号入力回路4104は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1061、第2の復号回路1062および第3の復号回路1053へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第1の復号回路1061、第2の復号回路1062および第3の復号回路1053へ出力する。
【0144】
本発明の第14の実施例は、第12の実施例において帯域数をNに拡張することで実現される。本発明の第14の実施例による音声音楽信号復号装置の構成は、図26に示すブロック図で表すことができる。ここで、第1の復号回路1061から第N−1の復号回路1064の各々は図21と等価であり、第Nの復号回路1055は図21と等価である。符号入力回路4105は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1061から第N−1の復号回路1064および第Nの復号回路1055の各々へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第1の復号回路1061から第N−1の復号回路1064および第Nの復号回路1055の各々へ出力する。
【0145】
図27は、本発明の第15の実施例による、第7の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。図27において、図16の第9の実施例と異なるブロックは、記憶回路510、ピッチ信号生成回路112、第3のゲイン回路162、加算器184および符号入力回路610であるが、記憶回路510、ピッチ信号生成回路112、第3のゲイン回路162および加算器184は、図14と同様であるので説明を省略し、符号入力回路610について説明する。
【0146】
符号入力回路610は、入力端子30から入力したビット系列の符号をインデックスに変換する。第1の音源ベクトルに対応するインデックスは、第1の音源生成回路110へ出力される。遅延dに対応するインデックスは、ピッチ信号生成回路112へ出力される。第1のゲインに対応するインデックスは、第1のゲイン回路160へ出力される。第3のゲインに対応するインデックスは、第3のゲイン回路162へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ130および線形予測合成フィルタ131へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスをNsbv 個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路460へ出力される。
【0147】
図28は、本発明の第16の実施例による、第8の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。以下では、図27と異なるブロックである、符号入力回路810、第1の線形予測係数合成フィルタ132、アップサンプル回路781および第2の線形予測合成フィルタ831について説明する。
【0148】
符号入力回路810は、入力端子30から入力したビット系列の符号をインデックスに変換する。第1の音源ベクトルに対応するインデックスは、第1の音源生成回路110へ出力される。遅延dに対応するインデックスは、ピッチ信号生成回路112へ出力される。第1のゲインに対応するインデックスは、第1のゲイン回路160へ出力される。第3のゲインに対応するインデックスは、第3のゲイン回路162へ出力される。第1の量子化線形予測係数に対応するインデックスは、第1の線形予測合成フィルタ132および第2の線形予測合成フィルタ831へ出力される。第3の量子化線形予測係数に対応するインデックスは、第2の線形予測合成フィルタ831へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスをNsbv 個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路460へ出力される。
【0149】
第1の線形予測合成フィルタ132は、第1の量子化線形予測係数が格納されたテーブルを備えている。第1の線形予測合成フィルタ132は、加算器184から出力される第5の音源ベクトルと符号入力回路810から出力される第1の量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する第1の量子化線形予測係数を、前記テーブルより読み出し、前記第1の量子化線形予測係数が設定された合成フィルタを、前記第5の音源ベクトルにより駆動することで、第1の帯域を有する第1の再生ベクトルを得る。そして前記第1の再生ベクトルをアップサンプル回路781へ出力する。
【0150】
アップサンプル回路781は、第1の線形予測合成フィルタ132から出力される第1の再生ベクトルを入力し、これをアップサンプルして第3の帯域を有する第3の再生ベクトルを得る。そして前記第3の再生ベクトルを第1の加算器182へ出力する。
【0151】
第2の線形予測合成フィルタ831は、第1の帯域を有する第1の量子化線形予測係数が格納された第1のテーブルと、第3の帯域を有する第3の量子化線形予測係数が格納された第2のテーブルとを備えている。第2の線形予測合成フィルタ831は、直交逆変換回路440から出力される第3の励振ベクトルと、符号入力回路810から出力される第1の量子化線形予測係数に対応する第1のインデックスと、第3の量子化線形予測係数に対応する第2のインデックスとを入力する。第2の線形予測合成フィルタ831は、前記第1のインデックスに対応する第1の量子化線形予測係数を前記第1のテーブルより読み出し、これをLSPに変換し、さらに、これをサンプリング周波数変換することで、第3の再生ベクトルのサンプリング周波数に対応する第1のLSPを得る。次に、前記第2のインデックスに対応する第3の量子化線形予測係数を、前記第2のテーブルより読み出し、これをLSPに変換し、第3のLSPを得る。そして前記第1のLSPと前記第3のLSPとを加算して得られる第2のLSPを、線形予測係数に変換し、第2の線形予測係数を得る。第2の線形予測合成フィルタ831は、前記第2の線形予測係数が設定された合成フィルタを、前記第3の励振ベクトルにより駆動することで、第3の帯域を有する第2の再生ベクトルを得る。そして前記第2の再生ベクトルを加算器182へ出力する。
【0152】
加算器182は、アップサンプル回路781から出力される第3の再生ベクトルと、第2の線形予測合成フィルタ831から出力される第2の再生ベクトルを入力し、これらの和を計算し、これを第4の再生ベクトルとして、出力端子40を介して、出力する。
【0153】
【発明の効果】
本発明による効果は、音声音楽信号を全帯域にわたって良好に符号化できることである。その理由は、入力信号の低域に対応する帯域特性を有する音源信号により前記入力信号から求めた線形予測合成フィルタを駆動することで第1の再生信号を生成し、前記入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号の高域成分を、直交変換に基づく符号化方式を用いて符号化するため、前記入力信号の高域成分に対する符号化性能が改善されるからである。
【図面の簡単な説明】
【図1】本発明の第1の実施例による音声音楽信号符号化装置の構成を示すブロック図である。
【図2】第1の音源生成回路110の構成を示すブロック図である。
【図3】帯域選択回路250においてサブベクトル生成する方法を説明するための図である。
【図4】直交変換係数量子化回路260の構成を示すブロック図である。
【図5】本発明の第1の実施例による音声音楽信号符号化装置の構成を示す、図1と等価なブロック図である。
【図6】図5における第1の符号化回路1001の構成を示すブロック図である。
【図7】図5における第2の符号化回路1002の構成を示すブロック図である。
【図8】本発明の第2の実施例による音声音楽信号符号化装置の構成を示すブロック図である。
【図9】本発明の第3の実施例による音声音楽信号符号化装置の構成を示すブロック図である。
【図10】図11における第1の符号化回路1011の構成を示すブロック図である。
【図11】本発明の第4の実施例による音声音楽信号符号化装置の構成を示すブロック図である。
【図12】本発明の第5の実施例による音声音楽信号符号化装置の構成を示すブロック図である。
【図13】本発明の第6の実施例による音声音楽信号符号化装置の構成を示すブロック図である。
【図14】本発明の第7の実施例による音声音楽信号符号化装置の構成を示すブロック図である。
【図15】本発明の第8の実施例による音声音楽信号符号化装置の構成を示すブロック図である。
【図16】本発明の第9の実施例による音声音楽信号復号装置の構成を示すブロック図である。
【図17】直交変換係数逆量子化回路460において第2の励振ベクトル生成する方法を説明するための図である。
【図18】直交変換係数逆量子化回路460の構成を示すブロック図である。
【図19】本発明の第9の実施例による音声音楽信号復号装置の構成を示す、図16と等価なブロック図である。
【図20】図19における第1の復号回路1051の構成を示すブロック図である。
【図21】図19における第2の復号回路1052の構成を示すブロック図である。
【図22】本発明の第10の実施例による音声音楽信号復号装置の構成を示すブロック図である。
【図23】本発明の第11の実施例による音声音楽信号復号装置の構成を示すブロック図である。
【図24】本発明の第12の実施例による音声音楽信号復号装置の構成を示すブロック図である。
【図25】本発明の第13の実施例による音声音楽信号復号装置の構成を示すブロック図である。
【図26】本発明の第14の実施例による音声音楽信号復号装置の構成を示すブロック図である。
【図27】本発明の第15の実施例による音声音楽信号復号装置の構成を示すブロック図である。
【図28】本発明の第16の実施例による音声音楽信号復号装置の構成を示すブロック図である。
【図29】符号出力回路290における、インデックスとビット系列の符号との対応を説明するための図である。
【図30】ピッチ信号生成回路112において、第1のピッチベクトルを生成する方法を説明するための図である。
【図31】従来法による音声音楽信号符号化装置の実施の形態を示すブロック図である。
【図32】従来法による音声音楽信号復号装置の実施の形態を示すブロック図である。
【符号の説明】
10,30 入力端子
20,40 出力端子
110 第1の音源生成回路
111 第2の音源生成回路
160 第1のゲイン回路
161 第2のゲイン回路
120 第1の帯域通過フィルタ
121 第2の帯域通過フィルタ
182,184 加算器
180 第1の差分器
181 第2の差分器
183 第3の差分器
170 線形予測係数計算回路
770 第1の線形予測係数計算回路
771 第2の線形予測係数計算回路
772 第3の線形予測係数計算回路
130 線形予測合成フィルタ
131 線形予測合成フィルタ
132 第1の線形予測合成フィルタ
831 第2の線形予測合成フィルタ
140 重みづけフィルタ
141 重みづけフィルタ
150,550 第1の最小化回路
151 第2の最小化回路
230,730 線形予測逆フィルタ
240 直交変換回路
250 帯域選択回路
260 直交変換係数量子化回路
440 直交逆変換回路
460 直交変換係数逆量子化回路
190,290,590,790 符号出力回路
310,410,610,810 符号入力回路
780 ダウンサンプル回路
781 アップサンプル回路
510 記憶回路
112 ピッチ信号生成回路
162 第3のゲイン回路
1101 テーブル
1102 スイッチ
1103 入力端子
1104 出力端子
2650,2651 入力端子
2610,2611 テーブル
2620,2621 ゲイン回路
2630,2631 最小化回路
2640,2641 差分器
2660 インデックス出力回路
2670 出力端子
1001,1011 第1の符号化回路
1002,1012 第2の符号化回路
1003 第3の符号化回路
1004,1014 第N−1の符号化回路
1005 第Nの符号化回路
2901,2902,2903,2904,2905 符号出力回路
1801,1802 差分器
4610,4611 テーブル
4620,4621 ゲイン回路
4630 インデックス入力回路
4640 全帯域ベクトル生成回路
4650 入力端子
4660 出力端子
1051,1061 第1の復号回路
1052,1062 第2の復号回路
1053 第3の復号回路
1054,1064 第N−1の復号回路
1055 第Nの復号回路
4101,4102,4103,4104,4105 符号入力回路
1821,1822 加算器
Claims (21)
- 入力信号の第1の帯域に対応する励振信号と、前記入力信号の第2の帯域に対応する励振信号とを加算して得られる励振信号により、前記入力信号から求めた線形予測合成フィルタを駆動することで再生信号を生成する音声音楽信号符号化装置において、前記第1の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1の再生信号を生成し、前記入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における前記第2の帯域に対応する成分を直交変換後に符号化することを特徴とする音声音楽信号符号化装置。
- 3個の帯域に対応する3個の励振信号を加算して得られる励振信号により、入力信号から求めた線形予測合成フィルタを駆動することで再生信号を生成する音声音楽信号符号化装置において、第1と第2の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1と第2の再生信号を生成し、前記第1と第2の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第3の帯域に対応する成分を直交変換後に符号化することを特徴とする音声音楽信号符号化装置。
- N個の帯域に対応するN個の励振信号を加算して得られる励振信号により、入力信号から求めた線形予測合成フィルタを駆動することで再生信号を生成する音声音楽信号符号化装置において、第1から第N−1の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1から第N−1の再生信号を生成し、前記第1から第N−1の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第Nの帯域に対応する成分を直交変換後に符号化することを特徴とする音声音楽信号符号化装置。
- 第2の符号化において、第1の符号化によって符号化された信号を復号した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化することを特徴とする音声音楽信号符号化装置。
- 第3の符号化において、第1と第2の符号化によって符号化された信号を復号した信号を加算した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化することを特徴とする音声音楽信号符号化装置。
- 第Nの符号化において、第1から第N−1の符号化によって符号化された信号を復号した信号を加算した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化することを特徴とする音声音楽信号符号化装置。
- 入力信号の第1の帯域に対応する励振信号を生成する際にピッチ予測フィルタを用いることを特徴とする請求項1記載の音声音楽信号符号化装置。
- 第1の帯域に対応する励振信号と、第2の帯域に対応する励振信号とを加算して得られる励振信号により、線形予測合成フィルタを駆動することで再生信号を生成する音声音楽信号復号装置において、復号した直交変換係数を直交逆変換することにより、前記第2の帯域に対応する励振信号を生成することを特徴とする音声音楽信号復号装置。
- 第1から第3の帯域に対応する3個の励振信号を加算して得られる励振信号により、線形予測合成フィルタを駆動することで再生信号を生成する音声音楽信号復号装置において、復号した直交変換係数を直交逆変換することにより、前記第3の帯域に対応する励振信号を生成することを特徴とする音声音楽信号復号装置。
- 第1から第Nの帯域に対応するN個の励振信号を加算して得られる励振信号により、線形予測合成フィルタを駆動することで再生信号を生成する音声音楽信号復号装置において、復号した直交変換係数を直交逆変換することにより、前記第Nの帯域に対応する励振信号を生成することを特徴とする音声音楽信号復号装置。
- 第2の復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と、第1の復号信号とを加算することで復号音声音楽を生成することを特徴とする音声音楽信号復号装置。
- 第3の復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と、第1と第2の復号信号とを加算することで復号音声音楽を生成することを特徴とする音声音楽信号復号装置。
- 第Nの復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と、第1から第N−1の復号信号とを加算することで復号音声音楽を生成することを特徴とする音声音楽信号復号装置。
- 第1の帯域に対応する励振信号を生成する際にピッチ予測フィルタを用いることを特徴とする請求項8記載の音声音楽信号復号装置。
- 請求項1記載の音声音楽信号符号化装置から出力される符号を、請求項8記載の音声音楽信号復号装置で復号する音声音楽信号符号化復号装置。
- 請求項2記載の音声音楽信号符号化装置から出力される符号を、請求項9記載の音声音楽信号復号装置で復号する音声音楽信号符号化復号装置。
- 請求項3記載の音声音楽信号符号化装置から出力される符号を、請求項10記載の音声音楽信号復号装置で復号する音声音楽信号符号化復号装置。
- 請求項4記載の音声音楽信号符号化装置から出力される符号を、請求項11記載の音声音楽信号復号装置で復号する音声音楽信号符号化復号装置。
- 請求項5記載の音声音楽信号符号化装置から出力される符号を、請求項11記載の音声音楽信号復号装置で復号する音声音楽信号符号化復号装置。
- 請求項6記載の音声音楽信号符号化装置から出力される符号を、請求項13記載の音声音楽信号復号装置で復号する音声音楽信号符号化復号装置。
- 請求項7記載の音声音楽信号符号化装置から出力される符号を、請求項14記載の音声音楽信号復号装置で復号する音声音楽信号符号化復号装置。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16657398A JP3541680B2 (ja) | 1998-06-15 | 1998-06-15 | 音声音楽信号の符号化装置および復号装置 |
DE69941259T DE69941259D1 (de) | 1998-06-15 | 1999-06-15 | Sprach/musik signal kodierer und dekodierer |
US09/719,826 US6865534B1 (en) | 1998-06-15 | 1999-06-15 | Speech and music signal coder/decoder |
EP99925329A EP1087378B1 (en) | 1998-06-15 | 1999-06-15 | Voice/music signal encoder and decoder |
PCT/JP1999/003185 WO1999066497A1 (fr) | 1998-06-15 | 1999-06-15 | Codeur et decodeur de signaux musicaux/vocaux |
CA002335284A CA2335284A1 (en) | 1998-06-15 | 1999-06-15 | Speech and music signal coder/decoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16657398A JP3541680B2 (ja) | 1998-06-15 | 1998-06-15 | 音声音楽信号の符号化装置および復号装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004027981A Division JP4293005B2 (ja) | 2004-02-04 | 2004-02-04 | 音声音楽信号の符号化装置および復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000003193A JP2000003193A (ja) | 2000-01-07 |
JP3541680B2 true JP3541680B2 (ja) | 2004-07-14 |
Family
ID=15833779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16657398A Expired - Fee Related JP3541680B2 (ja) | 1998-06-15 | 1998-06-15 | 音声音楽信号の符号化装置および復号装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6865534B1 (ja) |
EP (1) | EP1087378B1 (ja) |
JP (1) | JP3541680B2 (ja) |
CA (1) | CA2335284A1 (ja) |
DE (1) | DE69941259D1 (ja) |
WO (1) | WO1999066497A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
US7399599B2 (en) | 2000-07-10 | 2008-07-15 | Vertex Pharmaceuticals (San Diego) Llc | Ion channel assay methods |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7752052B2 (en) | 2002-04-26 | 2010-07-06 | Panasonic Corporation | Scalable coder and decoder performing amplitude flattening for error spectrum estimation |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
US7486719B2 (en) * | 2002-10-31 | 2009-02-03 | Nec Corporation | Transcoder and code conversion method |
US7844451B2 (en) * | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
BRPI0515814A (pt) * | 2004-12-10 | 2008-08-05 | Matsushita Electric Ind Co Ltd | dispositivo de codificação de banda larga, dispositivo de predição de lsp de banda larga, dispositivo de codificação de banda escalonável, método de codificação de banda larga |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US8560328B2 (en) * | 2006-12-15 | 2013-10-15 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
US9602127B1 (en) * | 2016-02-11 | 2017-03-21 | Intel Corporation | Devices and methods for pyramid stream encoding |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4956871A (en) | 1988-09-30 | 1990-09-11 | At&T Bell Laboratories | Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands |
JPH05265492A (ja) | 1991-03-27 | 1993-10-15 | Oki Electric Ind Co Ltd | コード励振線形予測符号化器及び復号化器 |
JP3249144B2 (ja) | 1991-03-29 | 2002-01-21 | 株式会社東芝 | 音声符号化装置 |
JP3264679B2 (ja) | 1991-08-30 | 2002-03-11 | 沖電気工業株式会社 | コード励振線形予測符号化装置及び復号化装置 |
JP3089769B2 (ja) | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
US5526464A (en) * | 1993-04-29 | 1996-06-11 | Northern Telecom Limited | Reducing search complexity for code-excited linear prediction (CELP) coding |
JP3186489B2 (ja) | 1994-02-09 | 2001-07-11 | ソニー株式会社 | ディジタル信号処理方法及び装置 |
JP3139602B2 (ja) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | 音響信号符号化方法及び復号化方法 |
JPH0946233A (ja) * | 1995-07-31 | 1997-02-14 | Kokusai Electric Co Ltd | 音声符号化方法とその装置、音声復号方法とその装置 |
JPH09127995A (ja) | 1995-10-26 | 1997-05-16 | Sony Corp | 信号復号化方法及び信号復号化装置 |
JPH09127994A (ja) | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
JPH09127985A (ja) | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
TW321810B (ja) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JPH09127987A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
JP3159012B2 (ja) | 1995-10-26 | 2001-04-23 | 日本ビクター株式会社 | 音響信号の符号化装置及び復号化装置 |
US5778335A (en) * | 1996-02-26 | 1998-07-07 | The Regents Of The University Of California | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
JPH09281995A (ja) | 1996-04-12 | 1997-10-31 | Nec Corp | 信号符号化装置及び方法 |
JP3092653B2 (ja) | 1996-06-21 | 2000-09-25 | 日本電気株式会社 | 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置 |
JP3357795B2 (ja) | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
US6345246B1 (en) * | 1997-02-05 | 2002-02-05 | Nippon Telegraph And Telephone Corporation | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates |
-
1998
- 1998-06-15 JP JP16657398A patent/JP3541680B2/ja not_active Expired - Fee Related
-
1999
- 1999-06-15 DE DE69941259T patent/DE69941259D1/de not_active Expired - Lifetime
- 1999-06-15 US US09/719,826 patent/US6865534B1/en not_active Expired - Fee Related
- 1999-06-15 CA CA002335284A patent/CA2335284A1/en not_active Abandoned
- 1999-06-15 WO PCT/JP1999/003185 patent/WO1999066497A1/ja active Application Filing
- 1999-06-15 EP EP99925329A patent/EP1087378B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
WO1999066497A1 (fr) | 1999-12-23 |
US6865534B1 (en) | 2005-03-08 |
EP1087378A4 (en) | 2005-10-26 |
EP1087378A1 (en) | 2001-03-28 |
CA2335284A1 (en) | 1999-12-23 |
EP1087378B1 (en) | 2009-08-12 |
JP2000003193A (ja) | 2000-01-07 |
DE69941259D1 (de) | 2009-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3541680B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
US6401062B1 (en) | Apparatus for encoding and apparatus for decoding speech and musical signals | |
JP3134817B2 (ja) | 音声符号化復号装置 | |
EP2041745B1 (en) | Adaptive encoding and decoding methods and apparatuses | |
JP4005359B2 (ja) | 音声符号化及び音声復号化装置 | |
US7805314B2 (en) | Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data | |
US20040064311A1 (en) | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband | |
CN113223540B (zh) | 在声音信号编码器和解码器中使用的方法、设备和存储器 | |
EP2805324B1 (en) | System and method for mixed codebook excitation for speech coding | |
JPH09281995A (ja) | 信号符号化装置及び方法 | |
CN101847414A (zh) | 用于语音编码的方法和设备 | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3335841B2 (ja) | 信号符号化装置 | |
Davidson et al. | Multiple-stage vector excitation coding of speech waveforms | |
JP2000132194A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3237178B2 (ja) | 符号化方法及び復号化方法 | |
JP3147807B2 (ja) | 信号符号化装置 | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPH09127985A (ja) | 信号符号化方法及び装置 | |
JPH09127987A (ja) | 信号符号化方法及び装置 | |
JP4293005B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
JP3916934B2 (ja) | 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置 | |
JP3249144B2 (ja) | 音声符号化装置 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20031202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040204 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040309 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040322 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080409 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090409 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100409 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |