JP4903053B2 - 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 - Google Patents
広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 Download PDFInfo
- Publication number
- JP4903053B2 JP4903053B2 JP2006546778A JP2006546778A JP4903053B2 JP 4903053 B2 JP4903053 B2 JP 4903053B2 JP 2006546778 A JP2006546778 A JP 2006546778A JP 2006546778 A JP2006546778 A JP 2006546778A JP 4903053 B2 JP4903053 B2 JP 4903053B2
- Authority
- JP
- Japan
- Prior art keywords
- lsp
- wideband
- prediction
- error
- quantized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 24
- 239000013598 vector Substances 0.000 claims abstract description 198
- 238000006243 chemical reaction Methods 0.000 claims abstract description 47
- 238000013139 quantization Methods 0.000 claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims description 34
- 238000013507 mapping Methods 0.000 claims description 21
- 230000005236 sound signal Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 16
- 238000004891 communication Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000003111 delayed effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 52
- 230000006870 function Effects 0.000 description 14
- 238000003860 storage Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 4
- 101000869912 Cerastes vipera Disintegrin CV-11-alpha Proteins 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Amplifiers (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
れるので、一般に高い予測性能が得られる。その一方で、実際のアプリケーションにおいて、巨大な学習データを用いて無限大の変換テーブルを作成し使用することは不可能である。従って、現実には、ある程度限られた規模の学習データを用いて、ある程度現実的なサイズの変換テーブルを作成し使用することになる。変換テーブルのサイズはメモリ量以外にも変換処理に要する演算処理量にも関係することから、メモリ量や演算処理量に制約のあるアプリケーション、例えば携帯端末等で使用されるアプリケーションについては、さらに変換テーブルのサイズを小さくしなければならない。そして、変換テーブルのサイズが小さいと、狭帯域信号と広帯域信号との関連付けが限定されるため、広帯域LSPパラメータの予測性能が低くなる。つまり、この変換テーブルの大きさが十分でなければ、狭帯域LSPパラメータから広帯域LSPパラメータを非線形予測する際の量子化効率が低下してしまい、特に音声信号の特徴が良く現れる低域成分については、非線形予測を行うことによってその品質が却って劣化する場合もある。
図1は、本発明の実施の形態1に係る広帯域LSP予測装置を具備する広帯域符号化装置100の主要な構成要素を示すブロック図である。なお、本実施の形態では、広帯域符号化装置100が帯域スケーラブル符号化装置の一部として使用される場合を例にとって説明する。本実施の形態に係る広帯域LSP予測装置、広帯域符号化装置、帯域スケーラブル符号化装置等は、携帯電話等の通信端末装置や基地局装置等に搭載され得るものである。
=0.0 [ただし、i=Pn,…,Pw−1] ・・・(1)
式(1)において、fw(i)は音声信号のi次の広帯域LSP、fn(i)は音声信号のi次の狭帯域LSP、Pnは狭帯域LSPのLSP分析次数、Pwは広帯域LSPのLSP分析次数をそれぞれ示す(例えば特開平11−30997号公報参照)。
力する。
合に限定されるものではなく、例えば非線形予測部102内で決定された分類結果kや重み係数セットを利用して変換広帯域LSPのクラス分けを行い、決定されたクラス毎に異なるLSP予測残差符号帳110や予測係数テーブル131を切り替えて使用するようにしても良い。このように、LSP予測残差符号帳や予測係数テーブルのマルチモード化を行えば、非線形予測処理途中に得られる情報を利用するだけであるため、モード判定のための追加処理や新たな伝送情報を必要とすることなく、非線形予測部102の予測性能を一層改善することができる。
図6は、本発明の実施の形態2に係る広帯域LSP予測装置を具備する広帯域符号化装置600の主要な構成要素を示すブロック図である。広帯域符号化装置600は、実施の形態1に係る広帯域符号化装置100において、加算器122及び予測係数テーブル131の代わりに加算器622及び予測係数テーブル631を具備し、さらに遅延器601、612、除算器602及び増幅器603、604、605を具備するものである。従って、広帯域符号化装置600は、広帯域符号化装置100と同一の動作を行う構成要素を多く具備することから、本実施の形態では、広帯域符号化装置600について、重複を避けるため、広帯域符号化装置100と相違する構成要素についてのみ説明する。
24からの通知に応じて、格納する予測係数セットの中から通知された1セットを選択し、選択した予測係数セットにおける各重み係数を増幅器103、104、121、604、605にそれぞれ指示する。
図8は、本発明の実施の形態3に係る広帯域LSP予測装置を具備する広帯域符号化装置800の主要な構成要素を示すブロック図である。広帯域符号化装置800は、実施の形態1に係る広帯域符号化装置100において、増幅器801をさらに具備するものである。また、非線形予測部102、加算器122及び予測係数テーブル131は、その基本的動作は同一だが、新たな動作も行うので、非線形予測部102a、加算器122a、予測係数テーブル131aのように表す。従って、広帯域符号化装置800は、広帯域符号化装置100と同一の動作を行う構成要素を多く具備することから、本実施の形態では、広帯域符号化装置800について、重複を避けるため、広帯域符号化装置100と相違する構成要素についてのみ説明する。
算結果(ベクトル)を加算し、その加算結果、すなわち音声信号の広帯域LSPの予測結果を出力する。
予測広帯域LSP
=β2×狭帯域LSP+β1×非線形予測広帯域LSP+β3×コードブックマッピング用の符号帳でベクトル量子化された狭帯域LSP ・・・(2)
予測広帯域LSP
=β2×狭帯域LSP+β1×非線形予測広帯域LSP ・・・(3)
実施の形態3で示した各増幅器で乗ぜられる重み係数は、正の数とは限らない。例えば、各係数の最適値をシミュレーションによって求めると、β1が正の数であるときに、β3は−β1に近い負の値となり、β2は1.0に近い値となることが多い。
予測広帯域LSP
=β1×非線形予測広帯域LSP+β2×(狭帯域LSP−コードブックマッピング用の符号帳でベクトル量子化された狭帯域LSP) ・・・(4)
本発明の実施の形態5に係る広帯域符号化装置の基本的構成は、実施の形態1に係る広帯域符号化装置100と同様である。よって、実施の形態1と異なる構成である非線形予測部102cについて以下説明する。
CV1→CV11+CV21
CV2→CV11+CV22
・
・
・
CV8→CV11+CV28
CV9→CV12+CV21
・
・
・
CV16→CV12+CV28
CV17→CV13+CV21
・
・
・
CV64→CV18+CV28
図19は、本発明の実施の形態6に係る広帯域符号化装置1900の主要な構成要素を示すブロック図である。広帯域符号化装置1900は、実施の形態1に係る広帯域符号化装置100と同一の動作を行う構成要素を多く具備することから、本実施の形態でも、重複を避けるために、広帯域符号化装置100と相違する構成要素についてのみ説明する。
適用可能である。
図23は、本発明の実施の形態7に係る広帯域符号化装置2300の主要な構成要素を示すブロック図である。広帯域符号化装置2300も実施の形態6と同様に、実施の形態1に係る広帯域符号化装置100と同一の動作を行う構成要素を多く具備することから、重複を避けるために、広帯域符号化装置100と相違する構成要素についてのみ説明する。
図26は、本発明の実施の形態8に係る広帯域符号化装置2600の主要な構成要素を示すブロック図である。広帯域符号化装置2600は、実施の形態3に係る広帯域符号化装置800(図8参照)と同一の動作を行う構成要素を多く具備することから、本実施の形態でも、重複を避けるために、広帯域符号化装置800と相違する構成要素についてのみ説明する。
02gへ出力する。非線形予測部102gは、入力された選択情報に基づいて広帯域コードベクトル及び分類用コードベクトルを求め、広帯域コードベクトルを増幅器103へ、分類用コードベクトルを増幅器801へそれぞれ出力する。非線形予測部102gの内部構成は、図27に示した非線形予測部102gと同様であるので、その説明を省略する。
置と同様の機能を実現することができる。
Claims (17)
- 入力された音声信号の量子化狭帯域LSPを、アップサンプリングによって、当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、
非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測する予測手段と、
前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成する生成手段と、
前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする符号化データを求める符号化手段と、
を具備する広帯域符号化装置。 - 前記予測手段は、
非線形予測処理として、コードブックマッピングによるベクトル量子化を用いる、
請求項1記載の広帯域符号化装置。 - 前記予測手段は、
前記第1LSPまたは前記量子化狭帯域LSPを表す基準ベクトルである分類用コードベクトルを複数含んで構成される分類用符号帳と、
前記第1LSPと前記分類用コードベクトルとの誤差、または前記量子化狭帯域LSPと前記分類用コードベクトルとの誤差を算出する誤差算出手段と、
前記分類用符号帳の中から前記誤差算出手段での誤差が最小となる分類用コードベクトルを特定する最小化手段と、
前記分類用コードベクトルに対応付けられた広帯域コードベクトルを複数含んで構成され、前記最小化手段によって特定された分類用コードベクトルに対応付けられた広帯域コードベクトルを出力する広帯域符号帳と、
を具備する、
請求項1記載の広帯域符号化装置。 - 前記生成手段は、
前記第1LSPと前記第2LSPとの重み付け和の代わりに、前記第1LSPと前記第2LSPと前記予測手段の分類用コードベクトルでベクトル量子化された第1LSPとの重み付け和を用いる、
請求項3記載の広帯域符号化装置。 - 前記生成手段は、
前記第1LSPの代わりに、当該第1LSPと前記予測手段の分類用コードベクトルでベクトル量子化された第1LSPとの差を用いる、
請求項3記載の広帯域符号化装置。 - 前記分類用符号帳に含まれる分類用コードベクトル、又は前記広帯域符号帳に含まれる広帯域コードベクトルが多段構成となっている、
請求項3記載の広帯域符号化装置。 - 前記予測手段は、
前記第1LSPまたは前記量子化狭帯域LSPを表す基準ベクトルである分類用コードベクトルを複数含んで構成される分類用符号帳と、
前記第1LSPと前記分類用コードベクトルとの誤差、または前記量子化狭帯域LSPと前記分類用コードベクトルとの誤差を算出する第1誤差算出手段と、
前記分類用符号帳の中から、前記第1誤差算出手段での誤差が小さい分類用コードベクトルを誤差が小さい方から所定数だけ選択する選択手段と、
前記分類用コードベクトルに対応付けられた広帯域コードベクトルを複数含んで構成され、前記選択手段によって選択された所定数の分類用コードベクトルに対応付けられた所定数の広帯域コードベクトルを出力する広帯域符号帳と、
前記音声信号の広帯域LSPと前記所定数の広帯域コードベクトルとの誤差を算出する第2誤差算出手段と、
前記所定数の広帯域コードベクトルの中から前記第2誤差算出手段での誤差が最小となる広帯域コードベクトルを選択すると共に、選択された広帯域コードベクトルに関する選択情報を出力する最小化手段と、
を具備する、
請求項1記載の広帯域符号化装置。 - 前記予測手段は、
前記第1LSPまたは前記量子化狭帯域LSPを表す基準ベクトルである分類用コードベクトルを複数含んで構成される分類用符号帳と、
前記第1LSPと前記分類用コードベクトルとの誤差、または前記量子化狭帯域LSPと前記分類用コードベクトルとの誤差を算出する誤差算出手段と、
前記分類用符号帳の中から、前記誤差算出手段での誤差が小さい分類用コードベクトルを誤差が小さい方から所定数だけ選択する選択手段と、
前記分類用コードベクトルに対応付けられた広帯域コードベクトルを複数含んで構成され、前記選択手段によって選択された所定数の分類用コードベクトルに対応付けられた所定数の広帯域コードベクトルを出力する広帯域符号帳と、
を具備し、
前記符号化手段は、
前記所定数の広帯域コードベクトルの中から、前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする広帯域コードベクトルを出力すると共に、当該広帯域コードベクトルに対応する重み係数を示す符号化データを出力する、
請求項1記載の広帯域符号化装置。 - 前記生成手段は、
前記第1LSPと前記第2LSPとの重み付け和の代わりに、前記第1LSPと前記第2LSPと前記予測手段の分類用コードベクトルでベクトル量子化された第1LSPとの重み付け和を用いる、
請求項8記載の広帯域符号化装置。 - 前記予測手段は、
前記第1LSPまたは前記量子化狭帯域LSPを表す基準ベクトルである分類用コードベクトルを複数含んで構成される分類用符号帳と、
複数の前記分類用コードベクトルに重み係数を乗じた乗算結果を加算した加算結果と前記第1LSPとの誤差、または前記加算結果と前記量子化狭帯域LSPとの誤差を算出し、算出した誤差が最小となる前記重み係数を決定する重み係数決定手段と、
前記分類用コードベクトルに対応付けられた広帯域コードベクトルを複数含んで構成され、前記重み係数決定手段によって決定された重み係数を前記広帯域コードベクトルに乗じた乗算結果を加算する広帯域符号帳と、
を具備する、
請求項1記載の広帯域符号化装置。 - 前記予測広帯域LSPを遅延させる遅延手段をさらに具備し、
前記生成手段は、
前記第1LSPと前記第2LSPとの重み付け和の代わりに、前記第1LSPと前記第2LSPと前記遅延手段で遅延された過去の予測広帯域LSPとの重み付け和を用いる、 請求項1記載の広帯域符号化装置。 - 音声信号の量子化狭帯域LSPから広帯域LSPを予測する広帯域LSP予測装置であって、
アップサンプリングによって、前記量子化狭帯域LSPを当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、
非線形予測処理によって、前記第1LSPから広帯域の第2LSPを予測する予測手段と、
前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成する生成手段と、
を具備する広帯域LSP予測装置。 - 入力された音声信号の狭帯域LSPを符号化して量子化狭帯域LSPを生成する狭帯域符号化手段と、
前記音声信号の広帯域LSPを符号化する広帯域符号化手段と、
を具備し、
前記広帯域符号化手段は、
アップサンプリングによって、前記量子化狭帯域LSPを当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、
非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測する予測手段と、
前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成する生成手段と、
前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする符号化データを求める符号化手段と、
を具備する、
帯域スケーラブル符号化装置。 - 音声信号の量子化狭帯域LSPを示す符号化データを復号して量子化狭帯域LSPを生成する狭帯域復号手段と、
前記音声信号の量子化広帯域LSPに関する符号化データを復号する復号手段と、
前記復号手段によって復号された量子化広帯域LSPに関する情報に従って、前記量子化狭帯域LSPから量子化広帯域LSPを生成する広帯域復号手段と、
を具備し、
前記広帯域復号手段は、
アップサンプリングによって、前記量子化狭帯域LSPを当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、
非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測する予測手段と、
前記情報に従って、前記第1LSPと前記第2LSPとの重み付け和を用いて量子化広帯域LSPを生成する生成手段と、
を具備する、
帯域スケーラブル復号装置。 - 請求項1記載の広帯域符号化装置を具備する通信端末装置。
- 請求項1記載の広帯域符号化装置を具備する基地局装置。
- 入力された音声信号の量子化狭帯域LSPを、アップサンプリングによって、当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換するステップと、
非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測するステップと、
前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成するステップと、
前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする符号化データを求めるステップと、
を具備する広帯域符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006546778A JP4903053B2 (ja) | 2004-12-10 | 2005-12-09 | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004358260 | 2004-12-10 | ||
JP2004358260 | 2004-12-10 | ||
JP2005095345 | 2005-03-29 | ||
JP2005095345 | 2005-03-29 | ||
JP2005286532 | 2005-09-30 | ||
JP2005286532 | 2005-09-30 | ||
PCT/JP2005/022690 WO2006062202A1 (ja) | 2004-12-10 | 2005-12-09 | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
JP2006546778A JP4903053B2 (ja) | 2004-12-10 | 2005-12-09 | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006062202A1 JPWO2006062202A1 (ja) | 2008-06-12 |
JP4903053B2 true JP4903053B2 (ja) | 2012-03-21 |
Family
ID=36578022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006546778A Expired - Fee Related JP4903053B2 (ja) | 2004-12-10 | 2005-12-09 | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8229749B2 (ja) |
EP (1) | EP1818913B1 (ja) |
JP (1) | JP4903053B2 (ja) |
KR (1) | KR20070085982A (ja) |
CN (1) | CN101076853B (ja) |
AT (1) | ATE520124T1 (ja) |
BR (1) | BRPI0515814A (ja) |
WO (1) | WO2006062202A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
WO2009047911A1 (ja) * | 2007-10-12 | 2009-04-16 | Panasonic Corporation | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 |
ES2639572T3 (es) * | 2008-01-16 | 2017-10-27 | Iii Holdings 12, Llc | Cuantificador vectorial, cuantificador inverso vectorial y procedimientos para los mismos |
JP5423684B2 (ja) * | 2008-12-19 | 2014-02-19 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
RU2519027C2 (ru) * | 2009-02-13 | 2014-06-10 | Панасоник Корпорэйшн | Устройство векторного квантования, устройство векторного обратного квантования и способы для этого |
KR101390433B1 (ko) | 2009-03-31 | 2014-04-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템 |
US8447617B2 (en) * | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
CN102870156B (zh) * | 2010-04-12 | 2015-07-22 | 飞思卡尔半导体公司 | 音频通信设备、输出音频信号的方法和通信系统 |
US8000968B1 (en) | 2011-04-26 | 2011-08-16 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
CN102339607A (zh) * | 2010-07-16 | 2012-02-01 | 华为技术有限公司 | 一种频带扩展的方法和装置 |
EP3040988B1 (en) * | 2011-11-02 | 2017-10-25 | Telefonaktiebolaget LM Ericsson (publ) | Audio decoding based on an efficient representation of auto-regressive coefficients |
ES2762325T3 (es) | 2012-03-21 | 2020-05-22 | Samsung Electronics Co Ltd | Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US9524720B2 (en) * | 2013-12-15 | 2016-12-20 | Qualcomm Incorporated | Systems and methods of blind bandwidth extension |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
KR102002681B1 (ko) | 2017-06-27 | 2019-07-23 | 한양대학교 산학협력단 | 생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법 |
US11599773B2 (en) | 2018-12-27 | 2023-03-07 | Micron Technology, Inc. | Neural networks and systems for decoding encoded data |
US11424764B2 (en) | 2019-11-13 | 2022-08-23 | Micron Technology, Inc. | Recurrent neural networks and systems for decoding encoded data |
US11563449B2 (en) | 2021-04-27 | 2023-01-24 | Micron Technology, Inc. | Systems for error reduction of encoded data using neural networks |
US11755408B2 (en) | 2021-10-07 | 2023-09-12 | Micron Technology, Inc. | Systems for estimating bit error rate (BER) of encoded data using neural networks |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3483958B2 (ja) * | 1994-10-28 | 2004-01-06 | 三菱電機株式会社 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
JP3189614B2 (ja) * | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP2956548B2 (ja) | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
CN1178204C (zh) * | 1996-11-07 | 2004-12-01 | 松下电器产业株式会社 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
JP3541680B2 (ja) * | 1998-06-15 | 2004-07-14 | 日本電気株式会社 | 音声音楽信号の符号化装置および復号装置 |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
CN1381041A (zh) * | 2000-05-26 | 2002-11-20 | 皇家菲利浦电子有限公司 | 用于发送在窄带中已编码信号的发送机、用于在接收端扩展已编码信号的频带的接收机、相应的发送和接收方法及系统 |
JP2002055699A (ja) * | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
EP1199711A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
US7113522B2 (en) * | 2001-01-24 | 2006-09-26 | Qualcomm, Incorporated | Enhanced conversion of wideband signals to narrowband signals |
EP1374230B1 (en) * | 2001-11-14 | 2006-06-21 | Matsushita Electric Industrial Co., Ltd. | Audio coding and decoding |
US7752052B2 (en) * | 2002-04-26 | 2010-07-06 | Panasonic Corporation | Scalable coder and decoder performing amplitude flattening for error spectrum estimation |
JP2003323199A (ja) | 2002-04-26 | 2003-11-14 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置及び符号化方法、復号化方法 |
JP3881943B2 (ja) | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
BRPI0306434B1 (pt) * | 2002-09-19 | 2018-06-12 | Nec Corporation | Aparelho e método de decodificação de áudio |
US7254533B1 (en) * | 2002-10-17 | 2007-08-07 | Dilithium Networks Pty Ltd. | Method and apparatus for a thin CELP voice codec |
RU2007108288A (ru) * | 2004-09-06 | 2008-09-10 | Мацусита Электрик Индастриал Ко., Лтд. (Jp) | Устройство масштабируемого кодирования и способ масштабируемого кодирования |
KR100721537B1 (ko) * | 2004-12-08 | 2007-05-23 | 한국전자통신연구원 | 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법 |
US7596491B1 (en) * | 2005-04-19 | 2009-09-29 | Texas Instruments Incorporated | Layered CELP system and method |
CN101199004B (zh) * | 2005-04-22 | 2011-11-09 | 高通股份有限公司 | 用于增益因数平滑的系统、方法及设备 |
-
2005
- 2005-12-09 JP JP2006546778A patent/JP4903053B2/ja not_active Expired - Fee Related
- 2005-12-09 WO PCT/JP2005/022690 patent/WO2006062202A1/ja active Application Filing
- 2005-12-09 KR KR1020077013054A patent/KR20070085982A/ko not_active Application Discontinuation
- 2005-12-09 US US11/721,358 patent/US8229749B2/en active Active
- 2005-12-09 CN CN2005800424845A patent/CN101076853B/zh not_active Expired - Fee Related
- 2005-12-09 BR BRPI0515814-1A patent/BRPI0515814A/pt not_active Application Discontinuation
- 2005-12-09 EP EP05814285A patent/EP1818913B1/en not_active Not-in-force
- 2005-12-09 AT AT05814285T patent/ATE520124T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP1818913A4 (en) | 2009-01-14 |
JPWO2006062202A1 (ja) | 2008-06-12 |
EP1818913B1 (en) | 2011-08-10 |
KR20070085982A (ko) | 2007-08-27 |
BRPI0515814A (pt) | 2008-08-05 |
US20090292537A1 (en) | 2009-11-26 |
EP1818913A1 (en) | 2007-08-15 |
ATE520124T1 (de) | 2011-08-15 |
CN101076853A (zh) | 2007-11-21 |
WO2006062202A1 (ja) | 2006-06-15 |
CN101076853B (zh) | 2010-10-13 |
US8229749B2 (en) | 2012-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4903053B2 (ja) | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 | |
JP5143193B2 (ja) | スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法 | |
JP4394578B2 (ja) | 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 | |
US8364495B2 (en) | Voice encoding device, voice decoding device, and methods therefor | |
RU2509379C2 (ru) | Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре | |
JP3344962B2 (ja) | オーディオ信号符号化装置、及びオーディオ信号復号化装置 | |
JPWO2008047795A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 | |
RU2469421C2 (ru) | Векторный квантователь, инверсный векторный квантователь и способы | |
WO2005112005A1 (ja) | スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法 | |
WO2007132750A1 (ja) | Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法 | |
JPWO2007114290A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 | |
WO2006046587A1 (ja) | スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法 | |
WO2009090875A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 | |
JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP4937746B2 (ja) | 音声符号化装置および音声符号化方法 | |
JP3268750B2 (ja) | 音声合成方法及びシステム | |
JP3428595B2 (ja) | 音声符号化方式 | |
JP4891747B2 (ja) | 信号符号化装置、信号符号化方法、プログラム及び記録媒体 | |
JP2018526669A (ja) | オーディオ信号デコーダのためのビット・エラー検出器 | |
Kumar et al. | A 6.7 kbps vector sum excited linear prediction on TMS320C54X digital signal processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081203 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4903053 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150113 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |