[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4903053B2 - 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 - Google Patents

広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 Download PDF

Info

Publication number
JP4903053B2
JP4903053B2 JP2006546778A JP2006546778A JP4903053B2 JP 4903053 B2 JP4903053 B2 JP 4903053B2 JP 2006546778 A JP2006546778 A JP 2006546778A JP 2006546778 A JP2006546778 A JP 2006546778A JP 4903053 B2 JP4903053 B2 JP 4903053B2
Authority
JP
Japan
Prior art keywords
lsp
wideband
prediction
error
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006546778A
Other languages
English (en)
Other versions
JPWO2006062202A1 (ja
Inventor
宏幸 江原
幸司 吉田
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006546778A priority Critical patent/JP4903053B2/ja
Publication of JPWO2006062202A1 publication Critical patent/JPWO2006062202A1/ja
Application granted granted Critical
Publication of JP4903053B2 publication Critical patent/JP4903053B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Amplifiers (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、音声信号を帯域スケーラブルに符号化する帯域スケーラブル符号化装置、その一部として動作する広帯域符号化装置、広帯域符号化装置に搭載される広帯域LSP(Line Spectrum Pair:線スペクトル対)予測装置、並びにその広帯域符号化装置によって生成された広帯域符号化データ等を復号する帯域スケーラブル復号装置に関する。
信号帯域にスケーラビリティを有するエンベデッド可変レート音声符号化方式は、従来の電話サービスから臨場感のある広帯域音声通信サービスまでをサポートできる音声符号化方式として注目されている。また、スケーラブルな符号化情報は、伝送路上の任意のノードで自由に符号化情報を削減できるので、IP網に代表されるパケット網を利用した通信における輻輳制御に有効である。このような背景から、ITU−T(International Telecommunication Union - Telecommunication standardization sector) SG16(Study Group 16)においても、音声信号の帯域スケーラブルなエンベデッド可変レート符号化方式の標準化が行われている。
一方、音声信号の符号化において、LSPパラメータはスペクトル包絡情報を効率的に表現するパラメータとして広く用いられており、帯域スケーラブル音声符号化においてもLSPパラメータの符号化は、必須要素技術の一つである。
LSPパラメータに帯域スケーラビリティをもたせる場合、狭帯域信号を分析して得られる狭帯域LSPパラメータを用いて広帯域LSPパラメータを予測量子化することになる。そのため、広帯域LSPパラメータの予測量子化における予測精度や量子化効率は、音声信号の帯域スケーラブル符号化性能に直接的な影響を与える重要指標である。
このような広帯域LSPパラメータを予測量子化する技術として、符号化した狭帯域LSPパラメータから広帯域LSPパラメータをコードブックマッピングのような非線形予測技術を用いて予測し、その予測結果と実際の広帯域LSPパラメータとを比較して予測誤差を生成し、生成した予測誤差と符号化した狭帯域LSPパラメータとを共に伝送する技術が知られている(例えば特許文献1参照)。また、コードブックマッピング等を用いて狭帯域LSF(Line Spectral Frequency)パラメータから広帯域LSFパラメータを予測し、予測残差を符号化する技術も知られている(例えば特許文献2参照)。
特表2003−534578号公報 特開平6−118995号公報
しかしながら、特許文献1には、特許文献2に開示された方法で広帯域LSP(LSFと同義)パラメータを予測し、さらに予測残差を符号化する「概念」は示されているものの、その具体的な記述としては、コードブックマッピング技術を用いるという程度である。
ここで、特許文献2に記載の方法で広帯域LSPパラメータを予測する場合、その量子化性能は予測性能に依存し、またその予測性能は変換テーブルの大きさや変換テーブルを学習によって作成する際の学習データ等に依存する。大規模な学習データを用いてサイズの大きな変換テーブルを設計すれば、さまざまな狭帯域信号と広帯域信号とを対応付けら
れるので、一般に高い予測性能が得られる。その一方で、実際のアプリケーションにおいて、巨大な学習データを用いて無限大の変換テーブルを作成し使用することは不可能である。従って、現実には、ある程度限られた規模の学習データを用いて、ある程度現実的なサイズの変換テーブルを作成し使用することになる。変換テーブルのサイズはメモリ量以外にも変換処理に要する演算処理量にも関係することから、メモリ量や演算処理量に制約のあるアプリケーション、例えば携帯端末等で使用されるアプリケーションについては、さらに変換テーブルのサイズを小さくしなければならない。そして、変換テーブルのサイズが小さいと、狭帯域信号と広帯域信号との関連付けが限定されるため、広帯域LSPパラメータの予測性能が低くなる。つまり、この変換テーブルの大きさが十分でなければ、狭帯域LSPパラメータから広帯域LSPパラメータを非線形予測する際の量子化効率が低下してしまい、特に音声信号の特徴が良く現れる低域成分については、非線形予測を行うことによってその品質が却って劣化する場合もある。
このように、特許文献1には、コードブックマッピング技術のみを用いて狭帯域LSPパラメータから広帯域LSPパラメータを予測する場合に生じる技術的課題についての示唆はなく、当然にその解決手段についての思想も開示されていない。つまり、特許文献1に記載の技術に、特許文献2に記載されたようなコードブックマッピング技術をそのまま適用しても、狭帯域LSPパラメータから広帯域LSPパラメータを予測する際の量子化効率と予測精度とを確実に改善することはできない。
よって、本発明の目的は、狭帯域LSPと広帯域LSPとを対応付けた変換テーブルのサイズを抑えつつ、狭帯域LSPから広帯域LSPを高い量子化効率で、かつ、高精度で予測できる広帯域符号化装置等を提供することである。
本発明に係る広帯域符号化装置は、入力された音声信号の量子化狭帯域LSPを、アップサンプリングによって、当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測する予測手段と、前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成する生成手段と、前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする符号化データを求める符号化手段と、を具備する構成を採る。
また、本発明に係る広帯域LSP予測装置は、音声信号の量子化狭帯域LSPから広帯域LSPを予測する広帯域LSP予測装置であって、アップサンプリングによって、前記量子化狭帯域LSPを当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、非線形予測処理によって、前記第1LSPから広帯域の第2LSPを予測する予測手段と、前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成する生成手段と、を具備する構成を採る。
すなわち、本発明によれば、音声信号の量子化狭帯域LSPをアップサンプリングして変換した変換広帯域LSP(第1LSP)と、この変換広帯域LSPを用いて非線形予測を行った非線形予測結果(第2LSP)と、にそれぞれ重み付けを行い、それらの加算結果を用いることにより、量子化狭帯域LSPから音声信号の広帯域LSPを予測する。また、この予測によって得られる予測広帯域LSPと別途入力される広帯域LSPとの間の誤差を求め、これを最小化することにより広帯域LSPの符号化を行う。
また、本発明に係る広帯域符号化装置は、周波数軸方向にスケーラビリティを有する符号化データを生成する帯域スケーラブル符号化装置、及びこれに対応する帯域スケーラブル復号装置に搭載される。
本発明によれば、音声信号の帯域スケーラブル符号化において、変換広帯域LSPや音声信号の広帯域LSPを表す基準ベクトルである各種コードベクトルを複数含んで構成される各種符号帳のサイズを抑え、かつ、量子化狭帯域LSPから音声信号の広帯域LSPを予測する際の量子化効率と予測精度とを共に改善することができる。
以下、本発明に係る実施の形態について、図を適宜参照しながら詳細に説明する。なお、本発明では、音声信号を分析して得られるLSPパラメータを単に「LSP」と称する。また、本発明では、「LSP」の代わりに「ISP(Immittance Spectral Pair)」を使用することもできる。
(実施の形態1)
図1は、本発明の実施の形態1に係る広帯域LSP予測装置を具備する広帯域符号化装置100の主要な構成要素を示すブロック図である。なお、本実施の形態では、広帯域符号化装置100が帯域スケーラブル符号化装置の一部として使用される場合を例にとって説明する。本実施の形態に係る広帯域LSP予測装置、広帯域符号化装置、帯域スケーラブル符号化装置等は、携帯電話等の通信端末装置や基地局装置等に搭載され得るものである。
広帯域符号化装置100は、狭帯域−広帯域変換部101、非線形予測部102、増幅器103、104、121、LSP予測残差符号帳110、加算器122、誤差算出部123、誤差最小化決定部124及び予測係数テーブル131を具備する。また、LSP予測残差符号帳110は、3段階構成の符号帳であり、初段符号帳(CBa)111、第2段符号帳(CBb)112、加算器113、115及び第3段符号帳(CBc)114を具備する。
狭帯域−広帯域変換部101は、図示しない狭帯域LSP量子化器から入力される音声信号の量子化狭帯域LSPを例えば次の式(1)等を用いてアップサンプリングして広帯域LSPに変換し、得られる変換広帯域LSPを非線形予測部102と増幅器104とに入力する。
fw(i)=0.5×fn(i) [ただし、i=0,…,Pn−1]
=0.0 [ただし、i=Pn,…,Pw−1] ・・・(1)
式(1)において、fw(i)は音声信号のi次の広帯域LSP、fn(i)は音声信号のi次の狭帯域LSP、Pnは狭帯域LSPのLSP分析次数、Pwは広帯域LSPのLSP分析次数をそれぞれ示す(例えば特開平11−30997号公報参照)。
非線形予測部102は、狭帯域−広帯域変換部101から入力される変換広帯域LSPを用いて音声信号の広帯域LSPを非線形予測し、その非線形予測結果を増幅器103に入力する。なお、非線形予測部102の内部構成及びその動作等については後述する。
増幅器103は、非線形予測部102から入力される非線形予測結果に対して、後述する予測係数テーブル131から通知される重み係数β(ベクトル要素毎に値を有する)を乗じて、その乗算結果を加算器122に入力する。
増幅器104は、狭帯域−広帯域変換部101から入力される変換広帯域LSPに、予測係数テーブル131から通知される重み係数βを乗じて、その乗算結果を加算器122に入力する。なお、本実施の形態では、増幅器103での乗算結果と増幅器104での乗算結果との加算結果が音声信号の広帯域LSPの予測結果である。
LSP予測残差符号帳110は、音声信号の広帯域LSPを予測した予測結果とその音声信号の広帯域LSPとの残差を表す基準ベクトルであるLSP予測残差コードベクトルを複数含んで構成される符号帳であって、後述する誤差最小化決定部124からの通知に従って、その通知されたLSP予測残差コードベクトルを生成して増幅器121に入力する。
CBa111は、誤差最小化決定部124からの通知に従い、通知された初段コードベクトルを加算器113に入力する。
CBb112も、誤差最小化決定部124からの通知に従い、通知された第2段コードベクトルを加算器113に入力する。
加算器113は、CBa111から入力される初段コードベクトルとCBb112から入力される第2段コードベクトルとを加算して、その加算結果を加算器115に入力する。
CBc114は、誤差最小化決定部124からの通知に従い、通知された第3段コードベクトルを加算器115に入力する。
加算器115は、加算器113から入力される加算結果とCBc114から入力される第3段コードベクトルとを加算し、その加算結果をLSP予測残差コードベクトルとして増幅器121に入力する。
増幅器121は、LSP予測残差符号帳110から入力されるLSP予測残差コードベクトルに、予測係数テーブル131から指示された重み係数βを乗じて、その乗算結果を加算器122に入力する。
加算器122は、増幅器103、104、121からそれぞれ入力される乗算結果(ベクトル)を加算し、その加算結果を量子化広帯域LSP候補として誤差算出部123に入力する。また、加算器122は、後述する誤差最小化決定部124が初段コードベクトル〜第3段コードベクトルと予測係数セットとをそれぞれ決定すると、そのときの加算結果を量子化広帯域LSPとして広帯域符号化装置100の外部へ必要に応じて出力する。この外部へ出力された量子化広帯域LSPは、音声信号を符号化する図示しない他のブロック等での処理に用いられる。
誤差算出部123は、量子化ターゲットとなる音声信号の広帯域LSPと、加算器122から入力される加算結果(量子化広帯域LSP候補)と、の誤差を算出し、算出した誤差を誤差最小化決定部124に入力する。なお、誤差算出部123で算出される誤差は、入力されたLSPベクトル間の二乗誤差で良い。また、入力されたLSPベクトルの特徴に応じて重み付けを行なうようにすれば、さらに聴感上の品質を良くすることができる。例えば、ITU−T勧告G.729では、3.2.4章(Quantization of the LSP coefficients)の(21)式の重み付け二乗誤差(重み付けユークリッド距離)を用いて誤差最小化を行なう。
誤差最小化決定部124は、誤差算出部123から入力される誤差が最小となる初段コードベクトル〜第3段コードベクトルと予測係数セットとを決定して、決定した初段コードベクトル〜第3段コードベクトルと予測係数セットとを示す符号化データを生成し、生成した符号化データを図示しない無線送信部等に入力する。なお、誤差最小化決定部124は、誤差算出部123から入力される誤差が最小となる初段コードベクトル〜第3段コードベクトルと予測係数セットとを決定するに際して、CBa111、CBb112及びCBc114と予測係数テーブル131とに対し、その出力を順次変更するように通知する。即ち、誤差最小化決定部124は、符号化データで示される初段コードベクトル〜第3段コードベクトルと予測係数セットとを試行錯誤的に決定する。
予測係数テーブル131は、増幅器103、104、121に指示する重み係数の組み合わせである予測係数セットを複数格納しており、誤差最小化決定部124からの通知に従い、格納している予測係数セットの中から通知された1セットを選択し、選択した予測係数セットに含まれる重み係数を使用するように、増幅器103、104、121にそれぞれ指示する。
なお、広帯域符号化装置100は、図示しない無線送信部を具備し、音声信号の量子化狭帯域LSPを所定の方式で符号化した符号化データと、誤差最小化決定部124から入力される量子化広帯域LSP候補と音声信号の広帯域LSPとの誤差が最小となる初段コードベクトル〜第3段コードベクトルと予測係数セットとを示す符号化データ即ち量子化広帯域LSPを構成する符号化データと、を含む無線信号を生成し、生成した無線信号を後述する広帯域復号装置300を搭載する携帯電話等の通信端末装置に無線送信する。なお、広帯域符号化装置100から送信された無線信号は、一旦基地局装置に受信され増幅等された後に、広帯域復号装置300に受信される。
図2は、本実施の形態における非線形予測部102の主要な内部構成を示すブロック図である。非線形予測部102は、誤差算出部201、最小化部202、分類用符号帳210及び広帯域符号帳220を具備する。また、分類用符号帳210は、分類用コードベクトル(CVk:k=1〜n)を格納するn個の分類用コードベクトル格納部211及び選択部212を具備する。また、広帯域符号帳220は、広帯域コードベクトル(CVk’:k=1〜n)を格納するn個の広帯域コードベクトル格納部221及び選択部222を具備する。ここで、1つの分類用コードベクトル格納部211には、1種類のCVkが格納されているものとし、同様に1つの広帯域コードベクトル格納部221には、1種類のCVk’が格納されているものとする。なお、図2では、同様の機能を発揮する複数の構成要素に対してそれぞれ異なる枝番号を付しているが、本明細書では、これらの構成要素について総括的に説明する場合には、その枝番号を省略する。
狭帯域−広帯域変換部101は、狭帯域LSPの次元数を単に広帯域LSPの次元数に変換するアップサンプリングを行う。このアップサンプリングによれば、広帯域LSPに狭帯域LSPの特徴が反映され、変換広帯域LSPの低域部(狭帯域LSPが定義される帯域)に元の狭帯域LSPの特徴が現れる。よって、狭帯域−広帯域変換部101で得られる変換広帯域LSPは、アップサンプリングによって見かけ上広帯域となっているが、音声信号としては実質的に狭帯域のデータのままである。非線形予測部102は、この変換広帯域LSPを、狭帯域用の符号帳(分類用符号帳210)及び広帯域用の符号帳(広帯域符号帳220)を用いて下記のようにコードブックマッピングによるベクトル量子化を行い、得られるコードベクトルを音声信号の広帯域LSPの非線形予測結果として出力する。
誤差算出部201は、狭帯域−広帯域変換部101から入力される変換広帯域LSPと、後述する分類用符号帳210から順次入力されるCVk(k=1〜n)と、の2乗誤差を逐次算出し、その算出結果を最小化部202に入力する。なお、誤差算出部201は、ベクトルのユークリッド距離(即ち2乗誤差)を算出しても良いし、ベクトルの重み付けユークリッド距離(即ち重み付け2乗誤差)を算出しても良い。
最小化部202は、誤差算出部201から変換広帯域LSPとCVkとの2乗誤差が入力されるごとに、分類用符号帳210から誤差算出部201にCVk+1が入力されるように選択部212に対して指示するとともに、CV1〜CVnについての2乗誤差を蓄積し、蓄積した中で最小の2乗誤差を示すCVkを特定して、その特定したCVkの「k」を広帯域符号帳220における選択部222に通知する。
分類用符号帳210は、CVkを複数含んで構成され、最小化部202から指示されたCVkを誤差算出部201に入力する。
分類用コードベクトル格納部211は、変換広帯域LSPを表す基準ベクトルであるCVkをそれぞれ格納し、選択部212によって誤差算出部201と接続されたときに、格納するCVkを選択部212を介して誤差算出部201に入力する。
選択部212は、最小化部202からの指示に従って、誤差算出部201に接続する分類用コードベクトル格納部211−1〜211−nを順次切り替えて、CV1〜CVnを順次誤差算出部201に入力する。
広帯域符号帳220は、CVkに対応付けされたCVk’を複数含んで構成され、最小化部202からの通知に応じて、最小化部202の特定したCVkに対応付けられたCVk’を非線形予測結果として選出して、その選出した非線形予測結果を増幅器103に入
力する。
広帯域コードベクトル格納部221は、CVkそれぞれと対応付けされたCVk’を複数含んで構成され、後述する選択部222によって増幅器103と接続されたときに、保持するCVk’を増幅器103に入力する。なお、CVkとCVk’との対応付けは、学習データを用いて設計される。具体的には、学習データとなる音声信号から対となる狭帯域スペクトルデータと広帯域スペクトルデータとを生成し、狭帯域スペクトルデータ(又は広帯域スペクトルデータ)をLBGアルゴリズム等によってnクラスにクラスタリングしてCVkを作成する。そして、各クラスにクラスタリングされたスペクトルデータの対となっている広帯域スペクトルデータ(又は狭帯域スペクトルデータ)の平均値を求めて広帯域のnクラスのCVk’を作成することにより、CVkとCVk’との対応付けを行う。
選択部222は、最小化部202からkを通知されたときに、最小化部202の特定したCVkに対応付けされたCVk’を格納する広帯域コードベクトル格納部221と増幅器103とを接続する。
このように、本実施の形態では、非線形予測部102において、コードブックマッピング技術を用いた非線形予測が行われる。
図3は、本実施の形態に係る広帯域LSP予測装置を具備する広帯域復号装置300の主要な構成要素を示すブロック図である。広帯域復号装置300は、狭帯域−広帯域変換部101、非線形予測部102、増幅器103、104、121、LSP予測残差符号帳110、加算器122、予測係数テーブル131及びインデックス復号部324を具備する。従って、広帯域復号装置300は、広帯域符号化装置100の構成要素と同一の構成要素を多く具備するため、本実施の形態では、このような同一の構成要素については、その説明を省略する。
インデックス復号部324は、広帯域符号化装置100から送信された無線信号に含まれる量子化広帯域LSPを構成する符号化データを受け取り、広帯域復号装置300におけるLSP予測残差符号帳110のCBa111、CBb112及びCBc114と予測係数テーブル131とに対して、これらが出力すべき初段コードベクトル〜第3段コードベクトルや予測係数セットを通知する。
なお、広帯域復号装置300は、図示しない無線受信部を具備し、この無線受信部において、広帯域符号化装置100から送信された無線信号を受信し、その無線信号に含まれる音声信号の量子化狭帯域LSPを示す符号化データ及び量子化広帯域LSPを構成する符号化データを取り出す。また、広帯域復号装置300は、図示しない狭帯域LSP復号部を具備し、この狭帯域LSP復号部において、無線受信部で取り出した音声信号の量子化狭帯域LSPを復号する。そして、広帯域復号装置300において、図示しない無線受信部は、その取り出した量子化広帯域LSPを構成する符号化データをインデックス復号部324に入力し、また図示しない狭帯域LSP復号部は、復号した音声信号の量子化狭帯域LSPを狭帯域−広帯域変換部101に入力する。
従って、広帯域復号装置300は、広帯域符号化装置100と同一の構成要素を具備し、広帯域符号化装置100によって生成された音声信号の量子化狭帯域LSPと量子化広帯域LSPを構成する符号化データとに基づいて、これらの構成要素を動作させることにより、広帯域符号化装置100の生成した量子化広帯域LSPと同一の量子化広帯域LSPを生成することになる。
このように、本実施の形態では、重み係数βを乗じた非線形予測結果と重み係数βを乗じた変換広帯域LSPとの和によって音声信号の広帯域LSPを予測し、またその予測結果と実際の音声信号の広帯域LSPとの残差を算出してその残差に最も近似するLSP予測残差コードベクトルを生成する。さらに、本実施の形態では、音声信号の広帯域LSPの予測結果とLSP予測残差コードベクトルに重み係数βを乗じたベクトルとを加算することにより、量子化広帯域LSPを生成する。つまり、本実施の形態によれば、従来法のように非線形予測のみ又はアップサンプルのみによって音声信号の広帯域LSPを予測するのではなく、非線形予測による予測値とアップサンプルによる予測値とを共に最大限に利用する。そのため、本実施の形態によれば、音声信号の量子化狭帯域LSPから音声信号の広帯域LSPを予測する場合の予測性能を高めることができ、その結果として、この場合における量子化性能も改善することができる。
また、本実施の形態では、同一フレーム内の互いに類似するこれらの値を同時に考慮しているので、フレーム内相関を利用して予測を行っていることとなり、予測性能を高めることができ、その結果として、この場合における量子化性能も改善することができる。
また、本実施の形態によれば、量子化広帯域LSP候補がそれぞれ異なる信号処理によって生成されたベクトルの組み合わせで構成されることから、非線形予測部102の予測性能が低い場合でも、予測係数テーブル131が増幅器103、104、121に指示する重み係数を適宜調節することにより、量子化広帯域LSPの予測精度を改善することができる。従って、本実施の形態によれば、非線形予測部102の予測性能についての要求条件を緩和することができる。ここで、一般に、非線形予測の予測性能が高いほど、非線形予測に必要なメモリ量や演算処理量は多くなる。そのため、前述のように非線形予測の予測性能についての要求条件が緩和されるということは、そのメモリ量や演算処理量を少なく抑えることができるということである。つまり、本実施の形態によれば、非線形予測部102におけるメモリ量や演算処理量に制約がある場合でも、その定められたメモリ量や演算処理量の範囲内で、非線形予測の予測効果を最大限利用することができる。換言すれば、本実施の形態によれば、量子化広帯域LSPの予測性能を高性能化できると同時に、複数の予測成分及びそれらに乗じる重み係数を自由に設計したり設定したりできるという設計自由度の向上が図られることから、広帯域符号化装置について、誤り耐性と量子化性能とのバランスを任意に設定することができる。
なお、本実施の形態について、以下のように変形したり応用したりしても良い。
本実施の形態では、非線形予測部102においてコードブックマッピング技術を使用して非線形予測を行う場合について説明したが、本発明はこの場合に限定されるものではなく、例えば非線形予測部102においてニューラルネットや変換関数を用いた写像変換等を使用して非線形予測を行っても良い。
また、本実施の形態では、非線形予測部102において、CVkとCVk’とが一対一で対応付けされる場合について説明したが、本発明はこの場合に限定されるものではなく、例えば1つのCVkに複数のCVk’が対応付けられ、さらに分類用符号帳210から広帯域符号帳220にCVk’の選出に必要な情報が伝送されるようにしても良い。このようにすれば、非線形予測部102における非線形予測に必要な伝送データ量を殆ど増加させることなく、非線形予測性能を効果的に改善することができる。
また、本実施の形態では、非線形予測部102の主要な内部構成が図2に示す態様である場合について説明したが、本発明はこの場合に限定されるものではなく、例えば非線形予測部102の主要な内部構成が図4に示す態様であっても良い。
ここで、図4は、本実施の形態の変形例における非線形予測部102の主要な内部構成を示すブロック図である。この変形例においても、非線形予測部102はコードブックマッピング技術を使用して非線形予測を行う。
図4に示す変形例において、非線形予測部102は、分類用コードベクトル格納部211、広帯域コードベクトル格納部221、重み係数決定部401及び重み付け和算出部402を具備する。この変形例において、分類用コードベクトル格納部211と広帯域コードベクトル格納部221とは、本実施の形態と同様に対応付けされており、重み係数決定部401はCVkそれぞれに重み係数を試行錯誤的に乗じて、それらの乗算結果と変換広帯域LSPとの誤差が最小となる重み係数の組み合わせを決定し、決定した重み係数の組み合わせを重み付け和算出部402に通知する。
重み付け和算出部402は、重み係数決定部401から決定された重み係数の組み合わせを通知されると、CVkに対応付けられたCVk’を広帯域コードベクトル格納部221から取り出し、取り出したCVk’に通知された重み係数をそれぞれ乗じてその乗算結果を加算し、その加算結果を非線形予測結果として、増幅器103に入力する。
このように、図4に示す変形例によれば、非線形予測部102から増幅器103に入力される非線形予測結果が重み係数をそれぞれ乗じた複数のCVk’の総和で構成されるため、非線形予測結果の微細な調節が可能となり、非線形予測部102の予測性能を一層高めることができる。
また、本発明において、非線形予測部102の主要な内部構成は、例えば図5に示す態様であっても良い。ここで、図5は、本実施の形態の変形例における非線形予測部102の主要な内部構成を示すブロック図である。
図5に示す変形例では、非線形予測部102は複数の変換関数を用いて非線形予測を行う。この変形例において、非線形予測部102は、重み係数決定部501、重み付け和算出部502及び変換関数k(k=1〜m)をそれぞれ保持するm個の変換関数保持部511を具備する。
変換関数保持部511はそれぞれ、狭帯域−広帯域変換部101から入力される変換広帯域LSPを保持する変換関数k(k=1〜m)を用いてベクトル変換し、変換後のベクトルを重み付け和算出部502に入力する。なお、変換関数kは、予め学習データを用いて作成することができるが、特に限定されるものではない。
重み係数決定部501は、変換関数保持部511から重み付け和算出部502へ入力されるベクトルに乗じる重み係数をそれぞれ決定する。すなわち、狭帯域−広帯域変換部101から入力される変換広帯域LSPを用いて、上記の重み係数を決定して、決定した重み係数を重み付け和算出部502に通知する。この重み係数の決定方法としては、例えば特定の代表ベクトルに近い入力ベクトルに対して特定の変換関数を学習して設計し、各変換関数に割り当てられた代表ベクトルとの類似度を基にして決定する方法等が挙げられる。
重み付け和算出部502は、重み係数決定部501から通知された重み係数を変換関数保持部511から入力される各ベクトルに乗じて、その乗算結果を全て加算し、その加算結果を非線形予測結果として増幅器103に入力する。
また、本実施の形態では、LSP予測残差符号帳110及び予測係数テーブル131は、非線形予測部102と関連付けられていない場合について説明したが、本発明はこの場
合に限定されるものではなく、例えば非線形予測部102内で決定された分類結果kや重み係数セットを利用して変換広帯域LSPのクラス分けを行い、決定されたクラス毎に異なるLSP予測残差符号帳110や予測係数テーブル131を切り替えて使用するようにしても良い。このように、LSP予測残差符号帳や予測係数テーブルのマルチモード化を行えば、非線形予測処理途中に得られる情報を利用するだけであるため、モード判定のための追加処理や新たな伝送情報を必要とすることなく、非線形予測部102の予測性能を一層改善することができる。
(実施の形態2)
図6は、本発明の実施の形態2に係る広帯域LSP予測装置を具備する広帯域符号化装置600の主要な構成要素を示すブロック図である。広帯域符号化装置600は、実施の形態1に係る広帯域符号化装置100において、加算器122及び予測係数テーブル131の代わりに加算器622及び予測係数テーブル631を具備し、さらに遅延器601、612、除算器602及び増幅器603、604、605を具備するものである。従って、広帯域符号化装置600は、広帯域符号化装置100と同一の動作を行う構成要素を多く具備することから、本実施の形態では、広帯域符号化装置600について、重複を避けるため、広帯域符号化装置100と相違する構成要素についてのみ説明する。
遅延器601は、狭帯域−広帯域変換部101から入力される変換広帯域LSPを1フレームの時間遅延させて、遅延させた1フレーム前の変換広帯域LSPを除算器602に入力する。
除算器602は、遅延器601から入力される1フレーム前の変換広帯域LSPを、後述する遅延器612から入力される1フレーム前の量子化広帯域LSPで除して、その除算結果を増幅器603に入力する。
増幅器603は、狭帯域−広帯域変換部101から入力される変換広帯域LSPに対して除算器602から入力される除算結果を増幅係数として乗じて、その乗算結果を増幅器604に入力する。
増幅器604は、予測係数テーブル631から指示された重み係数βを、増幅器603から入力される変換広帯域LSPに乗じて、その乗算結果を加算器622に入力する。
増幅器605は、遅延器612から入力される1フレーム前の量子化広帯域LSPに、予測係数テーブル631から指示された予測係数βを乗じて、その乗算結果を加算器622に入力する。
加算器622は、増幅器103、104、121、604、605からそれぞれ入力される乗算結果を加算し、その加算結果即ち量子化広帯域LSP候補を誤差算出部123に入力する。なお、誤差最小化決定部124で決定された誤差を最小とする初段コードベクトル〜第3段コードベクトルと予測係数セットとを用いたときに加算器622から出力される量子化広帯域LSPは、遅延器612に入力されるとともに、広帯域符号化装置600の外部へ必要に応じて出力する。
遅延器612は、加算器622から入力される量子化広帯域LSPを1フレームの時間遅延させて、その1フレーム前の量子化広帯域LSPを除算器602と増幅器605とにそれぞれ入力する。
予測係数テーブル631は、増幅器103、104、121、604、605に指示する重み係数の組み合わせである予測係数セットを複数格納しており、誤差最小化決定部1
24からの通知に応じて、格納する予測係数セットの中から通知された1セットを選択し、選択した予測係数セットにおける各重み係数を増幅器103、104、121、604、605にそれぞれ指示する。
図7は、本発明の実施の形態2に係る広帯域LSP予測装置を具備する広帯域復号装置700の主要な構成要素を示すブロック図である。広帯域復号装置700は、実施の形態1に係る広帯域復号装置300において、加算器122及び予測係数テーブル131の代わりに加算器622及び予測係数テーブル631を具備し、さらに遅延器601、612、除算器602及び増幅器603、604、605を具備するものである。従って、広帯域復号装置700の主要な構成要素は全て、広帯域復号装置300や広帯域符号化装置600の構成要素と同一の動作を行うことから、本実施の形態では、重複を避けるため、広帯域復号装置700についての説明を省略する。
このように、本実施の形態によれば、広帯域符号化装置600又は広帯域復号装置700において、量子化狭帯域LSPから音声信号の広帯域LSPを予測するに際して、1フレーム前の量子化広帯域LSPが用いられるため、フレーム間相関とフレーム内相関とを効率的に利用して、音声信号の帯域スケーラブル符号化又はその復号における予測性能を改善することができる。
なお、本実施の形態でも、実施の形態1と同様に、非線形予測部102の内部構成を図4及び図5に示す態様としても良い。さらに、本実施の形態でも、非線形予測部102の内部で得られる情報を用いて変換広帯域LSPのクラス分類を行い、LSP予測残差符号帳110と予測係数テーブル631との少なくとも一方を分類されたクラスに応じて切り替える、マルチモード構成にしても良い。
(実施の形態3)
図8は、本発明の実施の形態3に係る広帯域LSP予測装置を具備する広帯域符号化装置800の主要な構成要素を示すブロック図である。広帯域符号化装置800は、実施の形態1に係る広帯域符号化装置100において、増幅器801をさらに具備するものである。また、非線形予測部102、加算器122及び予測係数テーブル131は、その基本的動作は同一だが、新たな動作も行うので、非線形予測部102a、加算器122a、予測係数テーブル131aのように表す。従って、広帯域符号化装置800は、広帯域符号化装置100と同一の動作を行う構成要素を多く具備することから、本実施の形態では、広帯域符号化装置800について、重複を避けるため、広帯域符号化装置100と相違する構成要素についてのみ説明する。
非線形予測部102aは、後述の通り、その非線形予測結果を増幅器801にも入力する。
予測係数テーブル131aは、増幅器103、104、121、801に指示する重み係数の組み合わせである予測係数セットを複数格納しており、誤差最小化決定部124からの通知に従い、格納している予測係数セットの中から通知された1セットを選択し、選択した予測係数セットに含まれる重み係数を使用するように、増幅器103、104、121、801にそれぞれ指示する。
増幅器801は、非線形予測部102aから入力される非線形予測結果に対して、予測係数テーブル131aから通知される重み係数βを乗じて、その乗算結果を加算器122aに入力する。
加算器122aは、増幅器103、104、121、801からそれぞれ入力される乗
算結果(ベクトル)を加算し、その加算結果、すなわち音声信号の広帯域LSPの予測結果を出力する。
なお、本実施の形態では、説明を簡単にするため、各重み係数の表記を実施の形態1と同じくしているが、これらの値は設計段階における最適化によって定まる値であり、実際の値は実施の形態1とは異なる。
図9は、本実施の形態における非線形予測部102aの主要な内部構成を示すブロック図である。
実施の形態1における非線形予測部102は、狭帯域−広帯域変換部101から入力される変換広帯域LSPと最も近似するコードベクトルを、分類用符号帳210から選択し、そのコードベクトルに対応する広帯域符号帳220のコードベクトルを増幅器103へ出力する。これに対し、本実施の形態における非線形予測部102aは、分類用符号帳210で最終的に選択されたコードベクトルを増幅器801へ出力する。
図10は、本実施の形態に係る広帯域LSP予測装置を具備する広帯域復号装置1000の主要な構成要素を示すブロック図である。なお、広帯域復号装置1000は、実施の形態1に係る広帯域復号装置300と同様の基本的構成を採っており、また増幅器801等についても既に説明しているので、ここでは説明を省略する。
このように、本実施の形態によれば、実質的には狭帯域LSPである変換広帯域LSPと、コードブックマッピング後の広帯域LSP(非線形予測広帯域LSP)と、コードブックマッピング用の符号帳でベクトル量子化された変換広帯域LSPと、の3つのLSPの重み付け和をもって音声信号の広帯域LSPの予測結果としている。すなわち、音声信号の広帯域LSPを予測する予測広帯域LSPは、以下の式(2)で表される。
予測広帯域LSP
=β×狭帯域LSP+β×非線形予測広帯域LSP+β×コードブックマッピング用の符号帳でベクトル量子化された狭帯域LSP ・・・(2)
一方、実施の形態1では、狭帯域LSPをコードブックマッピングによって広帯域LSPに変換し、変換前後のLSPの重み付け和を広帯域LSPの予測結果としているので、予測広帯域LSPは、以下の式(3)で表されることになる。
予測広帯域LSP
=β×狭帯域LSP+β×非線形予測広帯域LSP ・・・(3)
よって、実施の形態1と比較して、コードブックマッピング用の符号帳でベクトル量子化された狭帯域LSPもさらに考慮していることとなるため、予測性能がさらに向上し、符号化性能を向上させることができる。
なお、本実施の形態は、実施の形態2と組み合わせることもできる。図11、12は、本実施の形態を実施の形態2と組み合わせた場合の広帯域符号化装置1100及び広帯域復号装置1200の主要な構成要素を示すブロック図である。基本的動作は既に示した通りであるので説明を省略する。
(実施の形態4)
実施の形態3で示した各増幅器で乗ぜられる重み係数は、正の数とは限らない。例えば、各係数の最適値をシミュレーションによって求めると、βが正の数であるときに、βは−βに近い負の値となり、βは1.0に近い値となることが多い。
かかる状況下では、上記式(2)は、狭帯域−広帯域変換部101から入力される狭帯域LSPと狭帯域用の符号帳に格納されているコードベクトルとの重み付け誤差を、広帯域用の符号帳から出力されるコードベクトルに加算することによって、予測広帯域LSPを求めていることに相当する。このとき、実施の形態3で示した非線形予測部102a、増幅器801、加算器122aの全体を、1つの非線形予測部102bとみなすことができる。
図13は、本発明の実施の形態4に係る広帯域LSP予測装置を具備する広帯域符号化装置1300の主要な構成要素を示すブロック図である。なお、広帯域符号化装置1300も、実施の形態1に係る広帯域符号化装置100と同一の動作を行う構成要素を多く具備する。
この構成によれば、β=−βとして、減算器1301が狭帯域LSPとコードブックマッピング用の符号帳でベクトル量子化された狭帯域LSPとの差を算出することにより、予測広帯域LSPを下記の式(4)のように求めることができる。
予測広帯域LSP
=β×非線形予測広帯域LSP+β×(狭帯域LSP−コードブックマッピング用の符号帳でベクトル量子化された狭帯域LSP) ・・・(4)
図14は、本実施の形態に係る広帯域LSP予測装置を具備する広帯域復号装置1400の主要な構成要素を示すブロック図である。基本的動作は既に示した通りであるので説明を省略する。
このように、本実施の形態によれば、上記式(4)の予測モデルを用いることにより、予測係数(重み係数)の数を1つ減らすことができ、その分のメモリ量を節約することができる。
なお、本実施の形態は、実施の形態2と組み合わせることもできる。図15、16は、本実施の形態を実施の形態2と組み合わせた場合の広帯域符号化装置1500及び広帯域復号装置1600の主要な構成要素を示すブロック図である。これらも基本的動作は既に示した通りであるので説明を省略する。
(実施の形態5)
本発明の実施の形態5に係る広帯域符号化装置の基本的構成は、実施の形態1に係る広帯域符号化装置100と同様である。よって、実施の形態1と異なる構成である非線形予測部102cについて以下説明する。
図17は、非線形予測部102cの主要な内部構成を示すブロック図である。
非線形予測部102cは、実施の形態1に示した広帯域符号帳220(図2参照)が多段構成となっている。すなわち、本実施の形態に係る広帯域符号帳220cはマルチステージ化されている。図17の例では、2ステージ化である。ここで、xは広帯域符号帳220cの初段符号帳221−11〜221−1xが格納するコードベクトル数を示しており、yは広帯域符号帳220cの2段目符号帳221−21〜221−2yが格納するコードベクトル数を示している。両者にはn=x×yの関係がある。
分類用符号帳210の分類用コードベクトルCVkと広帯域符号帳220cから生成される広帯域コードベクトルCVk’との対応付けは、例えば以下のように予め設計しておく。ここでは、x=8、y=8、n=64の場合を例にとって説明する。
CV1→CV11+CV21
CV2→CV11+CV22



CV8→CV11+CV28
CV9→CV12+CV21



CV16→CV12+CV28
CV17→CV13+CV21



CV64→CV18+CV28
上記のように、分類用コードベクトルCVkと広帯域コードベクトルCVk’とを対応付けておけば、分類用符号帳210から選択されたコードベクトルのインデックスの上位3ビットが、広帯域符号帳220cの初段符号帳221−11〜221−1xから選択されるコードベクトル番号となり、また、分類用符号帳210から選択されたコードベクトルのインデックスの下位3ビットが、広帯域符号帳220cの2段目符号帳221−21〜221−2yから選択されるコードベクトル番号となる。よって、分類用コードベクトルCVkと広帯域コードベクトルCVk’との対応関係を別個のメモリに保持しておく必要がない。
このように、本実施の形態によれば、分類用符号帳210又は広帯域符号帳220の少なくとも一方をマルチステージ化するので、非線形予測処理に必要なメモリ量を削減することができる。
なお、実施の形態1において、広帯域符号帳220ではなく分類用符号帳210の方をマルチステージ化する構成も可能である。しかし、広帯域符号帳220の方が分類用符号帳210よりもベクトルの次元数が多い場合、広帯域符号帳220の方をマルチステージ化した方がメモリの削減量は大きくなる。
また、本実施の形態は、実施の形態3、4にも適用することができる。この場合、実施の形態3で示した非線形予測部102aは図18に示す非線形予測部102cのようになる。
(実施の形態6)
図19は、本発明の実施の形態6に係る広帯域符号化装置1900の主要な構成要素を示すブロック図である。広帯域符号化装置1900は、実施の形態1に係る広帯域符号化装置100と同一の動作を行う構成要素を多く具備することから、本実施の形態でも、重複を避けるために、広帯域符号化装置100と相違する構成要素についてのみ説明する。
広帯域符号化装置1900は、コードブックマッピングの候補を選択し、この選択に関する情報を広帯域復号装置に出力する。具体的には、分類用符号帳から複数の候補コードベクトルを選択し、これらの中から最も入力広帯域LSPベクトルとの誤差が小さいものを選択し、この選択情報を符号化データと共に広帯域復号装置に伝送する。
図20は、非線形予測部102dの主要な内部構成を示すブロック図である。
候補選択部2001は、実施の形態1に示した最小化部202と同様に、2乗誤差を最小とする1つの分類用コードベクトルを選択する。さらに、候補選択部2001は、2乗誤差が小さい順に複数の分類用コードベクトル(候補コードベクトル)を選択し、広帯域符号帳220に対し、選択した複数の候補コードベクトルにそれぞれ対応する複数の広帯域コードベクトルを出力するように指示する。なお、図20では候補数が4の場合を例にとっている。以下の説明においても候補数は4とする。
広帯域符号帳220は、候補選択部2001から指示された4つの広帯域コードベクトルを候補コードベクトル符号帳2002に出力する。
候補コードベクトル符号帳2002は、入力された複数の広帯域コードベクトルを候補コードベクトル格納部CVa〜CVdに格納する。このとき、4つの広帯域コードベクトルは、誤差算出部201で算出された誤差が小さい方から、CVa、CVb、CVc、CVdに順に格納される。これら4つの広帯域コードベクトルは、誤差最小化決定部2006からの指示に従って1つずつ誤差算出部2005に出力される。
誤差算出部2005は、入力された広帯域LSPと広帯域コードベクトルとの誤差を誤差算出部201と同様に算出し、誤差最小化決定部2006に出力する。
誤差最小化決定部2006は、候補コードベクトル符号帳2002に格納された複数の広帯域コードベクトルの中から、最も入力広帯域LSPベクトルとの誤差が小さくなるものを帰還制御によって求める。具体的には、誤差最小化決定部2006は、実施の形態1に示した最小化部202と同様に、候補コードベクトル符号帳2002に格納された4つの広帯域コードベクトルの中から、誤差算出部2005から出力される誤差が最小となるコードベクトルを1つ選択し、候補コードベクトル符号帳2002に対し、この選択された広帯域コードベクトルを増幅器103へ出力するように指示する。また、誤差最小化決定部2006は、この選択された広帯域コードベクトルに関する情報(選択情報)も出力する。
図21は、本実施の形態に係る広帯域符号化装置1900で生成された符号化データ及び選択情報を復号する広帯域復号装置2100の主要な構成要素を示すブロック図である。広帯域復号装置2100は、実施の形態1に係る広帯域復号装置300と同一の動作を行う構成要素を多く具備することから、重複を避けるために、広帯域復号装置300と相違する構成要素についてのみ説明する。
非線形予測部102eは、上記の非線形予測部102dから伝送されてきた選択情報が入力され、この選択情報に基づく非線形予測結果を増幅器103へ出力する。図22は、非線形予測部102eの主要な内部構成を示すブロック図である。
選択情報復号部2201以外の構成は、上記の非線形予測部102dと同一であるのでその説明を省略する。選択情報復号部2201は、入力された選択情報を復号し、この選択情報で特定されたコードベクトルを出力するように、候補コードベクトル符号帳2002に指示を出す。
このように、本実施の形態によれば、分類用符号帳から複数の候補を選択し、予測誤差又は量子化誤差を最小とするコードベクトルを複数の候補の中からさらに選択するので、非線形予測の予測精度を改善することができる。
なお、本実施の形態に係る非線形予測部102d、102eは、実施の形態3、4にも
適用可能である。
(実施の形態7)
図23は、本発明の実施の形態7に係る広帯域符号化装置2300の主要な構成要素を示すブロック図である。広帯域符号化装置2300も実施の形態6と同様に、実施の形態1に係る広帯域符号化装置100と同一の動作を行う構成要素を多く具備することから、重複を避けるために、広帯域符号化装置100と相違する構成要素についてのみ説明する。
本実施の形態では、非線形予測部102fが、量子化結果(誤差最小化決定部124fの出力)を用いてコードブックマッピングの候補を選択する点が実施の形態6と異なる。よって、非線形予測部102f内部で広帯域LSPとの誤差を最小化することはせず、非線形予測部102f外部の誤差最小化決定部124fが、広帯域LSPとの誤差を最小化する帰還制御を行う。
非線形予測部102fは、誤差最小化決定部124fからの指示に従い、所定数の非線形予測結果を増幅器103へ順次出力する。図23の例では、非線形予測部102fは、CVa〜CVdに格納されている4つのコードベクトルを所定数の非線形予測結果として増幅器103へ出力する。
誤差最小化決定部124fは、この所定数の非線形予測結果を各々用いた場合の初段コードベクトル〜第3段コードベクトルと予測係数とのセットを決定する。そして、これらのパラメータの中で、誤差算出部123から出力される誤差が最も小さくなる非線形予測結果を求め、この非線形予測結果及び当該非線形予測結果を用いた場合に決定される初段コードベクトル〜第3段コードベクトルと予測係数とのセットとを符号化データとして無線送信部(図示せず)等へ出力する。
図24は、非線形予測部102fの主要な内部構成を示すブロック図である。実施の形態6に示した非線形予測部102dと同一の構成については、重複を避けるため説明を省略する。
候補コードベクトル符号帳2002は、誤差最小化決定部124fからの指示情報が入力され、その指示情報に基づいて1つのコードベクトルを選択し、増幅器103へ出力する。
図25は、本実施の形態に係る広帯域符号化装置2300で生成された符号化データを復号する広帯域復号装置2500の主要な構成要素を示すブロック図である。
広帯域符号化装置2300が生成した符号化データには、実施の形態1で示した情報に加えて、非線形予測部102fから出力される非線形予測結果の選択情報が含まれている。そこで、インデックス復号部324fは、入力された符号化データから上記選択情報を復号して非線形予測部102fに入力する。
非線形予測部102fは、入力された選択情報に基づいた非線形予測結果を増幅器103へ出力する。なお、非線形予測部102fの内部構成は、図24に示した構成と同一である。
このように、本実施の形態によれば、分類用符号帳から複数の候補を選択し、予測誤差又は量子化誤差を最小とするコードベクトルを複数の候補の中からさらに選択するので、非線形予測の予測精度を改善することができる。
なお、本実施の形態に係る非線形予測部102f、誤差最小化決定部124f、及びインデックス復号部324fは、実施の形態4にも適用可能である。
(実施の形態8)
図26は、本発明の実施の形態8に係る広帯域符号化装置2600の主要な構成要素を示すブロック図である。広帯域符号化装置2600は、実施の形態3に係る広帯域符号化装置800(図8参照)と同一の動作を行う構成要素を多く具備することから、本実施の形態でも、重複を避けるために、広帯域符号化装置800と相違する構成要素についてのみ説明する。
非線形予測部102gは、誤差最小化決定部124gからの指示に従い、分類用符号帳から複数の候補コードベクトルを選択し、これらのコードベクトルに対応する広帯域符号帳のコードベクトルを増幅器103へ出力すると共に、分類符号帳から選択された候補ベクトル自体も増幅器801へ出力する。
誤差最小化決定部124gは、所定数の広帯域コードベクトルと分類用コードベクトルとのセットを用いた場合の初段コードベクトル〜第3段コードベクトルと予測係数とのセットを決定する。そして、これらのパラメータの中で、誤差算出部123から出力される誤差を最も小さくする分類用コードベクトルと広帯域コードベクトルとのセットを求め、このセットと、このセットを用いた場合に決定される初段コードベクトル〜第3段コードベクトル及び予測セットを示す符号化データを生成し、無線送信部(図示せず)等へ入力する。
図27は、非線形予測部102gの主要な内部構成を示すブロック図である。実施の形態7に示した非線形予測部102fと同一の構成については、重複を避けるため説明を省略する。
実施の形態7に示した非線形予測部102fに対し、候補コードベクトル(分類用コードベクトル)符号帳2701が追加された構成である。候補コードベクトル符号帳2701以外の構成は、非線形予測部102fと同一であるので、その説明を省略する。候補コードベクトル符号帳2701は、誤差最小化決定部124gからの指示情報に基づいてコードベクトルを選択し、増幅器801へ出力する。
非線形予測部102gは、非線形予測結果(広帯域コードベクトル)とこれらに対応する分類用コードベクトルとを増幅器103へ出力する。出力される広帯域コードベクトル及び分類用コードベクトルは、1種類ではなく、誤差最小化決定部124gからの指示に従い、所定数の広帯域コードベクトル及び分類用コードベクトルが増幅器103及び増幅器801に順次入力される。
図28は、本実施の形態に係る広帯域符号化装置2600で生成された符号化データを復号する広帯域復号装置2800の主要な構成要素を示すブロック図である。広帯域復号装置2800は、実施の形態3に係る広帯域復号装置1000と同一の動作を行う構成要素を多く具備することから、本実施の形態でも、重複を避けるために、広帯域復号装置1000と相違する構成要素についてのみ説明する。
本実施の形態に係る広帯域復号装置2800において、符号化データは、実施の形態3における符号化データに含まれる情報に加えて、非線形予測部102gから出力される広帯域コードベクトルと分類用コードベクトルとのセットの選択情報を含んでいる。インデックス復号部324gは、この符号化データから上記選択情報を復号し、非線形予測部1
02gへ出力する。非線形予測部102gは、入力された選択情報に基づいて広帯域コードベクトル及び分類用コードベクトルを求め、広帯域コードベクトルを増幅器103へ、分類用コードベクトルを増幅器801へそれぞれ出力する。非線形予測部102gの内部構成は、図27に示した非線形予測部102gと同様であるので、その説明を省略する。
なお、本実施の形態に係る非線形予測部102g、誤差最小化決定部124g、及びインデックス復号部324gは、実施の形態4にも適用可能である。
以上、本発明の各実施の形態について説明した。
本発明に係る広帯域符号化装置等は、上記各実施の形態に限定されず、種々変更して実施することが可能である。
本発明に係る広帯域符号化装置等は、移動体通信システムにおける通信端末装置及び基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置及び移動体通信システムを提供することができる。
なお、LSPはLSF(Line Spectral Frequency)とも呼ばれる。LSPとLSFとは区別される場合もあるが(例えばITU−T勧告G.729では、LSFの余弦をとったものをLSPと定義している)、本明細書では両者の区別はせずに同義語として扱っている。すなわち、LSPをLSFと読み替えても良い。
また、ここでは、本発明の予測・符号化対象がLSPの場合を例にとって説明したが、LSP以外のスペクトル包絡パラメータの予測・符号化にも適用可能である。スペクトル包絡パラメータの具体例としては、FFT(高速フーリエ変換)パワースペクトルやMDCT(修正離散余弦変換)の包絡情報などが挙げられる。この場合、狭帯域−広帯域変換部101におけるアップサンプリングは、狭帯域のスペクトル包絡パラメータを低域部のスペクトル包絡パラメータとし、高域部をゼロ詰めすることで実現するのが一般的である。また、LSPと相互に変換可能なパラメータであるLPC(線形予測係数)、PARCOR係数(偏自己相関係数)、自己相関関数、LPCケプストラム、反射係数などもスペクトル包絡情報に含まれる。この場合、狭帯域−広帯域変換部101におけるアップサンプリングは、これらのパラメータを一旦LSPに変換してLSPの領域で実施の形態で説明したようなアップサンプリングを行ってもよいし、LPCケプストラムや自己相関関数の領域においてデータを内挿(補間)することによりアップサンプリングを実現しても良い。データの内挿には、いくつかの補間方法が知られているが、SINC関数を用いた補間フィルタで実現する方法が比較的広く利用されている。SINC関数を用いた補間フィルタによるデータの内挿処理は、例えばITU−T勧告G.729にも開示があり、適応符号帳の音源ベクトル生成やピッチ探索時の自己相関関数の内挿などに用いられている。狭帯域−広帯域変換部101以外のブロックの動作については、実施の形態におけるLSPをそれぞれのパラメータに読み替えればよい。
なお、本明細書では非線形予測部102に入力される量子化狭帯域LSPは、狭帯域−広帯域変換部101によってアップサンプリングされたLSPとしたが、狭帯域−広帯域変換部101を介さずにアップサンプリングされる前の量子化狭帯域LSPであっても良い。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る広帯域LSP予測方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明の広帯域LSP予測装
置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてありえる。
本明細書は、2004年12月10日出願の特願2004−358260、2005年3月29日出願の特願2005−095345、および2005年9月30日出願の特願2005−286532に基づく。これらの内容はすべてここに含めておく。
本発明に係る広帯域符号化装置等は、音声信号の帯域スケーラブル符号化又はその復号において、限られたメモリ量で実現可能な非線形予測を用いながらも予測性能の高い予測器を実現して量子化器の量子化効率を改善できるという効果を有し、利用可能なメモリ量に制限があり、かつ、低速での無線通信を強いられる携帯電話等の通信端末装置等として有用である。
実施の形態1に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態1における非線形予測部の主要な内部構成を示すブロック図 実施の形態1に係る広帯域復号装置の主要な構成要素を示すブロック図 実施の形態1における非線形予測部の変形例を示すブロック図 実施の形態1における非線形予測部の変形例を示すブロック図 実施の形態2に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態2に係る広帯域復号装置の主要な構成要素を示すブロック図 実施の形態3に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態3における非線形予測部の主要な内部構成を示すブロック図 実施の形態3に係る広帯域復号装置の主要な構成要素を示すブロック図 実施の形態3に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態3に係る広帯域復号装置の主要な構成要素を示すブロック図 実施の形態4に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態4に係る広帯域復号装置の主要な構成要素を示すブロック図 実施の形態4に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態4に係る広帯域復号装置の主要な構成要素を示すブロック図 実施の形態5における非線形予測部の主要な内部構成を示すブロック図 実施の形態5における非線形予測部のバリエーションを示す図 実施の形態6に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態6における非線形予測部の主要な内部構成を示すブロック図 実施の形態6に係る広帯域復号装置の主要な構成要素を示すブロック図 実施の形態6における非線形予測部の主要な内部構成を示すブロック図 実施の形態7に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態7における非線形予測部の主要な内部構成を示すブロック図 実施の形態7に係る広帯域復号装置の主要な構成要素を示すブロック図 実施の形態8に係る広帯域符号化装置の主要な構成要素を示すブロック図 実施の形態8における非線形予測部の主要な内部構成を示すブロック図 実施の形態8に係る広帯域復号装置の主要な構成要素を示すブロック図

Claims (17)

  1. 入力された音声信号の量子化狭帯域LSPを、アップサンプリングによって、当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、
    非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測する予測手段と、
    前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成する生成手段と、
    前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする符号化データを求める符号化手段と、
    を具備する広帯域符号化装置。
  2. 前記予測手段は、
    非線形予測処理として、コードブックマッピングによるベクトル量子化を用いる、
    請求項1記載の広帯域符号化装置。
  3. 前記予測手段は、
    前記第1LSPまたは前記量子化狭帯域LSPを表す基準ベクトルである分類用コードベクトルを複数含んで構成される分類用符号帳と、
    前記第1LSPと前記分類用コードベクトルとの誤差、または前記量子化狭帯域LSPと前記分類用コードベクトルとの誤差を算出する誤差算出手段と、
    前記分類用符号帳の中から前記誤差算出手段での誤差が最小となる分類用コードベクトルを特定する最小化手段と、
    前記分類用コードベクトルに対応付けられた広帯域コードベクトルを複数含んで構成され、前記最小化手段によって特定された分類用コードベクトルに対応付けられた広帯域コードベクトルを出力する広帯域符号帳と、
    を具備する、
    請求項1記載の広帯域符号化装置。
  4. 前記生成手段は、
    前記第1LSPと前記第2LSPとの重み付け和の代わりに、前記第1LSPと前記第2LSPと前記予測手段の分類用コードベクトルでベクトル量子化された第1LSPとの重み付け和を用いる、
    請求項3記載の広帯域符号化装置。
  5. 前記生成手段は、
    前記第1LSPの代わりに、当該第1LSPと前記予測手段の分類用コードベクトルでベクトル量子化された第1LSPとの差を用いる、
    請求項3記載の広帯域符号化装置。
  6. 前記分類用符号帳に含まれる分類用コードベクトル、又は前記広帯域符号帳に含まれる広帯域コードベクトルが多段構成となっている、
    請求項3記載の広帯域符号化装置。
  7. 前記予測手段は、
    前記第1LSPまたは前記量子化狭帯域LSPを表す基準ベクトルである分類用コードベクトルを複数含んで構成される分類用符号帳と、
    前記第1LSPと前記分類用コードベクトルとの誤差、または前記量子化狭帯域LSPと前記分類用コードベクトルとの誤差を算出する第1誤差算出手段と、
    前記分類用符号帳の中から、前記第1誤差算出手段での誤差が小さい分類用コードベクトルを誤差が小さい方から所定数だけ選択する選択手段と、
    前記分類用コードベクトルに対応付けられた広帯域コードベクトルを複数含んで構成され、前記選択手段によって選択された所定数の分類用コードベクトルに対応付けられた所定数の広帯域コードベクトルを出力する広帯域符号帳と、
    前記音声信号の広帯域LSPと前記所定数の広帯域コードベクトルとの誤差を算出する第2誤差算出手段と、
    前記所定数の広帯域コードベクトルの中から前記第2誤差算出手段での誤差が最小となる広帯域コードベクトルを選択すると共に、選択された広帯域コードベクトルに関する選択情報を出力する最小化手段と、
    を具備する、
    請求項1記載の広帯域符号化装置。
  8. 前記予測手段は、
    前記第1LSPまたは前記量子化狭帯域LSPを表す基準ベクトルである分類用コードベクトルを複数含んで構成される分類用符号帳と、
    前記第1LSPと前記分類用コードベクトルとの誤差、または前記量子化狭帯域LSPと前記分類用コードベクトルとの誤差を算出する誤差算出手段と、
    前記分類用符号帳の中から、前記誤差算出手段での誤差が小さい分類用コードベクトルを誤差が小さい方から所定数だけ選択する選択手段と、
    前記分類用コードベクトルに対応付けられた広帯域コードベクトルを複数含んで構成され、前記選択手段によって選択された所定数の分類用コードベクトルに対応付けられた所定数の広帯域コードベクトルを出力する広帯域符号帳と、
    を具備し、
    前記符号化手段は、
    前記所定数の広帯域コードベクトルの中から、前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする広帯域コードベクトルを出力すると共に、当該広帯域コードベクトルに対応する重み係数を示す符号化データを出力する、
    請求項1記載の広帯域符号化装置。
  9. 前記生成手段は、
    前記第1LSPと前記第2LSPとの重み付け和の代わりに、前記第1LSPと前記第2LSPと前記予測手段の分類用コードベクトルでベクトル量子化された第1LSPとの重み付け和を用いる、
    請求項8記載の広帯域符号化装置。
  10. 前記予測手段は、
    前記第1LSPまたは前記量子化狭帯域LSPを表す基準ベクトルである分類用コードベクトルを複数含んで構成される分類用符号帳と、
    複数の前記分類用コードベクトルに重み係数を乗じた乗算結果を加算した加算結果と前記第1LSPとの誤差、または前記加算結果と前記量子化狭帯域LSPとの誤差を算出し、算出した誤差が最小となる前記重み係数を決定する重み係数決定手段と、
    前記分類用コードベクトルに対応付けられた広帯域コードベクトルを複数含んで構成され、前記重み係数決定手段によって決定された重み係数を前記広帯域コードベクトルに乗じた乗算結果を加算する広帯域符号帳と、
    を具備する、
    請求項1記載の広帯域符号化装置。
  11. 前記予測広帯域LSPを遅延させる遅延手段をさらに具備し、
    前記生成手段は、
    前記第1LSPと前記第2LSPとの重み付け和の代わりに、前記第1LSPと前記第2LSPと前記遅延手段で遅延された過去の予測広帯域LSPとの重み付け和を用いる、 請求項1記載の広帯域符号化装置。
  12. 音声信号の量子化狭帯域LSPから広帯域LSPを予測する広帯域LSP予測装置であって、
    アップサンプリングによって、前記量子化狭帯域LSPを当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、
    非線形予測処理によって、前記第1LSPから広帯域の第2LSPを予測する予測手段と、
    前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成する生成手段と、
    を具備する広帯域LSP予測装置。
  13. 入力された音声信号の狭帯域LSPを符号化して量子化狭帯域LSPを生成する狭帯域符号化手段と、
    記音声信号の広帯域LSPを符号化する広帯域符号化手段と、
    を具備し、
    前記広帯域符号化手段は、
    アップサンプリングによって、前記量子化狭帯域LSPを当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、
    非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測する予測手段と、
    前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成する生成手段と、
    前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする符号化データを求める符号化手段と、
    を具備する、
    帯域スケーラブル符号化装置。
  14. 音声信号の量子化狭帯域LSPを示す符号化データを復号して量子化狭帯域LSPを生成する狭帯域復号手段と、
    前記音声信号の量子化広帯域LSPに関する符号化データを復号する復号手段と、
    前記復号手段によって復号された量子化広帯域LSPに関する情報に従って、前記量子化狭帯域LSPから量子化広帯域LSPを生成する広帯域復号手段と、
    を具備し、
    前記広帯域復号手段は、
    アップサンプリングによって、前記量子化狭帯域LSPを当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換する変換手段と、
    非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測する予測手段と、
    前記情報に従って、前記第1LSPと前記第2LSPとの重み付け和を用いて量子化広帯域LSPを生成する生成手段と、
    を具備する、
    帯域スケーラブル復号装置。
  15. 請求項1記載の広帯域符号化装置を具備する通信端末装置。
  16. 請求項1記載の広帯域符号化装置を具備する基地局装置。
  17. 入力された音声信号の量子化狭帯域LSPを、アップサンプリングによって、当該量子化狭帯域LSPの情報を有する広帯域の第1LSPに変換するステップと、
    非線形予測処理によって、前記第1LSPまたは前記量子化狭帯域LSPを用いて広帯域の第2LSPを予測するステップと、
    前記第1LSPと前記第2LSPとの重み付け和を用いて予測広帯域LSPを生成するステップと、
    前記予測広帯域LSPと前記音声信号の広帯域LSPとの間の誤差を最小とする符号化データを求めるステップと、
    を具備する広帯域符号化方法。
JP2006546778A 2004-12-10 2005-12-09 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 Expired - Fee Related JP4903053B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006546778A JP4903053B2 (ja) 2004-12-10 2005-12-09 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP2004358260 2004-12-10
JP2004358260 2004-12-10
JP2005095345 2005-03-29
JP2005095345 2005-03-29
JP2005286532 2005-09-30
JP2005286532 2005-09-30
PCT/JP2005/022690 WO2006062202A1 (ja) 2004-12-10 2005-12-09 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
JP2006546778A JP4903053B2 (ja) 2004-12-10 2005-12-09 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法

Publications (2)

Publication Number Publication Date
JPWO2006062202A1 JPWO2006062202A1 (ja) 2008-06-12
JP4903053B2 true JP4903053B2 (ja) 2012-03-21

Family

ID=36578022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006546778A Expired - Fee Related JP4903053B2 (ja) 2004-12-10 2005-12-09 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法

Country Status (8)

Country Link
US (1) US8229749B2 (ja)
EP (1) EP1818913B1 (ja)
JP (1) JP4903053B2 (ja)
KR (1) KR20070085982A (ja)
CN (1) CN101076853B (ja)
AT (1) ATE520124T1 (ja)
BR (1) BRPI0515814A (ja)
WO (1) WO2006062202A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
WO2009047911A1 (ja) * 2007-10-12 2009-04-16 Panasonic Corporation ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
ES2639572T3 (es) * 2008-01-16 2017-10-27 Iii Holdings 12, Llc Cuantificador vectorial, cuantificador inverso vectorial y procedimientos para los mismos
JP5423684B2 (ja) * 2008-12-19 2014-02-19 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
RU2519027C2 (ru) * 2009-02-13 2014-06-10 Панасоник Корпорэйшн Устройство векторного квантования, устройство векторного обратного квантования и способы для этого
KR101390433B1 (ko) 2009-03-31 2014-04-29 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
US8447617B2 (en) * 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
US8000968B1 (en) 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
CN102339607A (zh) * 2010-07-16 2012-02-01 华为技术有限公司 一种频带扩展的方法和装置
EP3040988B1 (en) * 2011-11-02 2017-10-25 Telefonaktiebolaget LM Ericsson (publ) Audio decoding based on an efficient representation of auto-regressive coefficients
ES2762325T3 (es) 2012-03-21 2020-05-22 Samsung Electronics Co Ltd Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US9524720B2 (en) * 2013-12-15 2016-12-20 Qualcomm Incorporated Systems and methods of blind bandwidth extension
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
KR102002681B1 (ko) 2017-06-27 2019-07-23 한양대학교 산학협력단 생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법
US11599773B2 (en) 2018-12-27 2023-03-07 Micron Technology, Inc. Neural networks and systems for decoding encoded data
US11424764B2 (en) 2019-11-13 2022-08-23 Micron Technology, Inc. Recurrent neural networks and systems for decoding encoded data
US11563449B2 (en) 2021-04-27 2023-01-24 Micron Technology, Inc. Systems for error reduction of encoded data using neural networks
US11755408B2 (en) 2021-10-07 2023-09-12 Micron Technology, Inc. Systems for estimating bit error rate (BER) of encoded data using neural networks

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3189614B2 (ja) * 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
CN1178204C (zh) * 1996-11-07 2004-12-01 松下电器产业株式会社 声源矢量生成装置以及声音编码装置和声音解码装置
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
CN1381041A (zh) * 2000-05-26 2002-11-20 皇家菲利浦电子有限公司 用于发送在窄带中已编码信号的发送机、用于在接收端扩展已编码信号的频带的接收机、相应的发送和接收方法及系统
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
EP1374230B1 (en) * 2001-11-14 2006-06-21 Matsushita Electric Industrial Co., Ltd. Audio coding and decoding
US7752052B2 (en) * 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
BRPI0306434B1 (pt) * 2002-09-19 2018-06-12 Nec Corporation Aparelho e método de decodificação de áudio
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
RU2007108288A (ru) * 2004-09-06 2008-09-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство масштабируемого кодирования и способ масштабируемого кодирования
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
US7596491B1 (en) * 2005-04-19 2009-09-29 Texas Instruments Incorporated Layered CELP system and method
CN101199004B (zh) * 2005-04-22 2011-11-09 高通股份有限公司 用于增益因数平滑的系统、方法及设备

Also Published As

Publication number Publication date
EP1818913A4 (en) 2009-01-14
JPWO2006062202A1 (ja) 2008-06-12
EP1818913B1 (en) 2011-08-10
KR20070085982A (ko) 2007-08-27
BRPI0515814A (pt) 2008-08-05
US20090292537A1 (en) 2009-11-26
EP1818913A1 (en) 2007-08-15
ATE520124T1 (de) 2011-08-15
CN101076853A (zh) 2007-11-21
WO2006062202A1 (ja) 2006-06-15
CN101076853B (zh) 2010-10-13
US8229749B2 (en) 2012-07-24

Similar Documents

Publication Publication Date Title
JP4903053B2 (ja) 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
JP5143193B2 (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
JP4394578B2 (ja) 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
US8364495B2 (en) Voice encoding device, voice decoding device, and methods therefor
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
JPWO2008047795A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
RU2469421C2 (ru) Векторный квантователь, инверсный векторный квантователь и способы
WO2005112005A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
WO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
WO2006046587A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
WO2009090875A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
JP4937746B2 (ja) 音声符号化装置および音声符号化方法
JP3268750B2 (ja) 音声合成方法及びシステム
JP3428595B2 (ja) 音声符号化方式
JP4891747B2 (ja) 信号符号化装置、信号符号化方法、プログラム及び記録媒体
JP2018526669A (ja) オーディオ信号デコーダのためのビット・エラー検出器
Kumar et al. A 6.7 kbps vector sum excited linear prediction on TMS320C54X digital signal processor

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081203

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120104

R150 Certificate of patent or registration of utility model

Ref document number: 4903053

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees