JP2005057439A - 帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置 - Google Patents
帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置 Download PDFInfo
- Publication number
- JP2005057439A JP2005057439A JP2003285330A JP2003285330A JP2005057439A JP 2005057439 A JP2005057439 A JP 2005057439A JP 2003285330 A JP2003285330 A JP 2003285330A JP 2003285330 A JP2003285330 A JP 2003285330A JP 2005057439 A JP2005057439 A JP 2005057439A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- band
- decoding
- encoding
- digital filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】 音質の劣化を抑えつつ圧縮率を上げる。
【解決手段】 エンコーダ1側では帯域分割する前にダウンサンプリングを行ってデータ量を減少させ、デコーダ2側では帯域統合した後にアップサンプリングし、サンプル値H∞制御により設計したデジタルフィルタ24により信号を復元する。フィルタの設計手法としては、入力アナログ信号wcを帯域制限した信号に時間遅れを加味した信号と、オーバーサンプリングD/A変換部を通した復元信号zcとの連続時間の誤差信号ecが小さくなるように条件式を設定し、それを有限次元離散時間系に変換して近似的な計算式を得る。そして、フィルタ等の条件を決めた上でその計算式をサンプル値設計の一手法であるH∞制御の問題として解き、フィルタのパラメータを算出する。これによって、ダウンサンプリングによって失われた周波数成分を聴感上問題ない程度に復元できる。
【選択図】 図2
【解決手段】 エンコーダ1側では帯域分割する前にダウンサンプリングを行ってデータ量を減少させ、デコーダ2側では帯域統合した後にアップサンプリングし、サンプル値H∞制御により設計したデジタルフィルタ24により信号を復元する。フィルタの設計手法としては、入力アナログ信号wcを帯域制限した信号に時間遅れを加味した信号と、オーバーサンプリングD/A変換部を通した復元信号zcとの連続時間の誤差信号ecが小さくなるように条件式を設定し、それを有限次元離散時間系に変換して近似的な計算式を得る。そして、フィルタ等の条件を決めた上でその計算式をサンプル値設計の一手法であるH∞制御の問題として解き、フィルタのパラメータを算出する。これによって、ダウンサンプリングによって失われた周波数成分を聴感上問題ない程度に復元できる。
【選択図】 図2
Description
本発明は、デジタル化されたオーディオ信号又は画像信号を対象とする高能率符号化・復号化方法であって、特に周波数帯域を複数に分割する帯域分割型の符号化・復号化方法、及びその方法に用いられる復号化装置に関する。
従来のデジタルオーディオはCDプレーヤを代表とするリニア(非圧縮)オーディオが主流であった。こうしたリニアオーディオにおいて、その音質を左右する主たるパラメータは1サンプルの量子化ビット数とサンプリング周波数である。前者はダイナミックレンジやS/N比を決める要素であり、後者は周波数特性を決める要素である。CDの標準的な規格では、量子化ビット数は16、サンプリング周波数は44.1kHzに決められている。
一方、デジタルオーディオの分野では、できるだけ音質を損なわずに、或いは聴感上問題のない程度の音質を確保しつつデータを圧縮し、記録媒体のメモリ資源や伝送路をできるだけ有効に利用しようとする試みも盛んに行われており、既にMDレコーダ/プレーヤやMP3レコーダ/プレーヤにはこうした符号化・復号化技術が広く採り入れられている。
デジタルオーディオの符号化方式としては様々なものが知られているが、特によく知られているものとして前述のMP3(MPEG Audio Layer-3)がある(例えば非特許文献1など参照)。このMP3は広い意味での帯域分割符号化の一種であり、人間の聴覚上の応答が周波数上で均一でないことを利用するために、周波数帯域の分割、聴覚特性を利用した各帯域毎の適応ビット割り当て、などの基本的な技術が利用されている。さらに、周波数領域でのスペクトル変換を利用して、ビット資源の利用効率を高める工夫も採り入れられている。
こうした符号化方式においては、その圧縮率が高ければ高いほど記録媒体のメモリ資源や伝送路を有効に利用することができる。そのため、音質をできるだけ損なうことなく圧縮率を高めることは最も大きな課題である。しかしながら、一般的に帯域分割符号化では、圧縮率を高めようとすればするほど高域に割り当てられる量子化ビット数が減少し又は高域にビットが全く割り当てられなくなり、再生音の高域の周波数成分は極端に落ちるか全く存在しなくなる。こうした高域の音はもともと人間の耳に聞こえにくいものであるが、例えば10kHz程度以上の成分が全く存在しなくなると、音楽再生ではかなり不自然で聴取者に違和感を惹起させることも多い。そのため、圧縮率を高めつつも、特に聴感上での音質を改善することが広く望まれている。
また、従来、圧縮率を高くする場合には例えば上述した周波数上でのスペクトル変換などの技術を採り入れる必要があり、そのために符号化、復号化に要する時間が長くなる傾向にある。例えばMDや半導体メモリなどのように記録済みのメディアの場合には、符号化に要する時間はあまり問題とならないが、復号化に要する時間が長くなると、或る信号を読み取ってからその信号に対応したオーディオ信号が実際に再生されるまでに時間を要し、不都合が生じることが多い。そのため、特に復号化に要する時間をあまり長くすることなく、圧縮率を高めることができるような技術が強く要望されている。
本発明はこのような点に鑑みて成されたものであり、従来、圧縮符号化・復号化に採用されているような各種技術とは全く異なる技術を導入することで、例えば聴感上の音質をあまり劣化させることなく圧縮率を上げる、或いは、圧縮率をほぼ同等に維持したまま聴感上の音質を向上させることができる、帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置を提供することにある。
本願発明者はこれまで、連続時間特性を扱うことができるサンプル値制御理論、より詳しくはサンプル値H∞制御をデジタルオーディオ信号を扱うD/A変換技術やサンプリングレート変換技術に導入する試みについて長年研究を続けてきた(特許文献1、2など参照)。こうした既に提案した技術は、元のデジタル信号のサンプルを単に離散時間信号としてのみ捉えるのではなく、サンプル間応答に含まれるアナログ特性をも考慮してD/A変換やサンプリングレート変換の際のデジタルフィルタの設計を行うことによって、アナログオーディオとしての聴感上での音質が最良又はそれに近い状態となるようにすることを意図するものであった。
上記の技術は、簡単に言えば、既定のサンプリング周波数と量子化ビット数という制限の上で、元のアナログオーディオの音質にできるだけ近い自然な音を追究しようとする試みである。しかしながら、本願発明者は研究の過程で、もともと高音質化とは全く逆の方向性を持った圧縮符号化・復号化にも上記のようなサンプル値H∞制御の技術を適用し得ることに想到した。すなわち、従来、或る既定のデータ量の範囲で以て聴感上の音質を向上させることにサンプル値H∞制御技術を利用していたのに対し、本発明では、聴感上の音質をできるだけ維持しつつ使用するデータ量をできるだけ削減することにサンプル値H∞制御技術を利用している。
具体的に上記課題を解決するために成された本発明は、所定のサンプリング周波数を有するデジタル信号列を圧縮符号化して記録媒体に記憶し又は伝送経路に送出し、該記憶媒体から読み出した又は該伝送経路を通して受信した前記信号を復号化して元のサンプリング周波数を有する信号を再生するための符号化・復号化方法であって、符号化には複数の周波数帯域に分割する帯域分割処理を、復号化には分割された周波数帯域を統合する帯域統合処理を含む帯域分割型符号化・復号化方法において、
前記符号化では、前記帯域分割処理の前段で前記デジタル信号列の隣接するN個のサンプルに(N−1)個の割合でサンプルを間引くダウンサンプリングを行い、
前記復号化では、前記帯域統合処理の後段で、時系列的に隣接するサンプル間に(N−1)個の0点データを挿入するN倍のアップサンプリングを行った後に、低域通過型のデジタルフィルタを通すことにより前記挿入された0信号の位置における情報を補間的に生成し、
該デジタルフィルタは、帯域制限された元のアナログ信号とアナログ/デジタル/アナログ変換を通して得られるアナログ信号との誤差信号を小さくするようにデジタルフィルタを設計すべく設定した条件式を、有限次元離散時間系に近似的に変換することで得た計算式を所定の条件に基づいてH∞制御により解くことによって又はそれに相当する計算で解くことによって算出したパラメータを有して成るものであることを特徴としている。
前記符号化では、前記帯域分割処理の前段で前記デジタル信号列の隣接するN個のサンプルに(N−1)個の割合でサンプルを間引くダウンサンプリングを行い、
前記復号化では、前記帯域統合処理の後段で、時系列的に隣接するサンプル間に(N−1)個の0点データを挿入するN倍のアップサンプリングを行った後に、低域通過型のデジタルフィルタを通すことにより前記挿入された0信号の位置における情報を補間的に生成し、
該デジタルフィルタは、帯域制限された元のアナログ信号とアナログ/デジタル/アナログ変換を通して得られるアナログ信号との誤差信号を小さくするようにデジタルフィルタを設計すべく設定した条件式を、有限次元離散時間系に近似的に変換することで得た計算式を所定の条件に基づいてH∞制御により解くことによって又はそれに相当する計算で解くことによって算出したパラメータを有して成るものであることを特徴としている。
また、本発明に係る符号化装置は、上記本発明に係る帯域分割型符号化・復号化方法により符号化されて記録媒体に記憶された又は伝送経路に送出された信号を受けてこれを復元するための復号化装置であって、
a)各周波数帯域毎に所定の復号化処理を行った後に分割された周波数帯域を統合する帯域統合処理を行う復号化手段と、
b)前記復号化手段の後段にあって、時系列的に隣接するサンプル間に(N−1)個の0点データを挿入するN倍のアップサンプリングを行うアップサンプラと、
c)アップサンプリングされたサンプル中に挿入されている0信号の位置における情報を補間的に生成する低域通過型のデジタルフィルタと、
を備え、該デジタルフィルタは、帯域制限された元のアナログ信号とアナログ/デジタル/アナログ変換を通して得られるアナログ信号との誤差信号を小さくするようにデジタルフィルタを設計すべく設定した条件式を、有限次元離散時間系に近似的に変換することで得た計算式を所定の条件に基づいてH∞制御により解くことによって又はそれに相当する計算で解くことによって算出したパラメータを有して成ることを特徴としている。
a)各周波数帯域毎に所定の復号化処理を行った後に分割された周波数帯域を統合する帯域統合処理を行う復号化手段と、
b)前記復号化手段の後段にあって、時系列的に隣接するサンプル間に(N−1)個の0点データを挿入するN倍のアップサンプリングを行うアップサンプラと、
c)アップサンプリングされたサンプル中に挿入されている0信号の位置における情報を補間的に生成する低域通過型のデジタルフィルタと、
を備え、該デジタルフィルタは、帯域制限された元のアナログ信号とアナログ/デジタル/アナログ変換を通して得られるアナログ信号との誤差信号を小さくするようにデジタルフィルタを設計すべく設定した条件式を、有限次元離散時間系に近似的に変換することで得た計算式を所定の条件に基づいてH∞制御により解くことによって又はそれに相当する計算で解くことによって算出したパラメータを有して成ることを特徴としている。
本発明に係る帯域分割型符号化・復号化方法では、通常の圧縮符号化処理による帯域分割を行う前に、ダウンサンプリングを行ってデータ量を1/Nに削減する。したがって、圧縮符号化された状態での全体のデータ量もダウンサンプリングを行わなかった場合に比べて約1/Nになり、圧縮率を高めたことに相当する。但し、ダウンサンプリングは元のサンプリング周波数を1/Nに落としたことと同じであるから、復号化処理の後にサンプリング周波数を元に戻すべくアップサンプリングを行ったとしても、ダウンサンプリング時に失われた高域の周波数成分を適切に復元しないと音質を大きく損なう。そこで、本発明に係る符号化・復号化方法では、この復号化処理時のアップサンプリングの後に従来の一般的なデジタルフィルタとは異なるフィルタ、すなわちサンプル値H∞制御を用いて、サンプル間応答に含まれるアナログ特性をも考慮したデジタルフィルタを利用する。
このデジタルフィルタによれば、ダウンサンプリング及びアップサンプリングの過程におけるアナログ信号の復元誤差が広い周波数帯域、具体的には本来ダウンサンプリングによって失われる高周波数成分を含むような周波数帯域に亘って小さくなるように保証される。したがって、本発明に係る符号化・復号化方法によれば、同じ圧縮率であれば、従来よりも音質や画質を向上させることができる。或いは、従来とほぼ同等の音質や画質を維持しつつ、圧縮率を上げることができる。また、符号化・復号化のそれぞれの過程では、ダウンサンプリング、アップサンプリング、デジタルフィルタによるフィルタリング処理などの簡単な演算処理を行っているだけであるので、大きな信号遅延を生じることがなく、符号化処理時間、復号化処理時間が長引くこともない。
本発明に係る符号化・復号化方法について詳細に説明する前に、帯域分割符号化の一般的な構成について簡単に説明する。図1は一般的なM分割フィルタバンクを用いた帯域分割エンコーダ/デコーダのブロック構成図である。
エンコーダ1において入力信号uは帯域分割フィルタ(フィルタバンク)11を並列に通り、そこで各サブバンドの周波数帯域に制限される。そして、それぞれダウンサンプラ12により1/Mに間引かれる。ここで↓Mは次の(1)式で定義される。
各帯域に分割された信号はそれぞれ量子化器13によって各信号のエネルギに応じて量子化される。一般にオーディオ信号ではその周波数分布に大きな偏りが存在するため、平均的に低ビットで以て量子化が可能である。
一方、デコーダ2では、各帯域の信号に対しアップサンプラ21により0信号を補間する。ここで、↑Mは次の(2)式で定義される。
その後に、フィルタバンク22によって各帯域毎の信号を復元し、それらを加算(統合)することで元の信号uに対応した信号[u]を復元する。
続いて、本発明に係る符号化・復号化法を適用した構成の一例を説明する。図2は本実施例による帯域分割符号化・復号化方法を実現するためのエンコーダ/デコーダのブロック構成図である。ここでは、入力信号uはサンプリング周波数44.1kHzのオーディオ信号であるものとし、M=16(つまり分割帯域数が16)であるとする。
エンコーダ1においては、まず、信号uを帯域分割する前にダウンサンプラ14によりサンプルを1/2に間引く。これによって、データ量は1/2に減少する。その後に、上述したようなフィルタバンク11を用いて信号を16帯域に分割し、ダウンサンプラ12でサンプルの間引きを行った後に各帯域毎に量子化器13で量子化する。ここで、フィルタバンク11は各帯域幅がMPEG-1 Audio Layer 1,2と同一の約690Hzとなる16等分割フィルタである。すなわち、ダウンサンプラ14を使用しない場合には帯域数は32となるが、ここではダウンサンプラ14を使用してデータ量を1/2に削減したことによって帯域数を半分の16としている。
デコーダ2では、アップサンプラ21及びフィルタバンク22によって帯域毎の信号を統合して信号vの復元信号[v]を生成する。その後に、2倍のアップサンプラ23によって1サンプル毎に0信号を挿入し、デジタルフィルタ24によって信号uの復元信号[u]を得る。すなわち、本発明に係る符号化・復号化方法の最も大きな特徴は、帯域分割による圧縮符号化の前にダウンサンプラ14によってデータ量を減少させる一方、復号化処理の後にアップサンプラ23及びデジタルフィルタ24によって、ダウンサンプリングによる音質劣化、具体的には特に高域の特性の劣化を軽減することにある。そのために、デジタルフィルタ24としてサンプル値制御理論に基づいて設計されたものを使用する。
なお、図2の例では、ダウンサンプラ14で1/2にダウンサンプリングしアップサンプラ23で2倍にアップサンプリングしているが、これは一例であって、1/3のダウンサンプリングと3倍のアップサンプリングとの組み合わせなど、適宜に変更できることは当然である。
次に、本実施例の符号化・復号化方法における特徴的な構成要素について詳しく説明する。
[1]デジタルフィルタの設計手法
まず、上記デジタルフィルタ24の設計方法の一例について説明する。
[1]デジタルフィルタの設計手法
まず、上記デジタルフィルタ24の設計方法の一例について説明する。
(1)設計の命題の設定
図3は、アップサンプラ23及びデジタルフィルタ24を含むインタポレータの信号復元系モデルを示すブロック図である。連続時間信号である入力wcは、A/D変換部30に含まれるアンチエリアシングフィルタ31で帯域制限されたあと、サンプラ32においてサンプル周期2hでサンプリングされ離散時間信号ydとなる。この離散時間信号ydが続くインタポレータによりレート変換される。まず、この離散時間信号ydを2倍のアップサンプラ34によりサンプル周期hの離散時間信号xdに変換する。その際、上記(2)式と同様にydに0信号が挿入される。
図3は、アップサンプラ23及びデジタルフィルタ24を含むインタポレータの信号復元系モデルを示すブロック図である。連続時間信号である入力wcは、A/D変換部30に含まれるアンチエリアシングフィルタ31で帯域制限されたあと、サンプラ32においてサンプル周期2hでサンプリングされ離散時間信号ydとなる。この離散時間信号ydが続くインタポレータによりレート変換される。まず、この離散時間信号ydを2倍のアップサンプラ34によりサンプル周期hの離散時間信号xdに変換する。その際、上記(2)式と同様にydに0信号が挿入される。
続いて、この離散時間信号xdはY(z)で表現されるデジタルフィルタ35で処理されることにより上記挿入された0信号が適宜な値に修正され、周期hで動作する0次ホールド36により連続時間信号ucとなる。最後に、この信号ucをP(s)で表現されるアナログローパスフィルタ(LPF)37により平滑化し復元信号zcを得る。このインタポレータ(つまりアップサンプラ34及びデジタルフィルタ35)、0次ホールド36及びLPF37により構成されるシステムは、速いサンプル周期で動作するホールド回路によりデジタル信号をアナログ信号に変換するオーバーサンプリング型D/A変換器33と看做すことができる。
オーディオ分野では、このような信号復元には或る程度の時間遅延が許される。そこで、この時間遅れを考慮して信号復元の際の誤差系モデルを考えると、図4に示すようになる。図4では、下側の信号経路がインタポレータによるレート変換の信号処理系であり、上側の信号経路がその信号処理系による時間遅れを考慮した遅延系である。時間遅れ要素38は帯域制限信号ycに上述した信号処理による時間遅れm(2h)を与え、減算器39により復元信号zcと遅延した帯域制限信号との誤差信号ecを取り出す。この誤差信号ecも連続時間信号であるから、次の(3)式のようにおく。
ec(t)=zc(t)−yc(t−m2h) …(3)
ec(t)=zc(t)−yc(t−m2h) …(3)
ここでは、この誤差信号ecができる限り小さくなるようにデジタルフィルタを構成する。すなわち、安定な連続時間フィルタ(アンチエリアシングフィルタ31及びLPF37)と正の整数m、N、Mとが与えられている条件下でデジタルフィルタを設計する。そのために、連続時間信号wcから誤差信号ecへ変換するシステムをTewとおいたとき、次の(4)式を満たすようなY(z)を求める。
つまり、この(4)式が上述したデジタルフィルタを設計すべく設定した条件式である。ここでγは誤差の大きさを支配するものであり小さいほどよい。H∞制御では、これを繰り返し計算によって最小化する方法を採る。
(2)単一レート系への変換
図4に示したアップサンプラ及びむだ時間系を含む系(マルチレート系)を単一のサンプル周期の有限次元系(単一レート系)に変換する。そのためには、次の(5)式で定義される離散時間リフティングLM及び逆リフティングLM -1を導入する。
但し、↓Mはダウンサンプラであり上記(1)式と同じ式で定義される。
図4に示したアップサンプラ及びむだ時間系を含む系(マルチレート系)を単一のサンプル周期の有限次元系(単一レート系)に変換する。そのためには、次の(5)式で定義される離散時間リフティングLM及び逆リフティングLM -1を導入する。
上記離散時間リフティング及び逆リフティングを用いてY(z)(↑M)、つまりアップサンプラ34とデジタルフィルタ35とによる処理を(6)式に従って変換する。
ここで、Y'(z)は1入力M出力の線形時不変(LTI:Linear Time-Invariant)システムであり、Y(z)との関係は次の(7)式で与えられる。
続いて、連続時間むだ時間要素であるe-m2hsを有限次元化するために、系の入力をmステップだけ遅らせるような変換を行う。これにより、所望の設計問題は、Y'(z)の代わりに非因果的なフィルタzmY'(z)を設計する問題に変換される。また、これを更に有限次元離散時間系の設計問題に帰着させることもできる。その手法の詳細は、カルゴネカー(P.P.Khargonekar)、山本、「ディレイド・シグナル・リコンストラクション・ユージング・サンプルド−データ・コントロール(Delayed signal reconstruction using sampled-data control)」、プロシーディングス・オブ・35ス・コンファレンス・オン・デシジョン・アンド・コントロール(Proc. of 35th Conf. on Decision and Control)、1259頁〜1263頁、1996年に記載されている。但し、これには近似は入らないものの、中間段階での設計フィルタの非因果性により、最終的に因果的なフィルタを得るために、後述するような強い制約条件が課せられており、その仮定は本デジタルフィルタの設計問題では余り満たされないことに注意しておく必要がある。したがって、より実際的な離散時間問題への変換法が必要となる。
(3)離散時間系への変換
上記事情に鑑み、FSFH(ファーストサンプル・ファーストホールド)手法を適用して、原問題が制約条件のない近似的な離散時間系設計問題に帰着できることを示す。FSFH手法はサンプル値制御系の性能を評価する一手法であって、h周期のサンプル値系の連続時間入出力をh/N(Nは自然数)周期で動作するサンプラとホールドによって離散化し、十分に大きなNに対する離散時間信号で連続時間信号を近似する方法である。なお、FSFH手法の詳細は、山本、マディエフスキ、アンダーソン(A.G.Madievski and B.D.O.Anderson)、「コンピュテーション・アンド・コンバージェンス・オブ・フリクエンシ・レスポンス・ビア・ファスト・サンプリング・フォー・サンプルド−データ・コントロール・システムズ(Computation and convergence of frequency response via fast sampling for sampled-data control systems)」、プロシーディングス・オブ・36ス・コンファレンス・オン・デシジョン・アンド・コントロール(Proc. of 36th Conf. on Decision and Control)、2157頁〜2162頁、1997年に記載されている。
上記事情に鑑み、FSFH(ファーストサンプル・ファーストホールド)手法を適用して、原問題が制約条件のない近似的な離散時間系設計問題に帰着できることを示す。FSFH手法はサンプル値制御系の性能を評価する一手法であって、h周期のサンプル値系の連続時間入出力をh/N(Nは自然数)周期で動作するサンプラとホールドによって離散化し、十分に大きなNに対する離散時間信号で連続時間信号を近似する方法である。なお、FSFH手法の詳細は、山本、マディエフスキ、アンダーソン(A.G.Madievski and B.D.O.Anderson)、「コンピュテーション・アンド・コンバージェンス・オブ・フリクエンシ・レスポンス・ビア・ファスト・サンプリング・フォー・サンプルド−データ・コントロール・システムズ(Computation and convergence of frequency response via fast sampling for sampled-data control systems)」、プロシーディングス・オブ・36ス・コンファレンス・オン・デシジョン・アンド・コントロール(Proc. of 36th Conf. on Decision and Control)、2157頁〜2162頁、1997年に記載されている。
設計のために図5を一般化プラント形式に描き直したものが図6である。この図6中に示したサンプル値系gsは次の(11)式で定義される。
FSFH手法を用いれば、このサンプル値系gsの近似離散時間系は次の(12-1)式で与えられる。ただし、FSFHにおいてN=Ml(lは自然数)としている。
GdN(z)の各行列及び作用素は次のように定義される。
上記近似離散時間系GdNを用いて上記(4)式は次の(13)式で近似され、(4)式を満たすようなY(z)を求めるということは近似的に有限次元離散時間系の問題に帰着される。
但し、
である。すなわち、図6は図7に示す有限次元離散時間系に変換されることになる。
ここで注意すべきことは、条件‖D11‖<γの下で図6のサンプル値系とH∞ノルム上界等価な離散時間系を計算する方法が従来提案されているが(藤岡、臼井、山本:「マルチレートフィルタバンクのサンプル値H∞設計−Mチャンネルの場合−」、第27回制御理論シンポジウム(1998年)参照)、ここでは通常のサンプル値H∞制御とは異なり、‖D11‖<γは(3)式において非常に強い制約となる。これが上述したようなFSFH近似を必要とする(また上記のカルゴネカー及び山本による文献に記載の、近似無しの離散時間系への変換手法を適用し難い)理由である。但し、
であり、(AF,BF,CF)はアンチエリアシングフィルタ31のW(s)の実現である。
而して、式(13)を求め、ごく一般的な離散時間H∞制御問題を解けば、所望のデジタルフィルタY(z)が得られることになる。なお、上述したようなデジタルフィルタの設計方法はパーソナルコンピュータ等で所定のプログラムを実行することにより実現される。そのプログラムの一部は既存のもの、具体的にはマトラブ(Matlab)等に搭載されているものを利用することができる。
なお、上記説明では、(4)式を満たすようなデジタルフィルタY(z)を求めることを近似的に有限次元離散時間系の問題に帰着したが、ここでの目的は(4)式の条件式を解くことにあり、そのために他の計算方法を採用しても構わない。
[2]適応ビット割り当ての方法
次に、本実施例の符号化・復号化方法における適応ビット割り当てについて説明する。図2の量子化器13に対し各帯域の信号の振幅に応じてビット数を割り当てるのが適応ビット割り当てである。周知のように、こうしたビット割り当てはいくつかのサンプル毎(これをブロックという)に行われる。基本は振幅の対数に比例するようにビットを割り当てる方法である。しかしながら、その方法によると高域の信号の振幅が大きいときに低中域にビットの割り当てが行われないという状況が発生する(図8(b)参照)。そこで、ここでは、低中域に予め2ビットを割り当てておくことにより、低中域にビット割り当てがなされなくなることを回避する。
次に、本実施例の符号化・復号化方法における適応ビット割り当てについて説明する。図2の量子化器13に対し各帯域の信号の振幅に応じてビット数を割り当てるのが適応ビット割り当てである。周知のように、こうしたビット割り当てはいくつかのサンプル毎(これをブロックという)に行われる。基本は振幅の対数に比例するようにビットを割り当てる方法である。しかしながら、その方法によると高域の信号の振幅が大きいときに低中域にビットの割り当てが行われないという状況が発生する(図8(b)参照)。そこで、ここでは、低中域に予め2ビットを割り当てておくことにより、低中域にビット割り当てがなされなくなることを回避する。
ここでの適応ビット割り当ての基本的な手順は次の通りである。
〈ステップ1〉
各帯域毎にN個のサンプル(v1,v2,…,vN)を先読みする。このN個のデータの範囲がブロックである。
〈ステップ2〉
ステップ1において先読みしたN個のサンプル中で最大値をスケールファクタS(i)とする。
S(i):=max{|v1|,|v2|,…,|vN|} …(14)
ここでiは帯域の番号であり、低域側から高域に向かって番号を付するものとする。
〈ステップ1〉
各帯域毎にN個のサンプル(v1,v2,…,vN)を先読みする。このN個のデータの範囲がブロックである。
〈ステップ2〉
ステップ1において先読みしたN個のサンプル中で最大値をスケールファクタS(i)とする。
S(i):=max{|v1|,|v2|,…,|vN|} …(14)
ここでiは帯域の番号であり、低域側から高域に向かって番号を付するものとする。
〈ステップ3a〉
下の(15)式で示すように、全16帯域のうちの最も低い帯域から順に9個の帯域に、それぞれ2ビットを割り当てる。(16)式において帯域の信号の大ききを表すスケールファクタS(i)を1/2bi倍しているのは、次のステップ3bにおいてスケールファクタS(i)を基にビットを再配分するためである。またBはビット資源を表しており、上記のように強制的に2ビットずつが割り当てられた後の残りのビット資源は(17)式に示すようになる。
bi :=2 (i=1,…,9) …(15)
S(i) :=S(i)/2bi (i=1,…,9) …(16)
B :=B−2×9 …(17)
〈ステップ3b〉
(17)式で表される残りのビット資源Bをlog2S(i),(i=1,…,16)に比例して配分する。
〈ステップ4〉
データをスケールファクタS(i)で除することにより正規化し、割り当てられたビット数に基づいて量子化を行う。
下の(15)式で示すように、全16帯域のうちの最も低い帯域から順に9個の帯域に、それぞれ2ビットを割り当てる。(16)式において帯域の信号の大ききを表すスケールファクタS(i)を1/2bi倍しているのは、次のステップ3bにおいてスケールファクタS(i)を基にビットを再配分するためである。またBはビット資源を表しており、上記のように強制的に2ビットずつが割り当てられた後の残りのビット資源は(17)式に示すようになる。
bi :=2 (i=1,…,9) …(15)
S(i) :=S(i)/2bi (i=1,…,9) …(16)
B :=B−2×9 …(17)
〈ステップ3b〉
(17)式で表される残りのビット資源Bをlog2S(i),(i=1,…,16)に比例して配分する。
〈ステップ4〉
データをスケールファクタS(i)で除することにより正規化し、割り当てられたビット数に基づいて量子化を行う。
以上のようなアルゴリズムに拠れば、低中域の帯域における量子化ビット数は2ビット以上が確保される。しかしながら、ステップ3bにおいて高域に1ビットのみが割り当てられた場合、「−1」又は「1」の2値量子化を行うと、復元信号において原信号にはない音が付帯的に出現し、聴感上、かなり耳障りとなることが判明した。そこで、この雑音を減少させるために、次の2つの方法を採用し得る。
〈方法1〉
ステップ3bにおいて残り帯域においても、ビットを割り当てる場合には最低2ビットとする。
〈方法2〉
或る帯域に1ビットのみが割り当てられた場合、−1,1の2値量子化ではなく、−1,0,1の3値量子化を行う。
〈方法1〉
ステップ3bにおいて残り帯域においても、ビットを割り当てる場合には最低2ビットとする。
〈方法2〉
或る帯域に1ビットのみが割り当てられた場合、−1,1の2値量子化ではなく、−1,0,1の3値量子化を行う。
方法1と方法2とは併用できないから、エンコードの際にいずれか一方を選択する必要がある。方法1の場合、1ビットのみ割り当てられる帯域は存在しない。したがって、量子化も単に割り当てられたビット数に基づいて行えばよい。一方、方法2の場合、実際には1ビットのみで3つの量子化値を表現することはできない。そこで、例えば次のような方法を採用する。すなわち、
(A)例えば3値量子化の帯域数が3つの場合には、信号のとり得る組み合わせは33=27通りである。これは、5ビット(25=32)を用いれば表現することが可能である。
(B)例えば3値量子化の帯域数が5つの場合には、信号のとり得る組み合わせは35=243通りである。これは、8ビット(28=256)を用いれば表現することが可能である。
したがって(A)、(B)の場合にそれぞれ補助的に2ビット、3ビットを追加すれば、3値量子化が可能である。実際には補助ビットとして予め3ビットを用意しておき、3値量子化を行う帯域の数に応じて補助ビットを適宜使用するものとする。
(A)例えば3値量子化の帯域数が3つの場合には、信号のとり得る組み合わせは33=27通りである。これは、5ビット(25=32)を用いれば表現することが可能である。
(B)例えば3値量子化の帯域数が5つの場合には、信号のとり得る組み合わせは35=243通りである。これは、8ビット(28=256)を用いれば表現することが可能である。
したがって(A)、(B)の場合にそれぞれ補助的に2ビット、3ビットを追加すれば、3値量子化が可能である。実際には補助ビットとして予め3ビットを用意しておき、3値量子化を行う帯域の数に応じて補助ビットを適宜使用するものとする。
方法2を用いる場合のステップ3a以降のビット割り当ての手順は次の通りである。
〈ステップ3a〉
ビット資源Bから補助ビット(Baux=3)を予め差し引く。
〈ステップ3b〉
上記(15)〜(17)式で示したように、全16帯域のうちの最も低い帯域から順に9個の帯域に、それぞれ2ビットを割り当て、スケールファクタS(i)を1/22倍し、残りのビット資源を求める。
〈ステップ3c〉
残りのビット資源Bをlog2S(i),(i=1,…,16)に比例して配分する。
〈ステップ3d〉
割り当てビット数が1ビットの帯域がある場合、その帯域数に応じて決められたアルゴリズムで3値量子化を実行する。その取り決めを図10に示す。
〈ステップ3e〉
補助ビットBauxの残りを全帯域のS(i)に基づいて再配分する。
〈ステップ4〉
データをスケールファクタS(i)で除することにより正規化し、割り当てられたビット数に基づいて量子化を行う。
〈ステップ3a〉
ビット資源Bから補助ビット(Baux=3)を予め差し引く。
〈ステップ3b〉
上記(15)〜(17)式で示したように、全16帯域のうちの最も低い帯域から順に9個の帯域に、それぞれ2ビットを割り当て、スケールファクタS(i)を1/22倍し、残りのビット資源を求める。
〈ステップ3c〉
残りのビット資源Bをlog2S(i),(i=1,…,16)に比例して配分する。
〈ステップ3d〉
割り当てビット数が1ビットの帯域がある場合、その帯域数に応じて決められたアルゴリズムで3値量子化を実行する。その取り決めを図10に示す。
〈ステップ3e〉
補助ビットBauxの残りを全帯域のS(i)に基づいて再配分する。
〈ステップ4〉
データをスケールファクタS(i)で除することにより正規化し、割り当てられたビット数に基づいて量子化を行う。
上記のような3値量子化を利用した適応ビット割り当てとそれに基づく量子化によって、ビット資源を節約しつつ音質の劣化が極力少ない量子化が達成できる。また、上記のような適用ビット割り当てでは聴覚心理特性を利用する必要がない。そのため、符号化処理が非常に簡単であって、ハードウエアで実現する場合に回路規模が小さくて済むという利点がある。
[3]フィルタバンクの高速化の手法
次に、本実施例の符号化・復号化方法におけるフィルタバンクの処理の高速化手法について説明する。高速化処理が可能なフィルタバンクとしてDCT(離散コサイン変換)フィルタバンクを)用いる。分析フィルタの場合、その構成は図11に示すようになる。ここで、行列CはM×2Mの行列で(i,j)成分は、
である。また、行列Pは次のように適当な基本ローパスフィルタP0(z)のポリフェーズフィルタから構成される。
次に、本実施例の符号化・復号化方法におけるフィルタバンクの処理の高速化手法について説明する。高速化処理が可能なフィルタバンクとしてDCT(離散コサイン変換)フィルタバンクを)用いる。分析フィルタの場合、その構成は図11に示すようになる。ここで、行列CはM×2Mの行列で(i,j)成分は、
行列Cを乗じる処理をそのまま計算すると、M×2M回の乗算が必要になる。この場合、ツリー構成のフィルタバンクの乗算回数とほぼ同等であり高速ではない。これに対し、FFTと同様のアルゴリズムを用いることにより(例えばチェン、スミス、フラリック(W.H.Chen,C.H.Smith, and S.C.Fralick)「ア・ファースト・コンピュテーショナル・アルゴリズム・フォー・ザ・ディスクリート・コサイン・トランスフォーム(A fast computational algorithm for the discrete cosine transform)」、IEEE Trans. Commun. vol.COM-25、第1004頁〜第1009頁、1977年9月などの文献参照)、O(Mlog2M)回の乗算で以て計算することができ、大幅に高速化できる。
一方、行列計算S=Cuの高速計算アルゴリズムは、例えばコンスタンチニデス(K.Konstantinides)「ファースト・サブバンド・フィルタリング・イン・エムペグ・オーディオ・コーディング(Fast Subband Filtering in MPEG Audio Coding)」、IEEE Signal Processing Letters, vol.1, No.2,第26頁〜第28頁、1994年などの文献を参照することができる。このとき、M=16とすれば、行列Cのサイズは32×16である。演算の手順は次の通りである。
〈ステップ1〉
32個の入力信号u[0],…,u[31] を用いて次式のように16個の信号を生成する。
〈ステップ2〉
16点逆離散コサイン変換を上記文献1に基づいて計算し、S[0],S[1],…,S[15]を得る。
このアルゴリズムを用いれば、乗算回数は約Mlog2M=16log216=64回で済む。これは行列をそのまま計算した場合の乗算回数2M×M=512回と比べて格段に高速である。
〈ステップ1〉
32個の入力信号u[0],…,u[31] を用いて次式のように16個の信号を生成する。
16点逆離散コサイン変換を上記文献1に基づいて計算し、S[0],S[1],…,S[15]を得る。
上述したように、本実施例の符号化・復号化方法によれば、帯域分割型の圧縮符号化・復号化方法にアナログで最適に信号を復元できるサンプル値H∞制御技術を採り入れることにより、音質の劣化を最小限に抑えつつ高い圧縮率を得ることができる。
すなわち、上記実施例の元のオーディオ信号の周波数特性は、例えば図12(a)に示すようにサンプリング周波数の約1/2に帯域が制限された状態である。このような信号に1/2のダウンサンプリング処理を行うと、サンプリング周波数が1/2に落ちたのと同じことであるため、周波数帯域は図12(b)に示すようにさらに1/2に制限された状態とほぼ等価である。この失われた帯域はアップサンプリングとその後のフィルタ処理によって見かけ上復元することが可能であるが、従来のフィルタでは折り返し雑音が20kHz以下の可聴帯域に多く存在し、大幅な音質の劣化は回避できない。それに対し、本実施例のようなデジタルフィルタを用いれば、図12(c)に示すように可聴帯域において適切に信号を復元することができる。
なお、上記説明はオーディオ信号に関して本発明を適用した例であるが、同様の手法を画像信号に適用できることは当業者には明らかである。
1…エンコーダ
11…フィルタバンク
12…ダウンサンプラ
13…量子化器
14…ダウンサンプラ
15…デジタルフィルタ
2…デコーダ
21…アップサンプラ
22…フィルタバンク
23…アップサンプラ
24…デジタルフィルタ
30…A/D変換部
31…アンチエリアシングフィルタ
32…サンプラ
33…オーバーサンプリング型D/A変換器
34…アップサンプラ
35…デジタルフィルタ
36…0次ホールド
37…ローパスフィルタ
38…遅れ要素
39…減算器
11…フィルタバンク
12…ダウンサンプラ
13…量子化器
14…ダウンサンプラ
15…デジタルフィルタ
2…デコーダ
21…アップサンプラ
22…フィルタバンク
23…アップサンプラ
24…デジタルフィルタ
30…A/D変換部
31…アンチエリアシングフィルタ
32…サンプラ
33…オーバーサンプリング型D/A変換器
34…アップサンプラ
35…デジタルフィルタ
36…0次ホールド
37…ローパスフィルタ
38…遅れ要素
39…減算器
Claims (2)
- 所定のサンプリング周波数を有するデジタル信号列を圧縮符号化して記録媒体に記憶し又は伝送経路に送出し、該記憶媒体から読み出した又は該伝送経路を通して受信した前記信号を復号化して元のサンプリング周波数を有する信号を再生するための符号化・復号化方法であって、符号化には複数の周波数帯域に分割する帯域分割処理を、復号化には分割された周波数帯域を統合する帯域統合処理を含む帯域分割型符号化・復号化方法において、
前記符号化では、前記帯域分割処理の前段で前記デジタル信号列の隣接するN個のサンプルに(N−1)個の割合でサンプルを間引くダウンサンプリングを行い、
前記復号化では、前記帯域統合処理の後段で、時系列的に隣接するサンプル間に(N−1)個の0点データを挿入するN倍のアップサンプリングを行った後に、低域通過型のデジタルフィルタを通すことにより前記挿入された0信号の位置における情報を補間的に生成し、
該デジタルフィルタは、帯域制限された元のアナログ信号とアナログ/デジタル/アナログ変換を通して得られるアナログ信号との誤差信号を小さくするようにデジタルフィルタを設計すべく設定した条件式を、有限次元離散時間系に近似的に変換することで得た計算式を所定の条件に基づいてH∞制御により解くことによって又はそれに相当する計算で解くことによって算出したパラメータを有して成るものであることを特徴とする帯域分割型符号化・復号化方法。 - 請求項1に記載の帯域分割型符号化・復号化方法により符号化されて記録媒体に記憶された又は伝送経路に送出された信号を受けてこれを復元するための復号化装置であって、
a)各周波数帯域毎に所定の復号化処理を行った後に分割された周波数帯域を統合する帯域統合処理を行う復号化手段と、
b)前記復号化手段の後段にあって、時系列的に隣接するサンプル間に(N−1)個の0点データを挿入するN倍のアップサンプリングを行うアップサンプラと、
c)アップサンプリングされたサンプル中に挿入されている0信号の位置における情報を補間的に生成する低域通過型のデジタルフィルタと、
を備え、該デジタルフィルタは、帯域制限された元のアナログ信号とアナログ/デジタル/アナログ変換を通して得られるアナログ信号との誤差信号を小さくするようにデジタルフィルタを設計すべく設定した条件式を、有限次元離散時間系に近似的に変換することで得た計算式を所定の条件に基づいてH∞制御により解くことによって又はそれに相当する計算で解くことによって算出したパラメータを有して成ることを特徴とする復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003285330A JP2005057439A (ja) | 2003-08-01 | 2003-08-01 | 帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003285330A JP2005057439A (ja) | 2003-08-01 | 2003-08-01 | 帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005057439A true JP2005057439A (ja) | 2005-03-03 |
Family
ID=34364986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003285330A Pending JP2005057439A (ja) | 2003-08-01 | 2003-08-01 | 帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005057439A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008135906A (ja) * | 2006-11-28 | 2008-06-12 | Canon Inc | 画像処理装置及び方法 |
WO2009157280A1 (ja) * | 2008-06-26 | 2009-12-30 | 独立行政法人科学技術振興機構 | オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法 |
CN110890926A (zh) * | 2018-09-11 | 2020-03-17 | 航天信息股份有限公司 | 一种解码方法及装置 |
CN112037781A (zh) * | 2020-08-07 | 2020-12-04 | 北京百度网讯科技有限公司 | 语音数据的获取方法和装置 |
-
2003
- 2003-08-01 JP JP2003285330A patent/JP2005057439A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008135906A (ja) * | 2006-11-28 | 2008-06-12 | Canon Inc | 画像処理装置及び方法 |
WO2009157280A1 (ja) * | 2008-06-26 | 2009-12-30 | 独立行政法人科学技術振興機構 | オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法 |
JP5224219B2 (ja) * | 2008-06-26 | 2013-07-03 | 独立行政法人科学技術振興機構 | オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法 |
US8666733B2 (en) | 2008-06-26 | 2014-03-04 | Japan Science And Technology Agency | Audio signal compression and decoding using band division and polynomial approximation |
CN110890926A (zh) * | 2018-09-11 | 2020-03-17 | 航天信息股份有限公司 | 一种解码方法及装置 |
CN112037781A (zh) * | 2020-08-07 | 2020-12-04 | 北京百度网讯科技有限公司 | 语音数据的获取方法和装置 |
CN112037781B (zh) * | 2020-08-07 | 2024-01-19 | 北京百度网讯科技有限公司 | 语音数据的获取方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7504174B2 (ja) | Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置 | |
JP4918841B2 (ja) | 符号化システム | |
EP1715476B1 (en) | Low-bitrate encoding/decoding method and system | |
EP1334484B1 (en) | Enhancing the performance of coding systems that use high frequency reconstruction methods | |
KR100548891B1 (ko) | 음성 부호화 장치 및 음성 부호화 방법 | |
WO2010098112A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
US9076437B2 (en) | Audio signal processing apparatus | |
JP2005157390A (ja) | 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 | |
WO2011161886A1 (ja) | 復号装置、符号化装置およびこれらの方法 | |
AU2015235133B2 (en) | Audio decoding device, audio encoding device, audio decoding method, audio encoding method, audio decoding program, and audio encoding program | |
US20080106445A1 (en) | Digital Signal Processing Apparatus, Digital Signal Processing Method, Digital Signal Processing Program, Digital Signal Reproduction Apparatus and Digital Signal Reproduction Method | |
JP4800645B2 (ja) | 音声符号化装置、及び音声符号化方法 | |
JP2002118517A (ja) | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 | |
CN101010729A (zh) | 用于转码的方法和设备 | |
JP2010145426A (ja) | オーディオ帯域拡張装置 | |
CN115668368A (zh) | 执行动态范围控制的方法和单元 | |
JP2005057439A (ja) | 帯域分割型符号化・復号化方法、及びその方法に用いる復号化装置 | |
JP2013073230A (ja) | オーディオ符号化装置 | |
JP3851757B2 (ja) | サンプリングレート変換装置 | |
JP4645869B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
KR100433984B1 (ko) | 디지털 오디오 부호화/복호화 장치 및 방법 | |
JP5491193B2 (ja) | 音声コード化の方法および装置 | |
JP4024784B2 (ja) | オーディオ復号装置 | |
JP2001306097A (ja) | 音声符号化方式及び装置、音声復号化方式及び装置、並びに記録媒体 | |
JP3311580B2 (ja) | 音声信号圧縮装置及びカメラ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051011 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060221 |