JP2001083994A

JP2001083994A - オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器

Info

Publication number: JP2001083994A
Application number: JP2000239442A
Authority: JP
Inventors: Walter Voessing; フェシングヴァルター; Fei Gao; ガオフェイ; Andreas Aust; アオストアンドレーアス
Original assignee: Deutsche Thomson Brandt GmbH
Current assignee: Deutsche Thomson Brandt GmbH
Priority date: 1999-08-09
Filing date: 2000-08-08
Publication date: 2001-03-30
Also published as: EP1076297A1; US6873950B1

Abstract

(57)【要約】【課題】本発明は、減少された計算能力で、音響心理
モデルを用いてオーディオ信号のデータ伝送速度を節約
して符号化する方法と、上記方法を使用する符号化器を
提供することを目的とする。【解決手段】本発明によれば、ｋ個のサブ変換（ＳＴ１
乃至ＳＴ９）を２^Ｎ個のサンプルについて計算し、ｋ個
のサブ変換の結果を組合わせることによって、Ｌ＝１１
５２個のサンプルの長さで高速フーリエ変換（ＦＦＴ）
が行なわれる（ｋ＊２^Ｎ＝Ｌ）、フーリエ変換が最小マ
スキング閾値を計算するために行なわれ、オーディオ信
号のＬ個のサンプルが伝送のためにフレーム内に配置さ
れる、音響心理モデルを用いてオーディオ信号のデータ
伝送速度を節約して符号化する方法及びこの方法を用い
る符号化器を提供することを目的とする。

Description

【発明の詳細な説明】

【０００１】

【発明が属する技術分野】本発明は、オーディオ信号の
ビット伝送速度を節約して符号化する方法及び符号化
器、特に、ＭＰＥＧ１のオーディオレイヤＩＩによるオ
ーディオ信号の符号化に係る。

【０００２】

【従来の技術】国際標準ＩＳＯ／ＩＥＣ１１７７２―３
に記載されるＭＰＥＧ１のオーディオ標準では、レイヤ
Ｉ、ＩＩ及びＩＩＩと知られる３つの動作モードが定義
される。各レイヤは増加された圧縮を提供するが、更に
増加された符号化の複雑さも提供し、下方向の互換性が
保証される。従ってレイヤＩＩ復号器は、レイヤＩのデ
ータストリームを読取ることができるが、レイヤＩＩＩ
のデータストリームを読取ることはできない。更にレイ
ヤＩＩＩ復号器は全てのＭＰＥＧ１のオーディオビット
ストリーム、つまりレイヤＩ乃至ＩＩＩを復号すること
ができる。

【０００３】ＭＰＥＧ１のオーディオデータ圧縮は、サ
ブバンド符号化に基づいている。オーディオ信号は、等
しい幅を有する３２個のサブバンドに分割される。量子
化は、人間の聴力のマスキング性質に適合された音響心
理（psychoacoustic）モデルを用いて行なわれる。各サ
ブバンド信号は、符号化によって引き起こされる量子化
雑音がそのサブバンドについてのマスキング曲線を超え
ないように量子化される。量子化された後に、サンプル
は、換算係数及び更なる符号化情報と共に、伝送のため
にフレーム構造を形成する。

【０００４】

【発明が解決しようとする課題】国際標準ＩＳＯ／ＩＥ
Ｃ１１１７２−３では、どのレイヤにも適合できる二つ
の独立した音響心理モデルが定義される。これらの音響
心理モデルの出力は、各サブバンドｎについての信号対
マスキング比、つまりＳＭＲ_ｎの組である。

【０００５】音響心理モデル２についてのＳＭＲ_ｎを計
算するためには、各チャネルにおいて２度実行されなけ
ればならず、即ちステレオチャネルにおいては４度実行
しなくてはならない１０２４個のサンプルの長さを有す
る高速フーリエ変換（ＦＦＴ）が使用される。

【０００６】

【課題を解決するための手段】本発明は、減少された計
算能力で、音響心理モデルを用いてオーディオ信号のビ
ット伝送速度を節約して符号化する方法を提供すること
を目的とする。上記目的は、請求項１に記載される方法
によって達成される。

【０００７】本発明は、上記の方法を使用する符号化器
を開示することを更なる目的とする。上記目的は請求項
６に開示される装置によって達成される。

【０００８】本発明は、以下の認識に基づいている。一
方で、ＦＦＴは、サンプルの数が、例えば１０２４個の
ような２の累乗でなければならない特別な離散フーリエ
変換であり、他方で、ＭＰＥＧ１のオーディオレイヤＩ
Ｉのフレームの長さは２の累乗ではない１１５２個のサ
ンプルである。従来技術においては、これはＦＦＴの各
チャネルにおいて２度の実行をもたらす。

【０００９】データ級数ｚ（ｎ）のＬ個の要素について
対応するＬ個の周波数値Ｆ（ｍ）を計算する離散フーリ
エ変換の公知の式は、以下のように表される。

【００１０】

【数１】上記式はＭ個の被加数をそれぞれ有するｋ個の部分和に
変換されて以下のように表される。

【００１１】

【数２】最後に、Ｌ＝ｋＭとして、指数関数を分離して以下のよ
うに変換される。

【００１２】

【数３】従って、Ｍ＝２^Ｎの長さを有するｋ個のサブ変換を使用
することによって、Ｌが２の累乗でない場合でも、高速
フーリエ変換によって効率のよい演算が可能になる。

【００１３】原則的には、フーリエ変換が最小マスキン
グ閾値を計算するために行なわれ、オーディオ信号のＬ
個のサンプルが伝送のためにフレーム内に配置される、
音響心理モデルを用いてオーディオ信号のデータ伝送速
度を節約して符号化する方法は、ｋ個のサブ変換を２^Ｎ
個のサンプルについて計算し、ｋ個のサブ変換の結果を
組合わせることによって、Ｌ個のサンプルの長さでフー
リエ変換が行なわれるという事実を含む。

【００１４】この方法によって、情報の損失又は誤りを
もたらすことなく各チャネルにおいての重複する実行が
阻止される。従って、計算能力は略半分まで減少され
る。これは、リアルタイムにデジタル信号プロセッサを
実行させる際に特に大切である。

【００１５】上記本発明の方法は特に有利であるが、ｋ
個のサブ変換の数が２の累乗でない場合、本発明の使用
はそのｋの値に制限されない。

【００１６】ｋ個のサブ変換の結果と組み合わされる前
に、これらは位相修正係数で乗算されることが有利であ
る。

【００１７】フーリエ変換は、ＭＰＥＧＩのオーディオ
レイヤＩＩの音響心理モデル２についてアルゴリズム内
で行なわれ、フレームの長さＬは１１５２個のサンプル
であることが有利な様式である。

【００１８】有利な発展において、Ｍ＝２^Ｎ＝１２８個
のサンプルの長さを有するｋ＝９個のサブ変換が計算さ
れる。

【００１９】

【発明の実施の形態】本発明の実施例を、サブ変換の略
図を参照し説明する。

【００２０】国際標準ＩＳＯ／ＩＥＣ１１１７２−３に
おいて、符号化器は標準化されていないが、マスキング
閾値の推測又は量子化のような幾つかの符号化手段は一
般的に使用されるので以下に詳細に説明しない。

【００２１】第１に、サンプリング周波数３２、４４．
１又は４８ｋＨｚ（又は半分のサンプリング周波数１
６、２２．０５又は２４ｋＨｚ）を有するＰＣＭオーデ
ィオサンプルが、符号化器に供給される。入力オーディ
オストリームのフィルタされ、サブサンプルされた表現
を、サブバンドサンプルと呼ばれる形態に形成するため
にマッピングが行なわれる。各サブバンド信号は、符号
化によって引き起こされる量子化雑音がそのサブバンド
についてのマスキング曲線を超えないように量子化され
る。

【００２２】量子化を制御するために音響心理モデル
は、１１５２個の入力ＰＣＭサンプルに対応する全体で
３６個のサブバンドサンプルとなる３つのブロックにつ
いてＭＰＥＧ１オーディオレイヤＩＩのための新しいビ
ットの割当を計算する。計算は全てのサブバンドについ
ての信号対マスキング比、つまりＳＭＲ_ｎに基づいてお
り、各サブバンドに対して最大信号レベルと最小マスキ
ング閾値を決定することが必要となる。

【００２３】最小マスキング閾値は、図１に示される本
発明による方法を使用することによって引き出される。
入力ＰＣＭサンプルをウィンドウ処理した後、フレーム
Ｆ１に対応するサンプルは分離され、９つのサブ変換Ｓ
Ｔ１乃至ＳＴ９に供給される。各サブ変換は２の７乗
（２^７＝１２８）である１２８個のサンプルの長さ（９
＊１２８＝１１５２）を有する。部分信号の高速フーリ
エ変換の後、９つのサブ変換の結果は位相修正係数によ
って乗算され、乗算器装置Ｍ１乃至Ｍ９によって示され
る。位相が修正されたデータは加算器装置Ａによって組
合されて、音響心理モデルの更なる計算のために使用さ
れる。同様の方法が、下記のフレームＦ２、Ｆ３等に対
応するオーディオサンプルに用いられる。

【００２４】本発明は、ＭＰＥＧ１のオーディオレイヤ
ＩＩのオーディオ信号の符号化に有利に使用できるが、
他のどのデジタルデータの符号化にも用いることが可能
である。

【００２５】本発明は、例えばデジタルオーディオ放送
（ＤＡＢ）、ケーブル及び衛星ラジオ／テレビ、又はＤ
ＶＤ−ＶＲ等のようなデジタル記録装置のようなどの種
類の符号化器にも用いることが可能である。

【図面の簡単な説明】

【図１】サブ変換の使用方法を示す略図である。

【符号の説明】

Ａ加算器装置Ｆ１、Ｆ２、Ｆ３フレームＭ１、Ｍ２、Ｍ３、Ｍ４、Ｍ５、Ｍ６、Ｍ７、Ｍ８、Ｍ
９乗算器装置ＳＴ１、ＳＴ２、ＳＴ３、ＳＴ４、ＳＴ５、ＳＴ６、Ｓ
Ｔ７、ＳＴ８、ＳＴ９サブ変換

───────────────────────────────────────────────────── フロントページの続き (72)発明者フェイガオドイツ連邦共和国，30449 ハノーヴァー, ヤコブスシュトラーセ８ａ (72)発明者アンドレーアスアオストドイツ連邦共和国，30177 ハノーヴァー, シュトルムシュトラーセ 23

Claims

【特許請求の範囲】

【請求項１】最小マスキング閾値を計算するためにフ
ーリエ変換が行なわれ、伝送のためにフレーム（Ｆ１、Ｆ２、Ｆ３）内にオーデ
ィオ信号のＬ個のサンプルが配置される、音響心理モデ
ルを用いてオーディオ信号のビット伝送速度を節約して
符号化する方法であって、上記フーリエ変換は、L個のサンプルの長さでは、ｋ個
のサブ変換（ＳＴ１、…、ＳＴ９）を２^Ｎ個のサンプル
について行い（ｋ＊２^N＝L）、ｋ個のサブ変換の結果を
組合わせること（Ａ）によって行なわれることを特徴と
する方法。
【請求項２】上記サブ変換の個数ｋは２の累乗ではな
い請求項１記載の方法。
【請求項３】上記ｋ個のサブ変換の結果を組合わせる
前に、上記結果は位相修正係数（Ｍ１、…、Ｍ９）によ
って乗算される請求項１又は２のうちいずれか一項記載
の方法。
【請求項４】上記フーリエ変換は、ＭＰＥＧ１のオー
ディオレイヤＩＩの上記音響心理モデル２についてアル
ゴリズム内で行なわれ、フレームの長さＬが１１５２個
のサンプルである請求項１乃至３のうちいずれか一項記
載の方法。
【請求項５】Ｍ＝２^Ｎ＝１２８個のサンプルの長さを
有するｋ＝９個のサブ変換が計算される請求項４記載の
方法。
【請求項６】請求項１記載の方法を行なうための符号
化器。