[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2001083994A - オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器 - Google Patents

オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器

Info

Publication number
JP2001083994A
JP2001083994A JP2000239442A JP2000239442A JP2001083994A JP 2001083994 A JP2001083994 A JP 2001083994A JP 2000239442 A JP2000239442 A JP 2000239442A JP 2000239442 A JP2000239442 A JP 2000239442A JP 2001083994 A JP2001083994 A JP 2001083994A
Authority
JP
Japan
Prior art keywords
samples
sub
audio signal
encoder
transforms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000239442A
Other languages
English (en)
Inventor
Walter Voessing
フェシング ヴァルター
Fei Gao
ガオ フェイ
Andreas Aust
アオスト アンドレーアス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Thomson Brandt GmbH
Original Assignee
Deutsche Thomson Brandt GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Thomson Brandt GmbH filed Critical Deutsche Thomson Brandt GmbH
Publication of JP2001083994A publication Critical patent/JP2001083994A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Discrete Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 本発明は、減少された計算能力で、音響心理
モデルを用いてオーディオ信号のデータ伝送速度を節約
して符号化する方法と、上記方法を使用する符号化器を
提供することを目的とする。 【解決手段】本発明によれば、k個のサブ変換(ST1
乃至ST9)を2個のサンプルについて計算し、k個
のサブ変換の結果を組合わせることによって、L=11
52個のサンプルの長さで高速フーリエ変換(FFT)
が行なわれる(k*2=L)、フーリエ変換が最小マ
スキング閾値を計算するために行なわれ、オーディオ信
号のL個のサンプルが伝送のためにフレーム内に配置さ
れる、音響心理モデルを用いてオーディオ信号のデータ
伝送速度を節約して符号化する方法及びこの方法を用い
る符号化器を提供することを目的とする。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、オーディオ信号の
ビット伝送速度を節約して符号化する方法及び符号化
器、特に、MPEG1のオーディオレイヤIIによるオ
ーディオ信号の符号化に係る。
【0002】
【従来の技術】国際標準ISO/IEC11772―3
に記載されるMPEG1のオーディオ標準では、レイヤ
I、II及びIIIと知られる3つの動作モードが定義
される。各レイヤは増加された圧縮を提供するが、更に
増加された符号化の複雑さも提供し、下方向の互換性が
保証される。従ってレイヤII復号器は、レイヤIのデ
ータストリームを読取ることができるが、レイヤIII
のデータストリームを読取ることはできない。更にレイ
ヤIII復号器は全てのMPEG1のオーディオビット
ストリーム、つまりレイヤI乃至IIIを復号すること
ができる。
【0003】MPEG1のオーディオデータ圧縮は、サ
ブバンド符号化に基づいている。オーディオ信号は、等
しい幅を有する32個のサブバンドに分割される。量子
化は、人間の聴力のマスキング性質に適合された音響心
理(psychoacoustic)モデルを用いて行なわれる。各サ
ブバンド信号は、符号化によって引き起こされる量子化
雑音がそのサブバンドについてのマスキング曲線を超え
ないように量子化される。量子化された後に、サンプル
は、換算係数及び更なる符号化情報と共に、伝送のため
にフレーム構造を形成する。
【0004】
【発明が解決しようとする課題】国際標準ISO/IE
C11172−3では、どのレイヤにも適合できる二つ
の独立した音響心理モデルが定義される。これらの音響
心理モデルの出力は、各サブバンドnについての信号対
マスキング比、つまりSMRの組である。
【0005】音響心理モデル2についてのSMRを計
算するためには、各チャネルにおいて2度実行されなけ
ればならず、即ちステレオチャネルにおいては4度実行
しなくてはならない1024個のサンプルの長さを有す
る高速フーリエ変換(FFT)が使用される。
【0006】
【課題を解決するための手段】本発明は、減少された計
算能力で、音響心理モデルを用いてオーディオ信号のビ
ット伝送速度を節約して符号化する方法を提供すること
を目的とする。上記目的は、請求項1に記載される方法
によって達成される。
【0007】本発明は、上記の方法を使用する符号化器
を開示することを更なる目的とする。上記目的は請求項
6に開示される装置によって達成される。
【0008】本発明は、以下の認識に基づいている。一
方で、FFTは、サンプルの数が、例えば1024個の
ような2の累乗でなければならない特別な離散フーリエ
変換であり、他方で、MPEG1のオーディオレイヤI
Iのフレームの長さは2の累乗ではない1152個のサ
ンプルである。従来技術においては、これはFFTの各
チャネルにおいて2度の実行をもたらす。
【0009】データ級数z(n)のL個の要素について
対応するL個の周波数値F(m)を計算する離散フーリ
エ変換の公知の式は、以下のように表される。
【0010】
【数1】 上記式はM個の被加数をそれぞれ有するk個の部分和に
変換されて以下のように表される。
【0011】
【数2】 最後に、L=kMとして、指数関数を分離して以下のよ
うに変換される。
【0012】
【数3】 従って、M=2の長さを有するk個のサブ変換を使用
することによって、Lが2の累乗でない場合でも、高速
フーリエ変換によって効率のよい演算が可能になる。
【0013】原則的には、フーリエ変換が最小マスキン
グ閾値を計算するために行なわれ、オーディオ信号のL
個のサンプルが伝送のためにフレーム内に配置される、
音響心理モデルを用いてオーディオ信号のデータ伝送速
度を節約して符号化する方法は、k個のサブ変換を2
個のサンプルについて計算し、k個のサブ変換の結果を
組合わせることによって、L個のサンプルの長さでフー
リエ変換が行なわれるという事実を含む。
【0014】この方法によって、情報の損失又は誤りを
もたらすことなく各チャネルにおいての重複する実行が
阻止される。従って、計算能力は略半分まで減少され
る。これは、リアルタイムにデジタル信号プロセッサを
実行させる際に特に大切である。
【0015】上記本発明の方法は特に有利であるが、k
個のサブ変換の数が2の累乗でない場合、本発明の使用
はそのkの値に制限されない。
【0016】k個のサブ変換の結果と組み合わされる前
に、これらは位相修正係数で乗算されることが有利であ
る。
【0017】フーリエ変換は、MPEGIのオーディオ
レイヤIIの音響心理モデル2についてアルゴリズム内
で行なわれ、フレームの長さLは1152個のサンプル
であることが有利な様式である。
【0018】有利な発展において、M=2=128個
のサンプルの長さを有するk=9個のサブ変換が計算さ
れる。
【0019】
【発明の実施の形態】本発明の実施例を、サブ変換の略
図を参照し説明する。
【0020】国際標準ISO/IEC11172−3に
おいて、符号化器は標準化されていないが、マスキング
閾値の推測又は量子化のような幾つかの符号化手段は一
般的に使用されるので以下に詳細に説明しない。
【0021】第1に、サンプリング周波数32、44.
1又は48kHz(又は半分のサンプリング周波数1
6、22.05又は24kHz)を有するPCMオーデ
ィオサンプルが、符号化器に供給される。入力オーディ
オストリームのフィルタされ、サブサンプルされた表現
を、サブバンドサンプルと呼ばれる形態に形成するため
にマッピングが行なわれる。各サブバンド信号は、符号
化によって引き起こされる量子化雑音がそのサブバンド
についてのマスキング曲線を超えないように量子化され
る。
【0022】量子化を制御するために音響心理モデル
は、1152個の入力PCMサンプルに対応する全体で
36個のサブバンドサンプルとなる3つのブロックにつ
いてMPEG1オーディオレイヤIIのための新しいビ
ットの割当を計算する。計算は全てのサブバンドについ
ての信号対マスキング比、つまりSMRに基づいてお
り、各サブバンドに対して最大信号レベルと最小マスキ
ング閾値を決定することが必要となる。
【0023】最小マスキング閾値は、図1に示される本
発明による方法を使用することによって引き出される。
入力PCMサンプルをウィンドウ処理した後、フレーム
F1に対応するサンプルは分離され、9つのサブ変換S
T1乃至ST9に供給される。各サブ変換は2の7乗
(2=128)である128個のサンプルの長さ(9
*128=1152)を有する。部分信号の高速フーリ
エ変換の後、9つのサブ変換の結果は位相修正係数によ
って乗算され、乗算器装置M1乃至M9によって示され
る。位相が修正されたデータは加算器装置Aによって組
合されて、音響心理モデルの更なる計算のために使用さ
れる。同様の方法が、下記のフレームF2、F3等に対
応するオーディオサンプルに用いられる。
【0024】本発明は、MPEG1のオーディオレイヤ
IIのオーディオ信号の符号化に有利に使用できるが、
他のどのデジタルデータの符号化にも用いることが可能
である。
【0025】本発明は、例えばデジタルオーディオ放送
(DAB)、ケーブル及び衛星ラジオ/テレビ、又はD
VD−VR等のようなデジタル記録装置のようなどの種
類の符号化器にも用いることが可能である。
【図面の簡単な説明】
【図1】サブ変換の使用方法を示す略図である。
【符号の説明】
A 加算器装置 F1、F2、F3 フレーム M1、M2、M3、M4、M5、M6、M7、M8、M
9 乗算器装置 ST1、ST2、ST3、ST4、ST5、ST6、S
T7、ST8、ST9サブ変換
───────────────────────────────────────────────────── フロントページの続き (72)発明者 フェイ ガオ ドイツ連邦共和国,30449 ハノーヴァー, ヤコブスシュトラーセ 8a (72)発明者 アンドレーアス アオスト ドイツ連邦共和国,30177 ハノーヴァー, シュトルムシュトラーセ 23

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 最小マスキング閾値を計算するためにフ
    ーリエ変換が行なわれ、 伝送のためにフレーム(F1、F2、F3)内にオーデ
    ィオ信号のL個のサンプルが配置される、音響心理モデ
    ルを用いてオーディオ信号のビット伝送速度を節約して
    符号化する方法であって、 上記フーリエ変換は、L個のサンプルの長さでは、k個
    のサブ変換(ST1、…、ST9)を2個のサンプル
    について行い(k*2N=L)、k個のサブ変換の結果を
    組合わせること(A)によって行なわれることを特徴と
    する方法。
  2. 【請求項2】 上記サブ変換の個数kは2の累乗ではな
    い請求項1記載の方法。
  3. 【請求項3】 上記k個のサブ変換の結果を組合わせる
    前に、上記結果は位相修正係数(M1、…、M9)によ
    って乗算される請求項1又は2のうちいずれか一項記載
    の方法。
  4. 【請求項4】 上記フーリエ変換は、MPEG1のオー
    ディオレイヤIIの上記音響心理モデル2についてアル
    ゴリズム内で行なわれ、フレームの長さLが1152個
    のサンプルである請求項1乃至3のうちいずれか一項記
    載の方法。
  5. 【請求項5】 M=2=128個のサンプルの長さを
    有するk=9個のサブ変換が計算される請求項4記載の
    方法。
  6. 【請求項6】 請求項1記載の方法を行なうための符号
    化器。
JP2000239442A 1999-08-09 2000-08-08 オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器 Pending JP2001083994A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP99115675A EP1076297A1 (en) 1999-08-09 1999-08-09 Method for fast Fourier transformation of audio signals
EP99115675:3 1999-08-09

Publications (1)

Publication Number Publication Date
JP2001083994A true JP2001083994A (ja) 2001-03-30

Family

ID=8238750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000239442A Pending JP2001083994A (ja) 1999-08-09 2000-08-08 オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器

Country Status (3)

Country Link
US (1) US6873950B1 (ja)
EP (1) EP1076297A1 (ja)
JP (1) JP2001083994A (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202627A (ja) * 1993-05-28 1994-07-22 Casio Comput Co Ltd 音信号ピッチ抽出装置
JPH0736484A (ja) * 1993-07-21 1995-02-07 Sharp Corp 音響信号符号化装置
JPH08328592A (ja) * 1995-05-31 1996-12-13 Nec Corp 音声信号処理回路
JPH09244686A (ja) * 1996-02-09 1997-09-19 Canon Inc 情報処理方法及び装置
JPH118559A (ja) * 1997-01-15 1999-01-12 Korea Telecommun Mpeg−iiオーディオ符号化装置
JPH11203272A (ja) * 1997-02-04 1999-07-30 Oki Electric Ind Co Ltd 高速フーリエ変換処理装置、高速フーリエ変換処理システムおよび高速フーリエ変換処理方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4604721A (en) * 1981-10-13 1986-08-05 Trw Inc. Computer and method for high speed prime factor transform
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5657423A (en) * 1993-02-22 1997-08-12 Texas Instruments Incorporated Hardware filter circuit and address circuitry for MPEG encoded data
US5294236A (en) * 1993-03-10 1994-03-15 Baird Meter Inc. Effluent metering system
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
WO1996019876A1 (en) * 1994-12-20 1996-06-27 Dolby Laboratories Licensing Corporation Method and apparatus for applying waveform prediction to subbands of a perceptual coding system
US5999905A (en) * 1995-12-13 1999-12-07 Sony Corporation Apparatus and method for processing data to maintain continuity when subsequent data is added and an apparatus and method for recording said data
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202627A (ja) * 1993-05-28 1994-07-22 Casio Comput Co Ltd 音信号ピッチ抽出装置
JPH0736484A (ja) * 1993-07-21 1995-02-07 Sharp Corp 音響信号符号化装置
JPH08328592A (ja) * 1995-05-31 1996-12-13 Nec Corp 音声信号処理回路
JPH09244686A (ja) * 1996-02-09 1997-09-19 Canon Inc 情報処理方法及び装置
JPH118559A (ja) * 1997-01-15 1999-01-12 Korea Telecommun Mpeg−iiオーディオ符号化装置
JPH11203272A (ja) * 1997-02-04 1999-07-30 Oki Electric Ind Co Ltd 高速フーリエ変換処理装置、高速フーリエ変換処理システムおよび高速フーリエ変換処理方法

Also Published As

Publication number Publication date
EP1076297A1 (en) 2001-02-14
US6873950B1 (en) 2005-03-29

Similar Documents

Publication Publication Date Title
US7337118B2 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR100608062B1 (ko) 오디오 데이터의 고주파수 복원 방법 및 그 장치
US20080140405A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
JPH07210196A (ja) ディジタル信号符号化/復号化装置及び方法
TW200406096A (en) Improved low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
JP2009515212A (ja) オーディオ圧縮
US20070078646A1 (en) Method and apparatus to encode/decode audio signal
JP2005534947A (ja) 心理音響ベースで圧縮する際に形成されるノイズの許容可能な歪みに基づくスケールファクタのフィードフォワード予測
EP1259956B1 (en) Method of and apparatus for converting an audio signal between data compression formats
EP1708173B1 (en) Method and apparatus for coding audio signal
KR100378796B1 (ko) 디지탈 오디오 부호화기 및 복호화 방법
TWI390502B (zh) 編碼信號之處理方法
JP2001083994A (ja) オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器
RU2409874C9 (ru) Сжатие звуковых сигналов
EP1076295A1 (en) Method and encoder for bit-rate saving encoding of audio signals
Cavagnolo et al. Introduction to Digital Audio Compression
JPH05114863A (ja) 高能率符号化装置及び復号化装置
IL165648A (en) An audio coding system that uses decoded signal properties to coordinate synthesized spectral components
JPH08330973A (ja) 信号符号化装置及び信号復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100910

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100915

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110301