JP2001083994A - オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器 - Google Patents
オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器Info
- Publication number
- JP2001083994A JP2001083994A JP2000239442A JP2000239442A JP2001083994A JP 2001083994 A JP2001083994 A JP 2001083994A JP 2000239442 A JP2000239442 A JP 2000239442A JP 2000239442 A JP2000239442 A JP 2000239442A JP 2001083994 A JP2001083994 A JP 2001083994A
- Authority
- JP
- Japan
- Prior art keywords
- samples
- sub
- audio signal
- encoder
- transforms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 230000005236 sound signal Effects 0.000 title claims abstract description 13
- 230000005540 biological transmission Effects 0.000 title claims abstract description 10
- 230000000873 masking effect Effects 0.000 claims abstract description 9
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 claims description 8
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 230000009466 transformation Effects 0.000 abstract 2
- 238000013139 quantization Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/007—Transform coding, e.g. discrete cosine transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Discrete Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
モデルを用いてオーディオ信号のデータ伝送速度を節約
して符号化する方法と、上記方法を使用する符号化器を
提供することを目的とする。 【解決手段】本発明によれば、k個のサブ変換(ST1
乃至ST9)を2N個のサンプルについて計算し、k個
のサブ変換の結果を組合わせることによって、L=11
52個のサンプルの長さで高速フーリエ変換(FFT)
が行なわれる(k*2N=L)、フーリエ変換が最小マ
スキング閾値を計算するために行なわれ、オーディオ信
号のL個のサンプルが伝送のためにフレーム内に配置さ
れる、音響心理モデルを用いてオーディオ信号のデータ
伝送速度を節約して符号化する方法及びこの方法を用い
る符号化器を提供することを目的とする。
Description
ビット伝送速度を節約して符号化する方法及び符号化
器、特に、MPEG1のオーディオレイヤIIによるオ
ーディオ信号の符号化に係る。
に記載されるMPEG1のオーディオ標準では、レイヤ
I、II及びIIIと知られる3つの動作モードが定義
される。各レイヤは増加された圧縮を提供するが、更に
増加された符号化の複雑さも提供し、下方向の互換性が
保証される。従ってレイヤII復号器は、レイヤIのデ
ータストリームを読取ることができるが、レイヤIII
のデータストリームを読取ることはできない。更にレイ
ヤIII復号器は全てのMPEG1のオーディオビット
ストリーム、つまりレイヤI乃至IIIを復号すること
ができる。
ブバンド符号化に基づいている。オーディオ信号は、等
しい幅を有する32個のサブバンドに分割される。量子
化は、人間の聴力のマスキング性質に適合された音響心
理(psychoacoustic)モデルを用いて行なわれる。各サ
ブバンド信号は、符号化によって引き起こされる量子化
雑音がそのサブバンドについてのマスキング曲線を超え
ないように量子化される。量子化された後に、サンプル
は、換算係数及び更なる符号化情報と共に、伝送のため
にフレーム構造を形成する。
C11172−3では、どのレイヤにも適合できる二つ
の独立した音響心理モデルが定義される。これらの音響
心理モデルの出力は、各サブバンドnについての信号対
マスキング比、つまりSMRnの組である。
算するためには、各チャネルにおいて2度実行されなけ
ればならず、即ちステレオチャネルにおいては4度実行
しなくてはならない1024個のサンプルの長さを有す
る高速フーリエ変換(FFT)が使用される。
算能力で、音響心理モデルを用いてオーディオ信号のビ
ット伝送速度を節約して符号化する方法を提供すること
を目的とする。上記目的は、請求項1に記載される方法
によって達成される。
を開示することを更なる目的とする。上記目的は請求項
6に開示される装置によって達成される。
方で、FFTは、サンプルの数が、例えば1024個の
ような2の累乗でなければならない特別な離散フーリエ
変換であり、他方で、MPEG1のオーディオレイヤI
Iのフレームの長さは2の累乗ではない1152個のサ
ンプルである。従来技術においては、これはFFTの各
チャネルにおいて2度の実行をもたらす。
対応するL個の周波数値F(m)を計算する離散フーリ
エ変換の公知の式は、以下のように表される。
変換されて以下のように表される。
うに変換される。
することによって、Lが2の累乗でない場合でも、高速
フーリエ変換によって効率のよい演算が可能になる。
グ閾値を計算するために行なわれ、オーディオ信号のL
個のサンプルが伝送のためにフレーム内に配置される、
音響心理モデルを用いてオーディオ信号のデータ伝送速
度を節約して符号化する方法は、k個のサブ変換を2N
個のサンプルについて計算し、k個のサブ変換の結果を
組合わせることによって、L個のサンプルの長さでフー
リエ変換が行なわれるという事実を含む。
もたらすことなく各チャネルにおいての重複する実行が
阻止される。従って、計算能力は略半分まで減少され
る。これは、リアルタイムにデジタル信号プロセッサを
実行させる際に特に大切である。
個のサブ変換の数が2の累乗でない場合、本発明の使用
はそのkの値に制限されない。
に、これらは位相修正係数で乗算されることが有利であ
る。
レイヤIIの音響心理モデル2についてアルゴリズム内
で行なわれ、フレームの長さLは1152個のサンプル
であることが有利な様式である。
のサンプルの長さを有するk=9個のサブ変換が計算さ
れる。
図を参照し説明する。
おいて、符号化器は標準化されていないが、マスキング
閾値の推測又は量子化のような幾つかの符号化手段は一
般的に使用されるので以下に詳細に説明しない。
1又は48kHz(又は半分のサンプリング周波数1
6、22.05又は24kHz)を有するPCMオーデ
ィオサンプルが、符号化器に供給される。入力オーディ
オストリームのフィルタされ、サブサンプルされた表現
を、サブバンドサンプルと呼ばれる形態に形成するため
にマッピングが行なわれる。各サブバンド信号は、符号
化によって引き起こされる量子化雑音がそのサブバンド
についてのマスキング曲線を超えないように量子化され
る。
は、1152個の入力PCMサンプルに対応する全体で
36個のサブバンドサンプルとなる3つのブロックにつ
いてMPEG1オーディオレイヤIIのための新しいビ
ットの割当を計算する。計算は全てのサブバンドについ
ての信号対マスキング比、つまりSMRnに基づいてお
り、各サブバンドに対して最大信号レベルと最小マスキ
ング閾値を決定することが必要となる。
発明による方法を使用することによって引き出される。
入力PCMサンプルをウィンドウ処理した後、フレーム
F1に対応するサンプルは分離され、9つのサブ変換S
T1乃至ST9に供給される。各サブ変換は2の7乗
(27=128)である128個のサンプルの長さ(9
*128=1152)を有する。部分信号の高速フーリ
エ変換の後、9つのサブ変換の結果は位相修正係数によ
って乗算され、乗算器装置M1乃至M9によって示され
る。位相が修正されたデータは加算器装置Aによって組
合されて、音響心理モデルの更なる計算のために使用さ
れる。同様の方法が、下記のフレームF2、F3等に対
応するオーディオサンプルに用いられる。
IIのオーディオ信号の符号化に有利に使用できるが、
他のどのデジタルデータの符号化にも用いることが可能
である。
(DAB)、ケーブル及び衛星ラジオ/テレビ、又はD
VD−VR等のようなデジタル記録装置のようなどの種
類の符号化器にも用いることが可能である。
9 乗算器装置 ST1、ST2、ST3、ST4、ST5、ST6、S
T7、ST8、ST9サブ変換
Claims (6)
- 【請求項1】 最小マスキング閾値を計算するためにフ
ーリエ変換が行なわれ、 伝送のためにフレーム(F1、F2、F3)内にオーデ
ィオ信号のL個のサンプルが配置される、音響心理モデ
ルを用いてオーディオ信号のビット伝送速度を節約して
符号化する方法であって、 上記フーリエ変換は、L個のサンプルの長さでは、k個
のサブ変換(ST1、…、ST9)を2N個のサンプル
について行い(k*2N=L)、k個のサブ変換の結果を
組合わせること(A)によって行なわれることを特徴と
する方法。 - 【請求項2】 上記サブ変換の個数kは2の累乗ではな
い請求項1記載の方法。 - 【請求項3】 上記k個のサブ変換の結果を組合わせる
前に、上記結果は位相修正係数(M1、…、M9)によ
って乗算される請求項1又は2のうちいずれか一項記載
の方法。 - 【請求項4】 上記フーリエ変換は、MPEG1のオー
ディオレイヤIIの上記音響心理モデル2についてアル
ゴリズム内で行なわれ、フレームの長さLが1152個
のサンプルである請求項1乃至3のうちいずれか一項記
載の方法。 - 【請求項5】 M=2N=128個のサンプルの長さを
有するk=9個のサブ変換が計算される請求項4記載の
方法。 - 【請求項6】 請求項1記載の方法を行なうための符号
化器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP99115675A EP1076297A1 (en) | 1999-08-09 | 1999-08-09 | Method for fast Fourier transformation of audio signals |
EP99115675:3 | 1999-08-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001083994A true JP2001083994A (ja) | 2001-03-30 |
Family
ID=8238750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000239442A Pending JP2001083994A (ja) | 1999-08-09 | 2000-08-08 | オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6873950B1 (ja) |
EP (1) | EP1076297A1 (ja) |
JP (1) | JP2001083994A (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06202627A (ja) * | 1993-05-28 | 1994-07-22 | Casio Comput Co Ltd | 音信号ピッチ抽出装置 |
JPH0736484A (ja) * | 1993-07-21 | 1995-02-07 | Sharp Corp | 音響信号符号化装置 |
JPH08328592A (ja) * | 1995-05-31 | 1996-12-13 | Nec Corp | 音声信号処理回路 |
JPH09244686A (ja) * | 1996-02-09 | 1997-09-19 | Canon Inc | 情報処理方法及び装置 |
JPH118559A (ja) * | 1997-01-15 | 1999-01-12 | Korea Telecommun | Mpeg−iiオーディオ符号化装置 |
JPH11203272A (ja) * | 1997-02-04 | 1999-07-30 | Oki Electric Ind Co Ltd | 高速フーリエ変換処理装置、高速フーリエ変換処理システムおよび高速フーリエ変換処理方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4604721A (en) * | 1981-10-13 | 1986-08-05 | Trw Inc. | Computer and method for high speed prime factor transform |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US5657423A (en) * | 1993-02-22 | 1997-08-12 | Texas Instruments Incorporated | Hardware filter circuit and address circuitry for MPEG encoded data |
US5294236A (en) * | 1993-03-10 | 1994-03-15 | Baird Meter Inc. | Effluent metering system |
US5451954A (en) * | 1993-08-04 | 1995-09-19 | Dolby Laboratories Licensing Corporation | Quantization noise suppression for encoder/decoder system |
US5764698A (en) * | 1993-12-30 | 1998-06-09 | International Business Machines Corporation | Method and apparatus for efficient compression of high quality digital audio |
WO1996019876A1 (en) * | 1994-12-20 | 1996-06-27 | Dolby Laboratories Licensing Corporation | Method and apparatus for applying waveform prediction to subbands of a perceptual coding system |
US5999905A (en) * | 1995-12-13 | 1999-12-07 | Sony Corporation | Apparatus and method for processing data to maintain continuity when subsequent data is added and an apparatus and method for recording said data |
US6226608B1 (en) * | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
-
1999
- 1999-08-09 EP EP99115675A patent/EP1076297A1/en not_active Withdrawn
-
2000
- 2000-07-31 US US09/629,109 patent/US6873950B1/en not_active Expired - Fee Related
- 2000-08-08 JP JP2000239442A patent/JP2001083994A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06202627A (ja) * | 1993-05-28 | 1994-07-22 | Casio Comput Co Ltd | 音信号ピッチ抽出装置 |
JPH0736484A (ja) * | 1993-07-21 | 1995-02-07 | Sharp Corp | 音響信号符号化装置 |
JPH08328592A (ja) * | 1995-05-31 | 1996-12-13 | Nec Corp | 音声信号処理回路 |
JPH09244686A (ja) * | 1996-02-09 | 1997-09-19 | Canon Inc | 情報処理方法及び装置 |
JPH118559A (ja) * | 1997-01-15 | 1999-01-12 | Korea Telecommun | Mpeg−iiオーディオ符号化装置 |
JPH11203272A (ja) * | 1997-02-04 | 1999-07-30 | Oki Electric Ind Co Ltd | 高速フーリエ変換処理装置、高速フーリエ変換処理システムおよび高速フーリエ変換処理方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1076297A1 (en) | 2001-02-14 |
US6873950B1 (en) | 2005-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7337118B2 (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
KR100608062B1 (ko) | 오디오 데이터의 고주파수 복원 방법 및 그 장치 | |
US20080140405A1 (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
JPH07210196A (ja) | ディジタル信号符号化/復号化装置及び方法 | |
TW200406096A (en) | Improved low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding | |
JP2009515212A (ja) | オーディオ圧縮 | |
US20070078646A1 (en) | Method and apparatus to encode/decode audio signal | |
JP2005534947A (ja) | 心理音響ベースで圧縮する際に形成されるノイズの許容可能な歪みに基づくスケールファクタのフィードフォワード予測 | |
EP1259956B1 (en) | Method of and apparatus for converting an audio signal between data compression formats | |
EP1708173B1 (en) | Method and apparatus for coding audio signal | |
KR100378796B1 (ko) | 디지탈 오디오 부호화기 및 복호화 방법 | |
TWI390502B (zh) | 編碼信號之處理方法 | |
JP2001083994A (ja) | オーディオ信号のビット伝送速度を節約して符号化する方法及び符号化器 | |
RU2409874C9 (ru) | Сжатие звуковых сигналов | |
EP1076295A1 (en) | Method and encoder for bit-rate saving encoding of audio signals | |
Cavagnolo et al. | Introduction to Digital Audio Compression | |
JPH05114863A (ja) | 高能率符号化装置及び復号化装置 | |
IL165648A (en) | An audio coding system that uses decoded signal properties to coordinate synthesized spectral components | |
JPH08330973A (ja) | 信号符号化装置及び信号復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100615 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100910 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100915 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110301 |