JPH0851366A - 適応的符号化システム - Google Patents
適応的符号化システムInfo
- Publication number
- JPH0851366A JPH0851366A JP7023465A JP2346595A JPH0851366A JP H0851366 A JPH0851366 A JP H0851366A JP 7023465 A JP7023465 A JP 7023465A JP 2346595 A JP2346595 A JP 2346595A JP H0851366 A JPH0851366 A JP H0851366A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- bit
- bit allocation
- frame group
- entropy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 title claims description 9
- 230000005236 sound signal Effects 0.000 claims abstract description 47
- 230000001149 cognitive effect Effects 0.000 claims description 54
- 238000001914 filtration Methods 0.000 claims description 11
- 101100533725 Mus musculus Smr3a gene Proteins 0.000 abstract description 9
- 101100149716 Rattus norvegicus Vcsa1 gene Proteins 0.000 abstract description 9
- 101150037481 SMR1 gene Proteins 0.000 abstract description 9
- 101100286750 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ILV2 gene Proteins 0.000 abstract description 9
- 101100028962 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PDR1 gene Proteins 0.000 abstract description 7
- 101150096622 Smr2 gene Proteins 0.000 abstract description 7
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000013139 quantization Methods 0.000 abstract description 5
- 108091006146 Channels Proteins 0.000 description 43
- 238000000034 method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 101100450694 Arabidopsis thaliana HFR1 gene Proteins 0.000 description 4
- 101100053789 Homo sapiens ZBTB7A gene Proteins 0.000 description 4
- 101100434608 Rattus norvegicus Akirin2 gene Proteins 0.000 description 4
- 102100023264 Zinc finger and BTB domain-containing protein 7A Human genes 0.000 description 4
- 241000607479 Yersinia pestis Species 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 101100342759 Arabidopsis thaliana LCMT1 gene Proteins 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】
【目的】 入力ディジタルオーディオ信号を認知エン
トロピーに基づき適応的に符号化する適応的符号化シス
テムを提供すること。 【構成】 複数のチャンネルから入力されるディジタ
ルオーディオ信号をサブバンド単位で受信する複数のサ
ブバンドフィルタと、各サブバンドに対するSMR、音
圧レベル、マスクしきい値を測定する第1認知パラメー
タ測定器と、測定されたそれらの値に基づき、認知エン
トロピー、平均値、及び標準偏差を測定する第2認知パ
ラメータ測定器と、測定されたSMR、認知エントロピ
ー、平均値、標準偏差に基づきフレーム及びサブバンド
のビット割当情報を発生するビット割当ユニットと、ビ
ット割当情報に応じて、フィルタリングされたサブバン
ドオーディオ信号を量子化する量子化器と、ビット割当
情報と共に量子化されたディジタルオーディオ信号をフ
ォーマットするフォーマッティング回路とを含む。
トロピーに基づき適応的に符号化する適応的符号化シス
テムを提供すること。 【構成】 複数のチャンネルから入力されるディジタ
ルオーディオ信号をサブバンド単位で受信する複数のサ
ブバンドフィルタと、各サブバンドに対するSMR、音
圧レベル、マスクしきい値を測定する第1認知パラメー
タ測定器と、測定されたそれらの値に基づき、認知エン
トロピー、平均値、及び標準偏差を測定する第2認知パ
ラメータ測定器と、測定されたSMR、認知エントロピ
ー、平均値、標準偏差に基づきフレーム及びサブバンド
のビット割当情報を発生するビット割当ユニットと、ビ
ット割当情報に応じて、フィルタリングされたサブバン
ドオーディオ信号を量子化する量子化器と、ビット割当
情報と共に量子化されたディジタルオーディオ信号をフ
ォーマットするフォーマッティング回路とを含む。
Description
【0001】
【産業上の利用分野】本発明は、ディジタルオーディオ
符号化システムに関する。特に、複数のチャンネルから
入力される入力ディジタルオーディオ信号を、人間の聴
覚特性に相応する各入力ディジタルオーディオ信号に対
する認知エントロピー(perceptual entropy)に基づいて
適応的に符号化する改良された符号化システムに関す
る。
符号化システムに関する。特に、複数のチャンネルから
入力される入力ディジタルオーディオ信号を、人間の聴
覚特性に相応する各入力ディジタルオーディオ信号に対
する認知エントロピー(perceptual entropy)に基づいて
適応的に符号化する改良された符号化システムに関す
る。
【0002】
【従来の技術】ディジタル化されたオーディオ信号を伝
送することによって、コンパクトディスク(CD)及び/ま
たはディジタルオーディオテープ(DAT)に相応する高音
質のオーディオ信号の伝送が可能である。オーディオ信
号をディジタル信号で表すときは、特に高精細度テレビ
(HDTV)の場合、大量のデータを伝送する必要がある。し
かし、オーディオ信号に割り当てられた周波数帯域は限
定されているため、例えば、48KHzでサンプリング
された16ビットパルス符号変調(PCM)オーディオ信
号、即ち、768Kbpsといった大量のデータを限定
されたオーディオ帯域(約128KHz)で伝送するた
めには、データの圧縮が必要である。
送することによって、コンパクトディスク(CD)及び/ま
たはディジタルオーディオテープ(DAT)に相応する高音
質のオーディオ信号の伝送が可能である。オーディオ信
号をディジタル信号で表すときは、特に高精細度テレビ
(HDTV)の場合、大量のデータを伝送する必要がある。し
かし、オーディオ信号に割り当てられた周波数帯域は限
定されているため、例えば、48KHzでサンプリング
された16ビットパルス符号変調(PCM)オーディオ信
号、即ち、768Kbpsといった大量のデータを限定
されたオーディオ帯域(約128KHz)で伝送するた
めには、データの圧縮が必要である。
【0003】様々なオーディオ信号圧縮装置または技法
の中で、HDTVのため、心理音響アルゴリズム(Psyc
hoacoustic algorithm)を用いた、いわゆるMPEG(M
oving Pictures Expert Group)オーディオアルゴリズム
が提案されてきた。
の中で、HDTVのため、心理音響アルゴリズム(Psyc
hoacoustic algorithm)を用いた、いわゆるMPEG(M
oving Pictures Expert Group)オーディオアルゴリズム
が提案されてきた。
【0004】このMPEGオーディオアルゴリズムは、
主に、サブバンドフィルタリング、心理音響モデリング
(psychoacoustic modeling)、量子化及び符号化、及び
フレームフォーマッティングの4つの要素からなる。サ
ブバンドフィルタリングは、入力PCMオーディオ信号
を時間領域から周波数領域へ写像するプロセスである。
B個(例えば、32個)のサブバンドを有するフィルタ
バンク(Filterbank)を用いてもよい。各サブバンドで
は12または36サンプルがグループ化されて処理さ
れ、B個のサブバンドのグループ化されたサンプル、即
ち、B×12個またはB×36個のサンプルによって1
フレームが構成される。このフレームがオーディオ信号
の符号化、伝送、及び復号の処理単位となる。心理音響
モデリングは、各サブバンドまたはサブバンドのグルー
プに対して、例えば信号対マスク比(Signal-to-Mask Ra
tio;SMR)のようなデータのセットを生成し、量子化及び
符号化を制御する。次に、サブバンドのサンプルを量子
化する過程で、SMRを参照して、使用可能な(availab
le)ビットがフレームの各サブバンドに適応的に割り当
られる。フレームフォーマットはフレームデータを他の
必要な付加情報と共に、伝送に適した形にフォーマット
する。
主に、サブバンドフィルタリング、心理音響モデリング
(psychoacoustic modeling)、量子化及び符号化、及び
フレームフォーマッティングの4つの要素からなる。サ
ブバンドフィルタリングは、入力PCMオーディオ信号
を時間領域から周波数領域へ写像するプロセスである。
B個(例えば、32個)のサブバンドを有するフィルタ
バンク(Filterbank)を用いてもよい。各サブバンドで
は12または36サンプルがグループ化されて処理さ
れ、B個のサブバンドのグループ化されたサンプル、即
ち、B×12個またはB×36個のサンプルによって1
フレームが構成される。このフレームがオーディオ信号
の符号化、伝送、及び復号の処理単位となる。心理音響
モデリングは、各サブバンドまたはサブバンドのグルー
プに対して、例えば信号対マスク比(Signal-to-Mask Ra
tio;SMR)のようなデータのセットを生成し、量子化及び
符号化を制御する。次に、サブバンドのサンプルを量子
化する過程で、SMRを参照して、使用可能な(availab
le)ビットがフレームの各サブバンドに適応的に割り当
られる。フレームフォーマットはフレームデータを他の
必要な付加情報と共に、伝送に適した形にフォーマット
する。
【0005】しかし、上述のMPEGオーディオ技法で
は、各フレームに割り当てられるビット数が固定である
ため、入力ディジタルオーディオ信号の平均値、標準偏
差、及び認知エントロピーといった、フレームによって
異なる統計的特性を反映することができない。
は、各フレームに割り当てられるビット数が固定である
ため、入力ディジタルオーディオ信号の平均値、標準偏
差、及び認知エントロピーといった、フレームによって
異なる統計的特性を反映することができない。
【0006】さらに、異なる認知エントロピーを有する
入力ディジタルオーディオ信号がこのような従来技術を
用いた通常の装置に加えられると、入力ディジタルオー
ディオ信号は認知エントロピーと全く関係なく符号化さ
れるため、結果として人による認識がされにくくなる。
入力ディジタルオーディオ信号がこのような従来技術を
用いた通常の装置に加えられると、入力ディジタルオー
ディオ信号は認知エントロピーと全く関係なく符号化さ
れるため、結果として人による認識がされにくくなる。
【0007】
【発明が解決しようとする課題】従って、本発明の主な
目的は、複数のチャンネルから入力される入力ディジタ
ルオーディオ信号を、各入力ディジタルオーディオ信号
に対する認知エントロピーに基づいて適応的に符号化す
ることによって符号化効率と音質とを向上させる新しい
システムを提供することである。
目的は、複数のチャンネルから入力される入力ディジタ
ルオーディオ信号を、各入力ディジタルオーディオ信号
に対する認知エントロピーに基づいて適応的に符号化す
ることによって符号化効率と音質とを向上させる新しい
システムを提供することである。
【0008】
【課題を達成するための手段】上記目的を達成するため
に、本発明によれば、N個(Nは正の整数)のチャンネ
ルから入力される入力ディジタルオーディオ信号を適応
的に符号化するシステムであって、前記入力ディジタル
オーディオ信号の各々が複数のフレームを含み、該フレ
ームの各々が複数のサブバンドを含んでおり、前記入力
ディジタルオーディオ信号を各サブバンド単位で受信し
フィルタリングする、並列に配置されたN個のサブバン
ドフィルタリング手段と、前記入力ディジタルオーディ
オ信号に含まれる各サブバンドに対して信号対マスク
比、音圧レベル、及びマスクしきい値を算定する第1算
定手段と、前記算定された信号対マスク比、音圧レベ
ル、及びマスクしきい値に基づいて、前記入力ディジタ
ルオーディオ信号のそれぞれに含まれるフレームの各々
に対して認知エントロピーを算定し、総数N個の前記チ
ャンネルに対しN×M個(Mは正の整数)の現フレーム
及び前フレームを含むフレームグループに対して、平均
値及び標準偏差を算定する第2算定手段と、前記算定さ
れた信号対マスク比、認知エントロピー、平均値及び標
準偏差に基づいて、前記フレームグループの各サブバン
ドに対して適応的にビットを決定し、前記サブバンドの
各々に対して決定されたビットに対応するビット割当情
報を発生するビット割当手段と、前記フレームグループ
の各サブバンドに対して発生される対応するビット割当
情報に応じて、前記N個のチャンネルに対してフィルタ
リングされたサブバンドオーディオ信号を量子化する並
列に配置されたN個の量子化手段と、前記ビット割当情
報と共に、前記量子化されたディジタルオーディオ信号
をフォーマットする手段とを含むことを特徴とする適応
的符号化システムが提供される。
に、本発明によれば、N個(Nは正の整数)のチャンネ
ルから入力される入力ディジタルオーディオ信号を適応
的に符号化するシステムであって、前記入力ディジタル
オーディオ信号の各々が複数のフレームを含み、該フレ
ームの各々が複数のサブバンドを含んでおり、前記入力
ディジタルオーディオ信号を各サブバンド単位で受信し
フィルタリングする、並列に配置されたN個のサブバン
ドフィルタリング手段と、前記入力ディジタルオーディ
オ信号に含まれる各サブバンドに対して信号対マスク
比、音圧レベル、及びマスクしきい値を算定する第1算
定手段と、前記算定された信号対マスク比、音圧レベ
ル、及びマスクしきい値に基づいて、前記入力ディジタ
ルオーディオ信号のそれぞれに含まれるフレームの各々
に対して認知エントロピーを算定し、総数N個の前記チ
ャンネルに対しN×M個(Mは正の整数)の現フレーム
及び前フレームを含むフレームグループに対して、平均
値及び標準偏差を算定する第2算定手段と、前記算定さ
れた信号対マスク比、認知エントロピー、平均値及び標
準偏差に基づいて、前記フレームグループの各サブバン
ドに対して適応的にビットを決定し、前記サブバンドの
各々に対して決定されたビットに対応するビット割当情
報を発生するビット割当手段と、前記フレームグループ
の各サブバンドに対して発生される対応するビット割当
情報に応じて、前記N個のチャンネルに対してフィルタ
リングされたサブバンドオーディオ信号を量子化する並
列に配置されたN個の量子化手段と、前記ビット割当情
報と共に、前記量子化されたディジタルオーディオ信号
をフォーマットする手段とを含むことを特徴とする適応
的符号化システムが提供される。
【0009】
【実施例】以下、本発明の適応的符号化システムについ
て、図面を参照しながら詳しく説明する。
て、図面を参照しながら詳しく説明する。
【0010】図1に、本発明による適応的符号化システ
ム100を概略的に示したブロック図を示す。
ム100を概略的に示したブロック図を示す。
【0011】適応的符号化システム100はサブバンド
フィルタリングデバイス10、第1及び第2認知パラメ
ータ算定器20,30、第1及び第2ビット割当ユニッ
ト40、50、量子化デバイス60及びフォーマッティ
ング回路70とを含む。
フィルタリングデバイス10、第1及び第2認知パラメ
ータ算定器20,30、第1及び第2ビット割当ユニッ
ト40、50、量子化デバイス60及びフォーマッティ
ング回路70とを含む。
【0012】符号化システム100に於いて、N個のチ
ャネル(この例では、2個、即ち、第1(またはL)チ
ャネル、及び第2(またはR)チャネル)を通して受容
されたi番目のフレーム(すなわち現フレーム)の入力
ディジタルオーディオ信号X1(m,i)及びX2
(s,i)は、前記第1認知パラメータ算定器20及び
前記サブバンドフィルタリングデバイス10に入力され
る。ここで、各入力ディジタルオーディオ信号は、それ
ぞれM個(即ち、m=0,1,...,M−1)及びS
個(即ち、s=0,1,...,S−1)のサンプルを
含む。M及びSは正の整数である。本明細書で使われて
いる“フレーム”は、ある決まった数のオーディオサン
プルに対応するディジタルオーディオ信号の一部を意味
すると共に、ディジタルオーディオ信号の符号化及び復
号に於ける処理単位でもある。
ャネル(この例では、2個、即ち、第1(またはL)チ
ャネル、及び第2(またはR)チャネル)を通して受容
されたi番目のフレーム(すなわち現フレーム)の入力
ディジタルオーディオ信号X1(m,i)及びX2
(s,i)は、前記第1認知パラメータ算定器20及び
前記サブバンドフィルタリングデバイス10に入力され
る。ここで、各入力ディジタルオーディオ信号は、それ
ぞれM個(即ち、m=0,1,...,M−1)及びS
個(即ち、s=0,1,...,S−1)のサンプルを
含む。M及びSは正の整数である。本明細書で使われて
いる“フレーム”は、ある決まった数のオーディオサン
プルに対応するディジタルオーディオ信号の一部を意味
すると共に、ディジタルオーディオ信号の符号化及び復
号に於ける処理単位でもある。
【0013】図示されているように、サブバンドフィル
タリングデバイス10は、複数の現フレームの入力ディ
ジタルオーディオ信号を同時に受信するため、例えば2
つのサブバンドフィルタ11及び12のような並列に結
合された複数のサブバンドフィルタを含み、本技術分野
では公知のサブバンドフィルタリング技法、例えば、IS
O IEC JTCI/SC2/WG 11、“Part3,Audio Proposal”、CD
-11172-3(1991年)に記述された、いわゆるMPEGオ
ーディオアルゴリズムに開示された方法を用いることに
よって、第1チャンネル及び第2チャンネルから入力さ
れる入力ディジタルオーディオ信号のフィルタリングを
する。即ち、各々のサブバンドフィルタ11及び12
は、サンプリング周波数fsの入力ディジタルオーディ
オ信号をサンプリング周波数fs/BのB個(例えば、
32個)の同一の大きさのサブバンドに分ける働きを
し、その分けられたサブバンドオーディオサンプルを量
子化デバイス60へと出力する。
タリングデバイス10は、複数の現フレームの入力ディ
ジタルオーディオ信号を同時に受信するため、例えば2
つのサブバンドフィルタ11及び12のような並列に結
合された複数のサブバンドフィルタを含み、本技術分野
では公知のサブバンドフィルタリング技法、例えば、IS
O IEC JTCI/SC2/WG 11、“Part3,Audio Proposal”、CD
-11172-3(1991年)に記述された、いわゆるMPEGオ
ーディオアルゴリズムに開示された方法を用いることに
よって、第1チャンネル及び第2チャンネルから入力さ
れる入力ディジタルオーディオ信号のフィルタリングを
する。即ち、各々のサブバンドフィルタ11及び12
は、サンプリング周波数fsの入力ディジタルオーディ
オ信号をサンプリング周波数fs/BのB個(例えば、
32個)の同一の大きさのサブバンドに分ける働きを
し、その分けられたサブバンドオーディオサンプルを量
子化デバイス60へと出力する。
【0014】一方、第1認知パラメータ算定器20は、
第1及び第2チャンネルから現フレームの入力ディジタ
ルオーディオ信号を受信し、現フレームの各サブバンド
に対する信号対マスク比(SMR)データSMR1、S
MR2と、音圧レベルP1、P2と、マスクしきい値M
1、M2とを算定する。これらは、例えば前記MPEG
オーディオアルゴリズムで論議されている心理音響モデ
ルを用いて行われる。第1チャンネルから入力される各
サブバンドのSMR1データは、次の(式1)のように
表される。
第1及び第2チャンネルから現フレームの入力ディジタ
ルオーディオ信号を受信し、現フレームの各サブバンド
に対する信号対マスク比(SMR)データSMR1、S
MR2と、音圧レベルP1、P2と、マスクしきい値M
1、M2とを算定する。これらは、例えば前記MPEG
オーディオアルゴリズムで論議されている心理音響モデ
ルを用いて行われる。第1チャンネルから入力される各
サブバンドのSMR1データは、次の(式1)のように
表される。
【0015】 SMR1(r)=P1(r)−M1(r) dB (式1)
【0016】ここで、
【0017】r:サブバンドインデックス(r=0,
1,...,B−1)、
1,...,B−1)、
【0018】B:1フレームのサブバンド数、
【0019】SMR1(r):第1チャンネルのr番目
のサブバンドに於ける信号対マスク比、
のサブバンドに於ける信号対マスク比、
【0020】P1(r):高速フーリエ変換(FFT)
法から算定されたr番目のサブバンドに於ける音圧レベ
ル、
法から算定されたr番目のサブバンドに於ける音圧レベ
ル、
【0021】M1(r):r番目のサブバンドに於ける
マスクしきい値である。また、SMR1(r)、P1
(r)及びM1(r)の単位は全てデシベル(dB)で
ある。
マスクしきい値である。また、SMR1(r)、P1
(r)及びM1(r)の単位は全てデシベル(dB)で
ある。
【0022】同様に、第2チャンネルから入力される各
サブバンドのSMR2データは、次の(式2)から得ら
れる。
サブバンドのSMR2データは、次の(式2)から得ら
れる。
【0023】 SMR2(r)=P2(r)−M2(r) dB (式2)
【0024】ここで、rは(式1)で定義したのと同じ
意味である。
意味である。
【0025】マスクしきい値は可聴限界を表すものであ
って、固有の可聴限界または音のしきい値と、オーディ
オ信号の他の音調及び非音調成分の存在によって生じる
増分との和である。次に、第1認知パラメータ算定器2
0で算定された第1及び第2チャンネルの信号対マスク
比SMR1(r)、SMR2(r)は第2ビット割当ユ
ニット50へ入力されると共に、第1及び第2チャンネ
ルの音圧レベルP1(r)、P2(r)及びマスクしき
い値M1(r)、M2(r)は第2認知パラメータ算定
器30へ入力される。
って、固有の可聴限界または音のしきい値と、オーディ
オ信号の他の音調及び非音調成分の存在によって生じる
増分との和である。次に、第1認知パラメータ算定器2
0で算定された第1及び第2チャンネルの信号対マスク
比SMR1(r)、SMR2(r)は第2ビット割当ユ
ニット50へ入力されると共に、第1及び第2チャンネ
ルの音圧レベルP1(r)、P2(r)及びマスクしき
い値M1(r)、M2(r)は第2認知パラメータ算定
器30へ入力される。
【0026】第2認知パラメータ算定器30は、第1認
知パラメータ算定器20から入力される音圧レベルP1
(r)、P2(r)とマスクしきい値M1(r),M2
(r)に基づいて、第1及び第2チャンネルのi番目の
フレーム(または、現フレーム)に対する認知エントロ
ピーPE1(i)、PE2(i)を算定する。また算定
された認知エントロピーに基づき、第1及び第2チャン
ネルの現フレーム及び前フレームを含むフレームグルー
プの統計的特性を表す平均値PEm及び標準偏差PEst
dを計算する。第2認知パラメータ算定器30は、後で
図2を参照しながら詳細に説明する。
知パラメータ算定器20から入力される音圧レベルP1
(r)、P2(r)とマスクしきい値M1(r),M2
(r)に基づいて、第1及び第2チャンネルのi番目の
フレーム(または、現フレーム)に対する認知エントロ
ピーPE1(i)、PE2(i)を算定する。また算定
された認知エントロピーに基づき、第1及び第2チャン
ネルの現フレーム及び前フレームを含むフレームグルー
プの統計的特性を表す平均値PEm及び標準偏差PEst
dを計算する。第2認知パラメータ算定器30は、後で
図2を参照しながら詳細に説明する。
【0027】フレームグループに含まれるp番目のフレ
ームの認知エントロピーPE(p)、平均値PEm、及
び標準偏差PEstdは、第2認知パラメータ算定器30
で算定され、第1ビット割当ユニット40へ入力され
る。この第1ビット割当ユニット40は、第2認知パラ
メータ算定器30から入力される認知エントロピー、平
均値、及び標準偏差に基づいて、フレームグループに含
まれる各フレームに対してビットを決定する働きをし、
さらに、第2ビット割当ユニット50及びフォーマッテ
ィング回路70に向けて、第1及び第2チャンネルの各
フレームに対して決定されたビットに対応するビット割
当情報FBI1、FBI2を出力する。第1ビット割当
ユニット40の詳細な説明は、後に図3を参照して詳細
に説明する。
ームの認知エントロピーPE(p)、平均値PEm、及
び標準偏差PEstdは、第2認知パラメータ算定器30
で算定され、第1ビット割当ユニット40へ入力され
る。この第1ビット割当ユニット40は、第2認知パラ
メータ算定器30から入力される認知エントロピー、平
均値、及び標準偏差に基づいて、フレームグループに含
まれる各フレームに対してビットを決定する働きをし、
さらに、第2ビット割当ユニット50及びフォーマッテ
ィング回路70に向けて、第1及び第2チャンネルの各
フレームに対して決定されたビットに対応するビット割
当情報FBI1、FBI2を出力する。第1ビット割当
ユニット40の詳細な説明は、後に図3を参照して詳細
に説明する。
【0028】図2を見ると、図1に示された第2認知パ
ラメータ算定器30の詳細ブロック図が示されている。
この第2認知パラメータ算定器30は認知エントロピー
計算器32と、平均値及び標準偏差計算器34とを含
む。認知エントロピー計算器32は、図1に示された第
1認知パラメータ算定器20から出力された第1及び第
2チャンネルの音圧レベルP1(r)、P2(r)及び
マスクしきい値M1(r)、M2(r)を受信して、第
1及び第2チャンネルのi番目のフレームに対する認知
エントロピーPE1(i)、PE2(i)を計算する。
第1チャンネルのi番目のフレームに対する認知エント
ロピーPE1(i)は、本分野では知られているよう
に、(式3)のように表される。
ラメータ算定器30の詳細ブロック図が示されている。
この第2認知パラメータ算定器30は認知エントロピー
計算器32と、平均値及び標準偏差計算器34とを含
む。認知エントロピー計算器32は、図1に示された第
1認知パラメータ算定器20から出力された第1及び第
2チャンネルの音圧レベルP1(r)、P2(r)及び
マスクしきい値M1(r)、M2(r)を受信して、第
1及び第2チャンネルのi番目のフレームに対する認知
エントロピーPE1(i)、PE2(i)を計算する。
第1チャンネルのi番目のフレームに対する認知エント
ロピーPE1(i)は、本分野では知られているよう
に、(式3)のように表される。
【0029】
【数1】
【0030】ここで、r、i、及びBは上記にて定義し
たのと同じ意味である。
たのと同じ意味である。
【0031】同様に、第2チャンネルのi番目のフレー
ムに対する認知エントロピーPE2(i)は、本分野で
は知られているように、(式4)のように表される。
ムに対する認知エントロピーPE2(i)は、本分野で
は知られているように、(式4)のように表される。
【0032】
【数2】
【0033】ここで、r、i、及びBは上記にて定義し
たのと同じ意味である。
たのと同じ意味である。
【0034】上記(式3)及び(式4)は、いわゆるひ
ずみ率理論(Rate Distortion Theory)を適用すること
によって得られ、人間の聴覚特性に基づいた認知エント
ロピーに一致する。しかる後、認知エントロピー計算器
32で計算された、第1及び第2チャンネルのi番目の
フレームに対する認知エントロピーは、平均値及び標準
偏差計算器34へ送られる。
ずみ率理論(Rate Distortion Theory)を適用すること
によって得られ、人間の聴覚特性に基づいた認知エント
ロピーに一致する。しかる後、認知エントロピー計算器
32で計算された、第1及び第2チャンネルのi番目の
フレームに対する認知エントロピーは、平均値及び標準
偏差計算器34へ送られる。
【0035】平均値及び標準偏差計算器34は、認知エ
ントロピー計算器32から入力されたQ個(この例で
は、4個)の第1及び第2チャンネルの現フレーム及び
前フレームに対して算定された認知エントロピー(即
ち、PE1(i−1)、PE1(i)及び、PE2(i
−1)及びPE2(i))をグループ化し、第1ビット
割当ユニット40の処理によって、グループ化されたフ
レームの間でビットが適応的に割り当てられるようにし
ている。第1ビット割当ユニット40については、後に
図3を参照して詳細に説明する。また、平均値及び標準
偏差計算機34は、フレームグループの全認知エントロ
ピーを用いて、それらの統計的特性を表す平均値及び標
準偏差を計算する。フレームグループの全認知エントロ
ピーに対する平均値PEmは、本分野では知られている
ように、(式5)のように表される。
ントロピー計算器32から入力されたQ個(この例で
は、4個)の第1及び第2チャンネルの現フレーム及び
前フレームに対して算定された認知エントロピー(即
ち、PE1(i−1)、PE1(i)及び、PE2(i
−1)及びPE2(i))をグループ化し、第1ビット
割当ユニット40の処理によって、グループ化されたフ
レームの間でビットが適応的に割り当てられるようにし
ている。第1ビット割当ユニット40については、後に
図3を参照して詳細に説明する。また、平均値及び標準
偏差計算機34は、フレームグループの全認知エントロ
ピーを用いて、それらの統計的特性を表す平均値及び標
準偏差を計算する。フレームグループの全認知エントロ
ピーに対する平均値PEmは、本分野では知られている
ように、(式5)のように表される。
【0036】
【数3】
【0037】ここで、
【0038】p:フレームグループで用いられるフレー
ムインデックス(p=0,1,...,Q−1)、
ムインデックス(p=0,1,...,Q−1)、
【0039】Q:フレームグループの全フレーム数、
【0040】PE(p):フレームグループに於けるp
番目のフレームの認知エントロピーである。従って、フ
レームグループの全認知エントロピーに対する標準偏差
PEstdは、本分野では知られているように、(式6)
のように得られる。
番目のフレームの認知エントロピーである。従って、フ
レームグループの全認知エントロピーに対する標準偏差
PEstdは、本分野では知られているように、(式6)
のように得られる。
【0041】
【数4】
【0042】ここで、p及びQは上記で定義したのと同
じ意味である。
じ意味である。
【0043】平均値及び標準偏差計算器34に於いてグ
ループ化され計算された平均値PEm、標準偏差PEst
d、及びp番目のフレームの認知エントロピーPE
(p)は、しかる後、図1に示されている第1ビット割
当ユニット40へ入力される。
ループ化され計算された平均値PEm、標準偏差PEst
d、及びp番目のフレームの認知エントロピーPE
(p)は、しかる後、図1に示されている第1ビット割
当ユニット40へ入力される。
【0044】図3を参照すると、図1に示されている第
1ビット割当ユニット40の詳細なブロック図が示され
ている。この第1ビット割当ユニット40は、決定レベ
ル算定器(dicision level estimator)42とビット割当
デバイス44とを含む。この決定レベル算定器42は、
図2に示されている平均値及び標準偏差計算器34から
入力される平均値及び標準偏差に基づいて、ビット割当
デバイス44がフレームグループの各フレームに対して
ビットを適応的に割り当てるのに、最も適したフレーム
グループの決定レベルを算定する。本発明の好適実施例
によると、このフレームグループのj番目の決定レベル
D(j)は(式7)のように得られる。
1ビット割当ユニット40の詳細なブロック図が示され
ている。この第1ビット割当ユニット40は、決定レベ
ル算定器(dicision level estimator)42とビット割当
デバイス44とを含む。この決定レベル算定器42は、
図2に示されている平均値及び標準偏差計算器34から
入力される平均値及び標準偏差に基づいて、ビット割当
デバイス44がフレームグループの各フレームに対して
ビットを適応的に割り当てるのに、最も適したフレーム
グループの決定レベルを算定する。本発明の好適実施例
によると、このフレームグループのj番目の決定レベル
D(j)は(式7)のように得られる。
【0045】 D(j)=PEm+j・PEstd ・W 式(7)
【0046】ここで、
【0047】j:決定レベルインデックス(j=−q〜
q)、
q)、
【0048】q:正の整数、
【0049】W:フレームグループに於ける重みファク
タである。
タである。
【0050】上記(式7)からわかるように、p番目の
フレームのj番目の決定レベルD(j)と(j−1)番
目の決定レベルD(j−1)との間のレベル間隔は、平
均値及び標準偏差計算器34から入力される標準偏差P
Estdと、フレームグループの重みファクタWの両方に
依存するが、決定レベルの全数(即ち、2q+1)は予
め定められている。決定レベル算定器42で用いられた
フレームグループの重みファクタWは、フレームグルー
プの決定レベルが最適になり実際の人間の聴覚特性によ
く合うように、平均値及び標準偏差計算器34から入力
される平均値PEm及び標準偏差PEstdを用いて決定
されることが好ましい。本発明によると、フレームグル
ープの重みファクタWは、表1に示されているように、
フレームグループの統計的特性を表す平均値PEm及び
標準偏差PEstdの両方に基づいて得ることができる。
フレームのj番目の決定レベルD(j)と(j−1)番
目の決定レベルD(j−1)との間のレベル間隔は、平
均値及び標準偏差計算器34から入力される標準偏差P
Estdと、フレームグループの重みファクタWの両方に
依存するが、決定レベルの全数(即ち、2q+1)は予
め定められている。決定レベル算定器42で用いられた
フレームグループの重みファクタWは、フレームグルー
プの決定レベルが最適になり実際の人間の聴覚特性によ
く合うように、平均値及び標準偏差計算器34から入力
される平均値PEm及び標準偏差PEstdを用いて決定
されることが好ましい。本発明によると、フレームグル
ープの重みファクタWは、表1に示されているように、
フレームグループの統計的特性を表す平均値PEm及び
標準偏差PEstdの両方に基づいて得ることができる。
【0051】
【表1】
【0052】上記の表1から分かるように、PEstdが
予め定められた第1しきい値(例えば、0.0125)
より小さく、PEmが予め定められた第2しきい値(例
えば、0.15)より小さい場合、重みファクタWは0
となり、そうでない場合は、上記の表1を参照して、表
中の重みファクタの内のいずれか一つが選択される。即
ち、このPEstdが相対的に小さくて、PEmが相対的
に大きければ、より大きい値の重みファクタが選択さ
れ、PEstdが相対的に大きくて、PEmがより小さけ
れば、より小さい値が選択される。
予め定められた第1しきい値(例えば、0.0125)
より小さく、PEmが予め定められた第2しきい値(例
えば、0.15)より小さい場合、重みファクタWは0
となり、そうでない場合は、上記の表1を参照して、表
中の重みファクタの内のいずれか一つが選択される。即
ち、このPEstdが相対的に小さくて、PEmが相対的
に大きければ、より大きい値の重みファクタが選択さ
れ、PEstdが相対的に大きくて、PEmがより小さけ
れば、より小さい値が選択される。
【0053】ここで、決定レベルの数、平均値及び標準
偏差のしきい値、及び重みファクタは、要求されている
符号化システムの符号化効率と音質とに基づいて決定さ
れることが好ましいということが理解されるだろう。
偏差のしきい値、及び重みファクタは、要求されている
符号化システムの符号化効率と音質とに基づいて決定さ
れることが好ましいということが理解されるだろう。
【0054】その次に、決定レベル算定器42で算定さ
れた決定レベルD(j)、あらかじめ決定された決定レ
ベルの全数(即ち、2q+1)、及び図2に示された平
均値及び標準偏差計算器34から入力された認知エント
ロピーPE(p)はビット割当デバイス44へ同時に入
力される。
れた決定レベルD(j)、あらかじめ決定された決定レ
ベルの全数(即ち、2q+1)、及び図2に示された平
均値及び標準偏差計算器34から入力された認知エント
ロピーPE(p)はビット割当デバイス44へ同時に入
力される。
【0055】このビット割当デバイス44は、フレーム
グループの各フレームに対するビットを、決定レベル算
定器42から入力される決定レベル及び決定レベルの全
数と、図2に示された平均値及び標準偏差計算器34か
ら入力されるp番目のフレームの認知エントロピーとに
基づいて決定する。その後、フレームグループの第1及
び第2チャンネルの各フレームに対して決定されたビッ
トに対応するビット割当情報FBI1、FBI2を図1
の第2ビット割当ユニット50及びフォーマッティング
回路70へ出力する。本発明の好適実施例に於いて、フ
レームグループに於けるp番目のフレームに対するビッ
ト割当情報FB(p)は、(式8)のように決定され
る。
グループの各フレームに対するビットを、決定レベル算
定器42から入力される決定レベル及び決定レベルの全
数と、図2に示された平均値及び標準偏差計算器34か
ら入力されるp番目のフレームの認知エントロピーとに
基づいて決定する。その後、フレームグループの第1及
び第2チャンネルの各フレームに対して決定されたビッ
トに対応するビット割当情報FBI1、FBI2を図1
の第2ビット割当ユニット50及びフォーマッティング
回路70へ出力する。本発明の好適実施例に於いて、フ
レームグループに於けるp番目のフレームに対するビッ
ト割当情報FB(p)は、(式8)のように決定され
る。
【0056】 FB(p)=FBm+BV/(2q+1)・I (式8)
【0057】ここで、pは上記で定義したのと同じ意味
である。また、
である。また、
【0058】FBm:フレームの平均ビット(mean bit
s)(例えば、1チャンネル当たり128Kbpsの伝送
速度で、サンプリング周波数が48KHzの16ビットP
CMオーディオ信号の場合、1フレーム当たり3072
ビット)、
s)(例えば、1チャンネル当たり128Kbpsの伝送
速度で、サンプリング周波数が48KHzの16ビットP
CMオーディオ信号の場合、1フレーム当たり3072
ビット)、
【0059】BV:予め定められたビット分散値(bit v
ariation value)、
ariation value)、
【0060】2q+1:予め定められた決定レベルの全
数、
数、
【0061】I:p番目のフレームに於けるレベルイン
デックス(level index)である。
デックス(level index)である。
【0062】上記(式8)から分かるように、p番目の
フレームに対するビット割当情報FB(p)は、平均ビ
ットFBmと(式8)の第2項で計算される可変ビット
数とを加算することによって決定される。予め定められ
たビット分散値BVは、上記(式8)で定義されるよう
に、1フレームの平均ビットと同一の値として決定して
もよい。また、フレームグループのp番目のフレームに
対するレベルインデックスIは、決定レベル算定器42
から入力される決定レベルD(j)と図2に示されてい
る平均値及び標準偏差計算器34から入力される認知エ
ントロピーPE(p)とに基づいて得られる。本発明の
好適実施例に於いて、フレームグループのp番目のフレ
ームに対するレベルインデックスIは、表2に示すよう
に表すことができる(ここで、決定レベルの間隔は1.
27で、決定レベルインデックスjは−2〜2と仮定し
ている)。
フレームに対するビット割当情報FB(p)は、平均ビ
ットFBmと(式8)の第2項で計算される可変ビット
数とを加算することによって決定される。予め定められ
たビット分散値BVは、上記(式8)で定義されるよう
に、1フレームの平均ビットと同一の値として決定して
もよい。また、フレームグループのp番目のフレームに
対するレベルインデックスIは、決定レベル算定器42
から入力される決定レベルD(j)と図2に示されてい
る平均値及び標準偏差計算器34から入力される認知エ
ントロピーPE(p)とに基づいて得られる。本発明の
好適実施例に於いて、フレームグループのp番目のフレ
ームに対するレベルインデックスIは、表2に示すよう
に表すことができる(ここで、決定レベルの間隔は1.
27で、決定レベルインデックスjは−2〜2と仮定し
ている)。
【0063】
【表2】
【0064】上記の表2から分かるように、もし認知エ
ントロピーPE(p)が決定レベル-2.55〜-1.28の間に
存在する場合は、p番目のフレームのレベルインデック
スIは-1として選択され、また、もし認知エントロピー
PE(p)が決定レベル-1.27〜1.26の間にある場合
は、レベルインデックスIとして0が選択される。この
ような方法で、p番目のフレームのビット割当情報FB
(p)を上記(式8)を用いることによって、効果的に
決定することができる。
ントロピーPE(p)が決定レベル-2.55〜-1.28の間に
存在する場合は、p番目のフレームのレベルインデック
スIは-1として選択され、また、もし認知エントロピー
PE(p)が決定レベル-1.27〜1.26の間にある場合
は、レベルインデックスIとして0が選択される。この
ような方法で、p番目のフレームのビット割当情報FB
(p)を上記(式8)を用いることによって、効果的に
決定することができる。
【0065】しかる後、ビット割当デバイス44にてフ
レームグループの各フレームに対して決定されたビット
に対応する第1及び第2チャンネルのビット割当情報F
BI1、FBI2と、図1に示されている第1認知パラ
メータ算定器20から入力される信号対マスク比SMR
1(r)、SMR2(r)とは、第2ビット割当ユニッ
ト50へ同時に入力される。また、ビット割当情報FB
I1、FBI2はフォーマッティング回路70へも入力
される。
レームグループの各フレームに対して決定されたビット
に対応する第1及び第2チャンネルのビット割当情報F
BI1、FBI2と、図1に示されている第1認知パラ
メータ算定器20から入力される信号対マスク比SMR
1(r)、SMR2(r)とは、第2ビット割当ユニッ
ト50へ同時に入力される。また、ビット割当情報FB
I1、FBI2はフォーマッティング回路70へも入力
される。
【0066】再度図1を参照すると、第2ビット割当ユ
ニット50は、第1認知パラメータ算定器20から出力
された信号対マスク比SMR1、SMR2と第1ビット
割当ユニット40から出力された各フレームのビット割
当情報FBI1、FBI2とを受信した後、前フレーム
グループの各フレームに含まれる各サブバンドに対して
ビットを決定する。その後、前記各サブバンドに対して
決定されたビットに対応するビット割当情報SBI1、
SBI2を量子化デバイス60とフォーマッティング回
路70へ出力する。第2ビット割当ユニット50にて用
いられたプロセスの原理は、使用されるビット数が第1
ビット割当ユニット40から送られてきたフレームに対
して使用可能なビット数を超過しないという条件の下で
の、1フレーム全体に渡る信号対マスク比の総合的な最
適化に基づく。続いて、第2ビット割当ユニット50か
ら出力される第1及び第2チャンネルの各サブバンドに
対するビット割当情報SBI1、SBI2と、各サブバ
ンドフィルタ11、12から出力されるサブバンドオー
ディオサンプルとは、複数の量子化器(例えば、61及
び62)を含む量子化デバイス60へ同時に入力され
る。
ニット50は、第1認知パラメータ算定器20から出力
された信号対マスク比SMR1、SMR2と第1ビット
割当ユニット40から出力された各フレームのビット割
当情報FBI1、FBI2とを受信した後、前フレーム
グループの各フレームに含まれる各サブバンドに対して
ビットを決定する。その後、前記各サブバンドに対して
決定されたビットに対応するビット割当情報SBI1、
SBI2を量子化デバイス60とフォーマッティング回
路70へ出力する。第2ビット割当ユニット50にて用
いられたプロセスの原理は、使用されるビット数が第1
ビット割当ユニット40から送られてきたフレームに対
して使用可能なビット数を超過しないという条件の下で
の、1フレーム全体に渡る信号対マスク比の総合的な最
適化に基づく。続いて、第2ビット割当ユニット50か
ら出力される第1及び第2チャンネルの各サブバンドに
対するビット割当情報SBI1、SBI2と、各サブバ
ンドフィルタ11、12から出力されるサブバンドオー
ディオサンプルとは、複数の量子化器(例えば、61及
び62)を含む量子化デバイス60へ同時に入力され
る。
【0067】各量子化器61、62は、第2ビット割当
ユニット50から入力される対応するビット割当情報に
基づいて、各サブバンドフィルタ11、12から入力さ
れる対応するサブバンドオーディオサンプルを適応的に
量子化し、第1及び第2チャンネルそれぞれの量子化さ
れたオーディオ信号をフォーマッティング回路70へと
出力する。
ユニット50から入力される対応するビット割当情報に
基づいて、各サブバンドフィルタ11、12から入力さ
れる対応するサブバンドオーディオサンプルを適応的に
量子化し、第1及び第2チャンネルそれぞれの量子化さ
れたオーディオ信号をフォーマッティング回路70へと
出力する。
【0068】このフォーマッティング回路70では、各
量子化器61、62から入力された量子化されたオーデ
ィオ信号と、第1及び第2ビット割当ユニット40、5
0から入力されるビット割当情報とをフォーマッティン
グすると共に、伝送のために伝送器(図示せず)へ伝送
する。これによって、入力ディジタルオーディオ信号の
符号化効率と音質が向上する。第2ビット割当ユニット
50、量子化器61、62、及びフォーマッティング回
路70は上述のMPEGオーディオアルゴリズムに於い
て見い出されるものと基本的に同じである。
量子化器61、62から入力された量子化されたオーデ
ィオ信号と、第1及び第2ビット割当ユニット40、5
0から入力されるビット割当情報とをフォーマッティン
グすると共に、伝送のために伝送器(図示せず)へ伝送
する。これによって、入力ディジタルオーディオ信号の
符号化効率と音質が向上する。第2ビット割当ユニット
50、量子化器61、62、及びフォーマッティング回
路70は上述のMPEGオーディオアルゴリズムに於い
て見い出されるものと基本的に同じである。
【0069】本発明は、特定の実施例について説明して
いるが、本発明の範囲を逸脱することなく、当業者は種
々の改変をなし得るであろう。
いるが、本発明の範囲を逸脱することなく、当業者は種
々の改変をなし得るであろう。
【0070】
【発明の効果】本発明によれば、複数のチャンネルから
入力される入力ディジタルオーディオ信号を、各入力デ
ィジタルオーディオ信号に対する認知エントロピーに基
づいて適応的に符号化することによって、符号化効率と
音質を向上することができる。
入力される入力ディジタルオーディオ信号を、各入力デ
ィジタルオーディオ信号に対する認知エントロピーに基
づいて適応的に符号化することによって、符号化効率と
音質を向上することができる。
【図1】複数のチャンネルから入力される入力ディジタ
ルオーディオ信号を適応的に符号化する本発明によるシ
ステムを概略的に示したブロック図である。
ルオーディオ信号を適応的に符号化する本発明によるシ
ステムを概略的に示したブロック図である。
【図2】図1に示されている第2認知パラメータ算定器
の詳細なブロック図である。
の詳細なブロック図である。
【図3】図1に示されている第1ビット割当ユニットの
詳細なブロック図である。
詳細なブロック図である。
10 サブバンドフィルタリングデバイス 20 第1認知パラメータ算定器 30 第2認知パラメータ算定器 32 認知エントロピー計算器 34 平均値及び標準偏差計算器 40 第1ビット割当ユニット 42 決定レベル算定器 44 ビット割当デバイス 50 第2ビット割当ユニット 61 量子化器 62 量子化器 60 量子化デバイス 70 フォーマッティング回路 100 適応的符号化システム 2q+1 決定レベルの全数 D(j) フレームグループのj番目の決定レベル FBI1 第1チャンネルのビット割当情報 FBI2 第2チャンネルのビット割当情報 M1(r) 第1チャンネルのr番目のサブバンドに於
けるマスクしきい値 M2(r) 第2チャンネルのr番目のサブバンドに於
けるマスクしきい値 P1(r) 第1チャンネルのr番目のサブバンドに於
ける音圧レベル、 P2(r) 第2チャンネルのr番目のサブバンドに於
ける音圧レベル、 PE1(i) 第1チャンネルのi番目のフレームに対
する認知エントロピー PE2(i) 第2チャンネルのi番目のフレームに対
する認知エントロピー PEm フレームグループの平均値 PEstd フレームグループの標準偏差 PE(p) フレームグループのp番目のフレームの認
知エントロピー SMR1(r) 第1チャンネルのr番目のサブバンド
に於ける信号対マスク比 SMR2(r) 第2チャンネルのr番目のサブバンド
に於ける信号対マスク比 X1(m,i) 第1チャンネルのi番目のフレームの
入力ディジタルオーディオ信号 X2(s,i) 第2チャンネルのi番目のフレームの
入力ディジタルオーディオ信号
けるマスクしきい値 M2(r) 第2チャンネルのr番目のサブバンドに於
けるマスクしきい値 P1(r) 第1チャンネルのr番目のサブバンドに於
ける音圧レベル、 P2(r) 第2チャンネルのr番目のサブバンドに於
ける音圧レベル、 PE1(i) 第1チャンネルのi番目のフレームに対
する認知エントロピー PE2(i) 第2チャンネルのi番目のフレームに対
する認知エントロピー PEm フレームグループの平均値 PEstd フレームグループの標準偏差 PE(p) フレームグループのp番目のフレームの認
知エントロピー SMR1(r) 第1チャンネルのr番目のサブバンド
に於ける信号対マスク比 SMR2(r) 第2チャンネルのr番目のサブバンド
に於ける信号対マスク比 X1(m,i) 第1チャンネルのi番目のフレームの
入力ディジタルオーディオ信号 X2(s,i) 第2チャンネルのi番目のフレームの
入力ディジタルオーディオ信号
Claims (4)
- 【請求項1】 N個(Nは正の整数)のチャンネルか
ら入力される入力ディジタルオーディオ信号を適応的に
符号化するシステムであって、 前記入力ディジタルオーディオ信号の各々が複数のフレ
ームを含み、該フレームの各々が複数のサブバンドを含
んでおり、 前記入力ディジタルオーディオ信号を各サブバンド単位
で受信しフィルタリングする、並列に配置されたN個の
サブバンドフィルタリング手段と、 前記入力ディジタルオーディオ信号に含まれる各サブバ
ンドに対して信号対マスク比、音圧レベル、及びマスク
しきい値を算定する第1算定手段と、 前記算定された信号対マスク比、音圧レベル、及びマス
クしきい値に基づいて、前記入力ディジタルオーディオ
信号のそれぞれに含まれるフレームの各々に対して認知
エントロピーを算定し、総数N個の前記チャンネルに対
しN×M個(Mは正の整数)の現フレーム及び前フレー
ムを含むフレームグループに対して平均値及び標準偏差
を算定する第2算定手段と、 前記算定された信号対マスク比、認知エントロピー、平
均値、及び標準偏差に基づいて、前記フレームグループ
のサブバンドの各々に対して適応的にビットを決定し、
前記サブバンドの各々に対して決定されたビットに対応
するビット割当情報を生成するビット割当手段と、 前記フレームグループの各サブバンドに対して生成され
る対応するビット割当情報に応じて、前記N個のチャン
ネルに対してフィルタリングされたサブバンドオーディ
オ信号を量子化する並列に配置されたN個の量子化手段
と、 前記ビット割当情報と共に、前記量子化されたディジタ
ルオーディオ信号をフォーマットする手段とを含むこと
を特徴とする適応的符号化システム。 - 【請求項2】 前記ビット割当手段が、 前記算定された平均値及び標準偏差に基づいて、前記フ
レームグループの決定レベルを算定する手段と、 前記算定された決定レベル、前記決定レベルの全数、前
記認知エントロピー、及び予め定められた平均ビットに
基づいて、前記フレームグループの各フレームに対して
ビットを決定すると共に、前記フレームの各々に対して
決定されたビットに対応するビット割当情報を発生する
第1ビット割当手段と、 前記算定された信号対マスク比と前記生成されたビット
割当情報とに基づいて、前記各フレームのサブバンドの
各々に対してビットを決定すると共に、前記サブバンド
の各々に対して決定されたビットに対応するビット割当
情報を発生する第2ビット割当手段とを備えることを特
徴とする請求項1に記載の適応的符号化システム。 - 【請求項3】 前記フレームグループの各決定レベル
Dが、 D=PEm+j・PEstd ・W のように決定され、 ここで、 j:決定レベルインデックス(j=−q〜q)、 q:正の整数、 W:前記フレームグループに於ける重みファクタ、 PEm:前記フレームグループの平均値、 PEstd:前記フレームグループの標準偏差 であることを特徴とする請求項2に記載の適応的符号化
システム。 - 【請求項4】 p番目のフレームのビット割当情報F
B(p)が、 FB(p)=FBm+BV/(2q+1)・I のように得られ、 ここで、 p:前記フレームグループに於けるフレームインデック
ス、 FBm:1フレームの平均ビットの関数、 BV:予め定められたビット分散値、 2q+1:予め定められた決定レベルの全数、 I:前記p番目のフレームのレベルインデックス であることを特徴とする請求項3に記載の適応的符号化
システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940000784A KR960012475B1 (ko) | 1994-01-18 | 1994-01-18 | 디지탈 오디오 부호화장치의 채널별 비트 할당 장치 |
KR1994P784 | 1994-01-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0851366A true JPH0851366A (ja) | 1996-02-20 |
JP2908270B2 JP2908270B2 (ja) | 1999-06-21 |
Family
ID=19375804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7023465A Expired - Lifetime JP2908270B2 (ja) | 1994-01-18 | 1995-01-18 | 適応的符号化システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US5613035A (ja) |
EP (1) | EP0663740A3 (ja) |
JP (1) | JP2908270B2 (ja) |
KR (1) | KR960012475B1 (ja) |
CN (1) | CN1119376A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09321628A (ja) * | 1996-05-29 | 1997-12-12 | Nec Corp | 音声符号化装置 |
JP2008538619A (ja) * | 2005-04-20 | 2008-10-30 | 株式会社エヌ・ティ・ティ・ドコモ | 非典型的な部分系列に関する部分情報を用いた音声及びオーディオ符号化パラメータの量子化 |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR970011727B1 (en) * | 1994-11-09 | 1997-07-14 | Daewoo Electronics Co Ltd | Apparatus for encoding of the audio signal |
KR0144011B1 (ko) * | 1994-12-31 | 1998-07-15 | 김주용 | 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법 |
TW384434B (en) | 1997-03-31 | 2000-03-11 | Sony Corp | Encoding method, device therefor, decoding method, device therefor and recording medium |
KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
US6005893A (en) * | 1997-09-23 | 1999-12-21 | Telefonaktiebolaget Lm Ericsson | Reduced complexity bit allocation to subchannels in a multi-carrier, high speed data transmission system |
DE19742655C2 (de) * | 1997-09-26 | 1999-08-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
DE69836785T2 (de) | 1997-10-03 | 2007-04-26 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiosignalkompression, Sprachsignalkompression und Spracherkennung |
KR100335611B1 (ko) * | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
TW477119B (en) * | 1999-01-28 | 2002-02-21 | Winbond Electronics Corp | Byte allocation method and device for speech synthesis |
IL134182A (en) | 2000-01-23 | 2006-08-01 | Vls Com Ltd | Method and apparatus for visual lossless pre-processing |
US6753929B1 (en) | 2000-06-28 | 2004-06-22 | Vls Com Ltd. | Method and system for real time motion picture segmentation and superposition |
US6744818B2 (en) * | 2000-12-27 | 2004-06-01 | Vls Com Ltd. | Method and apparatus for visual perception encoding |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US7469206B2 (en) | 2001-11-29 | 2008-12-23 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
AU2003202975A1 (en) * | 2002-01-15 | 2003-07-30 | University Of Miami | Coding a masked data channel in a radio signal |
CN1233163C (zh) * | 2002-08-21 | 2005-12-21 | 中山正音数字技术有限公司 | 多声道数字音频信号的压缩编码和解码设备及其方法 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
CN100349207C (zh) * | 2003-01-14 | 2007-11-14 | 北京阜国数字技术有限公司 | 高频耦合的伪小波5声道音频编/解码方法 |
US7212666B2 (en) * | 2003-04-01 | 2007-05-01 | Microsoft Corporation | Generating visually representative video thumbnails |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
GB2398191B (en) * | 2004-03-10 | 2004-12-22 | David Asher Jaffa | Adaptive quantiser |
EP1852851A1 (en) * | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
EP1873753A1 (en) * | 2004-04-01 | 2008-01-02 | Beijing Media Works Co., Ltd | Enhanced audio encoding/decoding device and method |
US7639892B2 (en) * | 2004-07-26 | 2009-12-29 | Sheraizin Semion M | Adaptive image improvement |
US7903902B2 (en) | 2004-07-26 | 2011-03-08 | Sheraizin Semion M | Adaptive image improvement |
JP4639073B2 (ja) * | 2004-11-18 | 2011-02-23 | キヤノン株式会社 | オーディオ信号符号化装置および方法 |
US7526142B2 (en) * | 2005-02-22 | 2009-04-28 | Sheraizin Vitaly S | Enhancement of decompressed video |
US7562021B2 (en) | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7630882B2 (en) | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
US8190425B2 (en) | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
CN104282311B (zh) * | 2014-09-30 | 2018-04-10 | 武汉大学深圳研究院 | 一种音频编码带宽扩展中子带划分的量化方法及装置 |
US10666289B1 (en) | 2019-01-16 | 2020-05-26 | International Business Machines Corporation | Data compression using dictionary encoding |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2389277A1 (fr) * | 1977-04-29 | 1978-11-24 | Ibm France | Procede de quantification a allocation dynamique du taux de bits disponible, et dispositif de mise en oeuvre dudit procede |
US4455649A (en) * | 1982-01-15 | 1984-06-19 | International Business Machines Corporation | Method and apparatus for efficient statistical multiplexing of voice and data signals |
CA1253255A (en) * | 1983-05-16 | 1989-04-25 | Nec Corporation | System for simultaneously coding and decoding a plurality of signals |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5230038A (en) * | 1989-01-27 | 1993-07-20 | Fielder Louis D | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5539829A (en) * | 1989-06-02 | 1996-07-23 | U.S. Philips Corporation | Subband coded digital transmission system using some composite signals |
US5367608A (en) * | 1990-05-14 | 1994-11-22 | U.S. Philips Corporation | Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal |
KR100263599B1 (ko) * | 1991-09-02 | 2000-08-01 | 요트.게.아. 롤페즈 | 인코딩 시스템 |
US5331414A (en) * | 1991-12-23 | 1994-07-19 | Intel Corporation | Method and apparatus for encoding a digital motion video signal using pyramid specific filtering |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
JP2976701B2 (ja) * | 1992-06-24 | 1999-11-10 | 日本電気株式会社 | 量子化ビット数割当方法 |
DE4222623C2 (de) * | 1992-07-10 | 1996-07-11 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern von digitalisierten Tonsignalen |
-
1994
- 1994-01-18 KR KR1019940000784A patent/KR960012475B1/ko not_active IP Right Cessation
- 1994-12-30 EP EP94120948A patent/EP0663740A3/en not_active Withdrawn
- 1994-12-30 US US08/367,521 patent/US5613035A/en not_active Expired - Fee Related
-
1995
- 1995-01-16 CN CN95101259A patent/CN1119376A/zh active Pending
- 1995-01-18 JP JP7023465A patent/JP2908270B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09321628A (ja) * | 1996-05-29 | 1997-12-12 | Nec Corp | 音声符号化装置 |
JP2008538619A (ja) * | 2005-04-20 | 2008-10-30 | 株式会社エヌ・ティ・ティ・ドコモ | 非典型的な部分系列に関する部分情報を用いた音声及びオーディオ符号化パラメータの量子化 |
Also Published As
Publication number | Publication date |
---|---|
EP0663740A2 (en) | 1995-07-19 |
JP2908270B2 (ja) | 1999-06-21 |
US5613035A (en) | 1997-03-18 |
KR950024447A (ko) | 1995-08-21 |
CN1119376A (zh) | 1996-03-27 |
KR960012475B1 (ko) | 1996-09-20 |
EP0663740A3 (en) | 1998-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2908270B2 (ja) | 適応的符号化システム | |
US5537510A (en) | Adaptive digital audio encoding apparatus and a bit allocation method thereof | |
JP3134455B2 (ja) | 高能率符号化装置及び方法 | |
JP3297240B2 (ja) | 適応的符号化システム | |
JP3802219B2 (ja) | 音声符号化装置 | |
JP3278900B2 (ja) | データ符号化装置及び方法 | |
JP3343962B2 (ja) | 高能率符号化方法及び装置 | |
JP3186292B2 (ja) | 高能率符号化方法及び装置 | |
US20040162720A1 (en) | Audio data encoding apparatus and method | |
JPS5997242A (ja) | 音声信号符号化方法 | |
CA2075156A1 (en) | Digital encoder with dynamic quantization bit allocation | |
JPH07336232A (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体 | |
JP2000004163A (ja) | オーディオ符号化のための動的ビット割り当て方法及び装置 | |
JPH066236A (ja) | 高能率符号化及び/又は復号化装置 | |
WO1995013660A1 (fr) | Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite | |
JP3395001B2 (ja) | ディジタルオーディオ信号の適応的符号化方法 | |
JP3297238B2 (ja) | 適応的符号化システム及びビット割当方法 | |
JP3255047B2 (ja) | 符号化装置および方法 | |
KR0181054B1 (ko) | 다수개의 채널들로부터의 입력 디지탈 오디오 신호들을 적응적으로 부호화하는 장치 | |
JPH08167851A (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
JPH06224862A (ja) | ディジタルオーディオ信号の処理方法および装置 | |
KR100340368B1 (ko) | 고능률부호화장치,복호화장치및디지털데이터도출방법 | |
JP3134384B2 (ja) | 符号化装置及び方法 | |
JP3134383B2 (ja) | ディジタルデータの高能率符号化方法及び装置 | |
KR0181061B1 (ko) | 적응 디지탈 오디오 부호화 장치 및 그의 비트 할당방법 |