JP3887827B2 - 符号化方法及び装置、復号化方法及び装置、並びに記録媒体 - Google Patents
符号化方法及び装置、復号化方法及び装置、並びに記録媒体 Download PDFInfo
- Publication number
- JP3887827B2 JP3887827B2 JP54260898A JP54260898A JP3887827B2 JP 3887827 B2 JP3887827 B2 JP 3887827B2 JP 54260898 A JP54260898 A JP 54260898A JP 54260898 A JP54260898 A JP 54260898A JP 3887827 B2 JP3887827 B2 JP 3887827B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- signals
- channels
- decoding
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 202
- 238000000926 separation method Methods 0.000 claims description 13
- 230000011664 signaling Effects 0.000 claims 1
- 238000013139 quantization Methods 0.000 description 56
- 238000006243 chemical reaction Methods 0.000 description 55
- 230000033458 reproduction Effects 0.000 description 43
- 238000012545 processing Methods 0.000 description 39
- 238000001228 spectrum Methods 0.000 description 34
- 230000005236 sound signal Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 25
- 230000003595 spectral effect Effects 0.000 description 24
- 238000012546 transfer Methods 0.000 description 20
- 230000003287 optical effect Effects 0.000 description 19
- 238000007726 management method Methods 0.000 description 12
- 238000010606 normalization Methods 0.000 description 12
- 238000013144 data compression Methods 0.000 description 10
- 238000007906 compression Methods 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 7
- 230000006835 compression Effects 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 6
- 230000006866 deterioration Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 201000009310 astigmatism Diseases 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H40/00—Arrangements specially adapted for receiving broadcast information
- H04H40/18—Arrangements characterised by circuits or components specially adapted for receiving
- H04H40/27—Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
- H04H40/36—Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving
- H04H40/45—Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving for FM stereophonic broadcast systems receiving
- H04H40/72—Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving for FM stereophonic broadcast systems receiving for noise suppression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereo-Broadcasting Methods (AREA)
Description
本発明は符号化された信号のフォーマットを拡張する際に好適な、符号化方法及び装置と、これに対応する復号化方法及び装置、符号化された信号が記録された記録媒体に関するものである。
背景技術
従来より、符号化された音響情報或いは音声情報の如き信号(以下、オーディオ信号と呼ぶ)を記録することが可能なものとして、例えば光磁気ディスクのような信号記録媒体が提案されている。上記オーディオ信号の高能率符号化の手法には種々あるが、その高能率符号化の手法としては、例えば、時間軸上のオーディオ信号を所定時間単位でブロック化し、このブロック毎の時間軸の信号を周波数軸上の信号に変換(スペクトル変換)して複数の周波数帯域に分割し、各帯域毎に符号化するブロック化周波数帯域分割方式であるいわゆる変換符号化や、時間軸上のオーディオ信号をブロック化しないで、複数の周波数帯域に分割して符号化する非ブロック化周波数帯域分割方式であるいわゆる帯域分割符号化(サブ・バンド・コーディング:SBC)等を挙げることができる。また、上述の帯域分割符号化と変換符号化とを組み合わせた高能率符号化の手法も考えられている。この場合には、例えば、上記帯域分割符号化で帯域分割を行った後、該各帯域毎の信号を周波数軸上の信号にスペクトル変換し、このスペクトル変換された各帯域毎に符号化が施される。
ここで、上述した帯域分割符号化において用いられる帯域分割用フィルタとしては、例えばいわゆるQMF(Quadrature Mirror filter)などのフィルタがあり、このQMFのフィルタは、文献「ディジタル・コーディング・オブ・スピーチ・イン・サブバンズ」(”Digital coding of speech in subbands”R. E. Crochiere, Bell Syst. Tech. J., Vol. 55, No.8 1976)に述べられている。このQMFのフィルタは、帯域を等バンド幅に2分割するものであり、当該フィルタにおいては上記分割した帯域を後に合成する際にいわゆるエリアシングが発生しないことが特徴となっている。また、文献「ポリフェイズ・クァドラチュア・フィルターズ ―新しい帯域分割符号化技術」(”Polyphase Quadrature filters -A new subband coding technique”, Joseph H. Rothweiler, ICASSP 83, BOSTON)には、等帯域幅のフィルタ分割手法が述べられている。このポリフェイズ・クァドラチュア・フィルタにおいては、信号を等バンド幅の複数の帯域に分割する際に一度に分割できることが特徴となっている。
上述したスペクトル変換としては、例えば、入力オーディオ信号を所定単位時間(フレーム)でブロック化し、当該ブロック毎に離散フーリエ変換(Discrete Fourier Transform:DFT)、離散コサイン変換(Discrete Cosine Transform:DCT)、モディファイド離散コサイン変換(変形離散コサイン変換:Modified Discrete Cosine Transform :MDCT)等を行うことで時間軸を周波数軸に変換するようなスペクトル変換がある。なお、上記MDCTについては、文献「時間領域エリアシング・キャンセルを基礎とするフィルタ・バンク設計を用いたサブバンド/変換符号化」(”Subband/Transform Coding Using Filter Bank Disigns Based on Time Domain Aliasing Cancellation,”J. P. Princen A. B. Bradley, Univ. of Surrey Royal Melbourne Inst. of Tech. ICASSP 1987)に述べられている。
また、波形信号をスペクトル変換する方法として上述のDFTやDCTを使用した場合、例えばM個のサンプルデータからなる時間ブロックで変換(以下、このブロックを変換ブロックと呼ぶ)を行うと、M個の独立な実数データが得られる。ここで変換ブロック間の接続歪みを軽減するために、通常は、両隣の変換ブロック間でそれぞれM1個のサンプルデータをオーバーラップさせるので、これらDFTやDCTでは、平均化して(M−M1)個のサンプルデータに対してM個の実数データが得られるようになり、したがって、これらM個の実数データが、その後量子化及び符号化されることになる。
これに対して、スペクトル変換の方法として上述のMDCTを使用した場合には、両隣の変換ブロック間でそれぞれM個ずつのサンプルデータをオーバーラップさせた2M個のサンプルから、独立なM個の実数データが得られる。すなわち、MDCTを使用した場合には、平均化してM個のサンプルデータに対してM個の実数データが得られ、これらM個の実数データが、その後量子化及び符号化されることになる。復号化装置においては、このようにしてMDCTを用いて得られた符号から、各ブロックにおいて逆変換を施して得た波形要素を互いに干渉させながら加え合わせることにより、波形信号を再構成することができる。
ところで、一般に、上記スペクトル変換のための変換ブロックを長くすると、周波数分解能が高まり、特定のスペクトル信号成分にエネルギが集中することが起きる。したがって、両隣の変換ブロック間でそれぞれ半分ずつサンプルデータをオーバーラップさせた長い変換ブロック長でスペクトル変換を行い、しかも得られたスペクトル信号成分の個数が、元の時間軸のサンプルデータの個数に対して増加しない上記MDCTを使用するようにすれば、DFTやDCTを使用した場合よりも効率の良い符号化を行うことが可能となる。また、隣接する変換ブロック同士で十分長いオーバーラップを持たせるようにすれば、波形信号の変換ブロック間の接続歪みを軽減することもできる。ただし、変換のための変換ブロックを長くするということは、変換のための作業領域がより多く必要になるということでもあるため、再生手段等の小型化を図る上での障害となり、特に半導体の集積度を上げることが困難な時点で長い変換ブロックを採用することはコストの増加につながるので注意が必要となる。
上述したように、フィルタやスペクトル変換によって帯域毎に分割された信号成分を量子化することにより、量子化雑音が発生する帯域を制御することができ、したがって、いわゆるマスキング効果などの性質を利用して聴覚的により高能率な符号化を行うことが可能となる。また、ここで量子化を行う前に、各帯域毎に、例えばその帯域における信号成分の絶対値の最大値で各サンプルデータの正規化を行うようにすれば、さらに高能率な符号化を行うことができる。
ここで、例えばオーディオ信号を周波数帯域分割して得た各信号成分を量子化する場合の周波数分割幅としては、例えば人間の聴覚特性を考慮した帯域幅を用いることが好ましい。すなわち、一般に高域ほど帯域幅が広くなるような臨界帯域(クリティカルバンド)と呼ばれている帯域幅で、オーディオ信号を複数(例えば25バント)の帯域に分割することが好ましい。また、このときの各帯域毎のデータを符号化する際には、各帯域毎に所定のビット配分或いは、各帯域毎に適応的なビット割当(ビットアロケーション)による符号化が行われる。例えば、上記MDCT処理されて得られた係数データを上記ビットアロケーションによって符号化する際には、上記各変換ブロック毎のMDCT処理により得られる各帯域毎のMDCT係数データに対して、適応的な割当ビット数で符号化が行われることになる。ビット割当手法としては、次の2手法が知られている。
例えば、文献「音声信号の適応変換符号化」(”Adaptive Transform Coding of Speech Signals”, R. Zelinski and P. Noll, IEEE Transactions of Acoustics, Speech, and Signal Processing, vol. ASSP-25, No. 4, August 1977)では、各帯域毎の信号の大きさをもとに、ビット割当を行っている。この方式では、量子化雑音スペクトルが平坦となり、雑音エネルギが最小となるが、聴感覚的にはマスキング効果が利用されていないために実際の雑音感は最適ではない。
また、例えば文献「臨界帯域符号化器 ―聴覚システムの知覚の要求に関するディジタル符号化」(”The critical band coder --digital encoding of the perceptual requirements of the auditory system”, M. A. Kransner MIT, ICASSP 1980)では、聴覚マスキングを利用することで、各帯域毎に必要な信号対雑音比を得て固定的なビット割当を行う手法が述べられている。しかしこの手法では、サイン波入力で特性を測定する場合でも、ビット割当が固定的であるために特性値がそれほど良い値とならない。
これらの問題を解決するために、ビット割当に使用できる全ビットを、各小ブロック毎に予め定められた固定ビット割当パターン分と、各ブロックの信号の大きさに依存したビット配分を行う分とに分割使用するようにし、そのときの分割比を入力信号に関係する信号に依存させ、上記信号のスペクトルのパターンが滑らかなほど上記固定ビット割当パターン分への分割比率を大きくするような高能率符号化方法が提案されている。
この方法によれば、サイン波入力のように、特定のスペクトル信号成分にエネルギが集中する場合にはそのスペクトル信号成分を含むブロックに多くのビットを割り当てることにより、全体の信号対雑音特性を著しく改善することができる。一般に、急峻なスペクトル信号成分を持つ信号に対して人間の聴覚は極めて敏感であるため、このような方法を用いることにより、信号対雑音特性を改善することは、単に測定上の数値を向上させるばかりでなく、聴感上、音質を改善するのに有効である。
ビット割当の方法にはこの他にも数多くの方法が提案されており、さらに聴覚に関するモデルが精緻化され、符号化装置の能力が上がれば聴覚的にみてより高能率な符号化が可能になる。
これらの方法においては、計算によって求められた信号対雑音特性をなるべく忠実に実現するような実数のビット割当基準値を求め、それを近似する整数値を割当ビット数とすることが一般的である。
実際の符号列を構成するに当たっては、先ず、正規化及び量子化が行われる帯域毎に、量子化精度情報と正規化係数情報を所定のビット数で符号化し、次に、正規化及び量子化されたスペクトル信号成分を符号化すれば良い。また、ISO標準(ISO/IEC 11172−3:1993(E),1993)では、帯域によって量子化精度情報を表すビット数が異なるように設定された高能率符号化方式が記述されており、ここでは高域になるにしたがって、量子化精度情報を表すビット数が小さくなるように規格化されている。
量子化精度情報を直接符号化する代わりに、復号化装置において例えば正規化係数情報から量子化精度情報を決定する方法も知られているが、この方法では、規格を設定した時点で正規化係数情報と量子化精度情報の関係が決まってしまうので、将来的にさらに高度な聴覚モデルに基づいた量子化精度の制御を導入することができなくなる。また、実現する圧縮率に幅がある場合には圧縮率毎に正規化係数情報と量子化精度情報との関係を定める必要が出てくる。
また、例えば、文献「最小冗長コードの構成のための方法」(”A Method for Construction of Minimum Redundancy Codes”D. A. Huffman:, Proc.I. R. E., 40, p. 1098 (1952))のように、可変長符号を用いて符号化することによって、量子化されたスペクトル信号成分をより効率的に符号化する方法も知られている。
さらに、本件出願人によるPCT出願国際公開WO94/28633の明細書及び図面には、スペクトル信号成分から聴感上特に重要なトーン性の成分を分離して、他のスペクトル信号成分とは別に符号化する方法が提案されており、これにより、オーディオ信号等を聴感上の劣化を殆ど生じさせずに高い圧縮率で効率的に符号化することが可能になっている。
なお、上述した各符号化手法は、複数のチャネルから構成される音響信号の各チャネルに対しても適用することが可能である。例えば、左側のスピーカに対応するLチャネル、右側のスピーカに対応するRチャネルのそれぞれに適用しても良い。また、Lチャネル、Rチャネルそれぞれの信号を加えることによって得られた(L+R)/2の信号に対して適用することも可能である。また、(L+R)/2の信号と(L−R)/2の信号に対して上述の各手法を用いて効率の良い符号化を行うことも可能である。なお、1チャネルの信号を符号化する場合のデータ量は、2チャネルの信号をそれぞれ独立に符号化する場合の半分ですむので、記録媒体に信号を記録する場合、1チャネルのモノラル信号で記録するモードと2チャネルのステレオ信号で記録するモードの両者を設け、長時間の記録が必要な場合にはモノラル信号として記録できるように規格を設定するという方法がよく採られている。
上述したように、符号化効率を高める手法は次々と開発されており、したがって、新たに開発された符号化手法を組み込んだ規格を採用すれば、より長時間の記録が可能になったり、同じ記録時間であればより音質の高い音響(オーディオ)信号を記録することが可能になる。
ここで、上述したような規格を決定する際には、将来的に規格が変更又は拡張される場合のことを考慮して、予め信号記録媒体に対して上記規格に関するフラグ情報等を記録できる余地を残しておく方法がよく採られる。すなわち例えば、最初に規格化を行う場合には、ビットのフラグ情報として「0」を記録しておくようにし、規格変更を行う場合にはそのフラグ情報に「1」を記録する。変更後の規格に対応した再生装置は、このフラグ情報が「0」であるか「1」であるかをチェックし、もし「1」ならば、変更後の規格に基づいて信号記録媒体から信号を読み出し再生する。上記フラグ情報が「0」の場合には、もし、その再生装置が最初に定められた規格にも対応しているのであれば、その規格に基づいて信号記録媒体から信号を読み出して再生し、対応していないのであれば信号再生を行わない。
しかしながら、一旦定められた規格(以下、これを「旧規格」、又は「第1の符号化方法」と称する)で記録された信号のみを再生できる再生装置(以下、これを「旧規格対応再生装置」と称する)が普及すると、この旧規格対応再生装置では、より高能率の符号化方式を使用した上位の規格(以下、これを「新規格」、又は「第2の符号化方法」と称する)を使って記録された記録媒体を再生できないため、装置の使用者に混乱を与える。
特に、旧規格が決定された時点における再生装置(旧規格対応再生装置)には、記録媒体に記録されたフラグ情報を無視して、当該記録媒体に記録されている信号は全て旧規格で符号化されているものとして再生してしまうものも存在する。すなわち、記録媒体が新規格に基づいて記録されているものであったとしても、全ての旧規格対応再生装置がそのことを識別できるわけではない。このため、当該旧規格対応再生装置において、例えば新規格に基づいた信号が記録された記録媒体を、旧規格に基づいた信号が記録された記録媒体であると解釈して再生したような場合には、正常に動作しなかったり、ひどい雑音を発生したりする虞がある。
この問題を解決するために、本件出願人は、日本特許出願公開平10−22935の明細書及び図面において、追加された規格すなわち新規格で記録を行う場合には、「記録されている信号の一部は、この規格のみに対応した再生手段では再生できない。」との事実を知らせる信号を、旧規格に基づいて記録するとともに、旧規格対応再生装置で再生した場合には、旧規格に基づいて記録された信号以外には再生させないようにして装置の使用者に混乱を招いたり、雑音を発生させたりすることを防止する方法を提案している。また、この日本特許出願公開平10−22935の明細書及び図面においては、予め記録媒体に旧規格によるメッセージ信号を記録しておき、新規格で記録を行う場合には再生管理情報の内容を操作することで、旧規格対応再生装置で再生した場合にはメッセージ信号が再生されるようにすることによって、安価な新規格対応の記録装置で容易に記録ができるようにする方法、及び、旧規格対応再生装置で再生した場合には新規格で記録された部分に対応して、メッセージ信号が再生されるようにすることにより、実際にどの曲が旧規格で記録されているのかを旧規格対応再生装置の使用者に知らせるようにする方法も提案している。
しかしながら、これらの方法においては、旧規格対応再生装置では実際に記録されている音を再生することができない。このため、本件出願人は、日本特許出願平9−42514号の明細書及び図面により、エンコーダによってその大きさが制御不可能なフレーム毎に多チャネルの信号を符号化する符号化方法において、旧規格対応再生装置が再生すべきチャネルの信号をそのフレームにおいて割当可能な最大ビット数よりも少ないビット数で符号化し、そのようにしてできたフレーム内の空き領域に他のチャネルの信号を符号化するすることにより、旧規格対応再生装置でも少数のチャネルの信号を再生できるようにするとともに、新規格対応の再生装置を用いれば、より多くのチャネルの信号が再生できるようにする方法を提案している。またこの方法では旧規格対応再生装置では再生しないチャネルの信号の符号化方法を旧規格の符号化方法よりも符号化効率の良いものとすることにより、多チャネル信号を符号化することによって生じる音質低下を軽減することが可能である。この方法において旧規格対応再生装置が再生可能な領域を領域1、旧規格対応再生装置では再生しない領域を領域2とする場合、例えば、領域1にA=(L+R)/2、領域2にB=(L−R)/2の信号を記録したすることにより、旧規格対応再生装置ではモノラル信号Aを再生し、新規格対応再生装置ではA,Bチャネルからステレオ信号L,Rを再生することが可能となる。
(L+R)/2と(L−R)/2の信号を符号化して記録し、ステレオ信号を再生する方法については、例えば文献「広帯域ステレオ信号の知覚変換符号化」(”Perceptual Transform Coding of Wide-band Stereo Signals”, James D. Johnston, ICASSP89, pp. 1993-1995)に述べられている。
しかしながら、これらの方法を用いてステレオ信号を再生する場合、ステレオ信号の種類によっては符号化により生じる量子化雑音が問題を起こす場合がある。
図1A〜1Hにはこれらの方法において、一般的なステレオ信号を符号化、復号化して再生する場合に生じる量子化雑音の様子について示す。
この図1A,1Bは、ステレオ信号の左チャネル成分(L)及びステレオ信号の右チャネル成分(R)の時間軸波形をそれぞれ表し、図1C,1DはL,Rのチャネル成分を(L+R)/2,(L−R)/2にチャネル変換した信号の時間軸波形をそれぞれ表している。図1C,1Dでは上記(L+R)/2をA、(L−R)/2をBで表している。一般に、ステレオ信号の各々のチャネル間には強い相関性が存在しているためB=(L−R)/2は原信号L又はRに比べてその信号レベルがかなり小さいものとなる。
また、図1E,1Fは、上記(L+R)/2=A,(L−R)/2=Bの信号をそれぞれ上記高能率符号化方法により符号化して復号化する際に生じる量子化雑音の様子を表し、図中N1とN2は(L+R)/2=A,(L−R)/2=Bの信号を符号化する際に生じる量子化雑音成分の時間軸波形をそれぞれ表している。ここで、(L+R)/2=Aを符号化及び復号化した後の信号はA+N1、(L−R)/2=Bを符号化及び復号化した後の信号はB+N2でそれぞれ表すことができる。高能率符号化方法において量子化雑音のレベルは元の信号レベルに依存する場合が多く、この場合はN1に比べてN2の信号レベルはかなり小さいものとなっている。
図1G,1Hは(A+N1),(B+N2)の信号波形からステレオ信号の各々のチャネルを分離した様子を示している。(A+N1)と(B+N2)の信号を加えることによりRチャネル成分が消え、L成分だけを取り出すことができ、また(A+N1)から(B+N2)の信号を引くことによりLチャネル成分が消え、Rチャネル成分だけを取り出すことができる。
量子化雑音成分N1とN2は(N1+N2)又は(N1−N2)という形で残るが、N2のレベルはN1に比べて極めて小さいため、聴感上は特に問題にならない。
一方、図2A,2Hには右チャネル(R)の信号レベルが左チャネル(L)の信号レベルに比べて非常に小さいステレオ信号を例に同様に量子化雑音の様子について示している。図2A,2Bはステレオ信号の左チャネル成分(L)、及びステレオ信号の右チャネル成分(R)の時間軸波形をそれぞれ表し、図2C,2DはL,Rチャネル成分を(L+R)/2,(L−R)/2にチャネル変換した信号の時間軸波形をそれぞれ表している。この図2C,2Dでも図1の例と同じように上記(L+R)/2をA、(L−R)/2をBで表している。この例ではRのチャネル成分の信号レベルが小さく両チャネル間の相関がないためB=(L−R)/2の信号レベルは小さくならず、むしろA=(L+R)/2に近い信号となる。
図2E,2Fも図1と同様に上記(L+R)/2=A,(L−R)/2=Bの信号をそれぞれ上記高能率符号化方法により符号化して復号化する際に生じる量子化雑音の様子を表し、図中N1とN2は(L+R)/2=A,(L−R)/2=Bの信号を符号化する際に生じる量子化雑音成分の時間軸波形をそれぞれ表している。ここで、図1の例と同様に、(L+R)/2=Aを符号化及び復号化した後の信号はA+N1、(L−R)/2=Bを符号化及び復号化した後の信号はB+N2でそれぞれ表すことができる。
図2G,2Hも図1と同様に(A+N1),(B+N2)の信号波形からステレオ信号の各々のチャネルを分離した様子を示している。(A+N1)と(B+N2)の信号を加えることによりRチャネル成分が消え、L成分だけを取り出すことができ、また(A+N1)から(B+N2)の信号を引くことによりLチャネル成分が消え、Rチャネル成分だけを取り出すことができる。
この図2の例の場合も量子化雑音成分N1とN2は(N1+N2)又は(N1−N2)という形で残るが、この例ではRチャネル成分の信号レベルが非常に小さいため、Rチャネル成分で(N1−N2)の量子化雑音成分をマスクすることができず、Rチャネル側で量子化雑音が聞こえてしまう場合がある。
発明の開示
そこで、本発明はこのような実情を鑑みてなされたものであり、旧規格対応再生装置による再生を可能にしながら、新規格拡張によって多チャネル化を実現する符号化・復号化の際に、符号化により生じる量子化雑音を最小限に抑え、音質劣化を軽減できる符号化方法及び装置、復号化装置、並びに記録媒体を提供することを目的とするものである。
すなわち本発明は、例えば旧規格対応再生装置による再生を可能にしながら、新規格拡張によって多チャネル化を実現する符号化・復号化方法において、拡張部分のチャネル信号を入力信号に応じて最適に選択し、符号化により生じる量子化雑音を最小限に抑えることにより音質劣化を軽減するものである。
本発明に係る符号化方法は、複数の入力チャネルの信号から第1の信号を生成し、複数の入力チャネルのうちの一部のチャネルと他のチャネルの信号レベルを求め、信号レベルに基づいて、一部のチャネルの信号のみからなる第2の信号と複数の入力チャネルの信号から生成した第2の信号との何れかを選択し、第1の信号及び選択した第2の信号を符号化する。
本発明に係る符号化装置は、複数の入力チャネルの信号から第1の信号を生成する第1の信号生成手段と、複数の入力チャネルのうちの一部のチャネルと他のチャネルの信号レベルに基づいて、一部のチャネルの信号のみからなる第2の信号と複数の入力チャネルの信号から生成した第2の信号との何れかを選択する第2の信号生成手段と、第1の信号及び選択した第2の信号を符号化する符号化手段とを具備する。
本発明に係る復号化方法は、符号列から第1の符号化信号と、第2の符号化信号と、第2の符号化信号の構成するチャネル信号の構成状態を示す構成情報とを分離し、分離した第1及び第2の符号化信号をそれぞれ復号化して第1及び第2の信号を生成し、構成情報に基づいて、第1及び第2の信号から複数のチャネル信号を生成するための復元処理を選択する。
本発明に係る復号化方法は、複数のチャネルの信号から生成されて符号化された第1の符号化信号と、複数のチャネルのうちの一部のチャネルと他のチャネルの信号レベルに基づいて一部のチャネルの信号のみからなる第2の信号又は複数のチャネルの信号から生成した第2の信号の何れかが選択されて符号化された第2の符号化信号とを含む符号列から第1及び第2の符号化信号を分離し、分離した第1及び第2の符号化信号をそれぞれ復号化し、復号化した第1及び第2の信号から複数チャネルの信号を復元する。
本発明に係る復号化装置は、符号列から第1の符号化信号と、第2の符号化信号と、第2の符号化信号の構成するチャネル信号の構成状態を示す構成情報とを分離する分離手段と、分離した第1及び第2の符号化信号をそれぞれ復号化して第1及び第2の信号を生成する復号化手段と、構成情報に基づいて、第1及び第2の信号から複数のチャネル信号を生成するための復元処理を選択する制御手段とを具備する。
本発明に係る復号化装置は、複数のチャネルの信号から生成されて符号化された第1の符号化信号と、複数のチャネルのうちの一部のチャネルと他のチャネルの信号レベルに基づいて一部のチャネルの信号のみからなる第2の信号又は複数のチャネルの信号から生成した第2の信号の何れかが選択されて符号化された第2の符号化信号とを含む符号列から第1及び第2の符号化信号を分離する分離手段と、分離した第1及び第2の符号化信号をそれぞれ復号化する復号化手段と、復号化した第1及び第2の信号から複数チャネルの信号を復元する復元手段とを具備する。
【図面の簡単な説明】
図1A〜1Hは、一般的なステレオ信号を、従来技術によって符号化及び復号化して再生する場合に生じる量子化雑音の様子についての説明に用いる図である。
図2A〜2Hは、右チャネル(R)の信号レベルが左チャネル(L)の信号レベルに比べて非常に小さいステレオ信号を、従来技術によって符号化及び復号化して再生する場合に生じる量子化雑音の様子についての説明に用いる図である。
図3は、本発明に係わる圧縮データの記録再生装置の一実施の形態としての記録再生装置の構成例を示すブロック回路図である。
図4は、符号化装置の具体的構成例を示すブロック回路図である。
図5は、変換回路の具体的構成例を示すブロック回路図である。
図6は、信号成分符号化回路の具体的構成例を示すブロック回路図である。
図7は、復号化装置の具体的構成例を示すブロック回路図である。
図8は、逆変換回路の具体的構成例を示すブロック回路図である。
図9は、信号成分復号化回路の具体的構成例を示すブロック回路図である。
図10は、基本的な符号化方法を説明するための図である。
図11は、基本的な符号化方法にて符号化したフレームの符号列の構成を説明するための図である。
図12は、フレーム毎にL,Rチャネルを配置する例を示す図である。
図13は、(L+R)/2のチャネルをフレームに配置する例を示す図である。
図14は、信号成分をトーン成分とノイズ成分に分けて符号化する符号化方法を説明するための図である。
図15は、信号成分をトーン成分とノイズ成分に分けて符号化する符号化方法で符号化したフレームの符号列の構成を説明するための図である。
図16は、信号成分をトーン成分とノイズ成分に分けて符号化する信号成分符号化回路の具体的構成例を示すブロック回路図である。
図17は、信号成分をトーン成分とノイズ成分に分けて符号化された信号を復号する信号成分復号化回路の具体的構成例を示すブロック回路図である。
図18は、Aコーデックの符号列を記録する場合の記録フォーマットを説明するための図である。
図19は、AコーデックとBコーデックの符号列を記録する場合の記録フォーマットを説明するための図である。
図20は、AコーデックとBコーデックの符号列を記録した場合に旧規格対応再生装置で誤ってBコーデックを再生しないことを実現する記録フォーマットを説明するための図である。
図21は、AコーデックとBコーデックの信号をフレーム内に配置する符号列の構成を説明するための図である。
図22は、AコーデックとBコーデックの信号をフレーム内に配置する符号列を生成する符号化装置の具体的構成を示すブロック回路図である。
図23は、AコーデックとBコーデックの信号をフレーム内に配置する符号列を生成する符号化装置の処理例を示すフローチャートである。
図24は、AコーデックとBコーデックの信号をフレーム内に配置する符号列を復号する信号成分復号化装置の具体的構成を示すブロック回路図である。
図25は、AコーデックとBコーデックの信号をフレーム内に配置する符号列を復号する信号成分復号化装置の処理例を示すフローチャートである。
図26は、チャネル構成データとAチャネル及びBチャネルの信号をフレーム内に配置する本発明実施の形態の符号列の構成を説明するための図である。
図27は、チャネル構成データとAチャネル及びBチャネルの信号をフレーム内に配置する本発明実施の形態の符号列を生成する符号化装置の具体的構成を示すブロック回路図である。
図28は、本発明実施の形態の符号列を生成する符号化装置の制御回路の処理の流れを示すフローチャートである。
図29は、チャネル構成データとAチャネル及びBチャネルの信号をフレーム内に配置する符号列を生成する本発明実施の形態の符号化装置の処理例を示すフローチャートである。
図30は、チャネル構成データとAチャネル及びBチャネルの信号をフレーム内に配置する符号列を復号する本発明実施の形態の符号化装置の具体的構成を示すブロック回路図である。
図31は、本発明実施の形態の符号列を復号化する復号化装置の処理の流れを示すフローチャートである。
図32は、本発明実施の形態の符号列を復号化する復号化装置にて復号モードを決定する処理の流れを示すフローチャートである。
図33A〜33Hは、右チャネル(R)の信号レベルが左チャネル(L)の信号レベルに比べて非常に小さいステレオ信号を、本発明実施の形態によって符号化及び復号化して再生した場合に生ずる量子化雑音の様子についての説明に用いる図である。
発明を実施するための最良の形態
以下、本発明の具体的な実施の形態について、図面を参照しながら説明する。先ず、図3には本発明の一実施の形態が適用される圧縮データ記録及び/又は再生装置の概略構成を示す。
図3に示す圧縮データ記録及び/又は再生装置において、先ず記録媒体としては、スピンドルモータ(M)51により回転駆動される光磁気ディスク1が用いられる。光磁気ディスク1に対するデータの記録時には、例えば光学ヘッド(H)53によりレーザ光を照射した状態で記録データに応じた変調磁界を磁気ヘッド54により印加することによって、いわゆる磁界変調記録を行い、光磁気ディスク1の記録トラックに沿ってデータを記録する。また再生時には、光磁気ディスク1の記録トラックを光学ヘッド53によりレーザ光でトレースして磁気光学的に再生を行う。
光学ヘッド53は、例えば、レーザダイオード等のレーザ光源、コリメータレンズ、対物レンズ、偏光ビームスプリッタ、シリンドリカルレンズ等の光学部品及び所定パターンの受光部を有するフォトディテクタ等から構成されている。この光学ヘッド53は、光磁気ディスク1を介して磁気ヘッド54と対向する位置に設けられている。光磁気ディスク1にデータを記録するときには、後述する記録系の磁気ヘッド駆動回路66により磁気ヘッド54を駆動して記録データに応じた変調磁界を印加するとともに、光学ヘッド53により光磁気ディスク1の目的トラックにレーザ光を照射することによって、磁界変調方式により熱磁気記録を行う。またこの光学ヘッド53は、目的トラックに照射したレーザ光の反射光を検出し、例えばいわゆる非点収差法によりフォーカスエラーを検出し、例えばいわゆるプッシュプル法によりトラッキングエラーを検出する。光磁気ディスク1からデータを再生するとき、光学ヘッド53は上記フォーカスエラーやトラッキングエラーを検出すると同時に、レーザ光の目的トラックからの反射光の偏光角(カー回転角)の違いを検出して再生信号を生成する。
光学ヘッド53の出力は、RF回路55に供給される。このRF回路55は、光学ヘッド53の出力から上記フォーカスエラー信号やトラッキングエラー信号を抽出してサーボ制御回路56に供給するとともに、再生信号を2値化して後述する再生系のデコーダ71に供給する。
サーボ制御回路56は、例えばフォーカスサーボ制御回路やトラッキングサーボ制御回路、スピンドルモータサーボ制御回路、スレッドサーボ制御回路等から構成される。上記フォーカスサーボ制御回路は、上記フォーカスエラー信号がゼロになるように、光学ヘッド53の光学系のフォーカス制御を行う。また上記トラッキングサーボ制御回路は、上記トラッキングエラー信号がゼロになるように光学ヘッド53の光学系のトラッキング制御を行う。さらに上記スピンドルモータサーボ制御回路は、光磁気ディスク1を所定の回転速度(例えば一定線速度)で回転駆動するようにスピンドルモータ51を制御する。また、上記スレッドサーボ制御回路は、システムコントローラ57により指定される光磁気ディスク1の目的トラック位置に光学ヘッド53及び磁気ヘッド54を移動させる。このような各種制御動作を行うサーボ制御回路56は、該サーボ制御回路56により制御される各部の動作状態を示す情報をシステムコントローラ57に送る。
システムコントローラ57にはキー入力操作部58や表示部(ディスプレイ)59が接続されている。このシステムコントローラ57は、キー入力操作部58による操作入力情報により操作入力情報により記録系及び再生系の制御を行う。またシステムコントローラ57は、光磁気ディスク1の記録トラックからヘッダタイムやサブコードのQデータ等により再生されるセクタ単位のアドレス情報に基づいて、光学ヘッド53及び磁気ヘッド54がトレースしている上記記録トラック上の記録位置や再生位置を管理する。さらにシステムコントローラ57は、本圧縮データ記録再生装置のデータ圧縮率と上記記録トラック上の再生位置情報とに基づいて表示部59に再生時間を表示させる制御を行う。
この再生時間表示は、光磁気ディスク1の記録トラックからいわゆるヘッダタイムやいわゆるサブコードQデータ等により再生されるセクタ単位のアドレス情報(絶対時間情報)に対し、データ圧縮率の逆数(例えば1/4圧縮のときには4)を乗算することにより、実際の時間情報を求め、これを表示部59に表示させるものである。なお、記録時においても、例えば光磁気ディスク等の記録トラックに予め絶対時間情報が記録されている(プリフォーマットされている)場合に、このプリフォーマットされた絶対時間情報を読み取ってデータ圧縮率の逆数を乗算することにより、現在位置を実際の記録時間で表示させることも可能である。
次にこのディスク記録再生装置の記録系において、入力端子60からのアナログオーディオ入力信号Ainがローパスフィルタ(LPF)61を介してA/D変換器62に供給され、このA/D変換器62は上記アナログオーディオ入力信号Ainを量子化する。A/D変換器62から得られたディジタルオーディオ信号は、ATC(Adaptive Transform Coding)エンコーダ63に供給される。また、入力端子67からのディジタルオーディオ入力信号Dinがディジタル入力インターフェース回路(ディジタル入力)68を介してATCエンコーダ63に供給される。ATCエンコーダ63は、上記入力信号AinをA/D変換器62により量子化した所定転送速度のディジタルオーディオPCMデータについて、所定のデータ圧縮率に応じたビット圧縮(データ圧縮)処理を行うものであり、ATCエンコーダ63から出力される圧縮データ(ATCデータ)は、メモリ64に供給される。例えばデータ圧縮率が1/8の場合について説明すると、ここでのデータ転送速度は、上記標準のCD−DAのフォーマットのデータ転送速度(75セクタ/秒)の1/8(9.375セクタ/秒)に低減されている。
次に、メモリ64は、データの書込及び読出がシステムコントローラ57により制御され、ATCエンコーダ63から供給されるATCデータを一時的に記憶しておき、必要に応じてディスク上に記録するためのバッファメモリとして用いられている。すなわち、例えばデータ圧縮率が1/8の場合において、ATCエンコーダ63から供給される圧縮オーディオデータは、そのデータ転送速度が、標準的なCD−DAフォーマットのデータ転送速度(75セクタ/秒)の1/8、すなわち9.375セクタ/秒に低減されており、この圧縮データがメモリ64に連続的に書き込まれる。この圧縮データ(ATCデータ)は、前述したように8セクタにつき1セクタの記録を行えば足りるが、このような8セクタおきの記録は事実上不可能に近いため、後述するようなセクタ連続の記録を行うようにしている。この記録は、休止期間を介して、所定の複数セクタ(例えば32セクタ+数セクタ)からなるクラスタを記録単位として、標準的なCD−DAフォーマットと同じデータ転送速度(75セクタ/秒)でバースト的に行われる。
すなわちメモリ64においては、上記ビット圧縮レートに応じた9.375(=75/8)セクタ/秒の低い転送速度で連続的に書き込まれたデータ圧縮率1/8のATCオーディオデータが、記録データとして上記75セクタ/秒の転送速度でバースト的に読み出される。この読み出されて記録されるデータについて、記録休止期間を含む全体的なデータ転送速度は、上記9.375セクタ/秒の低い速度となっているが、バースト的に行われる記録動作の時間内での瞬時的なデータ転送速度は上記標準的な75セクタ/秒となっている。したがって、ディスク回転速度が標準的なCD−DAフォーマットと同じ速度(一定線速度)のとき、該CD−DAフォーマットと同じ記録密度、記憶パターンの記録が行われることになる。
メモリ64から上記75セクタ/秒の(瞬時的な)転送速度でバースト的に読み出されたATCオーディオデータすなわち記録データは、エンコーダ65に供給される。ここで、メモリ64からエンコーダ65に供給されるデータ列において、1回の記録で連続記録される単位は、複数セクタ(例えば32セクタ)からなるクラスタ及び該クラスタの前後位置に配されたクラスタ接続用の数セクタとしている。このクラスタ接続用セクタは、エンコーダ65でのインターリーブ長より長く設定しており、インターリーブされても他のクラスタのデータに影響を与えないようにしている。
エンコーダ65は、メモリ64から上述したようにバースト的に供給される記録データについて、エラー訂正のための符号化処理(パリティ付加及びインターリーブ処理)やEFM符号化処理などを施す。このエンコーダ65による符号化処理の施された記録データが磁気ヘッド駆動回路66に供給される。この磁気ヘッド駆動回路66は、磁気ヘッド54が接続されており、上記記録データに応じた変調磁界を光磁気ディスク1に印加するように磁気ヘッド54を駆動する。
また、システムコントローラ57は、メモリ64に対する上述の如きメモリ制御を行うとともに、このメモリ制御によりメモリ64からバースト的に読み出される上記記録データを光磁気ディスク1の記録トラックに連続的に記録するように記録位置の制御を行う。この記録位置の制御は、システムコントローラ57によりメモリ64からバースト的に読み出される上記記録データの記録位置を管理して、光磁気ディスク1の記録トラック上の記録位置を指定する制御信号をサーボ制御回路56に供給することによって行われる。
次に再生系について説明する。この再生系は、上述の記録系により光磁気ディスク1の記録トラック上に連続的に記録された記録データを再生するためのものであり、光学ヘッド53によって光磁気ディスク1の記録トラックをレーザ光でトレースすることにより得られる再生出力がRF回路55により2値化されて供給されるデコーダ71を備えている。このとき光磁気ディスクのみではなく、いわゆるコンパクトディスク(CD:Compact Disc、商標)と同じ再生専用光ディスクの読み出しも行うことができる。
デコーダ71は、上述の記録系におけるエンコーダ65に対応するものであって、RF回路55により2値化された再生出力について、エラー訂正のための上述の如き復号化処理やEFM復号化処理などの処理を行い、上述のデータ圧縮率1/8のATCオーディオデータを、正規の転送速度よりも速い75セクタ/秒の転送速度で再生する。このデコーダ71により得られる再生データは、メモリ72に供給される。
メモリ72は、データの書込及び読出がシステムコントローラ57により制御され、デコーダ71から75セクタ/秒の転送速度で供給される再生データがその75セクタ/秒の転送速度でバースト的に書き込まれる。また、このメモリ72は、上記75セクタ/秒の転送速度でバースト的に書き込まれた上記再生データがデータ圧縮率1/8に対応する9.375セクタ/秒の転送速度で連続的に読み出される。
システムコントローラ57は、再生データをメモリ72に75セクタ/秒の転送速度で書き込むとともに、メモリ72から上記再生データを上記9.375セクタ/秒の転送速度で連続的に読み出すようなメモリ制御を行う。また、システムコントローラ57は、メモリ72に対する上述の如きメモリ制御を行うとともに、このメモリ制御によりメモリ72からバースト的に書き込まれる上記再生データを光磁気ディスク1の記録トラックから連続的に再生するように再生位置の制御を行う。この再生位置の制御は、システムコントローラ57によりメモリ72からバースト的に読み出される上記再生データの再生位置を管理して、光磁気ディスク1若しくは光磁気ディスク1の記録トラック上の再生位置を指定する制御信号をサーボ制御回路56に供給することによって行われる。
メモリ72から9.375セクタ/秒の転送速度で連続的に読み出された再生データとして得られるATCオーディオデータは、ATCデコーダ73に供給される。このATCデコーダ73は、記録系のATCエンコーダ63に対応するもので、例えばATCデータを8倍にデータ伸張(ビット伸張)することで16ビットのディジタルオーディオデータを再生する。このATCデコーダ73からのディジタルオーディオデータは、D/A変換器74に供給される。
D/A変換器74は、ATCデコーダ73から供給されるディジタルオーディオデータをアナログ信号に変換して、アナログオーディオ出力信号Aoutを形成する。このD/A変換器74により得られるアナログオーディオ信号Aoutは、ローパスフィルタ(LPF)75を介して出力端子76から出力される。
次に、高能率圧縮符号化について詳述する。すなわち、オーディオPCM信号等の入力ディジタル信号を、帯域分割符号化(SBC)、適応変換符号化(ATC)及び適応ビット割当の各技術を用いて高能率符号化する技術について、図4以降を参照しながら説明する。
本発明に係る音響波形信号の符号化方法を実行する符号化装置(図3のエンコーダ63)では、図4に示すように、入力された信号波形110aを変換回路111aによって信号周波数成分110bに変換し、得られた各周波数成分110bを信号成分符号化回路111bによって符号化し、その後、符号列生成回路111cにおいて、信号成分符号化回路111bにて生成された符号化信号110cから符号列110dを生成する。
また、変換回路111aにおいては、図5に示すように、入力信号120aを帯域分割フィルタ112aによって2つの帯域に分割し、得られた2つの帯域の信号120b,120cをMDCT等を用いた順スペクトル変換回路112b,112cによりスペクトル信号成分120d,120eに変換する。なお、入力信号120aは、図4の信号波形110aに対応し、また、スペクトル信号成分120d、120eは図4の信号周波数成分110bに対応している。この図5に示す構成を有する変換回路111aでは、上記2つの帯域に分割された信号120b、120cの帯域幅が入力信号120aの帯域幅の1/2となっており、該入力信号120aが1/2に間引かれている。もちろん、当該変換回路111aとしては、この具体例以外にも多数考えられ、例えば、入力信号を直接、MDCTによってスペクトル信号に変換するものでも良いし、MDCTではなく、DFTやDCTによって変換するものであっても良い。また、いわゆる帯域分割フィルタによって信号を帯域成分に分割することも可能であるが、本発明に係る符号化方法においては、多数の周波数成分が比較的少ない演算量で得られる、上述のスペクトル変換によって周波数成分に変換する方法を採ると都合が良い。
また、信号成分符号化回路111bでは、図6に示すように、各信号成分130aを正規化回路113aによって所定の帯域毎に正規化するとともに、量子化精度決定回路113bにて信号成分130aから量子化精度情報130cを計算し、当該量子化精度情報130cに基づいて、正規化回路113aからの正規化信号130bを量子化回路113cが量子化する。なお、各信号成分130aは、図4の信号周波数成分110bに対応し、量子化回路113cの出力信号130dは、図4の符号化信号110cに対応している。ただし、この出力信号130dには、量子化された信号成分に加え、上記正規化の際の正規化係数情報や上記量子化精度情報も含まれている。
一方、上述したような符号化装置によって生成された符号列からオーディオ信号を再現する復号化装置(図3の例ではデコーダ73)においては、図7に示すように、符号列分解回路114aによって符号列140aから各信号成分の符号140bが抽出され、それらの符号140bから信号成分復号化回路114bによって各信号成分140cが復元され、この復元された信号成分140cから、逆変換回路114cによって音響波形信号140dが再現される。
この復号化装置の逆変換回路114cは、図8に示すように構成されるものであって、図5に示した変換回路に対応したものである。この図8に示す逆変換回路114cにおいて、逆スペクトル変換回路115a,115bでは、それぞれ供給された入力信号150a,150bに逆スペクトル変換を施して各帯域の信号を復元し、帯域合成フィルタ115cではこれら各帯域信号を合成する。入力信号150a,150bは、図7の信号成分復号化回路114bによって各信号成分が復元された信号140cに対応している。また、帯域合成フィルタ115cの出力信号150eは、図7の音響波形信号140dに対応している。
また、図7の信号成分復号化回路114bは、図9に示すように構成されるものであり、図7の符号列分解回路114aからの符号140bすなわちスペクトル信号に対して、逆量子化と逆正規化処理とを施すものである。この図9に示す信号成分復号化回路114bにおいて、逆量子化回路116aでは入力された符号160aを逆量子化し、逆正規化回路116bでは上記逆量子化により得られた信号160bを逆正規化して信号成分160cを出力する。符号160aは、図7の符号列分解回路114aからの符号140bに対応し、出力信号成分160cは図7の信号成分140cに対応している。
なお、上述のような符号化装置の図5に示した変換回路によって得られるスペクトル信号は、例えば図10に示すようなものとなる。この図10に示す各スペクトル成分は、MDCTによるスペクトル成分の絶対値を、レベルを〔dB〕に変換して示したものである。すなわちこの信号符号化装置においては、入力信号を所定の変換ブロック毎に64個のスペクトル信号に変換しており、それを図中〔1〕から〔8〕にて示す8つの帯域(以下、これを符号化ユニットと呼ぶ)にまとめて正規化及び量子化している。このとき量子化精度を周波数成分の分布の仕方によって上記符号化ユニット毎に変化させるようにすれば、音質の劣化を最小限に抑えた聴覚的に効率の良い符号化が可能となる。
次に、図11には、上述の方法で符号化した場合の符号列の構成例を示す。
この構成例の符号列は、各変換ブロックのスペクトル信号を復元するためのデータが、それぞれ所定のビット数で構成されるフレームに対応して符号化された情報が配置されている。各フレームの先頭(ヘッダ部)には、先ず同期信号及び符号化されている符号化ユニット数等の制御データを一定のビット数で符号化した情報が、次に各符号化ユニットの量子化精度データと正規化係数データをそれぞれ低域側の符号化ユニットから符号化した情報が、最後に各符号化ユニット毎に、上述の正規化係数データ及び量子化精度データに基づいて正規化及び量子化されたスペクトル係数データを低域側から、符号化した情報が配置されている。
この変換ブロックのスペクトル信号を復元するために実際に必要なビット数は、上記符号化されている符号化ユニットの数、及び各符号化ユニットの量子化精度情報が示す量子化ビット数によって決まり、その量は各フレーム毎に異なっていても良い。各フレームの先頭から上記必要なビット数のみが再生時に意味を持ち、各フレームの残りの領域は空き領域となり、再生信号には影響を与えない。通常は、音質向上のためにより多くのビットを有効に使用して、各フレームの空き領域がなるべく小さくなるようにする。
この例のように、各変換ブロックを一定のビット数のフレームに対応させて符号化しておくことにより、例えば、この符号列を光ディスク等の記録媒体に記録した場合、任意の変換ブロックの記録位置を容易に算出できるので、任意の箇所から再生を行う、いわわゆるランダム・アクセスを容易に実現することが可能である。
次に、図12と図13には、図11に示したフレームのデータを記録媒体等に例えば時系列的に配置する場合の記録フォーマットの一例を示す。図12には、例えばL(左),R(右)の2チャネルの信号をフレーム毎に交互に配置した例を示し、図13には、L,Rの2チャネルの信号を(L+R)/2して生成した1チャネルの信号(L,Rの2チャネルから生成されたモノラルの信号)をフレーム毎に配置した例を示している。
これら図12のような記録フォーマットを採用することで、同一の記録媒体に対してL,Rの2チャネルの信号を記録することができ、また、図13のように、フレーム毎に上記(L+R)/2の1チャネル分のみを配置する記録フォーマットを採用する場合には、図12のようにL,Rの2チャネルをフレーム毎に交互に配置する記録フォーマットに比べて、倍の時間の信号の記録再生が可能になるとともに、再生回路を複雑にすることなく容易に再生することも可能になる。
なお、図12のような記録フォーマットを例えば標準時間モードと呼ぶとすると、図13のように、少ないチャネル数で長時間の信号の記録再生を可能にする記録フォーマットは、上記標準時間モードの倍の時間の記録再生ができる長時間モードと呼ぶことができる。また、図12の例においても、各フレームに対してL、Rの2チャネルでなく、モノラルの1チャネルのみを記録するようにすれば、L、Rの2チャネルを記録する場合よりも倍の時間の信号を記録できることになり、この場合も長時間モードと呼ぶことができる。
上述の説明では、符号化方法として図11にて説明した手法のみを述べてきたが、この図11で説明した符号化方法に対して、さらに符号化効率を高めることも可能である。
例えば、量子化されたスペクトル信号のうち、出現頻度の高いものに対しては比較的短い符号長を割り当て、出現頻度の低いものに対しては比較的長い符号長を割り当てる、いわゆる可変長符号化技術を用いることによって、符号化効率を高めることができる。
また例えば、入力信号を符号化する際の上記所定の変換ブロック、すなわちスペクトル変換のための時間ブロック長を長くとるようにすれば、量子化精度情報や正規化係数情報といったサブ情報の量を1ブロック当たりで相対的に削減でき、また、周波数分解能も上がるので、周波数軸上での量子化精度をより細やかに制御できるようになり、符号化効率を高めることが可能となる。
さらにまた、本件出願人によるPCT出願国際公開WO94/28633の明細書及び図面には、スペクトル信号成分から聴感上特に重要なトーン性の信号成分を分離して、他のスペクトル信号成分とは別に符号化する方法が提案されており、これを用いれば、オーディオ信号等を聴感上の劣化を殆ど生じさせずに高い圧縮率で効率的に符号化することが可能になる。
ここで、図14を用いて、上記トーン性の信号成分を分離して符号化する方法を説明する。この図14の例では、スペクトル信号成分からそれぞれトーン性の信号成分としてまとまった3個のトーン成分を分離した様子を示しており、これらの各トーン成分を構成する各信号成分は、各トーン成分の周波数軸上のそれぞれの位置データとともに符号化される。
一般に、音質を劣化させないためには少数のスペクトルにエネルギが集中する上記トーン成分の各信号成分を非常に高い精度で量子化する必要があるが、トーン成分を分離した後の各符号化ユニット内のスペクトル係数(非トーン性のスペクトル信号成分)は聴感上の音質を劣化させることなく、比較的少ないステップ数で量子化することができる。
図14では、図を簡略にするために、比較的少数のスペクトル信号成分しか図示していないが、実際のトーン成分では、数十のスペクトル信号成分から構成される符号化ユニット内の数個の信号成分にエネルギが集中するので、そのようなトーン成分を分離したことによるデータ量の増加は比較的少なく、これらトーン成分を分離することによって、全体として、符号化効率を向上させることができる。
次に、図15には、図14を用いて説明した方法で符号化した場合の符号列の構成例を示す。この構成例では、各フレームの先頭にはヘッダ部として、同期信号及び符号化されている符号化ユニット数等の制御データを所定のビット数で符号化した情報が配置され、次にトーン成分についてのデータであるトーン成分データを符号化した情報が配置されている。
トーン成分データとしては、最初にトーン成分内の各信号成分の個数を符号化した情報が、次に各トーン成分の周波数軸上の位置情報を、その後はトーン成分内での量子化精度データ、正規化係数データ、正規化及び量子化されたトーン性の信号成分(スペクトル係数データ)をそれぞれ符号化した情報が配置されている。
上記トーン成分データの次には、元のスペクトル信号成分から上記トーン性の信号成分を差し引いた残りの信号(ノイズ性の信号成分ということもできる)のデータが符号化された情報を配置している。これには、各符号化ユニットの量子化精度データと正規化係数データ及び各符号化ユニット毎に上述の正規化係数データ及び量子化精度データに基づいて正規化及び量子化されたスペクトル係数データ(トーン成分以外の信号成分)を、それぞれ低域側の符号化ユニットから符号化した情報が配置されている。ただし、ここでトーン性及びそれ以外の信号成分のスペクトル信号成分(係数データ)は可変長の符号化がなされているものとする。
図16には、上記各信号成分からトーン性の信号成分を分離する場合の、図4の信号成分符号化回路111bの具体例を示す。
この図16に示す信号成分符号化回路111bにおいて、図4の変換回路111aから供給された信号成分170a(110b)は、トーン成分分離回路117aに送られる。信号成分170aは、トーン性の信号成分とそれ以外の信号成分(非トーン性の信号成分)とに分けられ、トーン性の信号成分170bはトーン成分符号化回路117bに、非トーン性の信号成分170cは非トーン成分符号化回路117cに送られる。これらトーン成分符号化回路117bと非トーン成分符号化回路117cでは、それぞれ供給された信号成分を符号化し、それぞれ得られた出力信号170dと170eを出力する。なお、トーン成分符号化回路117bでは、上記トーン性の信号成分の符号化と同時に、図15のトーン成分データを構成する各情報の生成をも行う。トーン成分符号化回路117bと非トーン成分符号化回路117cにおける信号符号化のための構成は、それぞれ図6と同じである。
図17には、上記各信号成分からトーン性の信号成分を分離した場合の、図7の信号成分復号化回路114bの具体例を示す。
この図17に示す信号成分復号回路回路114bにおいて、図7の符号列分解回路114aから供給された符号140bは、上記トーン成分データ180aと非トーン性の信号成分180bからなり、これらデータ及び信号成分はそれぞれ対応するトーン成分復号化回路118aと非トーン成分復号化回路118bに送られる。上記トーン成分復号化回路118aでは、図15に示したようなトーン成分データからトーン性の信号成分を復号化し、得られたトーン性の信号成分180cを出力する。また、上記非トーン成分復号化回路118bでは、非トーン性の信号成分を復号化し、得られた非トーン性の信号成分180dを出力する。これらトーン性の信号成分180cと非トーン性の信号成分180dは、共にスペクトル信号合成回路118cに送られる。このスペクトル信号合成回路118cでは、上記位置データに基づいて上記トーン性の信号成分と非トーン性の信号成分とを合成し、得られた信号成分180eを出力する。なお、トーン成分復号化回路118aと非トーン成分復号化回路118bにおける信号復号化のための構成は、それぞれ図9と同じである。
ここで、図18には、上述のようにして符号化された信号を、例えば光磁気ディスクに記録する場合のフォーマット例を示す。なお、この図18の例では、全部で例えば4個(4曲)分のオーディオ信号データが記録されているとする。
この図18において、当該ディスクには、これら全部で4個分のオーディオ信号データとともに、当該オーディオ信号データの記録、再生を行う場合に使用する管理データも記録されている。管理データ領域の0番地、1番地には、それぞれ先頭データ番号、最終データ番号が記録されている。図18の例では、上記先頭データ番号の値として1が記録され、最終データ番号の値として4が記録されている。これにより、このディスクには1番目から4番目までの4個のオーディオ信号データが記録されていることがわかる。
管理データ領域の5番地から8番地までには、「各オーディオ信号データがディスクのどこに記録されているかを示すデータ」すなわちアドレス情報が、当該管理データ領域内のどこに記録されているのかを示すアドレス格納位置の情報が記録されている。このアドレス格納位置の情報はオーディオ信号データの再生順(曲の演奏順)に記録されており、1番目に再生されるオーディオ信号データのための上記アドレス格納位置の情報は5番地に、2番目に再生されるオーディオ信号データのための上記アドレス格納位置の情報は6番地に、といったようになっている。このような管理データを用いることにより、例えば、1番目と2番目の再生の順番を入れ替えることは、実際のオーディオ信号データの記録位置を入れ替える代わりに5番地と6番地の内容を入れ替えることによって容易に実現できる。また、管理データ領域内には、将来的な拡張が可能なように予備領域がとってあり、そこには0データが記録されるようになっている。
さてここで、ある符号化手法(以下、これを旧規格又はAコーデックと呼ぶことにする)が開発され、これを用いてディスクへの記録フォーマットが規格化され、その後、当該Aコーデックを拡張した、より高能率な符号化手法(以下、これを新規格又はBコーデックと呼ぶことにする)が開発されたとする。このような場合、上記Bコーデックにより符号化された信号は、上記Aコーデックによる信号が記録されるのと同一種類のディスクに記録できるようになる。このようにBコーデックによる信号もAコーデックの場合同様に記録できると、当該ディスクに対してより長時間の信号記録が可能になったり、より高音質の信号記録が可能になるので、ディスクの用途が広がり便利である。
上述した図11を用いて説明した符号化方法をAコーデックと考えた場合、例えば前述したように、量子化されたスペクトル信号のうち出現頻度の高いものに対しては比較的短い符号長を割り当て、出現頻度の低いものに対しては比較的長い符号長を割り当てるいわゆる可変長符号化技術を用いた符号化方法をBコーデックと考えることができる。同様に、例えば前述したように、入力信号を符号化する際の変換ブロック長を長くとるようにして量子化精度情報や正規化係数情報等のサブ情報量を1ブロック当たりで相対的に削減するような符号化方法をBコーデックと考えることもできる。また、例えば前述したように、スペクトル信号成分をトーン成分と非トーン成分とに分けて符号化する符号化方法をBコーデックと考えることもできる。さらに、それら高能率な符号化方法を組み合わせたものをBコーデックと考えることもできる。
上述のようにAコーデックを拡張したBコーデックにより符号化された信号をディスクに記録するような場合には、図18に示したような旧規格(Aコーデック)のみに対応していたディスクでは予備領域としていた2番地に、図19に示すようなモード指定情報を記録するようにする。当該モード指定情報は、値が0のとき上記旧規格(Aコーデック)に基づいた記録が行われていることを示し、値が1のときAコーデック又はBコーデックに基づいた記録が行われていることを示すものである。したがって、ディスク再生時に、当該モード指定情報の値が1になっていれば、当該ディスクにはBコーデックに基づいた記録が行われている可能性があることを判別できる。
また、このように当該Bコーデックによる信号をディスクに記録する場合には、図18で示したような各オーディオ信号データのアドレス情報(スタートアドレス及びエンドアドレス)を記録する領域の次に設けてあった予備領域の一つを、コーデック指定情報用の領域として使用する。当該コーデック指定情報は、値が0のとき上記スタートアドレス及びエンドアドレスからなるアドレス情報にて指定されるオーディオ信号データが、上記旧規格(Aコーデック)に基づいて符号化されていることを示し、値が1のとき上記アドレス情報にて指定されるオーディオ信号データが新規格(Bコーデック)に基づいて符号化されていることを示すものである。これにより、Aコーデックにより符号化されたオーディオ信号データとBコーデックにより符号化されたオーディオ信号データを同一ディスク上に混在させて記録できるとともに、当該ディスクは新規格(Bコーデック)にも対応した再生装置(以下、新規格対応再生装置と呼ぶ)によって再生可能となる。
ところが、この図19のように、AコーデックとBコーデックのデータが混在して記録されたディスクは、Aコーデックすなわち旧規格にて記録がなされたものか、Bコーデックすなわち新規格にて記録がなされたのもであるのかを、外見上で判別することはできない。したがって、使用者はこのディスクを旧規格対応再生装置で再生してしまう可能性がある。このとき、旧規格対応再生装置は、上記旧規格では、前述の図18のように常に値0と定められていた2番地の内容をチェックせず、当該ディスクに記録されている信号は全てAコーデックによるものであると解釈して再生を行おうとするため、再生できなかったり、乱雑で出鱈目な雑音を発生させたりして、使用者を混乱に陥れる危険性が高い。
本件出願人はこのような実情に鑑み、日本特許出願公開平10−22935の明細書及び図面において、追加された規格(新規格)で記録を行う場合には、「記録されている信号の一部は、この規格のみに対応した再生手段では再生できない。」との事実を知らせる信号を旧規格(Aコーデック)に基づいて記録するとともに、旧規格対応再生装置で再生した場合には、旧規格(Aコーデック)に基づいて記録された信号以外には再生させないようにして装置の使用者に混乱を招いたり、雑音を発生させたりすることを防止する方法を提案している。また、この日本特許出願公開平10−22935の明細書及び図面においては、予め記録媒体に旧規格(Aコーデック)によるメッセージ信号を記録しておき、新規格で記録を行う場合には再生管理情報の内容を操作することで旧規格対応再生装置で再生した場合には上記メッセージ信号が再生されるようにすることによって、安価な新規格対応の記録機器で容易に記録ができるようにする方法、及び、旧規格対応再生装置で再生した場合には新規格で記録された部分に対応してメッセージ信号が再生されるようにすることにより、実際にどの曲が旧規格で記録されているのかを旧規格対応再生装置の使用者に知らせるようにする方法に関しても提案を行っている。すなわち、日本特許出願公開平10−22935の明細書及び図面においては、旧規格対応再生装置自身が再生できないデータを誤って再生しないようにするとともに、使用者に対してその記録媒体の内容を知らせるメッセージを伝えることによって旧規格対応再生装置の使用者を混乱に陥れることを防止する方法を提案している。
ここで、図20には、日本特許出願公開平10−22935の明細書及び図面に記載の方法により、ディスクに記録を行った例を示している。この図20の例では、新規格(Bコーデック)に関連する管理データは旧規格(Aコーデック)に関連する管理データとは分離されて記録されている。
すなわち図20において、例えば旧規格対応再生装置は、先ず0番地の旧規格先頭データ番号と1番地の旧規格最終データ番号(これらは図18の先頭データ番号及び最終データ番号に対応する)を読み取る。この図20の例では、これら旧規格先頭データ番号と旧規格最終データ番号から、このディスクに記録されているデータがデータ番号1から1までの1個だけであると解釈できる。次に、その1個のデータがディスク上のどこに記録されているのかを知るために、上記旧規格対応再生装置は、旧規格に則って5番地(すなわちアドレス格納位置情報)の内容を調べて、そのアドレス・データの入っている管理領域内の位置を知る。次に、上記旧規格対応再生装置は、その5番地のアドレス格納位置情報に示される番地(116番地)からの内容を調べることによって、データ番号0のオーディオ信号が記録されている位置(200000番地)を知る。
ここで、当該旧規格対応再生装置は、118番地に記録されているコーデック指定情報を無視するが、日本特許出願公開平10−22935の明細書及び図面に記載の方法では、データ番号0のオーディオ信号は実際にAコーデックで符号化されているので問題はない。データ番号0のオーディオ信号の内容は「このディスクの信号を再生するためには、Bコーデック対応再生機をご使用下さい。」というメッセージであり、この信号が再生されることで、旧規格対応再生装置の使用者の混乱を回避できる。
一方、旧規格と新規格の両方に対応した再生装置(すなわち新規格対応再生装置)がこのディスクを再生する場合には、新規格に基づいて、先ず図20の2番地のモード指定情報の内容がチェックされる。これにより当該新規格対応再生装置はこのディスクがモード指定情報の値が1の新規格(Bコーデック)に基づいて記録されている可能性があることを知る。そこで、当該新規格対応再生装置は、モード指定情報が1の場合の規定に基づいて、0番地の旧規格先頭データ番号と1番地の旧規格最終データ番号を無視し、3番地の新規格先頭データ番号と4番地の新規格最終データ番号の内容から、このディスクで再生すべきデータはデータ番号2から5までの4個であると解釈して再生を行う。すなわち、この場合には、旧規格対応再生装置のためのメッセージ(データ番号0の信号)は再生されない。ただし、このディスクの使用者への注意のために、このメッセージを新規格対応再生装置でも再生することができ、この場合には、3番地の新規格先頭データ番号の値を1にしておけば良い。
以上の説明から明らかなように、上述の日本特許出願公開平10−22935の明細書及び図面に記載の方法を用いれば、新規格対応再生装置でディスクに記録されている所望のオーディオ信号データを再生できるばかりなく、旧規格対応再生装置では、ディスク再生に関する注意のメッセージのみが再生され、使用者に不要な混乱を与えることを回避することができる。
しかしながら、上述の方法では旧規格対応再生装置で再生できるのはメッセージ信号であり、本当に再生したい信号そのものではない。
そこで、本件出願人は、日本特許出願平9−42514号の明細書及び図面において、以下に説明するようなことを行うことによって、同一のディスク内にAコーデックとBコーデックによる信号が記録されている場合において、Aコーデックによる信号については旧規格対応再生装置でも再生できるようにするとともに、新規格対応再生装置を用いればAコーデックとBコーデックの両方の信号を再生できるようにしている。
また、同一のディスク内に、旧規格(Aコーデック)の信号と新規格(Bコーデック)の信号のように異なる規格の信号を同時に記録するようにすると、それぞれに対して割り当てられる記録領域が減ることになるため、記録再生される信号の品質(オーディオ信号の場合は音質)を維持することが困難になることも考えられるが、日本特許出願平9−42514号の明細書及び図面に記載の技術では、この音質低下をも軽減可能にしてる。
これらのことを実現するために、日本特許出願平9−42514号の明細書及び図面に記載の技術では、例えば図13に示した記録フォーマットや図12にてモノラルの信号を記録する場合のように、少ないチャネル数であれば長時間の記録再生が可能であるように予め規定されている符号列に対して、各フレームに割当可能な総ビット数よりも少ないビット数を上記少数チャネルに割り当てるようにする。言い換えれば、例えばAコーデックについてはフレーム内に空き記録領域ができるように各フレームに割当可能な総ビット数よりも少ないビット数にて符号化を行うようにし、これにより得られたフレーム内の空き記録領域に、旧規格対応再生装置が再生しないチャネルの信号、すなわちBコーデックの信号を記録するようにすることによって、長時間モードでの多チャネル記録再生(AコーデックとBコーデックの両信号の記録再生)を可能にしている。なお、上記空き記録領域を作る方法としては、上記割当ビット数の調整の他に、上記Aコーデックの符号化方法で符号化するチャネルの帯域を狭めるようにすることも可能である。
ここで、上述したように、1フレームに割当可能なビット数よりも少ないビット数でAコーデックとBコーデックの信号を符号化した場合は、1フレームの全ビットをAコーデックの符号化のために割り当てた場合に比較して当該Aコーデックの符号化のために割り当てられるビット数が減ってしまうため、旧規格対応再生装置で再生した場合の音質は低下してしまうことになる。しかし、日本特許出願平9−42514号の明細書及び図面に記載の技術によれば、Bコーデックの符号化方法として長時間の変換ブロックを使用するなど、Aコーデックの符号化方法よりも符号化効率の良い方法を採用しているため、Bコーデックの符号化方法のために利用するビット数が比較的少なくて済み、Aコーデックの符号化方法に利用できるビット数を比較的多くとれるので、この音質低下の程度を軽微なものに留めることが可能である。
すなわち、日本特許出願平9−42514号の明細書及び図面に記載の技術では、旧規格対応再生装置が再生しないチャネルの信号すなわちBコーデックの信号を、当該旧規格対応再生装置が再生するチャネルの信号(Aコーデックの信号)よりも効率の良い方法で符号化することにより、上述のように多チャネル化することで旧規格対応再生装置が再生する信号に割り当てられるビット数を少なくしたことによる音質の低下を、最小限に抑えることが可能である。実際に符号化効率を上げるための方法としては、前述したように、変換ブロックの長時間化、可変長符号の採用、トーン性の信号成分の分離等、種々の方法がある。これらは全て上記技術に含まれるが、以下では、説明を簡単にするために、このうち時間ブロック長の長時間化、可変長符号、トーン性成分分離を採用した場合の例について取り上げる。
図21には、上述した日本特許出願平9−42514号の明細書及び図面に記載の技術を適用してできた符号列の一具体例を示す。
この図21の例において、一定のビット数で構成される各フレームは、それぞれ2つの領域に分離されており、図21の領域1や領域3等には、例えば(L+R)/2のチャネルの信号が上記Aコーデックの符号化方法で符号化されて記録されており、また図中斜線が施されている領域2や領域4等には(L−R)/2のチャネルの信号が上記Bコーデックの符号化方法で符号化されて記録されている。上記領域2や領域4が上記空き記録領域に対応している。
なお、上記Aコーデックの符号化方法は、例えば前述した図11にて説明した符号化方法である。一方、Bコーデックの符号化方法は、例えばAコーデックの2倍の変換ブロック長でスペクトル信号成分に変換した信号を図15で示した符号化方法で符号化したものを例に挙げることができる。ただし、このときのBコーデックの変換ブロック長はAコーデックの変換ブロック長の2倍になっており、このため、その変換ブロックに対応する符号は2つのフレームに跨って記録されているとする。
また、この図21の例において、上記Aコーデックの符号化方法では固定長の符号化方法を採用しており、したがって当該Aコーデックの符号化方法により得られた符号列(以下、Aコーデック符号列と呼ぶ)が使用するビット数は容易に算出することができる。このようにAコーデック符号列が使用するビット数を算出できれば、Bコーデックの符号化方法による符号列(以下、Bコーデック符号列と呼ぶ)の先頭位置をも容易に知ることができる。なお、別の方法として、Bコーデック符号列は、フレームの最後部から開始することにしてもよい。このようにしておくと、Aコーデックの符号化方法に例えば可変長の符号化方法を採用した場合にも、Bコーデック符号列の先頭位置を容易に知ることができるようになる。このようにBコーデック符号列の先頭位置を容易に算出できるようにしておくと、これらAコーデックとBコーデックの両方に対応した再生装置(新規格対応再生装置)が、両者の符号列を迅速に並行して処理することができるようになり、高速処理が可能となる。
また、Aコーデックの符号化方法が図11のように符号化ユニット数の情報を含むものである場合において、前述したように、他チャネルの信号を記録するための領域(空き記録領域)を確保するために当該Aコーデックの符号化方法で符号化するチャネルの帯域を狭めるようにした場合、例えば高域側の量子化精度データ、正規化係数データを省略することができて都合が良い。この場合においても、Aコーデックの符号化方法での符号化に使用されたビット数は容易に計算することが可能である。
図21の例においては、上述したように、(L+R)/2のチャネルの信号をAコーデック符号列として記録し、また(L−R)/2のチャネルの信号をBコーデック符号列として記録しているため、例えばAコーデックの信号が記録された領域のみを復号すれば(L+R)/2のモノラルの信号再生が可能となり、一方、Aコーデックの信号が記録された領域とBコーデックの信号が記録された領域の両者を復号し、それらの差を計算すればR(右)チャネルの信号が生成でき、和を計算すればL(左)チャネルの信号を生成でき、ステレオでの再生が可能となる。
この図21のような符号列が記録された記録媒体に対して、上記旧規格対応再生装置は、Bコーデックの符号化方法で符号化されている領域については無視することになるので、上記の符号列が記録された記録媒体からモノラル信号を再生することができる。一方、この図21に示した符号列が記録された記録媒体に対して、Aコーデックの符号の復号回路とBコーデックの符号の復号回路を搭載した再生装置(新規格対応再生装置)は、ステレオ信号を再生できるようにすることが可能である。このように、旧規格対応再生装置が既に普及してしまった後に、新規格対応再生装置がステレオ再生するための規格として図21に示すような符号化方法を導入したとしても、旧規格対応再生装置がモノラル信号の再生をすることは可能となる。なお、上記Aコーデックの符号を復号するための復号回路は、比較的小規模のハードウェアで実現できるため、そのような復号回路を搭載した再生装置は比較的安価に製造することができる。
次に、図22には、上述した図21の符号列を生成する符号化装置の具体的な構成を示す。
この図22において、Lチャネルの入力信号190a及びRチャネルの入力信号190bは、チャネル変換回路119aによって、(L+R)/2に相当する信号190c及び(L−R)/2に相当する信号190dに変換される。(L+R)/2信号190cは第1の符号化回路119bに、(L−R)/2信号190dは第2の符号化回路119cに送られる。
上記第1の符号化回路119bは図6の構成を有する図4の信号成分符号化回路111bに相当し、上記Aコーデックの符号化方法が適用されるものである。一方、上記第2の符号化回路119cは、上記第1の符号化回路119bの倍の変換ブロック長を持ち、図16の構成を有する図4の信号成分符号化回路111bに相当し、上記Bコーデックの符号化方法が適用されるものである。これら第1の符号化回路119bのAコーデック符号列190eと第2の符号化回路119cのBコーデック符号列190fは、共に符号列生成回路119dに供給される。
この符号列生成回路119dは、符号列190e及び190fから、図21に示した符号列を生成し、出力符号列信号190gとして出力する。
図23には、図22の符号列生成回路119dが図21の符号列を生成する際の処理の流れを示す。
この図23において、ステップS101では、フレーム番号Fが1に初期化され、ステップS102では第1の符号化回路119bからのAコーデック符号列190eを受信する。ステップS103では、フレーム番号Fが偶数か否かの判断を行い、偶数でないときにはステップS106に、偶数であるときにはステップS104に処理を進める。
ステップS104では、第2の符号化回路119cからのBコーデック符号列190fを受信する。次のステップS105では、符号列190eと190fとから、図21の符号列を合成する。
ステップS106では、全てのフレームについての処理が終了したか否かの判断を行い、終了したときは当該図23の処理を終わり、終了していないときには、ステップS107にてフレーム番号Fを1インクリメントしてステップS102に戻り、上述した処理を繰り返す。
なお、この図23の処理において、フレーム番号Fは1から始まるが、Bコーデックの符号化方法の処理単位はAコーデックの符号化方法の倍の2フレームが単位となるので、符号列の生成も2フレーム毎に行われる。
次に、図24には、上述した本発明の符号化方法を用いて生成された図21の符号列を復号する新規格対応再生装置の復号化装置の具体的な構成を示す。
この図24において、図21の符号列である入力符号列200aは、符号列分離回路120aによってAコーデック符号列200bとBコーデック符号列200cとに分離される。上記Aコーデック符号列200bは第1の復号化回路120bに、Bコーデック符号列200cは第2の復号化回路120cに送られる。
第1の復号化回路120bは図9の構成を有する図7の信号成分復号回路114bに相当し、Aコーデックの符号を復号するものである。一方、第2の復号化回路120cは第2の復号化回路120bの倍の変換ブロック長を持ち、図17の構成を有する図7の信号成分復号回路114bに相当し、Bコーデックの符号を復号するものである。これら第1の復号化回路120bにより復号された信号200dは(L+R)/2信号190cに相当し、第2の復号化回路120cにより復号された信号200eは(L−R)/2信号190dに相当する。
ここで、(L+R)/2信号200dと(L−R)/2信号200eとでは、それぞれ変換ブロック長が異なるため、その処理遅延時間には差がある。このため、第1の復号化回路120bからの(L+R)/2信号200dはメモリ回路120dに、第2の復号化回路120cからの(L−R)/2信号200eはメモリ回路120eに供給され、これらメモリ回路120dと120eによって、上記処理遅延時間差が吸収される。これらメモリ回路120dと120eをそれぞれ経由した(L+R)/2信号200f及び(L−R)/2信号200gは、チャネル変換回路120fに送られる。
このチャネル変換回路120fは、(L+R)/2信号200fと(L−R)/2信号200gを加算することでLチャネルの信号200hを生成し、また、(L+R)/2信号200fから(L−R)/2信号200gを減算することでRチャネルの信号200iを生成し、これらLチャネルとRチャネルの信号をそれぞれ出力する。
図25には、図24の符号列分離回路120aが図21の符号列を分離する際の処理の流れを示す。
この図25において、ステップS201では、フレーム番号Fが1に初期化され、ステップS202では、第1の復号化回路120bに送るためのAコーデック符号列の分離及び送信を行う。ステップS203では、フレーム番号Fが奇数か否かの判断を行い、奇数でないときにはステップS205に、奇数であるときにはステップS204に処理を進める。
ステップS204では、第2の復号化回路120cに送るためのBコーデック符号列の分離及び送信を行う。
ステップS205では、全てのフレームについての処理が終了したか否かの判断を行い、終了したときは当該図25の処理を終わり、終了していないときには、ステップS206にてフレーム番号Fを1インクリメントしてステップS202に戻り、上述した処理を繰り返す。
なお、この図25の処理において、フレーム番号Fは1から始まるが、Bコーデックの符号化方法の処理単位はAコーデックの符号化方法の倍の2フレームが単位となるので、符号列の分離も2フレーム毎に行われる。
以上の説明では、各フレームの空き記録領域に追加のチャネル信号(Bコーデックの信号)のみを記録する例について述べたが、前述の従来技術にて述べたように、ステレオ信号の種類によっては符号化により発生する量子化雑音が問題を起こすことがある。
以下、この問題を解決する本発明の実施の形態の方法について説明する。
図26には、当該本発明の方法を適用してできた実施の形態の符号列の一具体例を示す。この図26の例は、旧規格では(L+R)/2の1チャネルの信号(音響信号)の記録だけが可能であったのに対し、空き記録領域にチャネル構成データと追加チャネルの信号を記録することによって、新規格では(L+R)/2と追加チャネルを組み合わせた2チャネルの信号の記録も可能にしたフォーマットの例を示したものである。
ここで(L+R)/2に相当するチャネルをAチャネル、追加チャネルに相当するチャネルをBチャネルと表すことにする。実際に2チャネルの信号が記録されているのはAチャネルの信号の後にチャネル構成データを記録するスペースが確保され、なおかつ、そのチャネル構成データが0以外の値になっている場合である。Bチャネルの信号は(L−R)/2、L、Rの何れかの信号であり、チャネル構成データの値はこれらの何れが記録されているのかを示している。この例ではチャネル構成データの値が1の場合は(L+R)/2、チャネル構成データの値が2の場合はL、チャネル構成データの値が3の場合はRの信号がそれぞれ記録されるようになっている。また、チャネル構成データを値0に設定することにより、ユーザにAチャネルの音響信号のみを聞かせることが可能になる。
なお、チャネル構成データを値0に設定した場合には、フレームに割り当てられたビット数を全て使うことなくAチャネルのみを記録することも可能である。
図27には、図26に示した符号列を生成する本発明の実施の形態の符号化装置の構成例を示す。
この図27において、入力信号210aはLチャネルとRチャネルの信号であり、この入力信号210aは、チャネル変換回路121aによって、Aチャネルすなわち(L+R)/2に相当する信号210b及びBチャネルに相当する信号210cに変換される。Aチャネル信号210bは第1の符号化回路121bに、Bチャネル信号210cは第2の符号化回路121cに送られる。
第1の符号化回路121bではAチャネルの信号210bを符号化し、第2の符号化回路121cではBチャネルの信号210cを符号化する。これら第1の符号化回路121bからのAチャネル符号列210dと第2の符号化回路121cからのBチャネル符号列210eは、共に符号列生成回路121dに供給される。
この符号列生成回路121dは、符号列210d及び210eから、図26に示した符号列を生成し、出力符号列信号210hとして出力する。
ここで、当該図27の構成には、制御回路121eが設置されている。この制御回路121eは、符号化のモードを指定する入力信号210fと入力信号210aに応じて、チャネル変換回路121aから符号列生成回路121dまでの構成に対し、後述する図28及び図29のフローチャートのようにして図26の符号列を生成するように制御する制御信号210gを生成し、各構成要素に送る。制御信号210gには、ステレオモード、モノラルモードのどちらで符号化するかを指示する情報とBチャネルをどのモードで符号化するかを指示する情報、すなわち(L−R)/2,R,Lの何れの信号を符号化するのかを指示する情報が含まれる。
図28には、図27の構成において、制御回路121eの処理の流れを示す。
ここでの処理はフレーム単位で行われる。先ず、ステップS310ではAチャネルに(L+R)/2を設定し、ステップS302では図27の入力信号210fによりステレオモードか否かの判定を行い、ステレオモードでない場合は処理を終了する。ステレオモードの場合はステップS303に進む。このステップS303では、図27の入力信号210aのフレーム毎の信号エネルギを各チャネル毎に求め、LチャネルのエネルギをEl、RチャネルのエネルギをErとする。ステップS304ではエネルギElとErを比較し、ElとErの比(El/Er)が例えば30dBより小さければステップS305に進み、逆に30dB以上であればステップS308でBチャネルにRチャネルを設定する。ステップS305では同様にエネルギElとErを比較し、ErとElの比(Er/El)が30dBより小さければ、ステップS306でBチャネルに(L−R)/2を設定し、逆に大きければステップS307でBチャネルにLチャネルを設定する。ここで設定されたチャネル情報は、図27の制御信号210gとして出力される。この例ではL,Rチャネルのエネルギ比を30dBという値と比較することによりBチャネルのチャネル選択を行うようにしているが、エネルギの代わりに信号の振幅比等で比較しても良いし、30dBという値も量子化雑音のレベルなどに応じて変更しても良く、例えば10dBなどの値としても良い。
図29には、図27の構成において、制御信号210gに基づいて図26に示したような符号列を生成する際の処理の流れを示す。なお、この図29の例では、各フレーム当たり例えば200バイト分が割り当てられているとする。
この図29において、ステップS401では、記録再生を上述のようにステレオにて行うか否かを判断する。図27のモード指定信号210fが、ステレオモードを示しているときにはステップS402以降の処理に、ステレオモードでない方、すなわちモノラルモードが選ばれたときにはステップS405の処理に移行する。
この図29において、ステップS401にてステレオモードでの符号化が指示された場合のステップS402では、150バイトを使用して、上記Aチャネルすなわち(L+R)/2の信号を符号化する。次のステップS403では、1バイトを使用して上記チャネル構成データを生成して符号化する。その後、ステップS404では、49バイトを使用して上記Bチャネルの信号を符号化する。
ここで、チャネル構成データは、Bチャネルが(L−R)/2に設定されている場合には1、Lチャネルが設定されている場合には2、Rチャネルに設定されている場合には3がそれぞれ符号化される。
一方、ステップS401にてモノラルモードが選ばれた場合のステップS405では、200バイトを使用して、Aチャネルすなわち(L+R)/2の信号を符号化する。
次に図30には、図26に示したような符号列を復号する本実施の形態の復号化装置の一具体例を示す。
この図30において、図26の符号列である入力符号列220aは、符号列分離回路122aによってAチャネルの符号列220bとBチャネルの符号列220cとに分離される。上記Aチャネルの符号列220bはAチャネル符号列210dに相当し、上記Bチャネルの符号列220cは上記Bチャネルの符号列210eに相当する。上記Aチャネルの符号列220bは第1の復号化回路122bに、上記Bチャネルの符号列220cは第2の復号化回路122cに送られる。第1の復号化回路122bは上記Aチャネルの符号列220bを復号し、第2の復号化回路122cは上記Bチャネルの符号列220cを復号する。
ここで、第1の復号化回路122bにより復号されたAチャネル信号220dと第2の復号化回路122cにより復号されたBチャネル信号220eとでは、それぞれバイト長が異なるため、その処理遅延時間には差がある。このため、第1の復号化回路122bからのAチャネル信号220dはメモリ回路122dに、第2の復号化回路122cからのBチャネル信号220eはメモリ回路122eに供給され、これらメモリ回路122dと122eによって、上記処理遅延時間差が吸収される。これらメモリ回路122dと122eをそれぞれ経由したAチャネル信号220f及びBチャネル信号220gは、チャネル変換回路122fに送られる。
このチャネル変換回路122fは、上記Aチャネルすなわち(L+R)/2信号220fとBチャネル信号220gから音響信号を生成してそれぞれ出力する。
当該図30の構成では、符号列分解回路122aにて入力符号列220aから上記チャネル構成データも分離される。符号列分解回路122aでは、ステレオモードの場合には、上記チャネル分離データを分離し、符号列分離化122aからチャネル変換回路122fまでの構成にて上述のような復号処理動作を行うための制御信号220hを生成し、各構成要素に送る。一方、モノラルモードの場合には、符号列分離化122aからAチャネル符号220bのみが出力され、第1の復号化回路122b以降の構成にてモノラルの信号が再生される。
次に、図31には、図26に示した符号列を復号する図30の構成の処理の流れを示す。
この図31において、ステップS501では、入力符号列220aの第1の符号列すなわち上記Aチャネル符号列220bのバイト数L1を計算により求める。ステップS502では、このバイト数L1が200より小さいか否かの判断が行われる。L1が200より小さいときにはステップS503の以降の処理に進み、小さくない(L1=200)ときにはステップS505の処理に進む。ここで、ステップS502は、モノラルモードであるかステレオモードであるかの判定を行っている。すなわち、ステップS502は、旧規格で記録されているか、新規格で記録されているかの判定を、符号列のバイト数に基づいて行う。このように符号列のバイト数で判別することにより、フレーム毎若しくは数フレーム毎に、モードを変更することが可能になる。
なお、モノラルモードとステレオモードの判別は、図19に示したように、管理データ内にモード指定情報として埋め込むことも可能である。
ステップS503では、チャネル構成データの値が0か否かの判断を行い、0であるときにはステップS504に、0でないときにはステップS505に進む。
ステップS504では、AチャネルとBチャネルの信号を復号化させるための制御信号220hを生成して各構成要素に送り、これにより、上述のようにAチャネル符号列220bが第1の復号化回路122bにて復号され、Bチャネル符号列220cが第2の復号化回路122cにて復号される。また、ステップS505ではモノラルモードであるためAチャネル信号を復号化させるための制御信号220hを生成して各構成要素に送り、上述のようにAチャネル符号列220bのみが第1の復号化回路122bにて復号される。
図32には図30の符号列分離回路122aが復号化のステレオモードのときのチャネル設定を決定する方法の処理例を示す。
この図32において、先ずステップS601において、チャネル構成データが0か否かの判断を行う。チャネル構成データが0の場合はステップS602に進み、このステップS602にてLチャネル、Rチャネルと共にAチャネルを出力するものとして、図30の制御信号220hを生成する。
一方、ステップS601にてチャネル構成データが0でないと判断された場合には、ステップS603に進む。このステップS603ではチャネル構成データが1か否かの判断を行い、当該チャネル構成データが1であると判断した場合にはステップS604に進む。ステップS604では、Lチャネルとして(A+B)、Rチャネルとして(A−B)のチャネルをそれぞれ出力するものとして、図30の制御信号220hを生成する。
またステップS603にてチャネル構成データが1でないと判断した場合は、ステップS605に進む。このステップS605では、チャネル構成データが2であるか否かの判断を行う。このステップS605においてチャネル構成データが2であると判断した場合には、ステップS606に進み、このステップS606でLチャネルとしてBチャネル、Rチャネルとして(2A−B)のチャネルをそれぞれ出力するものとして図30の制御信号220hを生成する。
ステップS605にてチャネル構成データが2でないと判断した場合は、ステップS607に進む。このステップS607では、チャネル構成データが3か否かの判断を行う。このステップS607において、チャネル構成データが3であると判断した場合には、ステップS608に進み、このステップS608でLチャネルとして(2A−B)、RチャネルとしてBチャネルをそれぞれ出力するものとして図30の制御信号220hを生成する。ステップS607にてチャネル構成データが3でないと判断した場合は処理を終了する。
上述のようにして生成された制御信号220hがチャネル変換回路122fに送られることで、このチャネル変換回路122fからはステレオモードのときにはL,Rチャネルの信号が、モノラルモードのときにはモノラルの信号が出力されることになる。すなわち、チャネル構成データが0の場合は、上述のようにLチャネル、Rチャネルと共にAチャネルの信号を出力することでモノラルの信号が得られる。チャネル構成データが1の場合は、上述のように(A+B)にてLチャネルの信号が得られ、(A−B)にてRチャネルの信号が得られる。また、チャネル構成データが2の場合には、BチャネルからLチャネルの信号が得られ、(2A−B)にてRチャネルの信号が得られる。さらに、チャネル構成データが3である場合には、(2A−B)にてLチャネルの信号が得られ、BチャネルからRチャネルの信号が得られる。
本発明実施の形態の方法を用いて、前述した図1及び図2と同様に示す図33A,33Bのようなステレオ信号を処理する例について説明する。
この図33A,33Bは、ステレオ信号の左チャネル成分(L)及びステレオ信号の右チャネル成分(R)の時間軸波形をそれぞれ表し、図33C,33DはL,Rのチャネル成分を(L+R)/2=Aチャネルとし、例えばR=Bチャネルにチャネル変換した信号の時間軸波形をそれぞれ表している。
また、図33E,33Fは、上記(L+R)/2=Aチャネル,R=Bチャネルの信号をそれぞれ本発明実施の形態の上述した高能率符号化方法により符号化して復号化する際に生じる量子化雑音の様子を表し、図中N1とN2は(L+R)/2=Aチャネル,R=Bチャネルの信号を符号化する際に生じる量子化雑音成分の時間軸波形をそれぞれ表している。ここで、(L+R)/2=Aチャネルを符号化及び復号化した後の信号はA+N1、R=Bチャネルを符号化及び復号化した後の信号はB+N2でそれぞれ表すことができる。
図33G,33Hは(A+N1),(B+N2)の信号波形からステレオ信号のL,Rチャネルを分離した様子を示している。Lチャネルについては(2A−B)により生成し、RチャネルについてはBチャネルそのものである。
すなわち、この図33に示したようなステレオ信号を前述した従来技術で処理すると、既に述べたように符号化により生じる量子化雑音が問題となるが、本実施の形態の場合には、図33C,33Dに示すように、A=(L+R)/2とし、例えばR=Bのチャネルとし、RチャネルはBチャネルとして独立して符号化処理することにより、このRチャネルは他チャネルで生じる量子化雑音に影響されることがないため、良好な音質で再生することができる。LチャネルについてはRチャネルの信号レベルが小さいため他チャネルで生じる量子化雑音に影響されることがないため問題は生じない。一般にこのような方法で符号化を行う場合、Bチャネルに使用する情報を少なくする場合が多いが、本発明実施の形態による方法ではBチャネルとして信号レベルが小さいものを選ぶようにチャネル変換を行うため、Bチャネルを少ない情報で符号化しても音質劣化は殆ど生じない。
このように旧規格対応再生装置では少数のチャネル再生が可能で、新規格対応再生装置ではより多数のチャネル再生が可能であり、且つチャネル変換を最適に行い音質劣化を最小限に止めるような符号化方法、復号化方法、及び符号化された記録した媒体等は全て本発明の方法に含まれる。
また、ここでは、第1の符号化方式として全体を2つの帯域に分割した後、スペクトル変換して、そのスペクトル係数を正規化及び量子化して固定長で符号化する方式を採用し、第2の符号化方式として全体を2つの帯域に分割した後、スペクトル変換して、そのスペクトル係数をトーン成分とその他の成分に分離した後、各々を正規化及び量子化して可変長で符号化する方式を採用したが、これらの符号化方式としては、その他にも様々なものが考えられ、例えば、第1の符号化方式として、帯域分割してから帯域幅に応じて間引いた時系列信号を正規化及び量子化して固定長で符号化する方式を採用し、第2の符号化方式として、全帯域の時系列信号をスペクトル変換して、そのスペクトル係数を正規化及び量子化して符号化する方式を採用するようにしても良い。ただし、第2の符号化方式としては、既に述べたようにできる限り符号化効率の良い手法を採用することによって、旧規格対応再生装置が再生した場合の音質低下を軽微なものにすることが望ましい。
さらに、オーディオ信号を用いた場合を例にとって説明を行ったが、本発明の方法は旧規格対応再生装置が再生する信号が例えば画像信号である場合にも適用可能である。すなわち、例えば、旧規格の符号列として輝度信号が符号化されている場合に本発明の方法を用いて色差信号、色相信号を符号列に加えることが可能である。本発明におけるチャネルとは映像の場合の輝度信号、色差信号、色相信号を含んだものである。
なお以上、符号化されたビットストリームを記録媒体に記録する場合について説明を行ったが、本発明の方法はビットストリームを伝送する場合にも適用可能である。また、記録媒体としても、ランダムアクセス可能なものであれば、光ディスク等の記録媒体に限らず、半導体メモリ等も使用可能であることは言うまでもない。
産業上の利用可能性
以上の説明からも明らかなように、本発明の信号符号化方法及び装置においては、複数の入力チャネルの信号から生成した第1の信号を符号化し、一部のチャネルと他のチャネルの信号レベルに基づいて、一部のチャネルの信号のみからなる第2の信号或いは複数の入力チャネルの信号から生成した第2の信号を符号化し、第2の信号として何れを選択したかを示す選択情報をも符号化し、第1、第2の信号の符号化方式を異なる符号化方式にすることにより、例えば、旧規格対応再生装置による再生を可能にしながら新規格拡張によって多チャネル化を実現する符号化・復号化を行う場合に、符号化により生じる量子化雑音を最小限に抑え、音質劣化を軽減可能となる。
また、本発明の信号復号化方法及び装置においては、複数のチャネルの信号から生成されて符号化された第1の符号化信号と、一部のチャネルの信号のみからなる第2の信号或いは複数のチャネルの信号から生成した第2の信号との何れかを選択して符号化した第2の符号化信号とを含む符号列を復号化するとともに、符号列から第2の信号の選択状況を特定する選択情報を取り出して復号化を制御し、復号化の際には第1、第2の符号化信号をそれぞれ異なる復号化方式にて復号化することにより、例えば、旧規格対応再生装置による再生が可能であり且つ新規格で拡張された信号をも再生でき、符号化及び復号化により生じる量子化雑音を最小限に抑え、音質劣化を軽減可能となる。
さらに本発明の信号記録媒体においては、複数の入力チャネルの信号から生成された第1の信号を符号化した第1の符号化信号と、一部のチャネルの信号のみからなる第2の信号或いは複数の入力チャネルの信号から生成した第2の信号の何れかを選択して符号化した第2の符号化信号と、それらの符号化パラメータと、第2の信号の選択情報を有する符号列を記録してなるとともに、第1、第2の信号の符号化方式が異なることにより、例えば、旧規格対応再生装置による再生が可能になり且つ新規格で拡張された信号をも再生でき、符号化及び復号化により生じる量子化雑音を最小限に抑え、音質劣化を軽減可能となる。
Claims (20)
- 信号を符号化する符号化方法において、
複数の入力チャネルの信号から第1の信号を生成し、
上記複数の入力チャネルのうちの一部のチャネルと他のチャネルの信号レベルを求め、
上記信号レベルに基づいて、上記一部のチャネルの信号のみからなる第2の信号と上記複数の入力チャネルの信号から生成した第2の信号との何れかを選択し、
上記第1の信号及び上記選択した第2の信号を符号化する符号化方法。 - 上記一部のチャネルの信号のみからなる第2の信号又は上記複数の入力チャネルの信号から生成した第2の信号の何れを選択したかを示す選択情報を生成し、符号化することを特徴とする請求の範囲第1項記載の符号化方法。
- 上記一部のチャネルと他のチャネルの信号レベルの比が所定の閾値より大きいとき、上記一部のチャネルの信号のみからなる第2の信号を選択することを特徴とする請求の範囲第1項記載の符号化方法。
- 上記一部のチャネルと他のチャネルの信号レベルの比が所定の閾値より小さいとき、上記複数の入力チャネルの信号から生成した第2の信号を選択することを特徴とする請求の範囲第1項記載の符号化方法。
- 信号を符号化する符号化装置において、
複数の入力チャネルの信号から第1の信号を生成する第1の信号生成手段と、
上記複数の入力チャネルのうちの一部のチャネルと他のチャネルの信号レベルに基づいて、上記一部のチャネルの信号のみからなる第2の信号と上記複数の入力チャネルの信号から生成した第2の信号との何れかを選択する第2の信号生成手段と、
上記第1の信号及び上記選択した第2の信号を符号化する符号化手段とを具備する符号化装置。 - 符号化された信号を復号する復号化方法において、
符号列から第1の符号化信号と、第2の符号化信号と、第2の符号化信号の構成するチャネル信号の構成状態を示す構成情報とを分離し、
上記分離した第1及び第2の符号化信号をそれぞれ復号化して第1及び第2の信号を生成し、
上記構成情報に基づいて、上記第1及び第2の信号から複数のチャネル信号を生成するための復元処理を選択する復号化方法。 - 符号化された信号を復号する復号化方法において、
複数のチャネルの信号から生成されて符号化された第1の符号化信号と、上記複数のチャネルのうちの一部のチャネルと他のチャネルの信号レベルに基づいて上記一部のチャネルの信号のみからなる第2の信号又は上記複数のチャネルの信号から生成した第2の信号の何れかが選択されて符号化された第2の符号化信号とを含む符号列から上記第1及び第2の符号化信号を分離し、
上記分離した第1及び第2の符号化信号をそれぞれ復号化し、
上記復号化した第1及び第2の信号から複数チャネルの信号を復元する復号化方法。 - 上記符号列から、上記第2の信号の選択状況を特定する選択情報をも分離し、
上記選択情報に基づいて、上記第1及び第2の符号化信号の復号化及び複数チャネルの信号の復元を制御することを特徴とする請求の範囲第7項記載の復号化方法。 - 上記第2の信号が上記複数のチャネルのうちの一部のチャネルの信号のみからなることを上記選択情報が示すとき、上記第2の符号化信号から上記一部のチャネルの信号を復号化し、
当該復号化した一部のチャネルの信号と上記復号化した第1の信号とから、上記複数チャネルの信号を復元することを特徴とする請求の範囲第8項記載の復号化方法。 - 上記第2の信号が上記複数のチャネルの信号から生成されたことを上記選択情報が示すとき、上記第2の符号化信号から第2の信号を復号化し、
当該復号化した第2の信号と上記復号化した第1の信号とから、上記複数チャネルの信号を復元することを特徴とする請求の範囲第8項記載の復号化方法。 - 上記複数のチャネルの信号は、音響信号の右チャネルの信号と左チャネルの信号からなることを特徴とする請求の範囲第7項記載の復号化方法。
- 上記第1の信号は、音響信号の右チャネルの信号と左チャネルの信号の加算によって求められた信号であり、
上記複数のチャネルの信号から生成した第2の信号は、音響信号の右チャネルの信号と左チャネルの信号の減算によって求められた信号であることを特徴とする請求の範囲第11項記載の復号化方法。 - 符号化された信号を復号する復号化装置において、
符号列から第1の符号化信号と、第2の符号化信号と、第2の符号化信号の構成するチャネル信号の構成状態を示す構成情報とを分離する分離手段と、
上記分離した第1及び第2の符号化信号をそれぞれ復号化して第1及び第2の信号を生成する復号化手段と、
上記構成情報に基づいて、上記第1及び第2の信号から複数のチャネル信号を生成するための復元処理を選択する制御手段とを具備する復号化装置。 - 符号化された信号を復号する復号化装置において、
複数のチャネルの信号から生成されて符号化された第1の符号化信号と、上記複数のチャネルのうちの一部のチャネルと他のチャネルの信号レベルに基づいて上記一部のチャネルの信号のみからなる第2の信号又は上記複数のチャネルの信号から生成した第2の信号の何れかが選択されて符号化された第2の符号化信号とを含む符号列から上記第1及び第2の符号化信号を分離する分離手段と、
上記分離した第1及び第2の符号化信号をそれぞれ復号化する復号化手段と、
上記復号化した第1及び第2の信号から複数チャネルの信号を復元する復元手段とを具備する復号化装置。 - 上記分離手段は、上記符号列から、上記第2の信号の選択状況を特定する選択情報をも分離し、
上記選択情報に基づいて、上記第1及び第2の符号化信号の復号化及び複数チャネルの信号の復元を制御する制御手段をさらに具備することを特徴とする請求の範囲第14項記載の復号化装置。 - 上記制御手段は、上記第2の信号が上記複数のチャネルのうちの一部のチャネルの信号のみからなることを上記選択情報が示すとき、上記第2の復号化手段を制御して、上記第2の符号化信号から上記一部のチャネルの信号を復号化するとともに、上記復元手段を制御して、上記復号化した一部のチャネルの信号と上記復号化した第1の信号とから上記複数チャネルの信号を復元することを特徴とする請求の範囲第15項記載の復号化装置。
- 上記制御手段は、上記第2の信号が上記複数のチャネルの信号から生成されたことを上記選択情報が示すとき、上記第2の復号化手段を制御して、上記第2の符号化信号から上記第2の信号を復号化するとともに、上記復元手段を制御して、上記復号化した第2の信号と上記復号化した第1の信号とから上記複数チャネルの信号を復元することを特徴とする請求の範囲第15項記載の復号化装置。
- 上記複数のチャネルの信号は、音響信号の右チャネルの信号と左チャネルの信号からなることを特徴とする請求の範囲第14項記載の復号化装置。
- 上記第1の信号は、音響信号の右チャネルの信号と左チャネルの信号の加算によって求められた信号であり、
上記複数のチャネルの信号から生成した第2の信号は、音響信号の右チャネルの信号と左チャネルの信号の減算によって求められた信号であることを特徴とする請求の範囲第18項記載の復号化装置。 - 複数の入力チャネルの信号から生成された第1の信号を符号化した第1の符号化信号と、上記複数の入力チャネルのうちの一部のチャネルと他のチャネルの信号レベルに基づいて上記一部のチャネルの信号のみからなる第2の信号又は上記複数の入力チャネルの信号から生成した第2の信号の何れかを選択して符号化した第2の符号化信号と、上記第1、第2の信号の符号化の際の符号化パラメータとを有する符号列を記録してなる記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9244897 | 1997-04-10 | ||
PCT/JP1998/001672 WO1998046045A1 (fr) | 1997-04-10 | 1998-04-10 | Procede et dispositif de codage, procede et dispositif de decodage et support d'enregistrement |
Publications (1)
Publication Number | Publication Date |
---|---|
JP3887827B2 true JP3887827B2 (ja) | 2007-02-28 |
Family
ID=14054698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP54260898A Expired - Fee Related JP3887827B2 (ja) | 1997-04-10 | 1998-04-10 | 符号化方法及び装置、復号化方法及び装置、並びに記録媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6741965B1 (ja) |
EP (1) | EP0924962B1 (ja) |
JP (1) | JP3887827B2 (ja) |
CN (1) | CN1205842C (ja) |
WO (1) | WO1998046045A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002093559A1 (en) * | 2001-05-11 | 2002-11-21 | Matsushita Electric Industrial Co., Ltd. | Device to encode, decode and broadcast audio signal with reduced size spectral information |
EP1437713A4 (en) | 2001-10-03 | 2006-07-26 | Sony Corp | APPARATUS AND METHOD FOR ENCODING APPARATUS, APPARATUS AND METHOD FOR DECODING APPARATUS AND METHOD FOR RECORDING RECORDING MEDIUM |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
KR100682915B1 (ko) * | 2005-01-13 | 2007-02-15 | 삼성전자주식회사 | 다채널 신호 부호화/복호화 방법 및 장치 |
RU2007139784A (ru) * | 2005-04-28 | 2009-05-10 | Мацусита Электрик Индастриал Ко., Лтд. (Jp) | Устройство кодирования звука и способ кодирования звука |
JP4850827B2 (ja) * | 2005-04-28 | 2012-01-11 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
US7895012B2 (en) * | 2005-05-03 | 2011-02-22 | Hewlett-Packard Development Company, L.P. | Systems and methods for organizing and storing data |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
CN101427307B (zh) * | 2005-09-27 | 2012-03-07 | Lg电子株式会社 | 编码/解码多声道音频信号的方法和装置 |
KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
JP2007179641A (ja) * | 2005-12-27 | 2007-07-12 | Sony Corp | 情報処理装置、コンテンツ再生可否判定通知方法及びコンテンツ再生可否判定通知プログラム |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8190425B2 (en) | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
CN101473347B (zh) * | 2006-04-21 | 2012-05-30 | 皇家飞利浦电子股份有限公司 | 增加精度平滑分布的画面增强 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
JP2009010841A (ja) * | 2007-06-29 | 2009-01-15 | Kenwood Corp | ステレオ復調装置及びステレオ復調方法 |
US20090319279A1 (en) * | 2008-06-19 | 2009-12-24 | Hongwei Kong | Method and system for audio transmit loopback processing in an audio codec |
CN102157151B (zh) | 2010-02-11 | 2012-10-03 | 华为技术有限公司 | 一种多声道信号编码方法、解码方法、装置和系统 |
JP4922427B2 (ja) | 2010-04-19 | 2012-04-25 | 株式会社東芝 | 信号補正装置 |
US9679572B2 (en) | 2013-04-23 | 2017-06-13 | The Korea Development Bank | Method and apparatus for encoding/decoding scalable digital audio using direct audio channel data and indirect audio channel data |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6452400U (ja) * | 1987-09-28 | 1989-03-31 | ||
JPH01247000A (ja) * | 1988-03-29 | 1989-10-02 | Asahi Optical Co Ltd | ディジタル音声再生装置 |
JP2845920B2 (ja) * | 1989-02-09 | 1999-01-13 | パイオニア株式会社 | 記録再生方式 |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
KR100395190B1 (ko) * | 1993-05-31 | 2003-08-21 | 소니 가부시끼 가이샤 | 신호 부호화 또는 복호화 장치, 및 신호 부호화 또는복호화 방법 |
JP3175446B2 (ja) * | 1993-11-29 | 2001-06-11 | ソニー株式会社 | 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体 |
JP2852862B2 (ja) * | 1994-02-01 | 1999-02-03 | 株式会社グラフィックス・コミュニケーション・ラボラトリーズ | Pcmオーディオ信号の変換方法と装置 |
JP3277692B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 情報符号化方法、情報復号化方法及び情報記録媒体 |
EP0820624A1 (en) * | 1995-04-10 | 1998-01-28 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals for digital transmission |
TW429700B (en) * | 1997-02-26 | 2001-04-11 | Sony Corp | Information encoding method and apparatus, information decoding method and apparatus and information recording medium |
-
1998
- 1998-04-10 JP JP54260898A patent/JP3887827B2/ja not_active Expired - Fee Related
- 1998-04-10 US US09/202,157 patent/US6741965B1/en not_active Expired - Fee Related
- 1998-04-10 WO PCT/JP1998/001672 patent/WO1998046045A1/ja active IP Right Grant
- 1998-04-10 CN CNB988007819A patent/CN1205842C/zh not_active Expired - Fee Related
- 1998-04-10 EP EP98912767A patent/EP0924962B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CN1205842C (zh) | 2005-06-08 |
EP0924962A1 (en) | 1999-06-23 |
EP0924962B1 (en) | 2012-12-12 |
US6741965B1 (en) | 2004-05-25 |
WO1998046045A1 (fr) | 1998-10-15 |
CN1228236A (zh) | 1999-09-08 |
EP0924962A4 (en) | 2006-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3887827B2 (ja) | 符号化方法及び装置、復号化方法及び装置、並びに記録媒体 | |
KR100565017B1 (ko) | 정보부호화방법과장치와정보복호화방법과장치및정보기록매체 | |
US6169973B1 (en) | Encoding method and apparatus, decoding method and apparatus and recording medium | |
JP3123286B2 (ja) | ディジタル信号処理装置又は方法、及び記録媒体 | |
JP3123290B2 (ja) | 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体 | |
KR100276788B1 (ko) | 디지탈 신호 처리 장치와 방법 및 기록 매체 | |
US6081784A (en) | Methods and apparatus for encoding, decoding, encrypting and decrypting an audio signal, recording medium therefor, and method of transmitting an encoded encrypted audio signal | |
JPH1132399A (ja) | 符号化方法及び装置、並びに記録媒体 | |
US6356211B1 (en) | Encoding method and apparatus and recording medium | |
JPH06318875A (ja) | 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、及び方法、並びに記録媒体 | |
KR100742260B1 (ko) | 부호화장치 및 방법, 기록매체와 복호장치 및 방법 | |
JP4211166B2 (ja) | 符号化装置及び方法、記録媒体、並びに復号装置及び方法 | |
JP3175446B2 (ja) | 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体 | |
US7257226B1 (en) | Information management method and information management apparatus | |
JP4470304B2 (ja) | 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体 | |
KR100563161B1 (ko) | 부호화 방법 및 장치, 복호화 방법 및 장치,기록 매체 | |
JP2000036755A (ja) | 符号変換方法及び装置、並びにプログラム供給媒体 | |
JPH06338861A (ja) | ディジタル信号処理装置及び方法、並びに記録媒体 | |
JP3477735B2 (ja) | 圧縮データ変換装置及び方法 | |
JPH10302405A (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体 | |
JP4123632B2 (ja) | 情報符号化方法及び装置、並びにプログラム供給媒体 | |
JPH07193510A (ja) | ディジタル信号処理装置、ディジタル信号処理方法、及び記録媒体 | |
JPH07273659A (ja) | ディジタル信号処理方法及び装置、並びに記録媒体 | |
JP3552239B2 (ja) | 圧縮データ記録装置及び方法、並びに圧縮データ再生方法 | |
JP2000036754A (ja) | 符号変換制御方法及び装置、並びにプログラム供給媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050311 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061120 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091208 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101208 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101208 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111208 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111208 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121208 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121208 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131208 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |