JPWO2009081567A1 - ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 - Google Patents
ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 Download PDFInfo
- Publication number
- JPWO2009081567A1 JPWO2009081567A1 JP2009546943A JP2009546943A JPWO2009081567A1 JP WO2009081567 A1 JPWO2009081567 A1 JP WO2009081567A1 JP 2009546943 A JP2009546943 A JP 2009546943A JP 2009546943 A JP2009546943 A JP 2009546943A JP WO2009081567 A1 JPWO2009081567 A1 JP WO2009081567A1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel signal
- sample
- stereo
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims description 49
- 238000004364 calculation method Methods 0.000 claims abstract description 52
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 230000008929 regeneration Effects 0.000 claims description 102
- 238000011069 regeneration method Methods 0.000 claims description 102
- 238000012545 processing Methods 0.000 claims description 29
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 10
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 16
- 238000005070 sampling Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 8
- 238000000926 separation method Methods 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
音源の位置が異なる場合であっても、冗長性が少なく、低ビットレートで高品質な符号化を実現することができるステレオ信号変換装置。この装置では、サンプル差分析部(111)は、右チャネル信号をサンプル差dだけ時間的に移動させた信号と左チャネル信号とを用いて相関が最も高くなるサンプル差Dを計算する。サンプル差値計算部(112)は、前フレームにおいて右チャネル信号を移動させた値とサンプル差Dとに基づいて、サンプル差値z(現フレームにおいて右チャネル信号を移動させる値)を計算する。サンプル差値符号化部(113)は、サンプル差値zを符号化する。スライド部(114)は、サンプル差値zだけ右チャネル信号を時間的に移動させる。和差計算部(115)は、左チャネル信号と移動後の右チャネル信号とを加算してモノラル信号を生成し、左チャネル信号から移動後の右チャネル信号を減算してサイド信号を生成する。
Description
本発明は、ステレオ音声の符号化を実現する符号化装置、復号装置に用いられるステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法に関する。
音声符号化は、電話帯域(200Hz〜3.4kHz)の狭帯域音声を使用する通信用途に用いられる。モノラル音声の狭帯域音声コーデックは、移動電話、遠隔会議機器や最近ではパケットネットワーク(たとえば、インターネット)上での音声通信などの通信用途に広く使用されている。
近年、通信ネットワークのブロードバンド化に伴い、音声通信に対して臨場感や音楽に対する品質の高さが求められるようになり、このニーズに応えるために、ステレオ音声の符号化技術を用いた音声通信システムの開発が進められている。
従来から、ステレオ音声を符号化する方法として、左チャネル信号と右チャネル信号との和であるモノラル信号と、左チャネル信号と右チャネル信号との差であるサイド信号とを求め、モノラル信号とサイド信号とをそれぞれ符号化する方法が知られている(特許文献1参照)。
左チャネル信号と右チャネル信号は、人間のそれぞれの耳から入る音を表す信号であり、モノラル信号によって左チャネル信号と右チャネル信号の共通部分を表すことができ、サイド信号によって左チャネル信号と右チャネル信号の空間的な違いを表現することができる。
左チャネル信号と右チャネル信号の相関性が高いことから、これらの信号をモノラル信号とサイド信号とに変換してから符号化する方が、直接符号化するよりも、モノラル信号とサイド信号の特徴に応じた適切な符号化が可能になり、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
特開2001−255892号公報
しかしながら、左チャネル信号と右チャネル信号の主成分が同じでも、これらの信号の音源の位置が異なる場合には、同時刻における左チャネル信号と右チャネル信号の相関性は低くなる。したがって、単に、左チャネル信号と右チャネル信号をモノラル信号とサイド信号とに変換して符号化すると、音源の位置が異なる場合に、モノラル信号とサイド信号に冗長性が含まれたまま非効率に量子化することになる。
本発明の目的は、音源の位置が異なる場合であっても、冗長性が少なく、低ビットレートで高品質な符号化を実現することができるステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法を提供することである。
本発明のステレオ信号変換装置は、ステレオ信号を構成する第1チャネル信号と第2チャネル信号との相関が最も高くなるタイミング差を分析する分析手段と、前記タイミング差に基づいて前記第2チャネル信号を時間移動させるスライド手段と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号を生成する和差計算手段と、を具備する構成を採る。
本発明のステレオ信号逆変換装置は、ステレオ信号を構成する第1チャネル信号と時間移動させた後の第2チャネル信号との和に関するモノラル信号の符号化データを復号したモノラル再生成信号と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号の符号化データを復号したサイド再生成信号とを用いて、前記第1チャネル信号の再生成信号および前記時間移動させた後の第2チャネル信号の再生成信号を生成する再生成信号生成手段と、前記時間移動させた後の第2チャネル信号の再生成信号を元に戻すように移動させる逆スライド手段と、を具備する構成を採る。
本発明のステレオ信号変換方法は、ステレオ信号を構成する第1チャネル信号と第2チャネル信号との相関が最も高くなるタイミング差を分析する分析工程と、前記タイミング差に基づいて前記第2チャネル信号を時間移動させるスライド工程と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号を生成する和差計算工程と、を具備する方法を採る。
本発明のステレオ信号逆変換方法は、ステレオ信号を構成する第1チャネル信号と時間移動させた後の第2チャネル信号との和に関するモノラル信号の符号化データを復号したモノラル再生成信号と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号の符号化データを復号したサイド再生成信号とを用いて、前記第1チャネル信号の再生成信号および前記時間移動させた後の第2チャネル信号の再生成信号を生成する再生成信号生成工程と、前記時間移動させた後の第2チャネル信号の再生成信号を元に戻すように移動させる逆スライド工程と、を具備する方法を採る。
本発明によれば、左チャネル信号と右チャネル信号の音源の位置が異なる場合であっても、これらの信号の一方を時間的に移動させてからモノラル信号およびサイド信号を生成することにより、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
以下、本発明の実施の形態について、図面を用いて説明する。なお、各実施の形態では、ステレオ信号が左チャネル信号と右チャネル信号の2つの信号からなる場合を例に説明する。また、左チャネル信号、右チャネル信号、モノラル信号、サイド信号をそれぞれ、L、R、M、Sと表し、それらの再生成信号をそれぞれ、L’、R’、M’、S’と表す。
(実施の形態1)
図1は、本実施の形態に係るステレオ信号変換装置を含む符号化装置の構成を示すブロック図である。図1に示す符号化装置100は、ステレオ信号変換装置101と、モノラル符号化部102と、サイド符号化部103と、多重化部104と、から主に構成される。
図1は、本実施の形態に係るステレオ信号変換装置を含む符号化装置の構成を示すブロック図である。図1に示す符号化装置100は、ステレオ信号変換装置101と、モノラル符号化部102と、サイド符号化部103と、多重化部104と、から主に構成される。
ステレオ信号変換装置101は、左チャネル信号Lおよび右チャネル信号Rのうち一方の信号を時間的に移動させてから、これらの信号の和であるモノラル信号M、および、これらの信号の差であるサイド信号Sを生成する。そして、ステレオ信号変換装置101は、モノラル符号化部102にモノラル信号Mを出力し、サイド符号化部103にサイド信号Sを出力する。また、ステレオ信号変換装置101は、右チャネル信号Rを移動させた値(以下、この値を「サンプル差値」といい、zで表す)を符号化して多重化部104に出力する。なお、サンプル差値zについては、ステレオ信号変換装置101の内部構成の説明の中で詳しく説明する。
モノラル符号化部102は、モノラル信号Mを符号化し、得られた符号化データを多重化部104に出力する。サイド符号化部103は、サイド信号Sを符号化し、得られた符号化データを多重化部104に出力する。
多重化部104は、モノラル信号Mの符号化データ、サイド信号Sの符号化データ、サンプル差値zの符号化データを多重し、得られたビットストリームを出力する。
次に、ステレオ信号変換装置101の内部構成について説明する。ステレオ信号変換装置101は、サンプル差分析部111、サンプル差値計算部112、サンプル差値符号化部113、スライド部114および和差計算部115を有する。なお、図1では、左チャネル信号Lを固定する場合を示す。右チャネル信号Rを固定する場合には、図1に対して、左チャネル信号Lと右チャネル信号Rの入力が逆になる。
サンプル差分析部111は、左チャネル信号Lと右チャネル信号Rとの相関が最も高くなるタイミング差Dを分析し、サンプル差値計算部112に出力する。例えば、サンプル差分析部111は、以下の式(1)により、入力された1フレーム分の左チャネル信号Lと入力された1フレーム分の右チャネル信号Rをサンプル差dだけ時間的に移動させた信号との相関値Vdと、その時の右チャネル信号RのパワCdを計算し、評価値Edを求める。なお、式(1)において、Xi Lは左チャネル信号の各サンプルタイミングiにおける信号値、Xi−d Rは右チャネル信号をサンプル差dだけ時間的に移動させた信号の各サンプルタイミングiにおける信号値である。
式(1)において、Edが大きいほど左チャネル信号Lと右チャネル信号Rとの相関が高いこととなるから、サンプル差分析部111は、この評価値Edが最も大きくなるサンプル差Dを計算する。例えば、サンプリングレートが16kHzの場合、人間の両耳の間隔の最大が34cm程度と仮定すると、音が伝わる速度が約340m/sであるから、±16サンプル(−16〜+15)で性能が得られるので、サンプル差分析部111は、この範囲で評価値最大のサンプル差Dを計算する。
サンプル差値計算部112は、前フレームにおいて右チャネル信号Rを移動させた値とサンプル差分析部111から出力されたサンプル差Dとに基づいて、サンプル差値(現フレームにおいて右チャネル信号Rを移動させる値)zを計算する。そして、サンプル差値計算部112は、計算したサンプル差値zをサンプル差値符号化部113およびスライド部114に出力する。
ここで、本実施の形態では、連続するフレームにおけるサンプル差値zの変動量を1サンプルまでに限定し、サンプル差値計算部112は、以下のルールに基づいて計算するものとする。すなわち変動量は「−1、0、1」のいずれかとなる。ルール1:サンプル差Dが前フレームのサンプル差値z(すなわち、前フレームにおいて右チャネル信号Rを移動させた値)と同じ場合、現フレームのサンプル差値zを前フレームのものと同じ値とする。この場合、変動量は「0」となる。ルール2:サンプル差Dが前フレームのサンプル差値zより大きい場合、現フレームのサンプル差値zを前フレームのものに対して1つ増やす。この場合、変動量は「1」となる。ルール3:サンプル差Dが前フレームのサンプル差値zより小さい場合、現フレームのサンプル差値zを前フレームのものに対して1つ減らす。この場合、変動量は「−1」となる。
サンプル差値符号化部113は、サンプル差値計算部112から出力されたサンプル差値zを符号化し、多重化部104に出力する。なお、サンプル差値の符号化方法として以下の2通りが挙げられる。
第1の方法は、サンプル差値zをそのまま符号化することである。例えば、サンプル差値zが−16〜+15のいずれかの値をとる場合、この値に16を加算した0〜31の数値を5ビットの符号に変換することができる。
第2の方法は、差分(サンプル差値zの変動量)を符号化することである。サンプル差値zの変動量は「−1、0、1」のいずれかの値をとるので、この値に1を加算した0〜2の数値を2ビットの符号に変換することができる。ただし、第2の方法では、ビット誤りがある場合には、一度ビットを誤ると誤りが長く伝播し正常な状態(正しく復号化された信号の状態)に戻り難いという点に注意する必要がある。
このように、少数サンプル(本実施の形態では1サンプル)ずつ目標の遅延に近づける処理は大変理にかなった方法である。なぜならば、ステレオ録音における音源の位置はそれほど急激には変わらないという傾向があり、フレーム長が20ms程度であれば音源位置が変化しても1サンプルずつの変化で十分追従することができ、かつ、復号の際に空きサンプルが生じる場合にも前後のサンプルの値を用いて容易に内挿補間することができるからである。
スライド部114は、サンプル差値計算部112で計算されたサンプル差値zだけ、右チャネル信号Rを時間的に移動させ、移動後の右チャネル信号Rzを和差計算部115に出力する。
和差計算部115は、図2に示すように、左チャネル信号Lと移動後の右チャネル信号Rzとを加算してモノラル信号Mを生成し、左チャネル信号Lから移動後の右チャネル信号Rzを減算してサイド信号Sを生成する。そして、和差計算部115は、モノラル符号化部102にモノラル信号Mを出力し、サイド符号化部103にサイド信号Sを出力する。式(2)は、和差計算部115における計算の一例を示す。式(2)において、Xi Mはモノラル信号の各サンプルタイミングiにおける信号値、Xi Sはサイド信号の各サンプルタイミングiにおける信号値を示す。
このように、本実施の形態では、左チャネル信号と右チャネル信号の音源の位置が異なる場合に、これらの信号の一方を時間的に移動させてからモノラル信号およびサイド信号を生成する。これにより、モノラル信号によって、左チャネル信号と右チャネル信号の主成分を従来技術よりも忠実に表すことができ、サイド信号によって、左チャネル信号と右チャネル信号の空間的に異なる部分を従来技術よりも忠実に表すことができるので、音源の位置が異なる場合であっても、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
図3は、本実施の形態に係るステレオ信号逆変換装置を含む復号装置の構成を示すブロック図である。図3に示す復号装置300は、分離部301と、モノラル復号部302と、サイド復号部303と、ステレオ信号逆変換装置304と、から主に構成される。
分離部301は、復号装置300に受信されたビットストリームを分離し、モノラル信号Mの符号化データをモノラル復号部302に、サイド信号Sの符号化データをサイド復号部303に、サンプル差値zの符号化データをステレオ信号逆変換装置304に、それぞれ出力する。
モノラル復号部302は、モノラル信号Mの符号化データを復号し、得られたモノラル再生成信号M’をステレオ信号逆変換装置304に出力する。サイド復号部303は、サイド信号Sの符号化データを復号し、得られたサイド再生成信号S’をステレオ信号逆変換装置304に出力する。
ステレオ信号逆変換装置304は、サンプル差値zの符号化データ、モノラル再生成信号M’およびサイド再生成信号S’を用いて左チャネル再生成信号L’および右チャネル再生成信号R’を得る。
次に、ステレオ信号逆変換装置304の内部構成について説明する。ステレオ信号逆変換装置304は、和差計算部311、サンプル差値復号部312、逆スライド部313、内挿係数格納部314および空きサンプル内挿部315を有する。なお、図3では、左チャネル再生成信号L’を固定する場合を示す。右チャネル再生成信号R’を固定する場合には、図3に対して、左チャネル再生成信号L’と右チャネル再生成信号R’の入力が逆になる。
和差計算部311は、図4に示すように、モノラル復号部302から出力されたモノラル再生成信号M’およびサイド復号部303から出力されたサイド再生成信号S’を用いて、以下の式(3)により、左チャネル再生成信号L’および移動後の右チャネル再生成信号Rz’を算出する。なお、式(3)において、Yi Mはモノラル再生成信号の各サンプルタイミングiにおける信号値、Yi Sはサイド再生成信号の各サンプルタイミングiにおける信号値、Yi Lは左チャネル再生成信号の各サンプルタイミングiにおける信号値、Yi−z Rは移動後の右チャネル再生成信号の各サンプルタイミングiにおける信号値を示す。
サンプル差値復号部312は、分離部301から出力されたサンプル差値zの符号化データを復号し、得られたサンプル差値zを逆スライド部313に出力する。
逆スライド部313は、ステレオ信号変換装置101のスライド部114にて時間的に移動させた方向と逆方向に、サンプル差値復号部312から出力されたサンプル差値zだけ、移動後の右チャネル再生成信号Rz’を移動させる。換言すれば、逆スライド部313は、移動後の右チャネル再生成信号Rz’を左チャネル再生成信号L’と時間的に一致するように移動させる。
ここで、サンプル差値計算部112にて計算されたサンプル差値zの変動量が「1」の場合、逆スライド部313における移動の結果、右チャネル再生成信号R’の信号列において現フレームと前フレームとの間に1サンプル分の空白区間(以下、「空きサンプル」という)が生じる。空きサンプル内挿部315は、右チャネル再生成信号R’の信号列に空きサンプルが生じた場合、内挿係数格納部314に格納された係数値と前後のサンプルの値とを用いた内挿補間処理により空きサンプルを埋めてから右チャネル再生成信号R’を出力する。なお、右チャネル再生成信号R’の信号列に空きサンプルが生じない場合には、空きサンプル内挿部315は、右チャネル再生成信号R’をそのまま出力する。
次に、空きサンプル内挿部315における内挿補間処理について、具体例を用いて詳細に説明する。本例では空きサンプルの前後5サンプルから内挿するものとする。
空きサンプル内挿部315は、以下の式(4)のように、空きサンプルの前後5サンプルの線形和を計算することによって、空きサンプルの値を計算する。なお、式(4)において、Yjは空きサンプル、Yj+iは空きサンプルの前後5サンプル、βiは内挿係数(固定値)である。なお、内挿係数格納部314に格納された内挿係数の一例を図5に示す。
このように、符号化側で移動した信号を逆方向に戻した結果、空きサンプルが生じた場合であっても、前後のサンプルの値を用いて内挿補間することにより、高効率の符号化/復号の後で不連続な異音感を起さないようにすることができる。特に、符号化側で、少数サンプル(本実施の形態では1サンプル)ずつ目標の遅延に近づける処理を行うことにより、復号側において内挿する空きサンプルを少数とすることができ、ステレオ信号の音質を維持することができる。
図6は、本発明の実証実験の結果を示す図である。図6では、従来方法(オリジナル)と本発明とで、左チャネル信号Lと右チャネル信号Rからモノラル信号Mとサイド信号Sを求めて符号化/復号し、左チャネル再生成信号L’と右チャネル再生成信号R’とを生成した場合のS/N比(単位dB、大きい方が品質が良い)を示している。ここで、図6において、左チャネル信号LのS/N比は式(5)より求め、右チャネル信号RのS/N比は式(6)より求める。
図6に示すように、本発明は、人の声のように方向が定まるものの場合に特に効果があり、従来方法に比べてS/N比が平均で0.6dB以上改善することができた。また、本発明は、音楽の様に方向が定まらないものの場合でも従来方法に比べてS/N比が0.15dB程度改善することができた。
以上説明したように、本発明では、左チャネル信号と右チャネル信号の音源の位置が異なる場合に、これらの信号の一方を時間的に移動させてからモノラル信号およびサイド信号を生成し、時間差(サンプル差値に相当)の成分は別に符号化する。これにより、モノラル信号によって、左チャネル信号と右チャネル信号の主成分を従来技術よりも忠実に表すことができ、サイド信号によって、左チャネル信号と右チャネル信号の空間的に異なる部分を従来技術よりも忠実に表すことができるので、音源の位置が異なる場合であっても、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
さらに、符号化側で移動した信号を逆方向に戻した結果、空きサンプルが生じた場合であっても、前後のサンプルの値を用いて内挿補間することにより、高効率の符号化/復号の後で不連続な異音感を起さないようにすることができる。特に、符号化側で、少数サンプルずつ目標の遅延に近づける処理を行うことにより、復号側において内挿するサンプルを少数とすることができ、ステレオ信号の音質を維持することができる。
(実施の形態2)
本実施の形態は、復号装置において、サンプル差値だけ変動している方の信号に重なる部分(既にデータが入っている位置に更にデータが書き込まれる状態)が生じた場合、重なる部分のサンプル値同士を演算して、重なる部分のサンプル値を求めることを特徴とする。
本実施の形態は、復号装置において、サンプル差値だけ変動している方の信号に重なる部分(既にデータが入っている位置に更にデータが書き込まれる状態)が生じた場合、重なる部分のサンプル値同士を演算して、重なる部分のサンプル値を求めることを特徴とする。
図7は、本発明の実施の形態2に係る復号装置700の構成を示すブロック図である。
図7に示す復号装置700は、図3に示す実施の形態1に係る復号装置300に対して、ステレオ信号逆変換装置304の代わりにステレオ信号逆変換装置701を有する。なお、図7において、図3と同一構成である部分には同一の符号を付してその説明を省略する。
図7に示す復号装置700は、分離部301と、モノラル復号部302と、サイド復号部303と、ステレオ信号逆変換装置701と、から主に構成される。
モノラル復号部302は、モノラル信号Mの符号化データを復号し、得られたモノラル再生成信号M’をステレオ信号逆変換装置701に出力する。サイド復号部303は、サイド信号Sの符号化データを復号し、得られたサイド再生成信号S’をステレオ信号逆変換装置701に出力する。
ステレオ信号逆変換装置701は、サンプル差値zの符号化データ、モノラル再生成信号M’およびサイド再生成信号S’を用いて左チャネル再生成信号L’および右チャネル再生成信号R’を得る。
次に、ステレオ信号逆変換装置701の内部構成について説明する。
図7に示すステレオ信号逆変換装置701は、図3に示す実施の形態1に係るステレオ信号逆変換装置304に対して、重なりサンプル処理部702を追加する。なお、図7において、図3と同一構成である部分には同一の符号を付してその説明を省略する。
ステレオ信号逆変換装置701は、和差計算部311、サンプル差値復号部312、逆スライド部313、内挿係数格納部314、空きサンプル内挿部315及び重なりサンプル処理部702を有する。なお、図7では、左チャネル再生成信号L’を固定する場合を示す。右チャネル再生成信号R’を固定する場合には、図7に対して、左チャネル再生成信号L’と右チャネル再生成信号R’の入力が逆になる。
空きサンプル内挿部315は、右チャネル再生成信号R’の信号列に空きサンプルが生じた場合、内挿係数格納部314に格納された係数値と前後のサンプルの値とを用いた内挿補間処理により空きサンプルを埋めてから右チャネル再生成信号R’を重なりサンプル処理部702へ出力する。なお、右チャネル再生成信号R’の信号列に空きサンプルが生じない場合には、空きサンプル内挿部315は、右チャネル再生成信号R’をそのまま重なりサンプル処理部702へ出力する。また、空きサンプル内挿部315における内挿補間処理については、上記の実施の形態1と同一であるので、その説明を省略する。
重なりサンプル処理部702は、空きサンプル内挿部315から入力した右チャネル再生成信号R’の信号列のサンプルに重なりが生じた場合には、重なった複数のサンプルを用いた演算によりサンプル値を求める。これにより、重なりサンプル処理部702は、「重なった部分」の重なりを解消する。なお、右チャネル再生成信号R’の信号列のサンプルに重なりが生じない場合には、重なりサンプル処理部702は、右チャネル再生成信号R’をそのまま出力する。
次に、重なりサンプル処理部702における「重なった部分」のサンプル値を求める処理について、具体例を用いて説明する。本例では、図8に示すように、サンプル差値が過去(zからz+1)に動いている場合に起こるサンプルの「重なった部分」#801のサンプル値を求めるものとする。図8は、1サンプルの重なりができる場合を示す。
重なりサンプル処理部702は、式(7)より、前後のサンプル(重なっているサンプル)の線形和を計算する。
重なりサンプル処理部702は、上記の処理を経て、右チャネル再生成信号R’を得る。そして、右チャネル再生成信号R’は、和差計算部311で算出された左チャネル再生成信号L’と共に、ステレオ信号逆変換装置701の外部に出力される。
重なりサンプル処理部702において求めるサンプル値は、第mフレームと第(m+1)フレームの両方で求められた値に基づいて算出されるので、両フレームの情報から実際の値に近いサンプル値を算出でき、また、両フレーム間で連続するサンプルを重ねることで音の不連続感を少なくすることができる。また、本実施の形態によれば、高効率の符号化及び復号の後に、不連続な異音感を生じないようにすることができ、高品質に符号化及び復号されたステレオ信号の音質を損なわないように処理することができる。
なお、サンプル差値が2以上の場合、即ち2サンプル以上の重なりが生じる場合もあるが、その場合は三角窓などで整合すればよい。例として、サンプル差値が2(重なりの数が2)の場合と、サンプル差値が3(重なりの数が3)の場合について式(8)に示す。
このように、本実施の形態によれば、上記実施の形態1の効果に加えて、重なった部分のサンプル値を、重なったサンプルを含む前後のフレームから求めるので、両フレームの情報を無駄なく使用することができるとともに、聴感的に音の不連続感を起き難くすることができる。
なお、上記の各実施の形態では、左チャネル信号、右チャネル信号という名称を用いて2つのステレオ信号を表したが、より一般的な第1チャネル信号、第2チャネル信号という名称を用いることもできる。
また、上記の各実施の形態では、ステレオ信号のうち左チャネル信号を固定する場合について説明したが、本発明は、右チャネル信号を固定しても同様の効果を得ることができる。この場合、上記各実施の形態の説明の左チャネル信号と右チャネル信号を逆にすればよい。
また、上記の各実施の形態ではサンプル差値の範囲を±16としたが、本発明はサンプル差値の範囲について限定はない。この範囲を広くすれば遅延を表現するバリエーションが増えるのでより高品質になり、狭くすれば符号化ビットを減らすことができる。
また、上記の各実施の形態ではサンプル差値の変動量を±1サンプルとしたが、本発明はサンプル差値の変動量について限定はない。ただし、サンプル差値の変動量は、空きサンプル内挿部315で内挿できる範囲が限界であり、発明者はサンプリングレートが16kHzのステレオ音声では1ないし2サンプルが限界であることも検証している。
また、上記の各実施の形態では空きサンプル内挿部315の内挿を前後5サンプルの線形和で行ったが、本発明は内挿に使用するサンプル数について限定はない。もっと多ければ補間精度を向上させることができる。なお、5サンプルというのは発明者が実験により検討した最低のサンプル数であり、これ以上少なくすることは補間精度を落とし小さな異音感に繋がることを検証している。勿論、内挿に使用するサンプル数を増やし過ぎると計算量が増加するという課題もある。
また、上記の各実施の形態ではサンプル差値を整数値としたが、本発明はこれに限られず、サンプル差値として分数値を使用することもできる。この場合、SINC関数などを使って分数値を補間することによって使用する。分数値を使用することによってより時間差の精度を向上させることができる。ただし、1/2精度、1/3精度と精度を向上させていくと計算量が増加するという課題もある。ちなみに、発明者は、サンプリングレートが16kHzであれば整数精度で効果が得られることを確認している。また、発明者は、8kHzサンプリングの場合は1/2精度など精度の向上が必要であることを確認している。
また、本発明は、サンプリングレートに依存せず、8kHz、16kHz、32kHz、44.1kHz、48kHzサンプリングなど全てのサンプリングレートに対応することができる。なお、32kHz以上のサンプリングレートの場合は、サンプル差値として±16よりももっと広い範囲の探索が必要になる。また、この場合には、多くのサンプルの補間が可能になるので、サンプル差値の変動量を増やすことができる。
また、上記の各実施の形態では、符号化側から復号側に符号化した情報を伝送する場合について説明したが、本発明は、符号化側において符号化した情報を媒体記録に格納する場合も有効である。オーディオ信号はメモリやディスクに蓄積して用いる場合も多く、本発明はその場合にも有効である。
また、上記の各実施の形態では2チャネルの場合について示したが、本発明は、チャネル数について限定はなく、5.1chなどの多チャネルの場合にも有効であり、固定するチャネルと時間差を伴った相関のあるチャネルを明らかにすればそのまま適用することができる。
また、上記の各実施の形態ではモノラル信号とサイド信号をそれぞれ符号化する場合について示したが、本発明はこれに限られず、モノラル信号のみを使用する方法でも有効である。本発明を用いることにより、位相のずれを補正してダウンミックスすることができるので、より音源に近い高品質のモノラル信号を得ることができる。
また、上記の各実施の形態において、左チャネル信号と右チャネル信号をモノラル信号とサイド信号に変換する式は、以下の式(9)のマトリクスで表現することができるが、このマトリクスが式(9)と異なる場合であっても本発明は有効である。位相の差を少しずつ補正し、元に戻す際に生じる空白区間を内挿補間するという本発明の特徴は、上記マトリクスの特徴に依存しないからである。したがって、5.1チャンネルなどの多チャンネル信号の変換の場合には、マトリクスの次元はもっと大きくなり、数値も複雑になるが、その場合にも本発明は有効である。
なお、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置等と同様の機能を実現することができる。
また、上記の各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2007年12月21日出願の特願2007−330991の日本出願、及び2008年9月30日出願の特願2008−253636の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係るステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法は、携帯電話、IP電話、テレビ会議等に用いるに好適である。
本発明は、ステレオ音声の符号化を実現する符号化装置、復号装置に用いられるステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法に関する。
音声符号化は、電話帯域(200Hz〜3.4kHz)の狭帯域音声を使用する通信用途に用いられる。モノラル音声の狭帯域音声コーデックは、移動電話、遠隔会議機器や最近ではパケットネットワーク(たとえば、インターネット)上での音声通信などの通信用途に広く使用されている。
近年、通信ネットワークのブロードバンド化に伴い、音声通信に対して臨場感や音楽に対する品質の高さが求められるようになり、このニーズに応えるために、ステレオ音声の符号化技術を用いた音声通信システムの開発が進められている。
従来から、ステレオ音声を符号化する方法として、左チャネル信号と右チャネル信号との和であるモノラル信号と、左チャネル信号と右チャネル信号との差であるサイド信号とを求め、モノラル信号とサイド信号とをそれぞれ符号化する方法が知られている(特許文献1参照)。
左チャネル信号と右チャネル信号は、人間のそれぞれの耳から入る音を表す信号であり、モノラル信号によって左チャネル信号と右チャネル信号の共通部分を表すことができ、サイド信号によって左チャネル信号と右チャネル信号の空間的な違いを表現することができる。
左チャネル信号と右チャネル信号の相関性が高いことから、これらの信号をモノラル信号とサイド信号とに変換してから符号化する方が、直接符号化するよりも、モノラル信号とサイド信号の特徴に応じた適切な符号化が可能になり、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
特開2001−255892号公報
しかしながら、左チャネル信号と右チャネル信号の主成分が同じでも、これらの信号の音源の位置が異なる場合には、同時刻における左チャネル信号と右チャネル信号の相関性は低くなる。したがって、単に、左チャネル信号と右チャネル信号をモノラル信号とサイド信号とに変換して符号化すると、音源の位置が異なる場合に、モノラル信号とサイド信号に冗長性が含まれたまま非効率に量子化することになる。
本発明の目的は、音源の位置が異なる場合であっても、冗長性が少なく、低ビットレートで高品質な符号化を実現することができるステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法を提供することである。
本発明のステレオ信号変換装置は、ステレオ信号を構成する第1チャネル信号と第2チャネル信号との相関が最も高くなるタイミング差を分析する分析手段と、前記タイミング差に基づいて前記第2チャネル信号を時間移動させるスライド手段と、前記第1チャネル
信号と前記時間移動させた後の第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号を生成する和差計算手段と、を具備する構成を採る。
信号と前記時間移動させた後の第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号を生成する和差計算手段と、を具備する構成を採る。
本発明のステレオ信号逆変換装置は、ステレオ信号を構成する第1チャネル信号と時間移動させた後の第2チャネル信号との和に関するモノラル信号の符号化データを復号したモノラル再生成信号と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号の符号化データを復号したサイド再生成信号とを用いて、前記第1チャネル信号の再生成信号および前記時間移動させた後の第2チャネル信号の再生成信号を生成する再生成信号生成手段と、前記時間移動させた後の第2チャネル信号の再生成信号を元に戻すように移動させる逆スライド手段と、を具備する構成を採る。
本発明のステレオ信号変換方法は、ステレオ信号を構成する第1チャネル信号と第2チャネル信号との相関が最も高くなるタイミング差を分析する分析工程と、前記タイミング差に基づいて前記第2チャネル信号を時間移動させるスライド工程と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号を生成する和差計算工程と、を具備する方法を採る。
本発明のステレオ信号逆変換方法は、ステレオ信号を構成する第1チャネル信号と時間移動させた後の第2チャネル信号との和に関するモノラル信号の符号化データを復号したモノラル再生成信号と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号の符号化データを復号したサイド再生成信号とを用いて、前記第1チャネル信号の再生成信号および前記時間移動させた後の第2チャネル信号の再生成信号を生成する再生成信号生成工程と、前記時間移動させた後の第2チャネル信号の再生成信号を元に戻すように移動させる逆スライド工程と、を具備する方法を採る。
本発明によれば、左チャネル信号と右チャネル信号の音源の位置が異なる場合であっても、これらの信号の一方を時間的に移動させてからモノラル信号およびサイド信号を生成することにより、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
以下、本発明の実施の形態について、図面を用いて説明する。なお、各実施の形態では、ステレオ信号が左チャネル信号と右チャネル信号の2つの信号からなる場合を例に説明する。また、左チャネル信号、右チャネル信号、モノラル信号、サイド信号をそれぞれ、L、R、M、Sと表し、それらの再生成信号をそれぞれ、L’、R’、M’、S’と表す。
(実施の形態1)
図1は、本実施の形態に係るステレオ信号変換装置を含む符号化装置の構成を示すブロック図である。図1に示す符号化装置100は、ステレオ信号変換装置101と、モノラル符号化部102と、サイド符号化部103と、多重化部104と、から主に構成される。
図1は、本実施の形態に係るステレオ信号変換装置を含む符号化装置の構成を示すブロック図である。図1に示す符号化装置100は、ステレオ信号変換装置101と、モノラル符号化部102と、サイド符号化部103と、多重化部104と、から主に構成される。
ステレオ信号変換装置101は、左チャネル信号Lおよび右チャネル信号Rのうち一方の信号を時間的に移動させてから、これらの信号の和であるモノラル信号M、および、これらの信号の差であるサイド信号Sを生成する。そして、ステレオ信号変換装置101は、モノラル符号化部102にモノラル信号Mを出力し、サイド符号化部103にサイド信号Sを出力する。また、ステレオ信号変換装置101は、右チャネル信号Rを移動させた値(以下、この値を「サンプル差値」といい、zで表す)を符号化して多重化部104に出力する。なお、サンプル差値zについては、ステレオ信号変換装置101の内部構成の説明の中で詳しく説明する。
モノラル符号化部102は、モノラル信号Mを符号化し、得られた符号化データを多重化部104に出力する。サイド符号化部103は、サイド信号Sを符号化し、得られた符号化データを多重化部104に出力する。
多重化部104は、モノラル信号Mの符号化データ、サイド信号Sの符号化データ、サンプル差値zの符号化データを多重し、得られたビットストリームを出力する。
次に、ステレオ信号変換装置101の内部構成について説明する。ステレオ信号変換装置101は、サンプル差分析部111、サンプル差値計算部112、サンプル差値符号化部113、スライド部114および和差計算部115を有する。なお、図1では、左チャネル信号Lを固定する場合を示す。右チャネル信号Rを固定する場合には、図1に対して、左チャネル信号Lと右チャネル信号Rの入力が逆になる。
サンプル差分析部111は、左チャネル信号Lと右チャネル信号Rとの相関が最も高くなるタイミング差Dを分析し、サンプル差値計算部112に出力する。例えば、サンプル差分析部111は、以下の式(1)により、入力された1フレーム分の左チャネル信号Lと入力された1フレーム分の右チャネル信号Rをサンプル差dだけ時間的に移動させた信号との相関値Vdと、その時の右チャネル信号RのパワCdを計算し、評価値Edを求める。なお、式(1)において、Xi Lは左チャネル信号の各サンプルタイミングiにおける信号値、Xi−d Rは右チャネル信号をサンプル差dだけ時間的に移動させた信号の各サンプルタイミングiにおける信号値である。
式(1)において、Edが大きいほど左チャネル信号Lと右チャネル信号Rとの相関が高いこととなるから、サンプル差分析部111は、この評価値Edが最も大きくなるサンプル差Dを計算する。例えば、サンプリングレートが16kHzの場合、人間の両耳の間隔の最大が34cm程度と仮定すると、音が伝わる速度が約340m/sであるから、±16サンプル(−16〜+15)で性能が得られるので、サンプル差分析部111は、この範囲で評価値最大のサンプル差Dを計算する。
サンプル差値計算部112は、前フレームにおいて右チャネル信号Rを移動させた値とサンプル差分析部111から出力されたサンプル差Dとに基づいて、サンプル差値(現フレームにおいて右チャネル信号Rを移動させる値)zを計算する。そして、サンプル差値計算部112は、計算したサンプル差値zをサンプル差値符号化部113およびスライド部114に出力する。
ここで、本実施の形態では、連続するフレームにおけるサンプル差値zの変動量を1サンプルまでに限定し、サンプル差値計算部112は、以下のルールに基づいて計算するものとする。すなわち変動量は「−1、0、1」のいずれかとなる。
ルール1:サンプル差Dが前フレームのサンプル差値z(すなわち、前フレームにおいて右チャネル信号Rを移動させた値)と同じ場合、現フレームのサンプル差値zを前フレームのものと同じ値とする。この場合、変動量は「0」となる。
ルール2:サンプル差Dが前フレームのサンプル差値zより大きい場合、現フレームのサンプル差値zを前フレームのものに対して1つ増やす。この場合、変動量は「1」となる。
ルール3:サンプル差Dが前フレームのサンプル差値zより小さい場合、現フレームのサンプル差値zを前フレームのものに対して1つ減らす。この場合、変動量は「−1」となる。
ルール1:サンプル差Dが前フレームのサンプル差値z(すなわち、前フレームにおいて右チャネル信号Rを移動させた値)と同じ場合、現フレームのサンプル差値zを前フレームのものと同じ値とする。この場合、変動量は「0」となる。
ルール2:サンプル差Dが前フレームのサンプル差値zより大きい場合、現フレームのサンプル差値zを前フレームのものに対して1つ増やす。この場合、変動量は「1」となる。
ルール3:サンプル差Dが前フレームのサンプル差値zより小さい場合、現フレームのサンプル差値zを前フレームのものに対して1つ減らす。この場合、変動量は「−1」となる。
サンプル差値符号化部113は、サンプル差値計算部112から出力されたサンプル差値zを符号化し、多重化部104に出力する。なお、サンプル差値の符号化方法として以下の2通りが挙げられる。
第1の方法は、サンプル差値zをそのまま符号化することである。例えば、サンプル差値zが−16〜+15のいずれかの値をとる場合、この値に16を加算した0〜31の数値を5ビットの符号に変換することができる。
第2の方法は、差分(サンプル差値zの変動量)を符号化することである。サンプル差値zの変動量は「−1、0、1」のいずれかの値をとるので、この値に1を加算した0〜2の数値を2ビットの符号に変換することができる。ただし、第2の方法では、ビット誤りがある場合には、一度ビットを誤ると誤りが長く伝播し正常な状態(正しく復号化された信号の状態)に戻り難いという点に注意する必要がある。
このように、少数サンプル(本実施の形態では1サンプル)ずつ目標の遅延に近づける
処理は大変理にかなった方法である。なぜならば、ステレオ録音における音源の位置はそれほど急激には変わらないという傾向があり、フレーム長が20ms程度であれば音源位置が変化しても1サンプルずつの変化で十分追従することができ、かつ、復号の際に空きサンプルが生じる場合にも前後のサンプルの値を用いて容易に内挿補間することができるからである。
処理は大変理にかなった方法である。なぜならば、ステレオ録音における音源の位置はそれほど急激には変わらないという傾向があり、フレーム長が20ms程度であれば音源位置が変化しても1サンプルずつの変化で十分追従することができ、かつ、復号の際に空きサンプルが生じる場合にも前後のサンプルの値を用いて容易に内挿補間することができるからである。
スライド部114は、サンプル差値計算部112で計算されたサンプル差値zだけ、右チャネル信号Rを時間的に移動させ、移動後の右チャネル信号Rzを和差計算部115に出力する。
和差計算部115は、図2に示すように、左チャネル信号Lと移動後の右チャネル信号Rzとを加算してモノラル信号Mを生成し、左チャネル信号Lから移動後の右チャネル信号Rzを減算してサイド信号Sを生成する。そして、和差計算部115は、モノラル符号化部102にモノラル信号Mを出力し、サイド符号化部103にサイド信号Sを出力する。式(2)は、和差計算部115における計算の一例を示す。式(2)において、Xi Mはモノラル信号の各サンプルタイミングiにおける信号値、Xi Sはサイド信号の各サンプルタイミングiにおける信号値を示す。
このように、本実施の形態では、左チャネル信号と右チャネル信号の音源の位置が異なる場合に、これらの信号の一方を時間的に移動させてからモノラル信号およびサイド信号を生成する。これにより、モノラル信号によって、左チャネル信号と右チャネル信号の主成分を従来技術よりも忠実に表すことができ、サイド信号によって、左チャネル信号と右チャネル信号の空間的に異なる部分を従来技術よりも忠実に表すことができるので、音源の位置が異なる場合であっても、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
図3は、本実施の形態に係るステレオ信号逆変換装置を含む復号装置の構成を示すブロック図である。図3に示す復号装置300は、分離部301と、モノラル復号部302と、サイド復号部303と、ステレオ信号逆変換装置304と、から主に構成される。
分離部301は、復号装置300に受信されたビットストリームを分離し、モノラル信号Mの符号化データをモノラル復号部302に、サイド信号Sの符号化データをサイド復号部303に、サンプル差値zの符号化データをステレオ信号逆変換装置304に、それぞれ出力する。
モノラル復号部302は、モノラル信号Mの符号化データを復号し、得られたモノラル再生成信号M’をステレオ信号逆変換装置304に出力する。サイド復号部303は、サイド信号Sの符号化データを復号し、得られたサイド再生成信号S’をステレオ信号逆変換装置304に出力する。
ステレオ信号逆変換装置304は、サンプル差値zの符号化データ、モノラル再生成信号M’およびサイド再生成信号S’を用いて左チャネル再生成信号L’および右チャネル再生成信号R’を得る。
次に、ステレオ信号逆変換装置304の内部構成について説明する。ステレオ信号逆変
換装置304は、和差計算部311、サンプル差値復号部312、逆スライド部313、内挿係数格納部314および空きサンプル内挿部315を有する。なお、図3では、左チャネル再生成信号L’を固定する場合を示す。右チャネル再生成信号R’を固定する場合には、図3に対して、左チャネル再生成信号L’と右チャネル再生成信号R’の入力が逆になる。
換装置304は、和差計算部311、サンプル差値復号部312、逆スライド部313、内挿係数格納部314および空きサンプル内挿部315を有する。なお、図3では、左チャネル再生成信号L’を固定する場合を示す。右チャネル再生成信号R’を固定する場合には、図3に対して、左チャネル再生成信号L’と右チャネル再生成信号R’の入力が逆になる。
和差計算部311は、図4に示すように、モノラル復号部302から出力されたモノラル再生成信号M’およびサイド復号部303から出力されたサイド再生成信号S’を用いて、以下の式(3)により、左チャネル再生成信号L’および移動後の右チャネル再生成信号Rz’を算出する。なお、式(3)において、Yi Mはモノラル再生成信号の各サンプルタイミングiにおける信号値、Yi Sはサイド再生成信号の各サンプルタイミングiにおける信号値、Yi Lは左チャネル再生成信号の各サンプルタイミングiにおける信号値、Yi−z Rは移動後の右チャネル再生成信号の各サンプルタイミングiにおける信号値を示す。
サンプル差値復号部312は、分離部301から出力されたサンプル差値zの符号化データを復号し、得られたサンプル差値zを逆スライド部313に出力する。
逆スライド部313は、ステレオ信号変換装置101のスライド部114にて時間的に移動させた方向と逆方向に、サンプル差値復号部312から出力されたサンプル差値zだけ、移動後の右チャネル再生成信号Rz’を移動させる。換言すれば、逆スライド部313は、移動後の右チャネル再生成信号Rz’を左チャネル再生成信号L’と時間的に一致するように移動させる。
ここで、サンプル差値計算部112にて計算されたサンプル差値zの変動量が「1」の場合、逆スライド部313における移動の結果、右チャネル再生成信号R’の信号列において現フレームと前フレームとの間に1サンプル分の空白区間(以下、「空きサンプル」という)が生じる。空きサンプル内挿部315は、右チャネル再生成信号R’の信号列に空きサンプルが生じた場合、内挿係数格納部314に格納された係数値と前後のサンプルの値とを用いた内挿補間処理により空きサンプルを埋めてから右チャネル再生成信号R’を出力する。なお、右チャネル再生成信号R’の信号列に空きサンプルが生じない場合には、空きサンプル内挿部315は、右チャネル再生成信号R’をそのまま出力する。
次に、空きサンプル内挿部315における内挿補間処理について、具体例を用いて詳細に説明する。本例では空きサンプルの前後5サンプルから内挿するものとする。
空きサンプル内挿部315は、以下の式(4)のように、空きサンプルの前後5サンプルの線形和を計算することによって、空きサンプルの値を計算する。なお、式(4)において、Yjは空きサンプル、Yj+iは空きサンプルの前後5サンプル、βiは内挿係数(固定値)である。なお、内挿係数格納部314に格納された内挿係数の一例を図5に示す。
このように、符号化側で移動した信号を逆方向に戻した結果、空きサンプルが生じた場合であっても、前後のサンプルの値を用いて内挿補間することにより、高効率の符号化/復号の後で不連続な異音感を起さないようにすることができる。特に、符号化側で、少数サンプル(本実施の形態では1サンプル)ずつ目標の遅延に近づける処理を行うことにより、復号側において内挿する空きサンプルを少数とすることができ、ステレオ信号の音質を維持することができる。
図6は、本発明の実証実験の結果を示す図である。図6では、従来方法(オリジナル)と本発明とで、左チャネル信号Lと右チャネル信号Rからモノラル信号Mとサイド信号Sを求めて符号化/復号し、左チャネル再生成信号L’と右チャネル再生成信号R’とを生成した場合のS/N比(単位dB、大きい方が品質が良い)を示している。ここで、図6において、左チャネル信号LのS/N比は式(5)より求め、右チャネル信号RのS/N比は式(6)より求める。
図6に示すように、本発明は、人の声のように方向が定まるものの場合に特に効果があり、従来方法に比べてS/N比が平均で0.6dB以上改善することができた。また、本発明は、音楽の様に方向が定まらないものの場合でも従来方法に比べてS/N比が0.15dB程度改善することができた。
以上説明したように、本発明では、左チャネル信号と右チャネル信号の音源の位置が異なる場合に、これらの信号の一方を時間的に移動させてからモノラル信号およびサイド信号を生成し、時間差(サンプル差値に相当)の成分は別に符号化する。これにより、モノラル信号によって、左チャネル信号と右チャネル信号の主成分を従来技術よりも忠実に表すことができ、サイド信号によって、左チャネル信号と右チャネル信号の空間的に異なる部分を従来技術よりも忠実に表すことができるので、音源の位置が異なる場合であっても、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
さらに、符号化側で移動した信号を逆方向に戻した結果、空きサンプルが生じた場合であっても、前後のサンプルの値を用いて内挿補間することにより、高効率の符号化/復号の後で不連続な異音感を起さないようにすることができる。特に、符号化側で、少数サンプルずつ目標の遅延に近づける処理を行うことにより、復号側において内挿するサンプルを少数とすることができ、ステレオ信号の音質を維持することができる。
(実施の形態2)
本実施の形態は、復号装置において、サンプル差値だけ変動している方の信号に重なる
部分(既にデータが入っている位置に更にデータが書き込まれる状態)が生じた場合、重なる部分のサンプル値同士を演算して、重なる部分のサンプル値を求めることを特徴とする。
本実施の形態は、復号装置において、サンプル差値だけ変動している方の信号に重なる
部分(既にデータが入っている位置に更にデータが書き込まれる状態)が生じた場合、重なる部分のサンプル値同士を演算して、重なる部分のサンプル値を求めることを特徴とする。
図7は、本発明の実施の形態2に係る復号装置700の構成を示すブロック図である。
図7に示す復号装置700は、図3に示す実施の形態1に係る復号装置300に対して、ステレオ信号逆変換装置304の代わりにステレオ信号逆変換装置701を有する。なお、図7において、図3と同一構成である部分には同一の符号を付してその説明を省略する。
図7に示す復号装置700は、分離部301と、モノラル復号部302と、サイド復号部303と、ステレオ信号逆変換装置701と、から主に構成される。
モノラル復号部302は、モノラル信号Mの符号化データを復号し、得られたモノラル再生成信号M’をステレオ信号逆変換装置701に出力する。サイド復号部303は、サイド信号Sの符号化データを復号し、得られたサイド再生成信号S’をステレオ信号逆変換装置701に出力する。
ステレオ信号逆変換装置701は、サンプル差値zの符号化データ、モノラル再生成信号M’およびサイド再生成信号S’を用いて左チャネル再生成信号L’および右チャネル再生成信号R’を得る。
次に、ステレオ信号逆変換装置701の内部構成について説明する。
図7に示すステレオ信号逆変換装置701は、図3に示す実施の形態1に係るステレオ信号逆変換装置304に対して、重なりサンプル処理部702を追加する。なお、図7において、図3と同一構成である部分には同一の符号を付してその説明を省略する。
ステレオ信号逆変換装置701は、和差計算部311、サンプル差値復号部312、逆スライド部313、内挿係数格納部314、空きサンプル内挿部315及び重なりサンプル処理部702を有する。なお、図7では、左チャネル再生成信号L’を固定する場合を示す。右チャネル再生成信号R’を固定する場合には、図7に対して、左チャネル再生成信号L’と右チャネル再生成信号R’の入力が逆になる。
空きサンプル内挿部315は、右チャネル再生成信号R’の信号列に空きサンプルが生じた場合、内挿係数格納部314に格納された係数値と前後のサンプルの値とを用いた内挿補間処理により空きサンプルを埋めてから右チャネル再生成信号R’を重なりサンプル処理部702へ出力する。なお、右チャネル再生成信号R’の信号列に空きサンプルが生じない場合には、空きサンプル内挿部315は、右チャネル再生成信号R’をそのまま重なりサンプル処理部702へ出力する。また、空きサンプル内挿部315における内挿補間処理については、上記の実施の形態1と同一であるので、その説明を省略する。
重なりサンプル処理部702は、空きサンプル内挿部315から入力した右チャネル再生成信号R’の信号列のサンプルに重なりが生じた場合には、重なった複数のサンプルを用いた演算によりサンプル値を求める。これにより、重なりサンプル処理部702は、「重なった部分」の重なりを解消する。なお、右チャネル再生成信号R’の信号列のサンプルに重なりが生じない場合には、重なりサンプル処理部702は、右チャネル再生成信号R’をそのまま出力する。
次に、重なりサンプル処理部702における「重なった部分」のサンプル値を求める処理について、具体例を用いて説明する。本例では、図8に示すように、サンプル差値が過去(zからz+1)に動いている場合に起こるサンプルの「重なった部分」#801のサンプル値を求めるものとする。図8は、1サンプルの重なりができる場合を示す。
重なりサンプル処理部702は、式(7)より、前後のサンプル(重なっているサンプル)の線形和を計算する。
重なりサンプル処理部702は、上記の処理を経て、右チャネル再生成信号R’を得る。そして、右チャネル再生成信号R’は、和差計算部311で算出された左チャネル再生成信号L’と共に、ステレオ信号逆変換装置701の外部に出力される。
重なりサンプル処理部702において求めるサンプル値は、第mフレームと第(m+1)フレームの両方で求められた値に基づいて算出されるので、両フレームの情報から実際の値に近いサンプル値を算出でき、また、両フレーム間で連続するサンプルを重ねることで音の不連続感を少なくすることができる。また、本実施の形態によれば、高効率の符号化及び復号の後に、不連続な異音感を生じないようにすることができ、高品質に符号化及び復号されたステレオ信号の音質を損なわないように処理することができる。
なお、サンプル差値が2以上の場合、即ち2サンプル以上の重なりが生じる場合もあるが、その場合は三角窓などで整合すればよい。例として、サンプル差値が2(重なりの数が2)の場合と、サンプル差値が3(重なりの数が3)の場合について式(8)に示す。
このように、本実施の形態によれば、上記実施の形態1の効果に加えて、重なった部分のサンプル値を、重なったサンプルを含む前後のフレームから求めるので、両フレームの情報を無駄なく使用することができるとともに、聴感的に音の不連続感を起き難くすることができる。
なお、上記の各実施の形態では、左チャネル信号、右チャネル信号という名称を用いて2つのステレオ信号を表したが、より一般的な第1チャネル信号、第2チャネル信号とい
う名称を用いることもできる。
う名称を用いることもできる。
また、上記の各実施の形態では、ステレオ信号のうち左チャネル信号を固定する場合について説明したが、本発明は、右チャネル信号を固定しても同様の効果を得ることができる。この場合、上記各実施の形態の説明の左チャネル信号と右チャネル信号を逆にすればよい。
また、上記の各実施の形態ではサンプル差値の範囲を±16としたが、本発明はサンプル差値の範囲について限定はない。この範囲を広くすれば遅延を表現するバリエーションが増えるのでより高品質になり、狭くすれば符号化ビットを減らすことができる。
また、上記の各実施の形態ではサンプル差値の変動量を±1サンプルとしたが、本発明はサンプル差値の変動量について限定はない。ただし、サンプル差値の変動量は、空きサンプル内挿部315で内挿できる範囲が限界であり、発明者はサンプリングレートが16kHzのステレオ音声では1ないし2サンプルが限界であることも検証している。
また、上記の各実施の形態では空きサンプル内挿部315の内挿を前後5サンプルの線形和で行ったが、本発明は内挿に使用するサンプル数について限定はない。もっと多ければ補間精度を向上させることができる。なお、5サンプルというのは発明者が実験により検討した最低のサンプル数であり、これ以上少なくすることは補間精度を落とし小さな異音感に繋がることを検証している。勿論、内挿に使用するサンプル数を増やし過ぎると計算量が増加するという課題もある。
また、上記の各実施の形態ではサンプル差値を整数値としたが、本発明はこれに限られず、サンプル差値として分数値を使用することもできる。この場合、SINC関数などを使って分数値を補間することによって使用する。分数値を使用することによってより時間差の精度を向上させることができる。ただし、1/2精度、1/3精度と精度を向上させていくと計算量が増加するという課題もある。ちなみに、発明者は、サンプリングレートが16kHzであれば整数精度で効果が得られることを確認している。また、発明者は、8kHzサンプリングの場合は1/2精度など精度の向上が必要であることを確認している。
また、本発明は、サンプリングレートに依存せず、8kHz、16kHz、32kHz、44.1kHz、48kHzサンプリングなど全てのサンプリングレートに対応することができる。なお、32kHz以上のサンプリングレートの場合は、サンプル差値として±16よりももっと広い範囲の探索が必要になる。また、この場合には、多くのサンプルの補間が可能になるので、サンプル差値の変動量を増やすことができる。
また、上記の各実施の形態では、符号化側から復号側に符号化した情報を伝送する場合について説明したが、本発明は、符号化側において符号化した情報を媒体記録に格納する場合も有効である。オーディオ信号はメモリやディスクに蓄積して用いる場合も多く、本発明はその場合にも有効である。
また、上記の各実施の形態では2チャネルの場合について示したが、本発明は、チャネル数について限定はなく、5.1chなどの多チャネルの場合にも有効であり、固定するチャネルと時間差を伴った相関のあるチャネルを明らかにすればそのまま適用することができる。
また、上記の各実施の形態ではモノラル信号とサイド信号をそれぞれ符号化する場合について示したが、本発明はこれに限られず、モノラル信号のみを使用する方法でも有効で
ある。本発明を用いることにより、位相のずれを補正してダウンミックスすることができるので、より音源に近い高品質のモノラル信号を得ることができる。
ある。本発明を用いることにより、位相のずれを補正してダウンミックスすることができるので、より音源に近い高品質のモノラル信号を得ることができる。
また、上記の各実施の形態において、左チャネル信号と右チャネル信号をモノラル信号とサイド信号に変換する式は、以下の式(9)のマトリクスで表現することができるが、このマトリクスが式(9)と異なる場合であっても本発明は有効である。位相の差を少しずつ補正し、元に戻す際に生じる空白区間を内挿補間するという本発明の特徴は、上記マトリクスの特徴に依存しないからである。したがって、5.1チャンネルなどの多チャンネル信号の変換の場合には、マトリクスの次元はもっと大きくなり、数値も複雑になるが、その場合にも本発明は有効である。
なお、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置等と同様の機能を実現することができる。
また、上記の各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2007年12月21日出願の特願2007−330991の日本出願、及び2008年9月30日出願の特願2008−253636の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係るステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法は、携帯電話、IP電話、テレビ会議等に用いるに好適である。
Claims (10)
- ステレオ信号を構成する第1チャネル信号と第2チャネル信号との相関が最も高くなるタイミング差を分析する分析手段と、
前記タイミング差に基づいて前記第2チャネル信号を時間移動させるスライド手段と、
前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号を生成する和差計算手段と、
を具備するステレオ信号変換装置。 - 前フレームにおいて前記第2チャネル信号を移動させた値と前記タイミング差とに基づいて現フレームの移動値を計算する移動値計算手段を、さらに具備し、
前記スライド手段は、前記現フレームの移動値だけ前記第2チャネル信号を時間移動させる、
請求項1記載のステレオ信号変換装置。 - 前記移動値計算手段は、前記タイミング差が前フレームにおいて前記第2チャネル信号を移動させた値と同じ場合には現フレームの移動値を前フレームのものと同じ値とし、前記タイミング差が前フレームにおいて前記第2チャネル信号を移動させた値より大きい場合には現フレームの移動値を前フレームのものに対して所定幅だけ増やし、前記タイミング差が前フレームにおいて前記第2チャネル信号を移動させた値より小さい場合には現フレームの移動値を前フレームのものに対して所定幅だけ減らす、
請求項2記載のステレオ信号変換装置。 - 請求項1記載のステレオ信号変換装置と、
前記ステレオ信号変換装置が生成したモノラル信号を符号化する第1符号化手段と、
前記ステレオ信号変換装置が生成したサイド信号を符号化する第2符号化手段と、
前記ステレオ信号変換装置において前記第2チャネル信号を移動させた値を示す情報を符号化する第3符号化手段と、
を具備する符号化装置。 - ステレオ信号を構成する第1チャネル信号と時間移動させた後の第2チャネル信号との和に関するモノラル信号の符号化データを復号したモノラル再生成信号と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号の符号化データを復号したサイド再生成信号とを用いて、前記第1チャネル信号の再生成信号および前記時間移動させた後の第2チャネル信号の再生成信号を生成する再生成信号生成手段と、
前記時間移動させた後の第2チャネル信号の再生成信号を元に戻すように移動させる逆スライド手段と、
を具備するステレオ信号逆変換装置。 - 前記逆スライド手段にて前記第2チャネル信号の再生成信号を移動させた結果、前記第2チャネル信号の再生成信号の信号列に空白区間が生じる場合に、前記空白区間を内挿補間する内挿補間手段を、さらに具備する請求項5記載のステレオ信号逆変換装置。
- 前記逆スライド手段にて前記第2チャネル信号の再生成信号を移動させた結果、前記第2チャネル信号の再生成信号の信号列に重なり区間が生じる場合に、前記重なり区間の前記第2チャネル信号の再生成信号を用いて、予め設定された演算を行うことにより、前記重なり区間の重なりを解消する重なり区間処理手段を、さらに具備する請求項5記載のステレオ信号逆変換装置。
- 前記モノラル信号の符号化データを復号して前記モノラル再生成信号を生成する第1復号手段と、
前記サイド信号の符号化データを復号して前記サイド再生成信号を生成する第2復号手段と、
前記第2チャネル信号を移動させた値を示す情報の符号化データを復号する第3復号手段と、
請求項5記載のステレオ信号逆変換装置と、
を具備する復号装置。 - ステレオ信号を構成する第1チャネル信号と第2チャネル信号との相関が最も高くなるタイミング差を分析する分析工程と、
前記タイミング差に基づいて前記第2チャネル信号を時間移動させるスライド工程と、
前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号を生成する和差計算工程と、
を具備するステレオ信号変換方法。 - ステレオ信号を構成する第1チャネル信号と時間移動させた後の第2チャネル信号との和に関するモノラル信号の符号化データを復号したモノラル再生成信号と、前記第1チャネル信号と前記時間移動させた後の第2チャネル信号との差に関するサイド信号の符号化データを復号したサイド再生成信号とを用いて、前記第1チャネル信号の再生成信号および前記時間移動させた後の第2チャネル信号の再生成信号を生成する再生成信号生成工程と、
前記時間移動させた後の第2チャネル信号の再生成信号を元に戻すように移動させる逆スライド工程と、
を具備するステレオ信号逆変換方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007330991 | 2007-12-21 | ||
JP2007330991 | 2007-12-21 | ||
JP2008253636 | 2008-09-30 | ||
JP2008253636 | 2008-09-30 | ||
PCT/JP2008/003893 WO2009081567A1 (ja) | 2007-12-21 | 2008-12-22 | ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2009081567A1 true JPWO2009081567A1 (ja) | 2011-05-06 |
Family
ID=40800884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009546943A Withdrawn JPWO2009081567A1 (ja) | 2007-12-21 | 2008-12-22 | ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20100290629A1 (ja) |
EP (1) | EP2237267A4 (ja) |
JP (1) | JPWO2009081567A1 (ja) |
WO (1) | WO2009081567A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2264698A4 (en) * | 2008-04-04 | 2012-06-13 | Panasonic Corp | STEREO SIGNAL CONVERTER, STEREO SIGNAL INVERTER AND METHODS THEREOF |
JPWO2009142017A1 (ja) * | 2008-05-22 | 2011-09-29 | パナソニック株式会社 | ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 |
CN102292769B (zh) * | 2009-02-13 | 2012-12-19 | 华为技术有限公司 | 一种立体声编码方法和装置 |
US9456289B2 (en) * | 2010-11-19 | 2016-09-27 | Nokia Technologies Oy | Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof |
US9055371B2 (en) | 2010-11-19 | 2015-06-09 | Nokia Technologies Oy | Controllable playback system offering hierarchical playback options |
US9313599B2 (en) | 2010-11-19 | 2016-04-12 | Nokia Technologies Oy | Apparatus and method for multi-channel signal playback |
CN104335599A (zh) | 2012-04-05 | 2015-02-04 | 诺基亚公司 | 柔性的空间音频捕捉设备 |
EP2982139A4 (en) | 2013-04-04 | 2016-11-23 | Nokia Technologies Oy | AUDIOVISUAL PROCESSING APPARATUS |
WO2014184618A1 (en) | 2013-05-17 | 2014-11-20 | Nokia Corporation | Spatial object oriented audio apparatus |
GB2519379B (en) * | 2013-10-21 | 2020-08-26 | Nokia Technologies Oy | Noise reduction in multi-microphone systems |
CN106033672B (zh) * | 2015-03-09 | 2021-04-09 | 华为技术有限公司 | 确定声道间时间差参数的方法和装置 |
US10152977B2 (en) * | 2015-11-20 | 2018-12-11 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10074373B2 (en) * | 2015-12-21 | 2018-09-11 | Qualcomm Incorporated | Channel adjustment for inter-frame temporal shift variations |
CN107742521B (zh) | 2016-08-10 | 2021-08-13 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN108877815B (zh) | 2017-05-16 | 2021-02-23 | 华为技术有限公司 | 一种立体声信号处理方法及装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4149039A (en) * | 1976-11-05 | 1979-04-10 | Kokusai Denshin Denwa Co., Ltd. | Frequency band compression of FDM using time expansion |
JPH0255431A (ja) * | 1988-08-19 | 1990-02-23 | Matsushita Electric Ind Co Ltd | 情報伝送装置 |
JP3400064B2 (ja) * | 1994-02-28 | 2003-04-28 | 株式会社東芝 | 音声符号復号化装置、音声符号化装置及び音声復号化装置 |
JP3335605B2 (ja) | 2000-03-13 | 2002-10-21 | 日本電信電話株式会社 | ステレオ信号符号化方法 |
EP1479263B1 (en) * | 2002-01-29 | 2008-02-27 | Bang & Olufsen A/S | Modular loudspeaker |
EP1736965B1 (en) * | 2004-04-28 | 2008-07-30 | Matsushita Electric Industrial Co., Ltd. | Hierarchy encoding apparatus and hierarchy encoding method |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
WO2007052612A1 (ja) * | 2005-10-31 | 2007-05-10 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置およびステレオ信号予測方法 |
JP4882430B2 (ja) * | 2006-03-07 | 2012-02-22 | 富士通株式会社 | 図形描画プログラム、方法及び装置 |
TW200742275A (en) * | 2006-03-21 | 2007-11-01 | Dolby Lab Licensing Corp | Low bit rate audio encoding and decoding in which multiple channels are represented by fewer channels and auxiliary information |
JP4714075B2 (ja) * | 2006-05-11 | 2011-06-29 | 日本電信電話株式会社 | 多チャネル信号符号化方法、その方法を用いた装置、プログラム、および記録媒体 |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
US8355921B2 (en) * | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
WO2010037427A1 (en) * | 2008-10-03 | 2010-04-08 | Nokia Corporation | Apparatus for binaural audio coding |
-
2008
- 2008-12-22 EP EP08863826A patent/EP2237267A4/en not_active Withdrawn
- 2008-12-22 US US12/809,154 patent/US20100290629A1/en not_active Abandoned
- 2008-12-22 JP JP2009546943A patent/JPWO2009081567A1/ja not_active Withdrawn
- 2008-12-22 WO PCT/JP2008/003893 patent/WO2009081567A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20100290629A1 (en) | 2010-11-18 |
WO2009081567A1 (ja) | 2009-07-02 |
EP2237267A4 (en) | 2012-01-18 |
EP2237267A1 (en) | 2010-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2009081567A1 (ja) | ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 | |
RU2625444C2 (ru) | Система обработки аудио | |
JP5277508B2 (ja) | マルチ・チャンネル音響信号をエンコードするための装置および方法 | |
KR101203244B1 (ko) | 통신 시스템에서 은닉 프레임들을 발생시키는 방법 | |
RU2305870C2 (ru) | Оптимизированное по точности кодирование с переменной длиной кадра | |
US8311810B2 (en) | Reduced delay spatial coding and decoding apparatus and teleconferencing system | |
KR101290486B1 (ko) | 다운믹스 오디오 신호를 업믹싱하는 장치, 방법 및 컴퓨터 프로그램 | |
US8817992B2 (en) | Multichannel audio coder and decoder | |
JP5269914B2 (ja) | ステレオ音響信号符号化装置、ステレオ音響信号復号装置およびそれらの方法 | |
JP4976304B2 (ja) | 音響信号処理装置、音響信号処理方法およびプログラム | |
JPWO2007116809A1 (ja) | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 | |
KR20150073180A (ko) | 후방 호환성 다중 해상도 공간적 오디오 오브젝트 코딩을 위한 인코더, 디코더 및 방법 | |
WO2009122757A1 (ja) | ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 | |
JPWO2008132826A1 (ja) | ステレオ音声符号化装置およびステレオ音声符号化方法 | |
KR20210071972A (ko) | 신호 처리 장치 및 방법, 그리고 프로그램 | |
JP6654236B2 (ja) | オーディオ変換コーディングにおけるオーバーラップ率の信号適応スイッチングのための符号化器、復号器および方法 | |
JPWO2008090970A1 (ja) | ステレオ符号化装置、ステレオ復号装置、およびこれらの方法 | |
WO2009142017A1 (ja) | ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法 | |
KR102654181B1 (ko) | 예측 코딩에서 저비용 에러 복구를 위한 방법 및 장치 | |
RU2807473C2 (ru) | Маскировка потерь пакетов для пространственного кодирования аудиоданных на основе dirac | |
JP2023514531A (ja) | マルチチャンネル音コーデックにおけるステレオコーディングモードの切り替え | |
KR19990053837A (ko) | 오디오 신호의 에러 은닉 방법과 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111124 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20120604 |