JP2003274492A - ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム - Google Patents
ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラムInfo
- Publication number
- JP2003274492A JP2003274492A JP2002071971A JP2002071971A JP2003274492A JP 2003274492 A JP2003274492 A JP 2003274492A JP 2002071971 A JP2002071971 A JP 2002071971A JP 2002071971 A JP2002071971 A JP 2002071971A JP 2003274492 A JP2003274492 A JP 2003274492A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- source signal
- phase difference
- power
- predetermined threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Stereophonic System (AREA)
Abstract
から発せられた複数の音響信号が混ざった2チャネルス
テレオ信号において、中央付近に定位する音源信号を強
調する。 【解決手段】 ステレオ信号を各チャネルごとに複数の
周波数成分に分割する過程と、各周波数ごとに中央付近
に定位する音源信号成分と中央付近以外に定位する音源
信号を判別する過程と、中央付近に定位する音源信号の
パワーと中央付近以外に定位する音源信号のパワーを推
定する過程と、その比を計算する過程と、その比に応じ
て中央付近以外に定位する音源信号を抑圧する過程とを
実行するステレオ音響信号処理方法。
Description
種環境音源などの複数の音源から発せられた複数の音響
信号が混ざった2チャネルステレオ信号において、中央
付近に定位する音源信号を強調するステレオ音響信号処
理方法、装置及びそのプログラムに関する。
目的とする音源信号を聞き取る能力(いわゆるカクテル
パーティー効果と呼ばれる)が劣っているといわれてい
る。このため、健聴者を対象に作成された音楽信号で
は、しばしば伴奏が歌よりも大きく感じられることが指
摘されている。この場合にはセンターに定位する歌を強
調し、伴奏を抑圧することが望まれる。複数の音源が混
合された信号から目的とする音源信号を抽出、もしくは
強調する方法には以下のようなものがある。
域において基本周波数を推定し、調波構造を抜き出すこ
とにより、同一音源と推定する成分を再合成する方法で
ある。しかしこの一つ目の方法では、音源は調波構造に
限定され、さらに音源の調波構造の推定には必ず誤差が
生じるため、それが雑音として知覚されることにより、
目的音源信号の抽出精度が悪くなる問題があった。二つ
目は、周波数特性の変動が比較的ゆるやかな定常的な雑
音源と周波数特性が定常的音源よりも頻繁に変動する例
えば音声のような目的信号音源が重畳された信号から、
後者の目的音源信号を抽出、もしくは強調する方法であ
り、スペクトラルサブトラクション法等が代表例であ
る。これは混合された信号を周波数領域において、まず
目的音源信号が重畳されていない部分、すなわち雑音源
信号を推定し、雑音源信号の平均的な周波数特性を記憶
する。そして、周波数領域において、雑音源信号と目的
音源信号が重畳された信号から記憶された雑音源の平均
的な周波数構造を減算することで目的音源信号を強調、
もしくは抽出する方法である。
が定常であることが必要で、歌の伴奏のように非定常な
音源の伴奏のみの個所の推定、及び抑圧は困難であっ
た。三つ目は、ステレオ信号の左右差を利用し、左右差
の小さい成分を抽出することで、中央に定位する音源信
号を強調する方法である(特願2000−26844
2、特願2001−038344)。一つ目、二つ目の
方法と違い、音源の調波性や定常性には依存しないで中
央付近に定位する音源信号を強調できる。しかしなが
ら、前述の発明(特願2000−268442、特願2
001−038344)は、中央以外に定位する音源信
号を抑圧する量を受聴音の好みなどで所望な量に調整す
ることは可能であったが、その調整は音量を調整するの
と同様に、利用者自身の操作が必要であった。音楽の場
合、伴奏と歌の大きさの差は楽曲によって様々である。
その差に応じて、抑圧する量が制御できることが望まし
い。また、歌の合間においては、必ずしもセンターに強
調すべきメイン楽器が定位しているとは限らない。その
場合は、抑圧を解除することが必要となるであろう。音
楽を聴いている合間の頻繁な操作は鑑賞の妨げになるの
で、これらの調整は、システム側で自動に行われること
が望ましい。
レオ音響信号から中央付近に定位する音源信号(チャネ
ル間レベル差及び位相差が所定の閾値より小さい音源信
号)を強調する技術において、中央付近に定位する音源
信号と中央以外に定位する音源信号(チャネル間レベル
差及び位相差が所定の閾値より大きい音源信号)の大き
さの差を計算し、その結果に応じて、中央以外に定位す
る音源信号を抑圧すべき量を自動的に調整することを可
能とすることである。
号を各チャネル毎に複数の周波数帯域に分割する周波数
帯域分割処理と、各周波数帯域毎にチャネル間レベル差
及び位相差が所定の閾値より小さい音源信号と、チャネ
ル間レベル差及び位相差が所定の閾値より大きい音源信
号とを判別する類似度判定処理と、前記チャネル間レベ
ル差及び位相差が所定の閾値より小さい音源信号のパワ
ーと前記チャネル間レベル差及び位相差が所定の閾値よ
り大きい音源信号のパワーを推定するパワー計算処理
と、前記パワー計算処理で得られた各音源信号のパワー
の比を算出するパワー比計算処理と、前記パワー比計算
処理で得られたパワー比に応じて前記チャネル間レベル
差及び位相差が所定の閾値より大きい音源信号を抑圧す
る抑圧制御処理とを実行するステレオ音響信号処理方法
を提案する。
理方法において、前記チャネル間レベル差及び位相差が
所定の閾値より大きい音源信号の抑圧制御は前記パワー
比に基づいて前記周波数帯域に分割された各帯域毎に減
衰係数を算出し、該減衰係数で各帯域成分に重み付けし
て実行するステレオ音響信号処理方法を提案する。この
発明では更に前記ステレオ音響信号処理方法において、
前記チャネル間レベル差及びチャネル間位相差が所定の
閾値より大きい音源信号の抑圧量は、前記パワー比に基
づいて一意に決まる量に予め設定しておくステレオ音響
信号処理方法を提案する。
ル毎に複数の周波数帯域に分割する周波数帯域分割部
と、各周波数帯域毎にチャネル間レベル差及び位相差が
所定の閾値より小さい音源信号と、チャネル間レベル差
及び位相差が所定の閾値より大きい音源信号とを判別す
る類似度判定部と、前記チャネル間レベル差及び位相差
が所定の閾値より小さい音源信号のパワーと前記チャネ
ル間レベル差及び位相差が所定の閾値より大きい音源信
号のパワーを推定するパワー計算部と、前記パワー計算
処理で得られた各音源信号のパワーの比を算出するパワ
ー比計算部と、前記パワー比計算処理で得られたパワー
比に応じて前記チャネル間レベル差及び位相差が所定の
閾値より大きい音源信号を抑圧する抑圧制御部とを有す
るステレオ音響信号処理装置を提案する。
可能な符号によって記述され、前記請求項1乃至3記載
のステレオ音響信号処理方法の何れかをコンピュータに
実行させるステレオ音響信号処理プログラムを提案す
る。作用 入力されたステレオ信号をチャネルごとに複数の周波数
成分に分割する。そして、各周波数成分ごとにチャネル
間の信号成分の類似度をその振幅比や位相差によって決
定する。そしてまず、類似度の高い周波数成分の合算パ
ワーと、その残り、即ち類似度の低い周波数成分の合算
パワーの比を計算する。次にそのパワー比に応じて、類
似度の高い周波数成分に比べて類似度の低い周波数成分
が小さくなるような一つ目の減衰係数を得る。さらに、
類似度の低い周波数成分の時間平均値を計算し、その値
と、前記パワー比から二つ目の減衰係数を得る。また、
この二つの減衰係数から実際に各成分に乗算する減衰係
数を選択して、各周波数成分に乗算、各チャネルごとに
再合成して出力すれば、中央付近に定位する音源信号の
中央付近以外に定位する音源信号からの相対的な大きさ
に応じて中央に定位する音源が強調される。実施例 図1は本発明の一実施例を示すブロック図である。ステ
レオ信号入力部102に入力される音源信号は、強調し
たい目的音源信号が左右チャネル間のレベル差及び位相
差が小さい状況に収音されているステレオ信号であれば
本発明は有効である。
テレオ信号は左右のチャネルごとに処理される。以下に
その処理方法の詳細を述べる。左チャネルの信号sL
は、左チャネル周波数帯域分割部103によって周波数
領域に変換される。同様に右チャネルの信号sRは、右
チャネル周波数帯域分割部104によって周波数領域に
変換される。ここで帯域分割数をNとする。左チャネル
において帯域分割された信号成分を低い周波数から順に
fL(0),fL(1),fL(2)…fL(k)…f
L(N−1)とする。右チャネルにおいて帯域分割され
た信号成分を低い周波数から順にfR(0),fR
(1),fR(2)…fR(k)…fR(N−1)とす
る。類似度計算部105において、fL(k),fR
(k)は、同じ周波数帯域ごとに類似度a(0),a
(1),a(2)…a(k)…a(N−1)が計算され
る。ステレオ信号において、中央付近に定位する音源信
号は左右の信号が一致、もしくはその差違が非常に小さ
い。これは即ち、周波数領域に変換した後も全ての周波
数帯域において、左右の成分の差違は小さいことを意味
する。このことから類似度は、kが等しい、即ち同じ周
波数帯域間で、fL(k)とfR(k)の差違で決定す
ることが出来る。
左右チャネル周波数帯域分割部103,104が短時間
フーリエ変換(以下、FFTと略する)である場合につ
いて述べる。FFTで周波数分割した場合、fL(k)
およびfR(k)は一般に複素数となり、位相を考慮す
る必要がある。そこで、各成分の大きさの比と位相差に
よって二つの類似度を計算する。つまり、チャネル間レ
ベル比に基づく尺度を示す類似度をai(k)、チャネ
ル間位相差に基づく尺度を示す類似度をap(k)とす
ると、 ai(k)=|fR(k)|/|fL(k)| (|fR(k)|<=|fL(k)|の時 ) =|fL(k)|/|fR(k)| (|fL(k)|<|fR(k)|の時)(1) ここで|A|は、A(複素数)の大きさを表す。
0<=|θ|<=π)を表す。また、A*は、A(複素
数)の共役複素数、Re(A)は、A(複素数)の実数
部を表す。類似度ai(k),ap(k)はセンターパ
ワー/非センターパワー計算部114及び左右差減衰係
数計算部106及びSS減衰係数計算部107に送られ
る。
計算部114における、センターパワーと非センターパ
ワーの比cbの計算方法とcbに基づいて最低減衰係数
計算部115で計算されるGimin(cb),Gpm
in(cb)及びGsmin(cb)の計算方法につい
て順次説明する。上記(1)式から明らかなように、類
似度ai(k)は、fL(k)とfR(k)の大きさが
等しい時に1になり、それ以外は1より小さい値にな
る。cbを計算するためのセンターと非センターの類似
度ai(k)に対する閾値をaithd(k)として、
1以下で1に近い値に設定し、中央付近に定位する音源
とそれ以外を分ける閾値として、おおよそ0.3〜0.
5程度が適当な値である。
ap(k)は、fL(k)とfR(k)の位相が一致し
たときに1になり、それ以外は1より小さい値であり、
位相差θがπ/2ラジアンのときに0,θがπラジアン
の時、すなわち逆相の時に−1で最小である。少なくと
も中央付近に定位する音源信号に関しては位相差は0に
近く、よってap(k)は1に近い値であることが期待
できる。cbを計算するためのセンターと非センターの
類似度ap(k)に対する閾値をapthd(k)とし
て、1以下で1に近い値に設定するが、中央付近に定位
する音源とそれ以外を分ける閾値として、おおよそ0.
7〜0.9程度が適当な値である。
に、センター音パワーcpw及び非センター音パワーb
pwが、下記のように計算される cpw=Σk=m,n(|fR(k)|*|fR(k)|+|fL(k)|*|fL(k)|) (ai(k)>=aithd(k)かつap(k)>=apthd(k)のとき) (3) bpw=Σk=m,n(|fR(k)|*|fR(k)|+|fL(k)|*|fL(k)|) (ai(k)<aithd(k)またはap(k)<apthd(k)のとき) (4) Σk=m,n A(k)は、kをmからnまで、A(k)を加
算する、即ち、 A(m)+A(m+1)+A(m+2)+……+A(n-1)+A(n) ことを表す。
=nである。これらの値は、目的に応じてパワー計算時
の帯域を制限する効果がある。歌の入った楽曲では、歌
が中央に定位するのが一般的だが、歌の他に、ベースギ
ターやベースドラム等も中央に定位させることが多い。
歌を強調することが目的である場合、歌の中心帯域にお
けるセンター音パワーと非センター音パワーを知りた
い。この場合mは、おおよそ100Hz〜200Hz、
nは3kHz〜4kHz程度までの帯域に対応する値に
することが適当である。
パワーbpwより、cbが以下のように計算出来る。 cb=cpw/bpw (5) cbは、信号と雑音の比を表すSN比に対応する。ここ
では、中央付近に定位する音が(所望の)信号であり、
非センター音が雑音ということになる。次に、cbを使
って、最低減衰係数計算部115においてGimin
(cb),Gpmin(cb),Gsmin(cb)を
計算する方法の一例を説明する。Gimin(cb)
は、左右差減衰係数計算部106において計算される大
きさの比による減衰係数gi(k)の最低値である。G
pmin(cb)は、左右差減衰係数計算部106にお
いて計算される位相差による減衰係数gp(i)の最低
値である。Gsmin(cb)は、SS減衰係数計算部
107で計算されるSS減衰係数gs(k)の最低値で
ある。gi(k),gp(k),gs(k)の計算方法
については、後述する。
とGimin(cb),Gpmin(cb),Gsmi
n(cb)の関係の一例を説明する。cbが大きいほ
ど、センター定位音は大きく、cbが小さいとセンター
定位音が小さい。cbが大きくなるにつれて、例えば伴
奏に比べて歌が大きいことを意味するから、その場合は
Gimin(cb),Gpmin(cb),Gsmin
(cb)を大きく、1に近い値にする。cbが小さくな
るにつれて、伴奏に比べて歌が小さくなることを意味す
るから、その場合はGimin(cb),Gpmin
(cb),Gsmin(cb)を小さくしていく。セン
ター定位音がない、即ち歌の合間などの場合、非センタ
ー音、即ち伴奏を抑圧することは意味がないばかりか、
不自然さを招く。よって、ある程度cbが小さくなった
ら、またGimin(cb),Gpmin(cb),G
smin(cb)を大きくしていく。この関係を図2に
示す。あるいは、センター音が存在する場合は、その大
きさに関わらず、一定の抑圧をする場合は、図3のよう
にすれば良い。図2、3において、a1は概ね−6dB
〜−3dB程度、a2は−3dBから0dB程度、a3
は3dB〜6dB程度の値である。また、b1は、0d
Bより小さく、最低−20dB程度の値である。cbの
値から実際にGimin(cb),Gpmin(c
b),Gsmin(cb)を求めるには、図2や図3の
ような関係を満たす関数式で計算しても、いくつかに細
分割してあらかじめ記憶してあるテーブルを参照しても
構わない。図2、図3に示すようなcbに応じた設定
は、受聴者の好み等に応じてあらかじめ設定しておくも
のである。その設定方法としては、例えば受聴者個々
で、事前にcbの大きさの異なるサンプル曲で、好みの
Gimin(cb),Gpmin(cb),Gsmin
(cb)を選択してもらい、その値から間を補間し、図
2や図3のような関係を作成し、記憶しておけばよい。
と周波数分析するフレーム単位で変化する。この値でそ
のままGimin(cb),Gpmin(cb),Gs
min(cb)を計算すると、抑圧量の瞬時の変動幅が
大きくなり、出力音が不自然になることがある。その場
合、必要に応じて、cbの長時間平均をして変化を滑ら
かにすることも有効である。cbの長時間平均の方法に
は、移動平均を用いる方法がある。また、Gimin
(cb),Gpmin(cb),Gsmin(cb)を
求めた後、その値を平滑化しても良い。またこの二つの
方法を併用しても良い。
われる左右差減衰係数gd(k)の計算方法について説
明する。まず大きさの比による減衰係数gi(k)を計
算する。(1)式から明らかなように、類似度ai
(k)は、fL(k)とfR(k)の大きさが等しい時
に1になり、それ以外は1より小さい値になる。したが
って、大きさの比による類似度ai(k)を引数とする
関数において、単調増加の関数の出力をgi(k)に選
べばよい。図4にその一例を示す。横軸は20*1og
10(ai(k))、縦軸は20*1og10(gi
(k))を示している。中央に定位する音源信号だけで
あるならば、全てのkに対してai(k)は1(20*
1og10(ai(k)=0)になるが、その他に定位す
る信号が重畳されることにより、中央定位成分が支配的
な帯域であっても1よりもやや小さくなることがある。
ことが有効である。Gimin(cb)は、非中央定位
成分の抑圧量に相当し、前述のように計算され、例えば
歌と伴奏のバランスに応じて、伴奏の大きさを調整する
ことが可能となる。図4においてβをεと一致させても
良いし、一致させなくても良い。βをεに近づけると非
中央定位成分は等しくGimin(cb)の減衰量で減
衰されることが期待できるが、中央定位音源信号の支配
的な帯域が誤って抑圧された場合の誤差の影響も大きく
なる。βをεから離すことで中央定位音源信号が支配的
な帯域を誤って抑圧した場合の誤差の影響を小さく出来
るが、定位する位置によって抑圧量が変ってしまい、歌
の伴奏に例えるならば、伴奏楽器間の音量のバランスが
変ってしまうことなども予想される。よって、中央定位
音源信号の音質などの変化が無視できる範囲でβはεに
近い値(0>ε>β)にすることが望ましい。εは概ね
0dBより大きく最大6dB程度、βは、最大12dB
程度である。
算方法について説明する。(2)式から明らかなよう
に、類似度ap(k)は、fL(k)とfR(k)の位
相が一致したときに1になり、それ以外は1より小さい
値であり、位相差θがπ/2ラジアンのときに0,θが
πラジアンの時、すなわち逆相の時に−1で最小であ
る。一般に位相差による定位知覚は周波数帯域にも依存
し、大きさの比ほど単純ではない。しかし、少なくとも
中央に定位する音源信号に関しては位相差は0に近く、
よってap(k)は1に近い値であることが期待でき
る。このことから位相差による減衰係数gp(k)は例
えば図5に示すように計算すれば良い。図5において、
横軸はap(k)、縦軸は20*log10(gp
(k))を表す。中央に定位する音源信号だけであるな
らば、全てのkに対してap(k)は1になるが、その
他の雑音信号が重畳されることにより、中央定位音源信
号が支配的な帯域であっても1よりもやや小さくなるこ
とがある。よって図5のように適当な幅ζを持たせるこ
とが有効である。Gpmin(cs)は、非中央定位成
分の抑圧量に相当し、前述のように計算され、例えば歌
と伴奏のバランスに応じて、伴奏の大きさを調整するこ
とが可能となる。図5においてαをζと一致させても良
いし、一致させなくても良い。αをζに近づけると非中
央定位成分は等しくGpmin(cs)の減衰量で減衰
されることが期待できるが、中央定位音源信号の支配的
な帯域が誤って抑圧された場合の誤差も大きくなる。α
をζから離すことで中央定位音源信号が支配的な帯域を
誤って抑圧された場合の誤差の影響を小さく出来るが、
位相差による抑圧量の違いは周波数帯域によってその影
響度が異なるため、歌の伴奏に例えるならば、伴奏楽器
の音量のバランスだけではなく音色などが変ってしまう
ことなどが予想される。よって、中央定位音源信号の変
化が無視できる範囲でαはζに近い値(0>ζ>α)に
することが望ましい。ζは0.9〜0.8程度で最低で
0.5程度、αは最低で0.0程度である。
(k)から左右差減衰係数gd(k)を計算する方法に
ついて述べる。適当な距離を離した二つのマイクロホン
で比較的マイクロホンから距離が近い複数の音源信号を
収音したステレオ信号が入力信号である場合には、ステ
レオ再生における定位は左右のマイクロホンに入ってく
る信号の位相差と大きさの比(レベル差)に依存する。
低い周波数においてはレベル差はつきにくく、位相差が
大きく影響する。高い周波数では、大きさの比が大きく
影響する。よって、例えば周波数帯域を二つに分けてそ
れよりも低い周波数においてはgi(k)を、高い周波
数においてはgp(k)を採用することが考えられる。
しかしながら、壁に囲まれた残響のある部屋において、
マイクロホンから離れた位置に存在する音源からの信号
は一般に左右のレベル差はほとんどなく、逆に位相が左
右のマイクロホンでランダムになるため(2)式の値が
0に近くなる。この場合は全ての周波数において優先的
にgp(k)を使うことが望ましい。さらにポピュラー
音楽等の場合は、直接マイクロホンで収音するだけでな
く、左右チャネル信号に大きさの比や時間差、あるいは
位相の時間的な変化を人工的に付加することで自然界に
は存在しない定位を得ることが普通であり、もっと複雑
になる。以上のように様々なステレオ入力信号に応じ
て、最適なgd(k)の選択をすることは非常に困難で
ある。しかしながら、どの場合も少なくとも中央に定位
する音源信号の大きさの比と位相差は共に小さい。そこ
で、減衰係数gd(k)として、gi(k)とgp
(k)の小さいほうを採用することにする。即ち、 gd(k)=min(gi(k),gp(k)) (6) ここで、min(A,B)はAとBの何れかの小さいほ
うを出力することを意味する。つまり、どんなステレオ
入力信号であっても、大きさか位相の少なくともどちら
か一方が左右で異なる場合は抑圧することになり、その
結果、中央に定位する音源信号を強調することが可能と
なる。ここでの抑圧制御は短時間(フレーム)毎のレベ
ル比を抑圧制御の手がかりとしているため、短時間毎の
非定常的非中心音源の抑圧に貢献する。
(cb)の関係は、同じであっても構わないが、それは
必須ではない。例えば、Gpmin(cb)をcbに関
わらず、常に1にしておけば、結果的に、位相差情報は
使用せず、レベル差情報だけで、非センター音を抑圧を
することになる。ポピュラー音楽等ではしばしば特殊な
音響処理によって、位相が時間的に回転を繰り返してい
るような場合があり、瞬時の位相情報で抑圧をすると、
不自然な異音が発生することがある。その場合、Gpm
in(cb)をcbに関わらず、常に1にしておけば良
い。
ついて述べる。まず、非中央定位成分の時間平均を計算
する。周波数分析のフレーム長単位の各時刻における周
波数成分の左右の平均を|fM(k)|として、それら
のうち類似度がレベル差類似度ai(k)、位相差類似
度ap(k)共に小さい成分を抽出し、|fN(k)|
とする。次に|fN(k)|の時間平均を取り、その値
を|fA(k)|とする。時間平均の方法には過去数時
刻の|fN(k)|を記憶しておき、その移動平均を取
る方法、その際、最近のフレームに大きな重みづけをす
る方法、忘却係数を用いる方法など各種考えられるが、
どの方法を用いても本発明の効果には変わりはない。
(k)を算出する一例について述べる。|fA(k)|
は、センターに定位しない成分の時間平均であり、スペ
クトラルサブトラクション法による雑音成分に相当する
から、gs(k)は例えば下記のように求めることが出
来る。 gs(k)=(|fM(k)|−α|fA(k)|)/|fM(k)| (7) gs(k)>1のとき、 gs(k)=1 gs(k)<Gsmin(cb)のとき、gs(k)=Gsmin(cb) ここで、αは消し残りを防ぐための適当な大きさの重み
であり、1〜2程度の値が適当である。Gsmin
(b)は、前述の方法で計算され、gs(k)による非
中央定位成分の最大抑圧量に相当し、例えば歌と伴奏の
バランスに応じて、伴奏の大きさを調整することが可能
となる。ここでの抑圧制御は長時間平均レベルに基づく
ため、定常的非中心音源の抑圧に貢献する。
衰係数gs(k)から最終的にfL(k),fR(k)
に乗算する減衰係数g(k)を算出する。各時刻でgd
(k)が小さい時、それは中央成分ではないことを意味
するから抑圧したい。gd(k)が大きく(1に近
く)、一方gs(k)が小さい成分は定常的に中央成分
ではないことを意味するから、その成分も抑圧したい。
よってどちらか小さいほうを減衰係数として選べばよ
い。最小値選択部108はその選択を行なう。 g(k)=min(gd(k),gs(k)) (8) cbとGimin(cb),Gpmin(cb)の関係
と、Gsmin(cb)との関係は、同じであっても構
わないが、それは必須ではない。例えば、Gpmin
(cb),Gimin(cb)ともにcbに関わらず、
常に1にしておけば、結果的に、瞬時の左右差情報を使
用せずに、スペクトラルサブトラクションのように、平
均的に、非センター音を抑圧をすることを意味する。こ
れにより、非センター音の中で、比較的時間変動の少な
い定常的な成分がより強く抑圧されるため、例えば、ピ
アノやアコースティックギター等の伴奏のように変動の
大きな非定常な音源信号の成分は抑圧されずに残ってし
まいやすい。しかし逆に、強調すべき歌は比較的非定常
であるから、瞬時の左右差で非センター音を抑圧するよ
り、歌の信号の劣化は少ないという利点がある。
は図1にあるように各チャネル各周波数帯域のfL
(k),fR(k)に乗算される。同じ帯域kにおいて
左右のチャネルに同じ減衰係数g(k)を乗算すること
で、中央に定位する音源信号以外の音源信号を定位を維
持したまま抑圧することが可能となる。g(k)を乗算
した信号は、fL(k)は左チャネル音源信号合成部1
09で再合成、時間波形sL′に変換される。fR
(k)は右チャネル音源信号合成部110で再合成、時
間波形sR′に変換される。sL′,sR′はステレオ
信号出力部111から、ステレオラウドスピーカ112
やステレオヘッドホン113に送られる。
ンターに定位する音源信号を強調する際、センター定位
音と非センター定位音のバランスに応じた強調が可能と
なる。上述した各処理はコンピュータ上において、コン
ピュータが読み取り可能な符号によって記述されている
プログラムを実行することにより実現される。プログラ
ムはCD等の記録媒体もしくは通信回線を経由してコン
ピュータにダウンロードされインストールしてCPU等
の演算手段でしてもよい。
テレオ音響信号から中央に定位する音源信号をステレオ
音響信号の中央に定位する音源信号とその他の音源信号
のレベル差に応じて強調することが、可能となり、以下
のような効果が期待できる。難聴者等の受聴者が市販の
音楽ソースを受聴する際、中央に定位する主たる音源信
号である歌とそれ以外の伴奏の音量バランスを、楽曲間
の歌の大小に応じて自動的に調整することが可能とな
り、あらかじめ、楽曲間の歌の大小に応じた受聴者の好
み等による音量バランスを設定しておけば、鑑賞中は、
自動的にその調整がなされ、調整にわずらわせることな
く、音楽をより良く楽しむことが期待できる。
実施例を示すブロック図。
b),Gpmin(cb),Gsmin(cb))とc
bとの関係を示すグラフ。
b),Gpmin(cb),Gsmin(cb))とc
bとの関係を示すグラフ。
i(k)とgi(k)の関係を示すグラフ。
p(k)とgp(k)の関係を示すグラフ。
Claims (5)
- 【請求項1】 ステレオ信号を各チャネル毎に複数の周
波数帯域に分割する周波数帯域分割処理と、 各周波数帯域毎にチャネル間レベル差及び位相差が所定
の閾値より小さい音源信号と、チャネル間レベル差及び
位相差が所定の閾値より大きい音源信号とを判別する類
似度判定処理と、 前記チャネル間レベル差及び位相差が所定の閾値より小
さい音源信号のパワーと前記チャネル間レベル差及び位
相差が所定の閾値より大きい音源信号のパワーを推定す
るパワー計算処理と、 前記パワー計算処理で得られた各音源信号のパワーの比
を算出するパワー比計算処理と、 前記パワー比計算処理で得られたパワー比に応じて前記
チャネル間レベル差及び位相差が所定の閾値より大きい
音源信号を抑圧する抑圧制御処理と、を実行することを
特徴とするステレオ音響信号処理方法。 - 【請求項2】 請求項1記載のステレオ音響信号処理方
法において、前記チャネル間レベル差及び位相差が所定
の閾値より大きい音源信号の抑圧制御は前記パワー比に
基づいて前記周波数帯域に分割された各帯域毎に減衰係
数を算出し、該減衰係数で各帯域成分に重み付けして実
行することを特徴とするステレオ音響信号処理方法。 - 【請求項3】 請求項1記載のステレオ音響信号処理方
法において、前記チャネル間レベル差及びチャネル間位
相差が所定の閾値より大きい音源信号の抑圧量は、前記
パワー比に基づいて一意に決まる量に予め設定しておく
ことを特徴とするステレオ音響信号処理方法。 - 【請求項4】 ステレオ信号を各チャネル毎に複数の周
波数帯域に分割する周波数帯域分割部と、 各周波数帯域毎にチャネル間レベル差及び位相差が所定
の閾値より小さい音源信号と、チャネル間レベル差及び
位相差が所定の閾値より大きい音源信号とを判別する類
似度判定部と、 前記チャネル間レベル差及び位相差が所定の閾値より小
さい音源信号のパワーと前記チャネル間レベル差及び位
相差が所定の閾値より大きい音源信号のパワーを推定す
るパワー計算部と、 前記パワー計算処理で得られた各音源信号のパワーの比
を算出するパワー比計算部と、 前記パワー比計算処理で得られたパワー比に応じて前記
チャネル間レベル差及び位相差が所定の閾値より大きい
音源信号を抑圧する抑圧制御部と、を有することを特徴
とするステレオ音響信号処理装置。 - 【請求項5】 コンピュータが読み取り可能な符号によ
って記述され、前記請求項1乃至3記載のステレオ音響
信号処理方法の何れかをコンピュータに実行させるステ
レオ音響信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002071971A JP3810004B2 (ja) | 2002-03-15 | 2002-03-15 | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002071971A JP3810004B2 (ja) | 2002-03-15 | 2002-03-15 | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003274492A true JP2003274492A (ja) | 2003-09-26 |
JP3810004B2 JP3810004B2 (ja) | 2006-08-16 |
Family
ID=29202095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002071971A Expired - Fee Related JP3810004B2 (ja) | 2002-03-15 | 2002-03-15 | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3810004B2 (ja) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005354695A (ja) * | 2004-06-08 | 2005-12-22 | Bose Corp | オーディオ信号処理 |
EP1635611A2 (en) | 2004-09-08 | 2006-03-15 | Sony Corporation | Audio signal processing apparatus and method |
WO2006043413A1 (ja) * | 2004-10-19 | 2006-04-27 | Sony Corporation | 音声信号処理装置および音声信号処理方法 |
JP2007221445A (ja) * | 2006-02-16 | 2007-08-30 | Sharp Corp | サラウンドシステム |
JP2008028693A (ja) * | 2006-07-21 | 2008-02-07 | Sony Corp | オーディオ信号処理装置、オーディオ信号処理方法およびプログラム |
WO2008113427A1 (en) * | 2007-03-21 | 2008-09-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for enhancement of audio reconstruction |
JP2009010996A (ja) * | 2008-09-11 | 2009-01-15 | Sony Corp | 音声信号処理装置および音声信号処理方法 |
JP2010500806A (ja) * | 2006-08-10 | 2010-01-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号を処理する装置及び方法 |
US7672466B2 (en) | 2004-09-28 | 2010-03-02 | Sony Corporation | Audio signal processing apparatus and method for the same |
CN101039536B (zh) * | 2006-01-26 | 2011-01-19 | 索尼株式会社 | 音频信号处理设备和音频信号处理方法 |
US20120114142A1 (en) * | 2009-07-07 | 2012-05-10 | Shuichiro Nishigori | Acoustic signal processing apparatus, processing method therefor, and program |
US8265301B2 (en) | 2005-08-31 | 2012-09-11 | Sony Corporation | Audio signal processing apparatus, audio signal processing method, program, and input apparatus |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US8311238B2 (en) | 2005-11-11 | 2012-11-13 | Sony Corporation | Audio signal processing apparatus, and audio signal processing method |
US8368715B2 (en) | 2006-07-21 | 2013-02-05 | Sony Corporation | Audio signal processing apparatus, audio signal processing method, and audio signal processing program |
JP2013521541A (ja) * | 2010-03-08 | 2013-06-10 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 多重チャネル音声信号中の発話に関連したチャネルのダッキングをスケーリングするための方法およびシステム |
RU2499301C2 (ru) * | 2008-08-13 | 2013-11-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство для определения преобразованного пространственного звукового сигнала |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9015051B2 (en) | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
-
2002
- 2002-03-15 JP JP2002071971A patent/JP3810004B2/ja not_active Expired - Fee Related
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005354695A (ja) * | 2004-06-08 | 2005-12-22 | Bose Corp | オーディオ信号処理 |
US8295496B2 (en) | 2004-06-08 | 2012-10-23 | Bose Corporation | Audio signal processing |
US8099293B2 (en) | 2004-06-08 | 2012-01-17 | Bose Corporation | Audio signal processing |
EP1635611A2 (en) | 2004-09-08 | 2006-03-15 | Sony Corporation | Audio signal processing apparatus and method |
EP1635611A3 (en) * | 2004-09-08 | 2010-04-21 | Sony Corporation | Audio signal processing apparatus and method |
US7672466B2 (en) | 2004-09-28 | 2010-03-02 | Sony Corporation | Audio signal processing apparatus and method for the same |
US8442241B2 (en) | 2004-10-19 | 2013-05-14 | Sony Corporation | Audio signal processing for separating multiple source signals from at least one source signal |
US20130223648A1 (en) * | 2004-10-19 | 2013-08-29 | Sony Corporation | Audio signal processing for separating multiple source signals from at least one source signal |
WO2006043413A1 (ja) * | 2004-10-19 | 2006-04-27 | Sony Corporation | 音声信号処理装置および音声信号処理方法 |
KR101229386B1 (ko) * | 2004-10-19 | 2013-02-05 | 소니 주식회사 | 음성신호 처리장치 및 음성신호 처리방법 |
US8265301B2 (en) | 2005-08-31 | 2012-09-11 | Sony Corporation | Audio signal processing apparatus, audio signal processing method, program, and input apparatus |
US8311238B2 (en) | 2005-11-11 | 2012-11-13 | Sony Corporation | Audio signal processing apparatus, and audio signal processing method |
CN101039536B (zh) * | 2006-01-26 | 2011-01-19 | 索尼株式会社 | 音频信号处理设备和音频信号处理方法 |
JP2007221445A (ja) * | 2006-02-16 | 2007-08-30 | Sharp Corp | サラウンドシステム |
JP2008028693A (ja) * | 2006-07-21 | 2008-02-07 | Sony Corp | オーディオ信号処理装置、オーディオ信号処理方法およびプログラム |
US8368715B2 (en) | 2006-07-21 | 2013-02-05 | Sony Corporation | Audio signal processing apparatus, audio signal processing method, and audio signal processing program |
US8160259B2 (en) | 2006-07-21 | 2012-04-17 | Sony Corporation | Audio signal processing apparatus, audio signal processing method, and program |
JP2010500806A (ja) * | 2006-08-10 | 2010-01-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号を処理する装置及び方法 |
KR101388931B1 (ko) * | 2006-08-10 | 2014-04-24 | 코닌클리케 필립스 엔.브이. | 오디오 신호를 처리하기 위한 디바이스 및 방법 |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9015051B2 (en) | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
WO2008113427A1 (en) * | 2007-03-21 | 2008-09-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for enhancement of audio reconstruction |
US8611550B2 (en) | 2008-08-13 | 2013-12-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for determining a converted spatial audio signal |
RU2499301C2 (ru) * | 2008-08-13 | 2013-11-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство для определения преобразованного пространственного звукового сигнала |
JP2009010996A (ja) * | 2008-09-11 | 2009-01-15 | Sony Corp | 音声信号処理装置および音声信号処理方法 |
US8891774B2 (en) * | 2009-07-07 | 2014-11-18 | Sony Corporation | Acoustic signal processing apparatus, processing method therefor, and program |
US20120114142A1 (en) * | 2009-07-07 | 2012-05-10 | Shuichiro Nishigori | Acoustic signal processing apparatus, processing method therefor, and program |
JP2013521541A (ja) * | 2010-03-08 | 2013-06-10 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 多重チャネル音声信号中の発話に関連したチャネルのダッキングをスケーリングするための方法およびシステム |
US9219973B2 (en) | 2010-03-08 | 2015-12-22 | Dolby Laboratories Licensing Corporation | Method and system for scaling ducking of speech-relevant channels in multi-channel audio |
US9881635B2 (en) | 2010-03-08 | 2018-01-30 | Dolby Laboratories Licensing Corporation | Method and system for scaling ducking of speech-relevant channels in multi-channel audio |
Also Published As
Publication number | Publication date |
---|---|
JP3810004B2 (ja) | 2006-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3670562B2 (ja) | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 | |
CN106796792B (zh) | 用于增强音频信号的装置和方法、声音增强系统 | |
JP2003274492A (ja) | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム | |
JP5149968B2 (ja) | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 | |
US8670850B2 (en) | System for modifying an acoustic space with audio source content | |
JP5957446B2 (ja) | 音響処理システム及び方法 | |
JP6198800B2 (ja) | 少なくとも2つの出力チャネルを有する出力信号を生成するための装置および方法 | |
JP2019533192A (ja) | 動的サウンド調整のための雑音推定 | |
EP2484127B1 (en) | Method, computer program and apparatus for processing audio signals | |
JP2016518621A (ja) | 信号対ダウンミックス比に基づいたセンター信号スケーリング及び立体音響強調のための装置及び方法 | |
JP2010288262A (ja) | 信号処理装置 | |
JP3755739B2 (ja) | ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体 | |
KR101745019B1 (ko) | 오디오 시스템 및 그 제어방법 | |
JP5316127B2 (ja) | 音処理装置およびプログラム | |
JP5463924B2 (ja) | 音響処理装置 | |
JP5494085B2 (ja) | 音響処理装置 | |
JP5454157B2 (ja) | 音響処理装置 | |
JP5641187B2 (ja) | 音響処理装置 | |
WO2023174951A1 (en) | Apparatus and method for an automated control of a reverberation level using a perceptional model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060502 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060519 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060519 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090602 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100602 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100602 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110602 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120602 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130602 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140602 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |