JP2016046695A - 音響品質評価装置、音響品質評価方法、およびプログラム - Google Patents
音響品質評価装置、音響品質評価方法、およびプログラム Download PDFInfo
- Publication number
- JP2016046695A JP2016046695A JP2014170109A JP2014170109A JP2016046695A JP 2016046695 A JP2016046695 A JP 2016046695A JP 2014170109 A JP2014170109 A JP 2014170109A JP 2014170109 A JP2014170109 A JP 2014170109A JP 2016046695 A JP2016046695 A JP 2016046695A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- evaluation
- acoustic signal
- end speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】第1の基準音響信号とこれを含む信号に基づく第1の評価対象音響信号とに対する第1のPESQ値を得、第2の基準音響信号と第2基準音響信号を含む信号に基づく第2の評価対象音響信号とに対応する第2のPESQ値と、第2の基準音響信号に対応する基準音と第2の評価対象音響信号に対応する評価音との違いについての5段階評価に基づく第2のMOS値と、の線形関係に基づいて、第1のPESQ値を線形変換して第1のMOS値を得る。
【選択図】図13
Description
[第1実施形態]
<拡声系通信システムでの会話MOS試験を模擬した評価試験>
まず、拡声系通信システムでの会話MOS試験を模擬した評価試験を概念的に説明する。この評価試験では、近端話者と遠端話者とが拡声系通信システムを通じて会話を行い、近端話者側に位置する評価者が当該拡声系通信システムの品質評価を行う。なお、拡声系通信システムとは、マイクロホンとスピーカーとを備えた端末装置間で音響信号を送受信する通信システムであって、端末装置のスピーカーから出力された音の少なくとも一部がその端末装置のマイクロホンで受音されるもの(音の回り込みが生じるもの)をいう。拡声系通信システムの一例は、音声会議システムやテレビ会議システムである。
次に、拡声系通信システムでの会話MOS試験を模擬した評価試験を行うためのデータ構造を生成するデータ生成装置を例示する。図1に例示するように、本実施形態のデータ生成装置1は、近端話者音響信号記憶部101、遠端話者音響信号記憶部102、再生部103,104、スピーカー105,106、マイクロホン107、時間調整処理部108、収録処理部109、近端端末部110、遠端端末部120、出力部131,132,141,142,151,152、およびデータ記憶部180を有する。遠端端末部120は信号処理部121を含み、近端端末部110と遠端端末部120とはネットワーク(NW)を通じて通信可能に構成されている。少なくとも、スピーカー105,106およびマイクロホン107は、同じ室内に配置されている。データ生成装置1は、例えば、スピーカーやマイクロホンが接続され、CPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)やRAM(random-access memory)・ROM(read-only memory)等のメモリ等を備えた汎用または専用の1個以上のコンピュータが所定のプログラムを実行することで構成される装置である。各コンピュータは1個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めROM等に記録されていてもよい。また、CPUのようにプログラムが読み込まれることで機能構成を実現する電子回路(circuitry)ではなく、単独で処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。また、1個の装置を構成する電子回路が複数のCPUを含んでいてもよい。
次に、本実施形態のデータ生成処理を説明する。
事前処理として、評価者が受聴する近端話者の直接音(近端話者の音声)に相当する音を表す近端話者音響信号(システムの第1端側の第1音響信号)のデータを近端話者音響信号記憶部101に格納し、遠端話者の直接音(遠端話者の音声)に相当する音を表す遠端話者音響信号(システムの第2端側の第2音響信号)のデータを遠端話者音響信号記憶部102に格納する。本実施形態の近端話者音響信号および遠端話者音響信号は何れも時系列の音響信号であり、例えば、防音室で収録した音声に基づいて得られたものである。ただし、これは本発明を限定するものではなく、近端話者音響信号および遠端話者音響信号の少なくとも一方が通常の室内環境で収録されたものであってもよい。また、本形態では、近端話者音響信号が表す近端話者音声と遠端話者音響信号が表す遠端話者音声との間の発話タイミング(すなわち、近端話者音声の発話時に対する遠端話者音声の発話時の相対時間、例えば、近端話者音声と遠端話者音声とのかぶり)に制約は設けない。ただし、これは本発明を限定するものではなく、近端話者音声と遠端話者音声との間の発話タイミングに何らかの制約を設けてもよい。また、近端話者および遠端話者に制約はなく、これらが評価者以外の人であってもよいし、これらの少なくとも一方が評価者と同一人物であってもよい。
第1実施形態では、遠端話者音響信号を遅延量τだけ遅延させたものを「参照信号」のLchの基準音響信号とした。これは「参照信号」と「劣化信号D1」「劣化信号D2」との間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を一致または近似(例えば、図3の時間区間a−cと時間区間a−c’との一致または近似)させるためである。しかしながら、このような目的は他の手段によっても実現できる。例えば、再生部104から出力された遠端話者音響信号を遅延させることなく「参照信号」のLchの基準音響信号として出力部152から出力し、再生部103から出力された近端話者音響信号を時間τだけ時間的に繰り上げたもの(遅延の逆の時間シフトをしたもの)を「参照信号」のRchの近端話者音響信号としてもよい。あるいは、再生部104から出力された遠端話者音響信号を時間τ−Tだけ遅延させたものを「参照信号」のLchの基準音響信号として出力部152から出力し、再生部103から出力された近端話者音響信号を時間Tだけ時間的に繰り上げたものを「参照信号」のRchの近端話者音響信号としてもよい。ただし、Tの値は、例えば、0≦T≦τである。あるいは、評価試験時の処理により、「参照信号」と「劣化信号D1」「劣化信号D2」との間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を一致または近似できるデータ構造であってもよい。例えば、「参照信号」「劣化信号D1」「劣化信号D2」のファイル名やそれらを構成する信号の時間情報を持つデータ構造であればよい。データ構造がさらに遅延量τを特定するための情報を持っていてもよい。このような場合、データ記憶部180に格納されている「参照信号」と「劣化信号D1」「劣化信号D2」との間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間が一致または近似されていなくてもよい。要は、何らかの方法で、「参照信号」と「劣化信号D1」「劣化信号D2」との間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を一致または近似させることが可能なデータ構造であればよい。さらに環境によっては、「参照信号」と「劣化信号D1」「劣化信号D2」との間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を調整することなく、評価試験が行われてもよい。このような場合には、「参照信号」と「劣化信号D1」「劣化信号D2」との間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を一致または近似させることが不可能なデータ構造であってもよい。また、「劣化信号D1」「劣化信号D2」との間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間が一致していないデータ構造であってもよい。
第2実施形態は第1実施形態の変形例であり、通信環境および室内環境を電気的に模擬したデータ生成装置で、評価試験を行うためのデータ構造を生成するものである。以下では、これまで説明した事項との相違点を中心に説明する。既に説明した事項については、それらに用いた参照番号を流用して説明を簡略化する。
図4に例示するように、本実施形態のデータ生成装置2は、近端話者音響信号記憶部101、遠端話者音響信号記憶部102、時間調整処理部208、通信環境模擬処理部260、信号処理部270、出力部131,132,141,142,151,152、およびデータ記憶部180を有する。データ生成装置2は、例えば、音声信号の処理が可能な汎用または専用の1個以上のコンピュータが所定のプログラムを実行することで構成される装置である。また、単独で処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。
第1実施形態と同じく、まず事前処理として、近端話者音響信号(第1音響信号)のデータを近端話者音響信号記憶部101に格納し、遠端話者音響信号(第2音響信号)のデータを遠端話者音響信号記憶部102に格納する。以上の前提のもと、上述の評価試験を行うためのデータ構造が次のように生成される。
第2実施形態では、時間調整処理部208,264,266,276それぞれの遅延処理により、「参照信号」「劣化信号D1」「劣化信号D2」の間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を一致または近似(図3の時間区間a−cと時間区間a−c’との一致または近似)させた。しかしながら、第1実施形態の変形例と同様、このような目的は他の手段によっても実現できる。例えば、遠端話者音響信号記憶部102から読み出された遠端話者音響信号を遅延させることなく「参照信号」のLchの基準音響信号として出力部152から出力し、近端話者音響信号記憶部101から読み出された近端話者音響信号を時間τ’だけ時間的に繰り上げたものを「参照信号」のRchの近端話者音響信号としてもよい。要は、
(1)「劣化信号D2」のRchの近端話者音響信号(第1音響信号)が出力されてから、そのLchの評価対象音響信号T2(重畳信号)に含まれる遠端話者音響信号成分(第1成分)が出力されるまでの時間と、「参照信号」のRchの近端話者音響信号(第1音響信号)が出力されてから、そのLchの基準音響信号に含まれる遠端話者音響信号成分(第22成分)が出力されるまでの時間との一致または近似、および、
(2)「劣化信号D1」のRchの近端話者音響信号(第1音響信号)が出力されてから、そのLchの評価対象音響信号T1に含まれる遠端話者音響信号成分(第21成分)が出力されるまでの時間と、「参照信号」のRchの近端話者音響信号(第1音響信号)が出力されてから、そのLchの基準音響信号に含まれる遠端話者音響信号成分(第22成分)が出力されるまでの時間との一致または近似、
の少なくとも一方を行う1個以上の時間調整処理部を備えていればよい。その他、評価試験の時の処理により、「参照信号」「劣化信号D1」「劣化信号D2」の間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を一致または近似できるデータ構造であってもよい。要は、何らかの方法で、「参照信号」「劣化信号D1」「劣化信号D2」の間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を一致または近似させることが可能なデータ構造であればよい。さらに環境によっては、「参照信号」「劣化信号D1」「劣化信号D2」の間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を調整することなく、評価試験が行われてもよい。このような場合には、「参照信号」「劣化信号D1」「劣化信号D2」の間で、近端話者音響信号(Rch)の開始時と遠端話者音響信号成分(Lch)の開始時との間の時間区間を一致または近似させることが不可能なデータ構造であってもよい。
第3実施形態では、前述のように生成されたデータ構造を用いた品質評価方法を説明する。
図6に例示するように、本実施形態の音響品質評価装置3は、データ記憶部180、集計結果記憶部305、再生制御部301、表示制御部302、集計部303、制御部304、音響出力処理部310−n、表示部320−n、および入力部330−nを有する。ただし、n=1,・・・,Nであり、Nは1以上の整数(例えば、Nは1以上4以下)である。音響品質評価装置3は、例えば、表示装置(ディスプレイ等)および入力装置(キーボードやマウス等)を備えた前述のような1個以上のコンピュータが所定のプログラムを実行することで構成される装置である。また、単独で処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。
音響品質評価装置3は、前述したデータ構造を用い、制御部304の制御のもと、前述した拡声系通信システムでの会話MOS試験を模擬した評価試験を行う。
「参照信号」が送られた場合、音響出力処理部310−n(ただし、n=1,・・・,N)は、「参照信号」の近端話者音響信号(第1音響信号)を出力部311−nから両耳装着型音響再生装置340−nの一方のチャネルであるRch(第1チャネル)に出力しつつ、「参照信号」の基準音響信号を出力部312−nから両耳装着型音響再生装置340−nの他方のチャネルであるLch(第2チャネル)に出力する(第1処理)。
「劣化信号D1」が送られた場合、音響出力処理部310−n(ただし、n=1,・・・,N)は、「劣化信号D1」の近端話者音響信号(第1音響信号)を出力部311−nから両耳装着型音響再生装置340−nのRch(第1チャネル)に出力しつつ、「劣化信号D1」の評価対象音響信号T1(第1音響信号に由来する信号と第2音響信号とに基づく評価音を表す重畳信号)を出力部312−nから両耳装着型音響再生装置340−nのLch(第2チャネル)に出力する(第2処理)。
「劣化信号D2」が送られた場合、音響出力処理部310−n(ただし、n=1,・・・,N)は、「劣化信号D2」の近端話者音響信号(第1音響信号)を出力部311−nから両耳装着型音響再生装置340−nのRch(第1チャネル)に出力しつつ、「劣化信号D2」の評価対象音響信号T2(第1音響信号に由来する信号と第2音響信号とに基づく評価音を表す重畳信号。ただし、この重畳信号は、第1音響信号に由来する信号と第2音響信号とに基づく信号に信号処理を行って得られた処理信号に由来する。)を出力部312−nから両耳装着型音響再生装置340−nのLch(第2チャネル)に出力する(第2処理)。
次に、図8から図12を用い、制御部304の制御内容を例示する。これらの図の横軸は時間軸を表し、紙面の右に向かうほど後の時間を表す。これらの図の「Lch」の行は、両耳装着型音響再生装置340−nのLch側のスピーカーから出力させる音を表し、「Rch」の行は、両耳装着型音響再生装置340−nのRch側のスピーカーから出力させる音を表す。これらの図の「3211」の列は、着目内容提示部3211の提示内容(何に着目するか)を表し、「3212」の列は、評価指示提示部3212の提示内容(何を評価するか)を表し、「3213」の列は、評価カテゴリー提示部3213の提示内容(評価カテゴリー)を表す。
図8の例では、まず、再生制御部301がデータ記憶部180から「参照信号」を読み込み、それを音響出力処理部310−n(ただし、n=1,・・・,N)に送る。音響出力処理部310−nは、出力部312−nから「参照信号」の基準音響信号を出力し、出力部311−nから「参照信号」の近端話者音響信号を出力する。これにより、両耳装着型音響再生装置340−nのLchからは基準音響信号が表す「基準音」が出力され、Rchからは近端話者からの直接音に相当する「近端話者音」が出力される。この際、表示制御部302は、着目内容F1および評価カテゴリーを表す表示情報を表示部320−nに送る。なお、着目内容F1は、基準音(Lch)に着目する旨の指示を表す内容(例えば「基準音(1):「女声(左側)」に着目してください」)を意味する。また、評価カテゴリーは、前述の「基準音と評価音との違いが分かるか否かと、評価音の聞き取りにくさについての2段階以上の度合いと、の組み合わせからなる3段階以上のカテゴリーを含む評価カテゴリー」である。表示部320−nは、着目内容F1を着目内容提示部3211に提示し、評価カテゴリーを評価カテゴリー提示部3213に提示する(ステップS1)。
図9の例では、「基準音」、評価対象音響信号T1が表す「評価音」、および評価対象音響信号T2が表す「評価音」のうち、対比を行う一組の音をランダムに選択し、選択した音を順番に出力する。
まず再生制御部301は、「参照信号」「劣化信号D1」「劣化信号D2」から、対比する組をランダムに選択する。対比する組の例は、「参照信号」と「劣化信号D1」とからなる組、「参照信号」と「劣化信号D2」とからなる組、「劣化信号D1」と「劣化信号D2」とからなる組である。対比する組を構成する信号のうち、先に出力する信号を「第1出力信号」とよび、後に出力する信号を「第2出力信号」とよぶ。対比する組を構成する信号のうち何れを先に出力してもかまわない。例えば、「参照信号」と「劣化信号D1」とからなる組を対比する場合、「参照信号」を「第1出力信号」とし、「劣化信号D1」を「第2出力信号」としてもよいし、「参照信号」を「第2出力信号」とし、「劣化信号D1」を「第1出力信号」としてもよい。
図10の例では、1回目に「基準音」が出力され、2回目および3回目にそれぞれ「隠された基準音」または評価対象音響信号T1が表す「評価音」もしくは評価対象音響信号T2が表す「評価音」が出力される。ここで、2回目に「隠された基準音」が出力された場合、3回目には評価対象音響信号T1が表す「評価音」もしくは評価対象音響信号T2が表す「評価音」が出力される(パターン1)。一方、2回目に評価対象音響信号T1が表す「評価音」もしくは評価対象音響信号T2が表す「評価音」が出力された場合、3回目に「隠された基準音」が出力される(パターン2)。なお、「隠された基準音」とは、「基準音」であることを示さずに出力する「基準音」を意味する。また、パターン1とするかパターン2とするかはランダムに定められる。
パターン1が選択された場合、まず、Lchから「参照信号」に対応する「隠された基準音」が出力され、Rchから「参照信号」に対応する「近端話者音」が出力され(ステップS32)、次に、Lchから「劣化信号D1」の評価対象音響信号T1が表す「評価音」もしくは「劣化信号D2」の評価対象音響信号T2が表す「評価音」が出力され、Rchから「劣化信号D1」もしくは「劣化信号D2」に対応する「近端話者音」が出力される(ステップS33)。
一方、パターン2が選択された場合、Lchから評価対象音響信号T1が表す「評価音」もしくは評価対象音響信号T2が表す「評価音」が出力され、Rchから「劣化信号D1」もしくは「劣化信号D2」に対応する「近端話者音」が出力され(ステップS32)、次に、Lchから「参照信号」に対応する「隠された基準音」が出力され、Rchから「参照信号」に対応する「近端話者音」が出力される(ステップS33)。
図11の例でも、1回目に「基準音」が出力され、2回目および3回目にそれぞれ、ランダムに選択されたパターン1またはパターン2に従い、「隠された基準音」または評価対象音響信号T1が表す「評価音」もしくは評価対象音響信号T2が表す「評価音」が出力される。ただし、2回目および3回目の出力時にそれぞれに対する評価値が入力され(ステップS132,S133)、最後に評価値の確定入力のみがなされる(ステップS105)。なお、評価者350−nは、ステップS132,S133で出力された音のうち、「隠された基準音」と判断したほうに評価値「5」を入力し、「評価音」と判断したほうに自らの評価値を入力する。その他の詳細は、図10の例と同じである。
図12では、1回目に「基準音」が出力され(ステップS41)、2回目からx+1回目(xは3以上の整数(例えばxは14以下))に「評価音1」から「評価音x」が出力され(ステップS42−1〜S42−x)、評価値の入力とその確定が行われる(ステップS5)。なお、「評価音1」から「評価音x」は、評価対象音響信号T1が表す「評価音」および評価対象音響信号T2が表す「評価音」の少なくとも一方、1個の「隠された基準音」、1個以上の「アンカー音」を含む。なお、「アンカー音」とは悪い音響品質の基準となる音を表す。複数のアンカー音を含む場合は、段階的に悪くなる音響品質の基準を用いてよい。また、ステップS5では、ステップS42−1〜S42−xで出力された音それぞれの評価値が入力される。また、「評価音1」から「評価音x」の出力順序はランダムに定められる。ただし、評価者350−nが入力部330−nに指示入力を行うことにより、ステップS5の前に、ステップS42−1〜S42−xを所望の順序で何度でも実行できる構成であってもよい。その他は、図10の例と同様である。
本発明者は、第3実施形態で得られる評価値(基準音響信号に対応する基準音と評価対象音響信号に対応する評価音との違いについての5段階評価に基づくMOS値(表1に例示))と、PESQ(これらの基準音響信号および評価対象音響信号に対応するPESQ値)との関係が線形関係に近似できることを見出した。このようなことは従来知られていない(例えば、非特許文献1の「付図V−1/JJ−201.01<PESQ値と受聴MOS値の関係の定式化>」等参照)。本実施形態では、この知見に基づき、線形演算によってPESQから煩雑な主観評価や計算量の多い非線形演算を行うことなく、演算量の少ない線形演算でMOS値を推定できる。以下、詳細に説明する。
図13に例示するように、本実施形態の音響品質評価装置4は、PESQ算出部41および線形変換部42を有する。音響品質評価装置4は、例えば、前述のような1個以上のコンピュータが所定のプログラムを実行することで構成される装置である。また、単独で処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。
音響品質評価処理の前処理として、基準音響信号と当該基準音響信号を含む信号に基づく評価対象音響信号との組をリファレンス信号として用い、基準音響信号(第2の基準音響信号)と当該基準音響信号を含む信号に基づく評価対象音響信号(第2の評価対象音響信号)とに対応するPESQ値(第2のPESQ値)と、当該基準音響信号に対応する基準音と当該評価対象音響信号に対応する評価音との違いについての5段階評価に基づくMOS値(第2のMOS値)と、の線形関係を求めておく。このとき基準音響信号と当該基準音響信号を含む信号に基づく評価対象音響信号の組については様々な組み合わせを行い、また評価者についても複数人で主観評価試験を実施し、リファレンス信号への依存性や評価者個人差への依存性を軽減する形で、線形関係を統計的に解析する。この解析結果として得た情報が、図14に示されるPESQ値(第2のPESQ値)とMOS値(第2のMOS値)との線形関係である。このような線形関係を表す情報は線形変換部42に設定される。「線形関係を表す情報」の例は、この線形関係を表す線形関数Fや、この線形関数Fを特定するパラメータ等である。線形関数Fの例は、PESQ値を入力としてそれに対応するMOS値を出力する関数であり、例えば、MOS値=α×PESQ値+βである。なお、αおよびβはパラメータである。
以上の前提のもと、以下のように音響品質評価処理が行われる。まず、PESQ算出部41は、基準音響信号(第1の基準音響信号)と当該基準音響信号を含む信号に基づく評価対象音響信号(第1の評価対象音響信号)とを入力とし、当該基準音響信号と当該評価対象音響信号とに対するPESQ値(第1のPESQ値)を得て出力する。このPESQ値は線形変換部42に入力される。線形変換部42は、上述した線形関係に基づいて、入力されたPESQ値を線形変換してMOSの推定値(第1のMOS値)を得て出力する。例えば、線形変換部42は、PESQ値を前述の線形関数Fに代入して得られた結果をMOSの推定値として出力する。
図15に例示するように、この変形例の音響品質評価装置は、PESQ算出部41、線形変換部42、遠端話者音響信号記憶部102、およびデータ記憶部180を有する。PESQ算出部41は、遠端話者音響信号記憶部102から遠端話者音響信号を基準音響信号として読み出し、データ記憶部180からこの遠端話者音響信号に対応する評価対象音響信号T1を読み出す(図3参照)。PESQ算出部41は、これらに対するPESQ値を得て出力する。以降の処理は第4実施形態と同じである。なお、PESQ算出部41が、遠端話者音響信号記憶部102から遠端話者音響信号を基準音響信号として読み出すことに代えて、データ記憶部180から基準音響信号を読み出してもよい。
第4実施形態の変形例1の評価対象音響信号T1を評価対象音響信号T2に置換した形態であってもよい。すなわち、PESQ算出部41は、遠端話者音響信号記憶部102から遠端話者音響信号を基準音響信号として読み出し、データ記憶部180からこの遠端話者音響信号に対応する評価対象音響信号T2を読み出す。PESQ算出部41は、これらに対するPESQ値を得て出力する。以降の処理は第4実施形態と同じである。
図15に例示するように、この変形例の音響品質評価装置は、PESQ算出部41、線形変換部42、近端話者音響信号記憶部101、遠端話者音響信号記憶部102、データ記憶部180、および信号処理部621を含む。なお、信号処理部621は、何らかの「信号処理」を行う処理部である。「信号処理」の例は、エコーキャンセル処理およびノイズキャンセル処理の少なくとも一方を含む処理である。その他、「信号処理」が、エコーキャンセル処理もノイズキャンセル処理も含まない処理であってもよい。PESQ算出部41は、遠端話者音響信号記憶部102から遠端話者音響信号を基準音響信号として読み出す。信号処理部621は、データ記憶部180からこの遠端話者音響信号に対応する評価対象音響信号T1を読み出し、近端話者音響信号記憶部101から評価対象音響信号T1に対応する近端話者音響信号を読み出す(図3参照)。信号処理部621は、これらを用いて評価対象音響信号T1に信号処理を行い、それによって得られた信号を評価対象信号としてPESQ算出部41に送る。PESQ算出部41は、入力された信号に対するPESQ値を得て出力する。以降の処理は第4実施形態と同じである。
なお、本発明は上述の実施の形態に限定されるものではない。例えば、参照信号や劣化信号が音声以外の音響信号(音楽や背景音等)に基づいて得られたものであってもよい。また、参照信号や劣化信号が時系列信号でなくてもよい。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
3〜6 音響品質評価装置
Claims (7)
- 第1の基準音響信号と前記第1の基準音響信号を含む信号に基づく第1の評価対象音響信号とに対する第1のPESQ値を得るPESQ算出部と、
第2の基準音響信号と前記第2基準音響信号を含む信号に基づく第2の評価対象音響信号とに対応する第2のPESQ値と、前記第2の基準音響信号に対応する基準音と前記第2の評価対象音響信号に対応する評価音との違いについての5段階評価に基づく第2のMOS値と、の線形関係に基づいて、前記第1のPESQ値を線形変換して第1のMOS値を得る線形変換部と、
を有する音響品質評価装置。 - 請求項1の音響品質評価装置であって、
前記第2のMOS値は、前記基準音と前記評価音との違いが分かるか否かと、前記評価音の聞き取り易さおよび/または聞き取りにくさについての度合いと、の組み合わせからなる評価カテゴリーについての5段階評価に基づく、音響品質評価装置。 - 請求項1または2の音響品質評価装置であって、
前記第2のMOS値は、前記基準音と前記評価音との違いが分かるか否かと、前記評価音の聞き取りにくさについての4段階の度合いと、の組み合わせからなる評価カテゴリーについての5段階評価に基づく、音響品質評価装置。 - 請求項1から3の何れかの音響品質評価装置であって、
前記第2のMOS値は、前記基準音と前記評価音との違いが分からないことを表す1段階のカテゴリーと、前記基準音と前記評価音との違いが分かる旨と前記評価音の聞き取りにくさについての4段階の度合いとの組み合わせからなる4段階のカテゴリーと、を含む評価カテゴリーについての5段階評価に基づく、音響品質評価装置。 - 請求項1から4の何れかの音響品質評価装置であって、
前記第2のMOS値は、前記評価音の聞き取り易さの評価を指示して得られた5段階評価に基づく、音響品質評価装置。 - 第1の基準音響信号と前記第1の基準音響信号を含む信号に基づく第1の評価対象音響信号とに対する第1のPESQ値を得るPESQ算出ステップと、
第2の基準音響信号と前記第2基準音響信号を含む信号に基づく第2の評価対象音響信号とに対応する第2のPESQ値と、前記第2の基準音響信号に対応する基準音と前記第2の評価対象音響信号に対応する評価音との違いについての5段階評価に基づく第2のMOS値と、の線形関係に基づいて、前記第1のPESQ値を線形変換して第1のMOS値を得る線形変換ステップと、
を有する音響品質評価方法。 - 請求項1から5の何れかの音響品質評価装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014170109A JP6163468B2 (ja) | 2014-08-25 | 2014-08-25 | 音響品質評価装置、音響品質評価方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014170109A JP6163468B2 (ja) | 2014-08-25 | 2014-08-25 | 音響品質評価装置、音響品質評価方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016046695A true JP2016046695A (ja) | 2016-04-04 |
JP6163468B2 JP6163468B2 (ja) | 2017-07-12 |
Family
ID=55636861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014170109A Active JP6163468B2 (ja) | 2014-08-25 | 2014-08-25 | 音響品質評価装置、音響品質評価方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6163468B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328167A (zh) * | 2016-08-16 | 2017-01-11 | 成都市和平科技有限责任公司 | 一种智能语音识别机器人及控制系统 |
JP2018063135A (ja) * | 2016-10-12 | 2018-04-19 | 日本電信電話株式会社 | 評価試験計画装置、主観評価装置、それらの方法、およびプログラム |
JP2018064162A (ja) * | 2016-10-12 | 2018-04-19 | 日本電信電話株式会社 | 音響品質評価装置、音響品質評価方法、およびプログラム |
JP2018064161A (ja) * | 2016-10-12 | 2018-04-19 | 日本電信電話株式会社 | 音響品質評価装置、音響品質評価方法、データ構造、およびプログラム |
CN108305618A (zh) * | 2018-01-17 | 2018-07-20 | 广东小天才科技有限公司 | 语音获取及搜索方法、智能笔、搜索终端及存储介质 |
CN111614842A (zh) * | 2020-05-14 | 2020-09-01 | 杭州当虹科技股份有限公司 | 一种基于pesq的客观语音通讯质量评价方法 |
JPWO2020240880A1 (ja) * | 2019-05-30 | 2020-12-03 | ||
CN112185421A (zh) * | 2020-09-29 | 2021-01-05 | 北京达佳互联信息技术有限公司 | 音质检测方法、装置、电子设备及存储介质 |
CN113096681A (zh) * | 2021-04-08 | 2021-07-09 | 海信视像科技股份有限公司 | 显示设备、多声道回声消除电路及多声道回声消除方法 |
WO2021152759A1 (ja) * | 2020-01-30 | 2021-08-05 | 日本電信電話株式会社 | 評価方法、評価装置、およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003234779A (ja) * | 2002-02-08 | 2003-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 品質推定方法および装置 |
JP2006345149A (ja) * | 2005-06-08 | 2006-12-21 | Kddi Corp | 通話品質の客観評価サーバ、方法及びプログラム |
-
2014
- 2014-08-25 JP JP2014170109A patent/JP6163468B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003234779A (ja) * | 2002-02-08 | 2003-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 品質推定方法および装置 |
JP2006345149A (ja) * | 2005-06-08 | 2006-12-21 | Kddi Corp | 通話品質の客観評価サーバ、方法及びプログラム |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328167A (zh) * | 2016-08-16 | 2017-01-11 | 成都市和平科技有限责任公司 | 一种智能语音识别机器人及控制系统 |
JP2018063135A (ja) * | 2016-10-12 | 2018-04-19 | 日本電信電話株式会社 | 評価試験計画装置、主観評価装置、それらの方法、およびプログラム |
JP2018064162A (ja) * | 2016-10-12 | 2018-04-19 | 日本電信電話株式会社 | 音響品質評価装置、音響品質評価方法、およびプログラム |
JP2018064161A (ja) * | 2016-10-12 | 2018-04-19 | 日本電信電話株式会社 | 音響品質評価装置、音響品質評価方法、データ構造、およびプログラム |
CN108305618A (zh) * | 2018-01-17 | 2018-07-20 | 广东小天才科技有限公司 | 语音获取及搜索方法、智能笔、搜索终端及存储介质 |
JPWO2020240880A1 (ja) * | 2019-05-30 | 2020-12-03 | ||
WO2020240880A1 (ja) * | 2019-05-30 | 2020-12-03 | 日本電信電話株式会社 | 評価装置、評価方法、およびプログラム |
JP7238978B2 (ja) | 2019-05-30 | 2023-03-14 | 日本電信電話株式会社 | 評価装置、評価方法、およびプログラム |
WO2021152759A1 (ja) * | 2020-01-30 | 2021-08-05 | 日本電信電話株式会社 | 評価方法、評価装置、およびプログラム |
JPWO2021152759A1 (ja) * | 2020-01-30 | 2021-08-05 | ||
CN111614842A (zh) * | 2020-05-14 | 2020-09-01 | 杭州当虹科技股份有限公司 | 一种基于pesq的客观语音通讯质量评价方法 |
CN111614842B (zh) * | 2020-05-14 | 2021-10-26 | 杭州当虹科技股份有限公司 | 一种基于pesq的客观语音通讯质量评价方法 |
CN112185421A (zh) * | 2020-09-29 | 2021-01-05 | 北京达佳互联信息技术有限公司 | 音质检测方法、装置、电子设备及存储介质 |
CN112185421B (zh) * | 2020-09-29 | 2023-11-21 | 北京达佳互联信息技术有限公司 | 音质检测方法、装置、电子设备及存储介质 |
CN113096681A (zh) * | 2021-04-08 | 2021-07-09 | 海信视像科技股份有限公司 | 显示设备、多声道回声消除电路及多声道回声消除方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6163468B2 (ja) | 2017-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6163468B2 (ja) | 音響品質評価装置、音響品質評価方法、およびプログラム | |
EP1913708B1 (en) | Determination of audio device quality | |
CN112071328B (zh) | 音频降噪 | |
JP6703525B2 (ja) | 音源を強調するための方法及び機器 | |
GB2495472B (en) | Processing audio signals | |
US8693713B2 (en) | Virtual audio environment for multidimensional conferencing | |
JP6571623B2 (ja) | 音響品質評価装置、音響品質評価方法、およびプログラム | |
US10192566B1 (en) | Noise reduction in an audio system | |
EP3979609B1 (en) | Evaluation device, evaluation method, and program | |
JP7310939B2 (ja) | 評価方法、評価装置、およびプログラム | |
JP6363429B2 (ja) | データ構造、データ生成装置、データ生成方法、およびプログラム | |
JP6126053B2 (ja) | 音響品質評価装置、音響品質評価方法、およびプログラム | |
Holub et al. | Delay effect on conversational quality in telecommunication networks: Do we mind? | |
JP6594840B2 (ja) | 音響品質評価装置、音響品質評価方法、データ構造、およびプログラム | |
US11924368B2 (en) | Data correction apparatus, data correction method, and program | |
JP7184173B2 (ja) | 音響品質評価装置、音響品質評価方法、およびプログラム | |
JP2012094945A (ja) | 音声通信システム、及び、音声通信装置 | |
Rund et al. | Objective quality assessment for the acoustic zoom | |
Ghimire | Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863 | |
JP5698110B2 (ja) | マルチチャネルエコー消去方法、マルチチャネルエコー消去装置、およびプログラム | |
JP2023047178A (ja) | 情報処理装置及び情報処理プログラム | |
Kim et al. | Investigation into spatial audio quality of experience in the presence of accompanying video cues with spatial mismatch | |
Chon et al. | Sound quality assessment of earphone: A subjective assessment procedure and an objective prediction model | |
Gierlich et al. | Wideband Hands-Free in Cars–New Challenges for System Design and Testing | |
Albrecht et al. | Continuous Mobile Communication with Acoustic Co-Location Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160510 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170613 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6163468 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |