[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5144835B2 - うるささ判定システム、装置、方法およびプログラム - Google Patents

うるささ判定システム、装置、方法およびプログラム Download PDF

Info

Publication number
JP5144835B2
JP5144835B2 JP2012512101A JP2012512101A JP5144835B2 JP 5144835 B2 JP5144835 B2 JP 5144835B2 JP 2012512101 A JP2012512101 A JP 2012512101A JP 2012512101 A JP2012512101 A JP 2012512101A JP 5144835 B2 JP5144835 B2 JP 5144835B2
Authority
JP
Japan
Prior art keywords
speech
sound
latency
annoyance
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012512101A
Other languages
English (en)
Other versions
JPWO2012070212A1 (ja
Inventor
信夫 足立
順 小澤
幸治 森川
弓子 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2012512101A priority Critical patent/JP5144835B2/ja
Application granted granted Critical
Publication of JP5144835B2 publication Critical patent/JP5144835B2/ja
Publication of JPWO2012070212A1 publication Critical patent/JPWO2012070212A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/12Audiometering
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • A61B5/377Electroencephalography [EEG] using evoked responses
    • A61B5/38Acoustic or auditory stimuli
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/70Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Acoustics & Sound (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Psychology (AREA)
  • Psychiatry (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Description

本発明は、ユーザが語音を快適に聴取できたか否かを評価(判定)するための技術に関する。
近年、社会の高齢化に伴い、加齢を原因とした難聴者が増加している。大音量の音楽を長時間聴く機会が増えたなどの影響により、若年の難聴者が増加している。また、補聴器の小型化・高性能化に伴い、ユーザが、抵抗なく、補聴器を装用するようになってきている。これらを背景として、会話の聞き分け能力の向上を目的に、補聴器を装用するユーザが増加している。
補聴器は、ユーザが聞きとりにくい音を構成する種々の周波数のうち、特定周波数の信号の振幅を増幅させることにより、ユーザの低下した聴力を補う。補聴器は、ユーザごとの聴力低下の度合いに応じて、音を増幅する量を調整することが求められる。そのため、補聴器の利用を開始する前には、ユーザごとの聴力に合わせて、音の増幅量を調整する「フィッティング」が必須である。
フィッティングとは、音の周波数ごとに、出力する音圧(音として知覚され得る、大気の圧力変動) をMCL(most comfortable level:ユーザが快適に感じる音圧)にすることを意味する。このとき、(1)増幅量不足、または、(2)増幅量過多のいずれかの場合には、フィッティングが適切でない。たとえば、増幅量不足の場合、ユーザが音声を聞き分けられず、補聴器装用の目的が達成できない。また、増幅量過多の場合、ユーザが音声を聞き分けることができる。しかし、ユーザが音声をうるさいと感じるため、補聴器を長時間使用できないという問題が発生する。そのため、上記(1)または(2)のいずれにも該当しないよう、フィッティングを行う必要がある。特に(2)の場合には、補聴器から必要以上の大音量が呈示されることになり、ユーザの耳を傷つける可能性がある。
フィッティングの最初の手順は、オージオグラムの測定である。「オージオグラム」とは、聴取可能な純音の最小音圧を測定することを意味する。たとえば、複数の周波数の音のそれぞれについて、そのユーザが聞き取ることが可能な最も小さい音圧(デシベル値)を周波数(たとえば250Hz、500Hz、1000Hz、2000Hz、4000Hz)に応じてプロットした図である。
次に、オージオグラムの結果から周波数ごとの増幅量を推定するための関数であるフィッティング理論に基づき、周波数ごとの増幅量を決定する。
しかしながら、オージオグラムとフィッティング理論に基づく調整のみでは、会話の聞き分け明瞭度を向上させる最適なフィッティングが実現されたかどうかは分からない。その理由として、たとえばオージオグラムと会話の聞き分け能力とが一対一対応しないこと、難聴者は適切な大きさに感じる音圧の範囲が狭いため調整が難しいことなどが挙げられる。
そこで、上記の方法で決定・調整された補聴器を装用して、補聴器適合検査が実施される(たとえば、非特許文献1参照)。補聴器適合検査の必須検査項目には、(1)語音明瞭度曲線の測定、(2)環境騒音許容レベルの測定の2種類がある。
語音明瞭度曲線の測定では、補聴器装用時と補聴器非装用時(裸耳)において、55dB SPL(Sound pressure level)、65dB SPL、75dBSPLおよび85dB SPLの音圧で単音節の語音音声を呈示し、それぞれの音圧ごとの語音明瞭度をプロットし比較する。そして、非装用時の場合と比較して装用時において明瞭度が向上していれば適合と判定する。
この「語音明瞭度」とは、単音節の語音音声が聞き取れたか否かの程度の指標をいう。語音明瞭度は、会話時の聞き分けの程度を反映する。「単音節の語音」とは、一つの母音、または子音と母音との組合せを示す(たとえば「あ」/「だ」/「し」)。
語音明瞭度は、以下の手順で評価する(たとえば非特許文献2)。まず、日本聴覚医学会が制定した67S式語表(20語音)の音声をひとつずつ再生し、ユーザに聞かせる。次に、呈示された語音をどの語音として聞き取ったかをユーザに発話または書き取りなどの方法で回答させる。そして、評価者が呈示した語音と回答とを照合し、全20語音のうち正しく聞き取れた語音の割合である正解率を計算する。その正解率が語音明瞭度である。
語音明瞭度の評価方法に関して、従来から種々の技術が公開されている。たとえば、特許文献1には、パーソナルコンピュータ(PC)を用いて自動的に正誤判定を行う語音明瞭度評価方法が開示されている。特許文献1では、PCを用いてユーザに対して単音節の音声を呈示し、ユーザにマウスまたはペンタッチ(touch the pen to the display)により回答させ、回答をPCの入力として受け付け、呈示した音声と回答入力との正誤判定を自動的に行う方法が提案されている。マウスまたはペンタッチで回答入力を受けることで、ユーザの回答(発話または書き取り)を評価者が識別/解読する必要がなくなり、評価者の手間が削減される。
また、たとえば特許文献2には、音声呈示後に該当する語音の選択候補を文字で呈示する語音明瞭度評価方法が開示されている。特許文献2では、選択候補を数個に絞り、数個の文字の中から該当する語音を選択させることでユーザが文字を探す手間を低減している。
一方、環境騒音許容レベルの測定では、朗読音と環境騒音を同時に呈示し朗読音を聴取させた場合に、環境騒音が許容できるかどうかを評価する(非特許文献2)。具体的には、朗読音を65dB SPLで、環境騒音を55dB SPLで呈示し、環境騒音が許容できるかどうかに関する主観的な印象を報告させる。主観的な印象として、雑音下で朗読音を聴取するときに補聴器を使用できる、または雑音下での補聴器装用は困難である、のどちらかを報告さFせる。そして、前者の場合を適合、後者の場合を不適合と判定する。
特開平9−038069号公報 特開平6−114038号公報
細井裕司他、「補聴器適合検査の指針2008」、2008年 小寺一興、「補聴器フィッティングの考え方」、診断と治療社、1999年、166頁
しかしながら、上述の補聴器適合検査のうち、語音明瞭度曲線の測定では、語音明瞭度のみに基づいて適合状態が判定されており、語音聴取時にユーザがうるさいと感じたか否かは考慮されていなかった。そのため、語音聴取時にうるさいと感じた場合にも、非装用時と比較して補聴器装用時において明瞭度が高ければ、適した補聴処理であると評価された。また、環境騒音許容レベルの測定では、環境騒音が許容できるか否かが評価され、語音聴取に対するうるささの評価はされなかった。これらの評価では、語音聴取時にユーザがうるさいと感じる、聞いていて疲れやすい補聴処理であっても、適合していると判定してしまう場合があった。語音聴取に対するうるささは、補聴器を日常的に装用するユーザにとって負担である。
本発明の目的は、語音聴取に対するうるささに関するユーザ状態を評価する仕組みを提供することである。
本発明のある実施形態によるうるささ判定システムは、ユーザの脳波信号を計測する生体信号計測部と、複数の単音節の語音を保持する語音データベースであって、各語音について、語音と前記語音に対応する脳波信号の陰性成分の基準潜時とが対応付けられている語音データベースと、前記語音データベースを参照して、呈示する単音節の語音を決定する呈示語音決定部と、前記ユーザに、決定された語音を呈示する出力部と、前記語音が呈示された時刻を起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、前記語音データベースに保持されている、決定された前記語音に対応する基準潜時とを比較して、出力された前記語音のうるささを判定するうるささ判定部とを備えている。
語音データベースは、前記語音に含まれる子音の長さ又は子音の強度に応じて、前記語音と前記語音に対応する脳波信号の陰性成分の基準潜時を対応付けていてもよい。
前記うるささ判定部は、前記陰性成分のピーク潜時が前記基準潜時よりも小さい場合に、前記音声信号が前記ユーザにとってうるさいと判定し、前記陰性成分のピーク潜時が前記基準潜時よりも大きい場合に、前記音声信号が前記ユーザにとってうるさくないと判定してもよい。
前記うるささ判定システムは、前記脳波信号の事象関連電位を、所定の基準にしたがって加算する事象関連電位処理部をさらに備え、前記呈示語音決定部は、複数の語音を決定し、前記出力部は、決定された前記複数の語音を順次呈示し、前記事象関連電位処理部は、前記複数の語音について、前記語音の種類又は前記語音呈示されたときの音圧が同じ語音が呈示された時刻を起点とした前記脳波信号の事象関連電位を加算して、前記加算した結果を前記うるささ判定部に出力してもよい。
前記うるささ判定部は、前記ピーク潜時として、前記決定された前記語音が呈示された時刻を起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分の最小の電位を取る時刻、または、前記脳波信号と予め用意されたN1成分の波形のテンプレートとの一致度が最も高くなる場合の、前記テンプレートに対応付けられたピーク潜時を採用してもよい。
前記事象関連電位処理部は、子音ごとまたは基準潜時の差が所定の値よりも小さい語音グループごとに事象関連電位を加算してもよい。
前記うるささ判定システムは、前記語音のうるささに関する判定結果を示す情報を蓄積する結果蓄積データベースをさらに備え、前記結果蓄積データベースには、語音ごと、子音ごと、または、基準潜時の差が所定の値よりも小さい語音グループごとに、前記語音のうるささに関する判定結果を示す情報が蓄積されていてもよい。
前記うるささ判定システムは、前記呈示された前記語音に関して補聴処理の種類を選択し、選択された補聴処理に基づいて前記語音データベースに保持されている語音データを加工する補聴処理部をさらに備えていてもよい。
前記うるささ判定システムは、ユーザごとの陰性成分の潜時を求める校正モードと、うるささを評価する評価モードとを切り替える切替部をさらに備え、前記校正モードにおいて、前記切替部は、前記呈示語音決定部において母音を選択し、母音に対する前記陰性成分の潜時に基づいて語音ごとの基準潜時を算出し、前記評価モードに切り替えられた後において、前記切替部は、前記陰性成分のピーク潜時と算出した前記基準潜時とを比較してもよい。
前記校正モードにおいて、前記評価切替部は、前記呈示語音決定部において母音が選択された場合に、母音に対するN1成分の潜時を母音の基準潜時に設定し、母音の基準潜時に子音部分の長さまたは強度に応じて決定された正の値を加えて、子音ごとの基準潜時を算出してもよい。
本発明の他の実施形態による補聴処理システムは、複数の単音節の語音を保持する語音データベースであって、各語音について、語音と前記語音に対応する脳波信号の陰性成分の基準潜時とが対応付けられている語音データベースと、前記語音データベースを参照して、呈示する単音節の語音を決定する呈示語音決定部と、生体信号計測部によって計測された前記ユーザの脳波信号のうち、前記語音が出力部によってユーザに呈示された時刻を起点として、50ms以上350ms以下の範囲に含まれる脳波信号の陰性成分のピーク潜時と、前記語音データベースに保持されている、決定された前記語音に対応する基準潜時とを比較した結果を出力するうるささ判定部と、前記うるささ判定部が出力した、前記脳波信号の陰性成分のピーク潜時と前記語音に対応する基準潜時との差に基づいて、前記語音を調整する補聴処理部とを備えている。
本発明の他の実施形態によるうるささ判定方法は、ユーザの脳波信号を計測するステップと、複数の単音節の語音と、前記語音に対応する脳波信号の陰性成分の基準潜時とが対応付けて保持されている語音データベースを参照して、呈示する単音節の語音を決定するステップと、前記ユーザに、決定された語音を呈示するステップと、前記語音が呈示された時刻を起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、前記語音データベースに保持されている、決定された前記語音に対応する基準潜時とを比較して、出力された前記語音のうるささを判定するステップとを包含する。
本発明の他の実施形態によるコンピュータプログラムは、語音聴取のうるささ判定システムに設けられたコンピュータによって実行されるコンピュータプログラムであって、前記コンピュータプログラムは、前記うるささ判定システムに実装されるコンピュータに対し、ユーザの脳波信号を受け取るステップと、複数の単音節の語音と、前記語音に対応する脳波信号の陰性成分の基準潜時とが対応付けて保持されている語音データベースを参照して、呈示する単音節の語音を決定するステップと、前記ユーザに、決定された語音を呈示するステップと、前記語音が呈示された時刻を起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、前記語音データベースに保持されている、決定された前記語音に対応する基準潜時とを比較して、出力された前記語音のうるささを判定するステップとを実行させる。
本発明のさらに他の実施形態によるうるささ判定システムは、ユーザの脳波信号を計測する生体信号計測部と、特定話者が発声した音声信号を入力するための音声入力部と、前記音声信号が入力されたタイミングを検出してトリガを出力し、さらに前記音声の子音部分の長さおよび強度に関する特徴を分析する音声分析部と、前記音声分析部で分析された前記特徴に基づいて、陰性成分の基準潜時を推定する基準潜時推定部と、前記トリガを起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、前記基準潜時推定部によって推定された基準潜時とを比較してうるささを判定するうるささ判定部とを備えている。
前記うるささ判定システムは、前記特定話者に発生させるための語音を示す文字情報を出力する文字出力部をさらに備え、前記文字出力部によって出力された文字情報に基づいて前記特定話者が発生した音声信号が前記音声入力部に入力されてもよい。
前記文字出力部は、前記単音節の語音を前記特定話者が発声する際の大きさを示す音圧に関する情報をさらに出力し、前記文字出力部によって出力された文字情報および音圧に関する情報に基づいて前記特定話者が発生した音声信号が前記音声入力部に入力されてもよい。
前記うるささ判定システムは、予め用意された語音リストを参照して、前記特定話者に発声させる語音を決定する呈示語音決定部をさらに備え、前記文字出力部は、前記呈示語音決定部によって決定された前記語音を示す文字情報を出力してもよい。
前記基準潜時推定部は、前記音声分析部で分析された前記特徴、および、呈示語音決定部が決定した前記特定話者に発声させる語音に基づいて、前記陰性成分の基準潜時を推定してもよい。
前記基準潜時推定部は、予め用意されたベース潜時に、前記音声の子音長あるいは子音強度に基づいて決定される所定の正の値を加えることにより、前記陰性成分の基準潜時を推定してもよい。
本発明のさらに他の実施形態によるうるささ判定方法は、ユーザの脳波信号を計測するステップと、特定話者が発声した音声信号を入力するステップと、前記音声信号が入力されたタイミングを検出してトリガを出力し、さらに前記音声の子音部分の長さおよび強度に関する特徴を分析するステップと、分析する前記ステップで分析された前記特徴に基づいて、陰性成分の基準潜時を推定するステップと、前記トリガを起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、推定する前記ステップによって推定された基準潜時とを比較してうるささを判定するステップとを包含する、。
本発明によれば、語音聴取に対するうるささに関するユーザ状態を評価する仕組みを提供できる。
脳波計測実験の実験手順の概要を示す図である。 1試行分の手順を示すフローチャートである。 (a)は、騒音計で測定した条件ごとの音圧レベルを示す図であり、(b)は、6つの条件のそれぞれにおける周波数ごとのゲイン調整量を示す図である。 (a)は、国際10−20法(10−20 System)の電極位置を示した図である。(b)は、脳波計を装着した電極配置である。 うるささについて、ビジュアルアナログスケールで主観報告行った結果を示す図である。 音声が呈示された時刻を起点としたPzにおける事象関連電位を、うるささに関する主観評価ごとに加算平均した波形を示す図である。 実験で呈示したMF条件の音声波形である。 同じ子音を持つ語音ごとの加算平均波形の例である。 同じ子音を持つ語音ごとのN1成分の潜時の音圧による変化と、従来研究による純音のN1成分の潜時の音圧による変化を示した図である。 刺激として呈示した語音音声の子音強度の例として、MF条件における子音部分に関する二乗平均振幅のその時刻までの和を示す図である。 子音強度が弱い子音および強い子音の各音声波形の例を示す図である。 N1成分の潜時の比較結果と、うるささ判定結果の対応関係を示す図である。 実施形態1による語音聴取のうるささ判定システム100の構成および利用環境を示す図である。 実施形態1による語音聴取のうるささ判定装置1のハードウェア構成を示す図である。 実施形態1による語音聴取のうるささ判定システム100の機能ブロックの構成を示す図である。 語音DB71の例を示す図である。 実施形態1による手法を用いたうるささの判定結果蓄積の例を示す図である。 実施形態1による手法を用いたうるささの判定結果と、従来の語音明瞭度曲線の結果との比較を示す図である。 語音聴取のうるささ判定システム100において行われる処理の手順を示すフローチャートである。 単音節の単語ごとの評価結果の一例を示す図である。 実施形態2による語音聴取のうるささ判定システム200の機能ブロックの構成を示す図である。 実施形態2による手法を用いたうるささの判定結果蓄積の例を示す図である。 実施形態2による語音聴取のうるささ判定システム200の処理手順を示すフローチャートである。 実施形態3による語音聴取のうるささ判定システム300の機能ブロックの構成を示す図である。 実施形態3による語音聴取のうるささ判定システム300の処理手順を示すフローチャートである。 実施形態4による語音聴取のうるささ判定システム400の機能ブロックの構成を示す図である。 実施形態4による語音聴取のうるささ判定装置4のハードウェア構成を示す図である。 実施形態4による語音聴取のうるささ判定システム400の処理手順を示すフローチャートである。
以下、添付の図面を参照して、本発明による語音聴取のうるささ判定システムの実施形態を説明する。
本発明による語音聴取のうるささ判定システムは、語音聴取時のユーザ状態として、脳波を利用して語音聴取時にユーザがうるさいと感じたか、を評価するために用いられる。より具体的には、本システムは、単音節の語音を音声で呈示し、音声呈示を起点として計測したユーザ脳波の事象関連電位を指標に、語音聴取のうるささを評価する。
ここで、本明細書で用いる文言を説明する。「事象関連電位(event−related potential:ERP)」とは、脳波(electroencephalogram:EEG)の一部であり、外的あるいは内的な事象に時間的に関連して生じる脳の一過性の電位変動をいう。また、「音声を呈示する」とは、聴覚刺激(「音声刺激」ともいう。)を出力することをいう。たとえば、音声をスピーカから出力する。なお、スピーカの種類は任意であり、床やスタンド上に設置されたスピーカでもよいし、ヘッドフォン型のスピーカでもよい。ただし、スピーカは、正しく評価を行うために指定した音圧で正確に出力できる必要がある。また「評価」は「判定」の意味としても用いられる。
本願発明者らは、語音明瞭度評価および評価時のユーザ状態を詳細に分析した結果、ユーザにとってうるさいと感じる程度を示す「うるささ」の評価が必要であるという知見を見出した。以下で、具体的に説明する。
語音明瞭度評価では、語音ごとに音声を聞き分けられたかどうかを聞き分けられた(○)/聞き分けられなかった(×)で評価する。聞き分けられた語音の数を評価対象の語音数(67s式語表の場合は20)で割って求める。そのため、語音聴取時のユーザ状態は結果に反映されない。
しかしながら、実際には快適に聞き分けができた場合と、聞き分けはできたが不快であった場合が存在すると考えられる。語音明瞭度評価は、補聴器販売店において実施される短時間の評価である。ユーザがうるさいと感じたかどうかは評価対象ではないため、我慢できないうるささでなければ少しうるさいと感じてもユーザは我慢して評価課題を遂行する。
ところが、日常的に長時間にわたって補聴器を装用する場合には、長時間にわたってうるささを我慢することは、ユーザにとって負担である。
これらの状況に鑑み、本願発明者らは、語音聴取時のユーザ状態として、「うるささに対する我慢」が不要な場合と、「うるささに対する我慢」が必要な場合は切り分けて評価すべきであると考えた。うるささは、語音聴取時の脳内における処理であるため、脳波の測定により評価できる可能性がある。
1.実験概要
本願発明者らは、語音聴取のうるささ判定の実現を目指し、うるささを反映した脳波特徴成分を特定するために以下の実験を実施した。
単音節の語音を音声で呈示し、音声に対応する語音をユーザに思い浮かべさせる設定で、音声呈示を起点に事象関連電位を計測する脳波計測実験を実施した。実験では、語音聴取に対するうるささに関する主観報告をさせた。そして、うるささに関する主観報告に基づき、それぞれ事象関連電位を加算平均した。なお、音声に対応する語音を思い浮かべさせるという手順は、うるささ判定においては必須ではない。
その結果、本願発明者らは、音声呈示を起点とした事象関連電位において、音声に対するうるささの増加に伴い潜時約200msの陰性成分(N1成分)の潜時が短くなることを発見した。さらに、語音ごとの子音長又は子音強度などの特徴の違いによって、N1成分の潜時が異なることを発見した。「潜時」とは、音声刺激が呈示された時刻を起点として陽性成分または陰性成分のピークが出現するまでの時間を示す。
これらの発見から、本願発明者らは、潜時約200msの陰性成分(N1成分)の潜時から語音聴取のうるささの判定が可能であることを見出した。本手法により、語音聴取のユーザ状態として、うるさいと感じていたかの評価を、語音ごとに客観的・定量的に実現できる。
以下で、これらをより詳細に説明する。はじめに、語音聴取のうるささ判定を実現するために本願発明者らが実施した脳波計測実験について説明する。その後、実施形態としての、語音聴取の快適性を評価する語音聴取のうるささ判定装置の概要および語音聴取のうるささ判定装置を含む語音聴取のうるささ判定システムの構成および動作を説明する。
2.脳波計測実験
脳波計測実験では、音声呈示後に取得したうるささに関する主観報告と、音声を起点とした事象関連電位との関係を調べた。以下、図1から図6を参照しながら、脳波計測実験の実験設定および実験結果を説明する。
実験参加者は、正常な聴力を持つ大学・大学院生13名であった。
図1は、脳波計測実験の実験手順の概要である。まず、手順Aにおいて単音節の音声を呈示した。呈示した音声の詳細は後述する。次に手順Bにおいて、参加者に音声を聞かせ、聞き取った音声に対応する平仮名を書き取らせた。呈示音声の条件を変えず、語音の種類のみ変化させた。手順AとBを5試行繰り返した。そして手順Cにおいて、参加者に手順Aで呈示した音声に対する、うるささ等に関する主観評価を実施させた。主観評価はタッチパネルを利用し、ビジュアルアナログスケール(100段階評価)で行った。上述の手順Aから手順Cを1ブロックとして12ブロック繰り返した(計60試行)。ブロックごとに呈示音声の音圧と歪みの条件は、ランダムな順序で変化させた。
図2は、1ブロック分の手順を示すフローチャートである。
ステップS11では、単音節の音声を実験参加者に呈示する。
ステップS12では、参加者が単音節の音声を聞いて対応する文字を思い浮かべる。
ステップS13では、参加者が聞き取った音声に対する文字を書き取る。
ステップS14では、音声の呈示回数をカウントする。呈示回数が4回まではステップS11に戻る。呈示回数が5回のときステップS15に進み、呈示回数をリセットする。
ステップS15では、参加者がステップS11で聞き取った音声に対して主観を回答する。
刺激として呈示した語音音声は、聞き取り間違いが多いとされる無声子音のうち、日本聴覚医学会が制定した67S式語表に含まれる8音(キ、ク、シ、ス、タ、テ、ト、ハ)とした。正常な聴力を有する参加者に対して、うるささを操作するために、周波数ゲインを調整した語音音声を用いた。「周波数ゲイン」とは、複数の周波数帯域ごとのゲイン(回路の利得、増幅率)を意味する。
周波数ゲインの調整には、音圧3種類(大:Large、中:Middle、小:Small)×歪み2種類(なし:Flat、あり:Distorted)の計6条件を利用した。具体的には以下の(1)〜(6)のとおりである。本明細書では、たとえば、音圧大・歪みなしはLargeとFlatの頭文字を取り、LF条件などと呼ぶ。
(1)LF(Large Flat)条件:音圧は大きく聞き分け易い音声として全ての周波数帯域においてゲインを20dB向上させた。(2)LD(Large Distorted)条件:音圧は大きいが聞き分けが難しい音声としてMD条件をベースに全体的に20dB向上させた。(3)MF(Middle Flat)条件:音圧が大きく聞き分けやすい音声として周波数ゲインの加工をしなかった。(4)MD(Middle Distorted)条件:聞き分けが難しい音声としてLF条件の音声を250Hz−16kHzの周波数のゲインを段々と−30dBまで調整(低減)した。(5)SF(Small Flat)条件:音圧は小さいが聞き分け易い音声として全ての周波数帯域においてゲインを20dB下げた。(6)SD(Small Distorted)条件:音圧が小さく聞き分けが難しい音声としてMD条件をベースに全体的に20dB下げた。
図3(a)は、音声と歪みの6条件の分類を示す。また、図3(b)は、周波数ごとのゲイン調整量を示す。高周波数帯の周波数ゲインを低減させた理由は、高齢難聴の典型的なパターンである高音漸傾型を模擬するためである。音声刺激は、周波数特性がフラットなスピーカから呈示した。
脳波は頭皮上のFz、Cz、Pz、C3、C4(国際10−20法)、左右こめかみ、右目上下から右マストイドを基準に記録した。「マストイド」とは、耳の裏の付け根の下部の頭蓋骨の乳様突起である。図4(a)は、国際10−20法(10−20 System)の電極位置を示し、図4(b)は本実験で電極を装着した電極配置を示す。サンプリング周波数は200Hz、時定数は1秒とした。オフラインで0.05−20Hzのディジタルバンドパスフィルタをかけた。音声呈示に対する事象関連電位として、音声が呈示された時刻を起点に−200msから1000msの波形を切り出した。ここで、「−200ms」とは、音声を呈示する時刻より200ミリ秒前の時点をいう。
以下、主観評価結果の分布と閾値の設定を説明する。
まず、主観評価の結果を示す。主観評価結果に基づき、後述の方法で決定した参加者ごとの閾値に基づいて、「うるさい」/「うるさくない」のラベル付けを行った。以下では、その主観評価のラベルを語音聴取時のユーザ状態とする。
図5は、うるささに関する参加者ごとの主観評価の結果である。横軸は主観評価値(ビジュアルアナログスケールの1から100)で、縦軸は度数分布を全試行数で割った割合(0から1)である。図5には全試行に対する割合が示されている。
図5中の実線は主観評価結果の分布であり、破線は主観評価(「うるさい」/「うるさくない」)を分割した閾値を示す。本願発明者らは、閾値を個人ごとの評価結果(ビジュアルアナログスケールの1から100)の順位に基づいて決定した。具体的には本願発明者らは、個人内での評価値の順位が、評価値が大きい方から3分の1を「うるさい」、それ以外を「うるさくない」とし、閾値を設定した。ただし、評価結果が同じものは同じ主観評価として扱った。
以下、事象関連電位の結果として、主観評価の結果によってラベル付けした、「うるさい」/「うるさくない」の基準に基づいて加算平均した結果を説明する。
図6は、頭頂部(Pz)において音声刺激が呈示された時刻を起点とした事象関連電位を示す。具体的には、図6は、上述の方法でラベル付けした「うるさい」/「うるさくない」の基準によって分けて総加算平均した波形である。加算平均は、上記計測実験の全6条件における、ブロックごとのうるささに関する主観評価に基づいて行った。図6の横軸は時間で単位はms、縦軸は電位で単位はμVである。図6中に示されたスケールから明らかなとおり、グラフの下方向が正(陽性)に、上方向が負(陰性)に対応している。図6中に示される実線は「うるさい」場合の総加算平均波形であり、破線は、「うるさくない」場合の総加算平均波形である。
図6より、「うるさくない」場合の破線に比べて、「うるさい」場合の実線では、潜時約200msに惹起される陰性成分(N1成分)の潜時が短いことが分かる。参加者ごとのN1成分の潜時は「うるさい」場合は195ms、「うるさくない」場合には240msであった。潜時をt検定した結果、有意差が認められた(p<.05)。よって、「うるさくない」場合よりも「うるさい」場合で潜時は短かったと結論付けることができた音声刺激の呈示(以下「音声呈示」という。)が行われた時刻を起点としたN1成分の潜時は、ユーザの主観的なうるささを反映し、語音聴取時のうるささの指標として利用できるといえる。
ところで、純音(トーンピップ、トーンバースト)を用いた従来研究により、聴覚刺激に対するN1成分の潜時および振幅は、音刺激の強度と立ち上がり時間に応じて変化することが知られている(鈴木他、1985、聴性脳幹反応−その基礎と臨床− pp384−385参照)。具体的には、刺激音の強度の増大に伴って潜時は短縮し、振幅(N1成分−P2成分の差の絶対値)は増大する。また、刺激音の立ち上がり時間の増大に伴い、振幅が減少する。
本実験では聴覚刺激として語音を用いた。図7は、本実験で用いた、MF条件(8語音:キ、ク、シ、ス、タ、テ、ト、ハ)の音声波形の例を示す。図7からも明らかなように、音声ごとに、子音部分の長さ・強度や、母音部分の強度・立ち上がり時間が異なっていることが分かる。たとえば子音部分の長さ(子音長)に着目する。子音長は、発生開始時刻(0ms)後に、波形が比較的大きく立ち上がるまでの時間長である。より具体的には、子音長は、母音が立ち上がるまでの時間長である。子音長は、カ行(キ・ク)では約80ms、サ行(シ・ス)では約170ms、タ行(タ・テ・ト)では約40ms、ハ行(ハ)では130msであった。また、たとえば、子音部分の強度は、サ行においてカ・タ・ハ行と比べて強かった。それら行ごとの音声波形が大きく異なる一方で、同じ行であれば全体の波形の特徴が似ていることも分かる。
なお、カ行とは、kから始まる語音を示す。具体的には、ka、ki、ku、ke、koを示す。サ行とは、sから始まる語音を示す。具体的には、sa、si、su、se、soを示す。タ行とは、tから始まる語音を示す。具体的には、ta、ti、tu、te、toを示す。
従来研究における純音刺激に関する知見、および、図7に示した語音ごとの音声波形の差異によれば、語音に対するN1成分の潜時・振幅は、語音ごとに異なる可能性がある。呈示した語音音声の特徴がN1成分の潜時変動の要因であるとすれば、「うるささ」とは無関係にN1成分の潜時が変動する。そのため、たとえばうるさくない音声に対してうるさい、あるいはうるさい音声に対してうるさくない、のような誤評価をするおそれがある。
そこで、本願発明者らは、音声波形の特徴が似ている同じ行ごとに加算平均を実施した。行ごとの加算平均により、N1成分の潜時の分析に必要な一定の加算平均回数を確保した。そして、行ごとの加算平均波形の結果から音声刺激の特徴の違いがN1成分の潜時におよぼす影響を調べた。なお、音圧とN1成分潜時との関係を明らかにするために、歪みの有無に関わらず、音圧ごとに加算平均を実施した。
図8(a)〜(c)は、行ごとの加算平均の結果の一例である。図8(a)〜(c)は順に、タ行(タ・テ・ト)、ハ行(ハ)、サ行(シ・ス)の結果を示している。図8の横軸は時間で単位はms、縦軸は電位で単位はμVである。
図8中に示されたスケールから明らかなとおり、グラフの下方向が正(陽性)に、上方向が負(陰性)に対応している。図8中に示される太実線はLarge条件(85dB)の場合の総加算平均波形であり、破線は、Middle条件(65dB)の場合の総加算平均波形、細実線はSmall条件(45dB)の場合の総加算平均波形である。図8中の○印は、N1成分を示している。N1成分は、たとえば0msから500msの区間における最小値を取っている。また、図8(a)から(c)中に、音声波形と脳波との時間的な対応関係を示すために、それぞれの行を代表して、語音「タ」、「ハ」、「シ」の音声波形を、起点をそろえて示した。図8より、いずれの行においても、音圧の増大に伴ってN1成分の潜時が短縮している様子が見て取れる。また、図8(c)のLarge条件では、母音部分が立ち上がる前に、N1成分がピークをとることがわかる。
図9は、本実験によって得られたN1成分の潜時の、音圧による変化の一例を示す。図9中には、従来研究による純音の音圧による変化も示した。図9によれば、(1)音強度、および、(2)子音長について、下記の特徴を見出すことができる。(1)音強度については、いずれの行においても音圧の増大に伴い、N1潜時が短縮していることが分かる。また、(2)子音長については、タ行の結果とハ行の結果との比較により、子音長に応じて、N1成分の潜時が異なることが分かる。
以下、上述の音強度、および、子音長に関してそれぞれ考察する。
まず、語音音声の音圧増大に伴うN1成分の潜時の減少特性を考察する。従来研究によれば、純音では、同様の40dBの音圧増大に対して、N1成分の潜時は10msのみ短縮することが分かっている。一方、本願発明者らの実験結果を用いて語音音声の音圧増大に伴うN1潜時の減少度合いを検討すると、45dBから85dBにかけての40dBの音圧増大に対して、サ行・タ行・ハ行の平均で約100ms短縮することが認められた。これは、純音と語音とではN1成分の減少特性が異なることを示している。よって、語音音声の音圧増大に伴う振幅減少特性は本願発明者らが実施した実験において初めて明らかになったといえる。
次に、子音長に応じたN1成分の潜時の減少特性を考察する。たとえば、図7に示されるように、タ行とハ行の子音長はそれぞれ約40msと約130msであり、約90msの差がある。Small条件におけるタ行とハ行の潜時は236msと322msであり、約90msの差が保存されている。よって、このN1成分は母音の立ち上がりに対して惹起されたと考えられる。一方、ほかの行と比べて子音強度が強いサ行では、子音長の影響は異なった。サ行の子音長は約170msであり、ハ行の子音長(約130ms)比較して長いが、全ての音圧条件においてN1成分の潜時はサ行においてハ行よりも短かった。また、サ行のLarge条件におけるN1成分の潜時は156msであり、サ行の子音長よりも短かった。
これらの結果から、子音長の持続時間が所定時間(たとえば100ms程度)よりも長く、かつ子音強度が強い場合には、子音に対してN1成分が惹起されるといえる。
図10は、刺激として呈示した語音音声の子音強度の例として、MF条件における子音部分に関する二乗平均振幅のその時刻までの和を示す。図10より、サ行では、ほかの語音と比較して、子音部の強度が強いことが分かる。「子音強度」とは、音声波形の子音部分の時間帯における振幅の大きさを意味する。子音強度は、たとえば子音部分の振幅の二乗平均値によって求めてもよい。
また、図11は、子音強度が弱い子音および強い子音の各音声波形の例を示す。ザ行「ジ」・ラ行「リ」に比べてマ行「モ」・ナ行「ネ」の子音強度が強い様子が見て取れる。なお、サ行以外に、たとえばマ行・ナ行・ヤ行・ワ行・ガ行の語音については子音強度が強いといえる。
よって、子音部分の強度が強い子音の、子音部分に対してN1成分が惹起されず、母音部分にのみN1成分が惹起された場合(N1成分の潜時が想定よりも大幅に遅れた場合)には、子音部分が聞き取れなかったと判定することも可能である。
以上、脳波計測実験により、語音聴取に対するユーザのうるささに関する主観評価を反映する脳波成分の存在が明らかになった。具体的には、うるささは潜時約200msにピークを持つ陰性電位に反映されることを発見した。また、N1成分の潜時は、音声波形の違いの影響で語音ごとに異なることを発見した。
上述の頭頂部(Pz)における、うるささに関する主観評価ごとの、潜時約200msのN1成分(図6)の潜時は、たとえば該当区間において最小の電位を取る時刻としてもよい。また、典型的なN1成分の波形からテンプレートを作成し、そのテンプレートと計測波形の一致度が最も高くなる場合の、テンプレートのN1成分のピーク時刻を潜時としてもよい。なお、N1成分の潜時は、潜時に関する所定の閾値との比較を行う方法等によって識別可能である。なお、閾値・テンプレートはあらかじめ保持した典型的なユーザのものを利用してもよいし、個人ごとに作成してもよい。また、今回の実験では、音声が呈示された時刻を起点とした事象関連電位にうるささに関する主観を反映した成分が出現することを確認する意味で、13人の参加者のデータを加算平均した。しかし、特徴量抽出の方法(たとえば波形のウェーブレット変換)や識別方法(たとえばサポートベクターマシンラーニング)の工夫により、非加算または数回程度の少数加算でも陰性成分の識別は可能である。
本願明細書においては、事象関連電位の成分を定義するためにある時点から起算した所定時間経過後の時刻を、たとえば「潜時約200ms」と表現している。これは、200msという特定の時刻を中心とした範囲を包含し得ることを意味している。「事象関連電位(ERP)マニュアル−P300を中心に」(加我君孝ほか編集、篠原出版新社、1995)の30頁に記載の表1によると、一般的に、事象関連電位の波形には、個人ごとに30msから50msの差異(ずれ)が生じる。したがって、「約Xms」や「Xms付近」という語は、Xmsを中心として30から50msの幅がその前後(例えば、300ms±30ms、750ms±50ms)に存在し得ることを意味している。また、上述のように、語音音声の特徴に応じてN1成分の潜時は変化する。よって、少なくとも子音長の変動分(0ms:母音から約200ms:子音)を含めて、より広い幅、たとえば前後に約150ms程度の幅であるとして取り扱うことが好ましい。よって、本実施形態において、「潜時約200ms」は、50ms以上350ms以下の範囲に含まれる潜時を意味する。
以上、本願発明者らが実施した脳波計測実験により、音声が呈示された時刻を起点とした事象関連電位において、潜時約200msの陰性成分(N1成分)がうるささを反映することが明らかになった。ゆえに、音声呈示(音声刺激)に対する事象関連電位を指標に、語音聴取時のうるささに関する主観評価が実現可能となる。
図12は、本願発明者らによってまとめられた、N1成分の潜時とうるささ判定との対応関係を示す。N1成分の潜時が所定の閾値よりも短い場合に「うるさい」と判定する。N1成分の潜時が所定の閾値よりも長い場合に「うるさくない」と判定する。
なお、一般的には「陰性成分」とは0μVよりも小さい電位を意味する。しかしながら本願明細書では、「うるさい」と感じたか否かを識別するために、潜時が所定の閾値よりも短い場合を「陰性成分あり」、潜時が所定の閾値よりも長い場合を「陰性成分なし」と定義する。閾値の具体例は後述する。
以下、本発明の実施形態にかかる語音聴取のうるささ判定システムを説明する。語音聴取のうるささ判定システムは、単音節の語音を音声で順次呈示し、音声が呈示された時刻を起点とした事象関連電位の潜時約200msの陰性成分の潜時に基づいて、語音聴取のうるささ判定を実現する。これは本願発明者らの発見に基づき初めて実現される。
(実施形態1)
以下では、まず、語音聴取のうるささ判定システムの概要を説明する。その後、語音聴取のうるささ判定装置を含む語音聴取のうるささ判定システムの構成および動作を説明する。
本実施形態による語音聴取のうるささ判定システムは、音声を順次呈示し音声呈示時刻の各々を起点に事象関連電位を計測する。そして、潜時約200msの陰性成分を検出し、語音聴取のうるささを判定する。
本実施形態においては、探査電極を頭頂部(Pz)に設け、基準電極を左右どちらかのマストイドに設けて、探査電極と基準電極の電位差である脳波を計測する。なお、事象関連電位の特徴成分のレベルや極性は、脳波計測用の電極を装着する部位や、基準電極および探査電極の設定の仕方に応じて変わる可能性がある。しかしながら、以下の説明に基づけば、当業者は、そのときの基準電極および探査電極に応じて適切な改変を行って事象関連電位の特徴成分を検出し、語音明瞭度の評価を行うことが可能である。そのような改変例は、本発明の範疇である。
なお、上記脳波計測実験の説明においては、実験的に正常な聴力を有する参加者に対して周波数ゲインの強弱を変化させて、難聴者の聞こえの状況に近い状況を再現した。しかしながら、難聴者に対して評価を実施する場合には聞き分けにくい語音をあえて呈示する必要はない。本実施形態では、あらかじめ測定した難聴者のオージオグラムからフィッティング理論に基づいて、周波数ごとに最適なゲインで調整された音声を呈示することを前提とする。なお、ユーザが補聴器を装用した状態で評価する場合には、呈示する音声に対する調整は不要である。
図13は、本実施形態による語音聴取のうるささ判定システム100の構成および利用環境を示す。この語音聴取のうるささ判定システム100は後述する実施形態1のシステム構成に対応させて例示している。
語音聴取のうるささ判定システム100は、語音聴取のうるささ判定装置1と、音声出力部11と、生体信号計測部50とを備えている。生体信号計測部50は少なくとも2つの電極AおよびBと接続されている。電極Aはユーザ5のマストイドに貼り付けられ、電極Bはユーザ5の頭皮上の頭頂部(いわゆるPz)に貼り付けられている。
語音聴取のうるささ判定システム100は、単音節の語音をある音圧の音声でユーザ5に呈示し、音声呈示時刻を起点に計測したユーザ5の脳波(事象関連電位)において潜時約200msのN1成分の潜時が所定の閾値よりも短いか否かを識別する。そして、呈示音声と当該N1成分の潜時に関する識別結果に基づき、語音聴取時にユーザがうるさいと感じたかを判定する。
ユーザ5の脳波は、電極Aと電極Bとの電位差に基づいて生体信号計測部50により取得される。生体信号計測部50は、電位差に対応する情報(脳波信号)を無線または有線で語音聴取のうるささ判定装置1に送信する。図13では、当該情報を生体信号計測部50が無線で語音聴取のうるささ判定装置1に送信する例を示している。
語音聴取のうるささ判定装置1は、語音聴取のうるささ判定のための音声の音圧又は音声の呈示タイミングの制御を行い、音声出力部11(たとえばスピーカ)を介してユーザ5に音声を呈示する。
図14は、本実施形態による語音聴取のうるささ判定装置1のハードウェア構成を示す。語音聴取のうるささ判定装置1は、CPU30と、メモリ31と、オーディオコントローラ32とを有している。これらは互いにバス34で接続され、相互にデータの授受が可能である。
CPU30は、メモリ31に格納されているコンピュータプログラム35を実行する。コンピュータプログラム35には、後述するフローチャートに示される処理手順が記述されている。語音聴取のうるささ判定装置1は、このコンピュータプログラム35にしたがって、同じメモリ31に格納されている語音データベース(DB)71を利用して、語音聴取のうるささ判定システム100の全体を制御する処理を行う。この処理は後に詳述する。
オーディオコントローラ32は、CPU30の命令に従って、それぞれ、呈示すべき音声を生成し、生成した音声信号を指定された音圧で音声出力部11に出力する。
なお、語音聴取のうるささ判定装置1は、1つの半導体回路にコンピュータプログラムを組み込んだDSP等のハードウェアとして実現されてもよい。そのようなDSPは、1つの集積回路で上述のCPU30、メモリ31、オーディオコントローラ32の機能を全て実現することが可能である。
上述のコンピュータプログラム35は、CD−ROM等の記録媒体に記録されて製品として市場に流通され、または、インターネット等の電気通信回線を通じて伝送され得る。図14に示すハードウェアを備えた機器(たとえばPC)は、当該コンピュータプログラム35を読み込むことにより、本実施形態による語音聴取のうるささ判定装置1として機能し得る。なお、語音DB71はメモリ31に保持されていなくてもよく、たとえばバス34に接続されたハードディスク(図示せず)に格納されていてもよい。
図15は、本実施形態による語音聴取のうるささ判定システム100の機能ブロックの構成を示す。語音聴取のうるささ判定システム100は、音声出力部11と、生体信号計測部50と、語音聴取のうるささ判定装置1とを有している。図15はまた、語音聴取のうるささ判定装置1の詳細な機能ブロックも示している。すなわち、語音聴取のうるささ判定装置1は、事象関連電位処理部55と、うるささ判定部65と、呈示語音決定部70と、語音DB71と、結果蓄積DB80とを備えている。なお、ユーザ5のブロックは説明の便宜のために示されている。
語音聴取のうるささ判定装置1の各機能ブロック(語音DB71を除く)は、それぞれ、図14に関連して説明したプログラムが実行されることによって、CPU30、メモリ31、オーディオコントローラ32によって全体としてその時々で実現される機能に対応している。
語音DB71は、語音聴取のうるささ判定を行うための語音のデータベースである。図16は、たとえば67S式語表の20語音を検査語音として用いる場合の語音DB71の例を示す。図16に示した語音DB71では、呈示する語音ごとの音声ファイル、子音ラベルに加えて、語音ごとのN1成分の基準潜時を対応付けて保持する。語音毎のN1成分の基準潜時は、語音に含まれる子音の長さ又は子音の強度に応じた長さであることが好ましい。音声ファイルは、たとえば67S語表の20語に関する標準的なテスト音声としてもよいし、補聴器を装用して主に会話する相手の声を収録した収録音声としてもよい。保存されている音声は、あらかじめ測定した難聴者のオージオグラムからあるフィッティング理論に基づいて周波数ごとのゲイン調整(補聴処理)が完了しているとする。なお、保存される語音の種類は、67S式語表の20語音以外にも、57S式語表の50音を用いてもよい。子音ラベルは、ユーザ5がどの子音においてうるささが高いかを評価する際に利用される。
N1成分の基準潜時は、語音音声の特徴の違いの影響を考慮した、語音ごとのN1成分の潜時の閾値(単位はms)である。標準的なテスト音声を用いる場合には、一般的なユーザがうるささを感じる音圧において、語音ごとに計測したN1成分の潜時を用いてもよい。また、標準的なテスト音声に限らず、たとえば補聴器を装用して主に会話する相手の声を録音した収録音声を用いる場合には、たとえば呈示語音の子音長と子音強度とに基づいて算出した値を設定してもよい。このN1成分の基準潜時と、計測したN1成分の潜時との比較によって、うるささを判定する。うるささ判定の方法については後述する。
再び図15を参照する。呈示語音決定部70は、語音DB71を参照し、どの語音をどの音圧で呈示するかを決定する。呈示語音は、たとえばランダムな順序で選択・決定してもよい。呈示語音の音圧は、語音明瞭度曲線測定の55dB SPL、65dB SPL、75dB SPL、85dB SPLの音声に対して補聴処理を実施した後の音圧とする。音圧は、小さな音圧から大きな音圧に順に変更してもよいし、その逆でもよい。また、ランダムな順序で音圧を選択してもよい。
呈示語音決定部70は、音声呈示時刻に合わせてトリガを生体信号計測部50へ出力し、また呈示される音声の内容を事象関連電位処理部55に送信する。
音声出力部11は、呈示語音決定部70によって決定された単音節の音声を再生することにより、ユーザ5に呈示する。
生体信号計測部50は、ユーザ5の生体信号を計測する脳波計であり、生体信号として脳波を計測する。そして、脳波データに対してN1成分の抽出に適した遮断周波数の周波数フィルタリングを行い、呈示語音決定部70から受けたトリガを起点に所定区間(たとえば−200msから500msの区間)の脳波の事象関連電位を切り出し、その波形データ(脳波データ)を事象関連電位処理部55に送付する。N1成分の周波数は10Hz程度である。よって、周波数フィルタとしてバンドパスフィルタを用いる場合には、たとえば脳波の5Hzから15Hzまでの成分を通過させるように設定してもよい。ユーザ5はあらかじめ脳波計を装着しているものとする。脳波計測用の電極はたとえば頭頂部のPzに装着される。
事象関連電位処理部55は、呈示語音決定部70から受けた呈示音声の内容に応じて、生体信号計測部50から受けた事象関連電位の加算演算を行う。事象関連電位処理部55は、たとえば同じ語音の音声呈示に対する事象関連電位のみを選択して、語音の種類毎に事象関連電位の加算演算を行う。同じ語音のみで事象関連電位を加算した場合には語音ごとのうるささ判定が可能となる。語音音声の特徴は同じ子音を持つ語音において似ているため、加算は、同じ子音を持つ語音の事象関連電位を選択して行ってもよい。また、図16に示したN1成分の基準潜時の差がたとえば10ms以内と小さい語音をグルーピングして加算してもよい。同じ子音を持つ語音で加算した場合には、子音の種類毎に、語音聴取のうるささの評価が可能となる。また、N1成分の基準潜時の差が小さい語音ごとに加算した場合には、そのグループごとのうるささ判定が可能となる。子音ごと、N1成分の基準潜時の差の小さなグループごとの加算によって、ある程度加算回数が確保された加算波形がそれぞれ得られる。また、たとえば、計測脳波データの特徴として、事象関連電位処理部55において、N1成分をシグナルとしてS(signal)/N(noise)を求めてもよい。なお、上述の実験では事象関連電位の加算平均を実施したが、N1成分の潜時のみに着目する場合には平均の処理は不要である。
事象関連電位処理部55は、語音ごとに所定回数の加算演算を実行して得られた脳波データを、うるささ判定部65に送付する。
うるささ判定部65は、事象関連電位処理部55から脳波データを受け取って、後述する解析処理を行う。
うるささ判定部65は、事象関連電位処理部55から受け取った脳波データの潜時約200msにおける、N1成分の潜時に基づいて、ユーザがうるさいと感じたか否かを判定する。たとえば、うるささ判定部65は、呈示語音決定部70から受けたトリガを起点とする50msから350msの間で陰性電位のピークを与える時刻(以下「ピーク潜時」とも呼ぶ。)を、N1成分の潜時として、語音DB71に保存した所定の基準潜時(閾値)と比較する。そして、N1成分のピーク潜時が所定の閾値よりも短い場合には「うるさい」と判定し、ピーク潜時が所定の閾値より小さい場合を「うるさくない」と判定する。ここで、「うるさい」とは、語音が、ユーザが不快に感じるほど大きな音圧であることを意味する。「うるさくない」とは、語音が、ユーザがうるさすぎて不快に感じることのない範囲の音圧であることを意味する。なお、うるささ判定部65は、「うるさい」と「うるさくない」の2値の判定だけでなく、N1成分のピーク潜時と基準潜時との差を判定してもよい。
たとえば語音ごとにうるささを判定する場合には、語音ごとの基準潜時を所定の閾値とする。また、同じ子音をもつ行ごとにうるささを判定する場合には、行ごとの基準潜時を所定の閾値とし、基準潜時の差が小さいグループごとにうるささを判定する場合には、グループごとの基準潜時を所定の閾値としてもよい。
結果蓄積DB80は、呈示語音決定部70から呈示した音声の情報を受け取る。また結果蓄積DB80は、うるささ判定部65から語音ごとのうるささ判定の結果の情報を受け取る。そして、たとえば呈示音声の語音ごと・音圧ごとに、受け取ったうるささの判定結果の情報を蓄積する。
図17は、結果蓄積DB80におけるデータ蓄積の例である。図17では、語音ごと・音圧ごとにうるささの情報を蓄積する場合を例示している。たとえば図17中の「1」は、うるささ判定部65においてN1成分の潜時が基準潜時よりも短く、「うるさい」と判定された場合を示し、「0」は、N1成分の潜時が基準潜時よりも長く、「うるさくない」と判定された場合を示す。
図18(a)から(c)は、語音明瞭度曲線の測定結果(従来評価)と、従来評価に加えて本実施形態による語音聴取のうるささ判定結果の例である。図18(a)は、装用時において呈示音声の音圧ごとの語音明瞭度のみを評価した例である。この例は従来の評価手法によって得られた評価結果である。この例では、65dB SPL以上の音圧において、明瞭度は80%以上と評価されている。そのため、非装用時(図18には表示せず)と比較して語音明瞭度が向上している場合には補聴器適合検査で適合と判定される。
図18(b)および(c)は、図18(a)に示した装用時における語音明瞭度曲線の測定結果に加えて、本実施形態によるうるささ判定を加えた評価結果の例である。語音明瞭度曲線は、発話やキー入力等を行う従来の方法で別途測定したとする。
図18(b)および(c)の明瞭度は同じであるが、うるささ判定の結果が大きく異なる。たとえば、図18(b)では、うるささの評価が全体的に低い。そこで、ユーザがうるささを感じることが少ない補聴処理であると評価できる。また、たとえば、図18(c)では、うるささの評価が全体的に高く、65dB SPL以上の大きな音圧では特に高い。そこで、日常会話の音圧である65dB SPLでうるささを感じる補聴処理だと評価できる。このような評価によって、たとえば図18(b)の場合に、ユーザがさらに明瞭度向上を要求するのであれば、全体的にゲイン調整量を上げる、図18(c)の場合には全体的にゲイン調整量を下げ、さらにノンリニア増幅におけるコンプレッションを強くするという具体的なフィッティング手順の提案ができる。
なお、図18(b)、(c)では、装用時のみのうるささの評価を示しているが、非装用時(裸耳)についてもうるささを評価し、非装用時と装用時でうるささを比較してもよい。
次に、図19を参照しながら図15の語音聴取のうるささ判定システム100において行われる処理手順を説明する。図19は、語音聴取のうるささ判定システム100において行われる処理の手順を示すフローチャートである。
ステップS101において、呈示語音決定部70は語音DB71を参照しながら呈示する単音節の語音と音圧を決定する。音声出力部11は、決定された音圧でユーザ5にその語音を呈示する。呈示語音決定部70は、生体信号計測部50にはトリガを送信し、事象関連電位処理部55には呈示した語音に関する音声情報を送信する。呈示する語音はDB71からランダムに選択してもよいし、特定の子音の語音を集中的に選択してもよい。呈示語音の音圧は、たとえば語音明瞭度曲線測定の55dB SPL、65dB SPL、75dB SPL、85dB SPLの音声に対して補聴処理を実施した後の音圧とする。音圧の呈示順序は、小さな音圧から大きな音圧に順に変更してもよいし、その逆でもよい。また、ランダムな順序で音圧を選択してもよい。
ステップS102において、生体信号計測部50は呈示語音決定部70からトリガを受けて、計測した脳波のうち、トリガを起点にたとえば−200msから500msまでの事象関連電位を切り出す。そしてたとえば−200msから0msの平均電位を求め、その平均電位が0μVになるよう、得られた事象関連電位をベースライン補正する。
なお、生体信号計測部50は、評価中常に脳波を計測し、脳波データに対してN1成分の抽出に適した周波数フィルタをかけているものとする。適した周波数フィルタとは、たとえばN1成分の中心周波数10Hz周辺の、5Hzから15Hzを通過させるバンドパスフィルタである。なお、脳波データに対してたとえば5Hz以上のハイパスフィルタをかけた場合には、低周波の基線変化の影響をほとんど受けないため、ベースライン補正は必須ではない。
ステップS103において、事象関連電位処理部55はステップS102で切り出した事象関連電位を、呈示語音決定部70から受けた呈示語音の情報に基づき、語音ごと・音圧ごとに加算する。本実施形態では語音ごと・音圧ごとに加算演算を行っているが、加算演算の対象は語音ごとに限られない。たとえば、語音の種類に応じて、たとえば子音ごとや基準潜時の差の小さい語音のグループごとに行ってもよいし、呈示された音圧ごとに行ってもよい。すなわち、各語音が語音の種類または、子音の種類、基準潜時の差が小さいグループの少なくとも一つに基づいて分類されるときにおいて、事象関連電位処理部55は、同じ分類に属する語音が呈示されたときに得られる脳波信号の事象関連電位を加算すればよい。
ステップS104において、事象関連電位処理部55はステップS101で呈示された語音に対する事象関連電位の加算回数が所定の加算回数に到達したか否かを判定する。加算回数が所定回数以下の場合には処理はステップS101へ戻り、音声の呈示を繰り返す。加算回数が所定回数以上の場合には、処理はステップS105へ進む。所定回数とは、たとえば20回である。なお、「20回」は、事象関連電位を計測する分野において多く採用される加算回数であるが、これは一例に過ぎない。たとえば、事象関連電位処理部55において、N1成分をシグナルとしてS(signal)/N(noise)を求め、S/Nが一定以上となる加算回数を所定回数としてもよい。
ステップS105において、事象関連電位処理部55は所定回数の加算演算をした脳波データをうるささ判定部65に送付する。
ステップS106において、うるささ判定部65は、事象関連電位処理部55から受け取った脳波データのN1成分の潜時を求め、語音DB71から受け取ったN1成分の基準潜時と比較を行う。脳波データにおけるN1成分の潜時は、たとえば0msから500msの区間において電位が最小となる時刻とする。また、ステップS103において語音ごと・音圧ごとの加算を実施した場合には、語音ごとの基準潜時と、脳波データにおけるN1成分の潜時との比較を行う。
ステップS107において、うるささ判定部65は、脳波データにおけるN1成分の潜時が基準潜時よりも短い場合に、ユーザ5はうるさいと感じたと判定する。一方、脳波データにおけるN1成分の潜時が基準潜時よりも長い場合に、ユーザ5はうるさくないと感じたと判定する。
ステップS108において、結果蓄積DB80は、ステップS101で呈示した語音ごと・音圧ごとに、うるささ判定部65から受け取ったうるささの判定結果の情報を蓄積する。
ステップS109において、呈示語音決定部70は、語音聴取のうるささを評価する予定の、全ての語音・音圧において刺激呈示が完了したか否かを判定する。完了していない場合には処理はステップS101へ戻り、完了している場合には語音聴取のうるささ判定を終了する。
結果蓄積DB80において蓄積した語音ごと・音圧ごとのうるささ判定結果に基づけば、より具体的なフィッティング手順の提案ができる。たとえば、図18(b)に示す語音明瞭度曲線の測定結果が得られたとする。図18(b)ではうるささの評価が全体的に低いと考えられる。しかしながら、ユーザがさらに明瞭度向上を要求するのであれば、全体的にゲイン調整量を上げればよい。これにより、そのユーザにより適切なフィッティングを実現できる。また、図18(c)に示す語音明瞭度曲線の測定結果が得られた場合には全体的にゲイン調整量を下げ、さらにノンリニア増幅におけるコンプレッションを強くする、というフィッティングを提案してもよい。
本実施形態では、単音節の語音を音声で呈示する設定で音声が呈示された時刻を起点とした事象関連電位の潜時約200msの陰性成分を用いた処理により、語音聴取のうるささを評価した。上述の処理によれば、語音聴取時に、ユーザがどれくらいうるささを感じたか(うるささ)に関する判定が実現できる。これは、語音明瞭度とは異なる語音聴取のうるささを軸として、補聴処理の適合度合いを評価できることを意味する。うるささを軸として補聴処理の評価ができるので、ユーザが語音聴取時にうるささを感じない、聞いていて疲れにくい補聴処理を実現できる。
なお、本実施形態における語音聴取のうるささ判定装置1は、図14に示すとおり、一般的なハードウェアを用いた、小型化可能な構成により実現される。うるささ判定装置1を持ち運び可能な大きさおよび重さで構成してユーザが携行することにより、ユーザが補聴器を利用する音環境で語音聴取の快適性を評価することができる。なお、図13では音声出力部11をスピーカとしたが、音声出力部11はヘッドフォンでもよい。ヘッドフォンを用いることで、持ち運びが簡易になりユーザが利用する環境において語音明瞭度の評価が可能となる。
本実施形態では日本語の評価を想定して説明した。しかしながら、単音節の語音であれば英語でも中国語でもよい。たとえば英語の場合には、単音節の単語を呈示し、単語ごとの評価をしてもよい。単音節の英単語は、短時間の音声であり、子音と母音とで構成されている。そのため、上述の日本語における単音節語音とほぼ同様に、子音長および子音強度に基づいて、単語ごとに基準潜時を決定できる。
図20は、単音節の単語ごとにうるささを評価した結果の一例を示している。図20中の「1」は、ユーザがうるさいと感じたこと、「0」はうるさいと感じなかったことを示す。
本実施形態の語音聴取のうるささ判定システム100によれば、ユーザは音声を聞いているだけで語音聴取時にどれくらいうるささを感じたか(うるささ)の判定が実現される。これにより、語音聴取時にユーザが感じる「うるささ」が定量化され、うるささの軸で補聴処理の評価ができるようになり、うるささを感じない、聞いていて疲れにくいフィッティングを実現できる。
本実施形態の説明では、生体信号計測部50は、呈示語音決定部70からのトリガを起点にして予め定められた範囲の事象関連電位を切り出し、ベースライン補正を行って電位波形のデータを事象関連電位処理部55に送信するとした。しかしながら、この処理は一例である。他の処理として、たとえば、生体信号計測部50は継続的に脳波を計測し、事象関連電位処理部55が必要な事象関連電位の切り出しおよびベースライン補正を行ってもよい。当該構成であれば、呈示語音決定部70は生体信号計測部50にトリガを送信する必要はなくなり、事象関連電位処理部55にトリガを送信すればよい。
また、本実施形態においては、うるささ判定の結果は、結果蓄積DB80に蓄積されるとしたが、蓄積しなくてもよい。たとえば結果蓄積DB80をうるささ判定装置1の外部に設ける場合には、うるささ判定部65の各判定結果を単に出力すればよい。各判定結果は、語音聴取のうるささに関する情報として利用され得る。
本実施形態に示すうるささ判定システムは、音声呈示後のユーザ脳波の潜時約200ms(より具体的には50msから350ms)の陰性成分の潜時に応じて、語音聴取に対してどれくらいうるさいと感じたか(うるささ)を判定する。その際、語音ごとに異なる基準潜時を設定することで、語音ごとのたとえば子音部分の長さ(子音長)や子音部分の強度(子音強度)などの特徴によらずに高精度でうるささを評価する。語音聴取に対するうるささ判定により、ユーザがうるささを感じることがなく、長時間にわたって補聴器を装用しても疲れにくい補聴処理を選択できる。
(実施形態2)
実施形態1による語音聴取のうるささ判定システム100では、語音DB71に保存されたある1種類の補聴処理に基づいてあらかじめ調整された所定の音声に対して、潜時約200msの陰性成分の有無に基づき、語音聴取時のうるささを判定した。
しかしながら、近年、信号処理の高精度化に伴い、たとえば子音強調、指向性、ノイズリダクション等の機能を実現する補聴処理方法の開発が進んでおり、1つの補聴処理に対するうるささ判定の結果のみから、最適な補聴処理を探索・特定することには限界があった。
そこで本実施形態では、呈示する語音音声を補聴器から出力される音に加工する補聴処理部を設け、補聴処理ごとのうるささを評価する、語音聴取のうるささ判定システムについて説明する。
図21は、本実施形態による語音聴取のうるささ判定システム200の機能ブロックの構成を示す。語音聴取のうるささ判定システム200は、音声出力部11と、生体信号計測部50と、語音聴取のうるささ判定装置2とを有している。図15と同じブロックについては同一の参照符号を付し、その説明は省略する。なお、語音聴取のうるささ判定装置2のハードウェア構成は、図14に示すとおりである。実施形態1で説明したプログラム35(図14)と異なる処理を規定するプログラムが実行されることにより、図21に示す本実施形態による語音聴取のうるささ判定装置2が実現される。うるささ判定システム200は、補聴処理システムとも表記する。
本実施形態による語音聴取のうるささ判定装置2が、実施形態1による語音聴取のうるささ判定装置1と大きく相違する点は、新たに補聴処理部90を設けた点である。なお、うるささ判定装置2の構成要素名に関しては、原則として実施形態1と同じ名称を用いているが、異なる動作および/または機能を有している場合には、異なる参照符号を用いている。たとえば、本実施形態では、実施形態1では行わなかった、複数の補聴処理ごとのうるささ判定を実施するため、実施形態1にかかる事象関連電位処理部55、呈示語音決定部70、語音DB71、結果蓄積DB80に代えて、本実施形態では事象関連電位処理部56、呈示語音決定部75、語音DB72、結果蓄積DB85を設けている。
以下、語音DB72、呈示語音決定部75、補聴処理部90、事象関連電位処理部56、結果蓄積DB85および補聴処理部90を説明する。
語音DB72は、実施形態1にかかる語音DB71と同様に、たとえば図16に示した67S式語表の20語音のような語音聴取のうるささ判定を行うための語音データベースである。語音DB71と同様に、語音ごとにN1成分の基準潜時の情報も保持している。語音DB72と語音DB71との差異は、語音DB72が補聴処理前の語音データを持つ点である。
呈示語音決定部75は、実施形態1にかかる呈示語音制御部70と同様に語音DBを参照し、語音の種類と音圧を決定する。呈示語音決定部75と呈示語音制御部70との差異は、呈示語音決定部75がどの補聴処理で音声を加工するかを選択し、補聴処理部90に呈示語音の音声データを共に送付する点である。
補聴処理部90は、呈示語音決定部75から受けた補聴処理選択に関する指示と、音声データとに基づき、音声データを指示された補聴処理方法で加工する。補聴処理には、たとえば子音強調、指向性、ノイズリダクション等がある。子音強調の補聴処理が選択されていた場合には、たとえば通常よりも子音周波数のゲイン増幅量を上げるという処理をほどこし、音声データを加工する。なお、補聴処理部90は、うるささ判定部65の判定結果に基づいて、音声のゲイン増幅量を調整してもよい。たとえば、うるささ判定部65がうるさいと判定した語音の音声データに対して、所定のゲイン増幅量を低下させる。うるささ判定部65がうるさくないと判定した語音の音声データに対して、ゲイン増幅量を調整しない。または、うるささ判定部65が判定した、N1成分のピーク潜時と基準潜時との差に基づいて、ゲイン増幅量を決定しても良い。たとえば、N1成分のピーク潜時と基準潜時との差の大きさが、あらかじめ定めた範囲に含まれる場合には、補聴処理部90は、ゲイン増幅量を調整しない。N1成分のピーク潜時と基準潜時との差の大きさと、あらかじめ定めた範囲の上限値または下限値との差が大きいほど、補聴処理部90は、ゲイン増幅量を小さくする。
事象関連電位処理部56は、実施形態1にかかる事象関連電位処理部55と同様に、呈示語音決定部75から受けた呈示音声の内容に応じて、生体信号計測部50から受けた事象関連電位の加算演算を行う。事象関連電位処理部56と事象関連電位処理部55との差異は、事象関連電位処理部56は、呈示語音決定部75から補聴処理の情報を受けて、語音ごと・音圧ごと・補聴処理ごとの加算演算を行う点である。
結果蓄積DB85は、実施形態1にかかる結果蓄積DB80と同様に、たとえば語音ごと・音圧ごとに、うるささ判定部65から受け取ったN1成分の潜時に基づく、うるささ判定結果の情報を蓄積する。結果蓄積DB85と結果蓄積DB80との差異は、結果蓄積DB85は、呈示語音決定部75から、呈示刺激の語音・音圧の情報に加えて、補聴処理の種類の情報を受け取り、補聴処理の種類ごとにデータを蓄積する点である。
図22(a)および(b)は、結果蓄積DB85におけるデータ蓄積の例である。図22では、語音ごと・音圧ごと・補聴処理ごとにうるささの判定結果をそれぞれ蓄積する場合を例示している。図22(a)は補聴処理Aのパターンを示し、図22(b)は補聴処理Bのパターンを示す。それぞれ補聴処理された語音を呈示した場合のうるささの評価結果を示している。図22中の「1」は、うるささ判定部65において、N1成分の潜時が基準潜時よりも短くユーザ5がうるさいと感じたと判定された場合で、「0」は、N1成分の潜時が基準潜時よりも長くユーザ5がうるさくないと感じたと判定された場合を示す。図22の(a)と(b)とを比べると、補聴処理Bのパターンで補聴処理された(b)の方が、「1」の数が少なく、ユーザはうるささを感じていないといえる。
次に、図23のフローチャートを参照しながら、語音聴取のうるささ判定システム200において行われる全体的な処理の手順を説明する。
図23は、本実施形態による語音明瞭度システム200の処理手順を示す。図23では、語音聴取のうるささ判定システム100の処理(図19)と同じ処理を行うステップについては同一の参照符号を付し、その説明は省略する。
本実施形態による語音聴取のうるささ判定システム200の処理が、実施形態1による語音聴取のうるささ判定システム100の処理と相違する点は、ステップS201、S202およびS203である。ステップS201では、指定された補聴処理で加工した単音節音声が呈示される。ステップS202では、語音・音圧・補聴処理ごとに加算演算が行われる。ステップS203では、語音ごと・音声ごと・補聴処理ごとに結果が蓄積される。それ以外のステップについては、図19に関連して既に説明しているため、説明を省略する。
ステップS201において、呈示語音決定部75は、語音DB72を参照して呈示する音声の種類と音圧を決定し、そのデータを取得する。さらに、呈示語音決定部75は、補聴処理を決定して、補聴処理の種類に関する情報と音声データを補聴処理部90に送付する。補聴処理部90は、呈示語音決定部75によって決定された補聴処理の種類に関する情報と音声データとを受け取り、指定された補聴処理方法に基づいて音声データを加工する。音声出力部11は、加工された音声データをユーザ5に呈示する。
ステップS202において、事象関連電位処理部56は呈示語音決定部75から受けた呈示語音の種類、音圧、補聴処理の情報を受けて、生体信号計測部50で計測した脳波の事象関連電位を、たとえば語音ごと・音圧ごと・補聴処理ごとに加算する。
ステップS203において、結果蓄積DBは、呈示語音決定部75から受けた呈示語音に関する情報(語音の種類、音圧、補聴処理)ごとに、うるささ判定部65で判定したN1成分の潜時に基づく、うるささの判定結果を蓄積する。結果蓄積の例は、図22に示したとおりである。
このような処理によって、たとえば、子音強調、指向性、ノイズリダクション等の補聴処理ごとに、語音聴取に対する快適性が評価できる。
なお、本実施形態では、複数の種類で補聴処理された音声をミックスして、ランダムな順序で呈示する場合を想定したが、たとえば補聴処理Aを行った後に補聴処理Bを行ったときのように、補聴処理の種類ごとに順番にうるささ判定を実施してもよい。補聴処理の種類ごとに実施すると、うるささ判定結果に応じて、次の補聴処理のパラメータを変更できるという特長がある。
本実施形態の語音聴取のうるささ判定システム200によれば、補聴処理ごとのうるささを評価できる。これによって、補聴器装用の目的、使用環境に合わせた補聴処理の選択が実現できるようになる。
(実施形態3)
実施形態1による語音聴取のうるささ判定システム100では、うるささ判定部65において、一般的なユーザにおける語音ごとのN1成分の基準潜時と、計測した脳波データのN1成分の潜時との比較により、うるささ判定を実施した。
N1成分は、誘発電位と呼ばれる事象関連電位の初期成分であり、潜時/振幅に関する個人差は比較的小さいと考えられる。しかしながら、N1成分に潜時/振幅の個人差が全くないわけではない。そのため、一般的なユーザの語音ごとのN1成分の潜時から求めた基準潜時による識別では、うるささをより高精度で判定するには限界があった。
そこで本実施形態では、語音聴取のうるささ判定の前に、ユーザごとのN1成分の基準潜時を測定するキャリブレーションを行い、個人ごとのN1成分の特徴に基づいてうるささを評価する。 これにより、本実施形態によれば、実施形態1よりもうるささをより高精度で判定することが可能となった。
図24は、本実施形態による語音聴取のうるささ判定システム300の機能ブロックの構成を示す。語音聴取のうるささ判定システム300は、音声出力部11と、生体信号計測部50と、語音聴取のうるささ判定装置3とを有している。図15と同じブロックについては同一の参照符号を付し、その説明は省略する。なお、語音聴取のうるささ判定装置3のハードウェア構成は、図14に示すとおりである。実施形態1で説明したプログラム35(図14)と異なる処理を規定するプログラムが実行されることにより、図24に示す本実施形態による語音聴取のうるささ判定装置3が実現される。
本実施形態による語音聴取のうるささ判定装置3が、実施形態1による語音聴取のうるささ判定装置1と大きく相違する点は、新たに校正/評価切替部95および基準潜時算出部96を設けた点である。また、ユーザごとの各語音に対するN1成分の基準潜時を求め、その基準潜時に基づいてうるささ判定を実施するために、実施形態1の呈示語音決定部70、事象関連電位処理部55、語音DB71(図15)に代えて呈示語音決定部77、事象関連電位処理部57、語音DB73を設けている。
以下、校正/評価切替部95、基準潜時算出部96、呈示語音制御部77、事象関連電位処理部57、語音DB73を説明する。
校正/評価切替部95は、ユーザごとの各語音に対するN1成分の基準潜時を特定するための校正モードと、特定した基準潜時と計測したN1成分の潜時に基づいてうるささ判定をするための評価モードとを切り替える。そして、現在のモードを示す情報を呈示語音決定部77に送付する。なおモードの切り替えは、語音DB73に各語音に対する基準潜時が書き込まれた時点で実施してもよいし、ユーザ脳波の各語音に対するN1成分の基準潜時を特定するために必要な所定回数の語音呈示が終了した時点で実施してもよい。
呈示語音決定部77は、語音DB73を参照し、語音の種類と呈示音声の音圧を決定し、音声出力部11を介してユーザ5に出力すると同時に、生体信号計測部50にトリガの情報を送付する。また、校正/評価切替部95から校正モード/評価モードの情報を受け取り、事象関連電位処理部57に音声情報と構成/評価モードの情報を送付する。呈示語音決定部77は、校正/評価切替部95から受け取ったモードに応じて動作を切り替える。校正モードの場合には、たとえば母音(子音部分がない単音節語)の音声を所定の音圧で呈示する。語音音声として母音を呈示することで、子音部分の影響を受けない、ユーザごとにベースとなるN1成分の潜時が特定できる。所定の音圧は、ユーザが音声を聞くことができる閾値以上の音圧である。たとえばユーザが「うるさい」と感じる音圧としてもよい。ユーザが聞くことができる音圧/ユーザがうるさいと感じる音圧は、たとえばユーザのオージオグラムを参考に決定してもよいし、あらかじめ主観評価によって測定してもよい。評価モードの場合には、呈示語音制御部70と同様に、語音を所定の音圧で呈示する。
事象関連電位処理部57は、事象関連電位処理部55と同様に、呈示語音決定部77から受けた呈示音声の内容に応じて、生体信号計測部50から受けた事象関連電位の加算演算を行う。また、事象関連電位処理部57は、呈示語音決定部77からモード情報を受け取り、動作を切り替える。校正モードの場合には、たとえば母音ごとに加算演算を実施し、所定回数の加算が完了すると、基準潜時算出部96に、母音ごとの加算波形を送付する。評価モードの場合には、事象関連電位処理部55と同様に、うるささ判定部65に語音ごと・音圧ごとの加算波形を送付する。
基準潜時算出部96は、事象関連電位処理部57から母音ごとの加算波形データを受け取り、潜時約200msにおけるN1成分の潜時を求める。N1成分の潜時は、たとえば潜時50msから350msにおいて電位が最小となる時刻とする。たとえば、呈示語音決定部77において、音圧をユーザが「うるさい」と感じる音圧に設定した場合には、求めた母音ごとのN1成分の潜時を、各母音の基準潜時とする。母音に対するN1潜時を測定することで、母音ごとの音特徴の違いに応じて、母音ごとにN1成分の基準潜時を求めることができる。また、子音部分を含む子音の基準潜時は、各母音の基準潜時に子音部分の特徴に応じた所定の正の値を加えて求める。所定の正の値は、子音ごとに決定する。たとえば、子音部分の強度が弱い子音の場合には、子音長を所定の正の値としてもよい。また、たとえば、子音部分の強度が強い子音の場合には、子音部分の強度が所定の値以上となるまでの時間を、所定の正の値としてもよい。そして、算出した結果を、語音DB73に書き込む。
なお、子音に比べて母音は、語音ごとの音声特徴の差が小さいため、全ての母音に対するN1成分の潜時を平均し、母音のN1成分の基準潜時としてもよい。また、N1成分が安定的に計測できた母音の潜時のみを平均し、母音のN1成分の基準潜時としてもよい。
語音DB73は、図16に一例を示した語音DB71と同様に、語音聴取のうるささ判定を行うための語音のデータベースである。語音DB73と語音DB71との相違点は、N1成分の基準潜時の書き換えが可能な点である。基準潜時算出部96によって、N1成分の基準潜時が書き換えられるまでは、語音ごとに基準潜時が設定されていないことを示す0を保持してもよい。
次に、図25のフローチャートを参照しながら、語音聴取のうるささ判定システム300において行われる全体的な処理の手順を説明する。
図25は、本実施形態による語音明瞭度システム300の処理手順を示す。図25では、語音聴取のうるささ判定システム100の処理(図19)と同じ処理を行うステップについては同一の参照符号を付し、その説明は省略する。
本実施形態による語音聴取のうるささ判定システム300の処理が、実施形態1による語音聴取のうるささ判定システム100の処理と相違する点は、ステップS301〜S306である。それ以外のステップについては、図19に関連して既に説明しているため、説明を諸略する。
ステップS301において、校正/評価切替部95は、現在のモードを校正モードに設定し、校正モードの情報を呈示語音決定部77に送付する。校正/評価切替部95は、語音DB73を参照し、N1成分の基準潜時の値が0の場合に構成モードを選択してもよい。また、所定回数の音声呈示が終了するまでは校正モードに設定してもよい。なお、校正/評価のモード切り替えは、補聴器フィッティングの専門家やユーザ5の選択によって実施してもよい。
ステップS302において、呈示語音決定部77は、語音DB73を参照して、たとえば母音を選択し、所定の音圧で音声出力部11を介してユーザ5に出力する。所定の音圧とは、ユーザが音声を聞くことができる閾値以上の音圧である。たとえばユーザが「うるさい」と感じる音圧としてもよい。ユーザが聞くことができる音圧/ユーザがうるさいと感じる音圧は、たとえばユーザのオージオグラムを参考に決定してもよい。
ステップS303において、事象関連電位処理部57は、生体信号計測部50で計測した事象関連電位を、母音ごとに加算する。
ステップS304において、基準潜時算出部96は、事象関連電位処理部57から母音ごとの加算済の波形データを受け取り、潜時約200msにおけるN1成分の潜時を求める。N1成分の潜時は、たとえば潜時50msから350msにおいて電位が最小となる時刻とする。たとえば、呈示語音決定部77において、音圧をユーザが「うるさい」と感じる音圧に設定した場合には、求めた母音ごとのN1成分の潜時を母音の基準潜時とする。そして、子音部分を含む子音の基準潜時は、母音の基準潜時に子音部分の特徴に応じた所定の正の値を加えて求める。所定の正の値は、子音ごとに決定する。たとえば、子音部分の強度が弱い子音の場合には、子音長を所定の正の値としてもよい。また、たとえば、子音部分の強度が強い子音の場合には、子音部分の強度が所定の値以上となるまでの時間を、所定の正の値としてもよい。
ステップS305において、基準潜時算出部96は、ステップS304で算出した語音ごとのN1成分の基準潜時を、語音DB73に書き込む。
ステップS306において、校正/評価切替部95は、語音DB73において、N1成分の基準潜時が書き込まれていることを検出して、校正モードから評価モードへの切替えを行い、評価モードの情報を呈示語音決定部77に送付する。モードの切り替えは、所定回数の音声呈示が終了した段階で実施してもよいし、補聴器フィッティングの専門家やユーザ5の操作入力によって実施してもよい。
このような処理によって、ユーザごとの各語音に対するN1成分の基準潜時と、計測した脳波データのN1成分の潜時との比較ができるようになるため、語音聴取のうるささがより高精度で評価できるようになる。
なお、本実施形態では、校正モードの場合に呈示語音決定部77において母音を選択し、母音に対するN1成分の潜時から、母音の基準潜時を決定し、子音の基準潜時を算出した。このようにすることで、全ての語音に対する基準潜時を算出する必要がなく、短時間で検査が実施できる。しかし、これは一例である。たとえば、うるささ判定対象の全ての語音を校正モードで呈示し、全ての語音に対して基準潜時を求めてもよい。また、たとえば、呈示語音決定部77に250Hz、500Hz、1kHz、2kHz、4kHz等のオージオグラムで一般的に測定される純音を保持し、校正モードにおいて純音を呈示し、純音に対するN1成分の潜時から語音ごとの基準潜時を算出してもよい。
本実施形態の語音聴取のうるささ判定システム300によれば、ユーザごとの脳波特徴に合わせて高い精度でうるささを評価できる。これによって、ユーザがうるささを感じない、聞いていて疲れない補聴処理が実現できるようになる。
なお、上述の実施形態1〜3では、語音DBは語音聴取のうるささ判定装置内に設けられていると説明したが、これは必須ではない。語音DBは、たとえば語音聴取のうるささ判定装置とネットワークを介して接続されたデータベースサーバ(図示せず)や外部記憶装置内に設けられていてもよい。その場合には、各実施形態の語音聴取のうるささ判定システムは、当該データベースサーバや外部記憶装置を含むことになる。
(実施形態4)
実施形態1による語音聴取のうるささ判定システム100では、語音DB71に収録済みの音声と、その語音音声の特徴に合わせた語音ごとのN1成分の基準潜時を保持し、計測した脳波データのN1成分の潜時との比較によりうるささ判定を実施した。収録済みの音声には、たとえば標準的なテスト音声、補聴器を装用して主に会話する相手(以下では「話者A」と呼ぶ。)の音声がある。話者Aが発声した音声に対するうるささ判定は、日常生活において話者Aがユーザにしゃべりかける音声の評価であり、重要である。
しかしながら、うるささ判定の前に、話者Aの音声を収録することは、話者Aにとっても補聴器フィッティングの専門化にとっても手間であった。
そこで本実施形態では、話者Aが発声した語音音声をリアルタイムに分析して、話者Aの語音音声の特徴に合わせてユーザ5のN1成分の基準潜時を推定し、推定した基準潜時と計測した脳波のN1成分の基準潜時との比較によって、うるささを評価する。
図26は、本実施形態による語音聴取のうるささ判定システム400の機能ブロックの構成を示す。語音聴取のうるささ判定システム400は、文字出力部12と、音声入力部41と、生体信号計測部50と、語音聴取のうるささ判定装置4とを有している。図15と同じブロックについては同一の参照符号を付し、その説明は省略する。
本実施形態による語音聴取のうるささ判定システム400が、実施形態1による語音聴取のうるささ判定システム100と相違する点は、音声入力部41を新たに設けた点、および、音声出力部11に代えて文字出力部12を設けた点である。語音聴取のうるささ判定装置4は、これらの構成要素の追加に伴い、語音聴取のうるささ判定装置1とは異なる機能を有している。
文字出力部12は、話者Aに対して語音の文字情報を出力する表示装置、たとえば液晶ディスプレイである。文字情報として、話者Aが発話する単音節の語音(たとえば「あ」、「だ」、「し」)を呈示する。また、単音節の語音に加えて、話者Aがどれくらいの大きさで発話するかの音圧に関する情報を示してもよい。音圧に関する情報とは、たとえば「普段話しかける程度の大きさで」、「大きな声で」、「小さな声で」である。
音声入力部41は、話者Aが発声した音声を集音するマイクである。
語音聴取のうるささ判定装置4については後述する。
図27は、語音聴取のうるささ判定装置4のハードウェア構成を示す。図14に示した実施形態1と同じ構成については、同様の記号を付し、その説明は省略する。図14との相違点は、新たにサウンドコントローラ46を備えた点と、オーディオコントローラ32の代わりにグラフィックコントローラ45を備えた点、メモリ31から語音DB71を除いた点である。
サウンドコントローラ46は、話者Aが発声し、音声入力部41から入力された音声波形をA/D変換して、得られた音声デジタルデータをCPU30に送付する。
グラフィックコントローラ45は、CPU30の命令に従って、呈示すべき語音の文字情報を、文字出力部12に出力する。
音声波形の分析など、本実施形態による語音聴取のうるささ判定装置4の処理は、実施形態1で説明したプログラム35(図14)と異なる処理を規定するプログラムが実行されることにより実現される。
再び図26を参照する。本実施形態による語音聴取のうるささ判定装置4が、実施形態1による語音聴取のうるささ判定装置1と大きく相違する点は、音声分析部42と、基準潜時推定部43とを新たに設けた点である。また、本実施形態においては、呈示語音決定部78およびうるささ判定部66は、話者Aが発声する語音の種類を決定し、話者Aが発声した語音音声に対するN1成分の基準潜時を求め、その基準潜時に基づいてうるささ判定を実施する。
以下、呈示語音決定部78、音声分析部42、基準潜時推定部43、うるささ判定部66を説明する。
呈示語音決定部78は、予め用意され、自らが保持している語音リストを参照し、話者Aが発声する語音をランダムに決定し、文字出力部12を介して話者Aに出力する。そして、決定した語音の情報を事象関連電位処理部55および基準潜時推定部43に送る。語音リストは、たとえば67S語表の20語音でもよいし、57S語表の50音でもよい。
音声分析部42は、音声入力部41に入力された音情報から、話者Aが音声を発声したタイミングを検出し、その音声の子音長・子音強度・母音強度などに関する特徴を分析する。そして、話者Aの発声を検出したタイミングでトリガを生体信号計測部50に送付する。さらに、基準潜時推定部42に音声特徴に関する情報を送付する。
基準潜時推定部43は、音声分析部42から受けた音声特徴に関する情報と、呈示語音決定部78から受けた語音情報とに基づき、その語音に対するN1成分の基準潜時を推定する。
うるささ判定部66は、実施形態1のうるささ判定部65と同様に、事象関連電位処理部55から受け取った脳波データの潜時約200msにおける、N1成分の潜時に基づいて、ユーザがうるさいと感じたか否かを判定する。たとえば、うるささ判定部66は、潜時50msから350msの陰性電位のピークの潜時を、基準潜時推定部43で推定された基準潜時(閾値)と比較する。そして、N1成分のピーク潜時が閾値よりも短い場合には「うるさい」と判定し、ピーク潜時が所定の閾値より小さい場合を「うるさくない」と判定する。
次に、図28のフローチャートを参照しながら、語音聴取のうるささ判定システム400において行われる全体的な処理の手順を説明する。
図28は、本実施形態による語音明瞭度システム400の処理手順を示す。図28では、語音聴取のうるささ判定システム100の処理(図19)と同じ処理を行うステップについては同一の参照符号を付し、その説明は省略する。
本実施形態による語音聴取のうるささ判定システム400の処理が、実施形態1による語音聴取のうるささ判定システム100の処理と相違する点は、ステップS401〜S407である。それ以外のステップについては、図19に関連して既に説明しているため、説明を諸略する。
ステップS401において、呈示語音決定部78は、呈示語音決定部78が保持している語音リストを参照し、話者Aに発生させる語音の種類をランダムに決定し、決定した語音を、文字出力部12を介して話者Aに出力する。
ステップS402において、音声分析部42は、音声入力部41に入力された音情報から、話者Aが音声を発声したタイミングを検出し、検出したタイミングでトリガを生体信号計測部50に送付する。
ステップS403において、音声分析部42は、音声入力部41に入力された音情報から検出した音声の子音長・子音強度・母音強度などに関する特徴を分析する。そして、基準潜時推定部43に分析結果を送付する。
ステップS404において、基準潜時推定部43は、音声分析部42から受けた音声特徴に関する情報と、呈示語音決定部78から受けた語音情報とに基づき、その語音に対するN1成分の基準潜時を推定する。基準潜時は、所定のベース潜時に、音声の子音長あるいは子音強度に基づく所定の正の値を加えて推定する。所定のベース潜時とは、たとえば90dB SPLで母音を聞いたときの一般ユーザの平均的なN1成分の潜時としてもよい。具体的には、100msとしてもよい。また、所定の正の値は、子音ごとに決定する。たとえば、子音部分の強度が弱い子音の場合には、音声分析部42において分析した子音長を所定の正の値としてもよい。また、たとえば、子音部分の強度が強い子音の場合には、音声分析部42において分析した子音部分の強度あるいは子音部分における特定周波数の強度が所定の値以上となるまでの時間を、所定の正の値としてもよい。子音強度の強弱は、呈示語音決定部78から受けた語音情報に基づいて決定してもよい。そして、推定した基準潜時をうるささ判定部66に送付する。
ステップS405において、事象関連電位処理部55は、呈示語音決定部70から受けた呈示音声の内容と、生体信号計測部50から受けた事象関連電位を、うるささ判定部66に送付する。
ステップS406において、うるささ判定部66は、事象関連電位処理部55から受け取った脳波データの潜時約200msにおける、N1成分の潜時に基づいて、ユーザがうるさいと感じたか否か有無を判定する。たとえば、うるささ判定部65は、潜時50msから350msの陰性電位のピークの潜時と、基準潜時推定部43からうけた基準潜時とを比較する。そして、N1成分のピーク潜時が基準潜時よりも短い場合には「うるさい」と判定し、ピーク潜時が基準潜時より小さい場合を「うるさくない」と判定する。
ステップS407において、結果蓄積DB80は、呈示語音決定部77から語音の種類を受け取り、うるささ判定部66からうるささ判定の結果の情報を受け取る。そして、たとえば語音ごとに、うるささの判定結果の情報を蓄積する。
このような処理によって、話者Aが発声した音声の特徴を分析し、音声特徴ごとにN1成分の基準潜時を推定し、推定したN1成分の基準潜時と、計測した脳波データのN1成分の潜時との比較が可能になる。なお、話者Aに単音節の語音を自由に発声させ、音声分析部42において音声認識をさせる場合には、呈示語音決定部78および文字出力部12はなくてもよい。
本実施形態の語音聴取のうるささ判定システム400によれば、話者Aが発声した音声を用いて、リアルタイムに語音聴取のうるささ判定が実現できる。これによって、話者Aおよび補聴器フィッティングの専門家の手間が少なく、かつ、ユーザがうるささを感じない、聞いていて疲れない補聴処理が実現できるようになる。
また、本実施形態では、音声分析部42は生体信号計測部50にトリガを送信するのではなく、事象関連電位処理部55にトリガを送信してもよい。このとき、生体信号計測部50は継続的に脳波を計測し、事象関連電位処理部55が必要な事象関連電位の切り出しおよびベースライン補正を行ってもよい。
上述の実施形態においては、たとえばうるささ判定部は「判定する」という動作を行い、呈示語音決定部は「決定する」という動作を行うとして説明した。しかしながらこれらの動作は、人間の理解の便宜のための表現であり、装置が積極的に「判定」し、「決定」したことを外部に出力することを意図するものではない。装置の一構成要素としての「うるささ判定部」や「呈示語音決定部」は、所定の条件が満たされたとき、所定の処理を行えばよい。
たとえば、うるささ判定部は、脳波データにおけるN1成分の潜時が基準潜時よりも短い場合には、ユーザがうるさいと感じたという分類でその結果を蓄積すればよく、また脳波データにおけるN1成分の潜時が基準潜時よりも長い場合に、ユーザがうるさくないと感じたという分類でその結果を蓄積すればよい。また、呈示語音決定部は、語音DBを参照して、語音をランダムな順序で選択し、音圧をランダムな順序で選択して、音声出力部に出力させればよい。これらの処理を、「判定」や「決定」という表現を利用して説明しているに過ぎないことに留意されたい。
上述の説明は、本願発明による処理を方法として実施する場合も同様である。
本発明の語音聴取のうるささ判定装置および語音聴取のうるささ判定装置が組み込まれた語音聴取のうるささ判定システムによれば、語音の聞き分けができたか否かの明瞭度に加えて、語音聴取時の脳波に基づき、語音聴取のうるささ判定が定量的にできる。それによって、ユーザがうるささを感じることがなく、聞いていて疲れない補聴処理が選択できるため、全ての補聴器ユーザのフィッティングにおいて利用可能である。
1、2、3、4 語音聴取のうるささ判定装置
5 ユーザ
11 音声出力部
12 文字出力部
41 音声入力部
42 音声分析部
43 基準潜時推定部
50 生体信号計測部
55、56、57 事象関連電位処理部
65、66 うるささ判定部
70、75、77、78 呈示語音決定部
71、72、73 語音DB
80、85 結果蓄積DB
90 補聴処理部
95 評価切替部
96 基準潜時算出部
100、200、300、400 語音聴取のうるささ判定システム

Claims (20)

  1. ユーザの脳波信号を計測する生体信号計測部と、
    複数の単音節の語音を保持する語音データベースであって、各語音について、語音と前記語音に対応する脳波信号の陰性成分の基準潜時とが対応付けられている語音データベースと、
    前記語音データベースを参照して、呈示する単音節の語音を決定する呈示語音決定部と、
    前記ユーザに、決定された語音を呈示する出力部と、
    前記語音が呈示された時刻を起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、前記語音データベースに保持されている、決定された前記語音に対応する基準潜時とを比較して、出力された前記語音のうるささを判定するうるささ判定部と
    を備えたうるささ判定システム。
  2. 語音データベースは、前記語音に含まれる子音の長さ又は子音の強度に応じて、前記語音と前記語音に対応する脳波信号の陰性成分の基準潜時を対応付けている、請求項1に記載のうるささ判定システム。
  3. 前記うるささ判定部は、前記陰性成分のピーク潜時が前記基準潜時よりも小さい場合に、呈示された前記語音が前記ユーザにとってうるさいと判定し、前記陰性成分のピーク潜時が前記基準潜時よりも大きい場合に、呈示された前記語音が前記ユーザにとってうるさくないと判定する、請求項1に記載のうるささ判定システム。
  4. 前記脳波信号の事象関連電位を、所定の基準にしたがって加算する事象関連電位処理部をさらに備え、
    前記呈示語音決定部は、複数の語音を決定し、
    前記出力部は、決定された前記複数の語音を順次呈示し、
    前記事象関連電位処理部は、前記複数の語音について、前記語音の種類又は音圧が同じ語音が呈示された時刻を起点とした前記脳波信号の事象関連電位を加算して、前記加算した結果を前記うるささ判定部に出力する、請求項1に記載のうるささ判定システム。
  5. 前記うるささ判定部は、前記ピーク潜時として、前記決定された前記語音が呈示された時刻を起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分の最小の電位を取る時刻、または、前記脳波信号と予め用意されたN1成分の波形のテンプレートとの一致度が最も高くなる場合の、前記テンプレートに対応付けられたピーク潜時を採用する、請求項1に記載のうるささ判定システム。
  6. 前記事象関連電位処理部は、子音ごとまたは基準潜時の差が所定の値よりも小さい語音グループごとに事象関連電位を加算する、請求項に記載のうるささ判定システム。
  7. 前記語音のうるささに関する判定結果を示す情報を蓄積する結果蓄積データベースをさらに備え、
    前記結果蓄積データベースには、語音ごと、子音ごと、または、基準潜時の差が所定の値よりも小さい語音グループごとに、前記語音のうるささに関する判定結果を示す情報が蓄積されている、請求項1に記載のうるささ判定システム。
  8. 前記呈示された前記語音に関して補聴処理の種類を選択し、選択された補聴処理に基づいて前記語音データベースに保持されている語音データを加工する補聴処理部をさらに備えた、請求項1に記載のうるささ判定システム。
  9. ユーザごとの陰性成分の潜時を求める校正モードと、うるささを評価する評価モードとを切り替える切替部をさらに備え、
    前記校正モードにおいて、前記切替部は、前記呈示語音決定部において母音を選択し、母音に対する前記陰性成分の潜時に基づいて語音ごとの基準潜時を算出し、
    前記評価モードに切り替えられた後において、前記切替部は、前記陰性成分のピーク潜時と算出した前記基準潜時とを比較する、請求項1に記載のうるささ判定システム。
  10. 前記校正モードにおいて、前記切替部は、前記呈示語音決定部において母音が選択された場合に、母音に対するN1成分の潜時を母音の基準潜時に設定し、母音の基準潜時に子音部分の長さまたは強度に応じて決定された正の値を加えて、子音ごとの基準潜時を算出する、請求項9に記載のうるささ判定システム。
  11. 複数の単音節の語音を保持し、かつ、各語音について、語音と前記語音に対応する脳波信号の陰性成分の基準潜時とが対応付けられている語音データベースを参照して、呈示する単音節の語音を決定する呈示語音決定部と、
    生体信号計測部によって計測されたユーザの脳波信号のうち、 前記語音が出力部によって前記ユーザに呈示された時刻を起点として、50ms以上350ms以下の範囲に含まれる脳波信号の陰性成分のピーク潜時と、前記語音データベースに保持されている、決定された前記語音に対応する基準潜時とを比較した結果を出力するうるささ判定部と、
    前記うるささ判定部が出力した、前記脳波信号の陰性成分のピーク潜時と前記語音に対応する基準潜時との差に基づいて、前記語音を調整する補聴処理部と
    を備えたうるささ判定装置。
  12. ユーザの脳波信号を計測するステップと、
    複数の単音節の語音と、前記語音に対応する脳波信号の陰性成分の基準潜時とが対応付けて保持されている語音データベースを参照して、呈示する単音節の語音を決定するステップと、
    前記ユーザに、決定された語音を呈示するステップと、
    前記語音が呈示された時刻を起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、前記語音データベースに保持されている、決定された前記語音に対応する基準潜時とを比較して、出力された前記語音のうるささを判定するステップと
    を包含する、うるささ判定方法。
  13. 語音聴取のうるささ判定システムに設けられたコンピュータによって実行されるコンピュータプログラムであって、
    前記コンピュータプログラムは、前記うるささ判定システムに実装されるコンピュータに対し、
    ユーザの脳波信号を受け取るステップと、
    複数の単音節の語音と、前記語音に対応する脳波信号の陰性成分の基準潜時とが対応付けて保持されている語音データベースを参照して、呈示する単音節の語音を決定するステップと、
    前記ユーザに、決定された語音を呈示するステップと、
    前記語音が呈示された時刻を起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、前記語音データベースに保持されている、決定された前記語音に対応する基準潜時とを比較して、出力された前記語音のうるささを判定するステップと
    を実行させる、コンピュータプログラム。
  14. ユーザの脳波信号を計測する生体信号計測部と、
    特定話者が発声した音声の音声信号を入力するための音声入力部と、
    前記音声信号が入力されたタイミングを検出してトリガを出力し、さらに前記音声の子音部分の長さおよび強度に関する特徴を分析する音声分析部と、
    前記音声分析部で分析された前記特徴に基づいて、陰性成分の基準潜時を推定する基準潜時推定部と、
    前記トリガを起点として50ms以上350ms以下の範囲に含まれる前記脳波信号の陰性成分のピーク潜時と、前記基準潜時推定部によって推定された基準潜時とを比較してうるささを判定するうるささ判定部と
    を備えたうるささ判定システム。
  15. 前記特定話者に発生させるための語音を示す文字情報を出力する文字出力部をさらに備え、
    前記文字出力部によって出力された文字情報に基づいて前記特定話者が発生した音声信号が前記音声入力部に入力される、請求項14に記載のうるささ判定システム。
  16. 前記文字出力部は、単音節の語音を前記特定話者が発声する際の大きさを示す音圧に関する情報をさらに出力し、
    前記文字出力部によって出力された文字情報および音圧に関する情報に基づいて前記特定話者が発生した音声信号が前記音声入力部に入力される、請求項15に記載のうるささ判定システム。
  17. 予め用意された語音リストを参照して、前記特定話者に発声させる語音を決定する呈示語音決定部をさらに備え、
    前記文字出力部は、前記呈示語音決定部によって決定された前記語音を示す文字情報を出力する、請求項15に記載のうるささ判定システム。
  18. 前記基準潜時推定部は、前記音声分析部で分析された前記特徴、および、呈示語音決定部が決定した前記特定話者に発声させる語音に基づいて、前記陰性成分の基準潜時を推定する、請求項17に記載のうるささ判定システム。
  19. 前記基準潜時推定部は、予め用意されたベース潜時に、前記語音の子音長あるいは子音強度に基づいて決定される所定の正の値を加えることにより、前記陰性成分の基準潜時を推定する、請求項17に記載のうるささ判定システム。
  20. ユーザの脳波信号を計測するステップと、
    特定話者が発声した音声の音声信号を入力するステップと、
    前記音声信号が入力されたタイミングを検出してトリガを出力し、さらに前記音声の子音部分の長さおよび強度に関する特徴を分析するステップと、
    分析する前記ステップで分析された前記特徴に基づいて、陰性成分の基準潜時を推定するステップと、
    前記トリガを起点として50ms以上350ms以下の範囲 に含まれる前記脳波信号の陰性成分のピーク潜時と、推定する前記ステップによって推定された基準潜時とを比較してうるささを判定するステップと
    を包含する、うるささ判定方法。
JP2012512101A 2010-11-24 2011-11-18 うるささ判定システム、装置、方法およびプログラム Active JP5144835B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012512101A JP5144835B2 (ja) 2010-11-24 2011-11-18 うるささ判定システム、装置、方法およびプログラム

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2010261372 2010-11-24
JP2010261372 2010-11-24
JP2010261373 2010-11-24
JP2010261373 2010-11-24
PCT/JP2011/006435 WO2012070212A1 (ja) 2010-11-24 2011-11-18 うるささ判定システム、装置、方法およびプログラム
JP2012512101A JP5144835B2 (ja) 2010-11-24 2011-11-18 うるささ判定システム、装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP5144835B2 true JP5144835B2 (ja) 2013-02-13
JPWO2012070212A1 JPWO2012070212A1 (ja) 2014-05-19

Family

ID=46145583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012512101A Active JP5144835B2 (ja) 2010-11-24 2011-11-18 うるささ判定システム、装置、方法およびプログラム

Country Status (4)

Country Link
US (1) US9149214B2 (ja)
JP (1) JP5144835B2 (ja)
CN (1) CN103053179A (ja)
WO (1) WO2012070212A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424952A (zh) * 2013-08-20 2015-03-18 索尼公司 语音处理设备、语音处理方法以及程序

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9443521B1 (en) * 2013-02-14 2016-09-13 Sociometric Solutions, Inc. Methods for automatically analyzing conversational turn-taking patterns
US10049336B2 (en) 2013-02-14 2018-08-14 Sociometric Solutions, Inc. Social sensing and behavioral analysis system
CN105193430A (zh) * 2015-08-31 2015-12-30 京东方科技集团股份有限公司 一种保护装置、可穿戴设备及保护方法和显示系统
JP6782554B2 (ja) * 2016-04-15 2020-11-11 日本電信電話株式会社 コンテンツ評価装置、コンテンツ評価方法、プログラム
BR112019016292A2 (pt) * 2017-03-17 2020-04-07 Ericsson Telefon Ab L M método e aparelho para permitir alteração de sinal de áudio adaptativa e meio de armazenamento legível por máquina
CN111182835A (zh) * 2017-07-28 2020-05-19 国立大学法人大阪大学 舒适不舒适的判别
WO2019060298A1 (en) 2017-09-19 2019-03-28 Neuroenhancement Lab, LLC METHOD AND APPARATUS FOR NEURO-ACTIVATION
US10580427B2 (en) 2017-10-30 2020-03-03 Starkey Laboratories, Inc. Ear-worn electronic device incorporating annoyance model driven selective active noise control
JP6337362B1 (ja) * 2017-11-02 2018-06-06 パナソニックIpマネジメント株式会社 認知機能評価装置、及び、認知機能評価システム
US11717686B2 (en) 2017-12-04 2023-08-08 Neuroenhancement Lab, LLC Method and apparatus for neuroenhancement to facilitate learning and performance
US11478603B2 (en) 2017-12-31 2022-10-25 Neuroenhancement Lab, LLC Method and apparatus for neuroenhancement to enhance emotional response
US11364361B2 (en) 2018-04-20 2022-06-21 Neuroenhancement Lab, LLC System and method for inducing sleep by transplanting mental states
CA3112564A1 (en) 2018-09-14 2020-03-19 Neuroenhancement Lab, LLC System and method of improving sleep
US10922044B2 (en) * 2018-11-29 2021-02-16 Bose Corporation Wearable audio device capability demonstration
US10817251B2 (en) 2018-11-29 2020-10-27 Bose Corporation Dynamic capability demonstration in wearable audio device
US10923098B2 (en) 2019-02-13 2021-02-16 Bose Corporation Binaural recording-based demonstration of wearable audio device functions
CN110068466B (zh) * 2019-04-30 2021-03-12 山东理工大学 基于脑电波的车辆声品质评价方法
US11786694B2 (en) 2019-05-24 2023-10-17 NeuroLight, Inc. Device, method, and app for facilitating sleep
US11462100B2 (en) * 2019-07-11 2022-10-04 Hyundai Motor Company Traffic surveillance system using error monitoring
EP3961624B1 (de) * 2020-08-28 2024-09-25 Sivantos Pte. Ltd. Verfahren zum betrieb einer hörvorrichtung in abhängigkeit eines sprachsignals

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60219000A (ja) * 1984-04-14 1985-11-01 Rion Co Ltd 補聴器
JPH08275297A (ja) * 1995-03-31 1996-10-18 Rion Co Ltd リモートコントローラ
WO2010073614A1 (ja) * 2008-12-22 2010-07-01 パナソニック株式会社 語音明瞭度評価システム、その方法およびそのコンピュータプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06114038A (ja) 1992-10-05 1994-04-26 Mitsui Petrochem Ind Ltd 聴覚検査・訓練装置
JPH0938069A (ja) * 1995-08-02 1997-02-10 Nippon Telegr & Teleph Corp <Ntt> 語音聴力検査方法およびこの方法を実施する装置
US6602202B2 (en) * 2000-05-19 2003-08-05 Baycrest Centre For Geriatric Care System and methods for objective evaluation of hearing using auditory steady-state responses
US8311228B2 (en) * 2006-06-01 2012-11-13 Personics Holdings Inc. Ear input sound pressure level monitoring system
US8165687B2 (en) * 2008-02-26 2012-04-24 Universidad Autonoma Metropolitana, Unidad Iztapalapa Systems and methods for detecting and using an electrical cochlear response (“ECR”) in analyzing operation of a cochlear stimulation system
EP2164066B1 (en) 2008-09-15 2016-03-09 Oticon A/S Noise spectrum tracking in noisy acoustical signals
WO2011155196A1 (ja) * 2010-06-11 2011-12-15 パナソニック株式会社 語音聴取の評価システム、その方法およびそのプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60219000A (ja) * 1984-04-14 1985-11-01 Rion Co Ltd 補聴器
JPH08275297A (ja) * 1995-03-31 1996-10-18 Rion Co Ltd リモートコントローラ
WO2010073614A1 (ja) * 2008-12-22 2010-07-01 パナソニック株式会社 語音明瞭度評価システム、その方法およびそのコンピュータプログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG199900134004; 栗城 真也: '多チャンネルSQUID磁束計による聴覚誘発脳磁界の観測' 日本音響学会誌 第48巻 第5号 第48巻, 19920501, p.320-327, 社団法人日本音響学会 *
CSNJ201010087505; 為末 隆弘 外4名著: '記憶精神作業時の騒音に対する心理・生理的定量評価に関する基礎的考察' 日本音響学会 2009年 春季研究発表会講演論文集 講演要旨・講演論文CD-ROM , 20090310, p.1031-1032 *
JPN6012027656; 為末 隆弘 外4名著: '記憶精神作業時の騒音に対する心理・生理的定量評価に関する基礎的考察' 日本音響学会 2009年 春季研究発表会講演論文集 講演要旨・講演論文CD-ROM , 20090310, p.1031-1032 *
JPN6012027658; 栗城 真也: '多チャンネルSQUID磁束計による聴覚誘発脳磁界の観測' 日本音響学会誌 第48巻 第5号 第48巻, 19920501, p.320-327, 社団法人日本音響学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424952A (zh) * 2013-08-20 2015-03-18 索尼公司 语音处理设备、语音处理方法以及程序
CN104424952B (zh) * 2013-08-20 2020-04-10 索尼公司 语音处理设备、语音处理方法以及程序

Also Published As

Publication number Publication date
JPWO2012070212A1 (ja) 2014-05-19
CN103053179A (zh) 2013-04-17
US9149214B2 (en) 2015-10-06
WO2012070212A1 (ja) 2012-05-31
US20130039498A1 (en) 2013-02-14

Similar Documents

Publication Publication Date Title
JP5144835B2 (ja) うるささ判定システム、装置、方法およびプログラム
JP5144836B2 (ja) 語音聴取の評価システム、その方法およびそのプログラム
JP4690507B2 (ja) 語音明瞭度評価システム、その方法およびそのプログラム
CN102265335B (zh) 助听器的调整装置和方法
JP5042398B1 (ja) 脳波記録装置、補聴器、脳波記録方法およびそのプログラム
JP5002739B2 (ja) 聴力判定システム、その方法およびそのプログラム
JP5215508B1 (ja) 不快閾値推定システム、方法およびそのプログラム、補聴器調整システムおよび不快閾値推定処理回路
JP4638558B2 (ja) 語音明瞭度評価システム、その方法およびそのコンピュータプログラム
WO2011135789A1 (ja) 脳波計測装置、電気的ノイズの推定方法、および、電気的ノイズの推定方法を実行するコンピュータプログラム
JP5091366B2 (ja) 音圧評価システム、その方法およびそのプログラム
US8849391B2 (en) Speech sound intelligibility assessment system, and method and program therefor

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5144835

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150