以下、本発明につき図面を参照しつつ詳細に説明する。なお、以下の説明により本発明が限定されるものではない。また、以下の説明における構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。以下においては、携帯電子機器の一例として携帯電話機を取り上げるが、本発明の適用対象は携帯電話機に限定されるものではなく、例えば、PHS(Personal Handy-phone System)、PDA、ポータブルナビゲーション装置、ノートパソコン、ゲーム機等に対しても本発明は適用できる。
図1は、実施形態に係る携帯電子機器の一実施形態の概略構成を示す正面図であり、図2は、図1に示す携帯電子機器の側面図である。図1、図2に示す携帯電子機器1は、無線通信機能と、出力手段と、音声取得手段とを有する携帯電話機である。携帯電子機器1は、筐体1Cが複数の筐体で構成される。具体的には、筐体1Cは、第1筐体1CAと第2筐体1CBとで開閉可能に構成される。すなわち、携帯電子機器1は、折り畳み式の筐体を有する。なお、携帯電子機器1の筐体は、このような構造に限定されるものではない。例えば、携帯電子機器1の筐体は、両方の筐体を重ね合わせた状態から一方の筐体と他方の筐体とを互いにスライドできるようにしたスライド式の筐体であってもよいし、重ね合わせ方向に沿う軸線を中心に、一方の筐体を回転させるようにした回転式や、2軸ヒンジを介して両方の筐体を連結したものでもよい。
第1筐体1CAと第2筐体1CBとは、連結部であるヒンジ機構8で連結されている。ヒンジ機構8で第1筐体1CAと第2筐体1CBとを連結することにより、第1筐体1CA及び第2筐体1CBは、ヒンジ機構8を中心としてともに回動して、互いに遠ざかる方向及び互いに接近する方向(図2の矢印Rで示す方向)に回動できるように構成される。第1筐体1CAと第2筐体1CBとが互いに遠ざかる方向に回動すると携帯電子機器1が開き、第1筐体1CAと第2筐体1CBとが互いに接近する方向に回動すると携帯電子機器1が閉じて、折り畳まれた状態となる(図2の点線で示す状態)。
第1筐体1CAには、表示部として、図1に示すディスプレイ2が設けられる。ディスプレイ2は、携帯電子機器1が受信を待機している状態のときに待ち受け画像を表示したり、携帯電子機器1の操作を補助するために用いられるメニュー画像を表示したりする。また、第1筐体1CAには、携帯電子機器1の通話時に音声を出力する出力手段であるレシーバ16が設けられる。
第2筐体1CBには、通話相手の電話番号や、メール作成時等に文字を入力するための操作キー13Aが複数設けられ、また、ディスプレイ2に表示されるメニューの選択及び決定や画面のスクロール等を容易に実行するための方向及び決定キー13Bが設けられる。操作キー13A及び方向及び決定キー13Bは、携帯電子機器1の操作部13を構成する。また、第2筐体1CBには、携帯電子機器1の通話時に音声を受け取る音声取得手段であるマイク15が設けられる。操作部13は、図2に示す、第2筐体1CBの操作面1PCに設けられる。操作面1PCとは反対側の面が、携帯電子機器1の背面1PBである。
第2筐体1CBの内部には、アンテナが設けられている。アンテナは、無線通信に用いる送受信アンテナであり、携帯電子機器1と基地局との間で通話や電子メール等に係る電波(電磁波)の送受信に用いられる。また、第2筐体1CBには、マイク15が設けられる。マイク15は、図2に示す、携帯電子機器1の操作面1PC側に配置される。
図3は、図1、図2に示す携帯電子機器の機能の概略構成を示すブロック図である。図3に示すように、携帯電子機器1は、処理部22と、記憶部24と、送受信部26と、操作部13と、音声処理部30と、表示部32と、出力音補正部34と、を有する。処理部22は、携帯電子機器1の全体的な動作を統括的に制御する機能を有する。すなわち、処理部22は、携帯電子機器1の各種の処理が、操作部13の操作や携帯電子機器1の記憶部24に記憶されるソフトウェアに応じて適切な手順で実行されるように、送受信部26や、音声処理部30や、表示部32等の動作を制御する。
携帯電子機器1の各種の処理としては、例えば、回線交換網を介して行われる音声通話、電子メールの作成及び送受信、インターネットのWeb(World Wide Web)サイトの閲覧等がある。また、送受信部26、音声処理部30、表示部32等の動作としては、例えば、送受信部26による信号の送受信、音声処理部30による音声の入出力、表示部32による画像の表示等がある。
処理部22は、記憶部24に記憶されているプログラム(例えば、オペレーティングシステムプログラム、アプリケーションプログラム等)に基づいて処理を実行する。処理部22は、例えば、マイクロプロセッサユニット(MPU:Micro Processing Unit)で構成され、前記ソフトウェアで指示された手順にしたがって上述した携帯電子機器1の各種の処理を実行する。すなわち、処理部22は、記憶部24に記憶されるオペレーティングシステムプログラムやアプリケーションプログラム等から命令コードを順次読み込んで処理を実行する。
処理部22は、複数のアプリケーションプログラムを実行する機能を有する。処理部22が実行するアプリケーションプログラムとしては、例えば、各種の画像ファイル(画像情報)を記憶部24から読み出してデコードするアプリケーションプログラム、及びデコードして得られる画像を表示部32に表示させるアプリケーションプログラム等の複数のアプリケーションプログラムがある。
本実施形態において、処理部22は、出力音補正部34の補正パラメータを設定する補正パラメータ設定部22a、音声認識処理を行う音声解析部22b、音声のスペクトル分析を行うスペクトル分析部22c、所定の提示音(テスト音)を生成する提示音生成部22dを有する。補正パラメータ設定部22a、音声解析部22b、スペクトル分析部22c、提示音生成部22dがそれぞれ有する機能は、処理部22及び記憶部24で構成されるハードウェア資源が、処理部22の制御部が割り当てるタスクを実行することにより実現される。ここで、タスクとは、アプリケーションソフトウェアが行っている処理全体、又は同じアプリケーションソフトウェアが行っている処理のうち、同時に実行できない処理単位である。なお、補正パラメータ設定部22a、音声解析部22b、スペクトル分析部22c及び提示音生成部22dの機能を、送受信部26を介して携帯電子機器1と通信可能なサーバで実行し、サーバが実行結果を携帯電子機器1に送信するようにしても良い。
記憶部24には、処理部22での処理に利用されるソフトウェアやデータが記憶されており、上述した、画像処理用プログラムを作動させるタスクが記憶されている。また、記憶部24には、これらのタスク以外にも、例えば、通信、ダウンロードされた音声データ、あるいは記憶部24に対する制御に処理部22が用いるソフトウェア、通信相手の電話番号やメールアドレス等が記述されて管理するアドレス帳、発信音や着信音等の音声ファイル、ソフトウェアの処理過程で用いられる一時的なデータ等が記憶されている。
なお、ソフトウェアの処理過程で用いられるコンピュータプログラムや一時的なデータは、処理部22によって記憶部24に割り当てられた作業領域へ一時的に記憶される。記憶部24は、例えば、不揮発性の記憶デバイス(ROM:Read Only Memory等の不揮発性半導体メモリ、ハードディスク装置等)や、読み書き可能な記憶デバイス(例えば、SRAM:Static Random Access Memory、DRAM:Dynamic Random Access Memory)等で構成される。
送受信部26は、アンテナ26aを有し、基地局によって割り当てられるチャネルを介し、基地局との間でCDMA(Code Division Multiple Access)方式などによる無線信号回線を確立し、基地局との間で電話通信及び情報通信を行う。操作部13は、例えば、電源キー、通話キー、数字キー、文字キー、方向キー、決定キー、発信キー等、各種の機能が割り当てられた操作キー13Aと、方向及び決定キー13Bとで構成される。そして、これらのキーがユーザの操作により入力されると、その操作内容に対応する信号を発生させる。発生した信号は、ユーザの指示として処理部22へ入力される。
音声処理部30は、マイク15に入力される音声信号やレシーバ16やスピーカ17から出力される音声信号の処理を実行する。すなわち、音声処理部30は、マイク15から入力される音声を増幅し、AD変換(Analog Digital変換)を実行した後、さらに符号化等の信号処理を施して、ディジタルの音声データに変換して処理部22へ出力する。また、処理部22から出力音補正部34を介して送られる音声データに対して復号化、DA変換(Digital Analog変換)、増幅等の処理を施してアナログの音声信号に変換してから、レシーバ16やスピーカ17へ出力する。ここで、スピーカ17は、携帯電子機器1の筐体1C内に配置されており、着信音やメールの送信音等を出力する。
表示部32は、上述したディスプレイ2を有しており、処理部22から供給される映像データに応じた映像や画像データに応じた画像を表示パネルに表示させる。ディスプレイ2は、例えば、液晶ディスプレイ(LCD、Liquid Crystal Display)や、有機EL(Organic Electro−Luminescence)パネルなどで構成された表示パネルで構成される。なお、表示部32は、ディスプレイ2に加え、サブディスプレイを有していてもよい。
出力音補正部34は、処理部22により設定される補正パラメータに基づいて、処理部22から送られる音声データに対して補正を行って音声処理部30に出力する。なお、出力音補正部34が行う補正は、入力される音声データに対して、補正パラメータに基づいて、音の大きさ及び周波数に応じて異なるゲインで増幅する補正である。また、出力音補正部34は、ハードウェア回路で実現しても良いし、CPUとプログラムで実現しても良い。出力音補正部34をCPUとプログラムで実現する場合、出力音補正部34を処理部22内で実現するようにしても良い。また、出力音補正部34の機能を、送受信部26を介して通信可能なサーバで実行し、サーバが補正処理後の音声データを携帯電子機器1に送信するようにしても良い。
ここで、人間の聴覚について図4〜図9を参照して説明する。図4は、人間の耳に入る音の大きさと人間が聴こえる(感じる)音の大きさとの関係を示すグラフである。健聴者の場合、耳に入る音の大きさと聴こえる音の大きさとは比例関係にある。一方、難聴者(高齢者、耳の病気を有する者等)の場合、一般的なイメージとしては、耳に入る音の大きさが或る値になるまでは殆ど聴こえず、耳に入る音の大きさが或る値以上になると耳に入る音に比例して音が聴こえるようになる。つまり、一般的なイメージの人は、耳に入る音を単純に増幅してやれば良いと考えられている。しかし、実際には、難聴者は、耳に入る音の大きさが或る値になるまでは殆ど聴こえず、耳に入る音の大きさが或る値以上になると急激に大きな音として聴こえるようになる。これにより、難聴者は、例えば、10dBの変化を20dBの変化に聴きとってしまう。そのため、大きい音に対して圧縮処理(大きい音に対するゲインを小さい音に対するゲインよりも小さくする処理)を行う必要がある。また、図5は、難聴者の聴力の周波数特性を示すグラフである。図5に示すように、難聴者は、低い音は良く聴こえるが、高い音ほど聴こえ難いことがわかる。なお、図5に示す特性は、一例であり、利用者によって聞こえる周波数特性は異なる。
図6は、健聴者、難聴者の出力される音の大きさと可聴閾値及び不快閾値との関係の一例を示す図である。なお、可聴閾値とは、適正に音が聴こえる下限の音の大きさであり、例えば、40dBで聴こえる音である。可聴閾値よりも小さい大きさの音は、小さくて聴こえにくい音になる。また、不快閾値とは、適正に音が聴こえる上限の音の大きさであり、例えば、90dBで聴こえる音である。不快閾値よりも大きい音は、音が大きくて不快に感じる音である。図6に示すように、難聴者は、可聴閾値42と不快閾値44とが共に、周波数が高くなるほど大きくなっている。なお、これに対して、健聴者は、可聴閾値46及び不快閾値48がともに、出力される音の大きさに対して一定となる。
次に、図7は、難聴者の出力される音の大きさと可聴閾値及び不快閾値との関係に、調整しないで出力される母音、有声子音及び無声子音の大きさ及び周波数を重ねて示した図である。図7に示すように、調整しないで出力される、つまり、健聴者の使用状態と同じ状態で出力させる母音は、範囲50で囲まれる周波数と音の大きさとの範囲の音で出力される。同様に、有声子音は、範囲52で囲まれる周波数と音の大きさとの範囲の音で出力され、無声子音は、範囲54で囲まれる周波数と音の大きさとの範囲の音で出力される。ここで、図7に示すように、難聴者の音が聞こえる範囲、可聴閾値42と不快閾値44の間には、母音の範囲50と、有声子音の範囲52の一部とが入るが、有声子音の範囲52の一部と、無声子音の範囲54の全部が入らない。このため、難聴者は、健聴者と同様の出力で音声を出力させると、母音は聴こえるが、子音(有声子音、無声子音)は殆ど聴こえないことがわかる。具体的には、有声子音は、一部聞こえるが、無声子音は、ほとんど聞こえない。
図8は、図7の高音(子音)を単純に増幅した図である。図8に示す母音の範囲50aは、図7に示す母音の範囲50と同様の範囲としている。また、有声子音の範囲52aは、図7に示す有声子音の範囲52よりも全体的に音の大きさが大きくなる方向、つまり範囲が図8中上方向に移動するように設定している。無声子音の範囲54aも、図7に示す無声子音の範囲54よりも全体的に音の大きさが大きくなる方向、つまり範囲が図8中上方向に移動するように設定している。図8に示すように、聞こえにくい周波数領域の音声、つまり、有声子音の範囲52aと、無声子音の範囲54aを単純に増幅すると、音の大きさが大きい範囲が不快閾値44を超えてしまい、高音が耳にキンキン響いてしまう。即ち、音がひずんで聞こえてしまい、言葉が明りょうに聞こえなくなる。
これに対して、図9は、本実施形態の携帯電子機器1の出力音補正部34により、音声を補正、具体的には、図8の大きい音に対して圧縮処理(大きい音に対するゲインを小さい音に対するゲインより小さくする処理)を行った図である。図9に示す母音の範囲50bは、図8に示す母音の範囲50aよりも大きい音に対するゲインを小さくしている。また、有声子音の範囲52bは、図8に示す有声子音の範囲52aよりも大きい音に対するゲインを小さくしている。また、無声子音の範囲54bも、図8に示す無声子音の範囲54aよりも大きい音に対するゲインを小さくしている。図9に示すように、小さい音は大きなゲインで増幅し、大きい音は小さいゲインで増幅することで、母音の範囲50b、有声子音の範囲52b及び無声子音の範囲54bを快適な音の大きさ(可聴閾値42と不快閾値44との間の大きさ)に含まれるようにすることができる。携帯電子機器1は、以上の事柄を考慮して、入力される音声データに対する補正パラメータを決定する。なお、補正パラメータは、入力される音声が、可聴閾値42と不快閾値44との間の大きさの音声としてユーザに聞こえるように補正を行うパラメータである。携帯電子機器1は、出力音補正部34により、決定した補正パラメータを用いて音の大きさ及び周波数に応じたゲインで増幅する補正を行い、音声処理部30に出力する。これにより、携帯電子機器1は、耳が聞こえにくいユーザでも、好適に音声を聞くことが可能となる。
次に、図10から図14を用いて、携帯電子機器の補正パラメータ設定動作を説明する。ここで、図10から図12は、それぞれ、携帯電子機器の動作を説明するための説明図である。より具体的には、補正パラメータの設定動作の際に、ディスプレイ2に表示させる画面を示す図である。携帯電子機器1は、補正パラメータの設定機能が起動されたら、まず、提示音生成部22dで提示音を生成し、レシーバ16またはスピーカ17から出力する。ここで、本実施形態において、提示音とは、補正パラメータの設定時にユーザが聞き取る対象の音声であり、単語、文章である。なお、提示音としては、聞き間違いが発生しやすい単語、文章を用いることが好ましい。なお、提示音としては、例えば、「安全」や「完全」や「断然」を用いることができる。「安全」と「完全」と「断然」とは、互いに聞き間違いしやすい音声である。また、提示音としては、「売り上げ」や「おみやげ」や「もみやげ」も用いることができる。また、このほかにも、「環境」や「反響」や「探求」も用いることができる。なお、以下では、提示音として「いなか(田舎)」を出力した場合として説明する。また、提示音は、不快閾値と可聴閾値とを設定できるように、設定された不快閾値ぎりぎりの音(例えば、不快閾値よりわずかに小さい音)や設定された可聴閾値ぎりぎりの音(例えば、可聴閾値よりわずかに大きい音)を用いることが好ましい。
携帯電子機器1は、提示音を出力したら、図10に示す画面70を表示させる。ここで、画面70は、聞き取った音を入力する画面であり、メッセージ72と、表示欄74a、74b、74cと、カーソル76とが表示される。メッセージ72は、ユーザに入力を即す、つまりユーザが行う動作を示唆するメッセージであり、「何と聞こえましたか?キーで入力してください」という文章である。また、表示欄74a、74b、74cは、ユーザが操作部13を操作して入力した文字を表示させる表示領域であり、提示音の文字数に対応した数の入力欄、つまり、本実施形態では、「いなか」に対応した3つの表示欄が表示される。カーソル76は、どの入力欄に文字を入力する状態であるかを示す指示指標であり、図10では、表示欄75aの直下に表示されている。
携帯電子機器1は、図10に示す画面70を表示させている状態で、操作部13が操作され、文字が入力されたら、入力された文字を表示欄74a、74b、74cに表示させる。ここで、図11に示す画面70aは、文字として「ひなた」が入力された状態である。画面70aでは、表示欄74aに「ひ」が表示され、表示欄74bに「な」が表示され、表示欄74cに「た」が表示される。また、カーソル76は、表示欄74cの直下に表示されている。
携帯電子機器1は、図11の画面70aに示すように、文字として、「ひなた」が入力されたら、提示音の文字と、入力された文字とを比較し、その比較結果に基づいて、補正パラメータを設定する。具体的には、携帯電子機器1は、「いなか」と「ひなた」とを母音と子音とに分解し、「INAKA」と、「HINATA」とを比較する。ここで、「INAKA」と、「HINATA」とは、いずれも母音が「I」、「A」、「A」であるため、母音が一致している。これに対して、子音なしと子音「H」とを聞き間違え、子音「K」と子音「T」とを聞き間違えている。以上の結果から、対象となる音声、本実施形態では子音「H」、「K」、「T」に対応する周波数域の閾値(不快閾値または可聴閾値)を調整し、設定する。
また、携帯電子機器1は、図12に示すように、提示音の文字と、入力された文字とが一致したか否かをユーザに通知する画面70bを表示させる。ここで、画面70bは、表示欄74aに「ひ」が表示され、表示欄74bに「な」が表示され、表示欄74cに「た」が表示される。さらに、画面70bには、不一致を示す印80aが、表示欄74aに重ねて表示され、一致を示す印80bが、表示欄74bに重ねて表示され、不一致を示す印80cが、表示欄74cに重ねて表示される。携帯電子機器1は、以上のようにして、ディスプレイに画面を表示させつつ、提示音を出力し、制御を行うことで、補正パラメータの調整を周波数域毎、各母音、各有声子音、各無声子音で行う。
次に、図13を用いて携帯電子機器の補正パラメータ設定動作をより詳細に説明する。ここで、図13は、携帯電子機器の動作の一例を示すフロー図である。なお、図13に示す動作は、記憶部24に記憶されたアプリケーションを実行することで処理してもよい。またプログラムは、外部からダウンロードして取得することができる。
まず、携帯電子機器1の処理部22は、ステップS12として、提示音(テスト音)を再生する。つまり、携帯電子機器1の処理部22は、提示音生成部22dにより提示音(テスト音)を生成し、音声処理部30を介してレシーバ16またはスピーカ17から出力させる。なお、提示音としては、上述したように、各種聞き間違えが発生しやすい単語、文章を用いることが好ましい。また、携帯電子機器1は、提示音を、設定された不快閾値ぎりぎりの音(例えば、不快閾値よりわずかに小さい音)や設定された可聴閾値ぎりぎりの音(例えば、可聴閾値よりわずかに大きい音)で出力することが好ましい。
処理部22は、ステップS12で提示音を再生したら、ステップS14として、入力画面を表示させる。つまり、上述した、図10のように提示音がなんと聞こえたか、どんな単語や、文章が聞こえたかを入力する画面を表示させる。処理部22は、ステップS14で入力画面を表示させたら、ステップS16として入力が完了したかを判定する。ここで、処理部22は、必要な文字数が入力されたら、または、一定の時間が経過したら、入力が完了したと判定する。処理部22は、ステップS16で入力が完了していない(ステップS16でNo)と判定したら、ステップS16に進む。つまり、処理部22は、入力が完了するまで、ステップS16の処理を繰り返す。なお、処理部22は、ステップS16の処理中に操作部13が操作され文字が入力されたら、入力された文字を反映して制御を行う。
処理部22は、ステップS16で入力が完了した(ステップS16でYes)と判定したら、ステップS18として、提示音と入力文字が一致しているかを判定する。処理部22は、ステップS18で、提示音と入力文字が一致する(ステップS18でYes)と判定したら、処理を終了する。また、処理部22は、ステップS18で、提示音と入力文字が一致しない(ステップS18でNo)と判定したら、ステップS20として、補正パラメータを調整し、処理を終了する。
次に、図14を用いて、ステップS20での提示音と入力文字が一致しないことに基づいた、補正パラメータの調整の処理について説明する。ここで、図14は、携帯電子機器の動作の一例を示すフロー図である。なお、図14に示す動作も、記憶部24に記憶されたアプリケーションを実行することで処理してもよい。またプログラムは、外部からダウンロードして取得することができる。
まず、処理部22は、ステップS40として、母音が不一致であるかを判定する。処理部22は、ステップS40で母音が不一致である(ステップS40でYes)と判定したら、ステップS42として、母音の周波数域で対象の周波数を特定する。つまり、不一致の母音に対応する周波数の帯域、または1つ以上の周波数を特定する。処理部22は、ステップS42で周波数を特定したら、ステップS50に進む。
また、ステップS40で母音が不一致ではない(ステップS40でNo)、つまり、母音は全て一致していると判定したら、ステップS44として、有声子音が不一致であるかを判定する。処理部22は、ステップS44で有声子音が不一致である(ステップS44でYes)と判定したら、ステップS46として、有声子音の周波数域で対象の周波数を特定する。つまり、不一致の有声子音に対応する周波数の帯域、または1つ以上の周波数を特定する。処理部22は、ステップS46で周波数を特定したら、ステップS50に進む。
また、処理部22は、ステップS44で有声子音が不一致ではない(ステップS44でNo)、つまり、不一致な音声は、無声子音であると判定したら、ステップS48として、無声子音の周波数域で対象の周波数を特定する。つまり、不一致の無声子音に対応する周波数の帯域、または1つ以上の周波数を特定する。処理部22は、ステップS48で周波数を特定したら、ステップS50に進む。
処理部22は、ステップS42、ステップS46、ステップS48の処理が終了したら、ステップS50として、不一致音の出力は、不快閾値に近いかを判定する。つまり、処理部22は、ステップS50として、不一致音の出力の大きさが、不快閾値に近いか、可聴閾値に近いかを判定し、聞き間違いをした原因が、ユーザの不快閾値よりも大きい音声であるためか、可聴閾値よりも小さいためであるかを判定する。
処理部22は、ステップS50で、不一致音の出力は、不快閾値に近い(ステップS50でYes)、つまり、不一致音の出力は、可聴閾値よりも不快閾値に近いと判定したら、ステップS52として、該当する周波数の不快閾値を低下させる。つまり調整対象の周波数の不快閾値をより小さい値とする。処理部22は、ステップS52の処理が終了したら、ステップS56に進む。
処理部22は、ステップS50で、不一致音の出力は、不快閾値に近くない(ステップS50でNo)、つまり、不一致音の出力は、不快閾値よりも可聴閾値に近いと判定したら、ステップS54として、該当する周波数の可聴閾値を上昇させる。つまり調整対象の周波数の可聴閾値をより大きな値とする。処理部22は、ステップS54の処理が終了したら、ステップS56に進む。
処理部22は、ステップS52、ステップS54の処理が終了したら、ステップS56として、不一致音を全て補正したか、つまり不一致音に対する補正処理を完了したかを判定する。処理部22は、ステップS56で、不一致音を全て補正していない(ステップS56でNo)、つまり、補正処理を行っていない不一致音があると判定したら、ステップS40に進み上記処理を繰り返す。これにより、処理部22は、不一致と判定した全ての音に対して、閾値の補正処理を行う。また、処理部22は、ステップS56で、不一致音を全て補正した(ステップS56でYes)と判定したら、処理を終了する。
携帯電子機器1は、以上のようにして、周波数毎に補正パラメータを設定する。携帯電子機器1は、音声信号が入力されたら、出力音補正部34が、設定した補正パラメータに基づいて、音声信号を補正し音声処理部30に出力する。これにより、携帯電子機器1は、ユーザの聴こえ(音声の聞こえ方、聴覚の特性)に合わせて設定した補正パラメータによって音声信号を補正することができ、ユーザにより聞こえやすい音声を出力することができる。
さらに、処理部22は、様々な単語、文章の提示音を用いて図13、図14に示すフローを繰り返し実行することで、補正パラメータをユーザに適した値に収束させ、ユーザにより聞こえやすい音声を出力することができる。
また、処理部22は、図13、図14に示すフローを定期的(例えば、3ヶ月毎、6ヶ月毎等)に実行することで、ユーザの聴力に変化があった場合であっても、ユーザにより聞こえやすい音声を出力することができる。
また、処理部22は、提示音として単語を用い、ユーザに聴こえた単語を入力させ、比較を行うことで、電話による通信や、テレビ放送の視聴時に実際に聞くことになる、言葉を用いて、補正処理を行うことができる。これにより、より適切に補正パラメータを調整することができ、電話による会話や、テレビ放送の視聴をより円滑に行うことができる。
また、処理部22は、本実施形態のように、提示音を、母音と有声子音と無声子音とに別け解析を行い、それぞれに対応する周波数毎に補正パラメータを設定することで、より聴こえやすい音声を出力することができる。
また、聴こえた音声を文字として入力できるため、処理部22は、確実、かつ間違えることなく、ユーザの入力を検出することができ、より高い精度で音声の補正を行うことができる。また、携帯電子機器1は、補正パラメータを調整しつつ、本実施形態のように、文字を入力させ、その結果、つまり、一致しているかの結果をディスプレイ2に表示させることで、ユーザに徐々に聴こえやすくなっていることを認知させることができる。これにより、ユーザに高い満足度かつ少ないストレスで、補正パラメータの設定を実施させることができる。また、ユーザにゲーム感覚で補正パラメータの設定を実施させることができる。
また、上記実施形態では、文字入力の入力欄を文字数に対応した数としたが、本発明はこれに限定されない。例えば、単にテキスト入力画面を表示させるようにしてもよい。
また、携帯電子機器1は、提示音の出力方法として種々の出力方法を用いることができる。例えば、予め設定してある音声を用いてもよいし、通話で使用した音声をサンプリングして用いてもよい。また、特定の通話相手に予め用意したテキスト情報を読み上げてもらい、そのテキスト情報と音声情報を取得し、ユーザが音声情報を聞きながら、聴こえた文字情報を入力するようにしても、補正パラメータを設定することができる。なお、提示音として、特定の対象の音声を用いることで、特定の対象の音声をより聞きやすくすることができ、特定の対象との通話をより円滑に行うことができる。
ここで、処理部22は、音声処理部30で実際に出力する周波数に対応して補正パラメータを設定することが好ましく、より好ましくは、電話通信で用いられる周波数に対応して補正パラメータを設定することが好ましい。このように、実際に使用する周波数に対して補正パラメータを設定することで、より携帯電子機器1から出力される音声をより聞きやすい音声にすることができる。ここで、補正パラメータを設定する周波数としては、例えば、CELP(符号励振線形予測符号化)方式、EVRC(可変レート音声コーデック)方式、AMR(適応型マルチレート)方式で用いられる周波数に対して設定することが好ましい。
なお、本実施形態では、補正パラメータの設定処理を、処理部22で行ったが、本発明はこれに限定されない。携帯電子機器1は、各種演算処理を、送受信部26を介して通信可能なサーバで実行してもよい。つまり、演算処理自体は、外部で行っても良い。この場合、携帯電子機器1は、サーバから送信された音声の出力、画像の表示等を行い、ユーザから入力された操作をデータとしてサーバに送信する。このように、サーバで演算を行ったり、補正パラメータを設定したりすることで、携帯電子機器にかかる負荷を少なくすることができる。また、通信を行うサーバで予め補正パラメータを設定し、サーバが補正パラメータに基づいて音声信号を補正するようにしてもよい。つまり、サーバと携帯電子機器とを1つのシステムとして、上述した処理を行うようにしてもよい。これにより、携帯電子機器1は、予め補正された音声信号を受け取ることができるため、補正処理自体を実行しないようにすることもできる。