JP5690085B2

JP5690085B2 - 携帯電子機器

Info

Publication number: JP5690085B2
Application number: JP2010151301A
Authority: JP
Inventors: 智裕稲垣
Original assignee: Kyocera Corp
Current assignee: Kyocera Corp
Priority date: 2010-07-01
Filing date: 2010-07-01
Publication date: 2015-03-25
Anticipated expiration: 2030-07-01
Also published as: JP2012015854A

Description

本発明は、音声を出力する携帯電子機器に関する。

携帯電話機、携帯テレビ等の携帯電子機器は、音声を出力する。ここで、携帯電子機器のユーザの中には、加齢等によって、聴力が低下し、出力される音声が聞こえにくいユーザがいる。

これに対して、例えば、特許文献１には、レシーバ等から出力される音声の周波数特性及びレベルを年齢による聴覚変化に合わせて補正する音声補正機能付き移動機が記載されている。

特開２０００−２０９６９８号公報

ここで、聴力低下の要因は、加齢、病気、騒音曝露等様々であり、聴力低下の程度も千差万別である。そのため、特許文献１に記載されているように、レシーバ等から出力される音声の周波数特性及びレベルを年齢に合わせて補正するだけでは、ユーザにとって十分満足できる音声の補正をすることができない。

本発明は、出力する音声を適正に補正することができ、ユーザにより聞こえやすい音声を出力することができる携帯電子機器を提供することを目的とする。

本発明に係る携帯電子機器は、筐体と、前記筐体に設けられて、画像を表示する画像表示部と、前記筐体に設けられて、音声信号に基づいて音を発生する音発生部と、前記筐体に設けられて、操作入力を受け付ける操作部と、前記音発生部により音を発生させ、発生させた音に対する応答を前記操作部により受け付けたら、前記応答に基づいて、補正パラメータを設定する処理部と、音声周波数毎に音の大きさを調整する補正パラメータに基づいて、音声信号を補正し、補正した音声信号を前記音発生部に供給する補正部と、を備え、前記処理部は、前記音発生部から出力された出力音声と、前記操作部から入力された入力文字とを比較し、出力音声と入力文字とで一致しない音に対応する周波数毎の補正パラメータを設定することを特徴とする。

ここで、前記補正パラメータは、前記音発生部から発生させる音声が不快閾値と可聴閾値との間の大きさになるように補正するパラメータであることが好ましい。

また、前記処理部は、出力音声と入力文字とで一致しない音が、可聴閾値よりも不快閾値に近い出力である場合は、該当する音の波長域の不快閾値の値を低下させ、出力音声と入力文字とで一致しない音が、不快閾値よりも可聴閾値に近い出力である場合は、該当する音の波長域の前記可聴閾値を上昇させることが好ましい。

また、前記処理部は、前記出力音声として、不快閾値より小さい音及び可聴閾値より大きい音の少なくとも一方を前記音発生部により発生させることが好ましい。

また、前記処理部は、音声を、母音、有声子音、無声子音に分けて、判定することが好ましい。

本発明の携帯電子機器は、個々のユーザの聴力に合わせて、出力する音声を適正に補正することができ、ユーザにより聞こえやすい音声を出力することができるという効果を奏する。

図１は、携帯電子機器の一実施形態の概略構成を示す正面図である。図２は、図１に示す携帯電子機器の側面図である。図３は、図１、図２に示す携帯電子機器の機能の概略構成を示すブロック図である。図４は、人間の聴力の特性を示す図である。図５は、難聴者の聴力の特性の例を示す図である。図６は、可聴閾値及び不快閾値の例を示す図である。図７は、図６に、母音、有声子音及び無声子音の大きさ及び周波数を重ねて示した図である。図８は、図７の高音（子音）を単純に増幅した図である。図９は、図８の大きい音に対して圧縮処理を行った図である。図１０は、携帯電子機器の動作を説明するための説明図である。図１１は、携帯電子機器の動作を説明するための説明図である。図１２は、携帯電子機器の動作を説明するための説明図である。図１３は、携帯電子機器の動作の一例を説明するためのフロー図である。図１４は、携帯電子機器の動作の一例を説明するためのフロー図である。

以下、本発明につき図面を参照しつつ詳細に説明する。なお、以下の説明により本発明が限定されるものではない。また、以下の説明における構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。以下においては、携帯電子機器の一例として携帯電話機を取り上げるが、本発明の適用対象は携帯電話機に限定されるものではなく、例えば、ＰＨＳ（Personal Handy-phone System）、ＰＤＡ、ポータブルナビゲーション装置、ノートパソコン、ゲーム機等に対しても本発明は適用できる。

図１は、実施形態に係る携帯電子機器の一実施形態の概略構成を示す正面図であり、図２は、図１に示す携帯電子機器の側面図である。図１、図２に示す携帯電子機器１は、無線通信機能と、出力手段と、音声取得手段とを有する携帯電話機である。携帯電子機器１は、筐体１Ｃが複数の筐体で構成される。具体的には、筐体１Ｃは、第１筐体１ＣＡと第２筐体１ＣＢとで開閉可能に構成される。すなわち、携帯電子機器１は、折り畳み式の筐体を有する。なお、携帯電子機器１の筐体は、このような構造に限定されるものではない。例えば、携帯電子機器１の筐体は、両方の筐体を重ね合わせた状態から一方の筐体と他方の筐体とを互いにスライドできるようにしたスライド式の筐体であってもよいし、重ね合わせ方向に沿う軸線を中心に、一方の筐体を回転させるようにした回転式や、２軸ヒンジを介して両方の筐体を連結したものでもよい。

第１筐体１ＣＡと第２筐体１ＣＢとは、連結部であるヒンジ機構８で連結されている。ヒンジ機構８で第１筐体１ＣＡと第２筐体１ＣＢとを連結することにより、第１筐体１ＣＡ及び第２筐体１ＣＢは、ヒンジ機構８を中心としてともに回動して、互いに遠ざかる方向及び互いに接近する方向（図２の矢印Ｒで示す方向）に回動できるように構成される。第１筐体１ＣＡと第２筐体１ＣＢとが互いに遠ざかる方向に回動すると携帯電子機器１が開き、第１筐体１ＣＡと第２筐体１ＣＢとが互いに接近する方向に回動すると携帯電子機器１が閉じて、折り畳まれた状態となる（図２の点線で示す状態）。

第１筐体１ＣＡには、表示部として、図１に示すディスプレイ２が設けられる。ディスプレイ２は、携帯電子機器１が受信を待機している状態のときに待ち受け画像を表示したり、携帯電子機器１の操作を補助するために用いられるメニュー画像を表示したりする。また、第１筐体１ＣＡには、携帯電子機器１の通話時に音声を出力する出力手段であるレシーバ１６が設けられる。

第２筐体１ＣＢには、通話相手の電話番号や、メール作成時等に文字を入力するための操作キー１３Ａが複数設けられ、また、ディスプレイ２に表示されるメニューの選択及び決定や画面のスクロール等を容易に実行するための方向及び決定キー１３Ｂが設けられる。操作キー１３Ａ及び方向及び決定キー１３Ｂは、携帯電子機器１の操作部１３を構成する。また、第２筐体１ＣＢには、携帯電子機器１の通話時に音声を受け取る音声取得手段であるマイク１５が設けられる。操作部１３は、図２に示す、第２筐体１ＣＢの操作面１ＰＣに設けられる。操作面１ＰＣとは反対側の面が、携帯電子機器１の背面１ＰＢである。

第２筐体１ＣＢの内部には、アンテナが設けられている。アンテナは、無線通信に用いる送受信アンテナであり、携帯電子機器１と基地局との間で通話や電子メール等に係る電波（電磁波）の送受信に用いられる。また、第２筐体１ＣＢには、マイク１５が設けられる。マイク１５は、図２に示す、携帯電子機器１の操作面１ＰＣ側に配置される。

図３は、図１、図２に示す携帯電子機器の機能の概略構成を示すブロック図である。図３に示すように、携帯電子機器１は、処理部２２と、記憶部２４と、送受信部２６と、操作部１３と、音声処理部３０と、表示部３２と、出力音補正部３４と、を有する。処理部２２は、携帯電子機器１の全体的な動作を統括的に制御する機能を有する。すなわち、処理部２２は、携帯電子機器１の各種の処理が、操作部１３の操作や携帯電子機器１の記憶部２４に記憶されるソフトウェアに応じて適切な手順で実行されるように、送受信部２６や、音声処理部３０や、表示部３２等の動作を制御する。

携帯電子機器１の各種の処理としては、例えば、回線交換網を介して行われる音声通話、電子メールの作成及び送受信、インターネットのＷｅｂ（World Wide Web）サイトの閲覧等がある。また、送受信部２６、音声処理部３０、表示部３２等の動作としては、例えば、送受信部２６による信号の送受信、音声処理部３０による音声の入出力、表示部３２による画像の表示等がある。

処理部２２は、記憶部２４に記憶されているプログラム（例えば、オペレーティングシステムプログラム、アプリケーションプログラム等）に基づいて処理を実行する。処理部２２は、例えば、マイクロプロセッサユニット（ＭＰＵ：Micro Processing Unit）で構成され、前記ソフトウェアで指示された手順にしたがって上述した携帯電子機器１の各種の処理を実行する。すなわち、処理部２２は、記憶部２４に記憶されるオペレーティングシステムプログラムやアプリケーションプログラム等から命令コードを順次読み込んで処理を実行する。

処理部２２は、複数のアプリケーションプログラムを実行する機能を有する。処理部２２が実行するアプリケーションプログラムとしては、例えば、各種の画像ファイル（画像情報）を記憶部２４から読み出してデコードするアプリケーションプログラム、及びデコードして得られる画像を表示部３２に表示させるアプリケーションプログラム等の複数のアプリケーションプログラムがある。

本実施形態において、処理部２２は、出力音補正部３４の補正パラメータを設定する補正パラメータ設定部２２ａ、音声認識処理を行う音声解析部２２ｂ、音声のスペクトル分析を行うスペクトル分析部２２ｃ、所定の提示音（テスト音）を生成する提示音生成部２２ｄを有する。補正パラメータ設定部２２ａ、音声解析部２２ｂ、スペクトル分析部２２ｃ、提示音生成部２２ｄがそれぞれ有する機能は、処理部２２及び記憶部２４で構成されるハードウェア資源が、処理部２２の制御部が割り当てるタスクを実行することにより実現される。ここで、タスクとは、アプリケーションソフトウェアが行っている処理全体、又は同じアプリケーションソフトウェアが行っている処理のうち、同時に実行できない処理単位である。なお、補正パラメータ設定部２２ａ、音声解析部２２ｂ、スペクトル分析部２２ｃ及び提示音生成部２２ｄの機能を、送受信部２６を介して携帯電子機器１と通信可能なサーバで実行し、サーバが実行結果を携帯電子機器１に送信するようにしても良い。

記憶部２４には、処理部２２での処理に利用されるソフトウェアやデータが記憶されており、上述した、画像処理用プログラムを作動させるタスクが記憶されている。また、記憶部２４には、これらのタスク以外にも、例えば、通信、ダウンロードされた音声データ、あるいは記憶部２４に対する制御に処理部２２が用いるソフトウェア、通信相手の電話番号やメールアドレス等が記述されて管理するアドレス帳、発信音や着信音等の音声ファイル、ソフトウェアの処理過程で用いられる一時的なデータ等が記憶されている。

なお、ソフトウェアの処理過程で用いられるコンピュータプログラムや一時的なデータは、処理部２２によって記憶部２４に割り当てられた作業領域へ一時的に記憶される。記憶部２４は、例えば、不揮発性の記憶デバイス（ＲＯＭ：Read Only Memory等の不揮発性半導体メモリ、ハードディスク装置等）や、読み書き可能な記憶デバイス（例えば、ＳＲＡＭ：Static Random Access Memory、ＤＲＡＭ：Dynamic Random Access Memory）等で構成される。

送受信部２６は、アンテナ２６ａを有し、基地局によって割り当てられるチャネルを介し、基地局との間でＣＤＭＡ（Code Division Multiple Access）方式などによる無線信号回線を確立し、基地局との間で電話通信及び情報通信を行う。操作部１３は、例えば、電源キー、通話キー、数字キー、文字キー、方向キー、決定キー、発信キー等、各種の機能が割り当てられた操作キー１３Ａと、方向及び決定キー１３Ｂとで構成される。そして、これらのキーがユーザの操作により入力されると、その操作内容に対応する信号を発生させる。発生した信号は、ユーザの指示として処理部２２へ入力される。

音声処理部３０は、マイク１５に入力される音声信号やレシーバ１６やスピーカ１７から出力される音声信号の処理を実行する。すなわち、音声処理部３０は、マイク１５から入力される音声を増幅し、ＡＤ変換（Analog Digital変換）を実行した後、さらに符号化等の信号処理を施して、ディジタルの音声データに変換して処理部２２へ出力する。また、処理部２２から出力音補正部３４を介して送られる音声データに対して復号化、ＤＡ変換（Digital Analog変換）、増幅等の処理を施してアナログの音声信号に変換してから、レシーバ１６やスピーカ１７へ出力する。ここで、スピーカ１７は、携帯電子機器１の筐体１Ｃ内に配置されており、着信音やメールの送信音等を出力する。

表示部３２は、上述したディスプレイ２を有しており、処理部２２から供給される映像データに応じた映像や画像データに応じた画像を表示パネルに表示させる。ディスプレイ２は、例えば、液晶ディスプレイ（ＬＣＤ、Liquid Crystal Display）や、有機ＥＬ（Organic Electro−Luminescence）パネルなどで構成された表示パネルで構成される。なお、表示部３２は、ディスプレイ２に加え、サブディスプレイを有していてもよい。

出力音補正部３４は、処理部２２により設定される補正パラメータに基づいて、処理部２２から送られる音声データに対して補正を行って音声処理部３０に出力する。なお、出力音補正部３４が行う補正は、入力される音声データに対して、補正パラメータに基づいて、音の大きさ及び周波数に応じて異なるゲインで増幅する補正である。また、出力音補正部３４は、ハードウェア回路で実現しても良いし、ＣＰＵとプログラムで実現しても良い。出力音補正部３４をＣＰＵとプログラムで実現する場合、出力音補正部３４を処理部２２内で実現するようにしても良い。また、出力音補正部３４の機能を、送受信部２６を介して通信可能なサーバで実行し、サーバが補正処理後の音声データを携帯電子機器１に送信するようにしても良い。

ここで、人間の聴覚について図４〜図９を参照して説明する。図４は、人間の耳に入る音の大きさと人間が聴こえる（感じる）音の大きさとの関係を示すグラフである。健聴者の場合、耳に入る音の大きさと聴こえる音の大きさとは比例関係にある。一方、難聴者（高齢者、耳の病気を有する者等）の場合、一般的なイメージとしては、耳に入る音の大きさが或る値になるまでは殆ど聴こえず、耳に入る音の大きさが或る値以上になると耳に入る音に比例して音が聴こえるようになる。つまり、一般的なイメージの人は、耳に入る音を単純に増幅してやれば良いと考えられている。しかし、実際には、難聴者は、耳に入る音の大きさが或る値になるまでは殆ど聴こえず、耳に入る音の大きさが或る値以上になると急激に大きな音として聴こえるようになる。これにより、難聴者は、例えば、１０ｄＢの変化を２０ｄＢの変化に聴きとってしまう。そのため、大きい音に対して圧縮処理（大きい音に対するゲインを小さい音に対するゲインよりも小さくする処理）を行う必要がある。また、図５は、難聴者の聴力の周波数特性を示すグラフである。図５に示すように、難聴者は、低い音は良く聴こえるが、高い音ほど聴こえ難いことがわかる。なお、図５に示す特性は、一例であり、利用者によって聞こえる周波数特性は異なる。

図６は、健聴者、難聴者の出力される音の大きさと可聴閾値及び不快閾値との関係の一例を示す図である。なお、可聴閾値とは、適正に音が聴こえる下限の音の大きさであり、例えば、４０ｄＢで聴こえる音である。可聴閾値よりも小さい大きさの音は、小さくて聴こえにくい音になる。また、不快閾値とは、適正に音が聴こえる上限の音の大きさであり、例えば、９０ｄＢで聴こえる音である。不快閾値よりも大きい音は、音が大きくて不快に感じる音である。図６に示すように、難聴者は、可聴閾値４２と不快閾値４４とが共に、周波数が高くなるほど大きくなっている。なお、これに対して、健聴者は、可聴閾値４６及び不快閾値４８がともに、出力される音の大きさに対して一定となる。

次に、図７は、難聴者の出力される音の大きさと可聴閾値及び不快閾値との関係に、調整しないで出力される母音、有声子音及び無声子音の大きさ及び周波数を重ねて示した図である。図７に示すように、調整しないで出力される、つまり、健聴者の使用状態と同じ状態で出力させる母音は、範囲５０で囲まれる周波数と音の大きさとの範囲の音で出力される。同様に、有声子音は、範囲５２で囲まれる周波数と音の大きさとの範囲の音で出力され、無声子音は、範囲５４で囲まれる周波数と音の大きさとの範囲の音で出力される。ここで、図７に示すように、難聴者の音が聞こえる範囲、可聴閾値４２と不快閾値４４の間には、母音の範囲５０と、有声子音の範囲５２の一部とが入るが、有声子音の範囲５２の一部と、無声子音の範囲５４の全部が入らない。このため、難聴者は、健聴者と同様の出力で音声を出力させると、母音は聴こえるが、子音（有声子音、無声子音）は殆ど聴こえないことがわかる。具体的には、有声子音は、一部聞こえるが、無声子音は、ほとんど聞こえない。

図８は、図７の高音（子音）を単純に増幅した図である。図８に示す母音の範囲５０ａは、図７に示す母音の範囲５０と同様の範囲としている。また、有声子音の範囲５２ａは、図７に示す有声子音の範囲５２よりも全体的に音の大きさが大きくなる方向、つまり範囲が図８中上方向に移動するように設定している。無声子音の範囲５４ａも、図７に示す無声子音の範囲５４よりも全体的に音の大きさが大きくなる方向、つまり範囲が図８中上方向に移動するように設定している。図８に示すように、聞こえにくい周波数領域の音声、つまり、有声子音の範囲５２ａと、無声子音の範囲５４ａを単純に増幅すると、音の大きさが大きい範囲が不快閾値４４を超えてしまい、高音が耳にキンキン響いてしまう。即ち、音がひずんで聞こえてしまい、言葉が明りょうに聞こえなくなる。

これに対して、図９は、本実施形態の携帯電子機器１の出力音補正部３４により、音声を補正、具体的には、図８の大きい音に対して圧縮処理（大きい音に対するゲインを小さい音に対するゲインより小さくする処理）を行った図である。図９に示す母音の範囲５０ｂは、図８に示す母音の範囲５０ａよりも大きい音に対するゲインを小さくしている。また、有声子音の範囲５２ｂは、図８に示す有声子音の範囲５２ａよりも大きい音に対するゲインを小さくしている。また、無声子音の範囲５４ｂも、図８に示す無声子音の範囲５４ａよりも大きい音に対するゲインを小さくしている。図９に示すように、小さい音は大きなゲインで増幅し、大きい音は小さいゲインで増幅することで、母音の範囲５０ｂ、有声子音の範囲５２ｂ及び無声子音の範囲５４ｂを快適な音の大きさ（可聴閾値４２と不快閾値４４との間の大きさ）に含まれるようにすることができる。携帯電子機器１は、以上の事柄を考慮して、入力される音声データに対する補正パラメータを決定する。なお、補正パラメータは、入力される音声が、可聴閾値４２と不快閾値４４との間の大きさの音声としてユーザに聞こえるように補正を行うパラメータである。携帯電子機器１は、出力音補正部３４により、決定した補正パラメータを用いて音の大きさ及び周波数に応じたゲインで増幅する補正を行い、音声処理部３０に出力する。これにより、携帯電子機器１は、耳が聞こえにくいユーザでも、好適に音声を聞くことが可能となる。

次に、図１０から図１４を用いて、携帯電子機器の補正パラメータ設定動作を説明する。ここで、図１０から図１２は、それぞれ、携帯電子機器の動作を説明するための説明図である。より具体的には、補正パラメータの設定動作の際に、ディスプレイ２に表示させる画面を示す図である。携帯電子機器１は、補正パラメータの設定機能が起動されたら、まず、提示音生成部２２ｄで提示音を生成し、レシーバ１６またはスピーカ１７から出力する。ここで、本実施形態において、提示音とは、補正パラメータの設定時にユーザが聞き取る対象の音声であり、単語、文章である。なお、提示音としては、聞き間違いが発生しやすい単語、文章を用いることが好ましい。なお、提示音としては、例えば、「安全」や「完全」や「断然」を用いることができる。「安全」と「完全」と「断然」とは、互いに聞き間違いしやすい音声である。また、提示音としては、「売り上げ」や「おみやげ」や「もみやげ」も用いることができる。また、このほかにも、「環境」や「反響」や「探求」も用いることができる。なお、以下では、提示音として「いなか（田舎）」を出力した場合として説明する。また、提示音は、不快閾値と可聴閾値とを設定できるように、設定された不快閾値ぎりぎりの音（例えば、不快閾値よりわずかに小さい音）や設定された可聴閾値ぎりぎりの音（例えば、可聴閾値よりわずかに大きい音）を用いることが好ましい。

携帯電子機器１は、提示音を出力したら、図１０に示す画面７０を表示させる。ここで、画面７０は、聞き取った音を入力する画面であり、メッセージ７２と、表示欄７４ａ、７４ｂ、７４ｃと、カーソル７６とが表示される。メッセージ７２は、ユーザに入力を即す、つまりユーザが行う動作を示唆するメッセージであり、「何と聞こえましたか？キーで入力してください」という文章である。また、表示欄７４ａ、７４ｂ、７４ｃは、ユーザが操作部１３を操作して入力した文字を表示させる表示領域であり、提示音の文字数に対応した数の入力欄、つまり、本実施形態では、「いなか」に対応した３つの表示欄が表示される。カーソル７６は、どの入力欄に文字を入力する状態であるかを示す指示指標であり、図１０では、表示欄７５ａの直下に表示されている。

携帯電子機器１は、図１０に示す画面７０を表示させている状態で、操作部１３が操作され、文字が入力されたら、入力された文字を表示欄７４ａ、７４ｂ、７４ｃに表示させる。ここで、図１１に示す画面７０ａは、文字として「ひなた」が入力された状態である。画面７０ａでは、表示欄７４ａに「ひ」が表示され、表示欄７４ｂに「な」が表示され、表示欄７４ｃに「た」が表示される。また、カーソル７６は、表示欄７４ｃの直下に表示されている。

携帯電子機器１は、図１１の画面７０ａに示すように、文字として、「ひなた」が入力されたら、提示音の文字と、入力された文字とを比較し、その比較結果に基づいて、補正パラメータを設定する。具体的には、携帯電子機器１は、「いなか」と「ひなた」とを母音と子音とに分解し、「ＩＮＡＫＡ」と、「ＨＩＮＡＴＡ」とを比較する。ここで、「ＩＮＡＫＡ」と、「ＨＩＮＡＴＡ」とは、いずれも母音が「Ｉ」、「Ａ」、「Ａ」であるため、母音が一致している。これに対して、子音なしと子音「Ｈ」とを聞き間違え、子音「Ｋ」と子音「Ｔ」とを聞き間違えている。以上の結果から、対象となる音声、本実施形態では子音「Ｈ」、「Ｋ」、「Ｔ」に対応する周波数域の閾値（不快閾値または可聴閾値）を調整し、設定する。

また、携帯電子機器１は、図１２に示すように、提示音の文字と、入力された文字とが一致したか否かをユーザに通知する画面７０ｂを表示させる。ここで、画面７０ｂは、表示欄７４ａに「ひ」が表示され、表示欄７４ｂに「な」が表示され、表示欄７４ｃに「た」が表示される。さらに、画面７０ｂには、不一致を示す印８０ａが、表示欄７４ａに重ねて表示され、一致を示す印８０ｂが、表示欄７４ｂに重ねて表示され、不一致を示す印８０ｃが、表示欄７４ｃに重ねて表示される。携帯電子機器１は、以上のようにして、ディスプレイに画面を表示させつつ、提示音を出力し、制御を行うことで、補正パラメータの調整を周波数域毎、各母音、各有声子音、各無声子音で行う。

次に、図１３を用いて携帯電子機器の補正パラメータ設定動作をより詳細に説明する。ここで、図１３は、携帯電子機器の動作の一例を示すフロー図である。なお、図１３に示す動作は、記憶部２４に記憶されたアプリケーションを実行することで処理してもよい。またプログラムは、外部からダウンロードして取得することができる。

まず、携帯電子機器１の処理部２２は、ステップＳ１２として、提示音（テスト音）を再生する。つまり、携帯電子機器１の処理部２２は、提示音生成部２２ｄにより提示音（テスト音）を生成し、音声処理部３０を介してレシーバ１６またはスピーカ１７から出力させる。なお、提示音としては、上述したように、各種聞き間違えが発生しやすい単語、文章を用いることが好ましい。また、携帯電子機器１は、提示音を、設定された不快閾値ぎりぎりの音（例えば、不快閾値よりわずかに小さい音）や設定された可聴閾値ぎりぎりの音（例えば、可聴閾値よりわずかに大きい音）で出力することが好ましい。

処理部２２は、ステップＳ１２で提示音を再生したら、ステップＳ１４として、入力画面を表示させる。つまり、上述した、図１０のように提示音がなんと聞こえたか、どんな単語や、文章が聞こえたかを入力する画面を表示させる。処理部２２は、ステップＳ１４で入力画面を表示させたら、ステップＳ１６として入力が完了したかを判定する。ここで、処理部２２は、必要な文字数が入力されたら、または、一定の時間が経過したら、入力が完了したと判定する。処理部２２は、ステップＳ１６で入力が完了していない（ステップＳ１６でＮｏ）と判定したら、ステップＳ１６に進む。つまり、処理部２２は、入力が完了するまで、ステップＳ１６の処理を繰り返す。なお、処理部２２は、ステップＳ１６の処理中に操作部１３が操作され文字が入力されたら、入力された文字を反映して制御を行う。

処理部２２は、ステップＳ１６で入力が完了した（ステップＳ１６でＹｅｓ）と判定したら、ステップＳ１８として、提示音と入力文字が一致しているかを判定する。処理部２２は、ステップＳ１８で、提示音と入力文字が一致する（ステップＳ１８でＹｅｓ）と判定したら、処理を終了する。また、処理部２２は、ステップＳ１８で、提示音と入力文字が一致しない（ステップＳ１８でＮｏ）と判定したら、ステップＳ２０として、補正パラメータを調整し、処理を終了する。

次に、図１４を用いて、ステップＳ２０での提示音と入力文字が一致しないことに基づいた、補正パラメータの調整の処理について説明する。ここで、図１４は、携帯電子機器の動作の一例を示すフロー図である。なお、図１４に示す動作も、記憶部２４に記憶されたアプリケーションを実行することで処理してもよい。またプログラムは、外部からダウンロードして取得することができる。

まず、処理部２２は、ステップＳ４０として、母音が不一致であるかを判定する。処理部２２は、ステップＳ４０で母音が不一致である（ステップＳ４０でＹｅｓ）と判定したら、ステップＳ４２として、母音の周波数域で対象の周波数を特定する。つまり、不一致の母音に対応する周波数の帯域、または１つ以上の周波数を特定する。処理部２２は、ステップＳ４２で周波数を特定したら、ステップＳ５０に進む。

また、ステップＳ４０で母音が不一致ではない（ステップＳ４０でＮｏ）、つまり、母音は全て一致していると判定したら、ステップＳ４４として、有声子音が不一致であるかを判定する。処理部２２は、ステップＳ４４で有声子音が不一致である（ステップＳ４４でＹｅｓ）と判定したら、ステップＳ４６として、有声子音の周波数域で対象の周波数を特定する。つまり、不一致の有声子音に対応する周波数の帯域、または１つ以上の周波数を特定する。処理部２２は、ステップＳ４６で周波数を特定したら、ステップＳ５０に進む。

また、処理部２２は、ステップＳ４４で有声子音が不一致ではない（ステップＳ４４でＮｏ）、つまり、不一致な音声は、無声子音であると判定したら、ステップＳ４８として、無声子音の周波数域で対象の周波数を特定する。つまり、不一致の無声子音に対応する周波数の帯域、または１つ以上の周波数を特定する。処理部２２は、ステップＳ４８で周波数を特定したら、ステップＳ５０に進む。

処理部２２は、ステップＳ４２、ステップＳ４６、ステップＳ４８の処理が終了したら、ステップＳ５０として、不一致音の出力は、不快閾値に近いかを判定する。つまり、処理部２２は、ステップＳ５０として、不一致音の出力の大きさが、不快閾値に近いか、可聴閾値に近いかを判定し、聞き間違いをした原因が、ユーザの不快閾値よりも大きい音声であるためか、可聴閾値よりも小さいためであるかを判定する。

処理部２２は、ステップＳ５０で、不一致音の出力は、不快閾値に近い（ステップＳ５０でＹｅｓ）、つまり、不一致音の出力は、可聴閾値よりも不快閾値に近いと判定したら、ステップＳ５２として、該当する周波数の不快閾値を低下させる。つまり調整対象の周波数の不快閾値をより小さい値とする。処理部２２は、ステップＳ５２の処理が終了したら、ステップＳ５６に進む。

処理部２２は、ステップＳ５０で、不一致音の出力は、不快閾値に近くない（ステップＳ５０でＮｏ）、つまり、不一致音の出力は、不快閾値よりも可聴閾値に近いと判定したら、ステップＳ５４として、該当する周波数の可聴閾値を上昇させる。つまり調整対象の周波数の可聴閾値をより大きな値とする。処理部２２は、ステップＳ５４の処理が終了したら、ステップＳ５６に進む。

処理部２２は、ステップＳ５２、ステップＳ５４の処理が終了したら、ステップＳ５６として、不一致音を全て補正したか、つまり不一致音に対する補正処理を完了したかを判定する。処理部２２は、ステップＳ５６で、不一致音を全て補正していない（ステップＳ５６でＮｏ）、つまり、補正処理を行っていない不一致音があると判定したら、ステップＳ４０に進み上記処理を繰り返す。これにより、処理部２２は、不一致と判定した全ての音に対して、閾値の補正処理を行う。また、処理部２２は、ステップＳ５６で、不一致音を全て補正した（ステップＳ５６でＹｅｓ）と判定したら、処理を終了する。

携帯電子機器１は、以上のようにして、周波数毎に補正パラメータを設定する。携帯電子機器１は、音声信号が入力されたら、出力音補正部３４が、設定した補正パラメータに基づいて、音声信号を補正し音声処理部３０に出力する。これにより、携帯電子機器１は、ユーザの聴こえ（音声の聞こえ方、聴覚の特性）に合わせて設定した補正パラメータによって音声信号を補正することができ、ユーザにより聞こえやすい音声を出力することができる。

さらに、処理部２２は、様々な単語、文章の提示音を用いて図１３、図１４に示すフローを繰り返し実行することで、補正パラメータをユーザに適した値に収束させ、ユーザにより聞こえやすい音声を出力することができる。

また、処理部２２は、図１３、図１４に示すフローを定期的（例えば、３ヶ月毎、６ヶ月毎等）に実行することで、ユーザの聴力に変化があった場合であっても、ユーザにより聞こえやすい音声を出力することができる。

また、処理部２２は、提示音として単語を用い、ユーザに聴こえた単語を入力させ、比較を行うことで、電話による通信や、テレビ放送の視聴時に実際に聞くことになる、言葉を用いて、補正処理を行うことができる。これにより、より適切に補正パラメータを調整することができ、電話による会話や、テレビ放送の視聴をより円滑に行うことができる。

また、処理部２２は、本実施形態のように、提示音を、母音と有声子音と無声子音とに別け解析を行い、それぞれに対応する周波数毎に補正パラメータを設定することで、より聴こえやすい音声を出力することができる。

また、聴こえた音声を文字として入力できるため、処理部２２は、確実、かつ間違えることなく、ユーザの入力を検出することができ、より高い精度で音声の補正を行うことができる。また、携帯電子機器１は、補正パラメータを調整しつつ、本実施形態のように、文字を入力させ、その結果、つまり、一致しているかの結果をディスプレイ２に表示させることで、ユーザに徐々に聴こえやすくなっていることを認知させることができる。これにより、ユーザに高い満足度かつ少ないストレスで、補正パラメータの設定を実施させることができる。また、ユーザにゲーム感覚で補正パラメータの設定を実施させることができる。

また、上記実施形態では、文字入力の入力欄を文字数に対応した数としたが、本発明はこれに限定されない。例えば、単にテキスト入力画面を表示させるようにしてもよい。

また、携帯電子機器１は、提示音の出力方法として種々の出力方法を用いることができる。例えば、予め設定してある音声を用いてもよいし、通話で使用した音声をサンプリングして用いてもよい。また、特定の通話相手に予め用意したテキスト情報を読み上げてもらい、そのテキスト情報と音声情報を取得し、ユーザが音声情報を聞きながら、聴こえた文字情報を入力するようにしても、補正パラメータを設定することができる。なお、提示音として、特定の対象の音声を用いることで、特定の対象の音声をより聞きやすくすることができ、特定の対象との通話をより円滑に行うことができる。

ここで、処理部２２は、音声処理部３０で実際に出力する周波数に対応して補正パラメータを設定することが好ましく、より好ましくは、電話通信で用いられる周波数に対応して補正パラメータを設定することが好ましい。このように、実際に使用する周波数に対して補正パラメータを設定することで、より携帯電子機器１から出力される音声をより聞きやすい音声にすることができる。ここで、補正パラメータを設定する周波数としては、例えば、ＣＥＬＰ（符号励振線形予測符号化）方式、ＥＶＲＣ（可変レート音声コーデック）方式、ＡＭＲ（適応型マルチレート）方式で用いられる周波数に対して設定することが好ましい。

なお、本実施形態では、補正パラメータの設定処理を、処理部２２で行ったが、本発明はこれに限定されない。携帯電子機器１は、各種演算処理を、送受信部２６を介して通信可能なサーバで実行してもよい。つまり、演算処理自体は、外部で行っても良い。この場合、携帯電子機器１は、サーバから送信された音声の出力、画像の表示等を行い、ユーザから入力された操作をデータとしてサーバに送信する。このように、サーバで演算を行ったり、補正パラメータを設定したりすることで、携帯電子機器にかかる負荷を少なくすることができる。また、通信を行うサーバで予め補正パラメータを設定し、サーバが補正パラメータに基づいて音声信号を補正するようにしてもよい。つまり、サーバと携帯電子機器とを１つのシステムとして、上述した処理を行うようにしてもよい。これにより、携帯電子機器１は、予め補正された音声信号を受け取ることができるため、補正処理自体を実行しないようにすることもできる。

以上のように、本発明に係る携帯電子機器は、音声を出力するものに有用である。

１携帯電子機器
１Ｃ筐体
２ディスプレイ
１３操作部
１３Ａ操作キー
１３Ｂ方向及び決定キー
２２処理部
２２ａ補正パラメータ設定部
２２ｂ音声解析部
２２ｃスペクトル分析部
２２ｄ提示音生成部
２４記憶部
３０音声処理部
３２表示部
３４出力音補正部

Claims

筐体と、
前記筐体に設けられて、画像を表示する画像表示部と、
前記筐体に設けられて、音声信号に基づいて音を発生する音発生部と、
前記筐体に設けられて、入力を受け付ける入力部と、
前記音発生部により音を発生させ、発生させた音に対する応答を前記入力部により受け付けたら、前記応答に基づいて、補正パラメータを設定する処理部と、
音声周波数毎に音の大きさを調整する補正パラメータに基づいて、音声信号を補正し、補正した音声信号を前記音発生部に供給する補正部と、を備え、
前記処理部は、前記音発生部から出力された出力音声と、前記入力部から入力された入力文字とを比較し、出力音声と入力文字とで一致しない音に対応する周波数毎の補正パラメータを設定することを特徴とする携帯電子機器。
前記処理部は、音声を、母音、有声子音、無声子音に分けて、判定することを特徴とする請求項１に記載の携帯電子機器。
前記処理部が前記音発生部に発生させる音は、提示音であり、
前記提示音は、単語を構成する母音の配列が共通した他の単語が存在する単語の中から選択された単語の音声であることを特徴とする請求項１または請求項２に記載の携帯電子機器。