[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3327936B2 - 話速制御型補聴装置 - Google Patents

話速制御型補聴装置

Info

Publication number
JP3327936B2
JP3327936B2 JP24596091A JP24596091A JP3327936B2 JP 3327936 B2 JP3327936 B2 JP 3327936B2 JP 24596091 A JP24596091 A JP 24596091A JP 24596091 A JP24596091 A JP 24596091A JP 3327936 B2 JP3327936 B2 JP 3327936B2
Authority
JP
Japan
Prior art keywords
section
module
speech
pitch
voiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP24596091A
Other languages
English (en)
Other versions
JPH0580796A (ja
Inventor
章 中村
信正 清山
徹 都木
栄一 宮坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP24596091A priority Critical patent/JP3327936B2/ja
Priority to US07/950,411 priority patent/US5305420A/en
Priority to DK96119237T priority patent/DK0766229T3/da
Priority to EP96119237A priority patent/EP0766229B1/en
Priority to DK92116292T priority patent/DK0534410T3/da
Priority to EP92116292A priority patent/EP0534410B1/en
Publication of JPH0580796A publication Critical patent/JPH0580796A/ja
Application granted granted Critical
Publication of JP3327936B2 publication Critical patent/JP3327936B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Analogue/Digital Conversion (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、例えばテレビ、ラジ
オテープレコーダ、補聴器などの音響機器や医療機器な
どにおいて、発話者の音声を加工して、ほぼリアルタイ
ムで受聴者の受聴能力に音声スピードをフィットさせ、
補聴を行なう話速制御型補聴装置に関する。
【0002】[発明の概要]この発明は、加齢ないしは
何らかの障害などによって低下する音声識別臨界速度
(音声を正確に識別できる最大の話速)などの受聴能力
を補うための話速制御型補聴方法および装置に関し、発
話者の個人性、音韻性を保持したまま、受聴者自身の操
作によって高品質に話速を変換し、受聴者にとって最適
な音声了解度を得るものである。
【0003】
【従来の技術】一般に、受聴者が加齢ないしは何らかの
障害などによって音声識別臨界速度(音声を正確に識別
できる最大の話速)などの受聴能力が低下すると、通常
の速さの音声や早口で話される音声の識別度が大幅に低
下するようになる。
【0004】
【発明が解決しようとする課題】ところが、従来、この
ような聴力障害を持つ人のための補聴手段としては補聴
器しか知られておらず、補聴器は、単に周波数特性の改
善、利得制御などによって聴覚系の外耳、中耳の伝達特
性のみを補償するものであるために、主として聴覚中枢
の劣化が関与する音声の識別能力の低下を補償すること
は不可能であった。
【0005】この発明の目的は、発話速度を受聴者の受
聴能力に最適になるように高品質のものにほぼリアルタ
イムで変換することにより、主として聴覚中枢に起因す
る聴覚の劣化を補償することができる話速制御型補聴装
置を提供することにある。
【0006】
【課題を解決するための手段】この発明の話速制御型補
聴装置は、以下の(1)から(10)に示す各モジュー
ルを並列演算用ICから成るトランスピュータモジュー
ルで構成したことを特徴としている。すなわち、(1)
入力音声信号をA/D変換して時系列音声データを生成
するするA/D変換モジュールと、(2)A/D変換さ
れた時系列音声データを取り込んでフレーム単位で処理
するためのバッファリングを行なう入力バッファモジュ
ールと、(3)この入力バッファモジュールを介して取
り込まれる時系列音声データに対して平均パワー、零交
差数、および自己相関係数を算出し、これらのしきい値
により無音フレーム、無声フレームおよび有声フレーム
を決定する区間分割処理を実行する第1分析モジュー
ル、と、(4)区間分割された時系列音声データに対し
て高速化のためのデシメーションを行なう第2分析モジ
ュールと、(5)デシメーションが施された時系列音声
データの自己相関係数を求め、フレーム毎に音声のピッ
チ周波数を求める第3分析モジュールと、(6)求めら
れたピッチ周波数の軌跡の平滑化を行なってピッチの開
始点およびピッチ数を決定し、ピッチ区間長延長・繰り
返し処理を行なう第4分析モジュールと、(7)決定さ
れたピッチの開始点およびピッチ数に基づいて、無音区
間、無声区間、有声区間の各ピッチ区間を決定する第5
分析モジュールと、(8)前記第5分析モジュールによ
って得られた無音区間、無声区間、有声区間および話速
度パラメータ設定手段から得られる無音区間ならびに有
声区間の延長比率に適合するように話速を変換して音声
合成を行なう合成モジュールと、(9)合成モジュール
の音声合成出力の連続性を保持するためのバッファリン
グを行なう出力バッファモジュールと、(10)出力バ
ッファモジュールの出力をD/A変換して話速が制御さ
れた音声信号として出力するD/A変換モジュールとを
トランスピュータモジュールで構成したものである。
【0007】
【0008】
【作用】この発明の話速制御型補聴装置によれば、先
ず、A/D変換モジュールにより入力音声信号がA/D
変換されて時系列音声データが生成される。バッファモ
ジュールでは、A/D変換された時系列音声データが取
り込まれてフレーム単位で処理するためのバッファリン
グが行なわれる。第1分析モジュールでは、入力バッフ
ァモジュールを介して取り込まれる時系列音声データに
対して平均パワー、零交差数、および自己相関係数が算
出され、これらのしきい値により無音フレーム、無声フ
レームおよび有声フレームを決定する区間分割処理が実
行される。第2分析モジュールでは、区間分割された時
系列音声データに対して高速化のためのデシメーション
が行なわれる。第3分析モジュールでは、デシメーショ
ンが施された時系列音声データの自己相関係数を求め、
フレーム毎に音声のピッチ周波数が求められる。第4分
析モジュールでは、求められたピッチ周波数の軌跡の平
滑化を行なってピッチの開始点およびピッチ数が決定さ
れ、ピッチ区間長延長・繰り返し処理が行なわれる。第
5分析モジュールでは、決定されたピッチの開始点およ
びピッチ数に基づいて、無音区間、無声区間、有声区間
の各ピッチ区間が決定される。合成モジュールでは、第
5分析モジュールによって得られた無音区間、無声区
間、有声区間および、話速度パラメータ設定モジュール
から得られる無音区間ならびに有声区間の延長比率に適
合するように話速を変換して音声合成が行なわれる。出
力バッファモジュールでは、合成モジュールの音声合成
出力における音声伸長による延長部分を吸収し、連続性
を保持するためのバッファリングが行なわれる。この出
力バッファモジュールの出力がD/A変換モジュールに
よってD/A変換されて話速が制御された音声信号とし
て出力される。
【0009】
【0010】
【0011】
【0012】
【0013】
【実施例】以下、この発明の実施例を図に基づいて詳説
する。
【0014】図1は話速制御型補聴装置の機能ブロック
図である。この装置は、区間分割部1、無音区間延長処
理部2、ピッチ周期抽出部3、ピッチ区間分割処理部
4、ピッチ区間長延長・繰り返し処理部5、話速設定部
6および合成部7から構成されている。
【0015】区間分割処理部1は、入力音声を無音区
間、無声区間および有声区間に分割する区間分割処理を
施す部分である。
【0016】無音区間延長処理部2は、この区間分割処
理部1によって分割された無音区間に対して、話速設定
部6があらかじめ定めた比率によって延長させる部分で
ある。
【0017】ピッチ周期抽出処理部3は、区間分割処理
部1によって分割された有声区間に対してピッチ周期を
抽出する部分であり、ピッチ区間分割処理部4は、ピッ
チ周期抽出処理部3が抽出した各ピッチ区間ごとに有声
区間を分割する部分であり、ピッチ区間長延長・繰り返
し部5は、ピッチ区間分割処理部が分割した各ピッチ区
間長を話速設定部6があらかじめ定めた比率によって延
長させる部分である。
【0018】話速設定部6は、発話者の話す速さと受聴
者の受聴能力に応じて無音区間の延長比率および有声区
間のピッチ区間の延長比率の設定を行なう部分である。
【0019】そして合成部7は、延長処理の施された無
音区間、何も処理の施されていない無区間、およびピ
ッチ区間の延長処理の施された有声区間を入力音声と同
じ順序で再合成し、音声として出力する部分である。
【0020】次に、上記構成の話速制御型補聴装置の動
作について説明する。
【0021】入力音声に対して、まず区間分割処理部1
において無音区間i、無声区間ii、有声区間iii に分割
する。
【0022】そして無音区間延長処理部2において、無
音区間iに対して話速設定部6が定める所定の比率で延
長処理を施し、話しの間の制御を行なう。
【0023】また、有声区間iii に対して、まずピッチ
周期抽出処理部3によって有声区間iii のピッチ周期を
抽出し、続いて、ピッチ区間分割処理部4によってピッ
チ周期抽出処理部3で抽出されたピッチ周期にしたがっ
てピッチ区間を分割する。さらに、ピッチ区間長延長・
繰り返し処理部5によってピッチ区間分割処理部4で分
割されたピッチ区間を話速設定部6であらかじめ定めた
数だけ繰り返して有声区間iii の延長を行なう。
【0024】なお、発話者の個人性および音韻性を維持
するために無声区間iiについては、何ら加工を行なわな
い。
【0025】このようにして各部で処理が行なわれた無
音区間i、無声区間iiおよび有声区間iii に対して、合
成部7において入力音声と同じ順序で再合成し、音声と
して出力する。こうして、出力される音声は、話速が受
聴者の受聴能力に応じて変換されたものとなる。
【0026】次にこの発明の実施例である話速制御型補
聴装置について図2を用いて説明する。
【0027】通常、図1に示した話速制御型補聴装置は
大型コンピュータ上で実現されるが、この場合には、大
量の演算を要するために信号処理に長時間を必要とし、
リアルタイム性に欠ける他、可搬性、操作性にも欠け
る。このため、入力音声の継続時間は必然的にメモリ容
量に依存し、有限長で打ち切らざるを得ない。
【0028】そこで、この実施例は、複数個の超小型ト
ランスピュータモジュール(並列演算用IC)を縦続接
続し、各モジュールに信号処理アルゴリズムを最適配分
して高速化を実現することにより、処理時間の大幅な短
縮を行ない、リアルタイム性を実現するものである。し
たがって、これによって入力音声が無制限に継続した場
合でも処理可能となるばかりでなく、小型軽量で可搬性
にも優れたものとなる。また、使用者自らが、簡単な手
動操作によって話速変換に必要なパラメータ(無音区間
iおよび有声区間iii の延長比率)を可変でき、使用者
にとっての最適値を設定できるので、操作性にも優れた
ものとすることができる。
【0029】図2に示すブロック図において、各々のブ
ロックはトランスピュータモジュール(TRPM)1個
分に相当し、個々のアルゴリズムがそれぞれのモジュー
ル上で縦続的に高速演算処理を分担している。
【0030】この実施例の話速制御型補聴装置は、A/
D変換モジュール11、入力バッファモジュール12、
第1〜第5分析モジュール13〜17、ロータリエンコ
ーダ18、合成モジュール19、出力バッファモジュー
ル20およびD/A変換モジュール21から構成されて
いる。
【0031】A/D変換モジュール11は、入力音声信
号を16ビット量子化、48kHzサンプリングでA/
D変換する。
【0032】入力バッファモジュール12は、A/D変
換された時系列音声データを逐次取り込み、フレーム単
位で処理するためにバッファリングを行なう。
【0033】区間分割処理を担当する第1分析モジュー
ル13は、平均パワー、零交差数、および自己相関係数
を算出し、これらのしきい値により無音、無声、および
有声音フレームi,ii,iiiを決定する。
【0034】第2分析モジュール14は、高速化のため
にデシメーションを行なう。
【0035】ピッチ周期抽出処理を担当する第3分析モ
ジュール15は、デシメーションを施した時系列音声デ
ータの自己相関係数を求め、これを用い、フレームごと
に音声のピッチ周波数を算出する。
【0036】ピッチ区間長延長・繰り返し処理を担当す
る第4分析モジュール16は、ピッチ周波数軌跡の平滑
化を行ない、ピッチの開始点およびピッチ数を決定す
る。
【0037】第5分析モジュール17は、各ブロックで
求めたパラメータの最終的な誤り訂正などの微調整を行
い、無音区間i、無声区間ii、有声区間iii と各ピッチ
区間を決定する。
【0038】ロータリエンコーダ18は、手動操作によ
り与えられる話速変換に必要なパラメータ(無音区間お
よび有声区間の延長比率)を角度情報として8ビット量
子化する。
【0039】合成処理を担当する合成モジュール19
は、第5分析モジュール17から得られた無音区間i、
無声区間ii、有声区間iii 、およびロータリエンコーダ
18から得られた無音、有声区間の延長比率に合うよう
に話速を変換して音声合成を行なう。
【0040】出力バッファモジュール20は、合成した
音声が伸張しているため、この延長部分を吸収するため
にバッファリングを行なう。
【0041】D/A変換モジュール21は、合成した音
声をD/A変換し、音声信号として出力する。
【0042】こうして、この実施例の話速制御型補聴装
置によれば、入力音声を無音区間、無声区間および有声
区間に分割する区間分割処理を施し、無音区間に対して
はあらかじめ定められた比率によって延長させ、無声区
間に対しては何ら加工を施さず、さらに有声区間に対し
てピッチ周期を抽出し、ピッチ区間ごとに分割し、各ピ
ッチ区間長をあらかじめ定められた比率によって延長さ
せ、これら延長処理の施された無音区間、何も処理の施
されていない無声区間、およびピッチ区間の延長処理の
施された有声区間を入力音声と同じ順序で再合成し、受
聴者の受聴能力に応じた話速にほぼリアルタイムで変換
して出力することができるのである。
【0043】
【発明の効果】以上のようにこの発明によれば、発話者
の個人性、および音韻性を保持したまま高品質に話速を
変換する処理を施し、受聴者自身の操作によって受聴者
の受聴能力に話速をフィットさせ、受聴者にとって最適
な話速にほぼリアルタイムに変換することができるの
で、加齢ないしは何らかの障害などによって音声識別臨
界速度が低下している受聴者の受聴能力を補い、最適な
速度でリアルタイムで受聴させることができる。
【図面の簡単な説明】
【図1】話速制御型補聴装置の機能ブロック図である。
【図2】この発明の実施例である話速制御型補聴装置の
機能ブロック図である。
【符号の説明】
1 区間分割処理部 2 無音区間延長処理部 3 ピッチ周期抽出処理部 4 ピッチ区間分割処理部 5 ピッチ区間長延長・繰り返し処理部 6 話速設定部 7 合成部 11 A/D変換モジュール 12 入力バッファモジュール 13 第1分析モジュール 14 第2分析モジュール 15 第3分析モジュール 16 第4分析モジュール 17 第5分析モジュール 18 ロータリエンコーダ 19 合成モジュール 20 出力バッファモジュール 21 D/A変換モジュール
───────────────────────────────────────────────────── フロントページの続き (72)発明者 宮坂 栄一 東京都世田谷区砧一丁目10番11号 日本 放送協会放送技術研究所内 (56)参考文献 特開 平1−93795(JP,A) 特開 昭59−82608(JP,A) 特開 昭64−44995(JP,A) 特開 平5−73089(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 21/04 A61F 11/00 H03M 1/00 H04R 25/00

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 以下の(1)から(10)に示す各モジ
    ュールを並列演算用ICから成るトランスピュータモジ
    ュールで構成したことを特徴とする話速制御型補聴装
    置。 (1)入力音声信号をA/D変換して時系列音声データ
    を生成するするA/D変換モジュール、 (2)A/D変換された時系列音声データを取り込んで
    フレーム単位で処理するためのバッファリングを行なう
    入力バッファモジュール、 (3)この入力バッファモジュールを介して取り込まれ
    る時系列音声データに対して平均パワー、零交差数、お
    よび自己相関係数を算出し、これらのしきい値により無
    音フレーム、無声フレームおよび有声フレームを決定す
    る区間分割処理を実行する第1分析モジュール、 (4)区間分割された時系列音声データに対して高速化
    のためのデシメーションを行なう第2分析モジュール、 (5)デシメーションが施された時系列音声データの自
    己相関係数を求め、フレーム毎に音声のピッチ周波数を
    求める第3分析モジュール、 (6)求められたピッチ周波数の軌跡の平滑化を行なっ
    てピッチの開始点およびピッチ数を決定し、ピッチ区間
    長延長・繰り返し処理を行なう第4分析モジュール、 (7)決定されたピッチの開始点およびピッチ数に基づ
    いて、無音区間、無声区間、有声区間の各ピッチ区間を
    決定する第5分析モジュール、 (8)前記第5分析モジュールによって得られた無音区
    間、無声区間、有声区間および話速度パラメータ設定手
    段から得られる無音区間ならびに有声区間の延長比率に
    適合するように話速を変換して音声合成を行なう合成モ
    ジュール、 (9)合成モジュールの音声合成出力における連続性を
    保持するためのバッファリングを行なう出力バッファモ
    ジュール、 (10)出力バッファモジュールの出力をD/A変換し
    て話速が制御された音声信号として出力するD/A変換
    モジュール。
JP24596091A 1991-09-25 1991-09-25 話速制御型補聴装置 Expired - Lifetime JP3327936B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP24596091A JP3327936B2 (ja) 1991-09-25 1991-09-25 話速制御型補聴装置
US07/950,411 US5305420A (en) 1991-09-25 1992-09-22 Method and apparatus for hearing assistance with speech speed control function
DK96119237T DK0766229T3 (da) 1991-09-25 1992-09-23 Fremgangsmåde og apparat til hørehjælp med talehastighedsstyrefunktion
EP96119237A EP0766229B1 (en) 1991-09-25 1992-09-23 Method and apparatus for hearing assistance with speech speed control function
DK92116292T DK0534410T3 (da) 1991-09-25 1992-09-23 Fremgangsmåde og apparat til hørehjælp med talehastighedsstyrefunktion
EP92116292A EP0534410B1 (en) 1991-09-25 1992-09-23 Method and apparatus for hearing assistance with speech speed control function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24596091A JP3327936B2 (ja) 1991-09-25 1991-09-25 話速制御型補聴装置

Publications (2)

Publication Number Publication Date
JPH0580796A JPH0580796A (ja) 1993-04-02
JP3327936B2 true JP3327936B2 (ja) 2002-09-24

Family

ID=17141409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24596091A Expired - Lifetime JP3327936B2 (ja) 1991-09-25 1991-09-25 話速制御型補聴装置

Country Status (1)

Country Link
JP (1) JP3327936B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1736967A2 (en) 2005-06-22 2006-12-27 Fujitsu Limited Speech speed converting device and speech speed converting method

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5825853A (en) * 1995-09-07 1998-10-20 Hitachi, Ltd. Communication device
JP3439307B2 (ja) * 1996-09-17 2003-08-25 Necエレクトロニクス株式会社 発声速度変換装置
US6879860B2 (en) * 2003-03-11 2005-04-12 Gregory Howard Wakefield Cochlear implant MAP optimization with use of a genetic algorithm
WO2007086365A1 (ja) * 2006-01-24 2007-08-02 Matsushita Electric Industrial Co., Ltd. 変換装置
JP6244658B2 (ja) 2013-05-23 2017-12-13 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1736967A2 (en) 2005-06-22 2006-12-27 Fujitsu Limited Speech speed converting device and speech speed converting method

Also Published As

Publication number Publication date
JPH0580796A (ja) 1993-04-02

Similar Documents

Publication Publication Date Title
JP2955247B2 (ja) 話速変換方法およびその装置
JP4219898B2 (ja) 音声強調装置
EP0766229B1 (en) Method and apparatus for hearing assistance with speech speed control function
US6484137B1 (en) Audio reproducing apparatus
US8311842B2 (en) Method and apparatus for expanding bandwidth of voice signal
WO1998049673A1 (fr) Procede et dispositif destines a detecter des parties vocales, procede de conversion du debit de parole et dispositif utilisant ce procede et ce dispositif
JP6073456B2 (ja) 音声強調装置
JP3327936B2 (ja) 話速制御型補聴装置
JP2000152394A (ja) 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置
JP3220043B2 (ja) 話速変換方法およびその装置
JP2002261553A (ja) 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
JP3961616B2 (ja) 話速変換方法および話速変換機能付補聴器
JP3432443B2 (ja) 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP3266124B2 (ja) アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置
JP3219892B2 (ja) リアルタイム話速変換装置
JP3185363B2 (ja) 補聴器
JP2905112B2 (ja) 環境音分析装置
JPH07210192A (ja) 出力データ制御方法及び装置
JPH07281691A (ja) 話速変換方法
JP3457393B2 (ja) 話速変換方法
JP2002297200A (ja) 話速変換装置
JPH0417520B2 (ja)
JPH10224898A (ja) 補聴器
JP4644879B2 (ja) 調音パラメータ補間用データ生成装置及びコンピュータプログラム
JP2000352991A (ja) スペクトル補正機能つき音声合成器

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090712

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100712

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110712

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120712

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120712

Year of fee payment: 10