JP2007065285A - 音声信号処理方法、装置及びプログラム - Google Patents
音声信号処理方法、装置及びプログラム Download PDFInfo
- Publication number
- JP2007065285A JP2007065285A JP2005251233A JP2005251233A JP2007065285A JP 2007065285 A JP2007065285 A JP 2007065285A JP 2005251233 A JP2005251233 A JP 2005251233A JP 2005251233 A JP2005251233 A JP 2005251233A JP 2007065285 A JP2007065285 A JP 2007065285A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- unit
- stationary part
- time
- signal processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】入力される音声信号に対してスピーカから音声が出力される前に処理を施す音声信号処理装置であって、入力端子11からの音声信号の母音部などの定常部を検出する定常部検出部12と、検出した定常部内に零系列を挿入する零系列を挿入して出力端子16へ出力する零系列挿入部13を有する。
【選択図】 図2
Description
T. Arai, K. Kinoshita, N. Hodoshima, A. Kusumoto and T. Kitamura, "Effects of suppressing steady-state portions of speech on intelligibility in reverberant environments," Proc. Autumn Meet. Acoust. Soc. Jpn., pp. 449-450 (2001). T. Arai, K. Kinoshita, N. Hodoshima, A. Kusumoto and T. Kitamura, "Effects of suppressing steady-state portions of speech on intelligibility in reverberant environments," Acoust. Sci. & Tech., 23, 229-232 (2002). N. Hodoshima, T. Goto, N. Ohata, T. Inoue and T. Arai, "The effect of pre-processing approach for improving speech intelligibility in a hall: Comparison between diotic and dichotic listening conditions," Acoust. Sci. & Tech., 26, 212-214 (2005).
図2は、本発明の第1の実施形態に係る音声信号処理装置を示している。入力端子11からのディジタル化された音声信号は、定常部検出部12と零系列挿入部13に入力される。定常部検出部12は、入力される音声信号の母音部などに存在する定常部(音声の音節の中心部の核など)を検出し、例えば定常部で“1”、非定常部で“0”となるような定常部検出信号を発生する。零系列挿入部13は、定常部検出部12からの定常部検出信号を受け、入力される音声信号の定常部内に零系列を挿入する処理を行う。こうして定常部内に零系列が挿入された後の音声信号は、出力端子16から出力される。
図3は、本発明の第2の実施形態に係る音声信号処理装置を示しており、図2に対して母音長測定部14と零系列長設定部15が追加されている。母音長測定部14は入力される音声信号から母音部を抽出して母音部の時間的な長さ(以下、母音長という)Tvを測定する。零系列長設定部15は、零系列挿入部13で挿入される零系列の長さ(以下、零系列長という)Tzを母音長測定部14により測定された母音長Tvに応じて、例えば母音長Tvに比例するように設定する。なお、定常部検出部12により定常部の長さTs(以下、定常部長という)を求め、零系列長Tzを定常部長Tsに応じて、例えば定常部長Tsに比例するように設定してもよい。
次に、図2または図3における定常部検出部12について説明する。図4及び図5は、定常部検出部の具体例を示している。
まず、図4に示す定常部検出部について説明すると、入力端子20にはディジタル化された音声信号が入力される。入力された音声信号は、まず例えば1/3オクターブ帯域の複数(N)個の帯域通過フィルタ(BPF)21−1〜21−Nからなるフィルタバンクによって、N個の帯域に分割される。分割されたN個の各帯域の音声信号は時間包絡抽出部22−1〜22−Nに入力され、時間包絡が抽出される。抽出された時間包絡は、低域通過フィルタ(LPF)23−1〜23−Nにより平滑化され、さらにこの後の処理を容易にするためダウンサンプラ24−1〜24−Nによって1/Mにダウンサンプリングされる。ダウンサンプリング比は、例えばM=160に設定される。
(1)帯域通過フィルタ21−1〜21−Nからなるフィルタバンクを省略し、これに伴い時間包絡抽出部、低域通過フィルタ、ダウンサンプラ、対数計算部及び回帰係数計算部についてはそれぞれ1個とする。すなわち、フィルタバンクによる帯域分割を行わず、全帯域について時間包絡抽出から回帰係数計算までの処理を行う。
(2)フィルタバンクによる帯域分割を行うが、時間包絡抽出部、低域通過フィルタ、ダウンサンプラ、対数計算部及び回帰係数計算部についてはそれぞれ1個とする。
(3)上記(2)の変形で、時間包絡抽出部については各帯域毎に設ける。
(4)上記(2)の変形で、回帰係数計算部については各帯域毎に設ける。
(5)図4では回帰係数の2乗平均を求めたが、これに限られるものではなく、他の方法で回帰係数を平均してもよい。
図9は、本発明の第3の実施形態に係る音声信号処理装置であり、入力端子41に入力される音声信号は、時間軸伸長部42によって時間軸が伸長された後、定常部検出部43と乗算器45の一方の入力端子に入力される。定常部検出部43は、例えば図4あるいは図5に示した通りである。図4または図5の出力端子30から出力される定常部検出信号は、定常部抑圧関数計算部44に入力される。定常部抑圧関数計算部44では、例えば定常部抑圧検出信号の“1”(定常部)に対応してα(0≦α<1)をとり、定常部抑圧検出信号の“0”(非定常部)に対応して1をとるような二値信号からなる関数(定常部抑圧関数という)の信号を発生する。なお、図9中に示した例ではα=0.4としているが、0≦α<1の値であれば何でもよい。この定常部抑圧関数の信号は、乗算器45の他方の入力端子に入力される。乗算器45では、時間軸伸長部42から出力される音声信号に定常部抑圧関数の信号を乗じることにより、定常部の振幅を抑圧した音声信号を出力端子46へ出力する。
12・・・定常部検出部
13・・・零系列挿入部
14・・・母音長測定部
15・・・零系列長設定部
16・・・音声信号出力端子
20・・・音声信号入力端子
21−1〜21−N・・・帯域通過フィルタ
22−1〜22−N・・・時間包絡抽出部
23−1〜23−N・・・低域通過フィルタ
24−1〜24−N・・・ダウンサンプラ
25−1〜25−N・・・対数計算部
26−1〜26−N・・・回帰係数計算部
27・・・2乗平均計算部
28・・・アップサンプラ
29・・・閾値処理部
30・・・定常部検出信号出力端子
31・・・窓掛け処理部
32・・・高速フーリエ変換部
33・・・対数スペクトル計算部
34・・・逆高速フーリエ変換部
35−1〜35−N・・・回帰係数計算部
36・・・2乗平均計算部
37・・・閾値処理部
41・・・音声信号入力端子
42・・・時間軸伸長部
43・・・定常部検出部
44・・・定常部抑圧関数計算部
45・・・乗算器
46・・・音声信号出力端子
Claims (11)
- 入力される音声信号に対してスピーカから音声が出力される前に処理を施す音声信号処理方法において、
前記音声信号の定常部を検出するステップと、
検出された定常部内に零系列を挿入するステップとを具備することを特徴とする音声信号処理方法。 - 入力される音声信号に対してスピーカから音声が出力される前に処理を施す音声信号処理装置において、
前記音声信号の定常部を検出する定常部検出部と、
検出された定常部内に零系列を挿入する零系列挿入部とを具備することを特徴とする音声信号処理装置。 - 前記音声信号の母音部の時間長を測定する母音長測定部と、
測定された母音部の時間長に応じて前記零系列の時間長を設定する母音長設定部とをさらに具備することを特徴とする請求項2記載の音声信号処理装置。 - 入力される音声信号に対してスピーカから音声が出力される前に処理を施す音声信号処理方法において、
前記音声信号の時間軸を伸長するステップと、
時間軸伸長後の音声信号の定常部を検出するステップと、
検出された定常部の振幅を抑圧するステップとを具備することを特徴とする音声信号処理方法。 - 入力される音声信号に対してスピーカから音声が出力される前に処理を施す音声信号処理装置において、
前記音声信号の時間軸を伸長する時間軸伸長部と、
時間軸伸長後の音声信号の定常部を検出する定常部検出部と、
検出された定常部の振幅を抑圧する定常部抑圧部とを具備することを特徴とする音声信号処理装置。 - 前記定常部検出部は、前記入力される音声信号から時間包絡を抽出する時間包絡抽出部と、前記時間包絡の対数の各時間サンプルについて当該時間サンプルを含む前後複数の時間サンプルの値から回帰係数を計算する回帰係数計算部と、前記回帰係数の平均を計算する平均計算部と、前記平均について閾値処理を行うことにより前記定常部を求める閾値処理部とを有することを特徴とする請求項2または5のいずれか1項記載の音声信号処理装置。
- 前記定常部検出部は、前記入力される音声信号から時間包絡を抽出する時間包絡抽出部と、前記時間包絡を平滑化する平滑フィルタと、平滑化された時間包絡をダウンサンプリングするダウンサンプラと、ダウンサンプリングされた時間包絡の対数を計算する対数計算部と、前記対数の各時間サンプルについて当該時間サンプルを含む前後複数の時間サンプルの値から回帰係数を計算する回帰係数計算部と、前記回帰係数の平均を計算する平均計算部と、前記平均をアップサンプリングするアップサンプラと、アップサンプリングされた平均について閾値処理を行うことにより前記定常部を求める閾値処理部とを有することを特徴とする請求項2または5のいずれか1項記載の音声信号処理装置。
- 前記定常部検出部は、前記入力される音声信号を複数の帯域に分割するフィルタバンクをさらに含み、前記時間包絡抽出部は分割された各帯域の音声信号から時間包絡を抽出する請求項6または7のいずれか1項記載の音声信号処理装置。
- 前記定常部検出部は、前記入力される音声信号に対して窓掛け処理を行って該音声信号を複数のフレームに分割する窓掛け処理部と、分割された各フレームの音声信号にフーリエ変換を施すフーリエ変換部と、前記フーリエ変換部からの出力信号に基づき対数スペクトルを計算する対数スペクトル計算部と、前記対数スペクトルに対して逆フーリエ変換を施すことによりケプストラム係数を生成するケプストラム係数計算部と、前記ケプストラム係数を時間方向に見た場合の回帰係数を計算する回帰係数計算部と、前記回帰係数の平均を計算する平均計算部と、前記平均について閾値処理を行うことにより前記音声信号の定常部を求める閾値処理部とを有することを特徴とする請求項2または5のいずれか1項記載の音声信号処理装置。
- 入力された音声信号に対してスピーカから音声が出力される前に施すべき音声信号処理をコンピュータに行わせるプログラムであって、
前記音声信号の定常部を検出する処理と、検出された定常部内に零系列を挿入する処理とを含む音声信号処理をコンピュータに行わせる音声信号処理プログラム。 - 入力された音声信号に対してスピーカから音声が出力される前に施すべき音声信号処理をコンピュータに行わせるプログラムであって、
前記音声信号の時間軸を伸長する処理と、時間軸伸長後の音声信号の定常部を検出する処理と、検出された定常部の振幅を抑圧する処理とを含む音声信号処理をコンピュータに行わせる音声信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005251233A JP4774255B2 (ja) | 2005-08-31 | 2005-08-31 | 音声信号処理方法、装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005251233A JP4774255B2 (ja) | 2005-08-31 | 2005-08-31 | 音声信号処理方法、装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007065285A true JP2007065285A (ja) | 2007-03-15 |
JP4774255B2 JP4774255B2 (ja) | 2011-09-14 |
Family
ID=37927568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005251233A Active JP4774255B2 (ja) | 2005-08-31 | 2005-08-31 | 音声信号処理方法、装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4774255B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011082708A (ja) * | 2009-10-05 | 2011-04-21 | Panasonic Electric Works Co Ltd | パケット挿入削除方法及び通話システム |
JP2012242468A (ja) * | 2011-05-17 | 2012-12-10 | Nippon Telegr & Teleph Corp <Ntt> | 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム |
JP2013186428A (ja) * | 2012-03-09 | 2013-09-19 | Chiba Inst Of Technology | 音声合成装置 |
JP2017187746A (ja) * | 2016-04-04 | 2017-10-12 | 株式会社東芝 | 音声処理システムおよび音声処理方法 |
JP2017223930A (ja) * | 2016-06-17 | 2017-12-21 | 株式会社東芝 | 音声処理システムおよび音声処理方法 |
CN114299977A (zh) * | 2021-11-30 | 2022-04-08 | 北京百度网讯科技有限公司 | 混响语音的处理方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5879400A (ja) * | 1981-11-06 | 1983-05-13 | Gen Eng:Kk | 補聴器 |
JPH1097267A (ja) * | 1996-09-24 | 1998-04-14 | Hitachi Ltd | 声質変換方法および装置 |
JP2005202335A (ja) * | 2004-01-19 | 2005-07-28 | Takayuki Arai | 音声処理方法と装置及びプログラム |
-
2005
- 2005-08-31 JP JP2005251233A patent/JP4774255B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5879400A (ja) * | 1981-11-06 | 1983-05-13 | Gen Eng:Kk | 補聴器 |
JPH1097267A (ja) * | 1996-09-24 | 1998-04-14 | Hitachi Ltd | 声質変換方法および装置 |
JP2005202335A (ja) * | 2004-01-19 | 2005-07-28 | Takayuki Arai | 音声処理方法と装置及びプログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011082708A (ja) * | 2009-10-05 | 2011-04-21 | Panasonic Electric Works Co Ltd | パケット挿入削除方法及び通話システム |
JP2012242468A (ja) * | 2011-05-17 | 2012-12-10 | Nippon Telegr & Teleph Corp <Ntt> | 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム |
JP2013186428A (ja) * | 2012-03-09 | 2013-09-19 | Chiba Inst Of Technology | 音声合成装置 |
JP2017187746A (ja) * | 2016-04-04 | 2017-10-12 | 株式会社東芝 | 音声処理システムおよび音声処理方法 |
JP2017223930A (ja) * | 2016-06-17 | 2017-12-21 | 株式会社東芝 | 音声処理システムおよび音声処理方法 |
CN114299977A (zh) * | 2021-11-30 | 2022-04-08 | 北京百度网讯科技有限公司 | 混响语音的处理方法、装置、电子设备及存储介质 |
CN114299977B (zh) * | 2021-11-30 | 2022-11-25 | 北京百度网讯科技有限公司 | 混响语音的处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4774255B2 (ja) | 2011-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8611554B2 (en) | Hearing assistance apparatus | |
EP2064699B1 (en) | Method and apparatus for extracting and changing the reverberant content of an input signal | |
Moore | Temporal integration and context effects in hearing | |
Stone et al. | Quantifying the effects of fast-acting compression on the envelope of speech | |
Yoo et al. | Speech signal modification to increase intelligibility in noisy environments | |
US10176824B2 (en) | Method and system for consonant-vowel ratio modification for improving speech perception | |
EP2984857B1 (en) | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio | |
JP6177480B1 (ja) | 音声強調装置、音声強調方法、及び音声処理プログラム | |
Kusumoto et al. | Modulation enhancement of speech by a pre-processing algorithm for improving intelligibility in reverberant environments | |
Kim et al. | Nonlinear enhancement of onset for robust speech recognition. | |
JP2010091897A (ja) | 音声信号強調装置 | |
Tsilfidis et al. | Blind single-channel suppression of late reverberation based on perceptual reverberation modeling | |
JP4774255B2 (ja) | 音声信号処理方法、装置及びプログラム | |
JP3411648B2 (ja) | 車載用オーディオ装置 | |
Desloge et al. | Masking release for hearing-impaired listeners: The effect of increased audibility through reduction of amplitude variability | |
Li et al. | Factors affecting masking release in cochlear-implant vocoded speech | |
JP2001100774A (ja) | 音声処理装置 | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 | |
JP2005202335A (ja) | 音声処理方法と装置及びプログラム | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
JP3303446B2 (ja) | 音声信号処理装置 | |
KR101682796B1 (ko) | 소음 환경에서 음절 형태 기반 음소 가중 기법을 이용한 음성의 명료도 향상 방법 및 이를 기록한 기록매체 | |
Kociński et al. | Time-compressed speech intelligibility in different reverberant conditions | |
EP2063420A1 (en) | Method and assembly to enhance the intelligibility of speech | |
JP4079478B2 (ja) | 音声信号の処理回路および処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110614 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110627 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4774255 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |