JP4552533B2 - 音響信号処理装置及び音声度合算出方法 - Google Patents
音響信号処理装置及び音声度合算出方法 Download PDFInfo
- Publication number
- JP4552533B2 JP4552533B2 JP2004194646A JP2004194646A JP4552533B2 JP 4552533 B2 JP4552533 B2 JP 4552533B2 JP 2004194646 A JP2004194646 A JP 2004194646A JP 2004194646 A JP2004194646 A JP 2004194646A JP 4552533 B2 JP4552533 B2 JP 4552533B2
- Authority
- JP
- Japan
- Prior art keywords
- decrease
- increase
- wavelength
- acoustic signal
- waveform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004364 calculation method Methods 0.000 title claims description 104
- 230000007423 decrease Effects 0.000 claims description 131
- 230000007613 environmental effect Effects 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 21
- 230000005236 sound signal Effects 0.000 claims description 17
- 230000000630 rising effect Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 18
- 230000009194 climbing Effects 0.000 description 14
- 230000010354 integration Effects 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 5
- 230000001174 ascending effect Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Time-Division Multiplex Systems (AREA)
Description
を制御する。
Rup=Aup/(Nup−2)
で定義される。下り半波長増減繰り返し割合算出部52の下り半波長についても、
Rdown=Adown/(Ndown−2)
で定義される。
Rup=Aup/(Nup−2)=2/(5−2)=0.67
Rdown=Adown/(Ndown−2)=1/(5−2)=0.33
となる。
Vdown=(Avedown/Vardown)/(Ndown−2)
ここでAveは登り、下りそれぞれの増減の繰り返しの長さの平均値、Varは増減の繰り返しの長さの分散、 Nはフレーム内の登り、下り半波長数である。
Vdown=(2/2)/(9 − 2)=0.14
ただしこのままでは、出力値が0〜1の範囲に収まらないので、出力値調整部54で調整する必要がある。具体的には以下の式(2)のようなシグモイド関数が挙げられる。
ゼロクロスを有する半波長数/全半波長数
を求め、これをゼロクロス割合出力値として出力値調整部57に送っている。例えば、上述した図5の波形の例では、登り及び下りの各半波長UH1、DH1、UH2、DH2、UH3、DH5はゼロクロスを有しており、DH3、UH4、DH4、UH5はゼロクロスを有していないことから、
ゼロクロスを有する半波長数/全半波長数=6/10=0.6
と計算される。これをフレーム内の全半波長について計算するものである。
Claims (7)
- 音声及び環境音を含む入力音響信号の音声の度合を算出する音声度合算出手段と、
この音声度合算出手段からの出力に基づき上記入力音響信号を処理する音声処理手段とを有し、
上記音声度合算出手段は、
上記入力音響信号の波形の半波長の増減の繰り返し割合を算出する半波長増減繰り返し割合算出手段と、
上記入力音響信号の波形の半波長のゼロクロスの割合を算出するゼロクロス割合算出手段と、
上記半波長増減繰り返し割合算出手段からの出力及び上記ゼロクロス割合算出手段からの出力に基づいて音声の度合を決定し出力する音声度合出力手段と
を有して成る
音響信号処理装置。 - 上記音声度合算出手段は、上記入力音響信号の所定の時間長単位で切り出されたフレーム単位で音声度合を算出する請求項1記載の音響信号処理装置。
- 上記半波長増減繰り返し割合算出手段は、上記入力音響信号の波形の登り半波長が増減あるいは減増と交互に変化する部分の割合と、上記入力音響信号の波形の下り半波長が増減あるいは減増と交互に変化する部分の割合とに基づいて半波長の増減の繰り返し割合を算出する請求項1記載の音響信号処理装置。
- 上記半波長増減繰り返し割合算出手段には、算出された繰り返し割合の出力値を調整する第1の出力値調整手段が設けられ、
上記ゼロクロス割合算出手段には、算出されたゼロクロス割合の出力値を調整する第2の出力値調整手段が設けられ、
上記第1、第2の出力調整手段により各出力値を調整して上記音声度合出力手段に送る請求項1記載の音響信号処理装置。 - 音声及び環境音を含む入力音響信号を複数の周波数帯域に分割する帯域分割手段と、
上記帯域分割手段により分割された各帯域毎の音響信号の波形の波長方向の特徴量に基づいて音声の度合を算出する音声度合算出手段と、
この音声度合算出手段からの各帯域の音声の度合に基づいて上記入力音響信号を各帯域毎に処理する音声処理手段とを有する
音響信号処理装置。 - 入力音響信号の波形を波形切り出し手段により所定長さのフレーム単位で切り出す波形切り出し工程と、
上記波形切り出し工程により切り出された波形の半波長の増減の繰り返し割合を半波長増減繰り返し割合算出手段により算出する半波長増減繰り返し割合算出工程と、
上記波形切り出し工程により切り出された波形の半波長のゼロクロスの割合をゼロクロス割合算出手段により算出するゼロクロス割合算出工程と、
上記半波長増減繰り返し割合算出手段からの出力及び上記ゼロクロス割合算出手段からの出力に基づいて音声度合出力手段により音声の度合を決定し出力する音声度合出力工程と
を有して成る音声度合算出方法。 - 上記半波長増減繰り返し割合算出工程では、上記入力音響信号の波形の登り半波長が増減あるいは減増と交互に変化する部分の割合と、上記入力音響信号の波形の下り半波長が増減あるいは減増と交互に変化する部分の割合とに基づいて半波長の増減の繰り返し割合を算出する請求項6記載の音声度合算出方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004194646A JP4552533B2 (ja) | 2004-06-30 | 2004-06-30 | 音響信号処理装置及び音声度合算出方法 |
EP05013599A EP1612773B1 (en) | 2004-06-30 | 2005-06-23 | Sound signal processing apparatus and degree of speech computation method |
DE602005027521T DE602005027521D1 (de) | 2004-06-30 | 2005-06-23 | Vorrichtung zur Verarbeitung eines Klangsignals und Verfahren zur Bestimmung des Sprachengrad |
CNB200510081836XA CN100479034C (zh) | 2004-06-30 | 2005-06-30 | 声音信号处理装置和语音强度计算方法 |
US11/169,667 US7555429B2 (en) | 2004-06-30 | 2005-06-30 | Sound signal processing apparatus and degree of speech computation method |
KR1020050057785A KR20060048769A (ko) | 2004-06-30 | 2005-06-30 | 음향 신호 처리 장치 및 음성 정도 산출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004194646A JP4552533B2 (ja) | 2004-06-30 | 2004-06-30 | 音響信号処理装置及び音声度合算出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006017940A JP2006017940A (ja) | 2006-01-19 |
JP4552533B2 true JP4552533B2 (ja) | 2010-09-29 |
Family
ID=34937633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004194646A Expired - Fee Related JP4552533B2 (ja) | 2004-06-30 | 2004-06-30 | 音響信号処理装置及び音声度合算出方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7555429B2 (ja) |
EP (1) | EP1612773B1 (ja) |
JP (1) | JP4552533B2 (ja) |
KR (1) | KR20060048769A (ja) |
CN (1) | CN100479034C (ja) |
DE (1) | DE602005027521D1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4564564B2 (ja) | 2008-12-22 | 2010-10-20 | 株式会社東芝 | 動画像再生装置、動画像再生方法および動画像再生プログラム |
JP4439579B1 (ja) * | 2008-12-24 | 2010-03-24 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
KR101211059B1 (ko) | 2010-12-21 | 2012-12-11 | 전자부품연구원 | 보컬 멜로디 강화 장치 및 방법 |
JP6361271B2 (ja) * | 2014-05-09 | 2018-07-25 | 富士通株式会社 | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム |
JP6585022B2 (ja) * | 2016-11-11 | 2019-10-02 | 株式会社東芝 | 音声認識装置、音声認識方法およびプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0816185A (ja) * | 1994-06-28 | 1996-01-19 | Sanyo Electric Co Ltd | 音声検出装置 |
JP2000330597A (ja) * | 1999-05-20 | 2000-11-30 | Matsushita Electric Ind Co Ltd | 雑音抑圧装置 |
WO2002080148A1 (fr) * | 2001-03-28 | 2002-10-10 | Mitsubishi Denki Kabushiki Kaisha | Dispositif eliminateur de bruit |
JP2003131686A (ja) * | 2001-10-29 | 2003-05-09 | Nippon Hoso Kyokai <Nhk> | 音声と音楽の混合比推定方法及び装置並びにそれを用いたオーディオ装置 |
JP2004125944A (ja) * | 2002-09-30 | 2004-04-22 | Sony Corp | 情報識別装置及び方法、並びにプログラム及び記録媒体 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3278685A (en) * | 1962-12-31 | 1966-10-11 | Ibm | Wave analyzing system |
US3549806A (en) | 1967-05-05 | 1970-12-22 | Gen Electric | Fundamental pitch frequency signal extraction system for complex signals |
US3940565A (en) | 1973-07-27 | 1976-02-24 | Klaus Wilhelm Lindenberg | Time domain speech recognition system |
GB9419388D0 (en) * | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
KR100566163B1 (ko) * | 2000-11-30 | 2006-03-29 | 마츠시타 덴끼 산교 가부시키가이샤 | 음성 복호화 장치, 음성 복호화 방법 및 프로그램을기록한 기록 매체 |
JP3866165B2 (ja) | 2002-07-12 | 2007-01-10 | 株式会社ケンウッド | 車載用ナビゲーション装置 |
JP2004045238A (ja) | 2002-07-12 | 2004-02-12 | Japan Science & Technology Corp | フラーレン類の分子回転速度測定方法 |
KR100450732B1 (ko) | 2002-12-13 | 2004-10-01 | 김정식 | 돌기가 형성된 밑밥주걱 및 그 제조방법 |
JP4526791B2 (ja) | 2003-07-24 | 2010-08-18 | 株式会社ブリヂストン | タイヤ構成材の製造方法 |
-
2004
- 2004-06-30 JP JP2004194646A patent/JP4552533B2/ja not_active Expired - Fee Related
-
2005
- 2005-06-23 DE DE602005027521T patent/DE602005027521D1/de active Active
- 2005-06-23 EP EP05013599A patent/EP1612773B1/en not_active Not-in-force
- 2005-06-30 CN CNB200510081836XA patent/CN100479034C/zh not_active Expired - Fee Related
- 2005-06-30 KR KR1020050057785A patent/KR20060048769A/ko not_active Application Discontinuation
- 2005-06-30 US US11/169,667 patent/US7555429B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0816185A (ja) * | 1994-06-28 | 1996-01-19 | Sanyo Electric Co Ltd | 音声検出装置 |
JP2000330597A (ja) * | 1999-05-20 | 2000-11-30 | Matsushita Electric Ind Co Ltd | 雑音抑圧装置 |
WO2002080148A1 (fr) * | 2001-03-28 | 2002-10-10 | Mitsubishi Denki Kabushiki Kaisha | Dispositif eliminateur de bruit |
JP2003131686A (ja) * | 2001-10-29 | 2003-05-09 | Nippon Hoso Kyokai <Nhk> | 音声と音楽の混合比推定方法及び装置並びにそれを用いたオーディオ装置 |
JP2004125944A (ja) * | 2002-09-30 | 2004-04-22 | Sony Corp | 情報識別装置及び方法、並びにプログラム及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US7555429B2 (en) | 2009-06-30 |
JP2006017940A (ja) | 2006-01-19 |
KR20060048769A (ko) | 2006-05-18 |
EP1612773A2 (en) | 2006-01-04 |
CN100479034C (zh) | 2009-04-15 |
US20060004568A1 (en) | 2006-01-05 |
EP1612773B1 (en) | 2011-04-20 |
DE602005027521D1 (de) | 2011-06-01 |
EP1612773A3 (en) | 2009-08-19 |
CN1716382A (zh) | 2006-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1755111B1 (en) | Method and device for detecting pitch | |
JP4818335B2 (ja) | 信号帯域拡張装置 | |
US8271292B2 (en) | Signal bandwidth expanding apparatus | |
US8311842B2 (en) | Method and apparatus for expanding bandwidth of voice signal | |
JP6019969B2 (ja) | 音響処理装置 | |
TW200412178A (en) | Apparatus and method for audio-signal-processing | |
JP2010224321A (ja) | 信号処理装置 | |
EP1426926B1 (en) | Apparatus and method for changing the playback rate of recorded speech | |
CN113241082A (zh) | 变声方法、装置、设备和介质 | |
KR20050049103A (ko) | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 | |
US8744845B2 (en) | Method for processing noisy speech signal, apparatus for same and computer-readable recording medium | |
CN105324815B (zh) | 信号处理装置和信号处理方法 | |
JP4552533B2 (ja) | 音響信号処理装置及び音声度合算出方法 | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
JP2005266797A (ja) | 音源信号分離装置及び方法、並びにピッチ検出装置及び方法 | |
JP2009055583A (ja) | 風雑音低減装置 | |
JP2008072600A (ja) | 音響信号処理装置、音響信号処理プログラム、音響信号処理方法 | |
JP7533440B2 (ja) | 信号処理装置および方法、並びにプログラム | |
JP6313619B2 (ja) | 音声信号処理装置及びプログラム | |
KR100715013B1 (ko) | 대역확장장치 및 방법 | |
JP2011013383A (ja) | オーディオ信号補正装置及びオーディオ信号補正方法 | |
WO2013018092A1 (en) | Method and system for speech processing | |
JP2008262140A (ja) | 音程変換装置及び音程変換方法 | |
JP5191459B2 (ja) | 声道断面積関数の抽出装置及びその抽出方法 | |
EP3327723A1 (en) | Method for slowing down a speech in an input media content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070517 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100622 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100705 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130723 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130723 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |