JP5172580B2 - 音補正装置及び音補正方法 - Google Patents
音補正装置及び音補正方法 Download PDFInfo
- Publication number
- JP5172580B2 JP5172580B2 JP2008257471A JP2008257471A JP5172580B2 JP 5172580 B2 JP5172580 B2 JP 5172580B2 JP 2008257471 A JP2008257471 A JP 2008257471A JP 2008257471 A JP2008257471 A JP 2008257471A JP 5172580 B2 JP5172580 B2 JP 5172580B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- power
- reproduced sound
- correction
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
図2は、補正処理部30の詳細を示す構成図である。補正処理部30には、補正処理の対象となる再生音が所定の単位区間ごとに入力される。前述のとおり、再生音は、通信によって得た音でも良いし、記憶部16に記憶されている音でも良い。例えば、放送受信部13を介して受信したテレビ放送波やラジオ放送波から得られる音や、送受信部12を介して受信した音声通話の音声や、記憶部16に記憶されたオーディオなどが考えられる。
7から読み出された収録雑音のマスキング閾値noise_thr[i]に対する補正処理を行う。なお、この補正処理は、後ほど詳細に説明する。
入力され、再生音マスキング特性解析部34から再生音のマスキング特性signal_thr[i]
が入力され、時間/周波数変換部31から再生音の周波数スペクトルが入力される。再生音補正部35は、これらの値を用いて、収録雑音のマスキング閾値によってマスクされている周波数帯域であって、再生音自身によってマスクされていない周波数帯域を増幅するよう再生音の補正を行う。再生音補正部35の詳細な処理については、後述する。
だしTH1<TH2)とを比較する。閾値TH1およびTH2は、予め設定された値であって、再生音の周波数域平均パワーframe_powerがTH1よりも小さい場合には、低レベ
ルの再生音と判定でき、frame_powerがTH2よりも大きい場合には、再生音が十分に大
きく、収録雑音にかかわらず十分に知覚できるような大レベルの再生音と判定できるよう設定される。
TH1およびTH2との比較結果としては、3つの場合がある。
、当該区間の再生音は低レベルであるため、音量増加を含めてより明瞭度を向上させる必要がある。そこで、まず収録雑音のマスキング閾値noise_thr[i]の平均値が再生音の周波数域パワーの平均値frame_powerよりも大きくなるよう補正する。図3は、再生音の周波
数域平均パワーframe_powerがTH1よりも小さいときに、収録雑音マスキング閾値noise_thr[i]を補正するときの処理の概念図である。図3(a)のような収録雑音マスキング
閾値が収録雑音マスキング閾値記憶部37から読み出されている状態で、図3(b)のような信号特性を有する再生音の単位区間が補正処理部30に入力されたとする。収録雑音マスキング閾値補正部33が、この再生音の周波数域平均パワーframe_powerはTH1よ
りも低いと判定すると、図3(c)のように、収録雑音のマスキング閾値の平均値を再生音の周波数域パワーの平均値frame_powerよりも大きくなるよう、収録雑音のマスキング
閾値を補正する。そして、収録雑音マスキング閾値補正部33は、補正処理を施したマスキング閾値を出力する。
再生音の周波数域平均パワーframe_powerがTH1以上であり、TH2未満であるときに
、収録雑音マスキング閾値noise_thr[i]を補正するときの処理の概念図である。図4(a)のような収録雑音マスキング閾値が収録雑音マスキング閾値記憶部37から読み出されている状態で、図4(b)のような信号特性を有する再生音の単位区間が補正処理部30に入力されたとする。収録雑音マスキング閾値補正部33が、この再生音の周波数域平均パワーframe_powerはTH1以上であり、TH2未満であると判定すると、図4(c)の
ように、収録雑音のマスキング閾値の平均値を再生音の周波数域パワーの平均値frame_powerと等しくなるよう、全帯域に対して同じレベル分だけ増幅させる。そして、収録雑音
マスキング閾値補正部33は、補正処理を施したマスキング閾値を出力する。
生音は、収録雑音にかかわらず十分に近くされるレベルであるため、収録雑音マスキング閾値noise_thr[i]に対してとくに補正処理を行わず、そのままnoise_thr[i]を出力する。
関係を示す図である。図5で表されるように、再生音の周波数域平均パワーframe_power
がTH1よりも小さい場合には、収録雑音マスキング閾値の平均値を再生音の周波数平均パワーよりも大きくなるように設定している。一方、再生音の周波数域平均パワーがTH1以上TH2未満の場合には、収録雑音マスキング閾値の平均値を再生音の周波数域平均パワーと同じになるよう設定している。
このように、収録雑音マスキング閾値補正部33では、再生音の周波数域平均パワーに応じて収録雑音マスキング閾値のレベルを補正する。補正後の収録雑音マスキング閾値nose_thr[i]は、後述の再生音補正部35によって算出される再生音の増幅率に影響するた
め、再生音の周波数域平均パワーが小さいほど収録雑音マスキング閾値のレベルが高くなるよう補正することは、再生音の周波数域平均パワーが小さいほど再生音の周波数帯域に対する増幅率を高くすることを意味する。なお、上記説明においては、frame_powerを再
生音の周波数域パワーとして既定の閾値TH1、TH2と比較しているが、単位区間のパワーの大小関係を判定することが目的であり、時間/周波数変換前の時間域平均パワーを用いても良い。
グする理由は、補正係数の算出には収録雑音のマスキング閾値と再生音のパワーとの比が用いられるため、再生音のパワーをスムージングさせないで補正係数を求め、この補正係数を用いて補正を行った場合、再生音の微細な構造が崩れてしまい、聴感が悪くなるためである。再生音のパワーのスムージングは、例えば、加重移動平均を用いる方法が考えられる。
る。この補正係数tmp_coef[i]の算出には、パワースムージング部35bでスムージング
された再生音の周波数成分ごとのパワーと、収録雑音マスキング閾値補正部33から出力された収録雑音のマスキング閾値noise_thr_new[i]の値を用いる。
定する。
波数成分)は、収録雑音が無ければ知覚できるにも関わらず、収録雑音によってマスクされていると判断できる。そこで、この周波数成分を増幅するように補正係数を設定する。
ただし、F()は補正係数tmp_coef[i]を算出する関数であり、例えば、式(3)や式
(4)のような関数である。
・・・(3)
F(noise_thr_new[i]/signal_power[i]) = noise_thr_new[i] / signal_power[i]×α ・・・(4)
なお、式(3)や式(4)中のαは補正係数を調整するための値である。この補正係数を調整するための値は、収録雑音マスキング閾値補正部33で再生音の周波数域平均パワーがTH1未満であると判定された場合であるか、収録雑音マスキング閾値補正部33で再生音の周波数域平均パワーがTH1以上でありTH2未満であると判定された場合であるかに応じて、この値を変えても良い。
ワーがTH1以上でありTH2未満であると判定された場合には、式(5)や式(6)の関数を用いて補正係数tmp_coef[i]を算出するとする。ただし、αとβとの関係はα>β
である。
・・・(5)
F(noise_thr_new[i]/signal_power[i]) = noise_thr_new[i] / signal_power[i]×β ・・・(6)
このように、再生音の周波数域平均パワーがTH1未満であると判定された場合(再生音が低レベルの場合)と再生音の周波数域平均パワーがTH1以上でありTH2未満であると判定された場合(再生音が中レベルの場合)とに応じて、補正係数を調整するために用いる値を変えることによって、もともと聞き取りにくい低レベルの区間に対して重みをつけて補正することができ、さらなる明瞭度の向上をはかることができる。
出力する。出力された補正係数tmp_coef[i]は、補正係数スムージング部35dに入力さ
れる。
自身にマスクされると判定された周波数成分に対する補正係数と、再生音自身にマスクされないと判定された周波数成分に対する補正係数とは算出方法が異なるため、隣接していた場合、不連続になりやすい。そこで、この不連続性を緩和するために、補正係数のスムージングを行い、再生音の品質劣化を抑制する。補正係数のスムージングは、例えば加重移動平均によって行う。
5dによってスムージングされた補正係数coef[i]とが入力される。補正演算部35eは
、入力された補正係数coef[i]と再生音のスペクトルsignal[i]とを式(7)のようにかけ合わせて補正後の再生音のスペクトルsignal_new[i]を得て、この値を出力する。
なお、補正演算部35eによって再生音の補正を行うときに、低域信号(例えば、100Hz以下の信号)は補正を行わないという条件や、低域信号を増幅させるときには所定の閾値以下の補正係数とするという条件などを付しても良い。
が入力される。ユーザボリューム適用部38では、入力された再生信号パワー情報をユーザボリューム値に応じて式(8)のように補正を行う。ただし、式(8)中のΔVは、基
準となるボリューム値(0dB)とユーザによって設定されたボリューム値との差分の値である。
また、再生音の周波数域パワーsignal_power[i]も同様にユーザボリューム値に応じて
式(9)のように補正を行う。
このようにユーザボリューム適用部38では、再生音の周波数域平均パワーframe_powerおよび再生音の周波数パワーsignal_power[i]を補正することによって、収録雑音マスキング閾値補正部33における再生音のレベル(低レベルか中レベルか大レベルか)の判定をより正確に行うことができ、聞き取りやすさを向上することができる。なお、実施例1と同様、上記説明においては、frame_powerを再生音の周波数域パワーとしているが、単
位区間のパワーの大小関係を判定することが目的であり、時間/周波数変換前の時間域平均パワーを用いても良い。
Claims (5)
- 再生音の周波数成分に対する補正係数を算出し、音声出力部から音声として出力される再生音の補正を行う音補正装置であって、
騒音環境下で予め収録された雑音から算出され、前記再生音がマスキングされるか否かを示すマスキング閾値を予め記憶する収録雑音マスキング閾値記憶手段と、
前記再生音の所定の区間のパワーの平均値を算出する手段と、
この再生音の区間ごとのパワーの平均値と、第1の閾値及びこの第1の閾値よりも大きい第2の閾値とを比較する手段と、
前記比較の結果、前記再生音の区間ごとのパワーの平均値が前記第1の閾値以上でかつ前記第2の閾値未満であった場合に前記区間に対応する前記マスキング閾値の平均値が前記再生音の区間ごとのパワーの平均値と同等になるように前記マスキング閾値を補正し、前記比較の結果前記再生音の区間ごとのパワーの平均値が前記第2の閾値以上であった場合は前記マスキング閾値の補正を行わず、前記比較の結果前記再生音の所定の区間ごとのパワーの平均値が前記第1の閾値未満であった場合は前記マスキング閾値を前記所定の区間の再生音よりも大きくなるように補正し、補正後の前記マスキング閾値未満のパワーを有する再生音の周波数成分を増幅させるよう補正する補正手段と
を有することを特徴とする音補正装置。 - 前記補正手段は、補正後前記マスキング閾値未満のパワーを有する再生音の周波数成分を増幅させるときに、前記再生音の所定の区間ごとのパワーの平均値が前記第1の閾値未満であった場合には、前記再生音の所定の区間ごとのパワーの平均値が前記第1の閾値以上であった場合よりも増幅率を高く設定することを特徴とする請求項1に記載の音補正装置。
- ユーザからの再生音の音量増減操作を受ける操作手段を更に有し、
前記補正手段は、前記操作手段によって設定された再生音の音量増減設定値を用いて再生音の所定の区間ごとのパワーの平均値を補正し、補正後の再生音のパワーの平均値に応じて前記マスキング閾値を補正し、補正後の前記マスキング閾値未満のパワーを有する再生音の周波数成分を増幅させるよう補正することを特徴とする請求項1に記載の音補正装置。 - 前記再生音は、予め記憶されていた音声データに対応する再生音もしくは無線または有線により受信した音声信号に対応する再生音であることを特徴とする請求項1に記載の音補正装置。
- 騒音環境下で予め収録された雑音から算出され、前記再生音がマスキングされるか否かを示すマスキング閾値を予め記憶する収録雑音マスキング閾値記憶手段を備える音補正装置における音声出力部から音声として出力される再生音の補正を行う音補正方法であって、
前記再生音の所定の区間のパワーの平均値を算出するステップと、
この再生音の区間ごとのパワーの平均値と、第1の閾値及びこの第1の閾値よりも大きい第2の閾値とを比較するステップと、
前記比較の結果、前記再生音の区間ごとのパワーの平均値が前記第1の閾値以上でかつ前記第2の閾値未満であった場合に前記区間に対応する前記マスキング閾値の平均値が前記再生音の区間ごとのパワーの平均値と同等になるように前記マスキング閾値を補正し、前記比較の結果前記再生音の区間ごとのパワーの平均値が前記第2の閾値以上であった場合は前記マスキング閾値の補正を行わず、前記比較の結果前記再生音の所定の区間ごとのパワーの平均値が前記第1の閾値未満であった場合は前記マスキング閾値を前記所定の区間の再生音よりも大きくなるように補正し、補正後の前記マスキング閾値未満のパワーを有する再生音の周波数成分を増幅させるよう補正するステップと
を有することを特徴とする音補正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008257471A JP5172580B2 (ja) | 2008-10-02 | 2008-10-02 | 音補正装置及び音補正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008257471A JP5172580B2 (ja) | 2008-10-02 | 2008-10-02 | 音補正装置及び音補正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010085913A JP2010085913A (ja) | 2010-04-15 |
JP5172580B2 true JP5172580B2 (ja) | 2013-03-27 |
Family
ID=42249898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008257471A Expired - Fee Related JP5172580B2 (ja) | 2008-10-02 | 2008-10-02 | 音補正装置及び音補正方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5172580B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109697978A (zh) * | 2018-12-18 | 2019-04-30 | 百度在线网络技术(北京)有限公司 | 用于生成模型的方法和装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5849411B2 (ja) | 2010-09-28 | 2016-01-27 | ヤマハ株式会社 | マスカ音出力装置 |
JP5902913B2 (ja) * | 2011-05-20 | 2016-04-13 | 日本放送協会 | ミキシングバランス自動調整装置およびプログラム |
CN108564963B (zh) * | 2018-04-23 | 2019-10-18 | 百度在线网络技术(北京)有限公司 | 用于增强语音的方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5105912B2 (ja) * | 2007-03-13 | 2012-12-26 | アルパイン株式会社 | 音声明瞭度改善装置およびその騒音レベル推定方法 |
JP2008228198A (ja) * | 2007-03-15 | 2008-09-25 | Sharp Corp | 再生音調整装置及び再生音調整方法 |
JP4940158B2 (ja) * | 2008-01-24 | 2012-05-30 | 株式会社東芝 | 音補正装置 |
-
2008
- 2008-10-02 JP JP2008257471A patent/JP5172580B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109697978A (zh) * | 2018-12-18 | 2019-04-30 | 百度在线网络技术(北京)有限公司 | 用于生成模型的方法和装置 |
CN109697978B (zh) * | 2018-12-18 | 2021-04-20 | 百度在线网络技术(北京)有限公司 | 用于生成模型的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2010085913A (ja) | 2010-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4940158B2 (ja) | 音補正装置 | |
JP5704470B2 (ja) | オーディオ明瞭度増大方法および装置とコンピュータ装置 | |
US9173020B2 (en) | Control method of sound producing, sound producing apparatus, and portable apparatus | |
US9208767B2 (en) | Method for adaptive audio signal shaping for improved playback in a noisy environment | |
JP5012995B2 (ja) | オーディオ信号処理装置及びオーディオ信号処理方法 | |
US9271089B2 (en) | Voice control device and voice control method | |
JP2004061617A (ja) | 受話音声処理装置 | |
JP5136378B2 (ja) | 音響処理方法 | |
JP5172580B2 (ja) | 音補正装置及び音補正方法 | |
KR100677554B1 (ko) | 비임형성 방식을 이용한 녹음 장치 및 그 방법 | |
US8254590B2 (en) | System and method for intelligibility enhancement of audio information | |
US8954322B2 (en) | Acoustic shock protection device and method thereof | |
US9070371B2 (en) | Method and system for peak limiting of speech signals for delay sensitive voice communication | |
JP2001188599A (ja) | オーディオ信号復号装置 | |
US20120158403A1 (en) | Voice reproduction apparatus and voice reproduction method | |
JP2005333191A (ja) | 携帯端末型テレビジョン受信装置 | |
JP4937246B2 (ja) | 音補正装置 | |
JP2586847B2 (ja) | 電子電話機 | |
JP2000349893A (ja) | 音声再生方法および音声再生装置 | |
JP2012129692A (ja) | 携帯端末、オーディオデータ再生システム、オーディオデータ再生方法及びプログラム | |
KR100604583B1 (ko) | 오디오 신호의 주파수 대역 레벨 특성 변환이 가능한 이동통신단말기 | |
JP5535428B2 (ja) | 音声信号の出力方法、スピーカシステム、携帯機器及びコンピュータプログラム | |
CN105720937A (zh) | 电子装置和声音信号的分析与播放方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110311 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110311 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121226 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160111 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |