[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN104021797A - 一种基于频域稀疏约束的语音信号增强方法 - Google Patents

一种基于频域稀疏约束的语音信号增强方法 Download PDF

Info

Publication number
CN104021797A
CN104021797A CN201410275813.1A CN201410275813A CN104021797A CN 104021797 A CN104021797 A CN 104021797A CN 201410275813 A CN201410275813 A CN 201410275813A CN 104021797 A CN104021797 A CN 104021797A
Authority
CN
China
Prior art keywords
voice signal
lambda
weighting
algorithm
sparse constraint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410275813.1A
Other languages
English (en)
Inventor
余腾龙
张烨
吴康锐
张文全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang University
Original Assignee
Nanchang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang University filed Critical Nanchang University
Priority to CN201410275813.1A priority Critical patent/CN104021797A/zh
Publication of CN104021797A publication Critical patent/CN104021797A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

一种基于频域稀疏约束的语音信号增强方法,(1)以语音信号短时傅里叶变换系数的加权L1范数作为语音去噪的过程的稀疏约束;(2)稀疏约束项与数据保真项通过拉格朗日乘子结合得到代价函数;(3)采用重复加权分裂布雷格曼算法求解代价函数,得到去噪信号。本发明与小波变换需要选取合适母小波及尺度不同,采用短时傅里叶变换将语音信号变换到时频域处理;与一般分裂布雷格曼算法相比重复加权分裂布雷格曼算法针对加权L1范数约束改进了更新迭代的过程,使算法具有自适应的特性,提高了算法的性能;本发明提供的语音增强方法能有效抑制噪声并改善语音信号质量,作为语音信号处理系统的预处理模块发挥重要作用。

Description

一种基于频域稀疏约束的语音信号增强方法
技术领域
本发明属于信号处理技术领域,涉及一种语音信号增强方法。
背景技术
通常,噪声的存在使得语音信号处理系统的性能恶化,但采用语音增强技术作为预处理可以有效抑制噪声的影响。语音增强的主要目标是从带噪语音信号中尽可能地提取原始语音信号,从而改善语音质量。目前常用的语音增强算法主要有:噪声对消法、维纳滤波法、小波去噪法等。这些语音信号处理方法可分为时域和变换域两类。噪声对消法和维纳滤波法属于在时域处理的方法。噪声对消法要求采集背景噪声作为参考噪声,该方法受参考噪声的影响较大。维纳滤波器法是在最下均方误差准则下得到最优滤波器,但巨大的运算量限制了其广泛应用。小波去噪法属于在变换域处理的方法,先选取合适的母小波,再在不同尺度下对语音信号分解,对分解系数采用硬阈值或软阈值等方法去噪,最后通过反变换得到时域的去噪信号。该方法中母小波和阈值的选取对去噪性能影响较大。
发明内容
本发明目的是针对现有语音信号增强方法的不足,提出了一种基于频域稀疏约束的语音信号增强方法。
本发明是通过以下技术方案实现的。
①以语音信号短时傅里叶变换系数的加权L1范数作为语音去噪的过程的稀疏约束;
②稀疏约束项与数据保真项通过拉格朗日乘子结合得到代价函数;
③采用重复加权分裂布雷格曼算法求解代价函数,得到去噪信号。
更进一步,本发明的具体步骤如下:
(1)读取带噪声的单声道语音信号;
(2)设置短时傅里叶变换的各项参数;
(3)利用重复加权分裂布雷格曼算法估计源信号,该算法的代价函数为:
min x | | F ( x ) | | w , 1 + μ 2 | | y - x | | 2 2
其中带噪语音信号为y=x+n,x为源信号,n高斯白噪声,F(x)表示对语音信号x的短时傅里叶变换,||·||w,1为加权L1范数,如向量z∈Rp,其加权L1范数为w=[w1 … wp]T∈Rp为加权系数,μ为拉格朗日乘子。
迭代时x,z和b的初值均设为零向量,w初值设为全1向量。
迭代过程如下:
(a)    x t + 1 = min x μ 2 | | y - x | | 2 2 + λ 2 | | z t - F ( x ) - b t | | 2 2
对上式求导并令导数为零,得到x的迭代公式如下:
x t + 1 = ( μy + λF - 1 ( z t - b t ) ) μ + λ
其中F-1(·)表示短时傅里叶变换的逆变换;
(b)    z t + 1 = min z | | z | | w , 1 + λ 2 | | z - F ( x t + 1 ) - b t | | 2 2
对上式求导并令导数为零,可得到z中每个元素的更新公式为:
z j t + 1 = ( F ( x t + 1 ) + b t ) j - w j &lambda; ( F ( x t + 1 ) + b t ) j > w j &lambda; 0 - w j &lambda; < ( F ( x t + 1 ) + b t ) j < w j &lambda; ( F ( x t + 1 ) + b t ) j + w j &lambda; ( F ( x t + 1 ) + b t ) j < - w j &lambda;
(c)   bt+1=bt+F(xt+1)-zt+1
循环以上(a)(b)(c)步,直到满足停止条件||xt+1-xt||2/||xt||2≤ρ后执行步骤(d)更新权值w;
(d)权值w的更新公式为:
w j = &delta; &delta; + | z j |
δ的值取向量z中所有元素的标准差,再在新的权值条件下回到步骤(a),如此重复直到权值更新后没有变化,则将以上估计的源信号x作为语音增强的结果。
将步骤(3)估计的源信号作为语音增强的结果,并与源信号x比较可得到输出性噪比作为本发明的评价标准。
本发明所述的设置短时傅里叶变换的各项参数,包括窗函数的类型(一般取汉明窗)、窗函数的大小(一般取20-30毫秒)、窗移动步长(一般为窗大小的一半)。
本发明方法与现有语音增强方法相比较,具有如下显著的特点和优点:
(1)与小波变换需要选取合适母小波及尺度不同,本发明采用短时傅里叶变换将语音信号变换到时频域处理。
(2)与一般分裂布雷格曼算法相比重复加权分裂布雷格曼算法针对加权L1范数约束改进了更新迭代的过程,提高了算法的性能。
(3)重复更新代价函数中的权值,使算法具有自适应的特性,从而有效的抑制噪声。
本发明提供的语音增强方法能有效抑制噪声并改善语音信号质量,作为语音信号处理系统的预处理模块发挥重要作用。
附图说明
图1为采用的原始语音信号。
图2为采用的带噪语音信号(信噪比为5分贝)。
图3为采用重复加权分裂布雷格曼算法得到的语音去噪结果。
图4为采用一般分裂布雷格曼算法得到的语音去噪结果。
图5为采用小波去噪法(多贝西5小波)的结果。
具体实施方式
本发明将通过以下实施例作进一步说明。
实施例。
(1)读取信噪比为5分贝的带噪单声道语音信号;
(2)设置短时傅里叶变换的各项参数,窗函数的类型取汉明窗、窗函数的大小取30毫秒、窗移动步长为窗大小的一半;
(3)利用重复加权分裂布雷格曼算法估计源信号,该算法的代价函数为迭代时x,z和b的初值均设为零向量,w初值设为全1向量,λ取1,μ取噪声方差的倒数,即68.02。
迭代过程如下:
(a)    x t + 1 = min x &mu; 2 | | y - x | | 2 2 + &lambda; 2 | | z t - F ( x ) - b t | | 2 2
对上式求导并令导数为零,得到x的迭代公式如下
x t + 1 = ( &mu;y + &lambda;F - 1 ( z t - b t ) ) &mu; + &lambda;
其中F-1(·)表示短时傅里叶变换的逆变换;
(b)    z t + 1 = min z | | z | | w , 1 + &lambda; 2 | | z - F ( x t + 1 ) - b t | | 2 2
对上式求导并令导数为零,可得到z中每个元素的更新公式为
z j t + 1 = ( F ( x t + 1 ) + b t ) j - w j &lambda; ( F ( x t + 1 ) + b t ) j > w j &lambda; 0 - w j &lambda; < ( F ( x t + 1 ) + b t ) j < w j &lambda; ( F ( x t + 1 ) + b t ) j + w j &lambda; ( F ( x t + 1 ) + b t ) j < - w j &lambda;
(c)   bt+1=bt+F(xt+1)-zt+1
循环以上(a)(b)(c)步,直到满足停止条件||xt+1-xt||2/||xt||2≤0.001后执行步骤(d)更新权值w;
(d)权值w的更新公式为
w j = &delta; &delta; + | z j |
δ的值取向量z中所有元素的标准差,再在新的权值条件下回到步骤(a),如此重复直到权值更新后没有变化。
(4)将步骤(3)估计的源信号作为语音增强的结果,并与源信号x比较可得到输出性噪比作为本发明的评价标准。
表1给出了本发明方法对语音去噪结果的客观评价指标。为评价各去噪方法的性能,表1中采用了输出信噪比衡量去噪语音的质量。从表1可知,本发明提出的重复加权分裂布雷格曼算法能有效去噪,并优于一般分裂布雷格曼算法和小波去噪法。
表1语音信号去噪性能(输出信噪比,单位分贝)

Claims (2)

1.基于频域稀疏约束的语音信号增强方法,其特征在于:
①以语音信号短时傅里叶变换系数的加权L1范数作为语音去噪的过程的稀疏约束;
②稀疏约束项与数据保真项通过拉格朗日乘子结合得到代价函数;
③采用重复加权分裂布雷格曼算法求解代价函数,得到去噪信号。
2.根据权利要求1所述的基于频域稀疏约束的语音信号增强方法,其特征在于:首先,读取带噪声的单声道语音信号;设置短时傅里叶变换的各项参数;然后,利用重复加权分裂布雷格曼算法估计源信号,该算法的代价函数为:
min x | | F ( x ) | | w , 1 + &mu; 2 | | y - x | | 2 2
其中,带噪语音信号为y=x+n,x为源信号,n高斯白噪声,F(x)表示对语音信号x的短时傅里叶变换,||·||w,1为加权L1范数,μ为拉格朗日乘子;
迭代时x,z和b的初值均设为零向量,w初值设为全1向量;
迭代过程如下:
(a)    x t + 1 = min x &mu; 2 | | y - x | | 2 2 + &lambda; 2 | | z t - F ( x ) - b t | | 2 2
对上式求导并令导数为零,得到x的迭代公式如下:
x t + 1 = ( &mu;y + &lambda;F - 1 ( z t - b t ) ) &mu; + &lambda;
其中F-1(·)表示短时傅里叶变换的逆变换;
(b)    z t + 1 = min z | | z | | w , 1 + &lambda; 2 | | z - F ( x t + 1 ) - b t | | 2 2
对上式求导并令导数为零,可得到z中每个元素的更新公式为:
z j t + 1 = ( F ( x t + 1 ) + b t ) j - w j &lambda; ( F ( x t + 1 ) + b t ) j > w j &lambda; 0 - w j &lambda; < ( F ( x t + 1 ) + b t ) j < w j &lambda; ( F ( x t + 1 ) + b t ) j + w j &lambda; ( F ( x t + 1 ) + b t ) j < - w j &lambda;
(c)   bt+1=bt+F(xt+1)-zt+1
循环以上(a)(b)(c)步,直到满足停止条件||xt+1-xt||2/||xt||2≤ρ后执行步骤(d)更新权值w
(d)权值w的更新公式为:
w j = &delta; &delta; + | z j |
δ的值取向量z中所有元素的标准差,再在新的权值条件下回到步骤(a),如此重复直到权值更新后没有变化,则将以上估计的源信号x作为语音增强的结果。
CN201410275813.1A 2014-06-19 2014-06-19 一种基于频域稀疏约束的语音信号增强方法 Pending CN104021797A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410275813.1A CN104021797A (zh) 2014-06-19 2014-06-19 一种基于频域稀疏约束的语音信号增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410275813.1A CN104021797A (zh) 2014-06-19 2014-06-19 一种基于频域稀疏约束的语音信号增强方法

Publications (1)

Publication Number Publication Date
CN104021797A true CN104021797A (zh) 2014-09-03

Family

ID=51438518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410275813.1A Pending CN104021797A (zh) 2014-06-19 2014-06-19 一种基于频域稀疏约束的语音信号增强方法

Country Status (1)

Country Link
CN (1) CN104021797A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110189761A (zh) * 2019-05-21 2019-08-30 哈尔滨工程大学 一种基于贪婪深度字典学习的单信道语音去混响方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1855227A (zh) * 2005-01-26 2006-11-01 索尼株式会社 用于分离音频信号的装置和方法
CN101030383A (zh) * 2006-03-02 2007-09-05 株式会社日立制作所 声源分离装置、方法和程序
JP2011170190A (ja) * 2010-02-19 2011-09-01 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、および、信号分離プログラム
CN102419974A (zh) * 2010-09-24 2012-04-18 国际商业机器公司 处理语音识别的稀疏表示特征的方法和系统
CN102915742A (zh) * 2012-10-30 2013-02-06 中国人民解放军理工大学 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法
CN103559888A (zh) * 2013-11-07 2014-02-05 航空电子系统综合技术重点实验室 基于非负低秩和稀疏矩阵分解原理的语音增强方法
CN103559886A (zh) * 2013-09-24 2014-02-05 浙江大学 基于组稀疏低秩表达的语音信号增强方法
CN103606133A (zh) * 2013-11-06 2014-02-26 南昌大学 一种基于解析稀疏表示的图像去噪方法
CN103745727A (zh) * 2013-12-25 2014-04-23 南京邮电大学 一种含噪声语音信号压缩感知方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1855227A (zh) * 2005-01-26 2006-11-01 索尼株式会社 用于分离音频信号的装置和方法
CN101030383A (zh) * 2006-03-02 2007-09-05 株式会社日立制作所 声源分离装置、方法和程序
JP2011170190A (ja) * 2010-02-19 2011-09-01 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、および、信号分離プログラム
CN102419974A (zh) * 2010-09-24 2012-04-18 国际商业机器公司 处理语音识别的稀疏表示特征的方法和系统
CN102915742A (zh) * 2012-10-30 2013-02-06 中国人民解放军理工大学 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法
CN103559886A (zh) * 2013-09-24 2014-02-05 浙江大学 基于组稀疏低秩表达的语音信号增强方法
CN103606133A (zh) * 2013-11-06 2014-02-26 南昌大学 一种基于解析稀疏表示的图像去噪方法
CN103559888A (zh) * 2013-11-07 2014-02-05 航空电子系统综合技术重点实验室 基于非负低秩和稀疏矩阵分解原理的语音增强方法
CN103745727A (zh) * 2013-12-25 2014-04-23 南京邮电大学 一种含噪声语音信号压缩感知方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
ALI GHOLAMI: ""Sparse Time-Frequency Decomposition and some Applications"", 《IEEE TRANSACTION》 *
EMMANUEL J ET AL: ""Enhancing Sparsity by Reweighted l1 Minimization"", 《J FOURIER ANAL 》 *
MENG YU ET AL: ""MUti-channel l1 Regularized Convex Speech Enhancement Model and Fast Computation By the Split Bregman Method"", 《IEEE TRANSACTION》 *
SIMON ARBERET ET AL: ""Sparse Reverberant Audio Source Separation Via Reweighted Analysis"", 《IEEE TRANSACTION》 *
ZHIMIN XIANG ET AL: ""Adaptive Speech Enhancement Using sparse Prior Information"", 《2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTIC ,SPEECH AND SIGNAL PROCESSING》 *
李树涛等: ""压缩传感综述"", 《自动化学报》 *
李轶男等: ""改进的系数字典学习单通道语音增强算法"", 《信号处理》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110189761A (zh) * 2019-05-21 2019-08-30 哈尔滨工程大学 一种基于贪婪深度字典学习的单信道语音去混响方法
CN110189761B (zh) * 2019-05-21 2021-03-30 哈尔滨工程大学 一种基于贪婪深度字典学习的单信道语音去混响方法

Similar Documents

Publication Publication Date Title
CN100543842C (zh) 基于多统计模型和最小均方误差实现背景噪声抑制的方法
US9570087B2 (en) Single channel suppression of interfering sources
CN110148420A (zh) 一种适用于噪声环境下的语音识别方法
CN101369427B (zh) 用于音频信号处理的方法和装置
KR101266894B1 (ko) 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법
US8880396B1 (en) Spectrum reconstruction for automatic speech recognition
US11894010B2 (en) Signal processing apparatus, signal processing method, and program
WO2020107269A1 (zh) 自适应语音增强方法和电子设备
CN106340292B (zh) 一种基于连续噪声估计的语音增强方法
US9754608B2 (en) Noise estimation apparatus, noise estimation method, noise estimation program, and recording medium
CN112581973B (zh) 一种语音增强方法及系统
EP3660845B1 (en) Method for detecting audio signal and apparatus
Niwa et al. Post-filter design for speech enhancement in various noisy environments
CN106356058B (zh) 一种基于多频带特征补偿的鲁棒语音识别方法
CN110808057A (zh) 一种基于约束朴素生成对抗网络的语音增强方法
Borowicz et al. Signal subspace approach for psychoacoustically motivated speech enhancement
CN110998723A (zh) 使用神经网络的信号处理装置、使用神经网络的信号处理方法以及信号处理程序
CN103971697B (zh) 基于非局部均值滤波的语音增强方法
CN104021797A (zh) 一种基于频域稀疏约束的语音信号增强方法
CN108280416A (zh) 一种小波跨尺度相关滤波的宽带水声信号处理方法
Esch et al. Model-based speech enhancement using SNR dependent MMSE estimation
Chehresa et al. MMSE speech enhancement based on GMM and solving an over-determined system of equations
CN115497492A (zh) 一种基于全卷积神经网络的实时语音增强方法
Chehresa et al. MMSE speech enhancement using GMM
Hanilçi et al. Regularization of all-pole models for speaker verification under additive noise

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140903