CN101673550A - 谱增益计算方法、装置以及噪声抑制系统 - Google Patents
谱增益计算方法、装置以及噪声抑制系统 Download PDFInfo
- Publication number
- CN101673550A CN101673550A CN200810042696A CN200810042696A CN101673550A CN 101673550 A CN101673550 A CN 101673550A CN 200810042696 A CN200810042696 A CN 200810042696A CN 200810042696 A CN200810042696 A CN 200810042696A CN 101673550 A CN101673550 A CN 101673550A
- Authority
- CN
- China
- Prior art keywords
- critical parameter
- passband
- threshold
- module
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
一种谱增益计算方法,包括如下步骤:(a)提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;(b)根据先验信噪比信息以及后验信噪比信息计算出判定参数K;(c)设定判定参数的阈值K0;(d)将计算得到的判定参数K同阈值K0相比较,当K>K0时,执行步骤(e),当K≤K0时,执行步骤(f);(e)将判定参数带入指数函数,计算谱增益G;(f)将判定参数带入对数函数,计算谱增益G。本发明还提供了一种谱增益计算设备以及一种噪声抑制设备。本发明优点在于:无论什么时候噪声谱值超过平均值,这个算法都会避免出现本地突发的“音乐噪声”,并且降低了计算的复杂程度。
Description
【技术领域】
本发明涉及通讯技术领域,尤其涉及谱增益的计算方法、装置以及噪声抑制系统。
【背景技术】
语音信号是人类传播信息和感情交流的重要媒体,但在语音通信过程中不可避免地受到来自周围环境、乃至其它讲话者的干扰,这些干扰最终使接收到的语音信号并非纯净的原始语音信号,而是受噪声污染的带噪语音信号。在语音通信过程中,噪声是使通信变的困难的主要原因。
噪声抑制(NS)技术可以帮助减小噪声的不利影响。它的目标是增加信噪比(SNR)并因此增加语音的可懂性,降低听者的努力度,改善声学环境的感知品质。噪声抑制技术的实现算法主要包括NS算法部分和语音激活检测(VAD)算法部分
在现有的NS技术实现方案中,主要有多麦克风(Multi-Mic)和单麦克风(Single-Mic)NS技术。Multi-Mic NS技术采用一对麦克风的硬件结构,NS算法是麦克阵列算法,这种算法可以显著改善语音的可懂性,提高通话的质量,但是算法的效果与两麦克之间的距离及方向角有很大关系,而且算法在面对多种噪声源和回响层次时鲁棒性较差。相较Multi-Mic NS技术,Single-Mic NS技术对硬件的限制小,并且NS算法能很好的适应多种噪声源和回响层次,所以在移动通信终端系统,比较理想的噪声抑制技术是Single-Mic NS技术。这种技术的NS算法对噪声功率谱的估计是关键。由于大部分现实的噪声环境是非平稳的,这就需要经常的调整噪声谱的估计,以使NS有效的进行。自然,在目标语音不出现时进行噪声谱的调整是最准确的,这时输入的信号只有噪声,这就需要语音停顿检测(VAD)技术。
Single-Mic NS技术所采用的算法主要是集中在短时谱分析(STSA)NS算法上。STSA广泛应用是因为它在运算复杂度方面占有优势。大部分的通过了主观评价的噪声抑制算法,都是STSA算法。主观评价语音质量的增强度,是最近国际标准规定的对NS的一个必须的评价方法,下一代移动蜂窝电话标准3GPP制定了主观评价噪声抑制算法的规程。因此STSA是最可靠的噪声抑制算法。在STSA算法中,最小均方误差短时谱分析(MMSE-STSA)是有效的NS算法,它最小化短时谱幅度估计的均方误差,并且在提供好的噪声抑制的同时不产生称为“musical noise”的残余噪声。
图1是现有技术中噪声抑制系统的结构示意图,包括噪声抑制组件110和VAD组件120,其中噪声抑制组件110包括如下装置:短时傅里叶分解装置111、噪声估计装置112、先验和后验信噪比估计装置113、谱增益计算装置114和短时傅里叶综合装置115。
系统在接收到含噪语音之后,首先输入短时傅里叶分解装置111。短时傅里叶分解装置111计算含噪语音的离散傅里叶变换,从而得到它的谱幅度和相位。其中谱幅度分别输入VAD检测组件120和谱增益计算装置114。
VAD检测组件120用以根据输入的谱幅度,判断语音的停顿周期,并将判断结果输入噪声估计装置112。
噪声估计装置112根据VAD检测组件120的判断结果,在语音停顿的时段内,对噪声进行功率谱的估计和更新。由噪声估计装置112输出的功率谱的更新结果被输入至先验和后验信噪比估计装置113,用以计算先验和后验信噪比,并将计算结果输入谱增益计算装置114。
谱增益计算装置114根据输入的谱幅度和先验和后验信噪比,对谱幅度进行加权,以增强语音。被加权后的幅度与相位相乘后送入短时傅里叶综合装置115进行离散傅里叶反变换,得到时域增强的语音信号。
VAD组件120的工作原理是采用固定的能量检测门限,例如50dB,每间隔一定的帧数对输入的语音信号的能量加以检测,如果能量的变化幅度大于门限值,则认为是语音帧,否则认为是停顿帧。并将这一判断结果输入噪声估计装置112。
现有技术中,谱增益计算装置114采用贝赛尔函数的方法对谱增益进行计算,表达式如下:
M代表下列函数:
其中I0和I1分别是第0级和第1级修正贝赛尔函数。
从上面的叙述中不难看出,谱增益计算单元是整个噪声抑制系统的核心。现有技术中的谱增益计算单元采用贝塞尔函数的方法进行谱增益计算,其算法的复杂较高,不利于提高噪声抑制系统的工作速度。
【发明内容】
本发明所要解决的技术问题是,提供一种谱增益计算方法、设备以及噪声抑制系统,对谱增益的算法加以简化,提高谱增益计算单元以及噪声抑制系统的工作速度。
为了解决上述问题,本发明提供了一种谱增益计算方法,包括如下步骤:(a)提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;(b)根据先验信噪比信息以及后验信噪比信息计算出判定参数K;(c)设定判定参数的阈值K0;(d)将计算得到的判定参数K同阈值K0相比较,当K>K0时,执行步骤(e),当K≤K0时,执行步骤(f);(e)将判定参数带入指数函数计算谱增益G;(f)将判定参数带入对数函数计算谱增益G;所述判定参数所述a1、a2均小于0。
作为可选的技术方案,所述步骤(f)进一步包括如下步骤:(f1)设定子阈值K1,所述K1<K0;(f2)将判定参数K同子阈值K1相比较,当K1<K≤K0时,执行步骤(f3),当K≤K1时,执行步骤(f4);(f3)设定对数函数中的a2=a21、b2=b21,将判定参数K带入对数函数中,计算谱增益G;(f4)设定对数函数中的a2=a22、b2=b22,将判定参数K带入对数函数中,计算谱增益G。
作为可选的技术方案,所述判定参数的阈值K0的范围是0.5至2.0。作为可选的技术方案,
作为可选的技术方案,所述子阈值K1的范围是0.05至0.5。
本发明还提供了一种谱增益计算装置,包括如下模块:信息采集模块,用于提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;判定参数计算模块,用于根据信息采集部分提供的先验信噪比信息以及后验信噪比信息计算出判定参数K;阈值设定模块,用于设定判定参数的阈值K0;判定模块,用于将计算得到的判定参数K同阈值K0相比较,当K>K0时,将判定参数K输入指数函数计算模块,当K≤K0时,将判定参数K输入对数函数计算模块;指数函数计算模块,用于将判定参数K带入指数函数计算谱增益G;对数函数计算模块,用于将判定参数K带入对数函数计算谱增益G;所述判定参数
作为可选的技术方案,所述对数计算模块进一步包括如下单元:子阈值设定单元,用于设定子阈值K1,所述K1<K0;子阈值判断单元,用于将判定参数K同子阈值K1相比较,当K1<K≤K0时,将判定参数K输入第一计算单元,当K≤K1时,将判定参数K输入第二计算单元;第一计算单元,设定对数函数中的a2=a21、b2=h21,将判定参数K带入对数函数中,计算谱增益G;第二计算单元,设定对数函数中的a2=a22、b2=b22,将判定参数K带入对数函数中,计算谱增益G。
作为可选的技术方案,所述判定参数的阈值K0的范围是0.5至2.0。
作为可选的技术方案,所述子阈值K1的范围是0.05至0.5。
本发明还提供了一种噪声抑制系统,包括噪声抑制组件和VAD组件,其中噪声抑制组件包括短时傅里叶分解装置、噪声估计装置、先验和后验信噪比估计装置、谱增益计算装置和短时傅里叶综合装置,所述谱增益计算装置包括如下模块:信息采集模块,用于提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;判定参数计算模块,用于根据信息采集部分提供的先验信噪比信息以及后验信噪比信息计算出判定参数K;阈值设定模块,用于设定判定参数的阈值K0;判定模块,用于将计算得到的判定参数K同阈值K0相比较,当K>K0时,将判定参数K输入指数函数计算模块,当K≤K0时,将判定参数K输入对数函数计算模块;指数函数计算模块,用于将判定参数K带入指数函数计算谱增益G;对数函数计算模块,用于将判定参数K带入对数函数计算谱增益G。
作为可选的技术方案,所述VAD组件包括如下模块:帧采集模块,用于每隔一段时间在含噪语音谱幅度信息中采集数据帧,作为当前数据帧;功率包络计算模块,用于计算帧采集模块采集的当前数据帧的功率包络值,包括低通带包络功率和高通带包络功率;功率包络最值计算模块,用于计算低通带以及高通带的功率包络最大值与最小值;功率动态范围计算模块,用于计算低通带和高通带信号功率的动态范围是否小于低通带门限值与高通带门限值,从而判断是否存在语音;低通带语音判定模块,用于判定当前数据帧在低通带是否存在语音;高通带语音判定模块,用于判定当前数据帧在高通带是否存在语音;语音检测判决模块,用于根据动态范围计算模块,低通带语音判定模块以及高通带语音判定模块的结果判定当前数据帧之中是否存在语音,上述三个模块中有一个模块的判断结果为不存在语音,则认为该数据帧不存在语音。
作为可选的技术方案,所述功率动态范围计算模块根据功率包络最值计算模块所输出的低通带以及高通带的功率包络最大值与最小值,计算低通带以及高通带最大值与最小值的差值,将其与设定的低通带门限值与高通带门限值比较,若差值小于对应通带的门限值,则认为不存在语音,若差值大于等于对应通带的门限值,则认为存在语音,所述低通带门限值和高通带门限值可以通过外部输入的方式进行设定。、
作为可选的技术方案,所述低通带语音判定模块将当前数据帧的低通带包络功率与低通带功率包络最小值相比较,若差值大于修正的低通带门限值,则认为存在语音,若差值小于等于修正的低通带门限值,则认为不存在语音,所述修正的低通带门限值由功率动态范围计算模块中的低通带门限值乘以修正系数之后得到,所述修正系数的取值范围是0至1,可以通过外部输入的方式进行设定。
作为可选的技术方案,所述高通带语音判定模块将当前数据帧的高通带包络功率与高通带功率包络最小值相比较,若差值大于修正的高通带门限值,则认为存在语音,若差值小于等于修正的高通带门限值,则认为不存在语音,所述修正的高通带门限值由功率动态范围计算模块中的高通带门限值乘以修正系数之后得到,所述修正系数的取值范围是0至1,可以通过外部输入的方式进行设定。
本发明优点在于:
1、采用上述方法降低噪音,当Rprior值低时,对噪声的衰减就比较大;当Rprior值高时,对噪声的衰减就小。当Rpost大时,对噪声的衰减就大。但是Rprior减小了“音乐噪声”(musical noise),这是因为,当Rprior值比较小时,相应的Rpost的值将比较大,这时衰减也会较大,这样就把比平均噪声级别高的谱值拉小了。因此,通过这样处理,无论什么时候噪声谱值超过平均值,这个算法都会避免出现本地突发的“音乐噪声”。
2、本发明所述之方法降低了计算的复杂程度。本发明所述之方法较现有技术可以少进行一次加法、一次除法、一次开方以及一次指数或者对数运算,因此降低了计算的复杂程度,可以提高工作效率。
3、作为可选的技术方案,所述VAD组件分别独立地考察高通段和低通段的功率包络值,可以进一步提高了VAD组件工作的可靠性。
【附图说明】
附图1是现有技术中噪声抑制系统的结构示意图;
附图2所示为本发明提供的谱增益计算方法具体实施方式的实施步骤流程图;
附图3所示为上述具体实施方式中步骤S250的详细实施步骤流程图;
附图4所示为本发明所述谱增益计算装置的具体实施方式的装置结构示意图;
附图5所示为上述具体实施方式中对数函数计算模块的结构示意图;
附图6所示为本发明所述噪声抑制系统的具体实施方式中VAD组件的结构示意图;
附图7所示为上述具体实施方式中功率包络最值计算模块的结构示意图;
附图8是采用本发明所述噪声抑制系统具体方式对含街道噪声的目标语音进行噪声抑制后的MOS图。
【具体实施方式】
下面结合附图对本发明提供的谱增益的计算方法、装置以及噪声抑制系统的具体实施方式做详细说明。
首先结合附图给出本发明提供的谱增益计算方法的具体实施方式。
附图2所示为本发明提供的谱增益计算方法具体实施方式的实施步骤流程图,包括如下步骤:步骤S200,提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;步骤S210,根据先验信噪比信息以及后验信噪比信息计算出判定参数K;步骤S220,设定判定参数的阈值K0;步骤S230,将计算得到的判定参数K同阈值K0相比较,当K>K0时,执行步骤S240,当K≤K0时,执行步骤S250;步骤S240,将判定参数带入指数函数计算谱增益G;步骤S250,将判定参数带入对数函数计算谱增益G。
步骤S200,提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost。所述信息由独立的噪声估计方法得到,采用噪声估计的方法得到先验和后验信噪比信息属于现有技术,此处不再赘述。
采用上述方案定义K值,并带入上述指数或者对数函数计算谱增益,其优点在于,当Rprior值低时,对噪声的衰减就比较大;当Rprior值高时,对噪声的衰减就小。当Rpost大时,对噪声的衰减就大。但是Rprior减小了“音乐噪声”(musical noise),这是因为,当Rprior值比较小时,相应的Rpost的值将比较大,这时衰减也会较大,这样就把比平均噪声级别高的谱值拉小了。因此,通过这样处理,无论什么时候噪声谱值超过平均值,这个算法都会避免出现本地突发的“音乐噪声”。
步骤S220,设定判定参数的阈值K0。
所述判定参数的阈值K0可以通过外部设定的方式进行定义,通常K0的取值范围是0.5至2.0,优选1.0。
步骤S230,将计算得到的判定参数K同阈值K0相比较,当K>K0时,执行步骤S240,当K≤K0时,执行步骤S250。
考虑到验以及后验信噪比不同的情况下,得到的K值处于不同的区间内,分别采用指数函数和对数函数对其进行计算,这种分段计算的方法,可以提高抑制噪音的效果。在应用中,也可以根据实际情况的需要,采取其他形式的分段函数计算谱增益。
本具体实施方式中的方法可以降低计算的复杂度。本具体实施方式的噪声抑制方法与现有技术计算复杂度的对比可参见表1。
表1本具体实施方式与现有技术计算复杂度的对比
由上表知,本具体实施方式的噪声抑制方法的复杂程度低于现有技术复杂。
附图3所示为本具体实施方式中步骤S250的详细实施步骤流程图。对于步骤S250,为了进一步提高计算的精确程度,此步骤进一步包括如下步骤:步骤S251,设定子阈值K1,所述K1<K0;步骤S252,将判定参数K同子阈值K1相比较,当K1<K≤K0时,执行步骤S253,当K≤K1时,执行步骤S254;步骤S253,设定对数函数中的a2=a21、b2=b21,将判定参数K带入对数函数中,计算谱增益G;步骤S254,设定对数函数中的a2=a22、b2=b22,将判定参数K带入对数函数中,计算谱增益G。
所述子阈值K1的范围是0.05至0.5。
上述技术方案考虑到需要根据先验以及后验信噪比的值不同来调整噪声抑制算法,以获得更好的技术效果。在先验以及后验信噪比不同的情况下,采用先验以及后验信噪比计算得到的K值处于不同的区间内。根据K值的不同,将对数函数的系数赋予不同的值,采用分段计算的方法,可以进一步提高此方法抑制噪音的效果,因此是一种较佳的可选技术方案。
在实际操作中,也可以根据噪声的类型和频谱特点,选用更多的分段,在每个分段内分别修正对数函数的系数。
每个分段内对数函数的系数值可以先赋予一组经验值,然后根据对该方法的使用效果进行测试所得到的结果,通过外部手段进行调整,以获得更好的技术效果。
下面结合附图给出本发明所述谱增益计算装置的具体实施方式示意图。
附图4所示为本发明所述谱增益计算装置的具体实施方式的装置结构示意图,包括如下模块:
信息采集模块300,用于提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;
判定参数计算模块310,用于根据信息采集部分提供的先验信噪比信息以及后验信噪比信息计算出判定参数K;
阈值设定模块320,用于设定判定参数的阈值K0;
判定模块330,用于将计算得到的判定参数K同阈值K0相比较,当K>K0时,将判定参数K输入指数函数计算模块340,当K≤K0时,将判定参数K输入对数函数计算模块350;
指数函数计算模块340,用于将判定参数K带入指数函数
对数函数计算模块350,用于将判定参数K带入对数函数
信息采集模块300将采集到的含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost输入判定参数计算模块310,计算出判定参数K。此判定参数与阈值设定模块320设定的判定参数的阈值K0一同输入判定模块330。判定模块330根据判定的结果,决定采用指数函数计算模块340或者对数函数计算模块350计算谱增益。
附图5所示为对数函数计算模块350的结构示意图,包括如下单元:
子阈值设定单元351,用于设定子阈值K1,所述K1<K0;
子阈值判断单元352,用于将判定参数K同子阈值K1相比较,当K1<K≤K0时,将判定参数K输入第一计算单元,当K≤K1时,将判定参数K输入第二计算单元;
第一计算单元353,设定对数函数中的a2=a21、b2=b21,将判定参数K带入对数函数中,计算谱增益G;
第二计算单元354,设定对数函数中的a2=a22、b2=b22,将判定参数K带入对数函数中,计算谱增益G。
上述技术方案考虑到需要根据先验以及后验信噪比的值不同来调整噪声抑制算法,以获得更好的技术效果。在先验以及后验信噪比不同的情况下,采用先验以及后验信噪比计算得到的K值处于不同的区间内。根据K值的不同,采用不同的计算单元,将对数函数的系数赋予不同的值,可以进一步提高此模块抑制噪音的效果,因此是一种较佳的可选技术方案。
在实际操作中,也可以根据噪声的类型和频谱特点,选用更多的计算单元将对数函数进行分段,在每个分段内分别修正对数函数的系数。
关于上述模块以及单元的进一步详细解释,可以参考前一个具体实施方式中对应部分的内容,此处不加赘述。
下面结合附图对本发明所述的噪声抑制系统的具体实施方式做详细说明。
一种噪声抑制系统,包括噪声抑制组件和VAD组件,其中噪声抑制组件包括短时傅里叶分解装置、噪声估计装置、先验和后验信噪比估计装置、谱增益计算装置和短时傅里叶综合装置。上述各组件以及装置之间的关系可以参考背景技术中相关内容的叙述,此处不再赘述。
本具体实施方式中,所述谱增益计算装置包括如下模块:
信息采集模块,用于提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;
判定参数计算模块,用于根据信息采集部分提供的先验信噪比信息以及后验信噪比信息计算出判定参数K;
阈值设定模块,用于设定判定参数的阈值K0;
判定模块,用于将计算得到的判定参数K同阈值K0相比较,当K>K0时,将判定参数K输入指数函数计算模块,当K≤K0时,将判定参数K输入对数函数计算模块;
指数函数计算模块,用于将判定参数K带入指数函数
计算谱增益G;
对数函数计算模块,用于将判定参数K带入对数函数
上述各个模块之间的关系以及每个模块的详细描述,可以参考前述谱增益计算装置的具体实施方式中的叙述。
附图6所示为本具体实施方式中VAD组件的结构示意图,作为可选的技术方案,所述VAD组件包括如下模块:帧采集模块410,用于每隔一段时间在含噪语音谱幅度信息中采集数据帧,作为当前数据帧;功率包络计算模块420,用于计算帧采集模块采集的当前数据帧的功率包络值,包括低通带包络功率和高通带包络功率;功率包络最值计算模块430,用于计算低通带以及高通带的功率包络最大值与最小值;功率动态范围计算模块440,用于计算低通带和高通带信号功率的动态范围是否小于低通带门限值与高通带门限值,从而判断是否存在语音;低通带语音判定模块450,用于判定当前数据帧在低通带是否存在语音;高通带语音判定模块460,用于判定当前数据帧在高通带是否存在语音;语音检测判决模块470,用于根据动态范围计算模块,低通带语音判定模块以及高通带语音判定模块的结果判定当前数据帧之中是否存在语音,上述三个模块中有一个模块的判断结果为不存在语音,则认为该数据帧不存在语。
作为可选的技术方案,所述VAD组件分别独立地考察高通段和低通段的功率包络值,可以进一步提高了VAD组件工作的可靠性,因此是一种可选的技术方案。
附图7所示为功率包络最值计算模块430的结构示意图,所述功率包络最值计算模块430包括如下单元:数据接收单元431,用于接收功率包络计算模块输出的当前数据帧的低通带包络功率值与高通带包络功率值;判断单元432,用于检查此模块中是否已经存在功率包络的最值;最值初始化单元433,用于在此模块中不存在功率包络最值的情况下,将接收到的当前数据帧低通带包络功率值与高通带包络功率值作为相应的功率包络最值;最大值更新单元434,用于在此模块中存在功率包络最值的情况下,将接收到的当前数据帧低通带包络功率值与高通带包络功率值与相应的功率包络最大值比较,若大于最大值,则将此功率包络最大值更新为接收到的该通带的包络功率值,否则不更新;最小值更新单元435,用于在此模块中存在功率包络最值得情况下,将接收到的当前数据帧低通带包络功率值与高通带包络功率值与相应的功率包络最小值比较,若小于最小值,则将此功率包络最小值更新为接收到该通带的包络功率值,否则不更新。
所述功率动态范围计算模块440根据功率包络最值计算模块所输出的低通带以及高通带的功率包络最大值与最小值,计算低通带以及高通带最大值与最小值的差值,将其与设定的低通带门限值与高通带门限值比较,若差值小于对应通带的门限值,则认为不存在语音,若差值大于等于对应通带的门限值,则认为存在语音,所述低通带门限值和高通带门限值可以通过外部输入的方式进行设定。
所述低通带语音判定模块450将当前数据帧的低通带包络功率与低通带功率包络最小值相比较,若差值大于修正的低通带门限值,则认为存在语音,若差值小于等于修正的低通带门限值,则认为不存在语音,所述修正的低通带门限值由功率动态范围计算模块中的低通带门限值乘以修正系数之后得到,所述修正系数的取值范围是0至1,可以通过外部输入的方式进行设定。
所述高通带语音判定模块460将当前数据帧的高通带包络功率与高通带功率包络最小值相比较,若差值大于修正的高通带门限值,则认为存在语音,若差值小于等于修正的高通带门限值,则认为不存在语音,所述修正的高通带门限值由功率动态范围计算模块中的高通带门限值乘以修正系数之后得到,所述修正系数的取值范围是0至1,可以通过外部输入的方式进行设定。
下列评测通过基于PC的测试从主观和客观两方面充分证明了在性能方面本发明的噪声抑制系统比传统噪声抑制系统优越;通过基于综测仪的评测,显示了本发明提供的噪声抑制系统的具体实施方式能够提升移动通信终端的入网测试指标,并使语音通话质量达到主观和客观相统一的目的。
基于PC的测试主要从主观和客观两方面评测说明本具体是方式的噪声抑制系统的优越性。待测语音是四段8秒语音,包括两段男声两段女声;所含噪声包括:多人谈话噪声,街道噪声,办公室噪声,车内噪声四种。这些测试信号是根据ITU-T推荐的P.501标准得到的,并由语音和噪声混合成为不同信噪比的带噪语音用来评测噪声性能,下面的具体评测只是列举了其中的一个测试用例。
主观评测(MOS分法):
MOS分的测试主要是利用MOS分软件对语音的可接受程度进行测试。MOS分可以分为五级,每一级代表参加测试的个人在听到待测语音时的主观感觉,5表示最高分,主观感觉是不用任何努力即可听懂待测语音,1表示最低分,主观感觉是对于待测语音无论如何努力都听不懂,附图8是对含街道噪声的目标语音进行噪声抑制后MOS图。
通过上图可以看出本发明所述噪声抑制系统具体是方式对语音的客观感觉改善要优于传统噪声抑制系统。
客观评测(信噪比增值统计):
对信噪比增值的计算是一种客观的测试方法。噪声消除算法对信噪比的提升也是对算法性能评测的一个重要指标,具体的提升值可以用数学方法计算出来。
通过在各种噪声和不同信噪比时对信噪比的提升值计算并求平均得,本发明的噪声抑制系统具体实施方式的信噪比提高值达到25dB,而传统NS系统只有21dB,显然本发明的噪声抑制系统具体实施方式对SNR提高的更多。并且在带噪语音信噪比<-30dB时,本发明的噪声抑制系统具体实施方式对信噪比的提升远远高于传统NS系统。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (13)
2.根据权利要求1所述的谱增益的计算方法,其特征在于,所述步骤(f)进一步包括如下步骤:
(f1)设定子阈值K1,所述K1<K0;
(f2)将判定参数K同子阈值K1相比较,当K1<K≤K0时,执行步骤(f3),当K≤K1时,执行步骤(f4);
(f3)设定对数函数中的a2=a21、b2=b21,将判定参数K带入对数函数中,计算谱增益G;
(f4)设定对数函数中的a2=a22、b2=b22,将判定参数K带入对数函数中,计算谱增益G。
3.根据权利要求1或2所述的谱增益的计算方法,其特征在于,所述判定参数的阈值K0的范围是0.5至2.0。
4.根据权利要求1或2所述的谱增益的计算方法,其特征在于,所述子阈值K1的范围是0.05至0.5。
5.一种谱增益计算装置,其特征在于,包括如下模块:
信息采集模块,用于提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;
判定参数计算模块,用于根据信息采集部分提供的先验信噪比信息以及后验信噪比信息计算出判定参数K;
阈值设定模块,用于设定判定参数的阈值K0;
判定模块,用于将计算得到的判定参数K同阈值K0相比较,当K>K0时,将判定参数K输入指数函数计算模块,当K≤K0时,将判定参数K输入对数函数计算模块;
指数函数计算模块,用于将判定参数K带入指数函数
对数函数计算模块,用于将判定参数K带入对数函数
所述判定参数
6.根据权利要求5所述的谱增益的计算装置,其特征在于,所述对数计算模块进一步包括如下单元:
子阈值设定单元,用于设定子阈值K1,所述K1<K0;
子阈值判断单元,用于将判定参数K同子阈值K1相比较,当K1<K≤K0时,将判定参数K输入第一计算单元,当K≤K1时,将判定参数K输入第二计算单元;
第一计算单元,设定对数函数中的a2=a21、b2=b21,将判定参数K带入对数函数中,计算谱增益G;
第二计算单元,设定对数函数中的a2=a22、b2=b22,将判定参数K带入对数函数中,计算谱增益G。
7.根据权利要求5或6所述的谱增益的计算装置,其特征在于,所述判定参数的阈值K0的范围是0.5至2.0。
8.根据权利要求5或6所述的谱增益的计算装置,其特征在于,所述子阈值K1的范围是0.05至0.5。
9.一种噪声抑制系统,包括噪声抑制组件和VAD组件,其中噪声抑制组件包括短时傅里叶分解装置、噪声估计装置、先验和后验信噪比估计装置、谱增益计算装置和短时傅里叶综合装置,其特征在于,所述谱增益计算装置包括如下模块:
信息采集模块,用于提供含噪语音的先验信噪比信息Rprior以及后验信噪比信息Rpost;
判定参数计算模块,用于根据信息采集部分提供的先验信噪比信息以及后验信噪比信息计算出判定参数K;
阈值设定模块,用于设定判定参数的阈值K0;
判定模块,用于将计算得到的判定参数K同阈值K0相比较,当K>K0时,将判定参数K输入指数函数计算模块,当K≤K0时,将判定参数K输入对数函数计算模块;
指数函数计算模块,用于将判定参数K带入指数函数
对数函数计算模块,用于将判定参数K带入对数函数
10.根据权利要求9所述的噪声抑制系统,其特征在于,所述VAD组件包括如下模块:
帧采集模块,用于每隔一段时间在含噪语音谱幅度信息中采集数据帧,作为当前数据帧;
功率包络计算模块,用于计算帧采集模块采集的当前数据帧的功率包络值,包括低通带包络功率和高通带包络功率;
功率包络最值计算模块,用于计算低通带以及高通带的功率包络最大值与最小值;
功率动态范围计算模块,用于计算低通带和高通带信号功率的动态范围是否小于低通带门限值与高通带门限值,从而判断是否存在语音;
低通带语音判定模块,用于判定当前数据帧在低通带是否存在语音;
高通带语音判定模块,用于判定当前数据帧在高通带是否存在语音;
语音检测判决模块,用于根据动态范围计算模块,低通带语音判定模块以及高通带语音判定模块的结果判定当前数据帧之中是否存在语音,上述三个模块中有一个模块的判断结果为不存在语音,则认为该数据帧不存在语音。
11.根据权利要求10所述的噪声抑制系统,其特征在于,所述功率动态范围计算模块根据功率包络最值计算模块所输出的低通带以及高通带的功率包络最大值与最小值,计算低通带以及高通带最大值与最小值的差值,将其与设定的低通带门限值与高通带门限值比较,若差值小于对应通带的门限值,则认为不存在语音,若差值大于等于对应通带的门限值,则认为存在语音,所述低通带门限值和高通带门限值可以通过外部输入的方式进行设定。
12.根据权利要求10所述的噪声抑制系统,其特征在于,所述低通带语音判定模块将当前数据帧的低通带包络功率与低通带功率包络最小值相比较,若差值大于修正的低通带门限值,则认为存在语音,若差值小于等于修正的低通带门限值,则认为不存在语音,所述修正的低通带门限值由功率动态范围计算模块中的低通带门限值乘以修正系数之后得到,所述修正系数的取值范围是0至1,可以通过外部输入的方式进行设定。
13.根据权利要求10所述的噪声抑制系统,其特征在于,所述高通带语音判定模块将当前数据帧的高通带包络功率与高通带功率包络最小值相比较,若差值大于修正的高通带门限值,则认为存在语音,若差值小于等于修正的高通带门限值,则认为不存在语音,所述修正的高通带门限值由功率动态范围计算模块中的高通带门限值乘以修正系数之后得到,所述修正系数的取值范围是0至1,可以通过外部输入的方式进行设定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810042696A CN101673550A (zh) | 2008-09-09 | 2008-09-09 | 谱增益计算方法、装置以及噪声抑制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810042696A CN101673550A (zh) | 2008-09-09 | 2008-09-09 | 谱增益计算方法、装置以及噪声抑制系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101673550A true CN101673550A (zh) | 2010-03-17 |
Family
ID=42020739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810042696A Pending CN101673550A (zh) | 2008-09-09 | 2008-09-09 | 谱增益计算方法、装置以及噪声抑制系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101673550A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102568491A (zh) * | 2010-12-14 | 2012-07-11 | 联芯科技有限公司 | 噪声抑制方法及设备 |
CN102737645A (zh) * | 2012-06-15 | 2012-10-17 | 武汉天喻信息产业股份有限公司 | 一种语音信号的基音周期估计算法 |
CN103680516A (zh) * | 2013-12-11 | 2014-03-26 | 深圳Tcl新技术有限公司 | 音频信号的处理方法和装置 |
WO2017000771A1 (zh) * | 2015-06-30 | 2017-01-05 | 芋头科技(杭州)有限公司 | 一种环噪消除系统及其应用方法 |
CN106328155A (zh) * | 2016-09-13 | 2017-01-11 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种修正先验信噪比过估计的语音增强方法 |
CN106328116A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种机器人室内噪声控制系统 |
CN107045874A (zh) * | 2016-02-05 | 2017-08-15 | 深圳市潮流网络技术有限公司 | 一种基于相关性的非线性语音增强方法 |
CN110168640A (zh) * | 2017-01-23 | 2019-08-23 | 华为技术有限公司 | 用于增强信号中需要分量的装置和方法 |
-
2008
- 2008-09-09 CN CN200810042696A patent/CN101673550A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102568491A (zh) * | 2010-12-14 | 2012-07-11 | 联芯科技有限公司 | 噪声抑制方法及设备 |
CN102568491B (zh) * | 2010-12-14 | 2015-01-07 | 联芯科技有限公司 | 噪声抑制方法及设备 |
CN102737645A (zh) * | 2012-06-15 | 2012-10-17 | 武汉天喻信息产业股份有限公司 | 一种语音信号的基音周期估计算法 |
CN103680516A (zh) * | 2013-12-11 | 2014-03-26 | 深圳Tcl新技术有限公司 | 音频信号的处理方法和装置 |
CN103680516B (zh) * | 2013-12-11 | 2017-07-28 | 深圳Tcl新技术有限公司 | 音频信号的处理方法和装置 |
WO2017000771A1 (zh) * | 2015-06-30 | 2017-01-05 | 芋头科技(杭州)有限公司 | 一种环噪消除系统及其应用方法 |
CN106328116A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种机器人室内噪声控制系统 |
CN106328116B (zh) * | 2015-06-30 | 2020-04-17 | 芋头科技(杭州)有限公司 | 一种机器人室内噪声控制系统 |
CN107045874A (zh) * | 2016-02-05 | 2017-08-15 | 深圳市潮流网络技术有限公司 | 一种基于相关性的非线性语音增强方法 |
CN106328155A (zh) * | 2016-09-13 | 2017-01-11 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种修正先验信噪比过估计的语音增强方法 |
CN110168640A (zh) * | 2017-01-23 | 2019-08-23 | 华为技术有限公司 | 用于增强信号中需要分量的装置和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101673550A (zh) | 谱增益计算方法、装置以及噪声抑制系统 | |
US8972255B2 (en) | Method and device for classifying background noise contained in an audio signal | |
US9830905B2 (en) | Systems and methods for feature extraction | |
Rix et al. | Perceptual evaluation of speech quality (PESQ)-a new method for speech quality assessment of telephone networks and codecs | |
Dong et al. | An attention enhanced multi-task model for objective speech assessment in real-world environments | |
US8818798B2 (en) | Method and system for determining a perceived quality of an audio system | |
CN111429931B (zh) | 一种基于数据增强的降噪模型压缩方法及装置 | |
Kumar | Real-time performance evaluation of modified cascaded median-based noise estimation for speech enhancement system | |
Dubey et al. | Non-intrusive speech quality assessment using several combinations of auditory features | |
CN101176149A (zh) | 用于音调噪声鲁棒的信号处理系统 | |
CN114530160A (zh) | 模型训练方法、回声消除方法、系统、设备及存储介质 | |
CN114401168B (zh) | 适用复杂强噪声环境下短波莫尔斯信号的语音增强方法 | |
CN111613211B (zh) | 特定词语音的处理方法及装置 | |
Falk et al. | Single-Ended Quality Measurement of Noise Suppressed Speech Based on Kullback-Leibler Distances. | |
Wen et al. | On generating mixing noise signals with basis functions for simulating noisy speech and learning DNN-based speech enhancement models | |
CN118450309B (zh) | 一种基于音频分析的蓝牙耳机性能测试方法及相关装置 | |
Yang et al. | Environment-Aware Reconfigurable Noise Suppression | |
Lingapuram | Measuring speech quality of laptop microphone system using PESQ | |
Kemalkar et al. | Marathi Speech Quality Assessment | |
Fu et al. | Experimental study on dereverberation and noise reduction for distant speech recognition | |
Chen et al. | Objective assessment of speech quality by combining Bark-and Mel-scale frequency | |
Scholz et al. | Assessment of the speech-quality dimension" noisiness" for the instrumental estimation and analysis of telephone-band speech quality. | |
CN117409803A (zh) | 风噪抑制方法、装置及存储介质 | |
Dyba et al. | Fixed-Point Implementation of Noise Reduction Using StarCore-SC3400 | |
CN118133184A (zh) | 异常检测模型的训练及检测方法、相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100317 |