CN104980337B - 一种音频处理的性能提升方法及装置 - Google Patents
一种音频处理的性能提升方法及装置 Download PDFInfo
- Publication number
- CN104980337B CN104980337B CN201510239444.5A CN201510239444A CN104980337B CN 104980337 B CN104980337 B CN 104980337B CN 201510239444 A CN201510239444 A CN 201510239444A CN 104980337 B CN104980337 B CN 104980337B
- Authority
- CN
- China
- Prior art keywords
- audio data
- audio
- echo
- noise
- volume
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 116
- 230000006872 improvement Effects 0.000 title claims abstract description 13
- 238000005457 optimization Methods 0.000 claims abstract description 60
- 230000008569 process Effects 0.000 claims description 85
- 238000011946 reduction process Methods 0.000 claims description 61
- 230000009467 reduction Effects 0.000 claims description 49
- 230000002708 enhancing effect Effects 0.000 claims description 19
- 230000006978 adaptation Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 14
- 239000000203 mixture Substances 0.000 description 13
- 238000004088 simulation Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/002—Applications of echo suppressors or cancellers in telephonic connections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2236—Quality of speech transmission monitoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
本发明实施例提供一种音频处理的性能提升方法及装置,其中的方法可包括:获取终端中的音频通话中的音频数据;采用音频处理算法对所述音频数据进行处理,获得所述音频数据的特征参数;根据所述音频数据的特征参数分析所述音频数据的处理质量;若所述音频数据的处理质量未达到预设质量标准,采用与所述终端相适配的优化数据对所述音频处理算法进行优化。本发明可对音频通话中的音频数据进行音频处理以提升音质,并可对音频处理质量进行分析和优化,以提升音频处理的质量,保证音质效果。
Description
技术领域
本发明涉及互联网技术领域,具体涉及音频技术领域,尤其涉及一种音频处理的性能提升方法及装置。
背景技术
随着互联网技术的发展,互联网应用也得到迅速发展;其中,互联网应用可包括但不限于:即时通信应用、SNS(Social Networking Services,社会性网络服务)应用、语音通信应用等等。诸如笔记本电脑、手机、PAD(平板电脑)等终端中可安装上述互联网应用,终端侧用户可使用终端中的互联网应用与其他用户进行诸如语音电话、音频聊天等音频通话。音质是影响音频通话的一个重要因素,如何提升音频通话中的音质是一个亟待解决的问题。
发明内容
本发明实施例提供一种音频处理的性能提升方法及装置,可对音频通话中的音频数据进行音频处理以提升音质,并可对音频处理质量进行分析和优化,以提升音频处理的质量,保证音质效果。
本发明实施例第一方面提供一种音频处理的性能提升方法,可包括:
获取终端中的音频通话中的音频数据;
采用音频处理算法对所述音频数据进行处理,获得所述音频数据的特征参数;
根据所述音频数据的特征参数分析所述音频数据的处理质量;
若所述音频数据的处理质量未达到预设质量标准,采用与所述终端相适配的优化数据对所述音频处理算法进行优化。
本发明实施例第二方面提供一种音频处理的性能提升装置,可包括:
获取单元,用于获取终端中的音频通话中的音频数据;
音频处理单元,用于采用音频处理算法对所述音频数据进行处理,获得所述音频数据的特征参数;
分析单元,用于根据所述音频数据的特征参数分析所述音频数据的处理质量;
优化单元,用于根据所述音频数据的特征参数分析所述音频数据的处理质量。
实施本发明实施例,具有如下有益效果:
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种音频处理的性能提升方法的流程图;
图2为本发明实施例提供的另一种音频处理的性能提升方法的流程图;
图3为本发明实施例提供的一种音频处理的性能提升装置的结构示意图;
图4为图3所示的获取单元的实施例的结构示意图;
图5a为图3所示的音频处理单元的一个实施例的结构示意图;
图5b为图3所示的音频处理单元的另一个实施例的结构示意图;
图5c为图3所示的音频处理单元的又一个实施例的结构示意图;
图6为图3所示的分析单元的实施例的结构示意图;
图7为图3所示的优化单元的实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,终端可以为PC(Personal Computer,个人计算机)、笔记本电脑、手机、PAD(平板电脑)、车载终端、智能可穿戴设备等设备。终端中可安装互联网应用,该互联网应用可包括但不限于:即时通信应用、SNS应用、语音通信应用等等。终端侧用户可使用终端中的互联网应用与其他用户进行音频通话。
下面将结合附图1-附图2,对本发明实施例提供的音频处理的性能提升方法进行详细介绍。需要说明的是,下述附图1-附图2的方法的流程可以由本发明实施例提供的音频处理的性能提升装置所执行,该装置可以运行于终端中,也可以运行于服务器中,或者可分布运行于终端和服务器中。
请参见图1,为本发明实施例提供的一种音频处理的性能提升方法的流程图;本实施例的方法流程可以由运行于终端中,或者运行于服务器中的音频处理的性能提升装置所执行;该方法可包括以下步骤S101-步骤S104。
S101,获取终端中的音频通话中的音频数据。
终端侧用户可使用终端中的互联网应用与其他用户进行音频通话,所述音频通话可包括但不限于:语音电话、音视频聊天通话等等。本步骤中,当终端中存在音频通话时,可采集音频通话中的声音信息,所述音频通话中的声音信息可包括但不限于:语音电话中通话者说话的声音信息或通话者所播放的诸如歌曲、音视频等的声音信息,以及音视频聊天通话中聊天者说话的声音信息或聊天者所播放的诸如歌曲、音视频等的声音信息等等。其中,所采集的音频通话中的声音信息为模拟信号,为了便于音频处理,本步骤中需要将模拟的声音信息转换为数字信号,即将所采集的模拟的所述音频通话中的声音信息转换为数字的所述音频通话中的音频数据。
S102,采用音频处理算法对所述音频数据进行处理,获得所述音频数据的特征参数。
所述音频处理算法可包括但不限于:回声消除算法、降噪算法和音量增益算法中的至少一种。本步骤中,采用音频处理算法对所述音频数据进行的处理可包括以下至少一种:采用回声消除算法对所述音频数据进行回声消除处理;采用降噪算法对所述音频数据进行降噪处理;以及采用音量增益算法对所述音频数据进行音量增益处理。
所述音频数据的特征参数包括:回声参数、噪声参数和增益参数中的至少一种。所述回声参数包括:回声处理持续时间、回声往返损耗和回声往返损耗增强;所述噪声参数包括:输入信噪比和输出信噪比;所述增益参数包括:音量输入数字包络和音量输出数字包络。其中,所述回声处理持续时间表示回声消除处理所用的时长。所述回声往返损耗可反映回声消除处理的能力,所述回声往返损耗的数值越小,表明所述回声消除处理得越干净,表明回声消除处理的能力越强。所述回声往返损耗增强可反映回声消除处理的能力,所述回声往返损耗增强的数值越大,表明所述回声消除处理得越干净,表明回声消除处理的能力越强。所述输入信噪比可用于反馈所采集的所述音频通话中的声音信息中的噪声情况,所述输入信噪比的数值越大,表明所采集的所述音频通话中的声音信息中的噪声越大。所述输出信噪比可反映降噪处理的效果,若所述输出信噪比的数值达到期望状态值时,表明降噪处理的效果达到期望状态,即降噪处理既使噪音降低到合适的范围同时又未损耗正常音频成份。所述音量输入数字包络可反映原始音量大小,其中,原始音量指所采集到的所述音频通话中的声音信息的音量,所述音量输入数字包络的数值越大,表明原始音量越大。所述音量输出数字包络可反映增益音量大小,其中,增益音量指音量增益处理后输出的音量,所述音量输出数字包络的数值越大,表明增益音量越大。
S103,根据所述音频数据的特征参数分析所述音频数据的处理质量。
根据所述音频数据的特征参数分析所述音频数据的处理质量可包括以下至少一种:根据所述音频数据的回声参数,可分析获得回声消除处理质量;根据所述音频数据的噪声参数,可分析获得降噪处理质量;以及根据所述增益参数,可分析获得音量增益处理质量。
S104,若所述音频数据的处理质量未达到预设质量标准,采用与所述终端相适配的优化数据对所述音频处理算法进行优化。所述优化数据可包括回声消除算法的调节数据、降噪算法的调节数据和音量增益算法的调节数据中的至少一种。
其中,所述预设质量标准可包括:预设回声消除程度范围、预设噪声范围和预设增益音量范围中的至少一种。若所述音频数据的回声消除程度位于所述预设回声消除程度范围内,和/或,若降噪处理后所述音频数据的噪声大小位于所述预设噪声范围内,和/或,所述音频数据的增益音量大小位于所述增益音量范围内,则所述音频数据的处理质量达到预设质量标准。
所述音频数据的处理质量可反映所述音频处理算法的优劣性,具体地,如果所述音频数据的处理质量达到预设质量标准,表明所述音频处理算法无需进行优化;反之,如果所述音频数据的处理质量未达到预设质量标准,表明所述音频处理算法需要进行优化,本步骤则可获取与所述终端相适配的优化数据对所述音频处理算法进行优化,以提升后续对终端中的音频数据进行音频处理的质量和效果。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
请参见图2,为本发明实施例提供的另一种音频处理的性能提升方法的流程图;本实施例的方法流程可以由分布运行于终端和服务器中的音频处理的性能提升装置所执行,该装置通过分布在终端与服务器中的模块使终端与服务器交互,从而实现本实施例的音频处理的性能提升方法;该方法可包括以下步骤S201-步骤S104。
S201,当终端中存在音频通话时,终端采集所述音频通话中的声音信息。
终端侧用户可使用终端中的互联网应用与其他用户进行音频通话,所述音频通话可包括但不限于:语音电话、音视频聊天通话等等。本步骤中,当终端中存在音频通话时,终端可调用诸如声卡等具备音频采集功能的设备,采集音频通话中的声音信息,所述音频通话中的声音信息可包括但不限于:语音电话中通话者说话的声音信息或通话者所播放的诸如歌曲、音视频等的声音信息,以及音视频聊天通话中聊天者说话的声音信息或聊天者所播放的诸如歌曲、音视频等的声音信息等等。
S202,所述终端将所述声音信息转换为所述音频数据。
所述终端所采集的音频通话中的声音信息为模拟信号,为了便于音频处理,本步骤中终端需要将模拟的声音信息转换为数字信号,即所述终端将所采集的模拟的所述音频通话中的声音信息转换为数字的所述音频通话中的音频数据。
S203,所述终端采用音频处理算法对所述音频数据进行处理,获得所述音频数据的特征参数。
所述音频处理算法包括:回声消除算法、降噪算法和音量增益算法中的至少一种。所述音频数据的特征参数包括:回声参数、噪声参数和增益参数中的至少一种。本步骤中,所述终端采用音频处理算法对所述音频数据进行处理,获得所述音频数据的特征参数可包括以下几种可行的实施方式:
在一种实施方式中,所述终端采用回声消除算法对所述音频数据进行回声消除处理;所述终端记录回声消除处理过程所获得的回声参数。
回声消除处理的目的在于消除或降低终端侧用户所听到的回声,以提升音频通话的质量。其中,所述回声消除算法可包括但不限于:LMS(Least mean square,最小均方)算法、NLMS(Normalized Least mean square,归一化最小均方)算法等等。所述回声消除算法的核心在于协调音频通话的终端之间的远端时延、近端时延的问题。所述回声参数包括:回声处理持续时间、回声往返损耗和回声往返损耗增强。所述回声处理持续时间表示回声消除处理所用的时长。所述回声往返损耗可反映回声消除处理的能力,所述回声往返损耗的数值越小,表明所述回声消除处理得越干净,表明回声消除处理的能力越强。所述回声往返损耗增强可反映回声消除处理的能力,所述回声往返损耗增强的数值越大,表明所述回声消除处理得越干净,表明回声消除处理的能力越强。
在另一种实施方式中,所述终端采用降噪算法对所述音频数据进行降噪处理,并根据降噪处理过程计算噪声参数。
降噪处理的目的在于降低所述音频通话过程中的噪声,以提升所述音频质量。所述降噪算法可包括但不限于:MATLAB(Matrix Laboratory,矩阵实验室)算法、LMS算法等等。所述降噪算法的核心在于设置噪声检测阀值,降噪处理过程中根据所述噪声检测阀值过滤噪声,即将超过噪声检测阀值的噪声过滤掉。所述噪声检测阀值决定了降噪处理的程度及正常音频成份的损耗度;比如如果噪声检测阀值设置过小,将导致降噪处理质量较差,降噪效果不明显;如果噪声检测阀值设置过大,可提升降噪效果,但同时可能提高正常音频成份的损耗度。所述噪声参数包括:输入信噪比和输出信噪比。本实施方式中,所述终端可以计算所述音频数据在降噪处理前的输入信噪比,以及计算所述音频数据在降噪处理后的输出信噪比。所述输入信噪比可用于反馈所采集的所述音频通话中的声音信息中的噪声情况,所述输入信噪比的数值越大,表明所采集的所述音频通话中的声音信息中的噪声越大。所述输出信噪比可反映降噪处理的效果,若所述输出信噪比的数值达到期望状态值时,表明降噪处理的效果达到期望状态,即降噪处理既使噪音降低到合适的范围同时又未损耗正常音频成份。
在又一种实施方式中,所述终端采用音量增益处理算法对所述音频数据进行音量增益处理,并根据音量增益处理过程统计增益参数。
音量增益处理的目的在于将所述音频通话过程中的音量调节至终端侧用户正常收听的音量范围,以提升音频通话的质量。所述音量增益处理算法的核心在于设置增益倍数,即增益音量与原始音量的比值。所述增益参数包括:音量输入数字包络和音量输出数字包络。所述音量输入数字包络可反映原始音量大小,其中,原始音量指所采集到的所述音频通话中的声音信息的音量,所述音量输入数字包络的数值越大,表明原始音量越大。所述音量输出数字包络可反映增益音量大小,其中,增益音量指音量增益处理后输出的音量,所述音量输出数字包络的数值越大,表明增益音量越大。
S204,所述终端将所述音频数据的特征参数上报至服务器。
所述终端与所述服务器之间可以采用有线或无线的方式进行通信连接,所述终端可基于与所述服务器之间的通信连接,将所述音频数据的特征参数上报至服务器。
S205,所述服务器接收终端上报的音频数据的特征参数。所述服务器可基于与所述终端之间的通信连接,接收所述终端上报的所述音频数据的特征参数。
S206,所述服务器根据所述音频数据的特征参数分析所述音频数据的处理质量。
本步骤中,所述服务器根据所述音频数据的特征参数分析所述音频数据的处理质量可包括以下几种可行的实施方式:
在一种实施方式中,所述服务器根据所述回声处理持续时间、所述回声往返损耗和所述回声往返损耗增强,确定所述音频数据的回声消除程度。
具体实现中,所述服务器可根据实际需要设置相应的阈值,例如:所述服务器可根据经验设置时间阀值,如果所述回声处理持续时间大于所述预设时间阀值,表明所述终端采用回声消除算法对所述音频数据进行回声消除处理时所耗费的时间较长,回声消除处理质量较差;再如:所述服务器可根据经验设置损耗阀值,若所述回声往返损耗的数值大于所述损耗阀值,表明所述终端采用回声消除算法对所述音频数据进行回声消除不够干净,回声消除处理质量较差;又如:所述服务器可根据经验设置损耗增强阀值,若所述回声往返损耗增强的数值小于所述损耗增强阀值,表明所述终端采用回声消除算法对所述音频数据进行回声消除不够干净,回声消除处理质量较差。
在另一种实施方式中,所述服务器根据所述输入信噪比,确定降噪处理前所述音频数据的噪声大小,并根据所述输出信噪比,确定降噪处理后所述音频数据的噪声大小。
所述输入信噪比的数值越大,表明所采集的所述音频通话中的声音信息中的噪声越大。所述输出信噪比可反映降噪处理的效果,若所述输出信噪比的数值达到期望状态值时,表明降噪处理的效果达到期望状态,即降噪处理既使噪音降低到合适的范围同时又未损耗正常音频成份。本实施方式中,所述服务器可以根据经验设置期望状态值,如果所述输入信噪比的数值表明所采集的所述音频通话中的声音信息中的噪声较大,然而所述输出信噪比的数值小于期望状态值,表明降噪处理的效果未达到期望状态,表明降噪处理质量较差。
在又一种实施方式中,所述服务器根据所述音量输入数字包络,确定所述音频数据的原始音量大小,并根据所述音量输出数字包络,确定所述音频数据的增益音量大小。
所述音量输入数字包络可反映原始音量大小,其中,原始音量指所采集到的所述音频通话中的声音信息的音量,所述音量输入数字包络的数值越大,表明原始音量越大。所述音量输出数字包络可反映增益音量大小,其中,增益音量指音量增益处理后输出的音量,所述音量输出数字包络的数值越大,表明增益音量越大。本实施方式中,所述服务器可以根据经验设置用户收听音量范围,如果所述音量输出数字包络的数值超出用户收听音量范围,表明音量增益处理的效果较差,表明音量增益处理质量较差。
S207,若所述音频数据的处理质量未达到预设质量标准,获取所述终端的机型特征。
其中,所述预设质量标准可包括:预设回声消除程度范围、预设噪声范围和预设增益音量范围中的至少一种。若所述音频数据的回声消除程度位于所述预设回声消除程度范围内,和/或,若降噪处理后所述音频数据的噪声大小位于所述预设噪声范围内,和/或,所述音频数据的增益音量大小位于所述增益音量范围内,则所述音频数据的处理质量达到预设质量标准。其中,所述终端的机型特征可包括但不限于:所述终端的型号信息、所述终端的Rom信息、所述终端的厂商信息、所述终端的内核信息和所述终端的声卡信息中的任一种或多种。本步骤中,所述服务器从所述终端处获取所述终端的机型特征,具体地,所述服务器可要求所述终端进行机型特征上报,所述终端根据所述服务器的要求提取自身的机型特征,并上报至所述服务器。
S208,所述服务器从数据库中查找与所述终端的机型特征相适配的优化数据。
所述数据库中可预先存储至少一种终端的机型特征,以及每种终端的机型特征对应的优化数据。所述优化数据可包括回声消除算法的调节数据、降噪算法的调节数据和音量增益算法的调节数据中的至少一种。其中,所述回声消除算法的调节数据可以为远端或近端时延;所述降噪算法的调节数据可以为噪声检测阀值;所述音量增益算法的调节数据可以为增益倍数。本步骤中,所述服务器可从数据库中查找与所述终端的机型特征相适配的优化数据。
S209,所述服务器将所述优化数据返回至所述终端。所述服务器可基于与所述终端之间的通信连接,将所述优化数据返回至所述终端。
S210,所述终端采用所述优化数据对所述音频处理算法进行调节。
具体实现中,若所述回声消除算法需要进行优化,所述终端采用所述回声消除算法的调节数据对所述回声消除算法进行优化;若所述降噪算法需要进行优化,所述终端采用所述降噪算法的调节数据对所述降噪算法进行优化;若所述音量增益算法需要进行优化,所述终端可以采用所述音量增益算法的调节数据对所述音量增益算法进行优化。
需要说明的是,所述终端对所述音频处理算法进行调节的过程可以为:直接采用调节数据替换原音频处理算法中的相应数据;或者,根据所述调节数据对原音频处理算法中的相应数据进行调整。所述终端的调节过程可包括:
(1)通常,进行所述音频通话的终端之间因为远端时延或近端时延的问题,会影响回声消除算法的回声消除处理质量。所述终端可通过调节在所述音频通话中的音频数据的远端时延或近端时延,实现对回声消除算法的优化。
(2)通常,降噪算法的核心在于噪声检测阀值,降噪处理根据噪声检测阀值过滤噪声,噪声检测阀值决定了降噪处理的程度及正常音频成份的损耗度;比如如果噪声检测阀值设置过小,将导致降噪处理质量较差,降噪效果不明显;如果噪声检测阀值设置过大,可提升降噪效果,但同时可能提高正常音频成份的损耗度。所述终端可调节所述噪声检测阀值,从而实现对降噪算法的优化。
(3)通常,音量增益算法的核心在于增益倍数,即增益音量与原始音量的比值。所述终端可以通过调节增益倍数,实现对音量增益算法的优化。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
下面将结合附图3-附图7,对本发明实施例提供的音频处理的性能提升装置的结构和功能进行详细介绍。需要说明的是,下述附图3-附图7的所示的装置可以运行于终端中,也可以运行于服务器中,或者可分布运行于终端和服务器中,以被应用于执行上述附图1-附图2所示的方法。
请参见图3,为本发明实施例提供的一种音频处理的性能提升装置的结构示意图;该装置可包括:获取单元101、音频处理单元102、分析单元103和优化单元104。
获取单元101,用于获取终端中的音频通话中的音频数据。
终端侧用户可使用终端中的互联网应用与其他用户进行音频通话,所述音频通话可包括但不限于:语音电话、音视频聊天通话等等。当终端中存在音频通话时,所述获取单元101可采集音频通话中的声音信息,所述音频通话中的声音信息可包括但不限于:语音电话中通话者说话的声音信息或通话者所播放的诸如歌曲、音视频等的声音信息,以及音视频聊天通话中聊天者说话的声音信息或聊天者所播放的诸如歌曲、音视频等的声音信息等等。其中,所采集的音频通话中的声音信息为模拟信号,为了便于音频处理,所述获取单元101需要将模拟的声音信息转换为数字信号,即将所采集的模拟的所述音频通话中的声音信息转换为数字的所述音频通话中的音频数据。
音频处理单元102,用于采用音频处理算法对所述音频数据进行处理,获得所述音频数据的特征参数。
所述音频处理算法可包括但不限于:回声消除算法、降噪算法和音量增益算法中的至少一种。所述音频处理单元102采用音频处理算法对所述音频数据进行的处理可包括以下至少一种:采用回声消除算法对所述音频数据进行回声消除处理;采用降噪算法对所述音频数据进行降噪处理;以及采用音量增益算法对所述音频数据进行音量增益处理。
所述音频数据的特征参数包括:回声参数、噪声参数和增益参数中的至少一种。所述回声参数包括:回声处理持续时间、回声往返损耗和回声往返损耗增强;所述噪声参数包括:输入信噪比和输出信噪比;所述增益参数包括:音量输入数字包络和音量输出数字包络。其中,所述回声处理持续时间表示回声消除处理所用的时长。所述回声往返损耗可反映回声消除处理的能力,所述回声往返损耗的数值越小,表明所述回声消除处理得越干净,表明回声消除处理的能力越强。所述回声往返损耗增强可反映回声消除处理的能力,所述回声往返损耗增强的数值越大,表明所述回声消除处理得越干净,表明回声消除处理的能力越强。所述输入信噪比可用于反馈所采集的所述音频通话中的声音信息中的噪声情况,所述输入信噪比的数值越大,表明所采集的所述音频通话中的声音信息中的噪声越大。所述输出信噪比可反映降噪处理的效果,若所述输出信噪比的数值达到期望状态值时,表明降噪处理的效果达到期望状态,即降噪处理既使噪音降低到合适的范围同时又未损耗正常音频成份。所述音量输入数字包络可反映原始音量大小,其中,原始音量指所采集到的所述音频通话中的声音信息的音量,所述音量输入数字包络的数值越大,表明原始音量越大。所述音量输出数字包络可反映增益音量大小,其中,增益音量指音量增益处理后输出的音量,所述音量输出数字包络的数值越大,表明增益音量越大。
分析单元103,用于根据所述音频数据的特征参数分析所述音频数据的处理质量。
根据所述音频数据的特征参数分析所述音频数据的处理质量可包括以下至少一种:根据所述音频数据的回声参数,可分析获得回声消除处理质量;根据所述音频数据的噪声参数,可分析获得降噪处理质量;以及根据所述增益参数,可分析获得音量增益处理质量。
优化单元104,用于根据所述音频数据的特征参数分析所述音频数据的处理质量。
所述优化数据可包括回声消除算法的调节数据、降噪算法的调节数据和音量增益算法的调节数据中的至少一种。其中,所述预设质量标准可包括:预设回声消除程度范围、预设噪声范围和预设增益音量范围中的至少一种。若所述音频数据的回声消除程度位于所述预设回声消除程度范围内,和/或,若降噪处理后所述音频数据的噪声大小位于所述预设噪声范围内,和/或,所述音频数据的增益音量大小位于所述增益音量范围内,则所述音频数据的处理质量达到预设质量标准。
所述音频数据的处理质量可反映所述音频处理算法的优劣性,具体地,如果所述音频数据的处理质量达到预设质量标准,表明所述音频处理算法无需进行优化;反之,如果所述音频数据的处理质量未达到预设质量标准,表明所述音频处理算法需要进行优化,所述优化单元104可获取与所述终端相适配的优化数据对所述音频处理算法进行优化,以提升后续对终端中的音频数据进行音频处理的质量和效果。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
请参见图4,为图3所示的获取单元的实施例的结构示意图;该获取单元101可包括:声音采集单元1001和转换单元1002。
声音采集单元1001,用于当终端中存在音频通话时,采集所述音频通话中的声音信息。
终端侧用户可使用终端中的互联网应用与其他用户进行音频通话,所述音频通话可包括但不限于:语音电话、音视频聊天通话等等。当终端中存在音频通话时,所述声音采集单元1001可调用诸如终端的声卡等具备音频采集功能的设备,采集音频通话中的声音信息,所述音频通话中的声音信息可包括但不限于:语音电话中通话者说话的声音信息或通话者所播放的诸如歌曲、音视频等的声音信息,以及音视频聊天通话中聊天者说话的声音信息或聊天者所播放的诸如歌曲、音视频等的声音信息等等。
转换单元1002,用于将所述声音信息转换为所述音频数据。
所采集的音频通话中的声音信息为模拟信号,为了便于音频处理,所述转换单元1002终端需要将模拟的声音信息转换为数字信号,即所述终端将所采集的模拟的所述音频通话中的声音信息转换为数字的所述音频通话中的音频数据。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
请参见图5a,为图3所示的音频处理单元的一个实施例的结构示意图;该音频处理单元102可包括:回声消除处理单元2001和回声参数记录单元2002。
回声消除处理单元2001,用于采用回声消除算法对所述音频数据进行回声消除处理。
回声消除处理的目的在于消除或降低终端侧用户所听到的回声,以提升音频通话的质量。其中,所述回声消除算法可包括但不限于:LMS算法、NLMS算法等等。所述回声消除算法的核心在于协调音频通话的终端之间的远端时延、近端时延的问题。
回声参数记录单元2002,用于记录回声消除处理过程所获得的回声参数。
所述回声参数包括:回声处理持续时间、回声往返损耗和回声往返损耗增强。所述回声处理持续时间表示回声消除处理所用的时长。所述回声往返损耗可反映回声消除处理的能力,所述回声往返损耗的数值越小,表明所述回声消除处理得越干净,表明回声消除处理的能力越强。所述回声往返损耗增强可反映回声消除处理的能力,所述回声往返损耗增强的数值越大,表明所述回声消除处理得越干净,表明回声消除处理的能力越强。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
请参见图5b,为图3所示的音频处理单元的另一个实施例的结构示意图;该音频处理单元102可包括:降噪处理单元2011和噪声参数计算单元2012。
降噪处理单元2011,用于采用降噪算法对所述音频数据进行降噪处理。
降噪处理的目的在于降低所述音频通话过程中的噪声,以提升所述音频质量。所述降噪算法可包括但不限于:MATLAB算法、LMS算法等等。所述降噪算法的核心在于设置噪声检测阀值,降噪处理过程中根据所述噪声检测阀值过滤噪声,即将超过噪声检测阀值的噪声过滤掉。所述噪声检测阀值决定了降噪处理的程度及正常音频成份的损耗度;比如如果噪声检测阀值设置过小,将导致降噪处理质量较差,降噪效果不明显;如果噪声检测阀值设置过大,可提升降噪效果,但同时可能提高正常音频成份的损耗度。
噪声参数计算单元2012,用于根据降噪处理过程计算噪声参数。
所述噪声参数包括:输入信噪比和输出信噪比。本实施方式中,所述终端可以计算所述音频数据在降噪处理前的输入信噪比,以及计算所述音频数据在降噪处理后的输出信噪比。所述输入信噪比可用于反馈所采集的所述音频通话中的声音信息中的噪声情况,所述输入信噪比的数值越大,表明所采集的所述音频通话中的声音信息中的噪声越大。所述输出信噪比可反映降噪处理的效果,若所述输出信噪比的数值达到期望状态值时,表明降噪处理的效果达到期望状态,即降噪处理既使噪音降低到合适的范围同时又未损耗正常音频成份。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
请参见图5c,为图3所示的音频处理单元的又一个实施例的结构示意图;该音频处理单元102可包括:音量增益处理单元2111和增益参数统计单元2112。
音量增益处理单元2111,用于采用音量增益处理算法对所述音频数据进行音量增益处理。
音量增益处理的目的在于将所述音频通话过程中的音量调节至终端侧用户正常收听的音量范围,以提升音频通话的质量。所述音量增益处理算法的核心在于设置增益倍数,即增益音量与原始音量的比值。
增益参数统计单元2112,用于根据音量增益处理过程统计增益参数。
所述增益参数包括:音量输入数字包络和音量输出数字包络。所述音量输入数字包络可反映原始音量大小,其中,原始音量指所采集到的所述音频通话中的声音信息的音量,所述音量输入数字包络的数值越大,表明原始音量越大。所述音量输出数字包络可反映增益音量大小,其中,增益音量指音量增益处理后输出的音量,所述音量输出数字包络的数值越大,表明增益音量越大。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
请参见图6,为图3所示的分析单元的实施例的结构示意图;该分析单元103可包括:回声处理分析单元,3001和/或噪声处理分析单元3002,和/或增益处理分析单元3003。
回声处理分析单元3001,用于根据所述回声处理持续时间、所述回声往返损耗和所述回声往返损耗增强,确定所述音频数据的回声消除程度。
具体实现中,所述回声处理分析单元3001可根据实际需要设置相应的阈值,例如:可根据经验设置时间阀值,如果所述回声处理持续时间大于所述预设时间阀值,表明所述回声消除算法对所述音频数据进行回声消除处理时所耗费的时间较长,回声消除处理质量较差;再如:可根据经验设置损耗阀值,若所述回声往返损耗的数值大于所述损耗阀值,表明所述回声消除算法对所述音频数据进行回声消除不够干净,回声消除处理质量较差;又如:可根据经验设置损耗增强阀值,若所述回声往返损耗增强的数值小于所述损耗增强阀值,表明所述回声消除算法对所述音频数据进行回声消除不够干净,回声消除处理质量较差。
噪声处理分析单元3002,用于根据所述输入信噪比,确定降噪处理前所述音频数据的噪声大小,并根据所述输出信噪比,确定降噪处理后所述音频数据的噪声大小。
所述输入信噪比的数值越大,表明所采集的所述音频通话中的声音信息中的噪声越大。所述输出信噪比可反映降噪处理的效果,若所述输出信噪比的数值达到期望状态值时,表明降噪处理的效果达到期望状态,即降噪处理既使噪音降低到合适的范围同时又未损耗正常音频成份。本实施方式中,所述噪声处理分析单元3002可以根据经验设置期望状态值,如果所述输入信噪比的数值表明所采集的所述音频通话中的声音信息中的噪声较大,然而所述输出信噪比的数值小于期望状态值,表明降噪处理的效果未达到期望状态,表明降噪处理质量较差。
增益处理分析单元3003,用于根据所述输入数字包络,确定所述音频数据的原始音量大小,并根据所述输出数字包络,确定所述音频数据的增益音量大小。
所述音量输入数字包络可反映原始音量大小,其中,原始音量指所采集到的所述音频通话中的声音信息的音量,所述音量输入数字包络的数值越大,表明原始音量越大。所述音量输出数字包络可反映增益音量大小,其中,增益音量指音量增益处理后输出的音量,所述音量输出数字包络的数值越大,表明增益音量越大。本实施方式中,所述增益处理分析单元3003可以根据经验设置用户收听音量范围,如果所述音量输出数字包络的数值超出用户收听音量范围,表明音量增益处理的效果较差,表明音量增益处理质量较差。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
请参见图7,为图3所示的优化单元的实施例的结构示意图;该优化单元104可包括:机型特征获取单元4001、数据查找单元4002和调节单元4003。
机型特征获取单元4001,用于若所述音频数据的处理质量未达到预设质量标准,获取所述终端的机型特征。
其中,所述预设质量标准可包括:预设回声消除程度范围、预设噪声范围和预设增益音量范围中的至少一种。若所述音频数据的回声消除程度位于所述预设回声消除程度范围内,和/或,若降噪处理后所述音频数据的噪声大小位于所述预设噪声范围内,和/或,所述音频数据的增益音量大小位于所述增益音量范围内,则所述音频数据的处理质量达到预设质量标准。其中,所述终端的机型特征可包括但不限于:所述终端的型号信息、所述终端的Rom信息、所述终端的厂商信息、所述终端的内核信息和所述终端的声卡信息中的任一种或多种。
数据查找单元4002,用于从数据库中查找与所述终端的机型特征相适配的优化数据,所述优化数据包括回声消除算法的调节数据、降噪算法的调节数据和音量增益算法的调节数据中的至少一种。
所述数据库中可预先存储至少一种终端的机型特征,以及每种终端的机型特征对应的优化数据。所述优化数据可包括回声消除算法的调节数据、降噪算法的调节数据和音量增益算法的调节数据中的至少一种。其中,所述回声消除算法的调节数据可以为远端或近端时延;所述降噪算法的调节数据可以为噪声检测阀值;所述音量增益算法的调节数据可以为增益倍数。所述数据查找单元4002可从数据库中查找与所述终端的机型特征相适配的优化数据。
调节单元4003,用于采用所述优化数据对所述音频处理算法进行调节。
具体实现中,若所述回声消除算法需要进行优化,所述调节单元4003采用所述回声消除算法的调节数据对所述回声消除算法进行优化;若所述降噪算法需要进行优化,所述调节单元4003采用所述降噪算法的调节数据对所述降噪算法进行优化;若所述音量增益算法需要进行优化,所述调节单元4003可以采用所述音量增益算法的调节数据对所述音量增益算法进行优化。
需要说明的是,所述调节单元4003对所述音频处理算法进行调节的过程可以为:直接采用调节数据替换原音频处理算法中的相应数据;或者,根据所述调节数据对原音频处理算法中的相应数据进行调整。所述调节单元4003的调节过程可包括:
(1)通常,进行所述音频通话的终端之间因为远端时延或近端时延的问题,会影响回声消除算法的回声消除处理质量。所述调节单元4003可通过调节在所述音频通话中的音频数据的远端时延或近端时延,实现对回声消除算法的优化。
(2)通常,降噪算法的核心在于噪声检测阀值,降噪处理根据噪声检测阀值过滤噪声,噪声检测阀值决定了降噪处理的程度及正常音频成份的损耗度;比如如果噪声检测阀值设置过小,将导致降噪处理质量较差,降噪效果不明显;如果噪声检测阀值设置过大,可提升降噪效果,但同时可能提高正常音频成份的损耗度。所述调节单元4003可调节所述噪声检测阀值,从而实现对降噪算法的优化。
(3)通常,音量增益算法的核心在于增益倍数,即增益音量与原始音量的比值。所述调节单元4003可以通过调节增益倍数,实现对音量增益算法的优化。
本发明实施例可采用音频处理算法对终端中的音频通话中的音频数据进行处理,通过音频处理可有效提升音频通话过程中的音质;另外,根据音频处理获得的音频数据的特征参数分析所述音频数据的处理质量,并在处理质量未达到预设质量标准时,采用与终端相适配的优化数据对音频处理算法进行优化,能够不断完善音频处理过程,提升音频处理质量,保证音质效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (14)
1.一种音频处理的性能提升方法,其特征在于,包括:
获取终端中的音频通话中的音频数据;
采用音频处理算法对所述音频数据进行处理,以获得所述音频数据的特征参数;
根据所述音频数据的特征参数分析所述音频数据的处理质量;
若所述音频数据的处理质量未达到预设质量标准,采用与所述终端相适配的优化数据对所述音频处理算法进行优化,包括:
若所述音频数据的处理质量未达到预设质量标准,获取所述终端的机型特征;
从数据库中查找与所述终端的机型特征相适配的优化数据;其中,所述数据库中预先存储至少一种终端的机型特征,以及每种终端的机型特征对应的优化数据;
采用所述优化数据对所述音频处理算法进行调节;
所述采用所述优化数据对所述音频处理算法进行调节包括通过调节在所述音频通话中的音频数据的远端时延或近端时延以实现对回声消除算法的优化、通过调节噪声检测阀值以实现对降噪算法的优化,以及通过调节增益倍数以实现对音量增益算法的优化。
2.如权利要求1所述的方法,其特征在于,所述获取终端中的音频通话中的音频数据,包括:
当终端中存在音频通话时,采集所述音频通话中的声音信息;
将所述声音信息转换为所述音频数据。
3.如权利要求1或2所述的方法,其特征在于,所述音频处理算法包括:回声消除算法、降噪算法和音量增益算法中的至少一种;
所述音频数据的特征参数包括:回声参数、噪声参数和增益参数中的至少一种;
所述回声参数包括:回声处理持续时间、回声往返损耗和回声往返损耗增强;所述噪声参数包括:输入信噪比和输出信噪比;所述增益参数包括:音量输入数字包络和音量输出数字包络。
4.如权利要求3所述的方法,其特征在于,所述采用音频处理算法对所述音频数据进行处理,以获得所述音频数据的特征参数,包括:
采用回声消除算法对所述音频数据进行回声消除处理,并记录回声消除处理过程所获得的回声参数;和/或,
采用降噪算法对所述音频数据进行降噪处理,并根据降噪处理过程计算噪声参数;和/或,
采用音量增益处理算法对所述音频数据进行音量增益处理,并根据音量增益处理过程统计增益参数。
5.如权利要求4所述的方法,其特征在于,所述根据所述音频数据的特征参数分析所述音频数据的处理质量,包括:
根据所述回声处理持续时间、所述回声往返损耗和所述回声往返损耗增强,确定所述音频数据的回声消除程度;和/或,
根据所述输入信噪比,确定降噪处理前所述音频数据的噪声大小,并根据所述输出信噪比,确定降噪处理后所述音频数据的噪声大小;和/或,
根据所述输入数字包络,确定所述音频数据的原始音量大小,并根据所述输出数字包络,确定所述音频数据的增益音量大小。
6.如权利要求5所述的方法,其特征在于,所述预设质量标准包括:预设回声消除程度范围、预设噪声范围和预设增益音量范围中的至少一种;
若所述音频数据的回声消除程度位于所述预设回声消除程度范围内,和/或,若降噪处理后所述音频数据的噪声大小位于所述预设噪声范围内,和/或,所述音频数据的增益音量大小位于所述增益音量范围内,则所述音频数据的处理质量达到预设质量标准。
7.如权利要求6所述的方法,其特征在于,
所述优化数据包括回声消除算法的调节数据、降噪算法的调节数据和音量增益算法的调节数据中的至少一种。
8.一种音频处理的性能提升装置,其特征在于,包括:
获取单元,用于获取终端中的音频通话中的音频数据;
音频处理单元,用于采用音频处理算法对所述音频数据进行处理,以获得所述音频数据的特征参数;
分析单元,用于根据所述音频数据的特征参数分析所述音频数据的处理质量;
优化单元,用于若所述音频数据的处理质量未达到预设质量标准,采用与所述终端相适配的优化数据对所述音频处理算法进行优化;
所述优化单元包括:机型特征获取单元,用于若所述音频数据的处理质量未达到预设质量标准,获取所述终端的机型特征;数据查找单元,用于从数据库中查找与所述终端的机型特征相适配的优化数据;调节单元,用于采用所述优化数据对所述音频处理算法进行调节;其中,所述数据库中预先存储至少一种终端的机型特征,以及每种终端的机型特征对应的优化数据;
所述采用所述优化数据对所述音频处理算法进行调节包括通过调节在所述音频通话中的音频数据的远端时延或近端时延以实现对回声消除算法的优化、通过调节噪声检测阀值以实现对降噪算法的优化,以及通过调节增益倍数以实现对音量增益算法的优化。
9.如权利要求8所述的装置,其特征在于,所述获取单元包括:
声音采集单元,用于当终端中存在音频通话时,采集所述音频通话中的声音信息;
转换单元,用于将所述声音信息转换为所述音频数据。
10.如权利要求8或9所述的装置,其特征在于,所述音频处理算法包括:回声消除算法、降噪算法和音量增益算法中的至少一种;
所述音频数据的特征参数包括:回声参数、噪声参数和增益参数中的至少一种;
所述回声参数包括:回声处理持续时间、回声往返损耗和回声往返损耗增强;所述噪声参数包括:输入信噪比和输出信噪比;所述增益参数包括:音量输入数字包络和音量输出数字包络。
11.如权利要求10所述的装置,其特征在于,所述音频处理单元包括:
回声消除处理单元,用于采用回声消除算法对所述音频数据进行回声消除处理;
回声参数记录单元,用于记录回声消除处理过程所获得的回声参数;和/或,
所述音频处理单元包括:
降噪处理单元,用于采用降噪算法对所述音频数据进行降噪处理;
噪声参数计算单元,用于根据降噪处理过程计算噪声参数;和/或,
所述音频处理单元包括:
音量增益处理单元,用于采用音量增益处理算法对所述音频数据进行音量增益处理;
增益参数统计单元,用于根据音量增益处理过程统计增益参数。
12.如权利要求11所述的装置,其特征在于,所述分析单元包括:
回声处理分析单元,用于根据所述回声处理持续时间、所述回声往返损耗和所述回声往返损耗增强,确定所述音频数据的回声消除程度;和/或,
噪声处理分析单元,用于根据所述输入信噪比,确定降噪处理前所述音频数据的噪声大小,并根据所述输出信噪比,确定降噪处理后所述音频数据的噪声大小;和/或,
增益处理分析单元,用于根据所述输入数字包络,确定所述音频数据的原始音量大小,并根据所述输出数字包络,确定所述音频数据的增益音量大小。
13.如权利要求12所述的装置,其特征在于,所述预设质量标准包括:预设回声消除程度范围、预设噪声范围和预设增益音量范围中的至少一种,
若所述音频数据的回声消除程度位于所述预设回声消除程度范围内,和/或,若降噪处理后所述音频数据的噪声大小位于所述预设噪声范围内,和/或,所述音频数据的增益音量大小位于所述增益音量范围内,则所述音频数据的处理质量达到预设质量标准。
14.如权利要求13所述的装置,其特征在于,所述优化数据包括回声消除算法的调节数据、降噪算法的调节数据和音量增益算法的调节数据中的至少一种。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510239444.5A CN104980337B (zh) | 2015-05-12 | 2015-05-12 | 一种音频处理的性能提升方法及装置 |
PCT/CN2016/078463 WO2016180100A1 (zh) | 2015-05-12 | 2016-04-05 | 一种音频处理的性能提升方法及装置 |
AU2016260156A AU2016260156B2 (en) | 2015-05-12 | 2016-04-05 | Method and device for improving audio processing performance |
US15/664,857 US10522164B2 (en) | 2015-05-12 | 2017-07-31 | Method and device for improving audio processing performance |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510239444.5A CN104980337B (zh) | 2015-05-12 | 2015-05-12 | 一种音频处理的性能提升方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104980337A CN104980337A (zh) | 2015-10-14 |
CN104980337B true CN104980337B (zh) | 2019-11-22 |
Family
ID=54276466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510239444.5A Active CN104980337B (zh) | 2015-05-12 | 2015-05-12 | 一种音频处理的性能提升方法及装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10522164B2 (zh) |
CN (1) | CN104980337B (zh) |
AU (1) | AU2016260156B2 (zh) |
WO (1) | WO2016180100A1 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104980337B (zh) | 2015-05-12 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 一种音频处理的性能提升方法及装置 |
CN105933841A (zh) * | 2016-04-29 | 2016-09-07 | 四川数字工匠科技有限公司 | 多媒体智能扩声系统 |
KR102146816B1 (ko) * | 2016-06-30 | 2020-08-21 | 구글 엘엘씨 | 모바일 디바이스들에서 비선형 반향 제거를 위한 이중 크기 처리 프레임워크 |
CN107426200B (zh) * | 2017-07-13 | 2020-10-23 | 广州市百果园网络科技有限公司 | 一种多媒体数据处理方法和装置 |
US11488615B2 (en) * | 2018-05-21 | 2022-11-01 | International Business Machines Corporation | Real-time assessment of call quality |
CN109817237A (zh) * | 2019-03-06 | 2019-05-28 | 小雅智能平台(深圳)有限公司 | 一种音频自动处理方法、终端及计算机可读存储介质 |
CN110324917A (zh) * | 2019-07-02 | 2019-10-11 | 北京分音塔科技有限公司 | 具有拾音功能的移动热点设备 |
CN111182118B (zh) * | 2020-01-03 | 2021-05-25 | 维沃移动通信有限公司 | 一种音量调节方法及电子设备 |
CN111212372B (zh) * | 2020-01-09 | 2022-03-11 | 广州视声智能科技有限公司 | 一种音频通话类产品自动测试和校准方法及装置 |
CN113299310B (zh) * | 2020-02-21 | 2022-05-13 | 阿里巴巴集团控股有限公司 | 声音信号处理方法、装置、电子设备及可读存储介质 |
CN112333530B (zh) * | 2020-05-18 | 2022-11-15 | 深圳Tcl新技术有限公司 | 音频调节方法、设备及计算机可读存储介质 |
US11853641B2 (en) * | 2020-08-26 | 2023-12-26 | Hearmecheer, Inc. | System and method for audio combination and playback |
CN112202778B (zh) * | 2020-09-30 | 2022-09-23 | 联想(北京)有限公司 | 一种信息处理方法、装置和电子设备 |
CN112489672A (zh) * | 2020-10-23 | 2021-03-12 | 盘正荣 | 一种虚拟隔音通信系统与方法 |
CN113113046B (zh) * | 2021-04-14 | 2024-01-19 | 杭州网易智企科技有限公司 | 音频处理的性能检测方法、装置、存储介质及电子设备 |
CN114666706B (zh) * | 2021-11-30 | 2024-05-14 | 北京达佳互联信息技术有限公司 | 音效增强方法、装置及系统 |
CN114650238B (zh) * | 2022-03-03 | 2024-09-20 | 随锐科技集团股份有限公司 | 用于检测通话状态的方法、装置、设备及可读存储介质 |
CN117079634B (zh) * | 2023-10-16 | 2023-12-22 | 深圳波洛斯科技有限公司 | 一种音频主动降噪方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102089815A (zh) * | 2008-07-09 | 2011-06-08 | Nxp股份有限公司 | 数字处理音频信号的方法和设备以及计算机程序产品 |
CN102196077A (zh) * | 2010-03-03 | 2011-09-21 | 英华达(南京)科技有限公司 | 实时音频校准方法 |
CN104750494A (zh) * | 2014-12-26 | 2015-07-01 | 深圳市微纳集成电路与系统应用研究院 | 处理器及其音频处理方法 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4283212B2 (ja) * | 2004-12-10 | 2009-06-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 雑音除去装置、雑音除去プログラム、及び雑音除去方法 |
US20060221942A1 (en) * | 2005-03-31 | 2006-10-05 | Frank Fruth | Intelligent voice network monitoring |
US7843991B2 (en) * | 2005-04-21 | 2010-11-30 | Qualcomm Incorporated | Methods and apparatus for monitoring voice quality on a wireless communication device |
US20060282264A1 (en) * | 2005-06-09 | 2006-12-14 | Bellsouth Intellectual Property Corporation | Methods and systems for providing noise filtering using speech recognition |
US7555075B2 (en) * | 2006-04-07 | 2009-06-30 | Freescale Semiconductor, Inc. | Adjustable noise suppression system |
US8326620B2 (en) * | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US7873069B2 (en) * | 2007-03-12 | 2011-01-18 | Avaya Inc. | Methods and apparatus for controlling audio characteristics of networked voice communications devices |
US20090012786A1 (en) * | 2007-07-06 | 2009-01-08 | Texas Instruments Incorporated | Adaptive Noise Cancellation |
KR101034554B1 (ko) * | 2008-07-24 | 2011-05-12 | 삼성전자주식회사 | 휴대단말의 통화품질 제어 방법 및 장치 |
US9343073B1 (en) * | 2010-04-20 | 2016-05-17 | Knowles Electronics, Llc | Robust noise suppression system in adverse echo conditions |
US8831937B2 (en) * | 2010-11-12 | 2014-09-09 | Audience, Inc. | Post-noise suppression processing to improve voice quality |
JP6064600B2 (ja) * | 2010-11-25 | 2017-01-25 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
KR20120078838A (ko) * | 2011-01-03 | 2012-07-11 | 삼성전자주식회사 | 휴대단말의 영상통화 제공 방법 및 장치 |
KR101866774B1 (ko) * | 2011-12-22 | 2018-06-19 | 삼성전자주식회사 | 휴대용 단말기에서 음량을 조절하기 위한 장치 및 방법 |
US8965005B1 (en) * | 2012-06-12 | 2015-02-24 | Amazon Technologies, Inc. | Transmission of noise compensation information between devices |
CN104378774A (zh) * | 2013-08-15 | 2015-02-25 | 中兴通讯股份有限公司 | 一种语音质量处理的方法及装置 |
US9837102B2 (en) * | 2014-07-02 | 2017-12-05 | Microsoft Technology Licensing, Llc | User environment aware acoustic noise reduction |
CN104217728A (zh) * | 2014-09-09 | 2014-12-17 | 联想(北京)有限公司 | 一种音频处理方法及电子设备 |
CN104269177B (zh) * | 2014-09-22 | 2017-11-07 | 联想(北京)有限公司 | 一种语音处理方法及电子设备 |
CN104299622A (zh) * | 2014-09-23 | 2015-01-21 | 深圳市金立通信设备有限公司 | 一种音频处理方法 |
CN104980337B (zh) * | 2015-05-12 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 一种音频处理的性能提升方法及装置 |
KR101735918B1 (ko) * | 2015-05-28 | 2017-05-15 | 라인 가부시키가이샤 | 통화 음질 개선을 위한 시스템 및 방법 |
-
2015
- 2015-05-12 CN CN201510239444.5A patent/CN104980337B/zh active Active
-
2016
- 2016-04-05 AU AU2016260156A patent/AU2016260156B2/en active Active
- 2016-04-05 WO PCT/CN2016/078463 patent/WO2016180100A1/zh active Application Filing
-
2017
- 2017-07-31 US US15/664,857 patent/US10522164B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102089815A (zh) * | 2008-07-09 | 2011-06-08 | Nxp股份有限公司 | 数字处理音频信号的方法和设备以及计算机程序产品 |
CN102196077A (zh) * | 2010-03-03 | 2011-09-21 | 英华达(南京)科技有限公司 | 实时音频校准方法 |
CN104750494A (zh) * | 2014-12-26 | 2015-07-01 | 深圳市微纳集成电路与系统应用研究院 | 处理器及其音频处理方法 |
Also Published As
Publication number | Publication date |
---|---|
AU2016260156B2 (en) | 2018-08-02 |
AU2016260156A1 (en) | 2017-06-29 |
US10522164B2 (en) | 2019-12-31 |
CN104980337A (zh) | 2015-10-14 |
WO2016180100A1 (zh) | 2016-11-17 |
US20170330579A1 (en) | 2017-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104980337B (zh) | 一种音频处理的性能提升方法及装置 | |
CN110246515B (zh) | 回声的消除方法、装置、存储介质及电子装置 | |
CN113766073B (zh) | 会议系统中的啸叫检测 | |
CN107276777B (zh) | 会议系统的音频处理方法及装置 | |
CN104299622A (zh) | 一种音频处理方法 | |
CN107360530B (zh) | 一种回声消除的测试方法和装置 | |
CN104883437B (zh) | 基于环境的语音分析调整提示音量的方法及系统 | |
CN107734126A (zh) | 语音调节方法、装置、终端及存储介质 | |
CN102164203A (zh) | 信息处理设备、方法以及程序 | |
CN104363510B (zh) | 一种播放终端 | |
CN114333912B (zh) | 语音激活检测方法、装置、电子设备和存储介质 | |
CN112185410B (zh) | 音频处理方法及装置 | |
CN103347070B (zh) | 推送语音数据的方法、终端、服务器及系统 | |
CN104284018A (zh) | 一种终端 | |
CN110782914A (zh) | 信号处理方法、装置、终端设备及存储介质 | |
CN112151055B (zh) | 音频处理方法及装置 | |
CN109981482B (zh) | 音频处理方法及装置 | |
CN204117590U (zh) | 语音采集降噪装置以及语音质量评价系统 | |
WO2021143249A1 (zh) | 基于瞬态噪声抑制的音频处理方法、装置、设备及介质 | |
WO2024017110A1 (zh) | 语音降噪方法、模型训练方法、装置、设备、介质及产品 | |
CN107750038B (zh) | 音量调节方法、装置、设备及存储介质 | |
CN107170461B (zh) | 语音信号处理方法及装置 | |
EP4310840A1 (en) | Echo cancellation method and apparatus, device, and storage medium | |
CN111477246A (zh) | 语音处理方法、装置及智能终端 | |
CN115394304B (zh) | 声纹判定方法、装置、系统、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |