[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN108804072A - 音频处理方法、装置、存储介质及终端 - Google Patents

音频处理方法、装置、存储介质及终端 Download PDF

Info

Publication number
CN108804072A
CN108804072A CN201810609905.7A CN201810609905A CN108804072A CN 108804072 A CN108804072 A CN 108804072A CN 201810609905 A CN201810609905 A CN 201810609905A CN 108804072 A CN108804072 A CN 108804072A
Authority
CN
China
Prior art keywords
signal
audio signal
audio
subband
subband signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810609905.7A
Other languages
English (en)
Inventor
彭学杰
刘佳泽
王宇飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kugou Computer Technology Co Ltd
Original Assignee
Guangzhou Kugou Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kugou Computer Technology Co Ltd filed Critical Guangzhou Kugou Computer Technology Co Ltd
Priority to CN201810609905.7A priority Critical patent/CN108804072A/zh
Publication of CN108804072A publication Critical patent/CN108804072A/zh
Priority to PCT/CN2018/117898 priority patent/WO2019237666A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例公开了一种音频处理方法、装置、存储介质及终端,属于计算机技术领域。所述方法包括:获取待处理的第一音频信号;对所述第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,所述预定频率是使用户的听觉系统产生疲劳以及伤害的频率;对所述第二音频信号进行输出。本申请实施例通过对第一音频信号中预定频率以上的音频信号进行剔除,可以使得到的第二音频信号中不包含使用户的听觉系统产生疲劳以及伤害的高音,从而解决了高音对用户的听觉系统造成很大伤害的问题,达到了保护听觉系统的效果。

Description

音频处理方法、装置、存储介质及终端
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种音频处理方法、装置、存储介质及终端。
背景技术
听音乐已经成为人们日常生活中最普遍的休闲娱乐项目。由于长时间使用耳机听音乐会导致用户的听觉系统疲劳,甚至会对听觉系统造成物理伤害,所以,需要在播放音乐时保护用户的听觉系统。
相关技术中,在播放器播放音乐时控制音量,用户可以调低音量,通过减小音量来保护用户的听觉系统。
除了音量之外,过强的高音也会对用户的听觉系统造成很大的伤害。
发明内容
本申请实施例提供了一种音频处理方法、装置、存储介质及终端,用于解决过强的高音也会对用户的听觉系统造成很大的伤害的问题。所述技术方案如下:
第一方面,提供了一种音频处理方法,所述方法包括:
获取待处理的第一音频信号;
对所述第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,所述预定频率是使用户的听觉系统产生疲劳以及伤害的频率;
对所述第二音频信号进行输出。
第二方面,提供了一种音频处理装置,所述装置包括:
获取模块,用于获取待处理的第一音频信号;
处理模块,用于对所述获取模块得到的所述第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,所述预定频率是使用户的听觉系统产生疲劳以及伤害的频率;
输出模块,用于对所述处理模块得到的所述第二音频信号进行输出。
第三方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的音频处理方法。
第四方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如第一方面所述的音频处理方法。
本申请实施例提供的技术方案的有益效果至少包括:
由于预定频率是使用户的听觉系统产生疲劳以及伤害的频率,所以,通过对第一音频信号中预定频率以上的音频信号进行剔除,可以使得到的第二音频信号中不包含会导致听觉系统产生疲劳以及伤害的高音,从而解决了高音对用户的听觉系统造成很大伤害的问题,达到了保护听觉系统的效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的音频处理方法的方法流程图;
图2是本申请另一实施例提供的音频处理方法的方法流程图;
图3是本申请一个实施例提供的音频处理装置的结构框图;
图4是本申请一个实施例提供的终端的结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1,其示出了本申请一个实施例提供的音频处理方法的方法流程图,该音频处理方法可以应用于终端中的播放器中。该音频处理方法,包括:
步骤101,获取待处理的第一音频信号。
步骤102,对第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,预定频率是使用户的听觉系统产生疲劳以及伤害的频率。
步骤103,对第二音频信号进行输出。
综上所述,本申请实施例提供的音频处理方法,由于预定频率是使用户的听觉系统产生疲劳以及伤害的频率,所以,通过对第一音频信号中预定频率以上的音频信号进行剔除,可以使得到的第二音频信号中不包含会导致听觉系统产生疲劳以及伤害的高音,从而解决了高音对用户的听觉系统造成很大伤害的问题,达到了保护听觉系统的效果。
请参考图2,其示出了本申请另一实施例提供的音频处理方法的方法流程图,该音频处理方法可以应用于终端中的播放器中。该音频处理方法,包括:
步骤201,获取第三音频信号和窗函数。
第三音频信号是播放器待播放的音频信号。第三音频信号可以是单独的音频文件,如歌曲、语音等等,也可以是视频文件中的音频文件,如电影或电视剧中的配音、配乐等等,本实施例不对第三音频信号的类型作限定。
窗函数是用于对音频信号进行截断,以便于后续处理的函数。本实施例中的窗函数可以是任意一种窗的窗函数,比如矩形窗的窗函数、三角窗的窗函数、汉宁窗的窗函数、海明窗的窗函数、高斯窗的窗函数等等,本实施例不对窗函数作限定。
其中,每个窗函数包括一个加窗处理时的第一函数W和逆窗处理时的第二函数IW,且W*IW=1。下文以海明窗的窗函数为例进行说明。
在获取到窗函数时,还需要设置窗函数的窗长的数值。其中,当第三音频信号经单声道输出时,窗长的单位为采样个数;当第三音频信号经双声道输出时,窗长的单位为采样对的个数,这里将同时经左声道输出的一个采样值和经右声道输出的一个采样值称为一个采样对。
该窗长用于表示窗函数每次处理的数据的数据个数。在选择窗长时,当选取的窗长过长时,每次处理的数据的数据个数较多,会导致播放卡顿的问题;当选取的窗长过短时,虽然每次处理的数据的数据个数较少,但处理频率会提高,也会导致播放卡顿的问题,从而影响播放效果。所以,可以综合用户需求的播放效果来选择窗长。本实施例中,可以根据经验值将窗长的数值设置为1024,当然也可以设置为其它数值,此处不作赘述。
步骤202,对第三音频信号进行采样。
播放器可以对接收到的第三音频信号进行缓存,再按照设定的采样频率对缓存的第三音频信号进行采样,得到各个采样值。其中,采样频率可以是22.05kHz、44.1kHz、48kHz等等,本实施例不作限定。
步骤203,当每采样得到一个音频帧时,根据窗函数对音频帧进行加窗处理,得到第一音频信号,该音频帧所包含的采样值的数量等于窗函数的窗长的数值。
播放器可以对每个或每对采样值进行缓存,当缓存的采样值的数量大于等于窗函数的窗长的数值时,每次从中取出该窗长对应的数量的采样值,将这些采样值作为一个音频帧。以窗长的数值为1024进行举例,当缓存的采样值的数量大于等于1024时,先取出第1-1024个(或对)采样值作为一个音频帧,再取出第1025-2048个(或对)采样值作为一个音频帧,依此类推,直至从音频信号中取出所有的音频帧后停止。
对于得到的每个音频帧,播放器对该音频帧进行加窗处理。假设音频帧为X,则第一音频信号XW=X*W。
步骤204,将第一音频信号划分成n个子带信号。
其中,n为正整数。当n的数值较大时,虽然每个子带信号的频带较窄,剔除效果较好,但划分成n个子带信号的耗时较长,导致播放器的性能较差;当n的数值较小时,虽然划分成n个子带信号的耗时较短,但每个子带信号的频带较宽,剔除效果不好,所以,可以综合考虑处理效果和播放器的性能来选择n的数值。本实施例中,可以根据经验值将n设置为8,当然也可以设置为其它数值,此处不作赘述。
其中,播放器可以通过多相滤波器将第一音频信号划分成n个子带信号(SUBBAND)。本实施例中,多相滤波器可以是级联的QMF(Quadrature mirror filter,正交镜像滤波器),也可以是其他多相滤波器,此处不作限定。下面对QMF划分子带信号的过程进行介绍。
QMF可以将输入的第一音频信号等分为高低两个子带信号,再分别将这两个子带信号作为输入信号输入QMF,得到四个子带信号,再分别将这四个子带信号作为输入信号输入QMF,得到八个子带信号。
以采样频率为44.1kHz,则得到的八个子带信号如下表一所示。
表一
子带ID 起始频率(Hz) 截止频率(Hz) 中心频率(Hz)
1 0 2756.25 1378.125
2 2756.25 5512.5 4134.375
3 5512.5 8268.75 6890.625
4 8268.75 11025 9646.875
5 11025 13781.25 12403.125
6 13781.25 16537.5 15159.375
7 16537.5 19293.75 17915.625
8 19293.75 22050 20671.875
由于强度过高的高音会对听觉系统造成伤害,所以,播放器可以通过步骤205-207中的至少一种处理方式对这些子带信号进行处理。
步骤205,当存在起始频率大于预定频率的子带信号时,对子带信号进行剔除,预定频率是使用户的听觉系统产生疲劳以及伤害的频率。
用户长时间收听大于预定频率的音频信号会造成听觉系统疲劳,继续发展下去,甚至会对听觉系统造成伤害,而日积月累的物理伤害则会造成不可逆的永久性听力障碍。并且,用户在收听大于预定频率的音频信号时,感觉不到任何的不适,可见,大于预定频率的音频信号会在不知不觉中伤害用户的听觉系统,所以,需要对大于预定频率的音频信号进行剔除,以保护听觉系统。
在确定预定频率时,除了需要考虑会保护听觉系统,还需要考虑音频信号的音质,即用户的听觉感受。由于大部分用户的听觉感知在17.5kHz以上时会快速衰减,所以,剔除17.5kHz以上的音频信号对用户的听觉感受的影响不大,可以将预定频率设置为大于等于17.5kHz。以预定频率为18kHz为例,即,可以直接将起始频率在18kHz以上的子带信号进行剔除,这样既不会影响音质,也可以剔除高音,从而保护听觉系统。
以表一中的八个子带信号为例,由于第八个子带信号(SUBBAND[8])的起始频率大于18kHz,所以,可以对频带在19.2kHz-22kHz的第八个子带信号进行剔除。即,SUBBAND[8]=SUBBAND[8]*0。
步骤206,当存在起始频率小于预定频率,且截止频率大于预定频率的子带信号时,对子带信号进行衰减。
当存在起始频率小于预定频率,且截止频率大于预定频率的子带信号时,可以对该子带信号进行剔除,以保护听觉系统。若对该子带信号进行剔除,对于一些听觉系统较敏感的用户来说,会听出最终得到的音频信号中缺少从该起始频率到预定频率之间的音频信号,从而影响音质。可选的,还可以不对该子带信号进行衰减处理,以保证音质。或者,可选的,还可以在保护听觉系统和保证音质之间进行平衡,即可以对该子带信号进行衰减,以减小该子带信号的信号强度,也即减小该子带信号的音量,这样既可以保护听觉系统,也可以保证音质。
本实施例中,可以预先设置一个预定衰减比例,此时,对子带信号进行衰减,可以实现为:按照预定衰减比例对子带信号的信号强度进行衰减,预定衰减比例大于等于0且小于等于1。其中,当预定衰减比例为0时,即相当于对该子带信号进行剔除;当预定衰减比例为1时,即相当于不对该子带信号进行衰减处理。
以表一中的八个子带信号为例,且假设预定频率为18kHz,由于第七个子带信号(SUBBAND[7])的起始频率小于18kHz,截止频率大于18kHz,所以,可以对第七个子带信号进行衰减,以预定衰减比例为0.5为例,则可以将第七个子带信号的信号强度衰减至原始的信号强度的一半,即,SUBBAND[7]=SUBBAND[7]*0.5。此时相当于将第七个子带信号的信号强度衰减一半,也即相当于将第七个子带信号的音量减小一半。
步骤207,当存在截止频率小于预定频率的子带信号时,对子带信号进行压缩限幅处理,压缩限幅处理后子带信号的信号强度小于等于预定门限值,预定门限值是根据动态范围阈值确定的,动态范围阈值是使听觉系统产生疲劳以及伤害的动态范围。
其中,动态范围是指音频信号的最大值和最小值的差值。用户长时间收听大于动态范围阈值的音频信号会造成听觉系统疲劳,继续发展下去,甚至会对听觉系统造成伤害,而日积月累的物理伤害则会造成不可逆的永久性听力障碍。并且,用户在收听大于动态范围阈值的音频信号时,感觉不到任何的不适,可见,大于动态范围阈值的音频信号会在不知不觉中伤害用户的听觉系统,所以,需要对减小音频信号的动态范围,以保护听觉系统。
本实施例中,可以对截止频率小于预定频率的每个子带信号配置一个压缩限幅器,再根据动态范围阈值确定一个预定门限值,通过压缩限幅器对子带信号进行压缩限幅处理,使得压缩限幅处理后子带信号的信号强度小于预定门限值,以减小子带信号的动态范围,从而使得合成后的第二音频信号较为平滑。
播放器需要判断是否需要对子带信号进行压缩限幅处理。当子带信号的信号强度大于等于对应的一个压缩限幅器的预定门限值时,对该子带信号进行压缩限幅处理;当子带信号的信号强度小于对应的一个压缩限幅器的预定门限值时,不对该子带信号进行压缩限幅处理。其中,压缩限幅处理是指在子带信号的信号强度大于等于预定门限值时,对子带信号进行压缩处理和增益处理。压缩处理是指按照压缩限幅器中的预定压缩比对子带信号进行压缩处理,且压缩比用于指示对子带信号的压缩速度的快慢,且压缩处理后子带信号的动态范围小于动态范围阈值;增益处理是指按照压缩限幅器中的预定增益对子带信号进行增益处理,,且预定增益大于等于0且小于等于预定门限值的绝对值。也即对子带信号进行放大,这里的预定增益用于指示对子带信号的信号强度的放大倍数。其中,门限值、压缩比和增益值可以是预先设置的经验值,本实施例不作限定。
需要说明的是,压缩处理用于减小子带信号的动态范围,此时,音频信号的音量也会相应减小。在一种实现方式中,播放器不对压缩处理后的子带信号进行增益处理,以保护听觉系统。由于压缩处理后子带信号的音量较小,导致音质较差,所以,在另一种实现方式中,还可以在保护听觉系统和保证音质之间进行平衡,即对压缩处理后的子带信号进行增益处理,也即增大音频信号的音量,以保证音质。其中,当预定增益为0时,即相当于不对压缩处理后的子带信号进行增益处理;当预定增益为预定门限值的绝对值时,即相当于对压缩处理后的子带信号进行增益处理,且增益处理后子带信号的信号强度小于等于预定门限值。
仍然以表一种的八个子带信号为例,则对第一个子带信号(SUBBAND[1])至第六个子带信号(SUBBAND[6])分别配置一个压缩限幅器,其配置参数如下表二所示。
表二
ID 门限(dB) 压缩比 增益(dB) Attack时间(ms) Release时间(ms)
LIM1 -3 1:无穷大 1.5 10 100
LIM2 -5 1:5 1.0 15 150
LIM3 -5 1:5 1.0 15 150
LIM4 -6 1:5 1.0 20 180
LIM5 -6 1:10 0 20 180
LIM6 -6 1:10 0 30 200
其中,LIM1对应于SUBBAND[1],LIM2对应于SUBBAND[2],依次类推。
本实施例以LIM1对SUBBAND[1]的处理过程进行举例说明,则先判断SUBBAND[1]的信号强度是否大于-3dB;当该信号强度大于等于-3dB时,按照1:无穷大的预定压缩比对SUBBAND[1]进行压缩,这里1:无穷大是指按照最快的压缩速度压缩SUBBAND[1];再对压缩处理后得到的SUBBAND[1]进行1.5的增益处理,得到LIM1(SUBBAND[1]);当该信号强度小于-3dB时,不对SUBBAND[1]进行处理。其他子带信号的压缩限幅处理与SUBBAND[1]的压缩限幅处理类似,不再赘述。
其中,Attack时间也可以称为输入时间,是指将子带信号输入对应的压缩限幅器的时间;Release时间也可以称为输出时间,是指将子带信号输出对应的压缩限幅器的时间。这里的Attack时间和Release时间是一次实验的实验数据,不同的终端可以具有不同的Attack时间和Release时间。
步骤208,对剩余的子带信号进行合成,得到第二音频信号。
播放器可以对步骤205-207得到的子带信号进行合成,得到第二音频信号。
仍然以表一中的八个子带信号为例,则第二音频信号Y=SUBBAND[8]*0+SUBBAND[7]*0.5+LIM6(SUBBAND[6])+LIM5(SUBBAND[5])+…+LIM1(SUBBAND[1])。
步骤209,对第二音频信号进行逆窗处理,得到第四音频信号。
假设第四音频信号为OUT,则OUT=Y*IW。
步骤210,对第四音频信号进行输出。
播放器对第四音频信号进行播放,由于较强的高音被剔除了,所以,无论用户是否佩戴耳机,都不会对用户的听觉系统造成伤害。
综上所述,本申请实施例提供的音频处理方法,由于预定频率是使用户的听觉系统产生疲劳以及伤害的频率,所以,通过对第一音频信号中预定频率以上的音频信号进行剔除,可以使得到的第二音频信号中不包含会导致听觉系统产生疲劳以及伤害的高音,从而解决了高音对用户的听觉系统造成很大伤害的问题,达到了保护听觉系统的效果。
当存在起始频率小于预定频率,且截止频率大于预定频率的子带信号时,可以对该子带信号进行剔除,以保护听觉系统;还可以不对该子带信号进行衰减处理,以保证音质;还可以在保护听觉系统和保证音质之间进行平衡,即可以对该子带信号进行衰减,以减小该子带信号的信号强度,也即减小该子带信号的音量,这样既可以保护听觉系统,也可以保证音质。
当存在截止频率小于预定频率的子带信号时,对每个子带信号配置一个压缩限幅器,再根据动态范围阈值确定一个预定门限值,通过压缩限幅器对子带信号进行压缩限幅处理,使得压缩限幅处理后子带信号的信号强度小于预定门限值,以减小子带信号的动态范围,既可以通过减少子带信号的动态范围来保护听觉系统,也可以使得合成后的第二音频信号较为平滑。
请参考图3,其示出了本申请一个实施例提供的音频处理装置的结构框图,该音频处理装置可以应用于终端中的播放器中。该音频处理装置,包括:
获取模块301,用于获取待处理的第一音频信号;
处理模块302,用于对获取模块301得到的第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,预定频率是使用户的听觉系统产生疲劳以及伤害的频率;
输出模块303,用于对处理模块302得到的第二音频信号进行输出。
综上所述,本申请实施例提供的音频处理装置,由于预定频率是使用户的听觉系统产生疲劳以及伤害的频率,所以,通过对第一音频信号中预定频率以上的音频信号进行剔除,可以使得到的第二音频信号中不包含会导致听觉系统产生疲劳以及伤害的高音,从而解决了高音对用户的听觉系统造成很大伤害的问题,达到了保护听觉系统的效果。
请参考图3,其示出了本申请再一实施例提供的音频处理装置的结构框图,该音频处理装置可以应用于终端中的播放器中。该音频处理装置,包括:
获取模块301,用于获取待处理的第一音频信号;
处理模块302,用于对获取模块301得到的第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,预定频率是使用户的听觉系统产生疲劳以及伤害的频率;
输出模块303,用于对处理模块302得到的第二音频信号进行输出。
可选的,预定频率大于等于17.5kHz。
可选的,处理模块302,还用于:
将第一音频信号划分成n个子带信号,n为正整数;
当存在起始频率大于预定频率的子带信号时,对子带信号进行剔除;
对剩余的子带信号进行合成,得到第二音频信号。
可选的,处理模块302,还用于:
在对剩余的子带信号进行合成,得到第二音频信号之前,当存在起始频率小于预定频率,且截止频率大于预定频率的子带信号时,对子带信号进行衰减。
可选的,处理模块302,还用于:
按照预定衰减比例对子带信号的信号强度进行衰减,预定衰减比例大于等于0且小于等于1。
可选的,处理模块302,还用于:
在对剩余的子带信号进行合成,得到第二音频信号之前,当存在截止频率小于预定频率的子带信号时,对子带信号进行压缩限幅处理,压缩限幅处理后子带信号的信号强度小于等于预定门限值,预定门限值是根据动态范围阈值确定的,动态范围阈值是使听觉系统产生疲劳以及伤害的动态范围。
可选的,处理模块302,还用于:
根据预定压缩比对子带信号进行压缩处理,预定压缩比用于指示对子带信号的压缩速度的快慢,且压缩处理后子带信号的动态范围小于动态范围阈值;
根据预定增益对压缩处理后的子带信号进行增益处理,预定增益用于指示对子带信号的信号强度的放大倍数,且预定增益大于等于0且小于等于预定门限值的绝对值。
可选的,获取模块301,还用于:获取第三音频信号和窗函数;对第三音频信号进行采样;当每采样得到一个音频帧时,根据窗函数对音频帧进行加窗处理,得到第一音频信号,音频帧所包含的采样值的数量等于窗函数的窗长的数值;
输出模块303,还用于:对第二音频信号进行逆窗处理,得到第四音频信号;对第四音频信号进行输出。
综上所述,本申请实施例提供的音频处理装置,由于预定频率是使用户的听觉系统产生疲劳以及伤害的频率,所以,通过对第一音频信号中预定频率以上的音频信号进行剔除,可以使得到的第二音频信号中不包含会导致听觉系统产生疲劳以及伤害的高音,从而解决了高音对用户的听觉系统造成很大伤害的问题,达到了保护听觉系统的效果。
当存在起始频率小于预定频率,且截止频率大于预定频率的子带信号时,可以对该子带信号进行剔除,以保护听觉系统;还可以不对该子带信号进行衰减处理,以保证音质;还可以在保护听觉系统和保证音质之间进行平衡,即可以对该子带信号进行衰减,以减小该子带信号的信号强度,也即减小该子带信号的音量,这样既可以保护听觉系统,也可以保证音质。
当存在截止频率小于预定频率的子带信号时,对每个子带信号配置一个压缩限幅器,再根据动态范围阈值确定一个预定门限值,通过压缩限幅器对子带信号进行压缩限幅处理,使得压缩限幅处理后子带信号的信号强度小于预定门限值,以减小子带信号的动态范围,既可以通过减少子带信号的动态范围来保护听觉系统,也可以使得合成后的第二音频信号较为平滑。
图4示出了本申请一个示例性实施例提供的终端400的结构框图。该终端400可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端400还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。终端400中安装有播放器。
通常,终端400包括有:处理器401和存储器402。
处理器401可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器401可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器401可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器402中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器401所执行以实现本申请中方法实施例提供的音频处理方法。
在一些实施例中,终端400还可选包括有:外围设备接口403和至少一个外围设备。处理器401、存储器402和外围设备接口403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口403相连。具体地,外围设备包括:射频电路404、触摸显示屏405、摄像头406、音频电路407、定位组件408和电源409中的至少一种。
外围设备接口403可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器401和存储器402。在一些实施例中,处理器401、存储器402和外围设备接口403被集成在同一芯片或电路板上;在一些其他实施例中,处理器401、存储器402和外围设备接口403中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路404用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路404将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路404包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路404还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏405用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏405是触摸显示屏时,显示屏405还具有采集在显示屏405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器401进行处理。此时,显示屏405还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏405可以为一个,设置终端400的前面板;在另一些实施例中,显示屏405可以为至少两个,分别设置在终端400的不同表面或呈折叠设计;在再一些实施例中,显示屏405可以是柔性显示屏,设置在终端400的弯曲表面上或折叠面上。甚至,显示屏405还可以设置成非矩形的不规则图形,也即异形屏。显示屏405可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件406用于采集图像或视频。可选地,摄像头组件406包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件406还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器401进行处理,或者输入至射频电路404以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器401或射频电路404的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路407还可以包括耳机插孔。
定位组件408用于定位终端400的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件408可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源409用于为终端400中的各个组件进行供电。电源409可以是交流电、直流电、一次性电池或可充电电池。当电源409包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端400还包括有一个或多个传感器410。该一个或多个传感器410包括但不限于:加速度传感器411、陀螺仪传感器412、压力传感器413、指纹传感器414、光学传感器415以及接近传感器416。
加速度传感器411可以检测以终端400建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器411可以用于检测重力加速度在三个坐标轴上的分量。处理器401可以根据加速度传感器411采集的重力加速度信号,控制触摸显示屏405以横向视图或纵向视图进行用户界面的显示。加速度传感器411还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器412可以检测终端400的机体方向及转动角度,陀螺仪传感器412可以与加速度传感器411协同采集用户对终端400的3D动作。处理器401根据陀螺仪传感器412采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器413可以设置在终端400的侧边框和/或触摸显示屏405的下层。当压力传感器413设置在终端400的侧边框时,可以检测用户对终端400的握持信号,由处理器401根据压力传感器413采集的握持信号进行左右手识别或快捷操作。当压力传感器413设置在触摸显示屏405的下层时,由处理器401根据用户对触摸显示屏405的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器414用于采集用户的指纹,由处理器401根据指纹传感器414采集到的指纹识别用户的身份,或者,由指纹传感器414根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器401授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器414可以被设置终端400的正面、背面或侧面。当终端400上设置有物理按键或厂商Logo时,指纹传感器414可以与物理按键或厂商Logo集成在一起。
光学传感器415用于采集环境光强度。在一个实施例中,处理器401可以根据光学传感器415采集的环境光强度,控制触摸显示屏405的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏405的显示亮度;当环境光强度较低时,调低触摸显示屏405的显示亮度。在另一个实施例中,处理器401还可以根据光学传感器415采集的环境光强度,动态调整摄像头组件406的拍摄参数。
接近传感器416,也称距离传感器,通常设置在终端400的前面板。接近传感器416用于采集用户与终端400的正面之间的距离。在一个实施例中,当接近传感器416检测到用户与终端400的正面之间的距离逐渐变小时,由处理器401控制触摸显示屏405从亮屏状态切换为息屏状态;当接近传感器416检测到用户与终端400的正面之间的距离逐渐变大时,由处理器401控制触摸显示屏405从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图4中示出的结构并不构成对终端400的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请一个实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的音频处理方法。
本申请一个实施例提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的音频处理方法。
需要说明的是:上述实施例提供的音频处理装置在进行音频处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将音频处理装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音频处理装置与音频处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请实施例的保护范围之内。

Claims (18)

1.一种音频处理方法,其特征在于,所述方法包括:
获取待处理的第一音频信号;
对所述第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,所述预定频率是使用户的听觉系统产生疲劳以及伤害的频率;
对所述第二音频信号进行输出。
2.根据权利要求1所述的方法,其特征在于,所述预定频率大于等于17.5kHz。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,包括:
将所述第一音频信号划分成n个子带信号,所述n为正整数;
当存在起始频率大于所述预定频率的子带信号时,对所述子带信号进行剔除;
对剩余的子带信号进行合成,得到所述第二音频信号。
4.根据权利要求3所述的方法,其特征在于,在所述对剩余的子带信号进行合成,得到所述第二音频信号之前,所述方法还包括:
当存在起始频率小于所述预定频率,且截止频率大于所述预定频率的子带信号时,对所述子带信号进行衰减。
5.根据权利要求4所述的方法,其特征在于,所述对所述子带信号进行衰减,包括:
按照预定衰减比例对所述子带信号的信号强度进行衰减,所述预定衰减比例大于等于0且小于等于1。
6.根据权利要求3所述的方法,其特征在于,在所述对剩余的子带信号进行合成,得到所述第二音频信号之前,所述方法还包括:
当存在截止频率小于所述预定频率的子带信号时,对所述子带信号进行压缩限幅处理,压缩限幅处理后所述子带信号的信号强度小于等于预定门限值,所述预定门限值是根据动态范围阈值确定的,所述动态范围阈值是使所述听觉系统产生疲劳以及伤害的动态范围。
7.根据权利要求6所述的方法,其特征在于,所述对所述子带信号进行压缩限幅处理,包括:
根据预定压缩比对所述子带信号进行压缩处理,所述预定压缩比用于指示对所述子带信号的压缩速度的快慢,且压缩处理后所述子带信号的动态范围小于所述动态范围阈值;
根据预定增益对所述压缩处理后的子带信号进行增益处理,所述预定增益用于指示对所述子带信号的信号强度的放大倍数,且所述预定增益大于等于0且小于等于所述预定门限值的绝对值。
8.根据权利要求1至7任一所述的方法,其特征在于,
所述获取待处理的第一音频信号,包括:获取第三音频信号和窗函数;对所述第三音频信号进行采样;当每采样得到一个音频帧时,根据所述窗函数对所述音频帧进行加窗处理,得到所述第一音频信号,所述音频帧所包含的采样值的数量等于所述窗函数的窗长的数值;
所述对所述第二音频信号进行输出,包括:对所述第二音频信号进行逆窗处理,得到第四音频信号;对所述第四音频信号进行输出。
9.一种音频处理装置,其特征在于,所述装置包括:
获取模块,用于获取待处理的第一音频信号;
处理模块,用于对所述获取模块得到的所述第一音频信号中预定频率以上的音频信号进行剔除,得到第二音频信号,所述预定频率是使用户的听觉系统产生疲劳以及伤害的频率;
输出模块,用于对所述处理模块得到的所述第二音频信号进行输出。
10.根据权利要求9所述的装置,其特征在于,所述预定频率大于等于17.5kHz。
11.根据权利要求9所述的装置,其特征在于,所述处理模块,还用于:
将所述第一音频信号划分成n个子带信号,所述n为正整数;
当存在起始频率大于所述预定频率的子带信号时,对所述子带信号进行剔除;
对剩余的子带信号进行合成,得到所述第二音频信号。
12.根据权利要求11所述的装置,其特征在于,所述处理模块,还用于:
在所述对剩余的子带信号进行合成,得到所述第二音频信号之前,当存在起始频率小于所述预定频率,且截止频率大于所述预定频率的子带信号时,对所述子带信号进行衰减。
13.根据权利要求12所述的装置,其特征在于,所述处理模块,还用于:
按照预定衰减比例对所述子带信号的信号强度进行衰减,所述预定衰减比例大于等于0且小于等于1。
14.根据权利要求11所述的装置,其特征在于,所述处理模块,还用于:
在所述对剩余的子带信号进行合成,得到所述第二音频信号之前,当存在截止频率小于所述预定频率的子带信号时,对所述子带信号进行压缩限幅处理,压缩限幅处理后所述子带信号的信号强度小于等于预定门限值,所述预定门限值是根据动态范围阈值确定的,所述动态范围阈值是使所述听觉系统产生疲劳以及伤害的动态范围。
15.根据权利要求14所述的装置,其特征在于,所述处理模块,还用于:
根据预定压缩比对所述子带信号进行压缩处理,所述预定压缩比用于指示对所述子带信号的压缩速度的快慢,且压缩处理后所述子带信号的动态范围小于所述动态范围阈值;
根据预定增益对所述压缩处理后的子带信号进行增益处理,所述预定增益用于指示对所述子带信号的信号强度的放大倍数,且所述预定增益大于等于0且小于等于所述预定门限值的绝对值。
16.根据权利要求9至15任一所述的装置,其特征在于,
所述获取模块,还用于:获取第三音频信号和窗函数;对所述第三音频信号进行采样;当每采样得到一个音频帧时,根据所述窗函数对所述音频帧进行加窗处理,得到所述第一音频信号,所述音频帧所包含的采样值的数量等于所述窗函数的窗长的数值;
所述输出模块,还用于:对所述第二音频信号进行逆窗处理,得到第四音频信号;对所述第四音频信号进行输出。
17.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至8任一所述的音频处理方法。
18.一种终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至8任一所述的音频处理方法。
CN201810609905.7A 2018-06-13 2018-06-13 音频处理方法、装置、存储介质及终端 Pending CN108804072A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810609905.7A CN108804072A (zh) 2018-06-13 2018-06-13 音频处理方法、装置、存储介质及终端
PCT/CN2018/117898 WO2019237666A1 (zh) 2018-06-13 2018-11-28 音频处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810609905.7A CN108804072A (zh) 2018-06-13 2018-06-13 音频处理方法、装置、存储介质及终端

Publications (1)

Publication Number Publication Date
CN108804072A true CN108804072A (zh) 2018-11-13

Family

ID=64085834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810609905.7A Pending CN108804072A (zh) 2018-06-13 2018-06-13 音频处理方法、装置、存储介质及终端

Country Status (2)

Country Link
CN (1) CN108804072A (zh)
WO (1) WO2019237666A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110074780A (zh) * 2019-04-25 2019-08-02 内蒙古农业大学 一种基于erp技术的音乐模式调节方法
CN110139181A (zh) * 2019-04-30 2019-08-16 维沃移动通信有限公司 音频处理方法、装置、耳机、终端设备及介质
WO2019237666A1 (zh) * 2018-06-13 2019-12-19 广州酷狗计算机科技有限公司 音频处理方法、装置、存储介质及电子设备
CN110931021A (zh) * 2019-10-29 2020-03-27 平安科技(深圳)有限公司 一种音频信号处理方法及装置
CN111128167A (zh) * 2019-12-30 2020-05-08 深圳创维-Rgb电子有限公司 一种远场语音唤醒方法、装置、电子产品及存储介质
CN111884673A (zh) * 2020-08-05 2020-11-03 成都国卫通信技术有限公司 一种基于逆窗补偿处理的频域滤波干扰抑制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104185870A (zh) * 2012-03-12 2014-12-03 歌乐株式会社 声学信号处理装置和声学信号处理方法
CN104934043A (zh) * 2015-06-17 2015-09-23 广东欧珀移动通信有限公司 音频处理方法及装置
CN107833579A (zh) * 2017-10-30 2018-03-23 广州酷狗计算机科技有限公司 噪声消除方法、装置及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104409086A (zh) * 2014-12-01 2015-03-11 联想(北京)有限公司 一种用于音频处理的方法和电子设备
CN108804072A (zh) * 2018-06-13 2018-11-13 广州酷狗计算机科技有限公司 音频处理方法、装置、存储介质及终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104185870A (zh) * 2012-03-12 2014-12-03 歌乐株式会社 声学信号处理装置和声学信号处理方法
CN104934043A (zh) * 2015-06-17 2015-09-23 广东欧珀移动通信有限公司 音频处理方法及装置
CN107833579A (zh) * 2017-10-30 2018-03-23 广州酷狗计算机科技有限公司 噪声消除方法、装置及计算机可读存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019237666A1 (zh) * 2018-06-13 2019-12-19 广州酷狗计算机科技有限公司 音频处理方法、装置、存储介质及电子设备
CN110074780A (zh) * 2019-04-25 2019-08-02 内蒙古农业大学 一种基于erp技术的音乐模式调节方法
CN110139181A (zh) * 2019-04-30 2019-08-16 维沃移动通信有限公司 音频处理方法、装置、耳机、终端设备及介质
CN110931021A (zh) * 2019-10-29 2020-03-27 平安科技(深圳)有限公司 一种音频信号处理方法及装置
CN110931021B (zh) * 2019-10-29 2023-10-13 平安科技(深圳)有限公司 一种音频信号处理方法及装置
CN111128167A (zh) * 2019-12-30 2020-05-08 深圳创维-Rgb电子有限公司 一种远场语音唤醒方法、装置、电子产品及存储介质
CN111128167B (zh) * 2019-12-30 2023-10-27 深圳创维-Rgb电子有限公司 一种远场语音唤醒方法、装置、电子产品及存储介质
CN111884673A (zh) * 2020-08-05 2020-11-03 成都国卫通信技术有限公司 一种基于逆窗补偿处理的频域滤波干扰抑制方法

Also Published As

Publication number Publication date
WO2019237666A1 (zh) 2019-12-19

Similar Documents

Publication Publication Date Title
CN108804072A (zh) 音频处理方法、装置、存储介质及终端
US10924877B2 (en) Audio signal processing method, terminal and storage medium thereof
CN107105367B (zh) 一种音频信号处理方法及终端
CN111050250B (zh) 降噪方法、装置、设备和存储介质
CN108156575B (zh) 音频信号的处理方法、装置及终端
CN108335703B (zh) 确定音频数据的重音位置的方法和装置
CN108401124A (zh) 视频录制的方法和装置
CN109524016B (zh) 音频处理方法、装置、电子设备及存储介质
US11315582B2 (en) Method for recovering audio signals, terminal and storage medium
CN111083289B (zh) 音频播放方法、装置、存储介质及移动终端
CN108834037B (zh) 播放音频数据的方法和装置
CN108449641A (zh) 播放媒体流的方法、装置、计算机设备和存储介质
CN109547848A (zh) 响度调整方法、装置、电子设备以及存储介质
CN109065068A (zh) 音频处理方法、装置及存储介质
CN111445901A (zh) 音频数据获取方法、装置、电子设备及存储介质
CN110139143A (zh) 虚拟物品显示方法、装置、计算机设备以及存储介质
CN109243479A (zh) 音频信号处理方法、装置、电子设备及存储介质
CN109360582B (zh) 音频处理方法、装置及存储介质
CN107944024A (zh) 一种确定音频文件的方法和装置
CN109360577B (zh) 对音频进行处理的方法、装置存储介质
CN109448676A (zh) 音频处理方法、装置及存储介质
CN108053831A (zh) 音乐生成、播放、识别方法、装置及存储介质
KR101696997B1 (ko) Dsp 내장 코덱을 이용한 소음에 따른 출력 음향 크기 자동 조정 장치
CN108347672A (zh) 播放音频的方法、装置及存储介质
CN109344284A (zh) 歌曲文件的播放方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181113