CN106971704A

CN106971704A - 一种音频处理方法及移动终端

Info

Publication number: CN106971704A
Application number: CN201710288677.3A
Authority: CN
Inventors: 林雄周
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2017-04-27
Filing date: 2017-04-27
Publication date: 2017-07-21
Anticipated expiration: 2037-04-27
Also published as: CN106971704B

Abstract

本发明实施例公开了一种音频处理方法及移动终端，其中，音频处理方法包括：在用户演唱歌曲过程中，采集用户的人声音频数据，并判断该人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则判断该人声音频数据的频率是否达到原唱的频率，若该人声音频数据的频率未达到原唱的频率，则将采集的人声音频数据的频率调整至原唱的频率，再输出频率调整后的人声音频数据。从而对用户歌声的频率进行有效调节，避免用户声音的频率与原唱声音频率差值过大影响演唱效果，进而使用户在不具备专业演唱能力的情况下，仍能够体现较好的演唱水平。

Description

一种音频处理方法及移动终端

技术领域

本发明实施例涉及通信领域，尤其涉及一种音频处理方法及移动终端。

背景技术

目前在很多终端上集成有家庭影院、卡拉OK等功能，方便用户K歌。而K歌的用户往往是业余的歌唱者，在歌唱过程中，经常无法按照原唱的频率演唱歌曲中的高音部分或低音部分。导致无法展现出优质的演唱效果。例如，当用户演唱到歌曲的高音部分时，往往会使用假音以达到较高的频率，但由于假音难以准确控制，因此容易出现频率突然降低的情况，即容易出现破音。

由此可见，现有技术中，只有通过提高用户的演唱水平，才能展现出优质的演唱效果，若用户演唱水平不足，容易出现破音，导致影响演唱效果。

发明内容

本发明实施例提供一种音频处理方法及移动终端，以解决由于用户演唱水平不足，容易出现破音，导致影响演唱效果的问题。

一方面，提供了一种音频处理方法，方法包括：

在用户演唱歌曲过程中，采集所述用户的人声音频数据；

判断所述人声音频数据在所述歌曲中对应的时间段是否位于预设时间段内；

若所述人声音频数据在所述歌曲中对应的时间段位于预设时间段内，则判断所述人声音频数据的频率是否达到原唱的频率；

若所述人声音频数据的频率未达到原唱的频率，则将所述采集的人声音频数据的频率调整至所述原唱的频率，输出频率调整后的人声音频数据；

其中，所述预设时间段为所述歌曲的预设音频片段对应的时间段，所述预设音频片段为所述歌曲原唱的频率在预设人声频率范围内的音频片段，所述预设人声频率范围包括预设的高音人声频率范围和预设的低音人声频率范围。

另一方面，本发明实施例还提供了一种移动终端，包括：

声音采集模块，用于在用户演唱歌曲过程中，采集所述用户的人声音频数据；

音频位置确定模块，用于判断所述人声音频数据在所述歌曲中对应的时间段是否位于预设时间段内；

评估模块，用于若所述人声音频数据在所述歌曲中对应的时间段位于预设时间段内，则判断所述人声音频数据的频率是否达到原唱的频率；

音频调整模块，用于若所述人声音频数据的频率未达到原唱的频率，则将所述采集的人声音频数据的频率调整至所述原唱的频率；

输出模块，用于输出频率调整后的人声音频数据；

综上，本发明实施例通过在用户演唱歌曲过程中，采集用户的人声音频数据，并判断该人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则判断该人声音频数据的频率是否达到原唱的频率，若该人声音频数据的频率未达到原唱的频率，则将采集的人声音频数据的频率调整至原唱的频率，再输出频率调整后的人声音频数据。从而对用户歌声的频率进行有效调节，避免用户声音的频率与原唱声音频率差值过大影响演唱效果，进而使用户在不具备专业演唱能力的情况下，仍能够体现较好的演唱水平，优化了演唱者的演唱效果。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种音频处理方法的流程图；

图2是本发明实施例的另一种音频处理方法的流程图；

图3是本发明实施例的移动终端的框图之一；

图4是本发明实施例的移动终端的框图之二；

图5是本发明实施例的移动终端的框图之三；

图6是本发明实施例的移动终端的框图之四。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1，示出了本发明实施例中一种音频处理方法的流程图，本实施例所提供的方法可以由移动终端执行，音频处理方法包括：

步骤101，在用户演唱歌曲过程中，采集用户的人声音频数据。

其中，该采集的人声音频数据可以为设定时间长度的一个或一个以上的音频帧。为保证该段时间内人声音频数据的频率不存在明显波动，可以根据人声音频的变化规律，确定该设定时间长度。

在实际应用中，采集的人声音频数据可以为用户输入的任一设定时间长度的音频。其中，设定时间长度可由本领域技术人员根据经验设置，例如，可设置为5毫秒。

在采集到人声音频数据后，可以通过对人声音频数据的分析，获取该段人声音频数据的频率值，以便与音频源文件进行比较。

步骤102，判断人声音频数据在歌曲中对应的时间段是否位于预设时间段内。

人声是指通过声带的振动而发出的声音。在一定时间内，声带振动的次数越多则声调越高，即人声频率越高。通常将频率处于高音人声频率范围的人声称为高音，将频率处于低音人声频率范围的人声称为低音。从发音难度而言，通常难于发出高音和低音。因此，可以针对这一特点，判断人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则执行步骤103，判断人声音频数据的频率是否达到原唱的频率。若该人声音频数据在歌曲中对应的时间段并不位于预设时间段内，则可以无需对采集的人声音频数据进行干预，直接输出即可，从而保留并体现用户真实的演唱风格。

其中，该预设时间段为歌曲的预设音频片段对应的时间段，该预设音频片段为歌曲原唱的频率在预设人声频率范围内的音频片段，该预设人声频率范围包括预设的高音人声频率范围和预设的低音人声频率范围。

例如，当人声音频数据在歌曲中对应的时间段位于歌曲的高音片段范围内时，即用户演唱到了歌曲的高音部分时，很容易因为用户高音唱不上去，导致降低用户的演唱效果。本发明实施例可以在该时段对采集的人声音频数据进行调整，以避免用户演唱时因声音频率较低影响演唱效果。

步骤103，判断人声音频数据的频率是否达到原唱的频率。

当人声音频数据在歌曲中对应的时间段位于预设时间段内时，由于用户通常难于以原唱的频率演唱该段歌曲，因此，可以在该时段判断人声音频数据的频率是否达到原唱的频率。

具体的，可以计算人声音频数据的频率与原唱的频率之间的频率差值，并判断该频率差值是否小于阈值频率，若该频率差值小于阈值频率，则确定该人声音频数据的频率达到原唱的频率。即确定用户演唱的频率与原唱相近似，能够达到较好的演唱效果，该情况下可以不对采集的人声音频数据进行调整。直接执行步骤105，输出采集的人声音频数据。

反之，若人声音频数据的频率未达到原唱的频率，则可以执行步骤104，将采集的人声音频数据的频率调整至原唱的频率，输出频率调整后的人声音频数据。以保障用户的演唱效果。

步骤104，将采集的人声音频数据的频率调整至原唱的频率，输出频率调整后的人声音频数据。

当采集的人声音频数据的频率未达到原唱时，可以通过对采集的人声音频数据的频率进行调整，以达到原唱的频率。

具体的，在对采集的人声音频数据的频率进行调整时，若原唱的频率处于高音人声频率范围，可以对发音较低的人声音频数据提高频率。若原唱的频率处于低音人声频率范围，可以对发音较高的人声音频数据降低频率。从而将采集的人声音频数据的频率调整至原唱的频率，使采集的人声音频数据通过移动终端播放出来的效果更加接近原唱的演唱效果。例如，可以使用频域均衡器对采集的人声音频数据的频率进行频域增强。其中，频域均衡器一种均衡补偿设备，用于完成对数据传输信道中的频率特性失真进行均衡补偿，从而起到调整采集的人声音频数据的频率的作用。对于多个音轨的音频数据，需要对每个音轨进行单独调节。

步骤105，输出采集的人声音频数据。

综上所述，本发明实施例中，通过在用户演唱歌曲过程中，采集用户的人声音频数据，并判断该人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则判断该人声音频数据的频率是否达到原唱的频率，若该人声音频数据的频率未达到原唱的频率，则将采集的人声音频数据的频率调整至原唱的频率，再输出频率调整后的人声音频数据。从而对用户歌声的频率进行有效调节，避免用户声音的频率与原唱声音频率差值过大影响演唱效果，进而使用户在不具备专业演唱能力的情况下，仍能够体现较好的演唱水平，优化了演唱者的演唱效果。

参照图2，示出了本发明实施例的另一种音频处理方法的流程图。本实施例所提供的方法可以由移动终端执行，控制音频处理方法包括：

步骤201，确定歌曲的音频源文件中的预设音频片段。

为了确定采集的人声音频数据是否位于预设时间段内，可以先根据预设人声频率范围和音频源文件的数据对应关系，确定歌曲的音频源文件中频率在预设人声频率范围内的目标时间段；再将该目标时间段内的音频片段确定为预设音频片段。从而为判断人声音频数据在歌曲中对应的时间段是否位于预设时间段内提供依据。其中，音频源文件的数据对应关系可以为频谱图。

具体的，由于不同性别的人发音特点不同，对应的预设人声频率范围也不同，因此可以先确定音频源文件中每个时间段的音频数据对应的原唱的性别，再根据各段音频数据对应的原唱的性别和不同性别对应的预设人声频率范围，分别确定各段音频数据中频率在预设人声频率范围内的目标时间段。从而能够针对不同性别做出更加准确的判断。

例如，若男性演唱者的预设人声频率范围为164～698Hz，女性演唱者的预设人声频率范围为220～1.1KHz。则对于原唱为男性演唱者的歌曲，音频源文件的数据对应关系中频率幅值在164～698Hz范围内的音频片段即为预设音频片段。同样，对于原唱为女性演唱者的歌曲，音频源文件的数据对应关系中频率幅值在220～1.1KHz范围内的音频片段即为预设音频片段。当音频源文件为男女合唱的歌曲时，可以针对每段音频片段标注的性别，根据对应的预设人声频率范围，分别确定各段音频的预设音频片段。

在实际应用中，为了提升分析判断的效率，可以预先根据音频源文件，制成预设音频片段划分数据，并存储在云端服务器中或移动终端本地。从而在确定歌曲的音频源文件中的预设音频片段这一步骤之前，可以从云端服务器中获取预设音频片段划分数据，或从移动终端本地获取预设音频片段划分数据。其中，该预设音频片段划分数据用于表征音频源文件中预设音频片段所在时间段。因此，在执行步骤203时，只需将人声音频数据在歌曲中对应的时间段与设音频片段划分数据直接对比即可，从而节省运算能力，避免大量频繁运算影响系统响应速度。

步骤202，在用户演唱歌曲过程中，采集用户的人声音频数据。

在实际应用中，可以利用如麦克风等声音采集设备，实时采集用户演唱歌曲时的音频信号，再对该音频信号进行处理，从而获得对应的人声音频数据。

步骤203，判断人声音频数据在歌曲中对应的时间段是否位于预设时间段内。

为了判断人声音频数据在歌曲中对应的时间段是否位于预设时间段内，可以根据预设人声频率范围和音频源文件的数据对应关系，确定歌曲的音频源文件中频率在预设人声频率范围内的目标时间段，再将目标时间段内的音频片段确定为预设音频片段。也可以从云端服务器或移动终端本地直接获取预先确定的预设音频片段划分数据，即只获取音频源文件中各预设音频片段所在时间段，并通过各预设音频片段所在时间段，判断人声音频数据在歌曲中对应的时间段是否位于预设时间段内。具体的，在利用音频源文件的数据对应关系对音频源文件的频谱进行分析时，为防止受到伴奏声音的干扰，对频谱的分析可以只对音频源文件的人声音轨进行鉴别。

若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则执行步骤204，判断人声音频数据的频率是否达到原唱的频率。若该人声音频数据在歌曲中对应的时间段并不位于预设时间段内，则可以无需对采集的人声音频数据进行干预，直接输出即可，从而保留并体现用户真实的演唱风格。

步骤204，判断人声音频数据的频率是否达到原唱的频率。

为了准确判断人声音频数据的频率是否达到原唱的频率，可以计算人声音频数据的频率与原唱的频率之间的频率差值，并判断该频率差值是否小于阈值频率，若该频率差值小于阈值频率，则确定该人声音频数据的频率达到原唱的频率。在该情况下，直接执行步骤206，输出采集的人声音频数据即可。否则执行步骤205，将采集的人声音频数据的频率调整至原唱的频率，输出频率调整后的人声音频数据。

具体的，由于不同用户对频率准确度的要求不同，可以由用户设定该阈值频率。也可以由本领域技术人员根据经验进行设置。例如，若用户需要确保表现出较好的演唱效果，可以将该阈值频率设置得较小，从而使得用户在该时间段的演唱效果更为接近原唱的演唱效果。如果用户在演唱时更希望凸显个人的演唱效果，可以将该阈值频率设置得较大，从而在用户演唱时采集的人声音频数据的频率明显低于原唱的频率时才进行调整。

步骤205，将采集的人声音频数据的频率调整至原唱的频率，输出频率调整后的人声音频数据。

在将采集的人声音频数据的频率调整至原唱的频率时，可以根据预设音频片段的长度，确定平缓调节时长。并在该平缓调节时长内，先将采集的人声音频数据的频率平缓地调整至原唱的频率，再在将采集的人声音频数据的频率平缓地调整至原唱的频率后，持续对采集的人声音频数据的频率进行增强，直至预设音频片段结束或采集的人声音频数据中断。从而使得频率调整的过程较为平缓，避免频率调整后输出的声音过于突兀影响演唱效果。

具体的，在根据预设音频片段的长度确定平缓调节时长过程中，当预设音频片段的长度超过阈值时间长度时，将阈值时间长度确定为平缓调节时长；当预设音频片段的长度未超过阈值时间长度时，将预设音频片段的长度确定为平缓调节时长。即在预设音频片段时间较长时，可以用充足的时间平缓地将采集的人声音频数据的频率调整至原唱的频率；在预设音频片段时间较短时，没有充足的时间进行调整，可以将整个预设音频片段时间作为平缓过渡的平缓调节时长。从而为频率调整最大化地提供充足的时间。

在对频率进行调整的过程中，可以在该平缓调节时长内，以调节幅度δ＝(f2-f1)*t/T对采集的人声音频数据的频率进行调节，得到调节后的频率f＝f1+δ，直至t＝T。其中，t为平缓调节时长内当前时刻距所述预设音频片段开始时刻的时间长度，T为所述平缓调节时长，f1为所述采集的人声音频数据的频率，f2为所述原唱的频率。从而保证在各种情况下，都能使采集的人声音频数据的频率能够平缓地调整至原唱的频率。

此外，由于部分用户在演唱至某一音频片段结束时，并不会按照音频源文件中结束的时间及时停止演唱，而是会继续延长一段时间。例如“青藏高原”这首歌的“原”字原唱假设会持续4秒，某些用户持续可能会5秒，此时，如果按照原唱结束的时间停止对采集的人声音频数据的调整，那么当原唱唱到第5秒的时候就会由于频率增强关闭造成人声音频的频率突然下降，给用户不好的体验。因此，为了防止在该情况下音频调整突然中断，可以在预设音频片段结束时，检测采集的人声音频数据是否中断。若检测到采集的人声音频数据未中断，则持续对采集的人声音频数据的频率进行调节，以稳定至原唱的频率，或平缓地降低对采集的人声音频数据的频率调节的幅度。

步骤206，输出采集的人声音频数据。

综上所述，本发明实施例中，通过根据各段音频数据对应的原唱的性别和不同性别对应的预设人声频率范围，分别确定各段音频数据中频率在预设人声频率范围内的目标时间段。从而能够针对不同性别做出更加准确的判断。而且通过从云端服务器或移动终端本地中获取预先确定的预设音频片段划分数据，使得计算速度更快，对采集的人声音频数据的频率的增强更加及时有效。另外，对音频的逐步增强，以及对段落结束部分的持续增强也使得变化更为平缓，避免变化效果过于突兀。从而大幅提升用户的使用体验。

参照图3，示出了本发明实施例中一种移动终端的框图。移动终端包括：声音采集模块31、音频位置确定模块32、评估模块33、音频调整模块34和输出模块35。

其中，声音采集模块31，用于在用户演唱歌曲过程中，采集用户的人声音频数据；

音频位置确定模块32，用于判断人声音频数据在歌曲中对应的时间段是否位于预设时间段内；

评估模块33，用于若人声音频数据在歌曲中对应的时间段位于预设时间段内，则判断人声音频数据的频率是否达到原唱的频率；

音频调整模块34，用于若人声音频数据的频率未达到原唱的频率，则将采集的人声音频数据的频率调整至原唱的频率；

输出模块35，用于输出频率调整后的人声音频数据。

其中，预设时间段为歌曲的预设音频片段对应的时间段，预设音频片段为歌曲原唱的频率在预设人声频率范围内的音频片段，预设人声频率范围包括预设的高音人声频率范围和预设的低音人声频率范围。

综上，本发明实施例中，通过声音采集模块31在用户演唱歌曲过程中，采集用户的人声音频数据，并由音频位置确定模块32判断该人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则由评估模块33判断该人声音频数据的频率是否达到原唱的频率，若该人声音频数据的频率未达到原唱的频率，则由音频调整模块34将采集的人声音频数据的频率调整至原唱的频率，再由输出模块35输出频率调整后的人声音频数据。从而对用户歌声的频率进行有效调节，避免用户声音的频率与原唱声音频率差值过大影响演唱效果，进而使用户在不具备专业演唱能力的情况下，仍能够体现较好的演唱水平。

参照图4，在本发明的一个优选的实施例中，在图3的基础上，移动终端还包括：预设音频片段确定模块36和获取模块37。

其中，预设音频片段确定模块36，用于确定歌曲的音频源文件中的预设音频片段。

获取模块37，用于从云端服务器中获取预设音频片段划分数据；或从移动终端本地获取预设音频片段划分数据；其中，预设音频片段划分数据用于表征音频源文件中预设音频片段所在时间段。

具体的，预设音频片段确定模块36，又包括：

时间段确定子模块361，用于根据预设人声频率范围和音频源文件的数据对应关系，确定歌曲的音频源文件中频率在预设人声频率范围内的目标时间段；

预设音频片段确定子模块362，用于将目标时间段内的音频片段确定为预设音频片段。

其中，时间段确定子模块361，包括：

性别确定单元3611，用于确定音频源文件中每个时间段的音频数据对应的原唱的性别；

时间段确定单元3612，用于根据各段音频数据对应的原唱的性别和不同性别对应的预设人声频率范围，分别确定各段音频数据中频率在预设人声频率范围内的目标时间段。

此外，音频调整模块34，包括：

平缓调节时长确定子模块341，用于根据预设音频片段的长度，确定平缓调节时长；

调整子模块342，用于在平缓调节时长内，逐步将采集的人声音频数据的频率调整至原唱的频率；并在将采集的人声音频数据的频率平缓地调整至原唱的频率后，持续对采集的人声音频数据的频率进行增强，直至预设音频片段结束或采集的人声音频数据中断。

其中，平缓调节时长确定子模块341，具体用于当预设音频片段的长度超过阈值时间长度时，将阈值时间长度确定为平缓调节时长；当预设音频片段的长度未超过阈值时间长度时，将预设音频片段的长度确定为平缓调节时长。

调整子模块342，具体用于在平缓调节时长内，以调节幅度δ＝(f2-f1)*t/T对采集的人声音频数据的频率进行调节，得到调节后的频率f＝f1+δ，直至t＝T；其中，t为平缓调节时长内当前时刻距预设音频片段开始时刻的时间长度，T为平缓调节时长，f1为采集的人声音频数据的频率，f2为原唱的频率。

而且，调整子模块342，还用于检测采集的人声音频数据是否中断；若检测到采集的人声音频数据未中断，则持续对采集的人声音频数据的频率进行调节，以稳定至原唱的频率，或平缓地降低对采集的人声音频数据的频率调节的幅度。

具体的，评估模块33，包括：

频率差值计算子模块331，用于计算人声音频数据的频率与原唱的频率之间的频率差值；

频率差值评估子模块332，用于判断频率差值是否小于阈值频率；若频率差值小于阈值频率，则确定人声音频数据的频率达到原唱的频率。

综上，本发明实施例中，通过音频片段确定模块36根据各段音频数据对应的原唱的性别和不同性别对应的预设人声频率范围，分别确定各段音频数据中频率在预设人声频率范围内的目标时间段。从而能够针对不同性别做出更加准确的判断。而且通过获取模块37从云端服务器或移动终端本地中获取预先确定的预设音频片段划分数据，使得计算速度更快，对采集的人声音频数据的频率的增强更加及时有效。另外，通过音频调整模块34对音频的逐步增强，以及对段落结束部分的持续增强也使得变化更为平缓，避免变化效果过于突兀。

图5是本发明实施例的又一种移动终端的框图。图5所示的移动终端500包括：至少一个处理器501、存储器502、至少一个网络接口504和其他用户接口503。移动终端500中的各个组件通过总线系统505耦合在一起。可理解，总线系统505用于实现这些组件之间的连接通信。总线系统505除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图5中将各种总线都标为总线系统505。

其中，用户接口503可以包括显示器、键盘或者点击设备(例如，鼠标，轨迹球(trackball)、触感板或者触摸屏等。

可以理解，本发明实施例中的存储器502可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-OnlyMemory，ROM)、可编程只读存储器(ProgrammableROM，PROM)、可擦除可编程只读存储器(ErasablePROM，EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccessMemory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(StaticRAM，SRAM)、动态随机存取存储器(DynamicRAM，DRAM)、同步动态随机存取存储器(SynchronousDRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRateSDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(SynchlinkDRAM，SLDRAM)和直接内存总线随机存取存储器(DirectRambusRAM，DRRAM)。本发明实施例描述的系统和方法的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中，存储器502存储了如下的元素，可执行模块或者数据结构，或者他们的子集，或者他们的扩展集：操作系统5021和应用程序5022。

其中，操作系统5021，包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序5022，包含各种应用程序，例如媒体播放器(MediaPlayer)、浏览器(Browser)等，用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序5022中。

在本发明实施例中，通过调用存储器502存储的程序或指令，具体的，可以是应用程序5022中存储的程序或指令，处理器501用于在用户演唱歌曲过程中，采集用户的人声音频数据，并判断该人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则判断该人声音频数据的频率是否达到原唱的频率，若该人声音频数据的频率未达到原唱的频率，则将采集的人声音频数据的频率调整至原唱的频率，再输出频率调整后的人声音频数据。

上述本发明实施例揭示的方法可以应用于处理器501中，或者由处理器501实现。处理器501可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、现成可编程门阵列(FieldProgrammableGateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502，处理器501读取存储器502中的信息，结合其硬件完成上述方法的步骤。

可以理解的是，本发明实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(ApplicationSpecificIntegratedCircuits，ASIC)、数字信号处理器(DigitalSignalProcessing，DSP)、数字信号处理设备(DSPDevice，DSPD)、可编程逻辑设备(ProgrammableLogicDevice，PLD)、现场可编程门阵列(Field-ProgrammableGateArray，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请功能的其它电子单元或其组合中。

对于软件实现，可通过执行本发明实施例功能的模块(例如过程、函数等)来实现本发明实施例的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

可选地，处理器501还用于，确定歌曲的音频源文件中的预设音频片段。

可选地，处理器501还具体用于，根据预设人声频率范围和音频源文件的数据对应关系，确定歌曲的音频源文件中频率在预设人声频率范围内的目标时间段；将目标时间段内的音频片段确定为预设音频片段。

可选地，处理器501还具体用于，确定音频源文件中每个时间段的音频数据对应的原唱的性别；根据各段音频数据对应的原唱的性别和不同性别对应的预设人声频率范围，分别确定各段音频数据中频率在预设人声频率范围内的目标时间段。

可选地，处理器501还用于，从云端服务器中获取预设音频片段划分数据；或从移动终端本地获取预设音频片段划分数据；其中，预设音频片段划分数据用于表征音频源文件中预设音频片段所在时间段。

可选地，处理器501还用于，根据预设音频片段的长度，确定平缓调节时长；在平缓调节时长内，将采集的人声音频数据的频率平缓地调整至原唱的频率；在将采集的人声音频数据的频率平缓地调整至原唱的频率后，持续对采集的人声音频数据的频率进行增强，直至预设音频片段结束或采集的人声音频数据中断。

可选地，处理器501还具体用于，当预设音频片段的长度超过阈值时间长度时，将阈值时间长度确定为平缓调节时长；当预设音频片段的长度未超过阈值时间长度时，将预设音频片段的长度确定为平缓调节时长。

可选地，处理器501还具体用于，在平缓调节时长内，以调节幅度δ＝(f2-f1)*t/T对采集的人声音频数据的频率进行调节，得到调节后的频率f＝f1+δ，直至t＝T；其中，t为平缓调节时长内当前时刻距预设音频片段开始时刻的时间长度，T为平缓调节时长，f1为采集的人声音频数据的频率，f2为原唱的频率。

可选地，处理器501还具体用于，检测采集的人声音频数据是否中断；若检测到采集的人声音频数据未中断，则持续对采集的人声音频数据的频率进行调节，以稳定至原唱的频率，或平缓地降低对采集的人声音频数据的频率调节的幅度。

可选地，处理器501还用于，计算人声音频数据的频率与原唱的频率之间的频率差值；判断频率差值是否小于阈值频率；若频率差值小于阈值频率，则确定人声音频数据的频率达到原唱的频率。

移动终端500能够实现前述实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

综上，本发明实施例通过在用户演唱歌曲过程中，采集用户的人声音频数据，并判断该人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则判断该人声音频数据的频率是否达到原唱的频率，若该人声音频数据的频率未达到原唱的频率，则将采集的人声音频数据的频率调整至原唱的频率，再输出频率调整后的人声音频数据。从而对用户歌声的频率进行有效调节，避免用户声音的频率与原唱声音频率差值过大影响演唱效果，进而使用户在不具备专业演唱能力的情况下，仍能够体现较好的演唱水平。

图6是本发明实施例的再一种移动终端的框图。具体地，图6中的移动终端可以为手机、平板电脑、个人数字助理(PersonalDigital Assistant，PDA)、或车载电脑等。

图6中的移动终端包括射频(RadioFrequency，RF)电路610、存储器620、输入单元630、显示单元640、处理器660、音频电路670、WiFi(WirelessFidelity)模块680和电源690。

其中，输入单元630可用于接收用户输入的数字或字符信息，以及产生与移动终端的用户设置以及功能控制有关的信号输入。具体地，本发明实施例中，该输入单元630可以包括触控面板631。触控面板631，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板631上的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板631可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给该处理器660，并能接收处理器660发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板631。除了触控面板631，输入单元630还可以包括其他输入设备632，其他输入设备632可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

其中，显示单元640可用于显示由用户输入的信息或提供给用户的信息以及移动终端的各种菜单界面。显示单元640可包括显示面板641，可选的，可以采用LCD或有机发光二极管(OrganicLight-EmittingDiode，OLED)等形式来配置显示面板641。

应注意，触控面板631可以覆盖显示面板641，形成触摸显示屏，当该触摸显示屏检测到在其上或附近的触摸操作后，传送给处理器660以确定触摸事件的类型，随后处理器660根据触摸事件的类型在触摸显示屏上提供相应的视觉输出。

触摸显示屏包括应用程序界面显示区及常用控件显示区。该应用程序界面显示区及该常用控件显示区的排列方式并不限定，可以为上下排列、左右排列等可以区分两个显示区的排列方式。该应用程序界面显示区可以用于显示应用程序的界面。每一个界面可以包含至少一个应用程序的图标和/或widget桌面控件等界面元素。该应用程序界面显示区也可以为不包含任何内容的空界面。该常用控件显示区用于显示使用率较高的控件，例如，设置按钮、界面编号、滚动条、电话本图标等应用程序图标等。

其中处理器660是移动终端的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在第一存储器621内的软件程序和/或模块，以及调用存储在第二存储器622内的数据，执行移动终端的各种功能和处理数据，从而对移动终端进行整体监控。可选的，处理器660可包括一个或多个处理单元。

在本发明实施例中，通过调用存储该第一存储器621内的软件程序和/或模块和/或该第二存储器622内的数据，处理器660用于在用户演唱歌曲过程中，采集用户的人声音频数据，并判断该人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则判断该人声音频数据的频率是否达到原唱的频率，若该人声音频数据的频率未达到原唱的频率，则将采集的人声音频数据的频率调整至原唱的频率，再输出频率调整后的人声音频数据。

可选地，处理器660还用于，确定歌曲的音频源文件中的预设音频片段。

可选地，处理器660还具体用于，根据预设人声频率范围和音频源文件的数据对应关系，确定歌曲的音频源文件中频率在预设人声频率范围内的目标时间段；将目标时间段内的音频片段确定为预设音频片段。

可选地，处理器660还具体用于，确定音频源文件中每个时间段的音频数据对应的原唱的性别；根据各段音频数据对应的原唱的性别和不同性别对应的预设人声频率范围，分别确定各段音频数据中频率在预设人声频率范围内的目标时间段。

可选地，处理器660还用于，从云端服务器中获取预设音频片段划分数据；或从移动终端本地获取预设音频片段划分数据；其中，预设音频片段划分数据用于表征音频源文件中预设音频片段所在时间段。

可选地，处理器660还用于，根据预设音频片段的长度，确定平缓调节时长；在平缓调节时长内，将采集的人声音频数据的频率平缓地调整至原唱的频率；在将采集的人声音频数据的频率平缓地调整至原唱的频率后，持续对采集的人声音频数据的频率进行增强，直至预设音频片段结束或采集的人声音频数据中断。

可选地，处理器660还具体用于，当预设音频片段的长度超过阈值时间长度时，将阈值时间长度确定为平缓调节时长；当预设音频片段的长度未超过阈值时间长度时，将预设音频片段的长度确定为平缓调节时长。

可选地，处理器660还具体用于，在平缓调节时长内，以调节幅度δ＝(f2-f1)*t/T对采集的人声音频数据的频率进行调节，得到调节后的频率f＝f1+δ，直至t＝T；其中，t为平缓调节时长内当前时刻距预设音频片段开始时刻的时间长度，T为平缓调节时长，f1为采集的人声音频数据的频率，f2为原唱的频率。

可选地，处理器660还具体用于，检测采集的人声音频数据是否中断；若检测到采集的人声音频数据未中断，则持续对采集的人声音频数据的频率进行调节，以稳定至原唱的频率，或平缓地降低对采集的人声音频数据的频率调节的幅度。

可选地，处理器660还用于，计算人声音频数据的频率与原唱的频率之间的频率差值；判断频率差值是否小于阈值频率；若频率差值小于阈值频率，则确定人声音频数据的频率达到原唱的频率。

移动终端能够实现前述实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

可见，本发明实施例中的移动终端，通过处理器660在用户演唱歌曲过程中，采集用户的人声音频数据，并判断该人声音频数据在歌曲中对应的时间段是否位于预设时间段内。若该人声音频数据在歌曲中对应的时间段位于预设时间段内，则判断该人声音频数据的频率是否达到原唱的频率，若该人声音频数据的频率未达到原唱的频率，则将采集的人声音频数据的频率调整至原唱的频率，再输出频率调整后的人声音频数据。从而对用户歌声的频率进行有效调节，避免用户声音的频率与原唱声音频率差值过大影响演唱效果，进而使用户在不具备专业演唱能力的情况下，仍能够体现较好的演唱水平。

本领域普通技术人员可以意识到，结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种音频处理方法，应用于移动终端，其特征在于，包括：

在用户演唱歌曲过程中，采集所述用户的人声音频数据；

2.根据权利要求1所述的方法，其特征在于，所述在用户演唱歌曲过程中，采集所述用户的人声音频数据的步骤之前，所述方法还包括：

确定所述歌曲的音频源文件中的所述预设音频片段。

3.根据权利要求2所述的方法，其特征在于，所述确定歌曲的音频源文件中的所述预设音频片段的步骤，包括：

根据预设人声频率范围和音频源文件的数据对应关系，确定所述歌曲的音频源文件中频率在预设人声频率范围内的目标时间段；

将所述目标时间段内的音频片段确定为所述预设音频片段。

4.根据权利要求3所述的方法，其特征在于，所述根据预设人声频率范围和音频源文件的数据对应关系，确定所述歌曲的音频源文件中，频率在预设人声频率范围内的目标时间段的步骤，包括：

确定所述音频源文件中每个时间段的音频数据对应的原唱的性别；

根据各段音频数据对应的原唱的性别和不同性别对应的预设人声频率范围，分别确定所述各段音频数据中频率在预设人声频率范围内的目标时间段。

5.根据权利要求2所述的方法，其特征在于，在所述确定所述歌曲的音频源文件中的所述预设音频片段的步骤之前，所述方法还包括：

从云端服务器中获取预设音频片段划分数据；或

从移动终端本地获取预设音频片段划分数据；

其中，所述预设音频片段划分数据用于表征所述音频源文件中预设音频片段所在时间段。

6.根据权利要求1所述的方法，其特征在于，所述将所述采集的人声音频数据的频率调整至所述原唱的频率的步骤，包括：

根据所述预设音频片段的长度，确定平缓调节时长；

在所述平缓调节时长内，将所述采集的人声音频数据的频率平缓地调整至所述原唱的频率；

在将所述采集的人声音频数据的频率平缓地调整至所述原唱的频率后，持续对所述采集的人声音频数据的频率进行增强，直至所述预设音频片段结束或采集的人声音频数据中断。

7.根据权利要求6所述的方法，其特征在于，所述根据所述预设音频片段的长度，确定平缓调节时长的步骤，包括：

当所述预设音频片段的长度超过阈值时间长度时，将所述阈值时间长度确定为所述平缓调节时长；

当所述预设音频片段的长度未超过阈值时间长度时，将所述预设音频片段的长度确定为所述平缓调节时长。

8.根据权利要求6所述的方法，其特征在于，所述在所述平缓调节时长内，将所述采集的人声音频数据的频率平缓地调整至所述原唱的频率的步骤，包括：

在所述平缓调节时长内，以调节幅度δ＝(f2-f1)*t/T对所述采集的人声音频数据的频率进行调节，得到调节后的频率f＝f1+δ，直至t＝T；

其中，t为平缓调节时长内当前时刻距所述预设音频片段开始时刻的时间长度，T为所述平缓调节时长，f1为所述采集的人声音频数据的频率，f2为所述原唱的频率。

9.根据权利要求6所述的方法，其特征在于，在所述预设音频片段结束时，所述方法还包括：

检测所述采集的人声音频数据是否中断；

若检测到所述采集的人声音频数据未中断，则持续对所述采集的人声音频数据的频率进行调节，以稳定至所述原唱的频率，或平缓地降低对所述采集的人声音频数据的频率调节的幅度。

10.根据权利要求1所述的方法，其特征在于，所述判断所述人声音频数据的频率是否达到原唱的频率的步骤，包括：

计算所述人声音频数据的频率与所述原唱的频率之间的频率差值；

判断所述频率差值是否小于阈值频率；

若所述频率差值小于阈值频率，则确定所述人声音频数据的频率达到所述原唱的频率。

11.一种移动终端，其特征在于，包括：

输出模块，用于输出频率调整后的人声音频数据；

12.根据权利要求11所述的移动终端，其特征在于，所述移动终端还包括：

预设音频片段确定模块，用于确定所述歌曲的音频源文件中的所述预设音频片段。

13.根据权利要求12所述的移动终端，其特征在于，所述预设音频片段确定模块，包括：

时间段确定子模块，用于根据预设人声频率范围和音频源文件的数据对应关系，确定所述歌曲的音频源文件中频率在预设人声频率范围内的目标时间段；

预设音频片段确定子模块，用于将所述目标时间段内的音频片段确定为所述预设音频片段。

14.根据权利要求13所述的移动终端，其特征在于，所述时间段确定子模块，包括：

性别确定单元，用于确定所述音频源文件中每个时间段的音频数据对应的原唱的性别；

时间段确定单元，用于根据各段音频数据对应的原唱的性别和不同性别对应的预设人声频率范围，分别确定所述各段音频数据中频率在预设人声频率范围内的目标时间段。

15.根据权利要求12所述的移动终端，其特征在于，所述移动终端还包括：

获取模块，用于从云端服务器中获取预设音频片段划分数据；或从移动终端本地获取预设音频片段划分数据；其中，所述预设音频片段划分数据用于表征所述音频源文件中预设音频片段所在时间段。

16.根据权利要求11所述的移动终端，其特征在于，所述音频调整模块，包括：

平缓调节时长确定子模块，用于根据所述预设音频片段的长度，确定平缓调节时长；

调整子模块，用于在所述平缓调节时长内，逐步将所述采集的人声音频数据的频率调整至原唱的频率；并在将所述采集的人声音频数据的频率平缓地调整至所述原唱的频率后，持续对所述采集的人声音频数据的频率进行增强，直至所述预设音频片段结束或采集的人声音频数据中断。

17.根据权利要求16所述的移动终端，其特征在于，

所述平缓调节时长确定子模块，具体用于当所述预设音频片段的长度超过阈值时间长度时，将所述阈值时间长度确定为所述平缓调节时长；当所述预设音频片段的长度未超过阈值时间长度时，将所述预设音频片段的长度确定为所述平缓调节时长。

18.根据权利要求16所述的移动终端，其特征在于，

所述调整子模块，具体用于在所述平缓调节时长内，以调节幅度δ＝(f2-f1)*t/T对所述采集的人声音频数据的频率进行调节，得到调节后的频率f＝f1+δ，直至t＝T；其中，t为平缓调节时长内当前时刻距所述预设音频片段开始时刻的时间长度，T为所述平缓调节时长，f1为所述采集的人声音频数据的频率，f2为所述原唱的频率。

19.根据权利要求16所述的移动终端，其特征在于，

所述调整子模块，还用于检测所述采集的人声音频数据是否中断；若检测到所述采集的人声音频数据未中断，则持续对所述采集的人声音频数据的频率进行调节，以稳定至所述原唱的频率，或平缓地降低对所述采集的人声音频数据的频率调节的幅度。

20.根据权利要求11所述的移动终端，其特征在于，所述评估模块，包括：

频率差值计算子模块，用于计算所述人声音频数据的频率与所述原唱的频率之间的频率差值；

频率差值评估子模块，用于判断所述频率差值是否小于阈值频率；若所述频率差值小于阈值频率，则确定所述人声音频数据的频率达到所述原唱的频率。