CN112118481B

CN112118481B - 一种音频片段生成方法、装置、播放器及存储介质

Info

Publication number: CN112118481B
Application number: CN202010987378.0A
Authority: CN
Inventors: 刘廷
Original assignee: Gree Electric Appliances Inc of Zhuhai
Current assignee: Gree Electric Appliances Inc of Zhuhai
Priority date: 2020-09-18
Filing date: 2020-09-18
Publication date: 2021-11-23
Anticipated expiration: 2040-09-18
Also published as: CN112118481A

Abstract

本发明提供一种音频片段生成方法、装置、播放器及存储介质，所述音频片段生成方法，包括：获取音频文件；检测所述音频文件的码流变化；利用预设码流范围及预设时长，生成目标音频片段。解决了生成满足预设要求的音频片段，以通过音频片段让用户感受整个音频的魅力的问题。通过检测获取的音频文件的码流变化，利用预设码流范围及预设时长，生成满足预设条件的音频片段，将音频文件(如一首歌曲)中的高潮部分并保存成一个片段，实现了自动快速识别音频文件中的高潮部分，帮助用户快速预览音频中的精彩片段，通过反映高潮部分的音频片段让用户感受整个音频的魅力。

Description

一种音频片段生成方法、装置、播放器及存储介质

技术领域

本发明属于音频处理技术领域，具体是一种音频片段生成方法、装置、播放器及存储介质。

背景技术

随着互联网技术的不断普及，互联网多媒体音乐版本逐渐被中国的用户接受，越来越多的客户端让免费的用户试听一小段的音乐，让用户通过这一小段的音乐片段来决定是不是要购买单曲，也能够让用户节省大量时间去挑选音乐。

现有技术中，客户端都是简单地给用户停前面的10s或者15s，用户还没有真正感受到这首歌的魅力就切歌，所以，本领域亟需解决生成满足预设要求的音频片段，以通过音频片段让用户感受整个音频的魅力的问题。

发明内容

本发明提供一种音频片段生成方法、装置、播放器及存储介质，以解决生成满足预设要求的音频片段，以通过音频片段让用户感受整个音频的魅力的问题。

第一方面，本发明提供一种音频片段生成方法，包括：

获取音频文件；

检测所述音频文件的码流变化；

利用预设码流范围及预设时长，生成目标音频片段。

根据本发明的实施例，可选地，所述获取音频文件，包括：

加载音频文件；

解析加载的所述音频文件。

根据本发明的实施例，可选地，所述利用预设码流范围及预设时长，生成目标音频片段，包括：

抓取所述音频文件中码流范围与预设码流范围匹配的目标子片段；

根据所述目标子片段的时长与预设时长的关系，生成目标音频片段。

根据本发明的实施例，可选地，所述抓取所述音频文件中码流范围与预设码流范围匹配的目标子片段，包括：

检测到所述音频文件的码流达到预设码流范围的上限值时，以该上限值对应的所述音频文件中的时间位置为起点，继续检测码流；

检测到所述音频文件的码流达到预设码流范围的下限值时，以该下限值对应的所述音频文件中的时间位置为终点；

抓取所述起点与所述终点之间的片段，作为码流范围与预设码流范围匹配的目标子片段。

根据本发明的实施例，可选地，所述目标子片段为一个时，所述根据所述目标子片段的时长与预设时长的关系，生成目标音频片段，包括：

所述目标子片段的时长与预设时长匹配时，所述目标子片段为目标音频片段；

所述目标子片段的时长与预设时长不匹配时，截取从所述起点开始的时长为预设时长的音频片段，作为目标音频片段。

根据本发明的实施例，可选地，所述目标子片段为多个时，所述根据所述目标子片段的时长与预设时长的关系，生成目标音频片段，包括：

多个目标子片段中仅存在一个时长与预设时长匹配的目标子片段时，该目标子片段为目标音频片段；

多个目标子片段中存在多个时长与预设时长匹配的目标子片段时，确定其中一个目标子片段为目标音频片段。

根据本发明的实施例，可选地，所述目标子片段为多个时，所述根据所述目标子片段的时长与预设时长的关系，生成目标音频片段，还包括：

多个目标子片段的时长与预设时长均不匹配时，确定各目标子片段的时长；

确定时长与预设时长相差最小的目标子片段；

截取从所确定的目标子片段起点开始的时长为预设时长的音频片段，作为目标音频片段。

根据本发明的实施例，可选地，所述确定时长与预设时长相差最小的目标子片段，包括：

从时长大于预设时长的目标子片段中，确定时长与预设时长相差最小的目标子片段。

第二方面，本发明提供一种音频片段生成装置，包括：

获取模块，用于获取音频文件；

检测模块，用于检测所述音频文件的码流变化；

生成模块，用于利用预设码流范围及预设时长，生成目标音频片段。

第三方面，本发明提供一种播放器，包括：存储器和处理器，所述存储器上存储有计算机程序，所述计算机程序被所述处理器执行时实现如第一方面所述的音频片段生成方法。

第四方面，本发明提供一种存储介质，包括：所述存储介质上存储有计算机程序，所述计算机程序被一个或多个处理器执行时，实现如第一方面所述的音频片段生成方法。

本发明与现有技术相比，至少具有如下有益效果：

通过检测获取的音频文件的码流变化，利用预设码流范围及预设时长，生成满足预设条件的音频片段，将音频文件(如一首歌曲)中的高潮部分并保存成一个片段，实现了自动快速识别音频文件中的高潮部分，帮助用户快速预览音频中的精彩片段，通过反映高潮部分的音频片段让用户感受整个音频的魅力，更加能够吸引用户去购买单曲，使用户在海量的网络音频中高效地找到自己喜欢的音乐，以做出正确选择，节省大量的时间和金钱。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明实施例一提供的一种音频片段生成方法流程图；

图2是本发明实施例二提供的一种音频片段生成装置框图。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

如图1所示，本实施例提供一种音频片段生成方法，可以应用于播放器中，具体来说，可以应用于具有音频编辑功能呢的网络媒体播放器中，该方法包括如下步骤：

步骤S110、获取音频文件。

可选地，获取音频文件的步骤，可以包括如下子步骤：

步骤S110-1、加载音频文件。

具体地，音频文件是可变比特率VBR(Variable Bit-Rate)的音频文件，加载一首完整的可变比特率的音频文件至播放器，例如，音频文件可以是通过网络获取的收费歌曲。比特率越高，音质就越好，一般来说，音频片段的音调越高，就需要更多的空间去存储，比特率就越高，VBR编码技术对每个音频帧选择最适合这一帧的比特率，对于音调比较低的音频帧，比特率会比较低，数据大小就比较小，音调比较高的则比特率就会比较高，数据大小就比较大。这样就能在不损失音频质量的前提下，节省音频数据的存储空间，进一步压缩mp3的文件大小，并且能够通过比特率体现音乐的高潮起伏。

步骤S110-2、解析加载的音频文件。

步骤S120、检测音频文件的码流变化。

步骤S130、利用预设码流范围及预设时长，生成目标音频片段。

其中，预设码流范围是[Min，Max]，Min表示预设码流范围的下限值，Max表示预设码流范围的上限值。预设时长是L，可以根据实际应用情况自行设定，例如可以是10秒、15秒等。通过预设体现音频文件高潮部分的码流范围，并预设目标音频片段的时长，生成满足预设要求的音频片段，以通过该音频片段让用户感受整个音频的魅力，在通过播放器播放该音频片段时，可以根据感受选择是否购买或播放该音频文件。

作为一种优选的实现方式，上述步骤S130，利用预设码流范围及预设时长，生成目标音频片段，可以包括如下子步骤：

步骤S130-1、抓取音频文件中码流范围与预设码流范围匹配的目标子片段。

具体地，通过从音频文件中抓取满足预设码流范围的目标子片段，得到可能满足预设要求的音频片段。

作为一种优选的实现方式，抓取音频文件中码流范围与预设码流范围匹配的目标子片段，包括：

首先，检测到音频文件的码流达到预设码流范围的上限值Max时，以该上限值Max对应的音频文件中的时间位置为起点K1，继续检测码流。

其次，检测到音频文件的码流达到预设码流范围的下限值Min时，以该下限值Min对应的音频文件中的时间位置为终点K2。

最后，抓取起点K1与终点K2之间的片段，作为码流范围与预设码流范围匹配的目标子片段。继续执行步骤S130-2，以生成满足预设要求的音频片段。

步骤S130-2、根据目标子片段的时长与预设时长的关系，生成目标音频片段。

具体地，目标子片段的时长是K2-K1，通过对抓取得到的目标子片段的时长与预设时长进行比对，生成满足预设时长的目标音频片段，并保存，以便在用户需要试听该音频文件时，直接播放该音频片段供用户欣赏，用户可根据对该音频片段的欣赏感受，进一步决定是否购买该音频文件。

根据抓取到的目标子片段的个数以及目标子片段的时长，可以分为不同情况生成目标音频片段：

第一种情况：目标子片段为一个时，根据目标子片段的时长与预设时长的关系，生成目标音频片段，包括：

(1)目标子片段的时长与预设时长匹配时，该目标子片段为目标音频片段。

具体来说，目标子片段的时长与预设时长匹配，是目标子片段的时长与预设时长相等，例如，预设时长是15秒，起点K1是音频文件的1分35秒，终点K2是音频文件的1分50秒，则抓取到的目标子片段的时长是15秒，目标子片段的时长与预设时长相等，两者匹配。

在一些情形下，目标子片段的时长与预设时长匹配也可以是相差时长不超过预设值，例如，预设值是1秒，起点K1是音频文件的1分35秒，终点K2是音频文件的1分49秒，则抓取到的目标子片段的时长是14秒，目标子片段的时长与预设时长相差1秒，不超过预设值，则仍认为两者匹配。

(2)目标子片段的时长与预设时长不匹配时，截取从起点K1开始的时长为预设时长L的音频片段，作为目标音频片段。

需要说明的是，目标子片段的时长与预设时长不相等时，可能存在两种情形：一种是目标子片段的时长大于预设时长，此时，从音频文件中截取起点K1开始的时长为预设时长L的音频片段，也就是从抓取的目标子片段中截取预设时长L的部分，作为目标音频片段。另一种是目标子片段的时长小于预设时长，此时，将目标子片段的长度补全到预设长度L，也就是从抓取的目标子片段的起点K1开始取时长为预设长度L的片段作为目标音频片段。

在此种情况下，目标子片段为一个，既可以是检测音频文件的码流变化过程中只抓取第一个满足预设条件的目标子片段，也可以是检测整个音频文件的码流变化，最终只抓取到一个满足预设条件的目标子片段，此处不做限定。

若检测音频文件的码流变化过程中只抓取第一个满足预设条件的目标子片段，可以提高检测效率，快速生成满足预设条件的目标音频片段。若检测整个音频文件的码流变化来抓取满足预设条件的目标子片段，能够将整个音频文件中满足预设条件的目标子片段都抓取出来，当抓取到的目标子片段有多个时，通过第二种情况从抓取到的多个目标子片段中选择更为符合预设要求的目标子片段，以得到更准确的目标音频片段。

第二种情况：目标子片段为多个时，根据目标子片段的时长与预设时长的关系，生成目标音频片段，包括：

具体来说，存在多个时长与预设时长匹配的目标子片段时，说明当前音频文件可能存在多处高潮音频片段，可以随机选取其中一个目标子片段，作为目标音频片段。当然，由于音频文件的高潮处往往位于整个音频文件的中间，也可以默认选取匹配的多个目标子片段中时间位置处于中间的一个子片段，作为目标音频片段。

本实施例中，当抓取到的多个目标子片段的时长与预设时长均不匹配时，需要通过各目标子片段的时长与预设时长的差异，生成目标音频片段，先确定时长与预设时长相差最小的目标子片段，在从该目标子片段的起点开始，从音频文件中截取出预设时长的音频片段，作为目标音频片段。因此，根据目标子片段的时长与预设时长的关系，生成目标音频片段，还包括：

确定时长与预设时长相差最小的目标子片段；

当然，为了进一步准确反映音频文件的高潮内容，确定时长与预设时长相差最小的目标子片段，可以是从时长大于预设时长的目标子片段中，确定时长与预设时长相差最小的目标子片段，以使从音频文件中截取的音频片段中的内容完全属于音频文件的高潮内容，给用户带来更好的感受。

实施例二

如图2所示，本实施例提供一种音频片段生成装置，包括如下模块：

获取模块210，用于获取音频文件。

检测模块220，用于检测音频文件的码流变化。

生成模块230，用于利用预设码流范围及预设时长，生成目标音频片段。

可以理解的是，获取模块210可用于执行实施例一中的步骤S110，检测模块220可用于执行实施例一中的步骤S120，生成模块230可用于执行实施例一中的步骤S130。具体步骤的内容详见实施例一，此处不再赘述。

进一步地，生成模块230用于利用预设码流范围及预设时长，生成目标音频片段时，包括：

抓取音频文件中码流范围与预设码流范围匹配的目标子片段；

根据目标子片段的时长与预设时长的关系，生成目标音频片段。

具体地，生成模块230根据目标子片段的时长与预设时长的关系，生成目标音频片段时，根据抓取到的目标子片段的个数以及目标子片段的时长，可以分为不同情况生成目标音频片段：

(1)目标子片段的时长与预设时长匹配时，目标子片段为目标音频片段。

(2)目标子片段的时长与预设时长不匹配时，截取从起点开始的时长为预设时L的音频片段，作为目标音频片段。

确定时长与预设时长相差最小的目标子片段；

实施例三

本发明提供一种播放器，包括：存储器和处理器，该存储器上存储有计算机程序，该计算机程序被该处理器执行时实现实施例一提供的音频片段生成方法。

本实施例中，播放器可以是网络媒体播放器，处理器可以是专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(DigitalSignal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述实施例中的音频片段生成方法。在处理器上运行的计算机程序被执行时所实现的方法可参照本发明实施例一提供的音频片段生成方法的具体实施例，此处不再赘述。

可以理解，该播放器还可以包括，多媒体组件，输入/输出(I/O)接口，以及通信组件。

多媒体组件可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或通过通信组件发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口为处理器和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件用于与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near Field Communication，简称NFC)，2G、3G或4G，或它们中的一种或几种的组合，因此相应的该通信组件可以包括：Wi-Fi模块，蓝牙模块，NFC模块。

实施例四

本发明提供一种存储介质，包括：所述存储介质上存储有计算机程序，所述计算机程序被一个或多个处理器执行时，实现如第一方面所述的音频片段生成方法。

本实施例中，存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。

在本发明实施例所提供的几个实施例中，应该理解到，所揭露的系统和方法，也可以通过其它的方式实现。以上所描述的系统和方法实施例仅仅是示意性的。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

虽然本发明所揭露的实施方式如上，但所述的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种音频片段生成方法，其特征在于，包括：

获取音频文件；

检测所述音频文件的码流变化；

利用预设码流范围及预设时长，生成目标音频片段，

其中，所述利用预设码流范围及预设时长，生成目标音频片段，包括：

抓取所述音频文件中码流范围与预设码流范围匹配的目标子片段，所述抓取所述音频文件中码流范围与预设码流范围匹配的目标子片段，包括：检测到所述音频文件的码流达到预设码流范围的上限值时，以该上限值对应的所述音频文件中的时间位置为起点，继续检测码流；检测到所述音频文件的码流达到预设码流范围的下限值时，以该下限值对应的所述音频文件中的时间位置为终点；抓取所述起点与所述终点之间的片段，作为码流范围与预设码流范围匹配的目标子片段；

根据所述目标子片段的时长与预设时长的关系，生成目标音频片段，

其中，所述目标子片段为多个时，所述根据所述目标子片段的时长与预设时长的关系，生成目标音频片段，包括：

2.根据权利要求1所述的音频片段生成方法，其特征在于，所述获取音频文件，包括：

加载音频文件；

解析加载的所述音频文件。

3.根据权利要求1或2所述的音频片段生成方法，其特征在于，所述目标子片段为一个时，所述根据所述目标子片段的时长与预设时长的关系，生成目标音频片段，包括：

4.根据权利要求1或2所述的音频片段生成方法，其特征在于，所述目标子片段为多个时，所述根据所述目标子片段的时长与预设时长的关系，生成目标音频片段，包括：

多个目标子片段中仅存在一个时长与预设时长匹配的目标子片段时，该目标子片段为目标音频片段。

5.根据权利要求1或2所述的音频片段生成方法，其特征在于，所述目标子片段为多个时，所述根据所述目标子片段的时长与预设时长的关系，生成目标音频片段，还包括：

确定时长与预设时长相差最小的目标子片段；

6.根据权利要求5所述的音频片段生成方法，其特征在于，所述确定时长与预设时长相差最小的目标子片段，包括：

7.一种音频片段生成装置，其特征在于，包括：

获取模块，用于获取音频文件；

检测模块，用于检测所述音频文件的码流变化；

生成模块，用于利用预设码流范围及预设时长，生成目标音频片段，

其中，生成模块利用预设码流范围及预设时长，生成目标音频片段，包括：

8.一种播放器，其特征在于，包括：存储器和处理器，所述存储器上存储有计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的音频片段生成方法。

9.一种存储介质，其特征在于，包括：所述存储介质上存储有计算机程序，所述计算机程序被一个或多个处理器执行时，实现如权利要求1至6中任一项所述的音频片段生成方法。