CN113837807A - 热度预测方法、装置、电子设备及可读存储介质 - Google Patents
热度预测方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN113837807A CN113837807A CN202111135530.3A CN202111135530A CN113837807A CN 113837807 A CN113837807 A CN 113837807A CN 202111135530 A CN202111135530 A CN 202111135530A CN 113837807 A CN113837807 A CN 113837807A
- Authority
- CN
- China
- Prior art keywords
- heat
- time period
- characteristic
- video resource
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种热度预测方法、装置、电子设备及可读存储介质,其中,所述热度预测方法:获取候选视频资源在预测时间段之前的第一热度特征,所述第一热度特征包括第一用户特征;基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,所述被预测时间段为所述预测时间段之后的时间段;在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源。能够提高对视频资源的热度预测的准确性。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种热度预测方法、装置、电子设备及可读存储介质。
背景技术
随着平台上线的视频内容越来越多,分摊到每一视频内容上的运营资源越来越少,如何实现运营资源的最大化利用成为了平台运营的重要任务。
目前,一般是通过比较每一视频资源的当日播放量、当日点击量等数据,并将当日播放量、当日点击量均较高的视频资源作为目标视频资源,以便集中资源对目标视频资源进行运营,实现运营资源的最大化利用。然而,由于当日播放量、当日点击量并不能准确的预测视频资源的热度走势,即目标视频资源的热度预测存在准确度低的问题。
可见,相关技术中,视频资源的热度预测存在准确度低的问题。
发明内容
本发明实施例的目的在于提供一种热度预测方法、装置、电子设备及可读存储介质,以提高视频资源的热度预测的准确度。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种热度预测方法,包括:
获取候选视频资源在预测时间段之前的第一热度特征,所述第一热度特征包括第一用户特征;
基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,所述被预测时间段为所述预测时间段之后的时间段;
在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源。
在本发明实施的第二方面,还提供了一种热度预测装置,包括:
第一获取模块,用于获取候选视频资源在预测时间段之前的第一热度特征,所述第一热度特征数据包括第一用户特征;
预测模块,用于基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,所述被预测时间段为所述预测时间段之后的时间段;
第一确定模块,用于在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源。
在本发明实施的又一方面,还提供了一种电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的热度预测方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的热度预测方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的热度预测方法。
本发明实施例中,所述热度预测方法不同于现有技术中通过日播放量或日点击量来判断视频资源的热度,而是通过包括用户特征的热度特征,来确定预测视频资源的热度状态,进而确定是否将所述候选视频资源作为热门视频资源,以投入运营资源进行宣传推广。视频资源的用户特征能够反映视频资源的用户群体的信息,相比单日的播放量或点击量所承载的信息,视频资源的用户群体的信息更能反映视频资源的热度趋势,能够作为更有力的证据来评估是否有必要对视频资源投入运营资源,提高热度预测的准确性,避免运营资源的浪费。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中一种热度预测方法的流程示意图之一;
图2为本发明实施例中一种热度预测方法的流程示意图之二;
图3为本发明实施例中一种决策树模型的If-Then规则示意图;
图4为本发明实施例中一种热度预测方法的流程示意图之三;
图5为本发明实施例中一种热度预测装置的结构示意图;
图6为本发明实施例中一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
随着平台上线的视频内容越来越多,而平台的运营资源有限,因而如何实现运营资源的最大化利用成为了平台运营的重要任务。基于此,准确预测视频内容的热度,进而集中运营资源对热度较高或者热度升高的视频内容进行推广,对实现运营资源的最大化利用是有价值的。
为方便理解,下面对本发明涉及的一些内容进行说明:
候选视频资源,所述候选视频资源可以为平台的任意一个视频资源,也可以为平台的任意一个存量视频资源,具体可根据实际情况决定,在此不做限定。所述存量视频资源是指首播期结束后的视频资源,即所述存量视频资源的首播宣传期或者说热度期已经结束,平台通常不会将所述存量视频资源置于运营的首位,但是所述存量视频资源仍然具有很高的价值,尤其在平台新上线的视频资源不足的情况下,如何运营所述存量视频资源至关重要。
预测时间段,所述预测时间段是指进行热度预测的时间段。实际应用中,进行热度预测的时间并不限定于某一时间点,通常需要一定长度的时间段以进行数据准备和/或数据处理,因此定义为预测时间段而非预测时间点。预测时间段的时长可以为1天,即24小时(00:00至23:59),也可以为1小时、2小时,或者2天、5天等,具体可根据实际情况决定。本发明实施例中以所述预测时间段的时长为24小时,即某天的00:00至23:59为例进行说明,并不作具体限定。
被预测时间段,所述被预测时间段是指热度预测的对象时间段,即需要预测热度的时间段。实际应用中,需要预测热度的时间段并不限定于某一时间点,通常为时间段,例如,预测2021/04/03当天的热度,或者2021/04/03至2021/04/04周末两天的热度,或者2021/04/03/20:00至2021/04/04/22:00两个小时的热度,因此定义为被预测时间段而非被预测时间点。所述被预测时间段为所述预测时间段之后的时间段,其可以与所述预测时间段连续,也可以与所述预测时间段不连续。所述被预测时间段的时长可以为1天,即24小时(00:00至23:59),也可以为1小时、2小时,或者2天、5天等。所述被预测时间段的时长可以与所述预测时间段的时长相等,也可以与所述预测时间段的时长不等,具体可根据实际情况决定。本发明实施例中以所述被预测时间段为所述预测时间段+2天的00:00至23:59为例进行说明,并不作具体限定。示例性地,所述预测时间段为2021/04/01/00:00至2021/04/01/23:59,所述被预测时间段为2021/04/03/00:00至2021/04/03/23:59。
拉新用户数,所述拉新用户数也可以称为新增用户的带量数,所述候选视频资源的拉新用户数具体可以是,特定时间段内,在平台注册后观看的首个视频资源为候选视频资源的新用户的数量。
搜索用户数,所述候选视频资源的搜索用户数具体可以是,特定时间段内,在平台搜索所述候选视频资源的用户数,需要说明的是,若某一用户在特定时间段内重复多次搜索视频资源,其搜索用户数也记为1。
请参见图1,图1为本发明实施例提供的一种热度预测方法的流程示意图。
如图1所示,所述热度预测方法包括以下步骤:
步骤101、获取候选视频资源在预测时间段之前的第一热度特征;所述第一热度特征包括第一用户特征;
步骤102、基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,所述被预测时间段为所述预测时间段之后的时间段;
步骤103、在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源。
所述步骤101中,所述第一热度特征是指在所述预测时间段提取的、所述候选视频资源在所述预测时间段之前的热度特征。所述第一热度特征包括第一用户特征,所述第一用户特征是指在所述预测时间段提取的、所述候选视频资源在所述预测时间段之前的用户特征,可以包括任意用于描述所述候选视频资源在所述预测时间段之前的用户情况的特征信息。需要说明的是,除所述第一用户特征外,可选地,所述第一热度特征还可以包括其他任意用于描述所述候选视频资源在所述预测时间段之前的热度情况的特征信息,例如,播放时长、评论数、弹幕数、被分享次数等,在此不作具体限定。
在一可选实施方式中,所述第一用户特征包括拉新用户特征和搜索用户特征中的至少一项;其中,所述拉新用户特征为因视频资源新增的用户的用户特征,所述搜索用户特征为搜索视频资源的用户的用户特征。
本实施方式中,所述拉新用户特征可以反映视频资源吸引新用户的能力,可以包括任意用于描述因视频资源新增的用户的特征信息。所述搜索用户特征可以反映视频资源吸引用户搜索的能力,可以包括任意用于描述搜索视频资源的用户的特征信息。需要说明的是,未表区分,将所述第一用户特征包括的拉新用户特征定义为第一拉新用户特征,将所述第一用户特征包括的搜索用户特征定义为第一搜索用户特征。
所述第一拉新用户特征可以包括拉新用户数,为表区分,在此定义为第一拉新用户数,所述第一拉新用户数是指所述预测时间段之前的拉新用户数。除此之外,可选地,所述第一拉新用户特征还可以包括拉新用户性别、拉新用户年龄层等,在此不作具体限定。所述第一搜索用户特征可以包括搜索用户数,为表区分,在此定义为第一搜索用户数,所述第一搜索用户数是指所述预测时间段之前的搜索用户数。除此之外,可选地,所述第一搜索用户特征还可以包括搜索用户性别、搜索用户年龄层,搜索用户的关联搜索等,在此不作具体限定。
进一步的,在一可选实施方式中,所述第一拉新用户特征包括第二时间周期内多个连续的第二时间段内的第一拉新用户数,所述第二时间周期为所述预测时间段之前的、且与所述预测时间段连续的时间周期。和/或,所述第一搜索用户特征包括第三时间周期内多个连续的第三时间段内的第一搜索用户数,所述第三时间周期为所述预测时间段之前的、且与所述预测时间段连续的时间周期。通过采集所述预测时间段之前的、多个连续历史时间段内的第一拉新用户数,可以获取所述预测时间段之前的拉新用户数随时间变化的趋势,以确定所述预测时间段之前的用户发展趋势,进而为热度预测提供较为全面的历史数据,进一步提高热度预测的准确性。
具体实施时,所述第二时间周期与所述第三时间周期的时长可以相等,也可以不等,所述第二时间段与所述第三时间段的时长可以相等,也可以不等。以所述第二时间周期为例,所述第二时间周期的时长可以为7天、10天、14天等。所述第二时间周期可以划分为所述多个连续的第二时间段,所述第二时间段的时长可以为2小时、5小时、1天、2天等,具体可根据实际情况决定,在此不作具体限定。为方便理解,在此举例说明,所述第二时间周期为所述预测时间段之前的7天,所述第二时间段为7个,分别为所述7天中的每一天,具体地,假设所述预测时间段为2021/04/01/00:00至2021/04/01/23:59,所述第二时间周期为2021/03/25/00:00至2021/03/31/23:59,7个连续的第二时间段为:2021/03/25/00:00至2021/03/25/23:59、2021/03/26/00:00至2021/03/26/23:59、2021/03/27/00:00至2021/03/27/23:59、2021/03/28/00:00至2021/03/28/23:59、2021/03/29/00:00至2021/03/29/23:59、2021/03/30/00:00至2021/03/30/23:59、2021/03/31/00:00至2021/03/31/23:59。
所述第一热度特征的形式可以为数值、字符串、数组或者向量、矩阵等。所述第一热度特征可以通过接收获取,例如,用户设备可以采集第一热度特征,之后再接收用户设备发送的所述第一热度特征。所述第一热度特征也可以自行采集获取,具体可根据实际情况决定,在此不作具体限定。
所述步骤102中,所述第一热度状态是指在所述预测时间段预测的所述候选视频资源在所述被预测时间段的热度状态。可选地,所述热度状态包括飙升状态或不飙升状态,所述飙升状态用于表征所述候选视频资源在所述被预测时间段的热度值满足预设增长条件,所述不飙升状态用于表征所述候选视频资源在所述被预测时间段的热度值不满足预设增长条件。所述热度值可以为播放时长、拉新用户数、搜索用户数,被点击次数、被搜索次数、评论数等,所述预设增长条件与所述热度值的种类相对应。
所述步骤103中,所述预设热度条件与所述热度状态的种类相对应。可选地,在所述热度状态包括飙升状态或不飙升状态的情况下,所述第一热度状态为所述飙升状态时,确定所述第一热度状态满足所述预设热度条件,进而确定所述候选视频资源为热门视频资源;所述第一热度状态为所述不飙升状态时,确定所述第一热度状态不满足所述预设热度条件,进而不确定所述候选视频资源为热门视频资源。
本发明实施例中,不同于现有技术中通过日播放量或日点击量来判断视频资源的热度,而是通过包括用户特征的热度特征,来确定预测视频资源的热度状态,进而确定是否将所述候选视频资源作为热门视频资源,以投入运营资源进行宣传推广。视频资源的用户特征能够反映视频资源的用户群体的信息,相比单日的播放量或点击量所承载的信息,视频资源的用户群体的信息更能反映视频资源的热度趋势,能够作为更有力的证据来评估是否有必要对视频资源投入运营资源,提高热度预测的准确性,避免运营资源的浪费。
可选地,所述步骤102之前,所述方法包括:
基于所述候选视频资源的历史热度特征和历史热度状态,确定热度特征与热度状态之间的关联关系,所述历史热度特征包括历史用户特征;
所述步骤102包括:
基于所述第一热度特征和所述关联关系,确定所述第一热度状态,所述第一热度状态为与所述第一热度特征关联的热度状态。
本实施例中,视频资源的热度趋势通常呈现一定的规律,例如,在周末、假期等时间段内的热度状态将不同于工作日等时间段的热度状态,更新日的热度状态将不同于非更新日的热度状态。由于历史时间段内所述候选视频资源的用户特征信息、热度特征信息等均可获取到,因此通过确定所述候选视频资源在历史时间段内相互对应的历史特征数据和历史热度状态,可以分析得到所述候选视频资源对应的热度特征与热度状态之间的关联关系,进而基于所述关联关系来实时预测所述第一热度状态。
具体实施时,在每一视频资源上线后,均可持续采集视频资源的用户特征信息和热度特征信息,具体所述用户特征信息和热度特征信息的实现方式可以参照上述实施方式的说明,在此不再赘述。
在一可选实施方式中,所述基于所述候选视频资源的历史热度特征和历史热度状态,确定热度特征与热度状态之间的关联关系,包括步骤1021至步骤1025,具体说明如下,如图2所示:
步骤1021、确定N个历史预测时间段,以及每个所述历史预测时间段对应的历史被预测时段,所述被预测时间段为所述预测时间段之后的时间段,N为正整数。
所述历史预测时间段的具体实现方式可以参照所述预测时间段的相关说明,所述历史被预测时间段的具体实现方式可以参照所述被预测时间段的相关说明,在此不再赘述。为了提高所述关联关系确定的准确性,所述历史预测时间段可以与所述预测时间段的时长相等,所述历史被预测时间段可以与所述被预测时间段的时长相等。所述N个历史预测时间段可以是连续的,也可以是不连续的,N的取值可以尽量大,以使历史样本数据足够多,以提高所述关联关系确定的准确性。
步骤1022、获取所述候选视频资源在每个所述历史预测时间段之前的第二热度特征,所述第二热度特征包括第二用户特征。
所述第二热度特征是指在所述历史预测时间段提取的、所述候选视频资源在所述历史预测时间段之前的热度特征。所述第二热度特征包括第二用户特征,所述第二用户特征是指在所述历史预测时间段提取的、所述候选视频资源在所述历史预测时间段之前的用户特征。
在一可选实施方式中,所述第二用户特征包括拉新用户特征和搜索用户特征中的至少一项;其中,所述拉新用户特征为因视频资源新增的用户的用户特征,所述搜索用户特征为搜索视频资源的用户的用户特征。需要说明的是,未表区分,将所述第二用户特征包括的拉新用户特征定义为第二拉新用户特征,将所述第二用户特征包括的搜索用户特征定义为第二搜索用户特征。
进一步的,在一可选实施方式中,所述第二拉新用户特征包括第二时间周期内多个连续的第二时间段内的第二拉新用户数,所述第二时间周期为所述历史预测时间段之前的、且与所述历史预测时间段连续的时间周期。和/或,所述第二搜索用户特征包括第三时间周期内多个连续的第三时间段内的第二搜索用户数,所述第三时间周期为所述历史预测时间段之前的、且与所述历史预测时间段连续的时间周期。
需要说明的是,所述第二热度特征和所述第二用户特征的具体实现方式可以参照所述第一热度特征和所述第一用户特征的相关说明,在此不再赘述。为方便理解,在此举例说明,选取所述预测时间段的上一年度中的365天作为365个所述历史预测时间段,例如,所述365个历史预测时间段包括:2020/01/01/00:00至2020/01/01/23:59、2020/01/02/00:00至2020/01/02/23:59、···、2020/12/24/00:00至2020/12/24/23:59、2020/12/31/00:00至2020/12/31/23:59。则以历史预测时间段2020/04/01/00:00至2020/04/01/23:59为例,其对应的历史被预测时间段为2020/04/03/00:00至2020/04/03/23:59,其对应的第二时间周期为2020/03/25/00:00至2020/03/31/23:59,具体包括7个第二时间段为:2020/03/25/00:00至2020/03/25/23:59、2020/03/26/00:00至2020/03/26/23:59、2020/03/27/00:00至2020/03/27/23:59、2020/03/28/00:00至2020/03/28/23:59、2020/03/29/00:00至2020/03/29/23:59、2020/03/30/00:00至2020/03/30/23:59、2020/03/31/00:00至2020/03/31/23:59。
步骤1023、获取所述候选视频资源在每个所述历史被预测时间段对应的第一播放特征和第二播放特征,所述第一播放特征为所述历史被预测时间段内的播放特征,所述第二播放特征为所述历史被预测时间段之前的播放特征。
步骤1024、基于所述第一播放特征和所述第二播放特征,确定所述候选视频资源在所述历史被预测时间段的第二热度状态。
所述第二热度状态可以通过所述候选视频资源在所述历史被预测时间段对应的第一播放特征和第二播放特征确定,与所述第一播放特征和所述第二播放特征相关的信息由于是历史信息,因此可以获取到。
所述第一播放特征可以包括任意用于表征所述候选视频资源在所述历史被预测时间段内的播放情况的特征信息;所述第二播放特征可以包括任意用于表征所述候选视频资源在所述历史被预测时间段之前的播放情况的特征信息,具体的特征信息可以包括例如播放时长、被点击次数、播放时长超过预设阈值的频次等,在此不作具体限定。基于所述候选视频资源在所述历史被预测时间段内的播放情况,与在所述历史被预测时间段之前的播放情况,可以分析所述候选视频资源在所述历史被预测时间段内的播放特征信息的变化趋势、变化幅度等,进而确定所述候选视频资源在所述历史被预测时间段的热度状态。
在一可选实施方式中,所述第一播放特征包括所述历史被预测时间段内的第一播放时长;所述第二播放特征包括第一时间周期内多个连续的第一时间段内的第二播放时长,所述第一时间周期为所述历史被预测时间段之前的、且与所述历史被预测时间段连续的时间周期。
本实施方式中,选用播放时长作为播放特征可以表征所述候选视频资源占用用户的屏幕时间,进而确定用户对所述候选视频资源的喜爱程度,使得热度状态的确定更加准确。
所述第一时间周期的时长可以为7天、10天、14天等。所述第一时间周期可以划分为所述多个连续的第一时间段,所述第一时间段的时长可以为2小时、5小时、1天、2天等,具体可根据实际情况决定,在此不作具体限定。可选地,也可以确定多个不同时长的第一时间周期,分别确定多个所述第二播放特征,以更加全面地确定所述第二热度状态。
为方便理解,在此举例说明,所述第一时间周期为所述历史被预测时间段之前的7天,所述第一时间段为7个,分别为所述7天中的每一天,具体地,假设所述历史预测时间段为2020/04/01/00:00至2020/04/01/23:59为例,其对应的历史被预测时间段为2020/04/03/00:00至2020/04/03/23:59,则所述第一时间周期为2020/03/27/00:00至2020/04/02/23:59,具体包括7个第二时间段为:2020/03/27/00:00至2020/03/27/23:59、2020/03/28/00:00至2020/03/28/23:59、2020/03/29/00:00至2020/03/29/23:59、2020/03/30/00:00至2020/03/30/23:59、2020/03/31/00:00至2020/03/31/23:59、2020/04/01/00:00至2020/04/01/23:59、2020/04/02/00:00至2020/04/02/23:59。
进一步的,可选地,所述热度状态包括所述飙升状态或所述不飙升状态;所述基于所述第一播放特征和所述第二播放特征,确定所述候选视频资源在所述历史被预测时间段的第二热度状态,包括:
基于所述第一播放时长和所述第二播放时长,确定所述第一播放时长是否满足预设增长条件;
在所述第一播放时长满足所述播放时长增长条件的情况下,确定所述第二热度状态为所述飙升状态,在所述第一播放时长不满足所述预设增长条件的情况下,确定所述第二热度状态为所述不飙升状态。
本实施方式中,所述预设增长条件可以从所述第一播放时长相对于所述第二播放时长的增长幅度的角度确定。可选地,所述基于所述第一播放时长和所述第二播放时长,确定所述第一播放时长满足预设增长条件,包括以下任意一种情况:1)所述第一播放时长与多个第二播放时长中的最大值的差值大于第一阈值;2)所述第一播放时长与多个第二播放时长中的最大值的比值大于第二阈值;3)所述第一播放时长与多个第二播放时长的平均值的差值大于第三阈值,或者比值大于第四阈值;4)所述第一播放时长与多个第二播放时长的中位数的差值大于第五阈值,或者比值大于第六阈值,所述第六阈值为所述预设比值阈值。其中,所述多个第二播放时长是指多个所述第一时间段分别对应的多个第二播放时长。
步骤1025、基于所述第二热度特征和所述第二热度状态,确定热度特征与热度状态之间的关联关系。
在一可选实施方式中,所述步骤1025包括:
建立热度预测模型,所述热度预测模型的输入为所述热度特征,所述热度预测模型的输出为所述热度状态,所述热度预测模型基于所述关联关系进行热度预测;
基于所述第二热度特征和所述第二热度状态,对所述热度预测模型中的所述关联关系进行训练;
所述基于所述第一热度特征和所述关联关系,确定所述第一热度状态,所述第一热度状态为与所述第一热度特征关联的热度状态,包括:
将所述第一热度特征输入所述热度预测模型进行热度预测,获取所述热度预测模型输出的第一热度状态。
本实施方式中,所述热度预测模型可以基于机器学习建立,通过机器学习历史热度特征和历史热度状态之间的关联关系,可以得到基于输入的实时热度特征预测未来热度状态的热度预测模型,进一步提高热度预测的准确性。
所述热度预测模型基于训练样本训练得到。本实施方式中,所述训练样本包括所述步骤1022得到的所述第二热度特征和所述步骤1023至步骤1024得到的所述第二热度状态,以训练所述第二热度特征与所述第二热度状态之间的关系。具体的,可以将所述第二热度特征和所述第二热度状态随机排列后输入训练前的算法模型,并基于所述第二热度特征和所述第二热度状态,对所述算法模型的算法进行优化更新,以不断提高所述算法模型的精确率和召回率,从而训练得到较优的所述热度预测模型。
在一可选实施方式中,所述热度状态包括飙升状态或不飙升状态,则所述热度预测模型可以基于所述第二热度特征和所述第二热度状态,进行热度状态是否为飙升状态的训练。
所述热度预测模型可以为任意一种机器学习模型,例如决策树模型、神经网络模型等,具体可根据实际情况决定,在此不作限定。所述热度预测模型的训练过程可以在当前设备中进行,也可以在其他设备中进行,当前设备需要进行热度预测时,可以将所述第一热度特征发送至其他设备,并接收其他设备返回的所述第一热度状态。具体可根据实际情况决定,在此不作限定。
本实施方式中,可选的,所述热度预测模型为决策树模型。
所述决策树模型是一种非参数分类器,呈树形结构,并基于所述树形结构进行决策。所述决策树模型的算法原理是通过递归地选择最优特征,并用最优特征对数据集进行分类。开始时,构建根节点并选择最优特征,该特征有几种值就将数据集分割为几个子集,每个子集分别进一步的递归确定最优特征,并进一步对子集进行分割,直到达到终止条件。所述决策树模型不需要对数据有任何的先验假设,计算速度较快,结果容易解释,而且稳健性强。
具体实施时,可以使用Python中的sklearn机器学习包中的决策树算法模型,在上述训练样本的基础上,进行建模训练所述决策树模型可以基于所述第二热度特征和所述第二热度状态,对决策算法进行不断更新优化,以确定最优的根节点、递归逻辑、子节点以及每一节点的最优特征。一种示例性的决策树热度预测的if-then规则如图3所示。
为方便理解,下面介绍本发明实施例的一种具体的实施方式:
本实施方式中,假设所述候选视频资源为视频资源1,所述预测时间段,即当前时间段为2021/04/01/00:00至2021/04/01/23:59,所述被预测时间段为2021/04/03/00:00至2021/04/03/23:59。则所述热度预测方法用于预测:视频资源1在2021/04/03/00:00至2021/04/03/23:59的热度状态为飙升状态还是不飙升状态。如图4所示,具体流程如下:
步骤一、获取训练样本。
1)确定365个历史预测时间段。
确定样本选取周期为2020/01/01/00:00至2020/12/31/23:59,共包括365个历史预测时间段,分别为2020/01/01/00:00至2020/01/01/23:59、2020/01/02/00:00至2020/01/02/23:59、···、2020/12/30/00:00至2020/12/30/23:59、2020/12/31/00:00至2020/12/31/23:59。一个所述历史预测时间段对应一个历史被预测时间段,365个历史被预测时间段分别为2020/01/03/00:00至2020/01/03/23:59、2020/01/04/00:00至2020/01/04/23:59、···、2021/01/01/00:00至2021/01/01/23:59、2021/01/02/00:00至2021/01/02/23:59。
2)获取所述第二热度特征。
针对每个所述历史预测时间段,可以获取其对应的所述第二热度特征。具体的,获取视频资源1在每个所述历史预测时间段之前的7天中每天的拉新用户数和搜索用户数。
以所述历史预测时间段为2020/01/30/00:00至2020/01/30/23:59为例,可以分别获取视频资源1在2020/01/23/00:00至2020/01/23/23:59、2020/01/24/00:00至2020/01/24/23:59、2020/01/25/00:00至2020/01/25/23:59、2020/01/26/00:00至2020/01/26/23:59、2020/01/27/00:00至2020/01/27/23:59、2020/01/28/00:00至2020/01/28/23:59、2020/01/29/00:00至2020/01/29/23:59内每天的拉新用户数和搜索用户数,以确定视频资源1在2020/01/30/00:00至2020/01/30/23:59之前的所述第二热度特征。
3)获取定义飙升的数据。
a.获取所述第一播放时长。
获取视频资源1在每个所述历史被预测时间段的播放时长。
b.获取所述第二播放时长。
获取视频资源1在每个所述历史被预测时间段之前的14天中每天的播放时长。以所述历史被预测时间段为2020/02/01/00:00至2020/02/01/23:59为例,可以分别获取视频资源1在2020/01/18/00:00至2020/01/18/23:59、2020/01/19/00:00至2020/01/19/23:59、···、2020/01/30/00:00至2020/01/30/23:59、2020/01/31/00:00至2020/01/31/23:59内的播放时长,进一步的,可以确定视频资源1在上述14天中每天的播放时长的中位数。
4)定义飙升状态的条件,确定所述第二热度状态。
满足以下任意一项,可以确定视频资源1在所述历史被预测时间段的热度状态为飙升状态:a.在所述历史被预测时间段的播放时长与前7天播放时长的中位数的比值大于等于200%;b.在所述历史被预测时间段的播放时长与前10天播放时长的中位数的比值大于等于200%;c.在所述历史被预测时间段的播放时长与前14天播放时长的中位数的比值大于等于200%。
5)生成训练样本。
将所述第二热度特征和所述第二热度状态随机排列后,将一部分数据生成训练样本,将另一部分数据生成测试样本。
步骤二、训练热度预测模型。
使用Python中的sklearn机器学习包中的决策树模型,基于所述训练样本,对所述热度预测模型进行训练。
步骤三、热度预测模型效果评估。
综合考虑精确率和召回率,选出在所述测试集上效果最好的模型。一种可选的决策树模型的if-then规则集合如图3所示。
步骤四、利用训练好的热度预测模型进行热度预测。
1)获取所述第一热度特征。
针对所述预测时间段2021/04/01/00:00至2021/04/01/23:59,可以获取其对应的所述第一热度特征。具体的,所述第一热度特征包括视频资源1在所述预测时间段之前的7天中每天的拉新用户数和搜索用户数,分别为视频资源1在2021/03/25/00:00至2021/03/25/23:59、2021/03/26/00:00至2021/03/26/23:59、2021/03/27/00:00至2021/03/27/23:59、2021/03/28/00:00至2021/03/28/23:59、2021/03/29/00:00至2021/03/29/23:59、2021/03/30/00:00至2021/03/30/23:59、2021/03/31/00:00至2021/03/31/23:59内的拉新用户数和搜索用户数。
2)将所述第一热度特征输入热度预测模型,获取所述热度预测模型输出的第一热度状态。
具体的,所述热度预测模型可以基于如图3所示的if-then规则集合,预测视频资源1在2021/04/03/00:00至2021/04/03/23:59的热度状态是否为飙升状态。若所述第一热度状态为所述飙升状态,可以将所述结果告知相关人员,以确定对视频资源1投入运营资源进行推广宣传;若热度预测结果表征视频资源1在2021/04/03/00:00至2021/04/03/23:59为所述不飙升状态,可以将所述结果告知相关人员,以暂时不对视频资源1投入运营资源。
综上所述,不同于现有技术中通过日播放量或日点击量来判断视频资源的热度,而是通过包括用户特征的热度特征,来确定预测视频资源的热度状态,进而确定是否将所述候选视频资源作为热门视频资源,以投入运营资源进行宣传推广。视频资源的用户特征能够反映视频资源的用户群体的信息,相比单日的播放量或点击量所承载的信息,视频资源的用户群体的信息更能反映视频资源的热度趋势,能够作为更有力的证据来评估是否有必要对视频资源投入运营资源,提高热度预测的准确性,避免运营资源的浪费。
请参见图5,图5是本发明实施例提供的一种热度预测装置的结构图。
如图5所示,热度预测装置500包括:
第一获取模块501,用于获取候选视频资源在预测时间段之前的第一热度特征,所述第一热度特征包括第一用户特征;
预测模块502,用于基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,所述被预测时间段为所述预测时间段之后的时间段;
第一确定模块503,用于在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源。
可选地,热度预测装置500还包括:
第二确定模块,用于基于所述候选视频资源的历史热度特征和历史热度状态,确定热度特征与热度状态之间的关联关系,所述历史热度特征包括历史用户特征;
预测模块502具体用于:
基于所述第一热度特征和所述关联关系,确定所述第一热度状态,所述第一热度状态为与所述第一热度特征关联的热度状态。
可选地,所述第二确定模块包括:
第一确定单元,用于确定N个历史预测时间段,以及每个所述历史预测时间段对应的历史被预测时段,所述被预测时间段为所述预测时间段之后的时间段,N为正整数;
第一获取单元,用于获取所述候选视频资源在每个所述历史预测时间段之前的第二热度特征,所述第二热度特征包括第二用户特征;
第二获取单元,用于获取所述候选视频资源在每个所述历史被预测时间段对应的第一播放特征和第二播放特征,所述第一播放特征为所述历史被预测时间段内的播放特征,所述第二播放特征为所述历史被预测时间段之前的播放特征;
第二确定单元,用于基于所述第一播放特征和所述第二播放特征,确定所述候选视频资源在所述历史被预测时间段的第二热度状态;
第三确定单元,用于基于所述第二热度特征和所述第二热度状态,确定热度特征与热度状态之间的关联关系。
可选地,所述第三确定单元包括:
建模子单元,用于建立热度预测模型,所述热度预测模型的输入为所述热度特征,所述热度预测模型的输出为所述热度状态,所述热度预测模型基于所述关联关系进行热度预测;
训练子单元,用于基于所述第二热度特征和所述第二热度状态,对所述热度预测模型中的所述关联关系进行训练;
预测模块502具体用于:
将所述第一热度特征输入所述热度预测模型进行热度预测,获取所述热度预测模型输出的第一热度状态。
可选地,所述热度预测模型为决策树算法模型。
可选地,所述第一播放特征包括所述历史被预测时间段内的第一播放时长;
所述第二播放特征包括第一时间周期内多个连续的第一时间段内的第二播放时长,所述第一时间周期为所述历史被预测时间段之前的、且与所述历史被预测时间段连续的时间周期。
可选地,所述热度状态包括飙升状态或不飙升状态;
所述第二确定单元包括:
第一确定子单元,用于基于所述第一播放时长和所述第二播放时长,确定所述第一播放时长是否满足预设增长条件;
第二确定子单元,用于在所述第一播放时长满足所述播放时长增长条件的情况下,确定所述第二热度状态为所述飙升状态,在所述第一播放时长不满足所述预设增长条件的情况下,确定所述第二热度状态为所述不飙升状态。
可选地,所述第一确定子单元具体用于:
确定多个连续的所述第一时间段内的所述第二播放时长的中位数;
在所述第一播放时长与所述中位数的比值大于或等于预设比值阈值的情况下,确定所述第一播放时长满足所述预设增长条件。
可选地,所述热度状态包括飙升状态或不飙升状态;
第一确定模块503具体用于:
在所述第一热度状态为所述飙升状态的情况下,确定所述候选视频资源为热门视频资源。
可选地,第一用户特征和/或第二用户特征包括拉新用户特征和搜索用户特征中的至少一项;
其中,所述拉新用户特征为因视频资源新增的用户的用户特征,所述搜索用户特征为搜索视频资源的用户的用户特征。
可选地,所述拉新用户特征包括第二时间周期内多个连续的第二时间段内的拉新用户数,所述第二时间周期为目标时间段之前的、且与所述目标时间段连续的时间周期;和/或,
所述搜索用户特征包括第三时间周期内多个连续的第三时间段内的搜索用户数,所述第三时间周期为所述目标时间段之前的、且与所述目标时间段连续的时间周期;
其中,所述目标时间段为预测时间段或历史预测时间段。
本发明实施例中,热度预测装置500可实现如图1所示的方法实施例的各个过程,且可以达到相同有益效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:
获取候选视频资源在预测时间段之前的第一热度特征,所述第一热度特征包括第一用户特征;
基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,所述被预测时间段为所述预测时间段之后的时间段;
在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源。
可选地,所述基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态之前,所述方法包括:
基于所述候选视频资源的历史热度特征和历史热度状态,确定热度特征与热度状态之间的关联关系,所述历史热度特征包括历史用户特征;
所述基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,包括:
基于所述第一热度特征和所述关联关系,确定所述第一热度状态,所述第一热度状态为与所述第一热度特征关联的热度状态。
可选地,所述基于所述候选视频资源的历史热度特征和历史热度状态,确定热度特征与热度状态之间的关联关系,包括:
确定N个历史预测时间段,以及每个所述历史预测时间段对应的历史被预测时段,所述被预测时间段为所述预测时间段之后的时间段,N为正整数;
获取所述候选视频资源在每个所述历史预测时间段之前的第二热度特征,所述第二热度特征包括第二用户特征;
获取所述候选视频资源在每个所述历史被预测时间段对应的第一播放特征和第二播放特征,所述第一播放特征为所述历史被预测时间段内的播放特征,所述第二播放特征为所述历史被预测时间段之前的播放特征;
基于所述第一播放特征和所述第二播放特征,确定所述候选视频资源在所述历史被预测时间段的第二热度状态;
基于所述第二热度特征和所述第二热度状态,确定热度特征与热度状态之间的关联关系。
可选地,所述基于所述第二热度特征和所述第二热度状态,确定热度特征与热度状态之间的关联关系,包括:
建立热度预测模型,所述热度预测模型的输入为所述热度特征,所述热度预测模型的输出为所述热度状态,所述热度预测模型基于所述关联关系进行热度预测;
基于所述第二热度特征和所述第二热度状态,对所述热度预测模型中的所述关联关系进行训练;
所述基于所述第一热度特征和所述关联关系,确定所述第一热度状态,所述第一热度状态为与所述第一热度特征关联的热度状态,包括:
将所述第一热度特征输入所述热度预测模型进行热度预测,获取所述热度预测模型输出的第一热度状态。
可选地,所述热度预测模型为决策树算法模型。
可选地,所述第一播放特征包括所述历史被预测时间段内的第一播放时长;
所述第二播放特征包括第一时间周期内多个连续的第一时间段内的第二播放时长,所述第一时间周期为所述历史被预测时间段之前的、且与所述历史被预测时间段连续的时间周期。
可选地,所述热度状态包括飙升状态或不飙升状态;所述基于所述第一播放特征和所述第二播放特征,确定所述候选视频资源在所述历史被预测时间段的第二热度状态,包括:
基于所述第一播放时长和所述第二播放时长,确定所述第一播放时长是否满足预设增长条件;
在所述第一播放时长满足所述播放时长增长条件的情况下,确定所述第二热度状态为所述飙升状态,在所述第一播放时长不满足所述预设增长条件的情况下,确定所述第二热度状态为所述不飙升状态。
可选地,所述基于所述第一播放时长和所述第二播放时长,确定所述第一播放时长是否满足预设增长条件,包括:
确定多个连续的所述第一时间段内的所述第二播放时长的中位数;
在所述第一播放时长与所述中位数的比值大于或等于预设比值阈值的情况下,确定所述第一播放时长满足所述预设增长条件。
可选地,所述热度状态包括飙升状态或不飙升状态;所述在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源,包括:
在所述第一热度状态为所述飙升状态的情况下,确定所述候选视频资源为热门视频资源。
可选地,第一用户特征和/或第二用户特征包括拉新用户特征和搜索用户特征中的至少一项;
其中,所述拉新用户特征为因视频资源新增的用户的用户特征,所述搜索用户特征为搜索视频资源的用户的用户特征。
可选地,所述拉新用户特征包括第二时间周期内多个连续的第二时间段内的拉新用户数,所述第二时间周期为目标时间段之前的、且与所述目标时间段连续的时间周期;和/或,
所述搜索用户特征包括第三时间周期内多个连续的第三时间段内的搜索用户数,所述第三时间周期为所述目标时间段之前的、且与所述目标时间段连续的时间周期;
其中,所述目标时间段为预测时间段或历史预测时间段。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的热度预测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的热度预测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (14)
1.一种热度预测方法,其特征在于,包括:
获取候选视频资源在预测时间段之前的第一热度特征,所述第一热度特征包括第一用户特征;
基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,所述被预测时间段为所述预测时间段之后的时间段;
在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态之前,所述方法包括:
基于所述候选视频资源的历史热度特征和历史热度状态,确定热度特征与热度状态之间的关联关系,所述历史热度特征包括历史用户特征;
所述基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,包括:
基于所述第一热度特征和所述关联关系,确定所述第一热度状态,所述第一热度状态为与所述第一热度特征关联的热度状态。
3.根据权利要求2所述的方法,其特征在于,所述基于所述候选视频资源的历史热度特征和历史热度状态,确定热度特征与热度状态之间的关联关系,包括:
确定N个历史预测时间段,以及每个所述历史预测时间段对应的历史被预测时段,所述被预测时间段为所述预测时间段之后的时间段,N为正整数;
获取所述候选视频资源在每个所述历史预测时间段之前的第二热度特征,所述第二热度特征包括第二用户特征;
获取所述候选视频资源在每个所述历史被预测时间段对应的第一播放特征和第二播放特征,所述第一播放特征为所述历史被预测时间段内的播放特征,所述第二播放特征为所述历史被预测时间段之前的播放特征;
基于所述第一播放特征和所述第二播放特征,确定所述候选视频资源在所述历史被预测时间段的第二热度状态;
基于所述第二热度特征和所述第二热度状态,确定热度特征与热度状态之间的关联关系。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第二热度特征和所述第二热度状态,确定热度特征与热度状态之间的关联关系,包括:
建立热度预测模型,所述热度预测模型的输入为所述热度特征,所述热度预测模型的输出为所述热度状态,所述热度预测模型基于所述关联关系进行热度预测;
基于所述第二热度特征和所述第二热度状态,对所述热度预测模型中的所述关联关系进行训练;
所述基于所述第一热度特征和所述关联关系,确定所述第一热度状态,所述第一热度状态为与所述第一热度特征关联的热度状态,包括:
将所述第一热度特征输入所述热度预测模型进行热度预测,获取所述热度预测模型输出的第一热度状态。
5.根据权利要求4所述的方法,其特征在于,所述热度预测模型为决策树算法模型。
6.根据权利要求3所述的方法,其特征在于,所述第一播放特征包括所述历史被预测时间段内的第一播放时长;
所述第二播放特征包括第一时间周期内多个连续的第一时间段内的第二播放时长,所述第一时间周期为所述历史被预测时间段之前的、且与所述历史被预测时间段连续的时间周期。
7.根据权利要求6所述的方法,其特征在于,所述热度状态包括飙升状态或不飙升状态;所述基于所述第一播放特征和所述第二播放特征,确定所述候选视频资源在所述历史被预测时间段的第二热度状态,包括:
基于所述第一播放时长和所述第二播放时长,确定所述第一播放时长是否满足预设增长条件;
在所述第一播放时长满足所述播放时长增长条件的情况下,确定所述第二热度状态为所述飙升状态,在所述第一播放时长不满足所述预设增长条件的情况下,确定所述第二热度状态为所述不飙升状态。
8.根据权利要求7所述的方法,其特征在于,所述基于所述第一播放时长和所述第二播放时长,确定所述第一播放时长是否满足预设增长条件,包括:
确定多个连续的所述第一时间段内的所述第二播放时长的中位数;
在所述第一播放时长与所述中位数的比值大于或等于预设比值阈值的情况下,确定所述第一播放时长满足所述预设增长条件。
9.根据权利要求1所述的方法,其特征在于,所述热度状态包括飙升状态或不飙升状态;所述在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源,包括:
在所述第一热度状态为所述飙升状态的情况下,确定所述候选视频资源为热门视频资源。
10.根据权利要求1所述的方法,其特征在于,第一用户特征和/或第二用户特征包括拉新用户特征和搜索用户特征中的至少一项;
其中,所述拉新用户特征为因视频资源新增的用户的用户特征,所述搜索用户特征为搜索视频资源的用户的用户特征。
11.根据权利要求10所述的方法,其特征在于,所述拉新用户特征包括第二时间周期内多个连续的第二时间段内的拉新用户数,所述第二时间周期为目标时间段之前的、且与所述目标时间段连续的时间周期;和/或,
所述搜索用户特征包括第三时间周期内多个连续的第三时间段内的搜索用户数,所述第三时间周期为所述目标时间段之前的、且与所述目标时间段连续的时间周期;
其中,所述目标时间段为预测时间段或历史预测时间段。
12.一种热度预测装置,其特征在于,包括:
第一获取模块,用于获取候选视频资源在预测时间段之前的第一热度特征,所述第一热度特征数据包括第一用户特征;
预测模块,用于基于所述第一热度特征,预测所述候选视频资源在被预测时间段内的第一热度状态,所述被预测时间段为所述预测时间段之后的时间段;
第一确定模块,用于在所述第一热度状态满足预设热度条件的情况下,确定所述候选视频资源为热门视频资源。
13.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-11任一所述的方法步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-11中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111135530.3A CN113837807B (zh) | 2021-09-27 | 2021-09-27 | 热度预测方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111135530.3A CN113837807B (zh) | 2021-09-27 | 2021-09-27 | 热度预测方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113837807A true CN113837807A (zh) | 2021-12-24 |
CN113837807B CN113837807B (zh) | 2023-07-21 |
Family
ID=78970601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111135530.3A Active CN113837807B (zh) | 2021-09-27 | 2021-09-27 | 热度预测方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113837807B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023169259A1 (zh) * | 2022-03-08 | 2023-09-14 | 北京字跳网络技术有限公司 | 音乐热度的预测方法、装置、存储介质及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090222321A1 (en) * | 2008-02-28 | 2009-09-03 | Microsoft Corporation | Prediction of future popularity of query terms |
US20110302103A1 (en) * | 2010-06-08 | 2011-12-08 | International Business Machines Corporation | Popularity prediction of user-generated content |
WO2014151351A1 (en) * | 2013-03-15 | 2014-09-25 | The Echo Nest Corporation | Demographic and media preference prediction using media content data analysis |
CN105096152A (zh) * | 2014-05-20 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 一种基于商品热度的操作执行方法及装置 |
US20160092893A1 (en) * | 2014-09-29 | 2016-03-31 | Ebay Inc. | System, method, and apparatus for predicting item characteristic popularity |
US20170323210A1 (en) * | 2016-05-06 | 2017-11-09 | Wp Company Llc | Techniques for prediction of popularity of media |
CN109522470A (zh) * | 2018-11-06 | 2019-03-26 | 汪浩 | 一种视频热度预测方法、装置、设备及存储介质 |
CN110489655A (zh) * | 2019-09-16 | 2019-11-22 | 浙江同花顺智能科技有限公司 | 热门内容确定、推荐方法、装置、设备及可读存储介质 |
CN111314790A (zh) * | 2020-03-26 | 2020-06-19 | 北京奇艺世纪科技有限公司 | 一种视频播放记录的排序方法、装置和电子设备 |
WO2021035975A1 (zh) * | 2019-08-23 | 2021-03-04 | 上海科技发展有限公司 | 基于多评价维度的热点学科预测方法、装置、终端、及介质 |
-
2021
- 2021-09-27 CN CN202111135530.3A patent/CN113837807B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090222321A1 (en) * | 2008-02-28 | 2009-09-03 | Microsoft Corporation | Prediction of future popularity of query terms |
US20110302103A1 (en) * | 2010-06-08 | 2011-12-08 | International Business Machines Corporation | Popularity prediction of user-generated content |
WO2014151351A1 (en) * | 2013-03-15 | 2014-09-25 | The Echo Nest Corporation | Demographic and media preference prediction using media content data analysis |
CN105096152A (zh) * | 2014-05-20 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 一种基于商品热度的操作执行方法及装置 |
US20160092893A1 (en) * | 2014-09-29 | 2016-03-31 | Ebay Inc. | System, method, and apparatus for predicting item characteristic popularity |
US20170323210A1 (en) * | 2016-05-06 | 2017-11-09 | Wp Company Llc | Techniques for prediction of popularity of media |
CN109522470A (zh) * | 2018-11-06 | 2019-03-26 | 汪浩 | 一种视频热度预测方法、装置、设备及存储介质 |
WO2021035975A1 (zh) * | 2019-08-23 | 2021-03-04 | 上海科技发展有限公司 | 基于多评价维度的热点学科预测方法、装置、终端、及介质 |
CN110489655A (zh) * | 2019-09-16 | 2019-11-22 | 浙江同花顺智能科技有限公司 | 热门内容确定、推荐方法、装置、设备及可读存储介质 |
CN111314790A (zh) * | 2020-03-26 | 2020-06-19 | 北京奇艺世纪科技有限公司 | 一种视频播放记录的排序方法、装置和电子设备 |
Non-Patent Citations (2)
Title |
---|
万倩;谢峰;赵明;王炳飞;: "基于灰色预测模型的电视频道热度预测", 电视技术, no. 1 * |
朱海龙;云晓春;韩志帅;: "基于传播加速度的微博流行度预测方法", 计算机研究与发展, no. 06 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023169259A1 (zh) * | 2022-03-08 | 2023-09-14 | 北京字跳网络技术有限公司 | 音乐热度的预测方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113837807B (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108073568B (zh) | 关键词提取方法和装置 | |
CN108376129B (zh) | 一种纠错方法及装置 | |
CN111427974A (zh) | 数据质量评估管理方法和装置 | |
CN111814056A (zh) | 基于信息处理的供应商推荐方法及相关设备 | |
CN111984867B (zh) | 一种网络资源确定方法及装置 | |
CN111314790A (zh) | 一种视频播放记录的排序方法、装置和电子设备 | |
CN108021713B (zh) | 一种文档聚类的方法和装置 | |
CN113837807A (zh) | 热度预测方法、装置、电子设备及可读存储介质 | |
CN114692978A (zh) | 一种基于大数据的社交媒体用户行为预测方法及系统 | |
CN114239697A (zh) | 目标对象的分类方法、装置、电子设备及存储介质 | |
CN111680218B (zh) | 用户兴趣识别方法、装置、电子设备及存储介质 | |
CN113656575A (zh) | 训练数据的生成方法、装置、电子设备及可读介质 | |
CN114693011A (zh) | 一种政策匹配方法、装置、设备和介质 | |
CN115794898B (zh) | 一种金融资讯推荐方法、装置、电子设备及存储介质 | |
CN112163415A (zh) | 针对反馈内容的用户意图识别方法、装置及电子设备 | |
CN110705889A (zh) | 一种企业筛选方法、装置、设备及存储介质 | |
CN111353052B (zh) | 一种多媒体对象推荐方法、装置、电子设备及存储介质 | |
CN114546360A (zh) | 代码程序推荐方法、装置、电子设备和存储介质 | |
CN112685623A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN114358024A (zh) | 日志分析方法、装置、设备、介质和程序产品 | |
CN113868481A (zh) | 组件获取方法、装置及电子设备和存储介质 | |
CN112860652A (zh) | 作业状态预测方法、装置和电子设备 | |
US8930362B2 (en) | System and method for streak discovery and prediction | |
CN113095589A (zh) | 一种人口属性确定方法、装置、设备及存储介质 | |
CN111782898A (zh) | 数据源搜索方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |