多媒体数据推荐方法、装置、计算机设备和存储介质
技术领域
本申请涉及多媒体数据处理技术领域,特别是涉及一种多媒体数据推荐方法、装置、计算机设备和存储介质。
背景技术
随着信息技术的飞速发展,多媒体数据的应用为丰富人们的生活起到了不可替代的作用。传统的多媒体数据推荐方法,通过预先设定的用户画像为用户推荐新的多媒体数据对象。
传统的多媒体数据推荐方法,根据用户画像来确定为用户推荐的多媒体数据对象,使得推荐的多媒体数据对象无法及时反映出用户的兴趣转变,因此,推荐的多媒体数据对象的准确性低,被点击播放的概率低,从而用户粘度有待提高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高用户粘度的多媒体数据推荐方法、装置、计算机设备和存储介质。
一种多媒体数据推荐方法,所述方法包括:
获取对多媒体数据对象的播放记录,所述播放记录包括目标用户标识及所述多媒体数据对象的对象标识;
根据目标特征信息与目标兴趣分布信息的相似度,更新所述目标兴趣分布信息;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息,所述目标兴趣分布信息为与所述目标用户标识对应的兴趣分布信息;
对比预估特征信息与更新后的所述目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率;
将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象。
一种多媒体数据推荐装置,所述装置包括:
播放记录获取模块,用于获取对多媒体数据对象的播放记录,所述播放记录包括目标用户标识及所述多媒体数据对象的对象标识;
兴趣信息更新模块,用于根据目标特征信息与目标兴趣分布信息的相似度,更新所述目标兴趣分布信息;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息,所述目标兴趣分布信息为与所述目标用户标识对应的兴趣分布信息;
点击率预测模块,用于对比预估特征信息与更新后的所述目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率;
目标对象确定模块,用于将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取对多媒体数据对象的播放记录,所述播放记录包括目标用户标识及所述多媒体数据对象的对象标识;
根据目标特征信息与目标兴趣分布信息的相似度,更新所述目标兴趣分布信息;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息,所述目标兴趣分布信息为与所述目标用户标识对应的兴趣分布信息;
对比预估特征信息与更新后的所述目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率;
将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取对多媒体数据对象的播放记录,所述播放记录包括目标用户标识及所述多媒体数据对象的对象标识;
根据目标特征信息与目标兴趣分布信息的相似度,更新所述目标兴趣分布信息;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息,所述目标兴趣分布信息为与所述目标用户标识对应的兴趣分布信息;
对比预估特征信息与更新后的所述目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率;
将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象。
由于该多媒体数据推荐方法、装置、计算机设备和存储介质,获取对多媒体数据对象的播放记录,所述播放记录包括目标用户标识及所述多媒体数据对象的对象标识;根据目标特征信息与目标兴趣分布信息的相似度,更新所述目标兴趣分布信息;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息,所述目标兴趣分布信息为与所述目标用户标识对应的兴趣分布信息。如此,基于多媒体数据对象的播放记录,对目标兴趣分布信息进行更新,可以保持目标兴趣分布信息的实时性。同时,由于基于目标特征信息与目标兴趣信息的相似度,更新目标兴趣分布信息,因此,可以快速地体现兴趣改变的情况,从而,在保持目标兴趣分布信息实时性的同时提高目标兴趣分布信息的准确性。由于目标兴趣分布信息具有实时性和准确性,将预估特征信息与更新后的兴趣分布信息的进行对比,确定该预估特征信息对象的候选多媒体数据对象的预测点击率更为准确且实时。从而,将预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象也更为准确且实时。因此,可以提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,从而提高用户粘度。
一种多媒体数据推荐方法,所述方法包括:
通过多媒体数据对象展示界面,接收播放控制指令,所述播放控制指令包括所述多媒体数据对象的对象标识;
在所述多媒体数据对象播放结束时,生成播放记录;所述播放记录包括目标用户标识及所述对象标识;
接收后台服务器基于所述目标用户标识反馈的多媒体数据推荐信息;所述多媒体数据推荐信息,由所述后台服务器根据目标多媒体数据对象生成并发送;所述后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率,并将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息;
根据所述多媒体数据推荐信息,推荐所述目标多媒体数据对象。
一种多媒体数据推荐装置,所述装置包括:
播放指令接收模块,用于通过多媒体数据对象展示界面,接收播放控制指令,所述播放控制指令包括所述多媒体数据对象的对象标识;
播放记录生成模块,用于在所述多媒体数据对象播放结束时,生成播放记录;所述播放记录包括目标用户标识及所述对象标识;
推荐信息接收模块,用于接收后台服务器基于所述目标用户标识反馈的多媒体数据推荐信息;所述多媒体数据推荐信息,由所述后台服务器根据目标多媒体数据对象生成并发送;所述后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率,并将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息;
多媒体对象推荐模块,用于根据所述多媒体数据推荐信息,推荐所述目标多媒体数据对象。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
通过多媒体数据对象展示界面,接收播放控制指令,所述播放控制指令包括所述多媒体数据对象的对象标识;
在所述多媒体数据对象播放结束时,生成播放记录;所述播放记录包括目标用户标识及所述对象标识;
接收后台服务器基于所述目标用户标识反馈的多媒体数据推荐信息;所述多媒体数据推荐信息,由所述后台服务器根据目标多媒体数据对象生成并发送;所述后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率,并将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息;
根据所述多媒体数据推荐信息,推荐所述目标多媒体数据对象。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
通过多媒体数据对象展示界面,接收播放控制指令,所述播放控制指令包括所述多媒体数据对象的对象标识;
在所述多媒体数据对象播放结束时,生成播放记录;所述播放记录包括目标用户标识及所述对象标识;
接收后台服务器基于所述目标用户标识反馈的多媒体数据推荐信息;所述多媒体数据推荐信息,由所述后台服务器根据目标多媒体数据对象生成并发送;所述后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率,并将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息;
根据所述多媒体数据推荐信息,推荐所述目标多媒体数据对象。
该多媒体数据推荐方法、装置、计算机设备和存储介质,通过多媒体数据对象展示界面,接收播放控制指令,所述播放控制指令包括所述多媒体数据对象的对象标识;在所述多媒体数据对象播放结束时,生成播放记录;所述播放记录包括目标用户标识及所述对象标识;接收后台服务器基于所述目标用户标识反馈的多媒体数据推荐信息;所述多媒体数据推荐信息,由所述后台服务器根据目标多媒体数据对象生成并发送;所述后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率,并将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息;根据所述多媒体数据推荐信息,推荐所述目标多媒体数据对象。
由于更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定,如此,基于多媒体数据对象的播放记录,对目标兴趣分布信息进行更新,可以保持目标兴趣分布信息的实时性。同时,由于基于目标特征信息与目标兴趣信息的相似度,更新目标兴趣分布信息,因此,可以快速地体现兴趣改变的情况,从而,在保持目标兴趣分布信息实时性的同时提高目标兴趣分布信息的准确性。由于目标兴趣分布信息具有实时性和准确性,后台服务器将预估特征信息与更新后的兴趣分布信息的进行对比,确定该预估特征信息对象的候选多媒体数据对象的预测点击率更为准确且实时。从而,后台服务器将预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象也更为准确且实时。进而,终端接收的多媒体数据推荐信息也更为准确且实时。因此,可以提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,从而提高用户粘度。
附图说明
图1为一个实施例中多媒体数据推荐方法的应用环境图示意图;
图2为一个实施例的多媒体数据推荐方法的流程示意图;
图3为一具体示例中的多媒体数据推荐方法中短视频播放行为的示意图;
图4为一具体实施例中的多媒体数据推荐方法中目标点击率预估模型的结构示意图;
图5为另一个实施例中多媒体数据推荐方法的流程示意图;
图6为一具体实施例中的多媒体数据推荐方法的基本流程图;
图7为一具体实施例中的多媒体数据推荐方法的时序图;
图8为一个实施例中的多媒体数据推荐装置的结构框图;
图9为另一个实施例中多媒体数据推荐装置的结构框图;
图10为一个实施例中计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中多媒体数据推荐方法的应用环境图示意图。本申请提供的多媒体数据推荐方法,可应用于如图1所示的应用环境中。其中,终端102通过网络与后台服务器104进行通信。其中,终端102可以是台式设备或者移动终端,如台式电脑、平板电脑、智能手机等。后台服务器104可以是独立的物理服务器、物理服务器集群或者虚拟服务器。
本申请一个实施例的多媒体数据推荐方法可以运行在后台服务器104上。后台服务器104获取对多媒体数据对象的播放记录,播放记录包括目标用户标识及多媒体数据对象的对象标识;根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息;目标特征信息为与对象标识所标识的多媒体数据对象的特征信息,目标兴趣分布信息为与目标用户标识对应的兴趣分布信息;对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率;将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象。进一步地,后台服务器104,还可以在确定了推荐的目标多媒体数据对象之后,根据目标多媒体数据对像生成多媒体数据推荐信息,并将该多媒体推荐信息发送至目标用户标识对应的终端,以使终端对目标多媒体数据对象进行推荐、曝光。可以理解地,该多媒体数据推荐信息包括各目标多媒体数据对象的对象标识。
本申请一个实施例的多媒体数据推荐方法可以运行在终端102上。终端102通过多媒体数据对象展示界面,接收播放控制指令,播放控制指令包括多媒体数据对象的对象标识;在多媒体数据对象播放结束时,生成播放记录;播放记录包括目标用户标识及对象标识;接收后台服务器基于目标用户标识反馈的多媒体数据推荐信息;多媒体数据推荐信息,由后台服务器根据目标多媒体数据对象生成并发送;后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率,并将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的目标兴趣分布信息根据目标特征信息与更新前的目标兴趣分布信息的相似度进行更新确定;目标特征信息为与对象标识所标识的多媒体数据对象的特征信息;根据多媒体数据推荐信息,推荐目标多媒体数据对象。
如图2所示,在一个实施例中,提供了一种多媒体数据推荐方法。该方法可以运行于图1中的后台服务器104。该多媒体数据推荐方法,包括以下步骤:
S202,获取对多媒体数据对象的播放记录。
后台服务器获取对多媒体数据对象的播放记录。多媒体数据对象包括语音对象及视频对象。其中,视频对象包括短视频对象和长视频对象。短视频对象是指短片视频,一般是在互联网新媒体上传播的时长在1分钟以内的视频传播内容,即短视频是指时长是1分钟以内的视频对象。长视频对象是指时长在1分钟以上的视频对象。
播放记录包括目标用户标识及多媒体数据对象的对象标识。目标用户标识是指播放该多媒体数据对象的用户标识。对象标识是指标识多媒体数据对象的标识。
播放记录可以是终端播放多媒体数据对象之后生成的。播放记录可以以日志的形式表示。该播放记录可以是在发送条件满足时发送至后台服务器。如可以是在该多媒体数据对象播放结束时,将该播放记录发送至后台服务器;也可以是在播放记录条数达到预定值数量时,将预定值数量的播放记录发送至后台服务器;还可以是在预设时间间隔内,若有新的播放记录生成,则发送该预设时间间隔内的播放记录至后台服务器,具体如预设时间间隔为一小时。
S204,根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息。
目标特征信息为与对象标识所标识的多媒体数据对象的特征信息。特征信息可以通过特征向量来表示,特征向量是指对多媒体数据对象的特征进行表示的向量。向量是一种数据表示形式。特征向量可以包括多个维度,每一个维度都可以表示一个特征。特征可以是多媒体数据对象相关的一些属性,如播放时长、总时长、多媒体数据对象的标签类型、多媒体数据对象的名称、多媒体数据对象的提供者等。其中,标签类型可以包括新闻、体育、娱乐、科技、时尚、服饰、汽车、文化、游戏、财经等。进一步地,标签类型可以包括更具进一步的类别信息,如可以包括以名人的姓名为类别的标签;又如,可以包括以游戏名称,甚至游戏环节为类别的标签;再如,可以以新闻事件的事件内容作为类别的标签。
特征信息可以包括离散特征信息和连续特征信息。其中,离散特征信息是指离散特征的信息,离散特征是指取值范围是离散的特征。连续特征信息是指连续特征的信息,连续特征是指取值范围是连续的特征。离散特征信息可以包括基于该多媒体数据对象的高维稀疏特征进行转换后,得到的低维稠密信息。其中,低维稠密信息可以是采用嵌入式(embedding)方法,将独热(one-hot)的高维稀疏特征转换为低维稠密信息。比如,对于一个N维one-hot编码的短视频ID(身份标识号)特征,可以通过embedding计算转换为一个低维的稠密信息表示。连续特征信息可以包括基于该多媒体数据对象的连续特征得到的信息,其中基于该多媒体数据对象的连续特征可以包括:播放时长、目标用户的年龄等。对于连续特征,可以采用原始值来表示,也可以将数值进行标准化转换或CDF(累积分布函数,Cumulative Distribution Function)离散化后,得到基于该多媒体数据数据对象的连续特征信息。
目标兴趣分布信息为与目标用户标识对应的兴趣分布信息。兴趣分布信息为表示用户兴趣分布的特征信息。兴趣分布是指用户感兴趣的多媒体数据对象的特征。用户兴趣分布可以与特征信息对应,如可以包括用户感兴趣的多媒体数据对象的时长范围,用户感兴趣的多媒体数据对象的所属标签类型,用户感兴趣的多媒体数据对象的提供者等。在本实施例中,目标兴趣分布信息是实时的,即每次获取到播放记录时,都将根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息。需要说明的是,在每次获取到多媒体数据对象的播放记录时,根据目标特征信息与前一播放记录对应的目标兴趣信息的相似度,确定本次播放记录对应的目标兴趣分布信息。
后台服务器根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息。如此,基于多媒体数据对象的播放记录,对目标兴趣分布信息进行更新,可以保持目标兴趣分布信息的实时性。同时,由于基于目标特征信息与目标兴趣信息的相似度,更新目标兴趣分布信息,因此,可以快速地体现兴趣改变的情况,在保持目标兴趣分布信息实时性的同时提高目标兴趣分布信息的准确性。
S206,对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率。
预估特征信息为候选多媒体数据对象的特征信息。预估特征信息也可以用向量来表示。候选多媒体数据对象为采用预设方式在多媒体对象数据库中选出的与目标用户相关的多媒体数据对象。预设方式可以为根据用户画像对多媒体数据库中的多媒体数据对象进行筛选。如,可以采用ICF(Item-based Collaborative Filtering,基于项目的协同过滤),UCF(User-based Collaborative Filtering,基于用户的协同过滤)等不同的策略通过用户画像对多媒体数据库中的多媒体数据对象进行筛选。可以采用预设方式在多媒体对象数据库中选出满足数量条件个数的多媒体数据对象。数量条件可以为数量范围在预设数量范围内,如1000到2000范围内,又如大于1小于1000,等。
可以通过对比预估特征信息与更新后的目标兴趣分布信息,得到预估特征信息与更新后的目标兴趣分布向信息的相似程度,来确定预估特征信息对象给的候选多媒体数据对象的预测点击率。预测点击率是指,预测得到的该候选多媒体数据对象曝光后被点击的概率(Click Through Rate,CTR)。
S208,将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象。
后台服务器可以将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对。该目标条件可以是预测点击率大于预设值,如预测点击率大于0.5、0.3等预设的概率值。该目标条件还可以是预测点击率按大小排序排在前预设数量位数。该前预设数量是预先设定的正整数,如预设数量可以为5、10、15、20等,此时,预测点击率满足目标条件的候选多媒体数据对象,分别表示按预测点击率的大小排序,从大到小排,排在前5、10、15、20的候选多媒体数据对象。
终端可以对目标多媒体数据对象进行曝光,以使得用户可以方便地对其进行点击,从而使得终端接收到对该目标多媒体数据对象的播放指令。其中,曝光是指在终端的推荐多媒体数据对象的展示区域内展示多媒体数据对象的对象信息。对象信息可以包括多媒体数据对象的名称、缩略图等信息。
可以将预测点击率满足目标条件的候选多媒体数据对象确定为推荐的目标多媒体数据对象。也可以先对根据预测点击率排序好的候选多媒体数据对象进行打散操作,再从中选出满足目标条件的目标多媒体数据对象。打散操作是指对于具有相同预设属性的多媒体数据对象,在推荐的多媒体数据对象中出现的次数小于预设次数。该预设次数可以为1,2,3。预设属性可以包括上传者、事件、主题等。其中,上传者是指多媒体数据对象的上传用户;事件可以是多媒体数据对象所展示的事件内容,如可以为一件新闻时事的主要内容;主题可以是多媒体数据对象的名称或者标题。如此,可以避免在一次推荐中出现多次具有相同预设属性的多媒体数据对象。
由于上述多媒体数据推荐方法,获取对多媒体数据对象的播放记录,播放记录包括目标用户标识及多媒体数据对象的对象标识;根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息;目标特征信息为与对象标识所标识的多媒体数据对象的特征信息,目标兴趣分布信息为与目标用户标识对应的兴趣分布信息。如此,基于多媒体数据对象的播放记录,对目标兴趣分布信息进行更新,可以保持目标兴趣分布信息的实时性。同时,由于基于目标特征信息与目标兴趣信息的相似度,更新目标兴趣分布信息,因此,可以快速地体现兴趣改变的情况,从而,在保持目标兴趣分布信息实时性的同时提高目标兴趣分布信息的准确性。由于目标兴趣分布信息具有实时性和准确性,将预估特征信息与更新后的兴趣分布信息的进行对比,确定该预估特征信息对象的候选多媒体数据对象的预测点击率更为准确且实时。从而,将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象也更为准确且实时。因此,可以提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,从而提高用户粘度。
在其中一实施例中,当目标特征信息与目标兴趣分布信息的相似度越小时,目标特征信息对更新目标兴趣分布信息的影响权重越大。如此,使得与目标兴趣信息相似度越大的目标特征信息对目标兴趣分布向的影响权重越小,而与目标兴趣信息相似度越小的目标特征信息对目标兴趣分布向的影响权重越大。
如图3所示,根据统计结果显示,用户在播放多媒体数据对象时,尤其是播放短视频对象时,用户的播放行为表现为:用户连续播放一组相似的多媒体数据对象,然后播放另一组相似的多媒体数据对象,如此重复。因此,在这种业务场景下,当用户的兴趣变化时,采用已有的各个目标特征信息的均值表示目标兴趣信息的方法,不能快速调整目标兴趣分布信息,与目标用户当前的兴趣分布存在较大偏差。比如,在用户完成短视频a1-an和b1的观看后,用户的兴趣已经发生变化,但是,传统的方法使用短视频a1-an和b1的特征信息均值,作为目标兴趣分布信息。这种方法在用户兴趣变化时,不能快速调整目标兴趣分布信息。
而基于本实施例的多媒体数据推荐方法,由于b1与更新前的目标兴趣信息的相似度很小,因此,在更新目标兴趣信息的过程中,该短视频b1的特征信息的影响权重较大。这样,使得在用户的兴趣发生改变时,可以更为快速地在目标兴趣分布信息中反映出来。如此,可以进一步提高目标特征信息的准确性与实时性,从而,可以进一步提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,提高用户粘度。
在其中一实施例中,播放记录还包括播放完成度信息。根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息,包括:根据目标特征信息与目标兴趣分布信息的相似度,以及播放完成度信息,更新目标用户标识对应的目标兴趣分布信息。
播放完成度信息为表现多媒体数据对象播放完成情况的信息。如可以通过播放时长来体现,也可以通过播放时长与多媒体数据对象的总时长来体现。具体如,播放完成度信息可以是播放时长除以该总时长而得到的值。
由于多媒体数据对象完成播放可能是在播放了很短的一段时间之后,就因为用户不喜欢而中途切换了其他多媒体对象进行播放,因此,播放完成度信息情况可以在一定程度上体现用户对该多媒体数据对象感兴趣的程度。
在本实施例中,更新目标兴趣分布信息时,还同时考虑该播放记录中,播放的多媒体数据对象的播放完成度信息的因素。如,可以在根据目标特征信息与目标兴趣分布信息确定的相似度,确定的影响权重的基础上,再乘以播放完成度信息所表示的播放完成度,得到最终的影响权重。该影响权重为目标特征信息在目标兴趣信息更新时的权重大小。又如,可以根据目标特征信息与目标兴趣分布信息的内积来体现相似度,因此,可以根据目标特征信息与目标兴趣分布信息的内积,以及根据目标特征信息与目标兴趣分布信息的模的乘积,来确定平滑权重参数。在本实施例中,可以将该平滑权重参数再乘以播放完成度信息所表示的播放完成度,得到最终的平滑权重参数。平滑权重参数为在确定影响权重的过程中,采用的一个中间参数。可以基于该平滑权重参数,确定最终的影响权重,影响权重可以等于平滑权重参数除以该平滑权重参数与超参数的和,超参数为一个常量。如此,可以避免影响权重过大,而导致结果不准确的问题。
基于本实施例的多媒体数据推荐方法,在更新目标兴趣分布信息的时候,在目标特征信息与目标兴趣分布信息的相似度的基础上,还考虑了多媒体数据对象的播放完成度情况的因素。如此,可以避免引入用户只播放了一小部分内容就因不感兴趣而结束播放的多媒体数据对象的噪声干扰。从而,使得更新后的目标兴趣信息可以更为准确地体现用户的兴趣分布情况。
在其中一实施例中,当播放完成度信息所表示的播放完成度越大时,目标特征信息对更新目标兴趣分布信息的影响权重越大。对于一个用户,不同播放完成度的多媒体数据对象,表示用户对该多媒体数据对象的喜好程度不同。
基于本实施例的多媒体数据数据对象推荐方法,当播放完成度信息所表示的播放完成度越大时,目标特征信息对更新目标兴趣分布信息的影响权重越大。如此,使得播放完成度越大的多媒体对象对应的目标特征信息,对目标兴趣分布信息的影响更大。从而进一步提高目标兴趣信息的准确性。
在其中一具体实施例中,平滑权重参数可以表示为:
其中,Vn表示用户完成第n个多媒体对象的播放后,用户的兴趣分布向量,即可以表示第n次播放记录对应的兴趣分布向量。
In+1表示用户完成播放的第n+1个多媒体数据对象的特征向量。
rn+1表示用户完成播放的第n+1个多媒体数据对象的播放完成度信息,可以使用播放时长/多媒体数据对象的总时长确定。
VnIn+1表示向量Vn与向量In+1的内积,通过内积体现两者的相似度。
|Vn|表示第n次播放记录对应的兴趣分布向量Vn的模。
|In+1|表示第n+1个多媒体数据对象的特征向量的模。
α表示一个超参数,用于计算In+1的平滑权重参数W,如此,可以避免影响权重过大的问题。
进一步地,在该具体实施例中,更新后的目标兴趣分布向量可以表示为:
其中,Vn+1表示用户完成第n+1个多媒体数据对象的播放后,用户的兴趣分布向量,即可以表示第n+1次播放记录对应的兴趣分布向量。
W表示平滑权重参数。Vn表示用户完成第n个多媒体对象的播放后,用户的兴趣分布向量,即可以表示第n次播放记录对应的兴趣分布向量。In+1表示用户完成播放的第n+1个多媒体数据对象的特征向量。
如此,可以根据In+1与Vn的相似度,调整计算Vn+1时In+1的权重,在用户兴趣发生改变时,快速调整目标兴趣分布向量。在In+1与Vn的相似度大于预设值时,In+1的影响权重较小。具体地,如果In+1与Vn的相似度小于预设值,即用户改变兴趣时,In+1的影响权重较大,如此,可以快速调整用户的兴趣分布。与传统的均值方法相比,可以更快速的调整目标兴趣分布向量,减少与用户当前兴趣的偏差。在计算Vn+1时,也需要考虑第n+1个多媒体多媒体数据对象的播放完成度信息rn+1,将播放完成度信息作为In+1权重的系数之一。不同的多媒体对象播放完成度,可以反映出用户对多媒体对象的喜好权重不同。因此,在确定目标兴趣分布向量时,考虑多媒体数据对象的播放完成度信息。如此,可以避免引入噪声,更好的保证线上效果。
在其中一实施例中,对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率,包括:根据更新后的目标兴趣分布信息,对目标点击率预估模型进行更新;通过更新后的目标点击率预估模型的输入层,将预估特征信息转化为目标预估信息;通过更新后的目标点击率预估模型的隐藏层,将目标预估信息进行全连接处理,得到全连接结果;通过更新后的目标点击率预估模型的输出层,将全连接结果映射成预测点击率。
目标点击率预估模型是指,针对目标用户标识所标识的用户,进行候选多媒体数据对象的点击率评估的模型。在本实施例中,基于目标点击率预估模型实现:对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率。
在本实施例中,在根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息之后,需要根据更新后的目标兴趣分布信息更新目标点击率预估模型。
如图4所示,目标点击率预估模型可以为神经网络模型,如DNN(Deep NeuralNetworks,深度神经网络)模型。目标点击率预估模型包括输入层、隐藏层及输出层。输入层用于接收候选多媒体数据对象的预估特征信息,并将预估特征信息转化为目标预估信息。预估特征信息可以为连续特征信息,也可以为稀疏特征信息。对于连续特征信息,将预估特征信息转化为目标预估信息的方式可以是,将该连续特征信息进行离散处理,或者进行标准化处理,得到目标特征信息。对于稀疏特征信息,将预估特征信息转化为目标预估信息的方式可以是,将该稀疏特征信息转化为低维稠密信息,得到目标预估信息。输入层还用于将预估特征信息与目标兴趣分布信息进行拼接,得到拼接信息,作为隐藏层的输入数据。
隐藏层,用于对拼接信息进行全连接处理,得到全连接结果。在一个具体实施例中,如图4所示,隐藏层包括三层全连接网络,分别包含1024,512,256个使用ReLU(Rectified Linear Unit,线性整流函数)激活函数的神经元。
输出层用于对全连接结果进行映射得到候选多媒体数据对象的预测点击率。在其中一具体实施例中,如图4所示,输出层采用sigmoid函数(S型函数)对隐藏层的输出信息进行映射,得到候选多媒体数据对象的预测点击率。
基于本实施例的多媒体数据推荐方法,基于目标点击率预估模型实现对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率。如此,可以进一步提高预测点击率的准确性。从而进一步提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,进一步提高用户粘度。
进一步地,该目标点击预估模型在训练时采用的训练样本,可以基于终端发送的播放记录生成。如,可以基于2-3周内曝光的多媒体数据数据对象的播放记录,制定训练样本。其中,训练样本的格式可以为:Label:feature1,feature2,…feature N。其中,特征信息中的各个元素Feature1,feaute2,…feature N,分别表示目标用户及多媒体数据对象的特征。Label,可以用于表示用户是否播放该多媒体数据对象。如果用户播放该多媒体数据对象,可以用“1”表示;否则,用“0”表示。更进一步地,Label还可以表示该多媒体数据对象的播放完成度,其取值范围为[0,1],如此,具有更准确的预测点击率,从而得到更好的线上推荐效果,提高用户粘度。
在对目标点击率预估模型进行训练的过程中,采用交叉熵作为损失函数,采用小批量梯度下降法(Mini-batch Gradient Descent,MBGD)进行优化,得到最优目标点击率预估模型。对于目标点击率预估模型的正则化项,丢弃概率和超参数的取值,可以采用搜索的方法,选取合适的值。其中,丢弃概率为在深度学习过程中对神经元进行丢弃的概率。在完成目标点击率模型的训练后,每当获取到新的播放记录时,需要基于该播放记录重新对目标点击率模型进行更新,如此,采用增量模型训练的方法,对目标点击率模型进行更新。在一个具体实施例中,该播放记录可以是在预设时间间隔内,若有新的播放记录生成,则发送该预设时间间隔内的播放记录至后台服务器,具体如预设时间间隔为一小时。如此,采用小时级别的目标点击率预估模型增量训练和更新的方式,对目标点击率预估模型进行训练和更新。
在目标点击率预估模型训练完成后,可以将该目标点击率预估模型加载到线上后台服务器的内存。在根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息之后,根据更新后的目标兴趣分布信息,对目标点击率预估模型进行更新,并采用更新后的目标点击率预估模型对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率。最后,后台服务器将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象。
在其中一实施例中,目标特征信息采用目标特征向量表示,目标兴趣分布信息采用目标兴趣分布向量表示。在根据目标特征信息与目标兴趣分布信息的相似度,更新目标兴趣分布信息之前,还包括:a、b、c;a、b、d;或者,a、b、c、d。
(a)根据对象标识获取多媒体数据对象。
后台服务器可以根据对象标识在数据表中查找多媒体数据对象的对象信息,在根据对象信息获取到与该对象标识一致的多媒体数据对象。其中,对象信息可以包括多媒体数据对象的对象标识、名称、存储路径等信息。
(b)提取多媒体数据对象的特征向量。
在后台服务器获取到与多媒体数据对象之后,可以对多媒体数据对象进行特征提取,提取到多媒体数据对象的特征向量。该特征向量可以包括离散特征向量和连续特征向量。其中,离散特征向量是指用离散特征的向量,离散特征是指取值范围是离散的特征。连续特征向量是指连续特征的向量,连续特征是指取值范围是连续的特征。
(c)当提取到的特征向量为稀疏特征向量时,将稀疏特征向量转化为低维稠密向量,得到目标特征向量。
离散特征向量可以包括基于该多媒体数据对象的高维稀疏特征进行转换后,得到的低维稠密向量。其中,低维稠密向量可以是采用嵌入式方法,将独热的高维稀疏特征转换为低维稠密向量,从而得到目标特征向量。
(d)当提取到的特征向量为连续特征向量时,将连续特征向量进行离散处理,得到目标特征向量。
连续特征向量可以包括基于该多媒体数据对象的连续特征得到的向量,其中基于该多媒体数据对象的连续特征可以包括:播放时长、目标用户的年龄等。对于连续特征,可以采用原始值来表示,也可以将数值进行标准化转换或CDF离散化后,得到基于该多媒体数据数据对象的连续特征向量,从而得到目标特征向量。
基于本实施例的多媒体数据的推荐方法,在提取到多媒体数据对象的特征向量之后,对其进行进一步处理,如稠密处理、标准化处理、离散化处理,使得最终得到的目标特征向量具有统一的格式,而预估特征向量与目标特征向量的格式应该保持一致,如此,方便预估特征向量及目标特征向量与目标兴趣分布向量的相关处理,可以提高多媒体推荐方法的效率,从而进一步提高实时性,提高用户粘度。
在其中一实施例中,所述对比预估特征信息与目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率之前,还包括:根据目标用户标识,获取用户画像;根据用户画像及候选策略,确定候选多媒体数据对象;提取候选多媒体数据对象的预估特征信息。
用户画像是根据播放的多媒体数据对象的属性抽象出的一个标签化的用户模型。用户画像可以通过数据库的形式进行存储,也可以直接存储在存储空间中。可以通过目标用户标识在数据库中查找到与该目标用户标识对应的用户画像。也可以直接通过用户标识在存储空间中查找命名包括用户标识的文件,该文件中记录有该用户标识对应的用户画像。
候选策略是指将数据库中的多媒体数据对象筛选为候选多媒体数据对象的策略。候选策略可以采用ICF、UCF等不同的策略。候选策略还可以采用随机选取的策略。在本实施例中,基于用户画像采用候选策略在多媒体数据中筛选出预设数量的候选多媒体数据对象。然后对每一个候选多媒体数据对象进行特征提取,得到候选多媒体数据对象的预估特征信息。最后,对比预估特征信息与目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率,并将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象。
基于本实施例的多媒体数据推荐方法,根据用户画像及候选策略对多媒体数据对象进行筛选,确定候选多媒体数据对象。如此,可以提高候选多媒体数据对象的准确性,从而,进一步提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,进一步提高用户粘度。
如图5所示,在一个实施例中,提供一种多媒体数据推荐方法,该方法运行于图1中的终端102。该多媒体数据推荐方法,包括以下步骤:
S502,通过多媒体数据对象展示界面,接收播放控制指令。播放控制指令包括多媒体数据对象的对象标识。
多媒体数据对象展示界面是指客户终端上,用于展示多媒体数据对象的界面。该多媒体数据对象展示界面上可以包括播放控件,可以基于该播放控件接收播放控制指令。如可以是在多媒体对象展示界面上的播放按钮被按下时,接收播放控制指令。播放控制指令中的多媒体数据对象的对象标识,用于表示该播放控制指令用于控制播放的多媒体数据对象的标识。
S504,在多媒体数据对象播放结束时,生成播放记录。播放记录包括目标用户标识及对象标识。
终端根据接收到的播放控制指令对多媒体数据进行播放,在该多媒体数据对象的播放结束之后,生成播放记录。该播放记录中记录有目标用户标识及对象标识。该目标用户标识为播放该多媒体数据对象的用户标识,该对象标识为播放的多媒体数据对象的标识。
S506,接收后台服务器基于目标用户标识反馈的多媒体数据推荐信息。多媒体数据推荐信息,由后台服务器根据目标多媒体数据对象生成并发送。该多媒体数据推荐信息包括目标用户标识及推荐的目标多媒体数据对象的对象标识。
后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率,并根据预测点击率,从候选多媒体数据对象中确定推荐的目标多媒体数据对象。其中,更新后的目标兴趣分布信息根据目标特征信息与更新前的目标兴趣分布信息的相似度进行更新确定;所述目标兴趣分布信息为与所述目标用户标识对应的兴趣分布的特征信息;目标特征信息为与对象标识所标识的多媒体数据对象的特征信息。
更新后的目标兴趣分布信息,可以是由后台服务器,根据目标特征信息与更新前的目标兴趣分布信息的相似度进行更新确定;也可以是由终端,根据目标特征信息与更新前的目标兴趣分布信息的相似度进行更新确定。
S508,根据多媒体数据推荐信息,推荐目标多媒体数据对象。
由于该多媒体数据推荐信息包括目标用户标识及推荐的目标多媒体数据对象的对象标识。终端可以根据该多媒体数据推荐信息,确定推荐的目标多媒体数据对象,并对目标多媒体数据对象进行推荐。推荐目标多媒体数据对象的方式可以是,在推荐界面展示目标多媒体数据对象,以对目标多媒体数据对象进行曝光,也可以是将目标多媒体数据对象插入待播放列表中。待播放列表为等待进行播放的列表。播放器将待播放列表中的项目按播放规则进行播放,如可以是按顺序进行播放,也可以是随机播放。
基于本实施例的多媒体数据推荐方法,通过多媒体数据对象展示界面,接收播放控制指令,播放控制指令包括多媒体数据对象的对象标识;在多媒体数据对象播放结束时,生成播放记录;播放记录包括目标用户标识及对象标识;接收后台服务器基于目标用户标识反馈的多媒体数据推荐信息;多媒体数据推荐信息,由后台服务器根据目标多媒体数据对象生成并发送;后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定预估特征信息对应的候选多媒体数据对象的预测点击率,并将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的目标兴趣分布信息根据目标特征信息与更新前的目标兴趣分布信息的相似度进行更新确定;目标特征信息为与对象标识所标识的多媒体数据对象的特征信息;根据多媒体数据推荐信息,推荐目标多媒体数据对象。
由于更新后的目标兴趣分布信息根据目标特征信息与更新前的目标兴趣分布信息的相似度进行更新确定,如此,基于多媒体数据对象的播放记录,对目标兴趣分布信息进行更新,可以保持目标兴趣分布信息的实时性。同时,由于基于目标特征信息与目标兴趣信息的相似度,更新目标兴趣分布信息,因此,可以快速地体现兴趣改变的情况,从而,在保持目标兴趣分布信息实时性的同时提高目标兴趣分布信息的准确性。由于目标兴趣分布信息具有实时性和准确性,后台服务器将预估特征信息与更新后的兴趣分布信息的进行对比,确定该预估特征信息对象的候选多媒体数据对象的预测点击率更为准确且实时。从而,后台服务器将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象也更为准确且实时。进而,终端接收的多媒体数据推荐信息也更为准确且实时。因此,可以提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,从而提高用户粘度。
在其中一实施例中,接收后台服务器基于目标用户标识反馈的多媒体数据推荐信息之前,还包括:根据目标特征信息与更新前的目标兴趣分布信息的相似度,更新目标兴趣分布信息,得到更新后的目标兴趣分布信息;将更新后的目标兴趣分布信息发送至后台服务器。
在本实施例中,终端根据目标特征信息与更新前的目标兴趣分布信息的相似度,更新目标兴趣分布信息,得到更新后的目标兴趣分布信息。并且,终端将更新后的目标兴趣分布信息发送至后台服务器。如此,可以节约后台服务器的资源。终端只需在目标兴趣分布信息更新之后,发送更新后的目标兴趣分布信息至后台服务器,使得后台服务器只需要在终端的目标兴趣分布信息有更新的时候,才对服务器端的目标兴趣分布信息进行更新,否则,后台服务器可以沿用之前的目标兴趣分布信息。
在其中一实施例中,将更新后的目标兴趣分布信息发送至后台服务器,包括:在目标特征信息与更新前的目标兴趣分布信息的相似度满足更新推荐条件时,将更新后的目标兴趣分布信息发送至后台服务器。
在本实施例中,在目标特征信息与更新前的目标兴趣分布信息的相似度满足更新推荐条件时,才将更新后的目标兴趣分布信息发送至后台服务器。更新推荐条件是指,需要对用于推荐目标多媒体数据对象的目标多媒体兴趣分布信息需要更新的条件。更新推荐条件可以包括:目标特征信息与更新前的目标兴趣分布信息的相似度小于或者等于预设值。
在本实施例中,终端需要在目标特征信息与更新前的目标兴趣分布信息的相似度满足更新推荐条件时,更新的目标兴趣分布信息才会同步至后台服务器;否则,终端不将更新后的目标兴区分布信息同步至后台服务器,后台服务器继续沿用之前的目标兴趣分布信息。如此,可进一步节约后台服务器的资源。
在其中一实施例中,在多媒体数据对象播放结束时,生成播放记录,包括:在多媒体数据对象播放结束时,记录播放完成度信息;根据播放完成度信息、目标用户标识及对象标识生成播放记录。
在本实施例中,播放记录中还包括播放完成度信息。播放完成度信息为表现多媒体数据对象播放完成情况的信息。如可以通过播放时长来体现,也可以通过播放时长与多媒体数据对象的总时长来体现。具体如,播放完成度信息可以是播放时长除以该总时长而得到的值。
由于多媒体数据对象完成播放可能是在播放了很短的一段时间之后,就因为用户不喜欢而中途切换了其他多媒体对象进行播放,因此,播放完成度信息情况可以在一定程度上体现用户对该多媒体数据对象感兴趣的程度。
基于本实施例的多媒体数据推荐方法,在终端生成的播放记录中,还包括播放完成度信息,可以使得后台服务器,可进一步结合该播放完成度信息对目标用户兴趣分布信息进行更新,如此,可以避免引入用户只播放了一小部分内容就因不感兴趣而结束播放的多媒体数据对象的噪声干扰。从而,使得更新后的目标兴趣信息可以更为准确地体现用户的兴趣分布情况。
进一步地,当播放完成度信息所表示的播放完成度越大时,目标多媒体数据对象的特征信息与目标特征信息的相似度越大。
在本实施例中,播放的多媒体数据对象的播放完成度越大,则表示用户越喜欢。那么,目标多媒体数据对象的特征信息与多媒体数据对象的目标特征信息的相似度也越大。如此,可以避免引入用户只播放了一小部分内容就因不感兴趣而结束播放的多媒体数据对象的噪声干扰。从而,使得更新后的目标兴趣信息可以更为准确地体现用户的兴趣分布情况。
为了更清楚地对本申请的多媒体数据推荐方法进行说明,以下以一个运用于短视频推荐的具体的实施例进行说明。图6示出了一个完整的多媒体数据推荐过程中,终端与后台服务器的基本流程。图7示出了一个完整的多媒体数据推荐过程中终端与后台服务器的时序图。
结合图6与图7,一个实施例的多媒体数据推荐过程包括:
S701,终端通过多媒体数据对象展示界面,接收播放控制指令;
S702,终端根据播放控制指令播放多媒体数据对象,在多媒体数据对象播放结束时,记录播放完成度信息;
S703,终端根据播放完成度信息、目标用户标识及对象标识,生成播放记录,并发送播放记录至后台服务器;后台服务器获取对多媒体数据对象的播放记录;
S704,后台服务器根据目标特征向量与目标兴趣分布向量的相似度,以及播放完成度信息,更新目标用户标识对应的目标兴趣分布向量;其中,当播放完成度信息所表示的播放完成度越大时,目标特征向量对更新目标兴趣分布向量的影响权重越大;当播放完成度信息所表示的播放完成度越大时,目标特征向量对更新目标兴趣分布向量的影响权重越大;
S705,后台服务器根据目标用户标识,获取用户画像;根据用户画像及候选策略,确定候选多媒体数据对象;提取候选多媒体数据对象的预估特征向量;
S706,后台服务器根据更新后的目标兴趣分布向量,对目标点击率预估模型进行更新;该目标点击率预估模型通过训练样本进行模型训练而确定,该训练样本,根据历史的播放记录生成;
S707,通过更新后的目标点击率预估模型,对比预估特征向量与更新后的目标兴趣分布向量,确定预估特征向量对应的候选多媒体数据对象的预测点击率;
S708,后台服务器对候选多媒体数据对象进行打散操作后,将预测点击率满足目标条件的候选多媒体数据对象,确定为推荐的目标多媒体数据对象;
S709,后台服务器基于目标用户标识反馈的多媒体数据推荐信息至终端;接收后台服务器基于目标用户标识反馈的多媒体数据推荐信息;
S710,根据多媒体数据推荐信息,推荐目标多媒体数据对象。
应该理解的是,虽然图2、5、7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、5、7中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种与上述运行于后台服务器的多媒体数据推荐方法对应的多媒体数据推荐装置,包括:
播放记录获取模块802,用于获取对多媒体数据对象的播放记录,所述播放记录包括目标用户标识及所述多媒体数据对象的对象标识;
兴趣信息更新模块804,用于根据目标特征信息与目标兴趣分布信息的相似度,更新所述目标兴趣分布信息;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息,所述目标兴趣分布信息为与所述目标用户标识对应的兴趣分布信息;
点击率预测模块806,用于对比预估特征信息与更新后的所述目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率;
目标对象确定模块808,用于将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象。
由于上述多媒体数据推荐装置,获取对多媒体数据对象的播放记录,所述播放记录包括目标用户标识及所述多媒体数据对象的对象标识;根据目标特征信息与目标兴趣分布信息的相似度,更新所述目标兴趣分布信息;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息,所述目标兴趣分布信息为与所述目标用户标识对应的兴趣分布信息。如此,基于多媒体数据对象的播放记录,对目标兴趣分布信息进行更新,可以保持目标兴趣分布信息的实时性。同时,由于基于目标特征信息与目标兴趣信息的相似度,更新目标兴趣分布信息,因此,可以快速地体现兴趣改变的情况,从而,在保持目标兴趣分布信息实时性的同时提高目标兴趣分布信息的准确性。由于目标兴趣分布信息具有实时性和准确性,将预估特征信息与更新后的兴趣分布信息的进行对比,确定该预估特征信息对象的候选多媒体数据对象的预测点击率更为准确且实时。从而,将预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象也更为准确且实时。因此,可以提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,从而提高用户粘度。
在其中一实施例中,所述播放记录还包括播放完成度信息;
兴趣信息更新模块,用于根据目标特征信息与目标兴趣分布信息的相似度,以及所述播放完成度信息,更新所述目标用户标识对应的所述目标兴趣分布信息。
在其中一实施例中,当所述播放完成度信息所表示的播放完成度越大时,所述目标特征信息对更新所述目标兴趣分布信息的影响权重越大。
在其中一实施例中,当所述目标特征信息与所述目标兴趣分布信息的相似度越小时,所述目标特征信息对更新所述目标兴趣分布信息的影响权重越大。
在其中一实施例中,点击率预测模块,包括:
预估模型更新单元,根据更新后的所述目标兴趣分布信息,对目标点击率预估模型进行更新;
信息输入转化单元,用于通过更新后的所述目标点击率预估模型的输入层,将所述预估特征信息转化为目标预估信息,并将所述目标预估信息与更新后的所述目标兴趣分布信息进行拼接,得到拼接信息;
全连接单元,用于通过更新后的所述目标点击率预估模型的隐藏层,将所述拼接信息进行全连接处理,得到全连接结果;
点击率预测单元,用于通过更新后的所述目标点击率预估模型的输出层,将所述全连接结果映射成预测点击率。
在其中一实施例中,还包括:目标特征信息确定模块,用于根据所述对象标识获取所述多媒体数据对象,提取所述多媒体数据对象的特征向量;当提取到的所述特征向量为稀疏特征向量时,将所述稀疏特征向量转化为低维稠密向量,得到目标特征向量;或者,当提取到的所述特征向量为连续特征向量时,将所述连续特征向量进行离散处理,得到目标特征向量。
在其中一实施例中,还包括:预估特征提取模块,用于根据目标用户标识,获取用户画像;根据所述用户画像及候选策略,确定候选多媒体数据对象;提取所述候选多媒体数据对象的预估特征信息。
在一个实施例中,如图9所示,提供了一种与上述运行于终端的多媒体数据推荐方法对应的多媒体数据推荐装置,包括:
播放指令接收模块902,用于通过多媒体数据对象展示界面,接收播放控制指令,所述播放控制指令包括所述多媒体数据对象的对象标识;
播放记录生成模块904,用于在所述多媒体数据对象播放结束时,生成播放记录;所述播放记录包括目标用户标识及所述对象标识;
推荐信息接收模块906,用于接收后台服务器基于所述目标用户标识反馈的多媒体数据推荐信息;所述多媒体数据推荐信息,由所述后台服务器根据目标多媒体数据对象生成并发送;所述后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率,并将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息;
多媒体对象推荐模块908,用于根据所述多媒体数据推荐信息,推荐所述目标多媒体数据对象。
基于本实施例的多媒体数据推荐装置,通过多媒体数据对象展示界面,接收播放控制指令,所述播放控制指令包括所述多媒体数据对象的对象标识;在所述多媒体数据对象播放结束时,生成播放记录;所述播放记录包括目标用户标识及所述对象标识;接收后台服务器基于所述目标用户标识反馈的多媒体数据推荐信息;所述多媒体数据推荐信息,由所述后台服务器根据目标多媒体数据对象生成并发送;所述后台服务器对比预估特征信息与更新后的目标兴趣分布信息,确定所述预估特征信息对应的候选多媒体数据对象的预测点击率,并将所述预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象;其中,更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定;所述目标特征信息为与所述对象标识所标识的所述多媒体数据对象的特征信息;根据所述多媒体数据推荐信息,推荐所述目标多媒体数据对象。
由于更新后的所述目标兴趣分布信息根据目标特征信息与更新前的所述目标兴趣分布信息的相似度进行更新确定,如此,基于多媒体数据对象的播放记录,对目标兴趣分布信息进行更新,可以保持目标兴趣分布信息的实时性。同时,由于基于目标特征信息与目标兴趣信息的相似度,更新目标兴趣分布信息,因此,可以快速地体现兴趣改变的情况,从而,在保持目标兴趣分布信息实时性的同时提高目标兴趣分布信息的准确性。由于目标兴趣分布信息具有实时性和准确性,后台服务器将预估特征信息与更新后的兴趣分布信息的进行对比,确定该预估特征信息对象的候选多媒体数据对象的预测点击率更为准确且实时。从而,后台服务器将预测点击率满足目标条件的所述候选多媒体数据对象,确定为推荐的目标多媒体数据对象也更为准确且实时。进而,终端接收的多媒体数据推荐信息也更为准确且实时。因此,可以提高推荐的目标多媒体数据对象在终端被曝光之后被点击播放的概率,从而提高用户粘度。
在其中一实施例中,还包括:
兴趣信息更新模块,用于根据所述目标特征信息与更新前的所述目标兴趣分布信息的相似度,更新所述目标兴趣分布信息,得到更新后的所述目标兴趣分布信息;
兴趣信息同步模块,用于将更新后的所述目标兴趣分布信息发送至后台服务器。
在其中一实施例中,兴趣信息同步模块,用于在所述目标特征信息与更新前的所述目标兴趣分布信息的相似度满足更新推荐条件时,将更新后的所述目标兴趣分布信息发送至后台服务器。
在其中一实施例中,还包括:完成度记录模块;
完成度记录模块,用于在所述多媒体数据对象播放结束时,记录播放完成度信息;
播放记录生成模块,用于根据所述播放完成度信息、所述目标用户标识及所述对象标识生成播放记录。
在其中一实施例中,当所述播放完成度信息所表示的播放完成度越大时,所述目标多媒体数据对象的特征信息与所述目标特征信息的相似度越大。
如图10所示,在一个实施例中,提供了一种计算机设备,该计算机设备可以是后台服务器,也可以终端。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的计算机设备通过网络连接通信。该计算机程序被处理器执行时以实现一种多媒体数据推荐方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施方式中,提供了一种计算机设备。该计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述多媒体数据推荐方法的步骤。
在一个实施方式中,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述多媒体数据推荐方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。