CN106454400B - 一种面向网络电视用户的时序主题偏好预测方法 - Google Patents
一种面向网络电视用户的时序主题偏好预测方法 Download PDFInfo
- Publication number
- CN106454400B CN106454400B CN201610838513.9A CN201610838513A CN106454400B CN 106454400 B CN106454400 B CN 106454400B CN 201610838513 A CN201610838513 A CN 201610838513A CN 106454400 B CN106454400 B CN 106454400B
- Authority
- CN
- China
- Prior art keywords
- user
- programme
- theme
- time slice
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 12
- 230000003203 everyday effect Effects 0.000 claims abstract description 6
- AYEKOFBPNLCAJY-UHFFFAOYSA-O thiamine pyrophosphate Chemical compound CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N AYEKOFBPNLCAJY-UHFFFAOYSA-O 0.000 claims description 6
- 238000000605 extraction Methods 0.000 abstract description 2
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/251—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
一种面向网络电视用户的时序主题偏好预测方法,通过提取用户d天观看电视节目的基本数据,将用户观看电视节目的时间d分为N时间片段,使用隐含狄利克雷分布(LDA)模型进行分析得到n个关于电视节目的主题以及电视节目在不同主题下的概率分布;运用最高分布概率替换原则,得到用户在不同时间片段的主题偏好,结合用户时序主题偏好及主题下电视节目的分布预测用户每一天各个时间片段里可能观看的电视节目以及用户特征,有利于电视运营商为用户提供高质量用户体验服务,有利于电视运营商结合用户特征推广增值服务及第三方商业服务,提高经济效益。本发明通过对提取的数据先进行清理,清除了一些实用性不强的数据,从而提高了预测结果的可靠性。
Description
技术领域
本发明涉及一种网络电视用户预测技术领域,尤其是一种面向网络电视用户的时序主题偏好预测方法。
背景技术
随着交互式网络电视(Internet Protocol Television,IPTV)产业的快速发展,网络电视用户数不断增长,电视节目源随之增加。把握用户的节目偏好,为用户及时推荐感兴趣的电视节目,有利于网络电视运营商提供优质用户体验,吸引用户资源,防止用户流失。用户的节目主题偏好往往能够体现出网络电视用户的家庭成员组成结构、家庭成员兴趣等特征,通过分析用户的主题偏好有利于运营商针对用户的家庭成员组成结构、用户兴趣提供相应的增值服务,甚至是为用户提供第三方服务,有利于提高运营商的经济效益。
现有的预测电视用户观看节目行为的方法有:1)、多用户上下文识别的节目推荐,2)、基于协同过滤的电视节目推荐等,以上方法在一定程度上预测了用户的节目偏好,并进行相似节目的推荐,但其存在一定的缺点,(1)、是用户在一天中各个时间区间的节目偏好不同,即便用户偏好某一个电视节目,但是因为推荐的时间点不恰当;(2)、分析用户的节目偏好,预测用户可能喜欢的节目,只能为用户推荐电视节目。
发明内容
针对现有技术的不足,本发明提供一种面向网络电视用户的时序主题偏好预测方法,该方法能够准确预测电视用户在不同时间段的电视节目偏好。
本发明的技术方案为:一种面向网络电视用户的时序主题偏好预测方法,其特征在于,包括以下步骤:
1)通过网络电视运营商服务器抓取用户d天内观看网络电视节目的基本数据,其中每一天的记录时间为00:00:00到23:59:59;
2)、针对抓取的基本数据设置电视节目观看最小时间tmin、时间区间长度L、电视节目的主题Tk(k=1,2,...n)的数量n;
3)、根据用户观看每条电视节目的起始时间和结束时间分别计算出每条电视节目的观看时间t,如果t<tmin,则删除该条电视节目;
4)、将d天的每一天按照从00:00:00到23:59:59依次等分成N个时间片段,从而得到d天的时间片段集Sj,i={s1,1,s1,2,...s1,i,s2,1,s2,2,...s2,i,...sj,2,...sj,i},其中sj,i表示第i(i=1,2,...d)天的第j(j=1,2,...N)个时间片段,sj={sj,1,sj,2,...sj,i}表示第j(j=1,2,...N)个时间片段,通过时间片段集Sj,i={s1,1,s1,2,...s1,i,s2,1,s2,2,...s2,i,...sj,2,...sj,i}与用户观看电视节目的天数d构建得到每个用户d天观看电视节目集Q={q1,1,q1,2,...q1,j,q2,1,q2,2,...q2,j,...qi,2,...qi,j},其中,qi,j表示该用户在第i天的第j个时间片段sj,i里观看的电视节目集;
5)、利用隐含狄利克雷分布(LDA)模型对电视节目集Q进行分析,得到n个关于电视节目的主题Tk(k=1,2,...n),以及每个电视节目分别落在主题Tk(k=1,2,...n)下的概率TPP={P1,1,…P1,k,…,P1,n,…,Pp,1,…Pp,k,…,Pp,n},其中,Pp,k表示电视节目p落在主题Tk下的概率;
6)、对每个主题Tk(k=1,2,...n)下的电视节目按照其在该主题Tk(k=1,2,...n)下的概率TPP从大到小依次进行排序,选取该主题Tk(k=1,2,...n)下前5个电视节目作为该主题Tk(k=1,2,...n)下隐含的偏好电视节目,并将该偏好电视节目的特征作为该主题Tk(k=1,2,...n)隐含的特征;
7)、对于步骤4中得到的每个用户观看电视节目集Q的每个元素qi,j中的电视节目p,根据其在n个主题Tk(k=1,2,...n)下的概率分布为{Pp,1,…,Pp,n},当则将该电视节目p替换为其对应的主题Tk(k=1,2,...n);
8)、根据得到用户在各个时间片段中各个主题Tk(k=1,2,...n)的分布比例,其中,Count(Tk|sj)表示主题Tk(k=1,2,...n)在第j个时间片段sj={sj,1,sj,2,...sj,i}出现的总次数;
9)、将步骤9中得到的该用户在第j个时间片段sj={sj,1,sj,2,...sj,i}里观看的主题Tk(k=1,2,...n)的分布比例按照从大到小进行排序,选取前m个分布比例累加和大于0.8的主题Tk(k=1,2...n)作为用户在该时间片段sj={sj,1,sj,2,...sj,i}内的偏好主题,从而得到每个时间片段的m个偏好主题;
10)、将步骤9中得到的每个时间片段的偏好主题以及该偏好主题下的5个偏好电视节目、偏好节目特征作为预测结果。
本发明的有益效果为:通过对提取的数据先进行清理,清除了一些实用性不强的数据,从而提高了预测结果的可靠性,通过LDA模型能够获得若干个主题,得到每一个主题隐含的用户特征,通过将一天划分为N个时间片段,细化了预测用户节目偏好的时间片段,不仅提高了电视节目偏好预测在时间上的精准性,并且结合电视节目主题体现的用户特征可以分析得到用户家庭成员结构以及兴趣特征,有利于电视运营商为用户提供高质量用户体验服务,有利于电视运营商结合用户特征推广增值服务及第三方商业服务,提高经济效益。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
如图1所示,一种面向网络电视用户的时序主题偏好预测方法,其特征在于,包括以下步骤:
1)通过网络电视运营商服务器抓取用户d天内观看网络电视节目的基本数据,其中每一天的记录时间为00:00:00到23:59:59;
2)、针对抓取的基本数据设置电视节目观看最小时间tmin、时间区间长度L、电视节目的主题Tk(k=1,2,...n)的数量n;
3)、根据用户观看每条电视节目的起始时间和结束时间分别计算出每条电视节目的观看时间t,如果t<tmin,则删除该条电视节目;
4)、将d天的每一天按照从00:00:00到23:59:59依次等分成N个时间片段,从而得到d天的时间片段集Sj,i={s1,1,s1,2,...s1,i,s2,1,s2,2,...s2,i,...sj,2,...sj,i},其中sj,i表示第i(i=1,2,...d)天的第j(j=1,2,...N)个时间片段,sj={sj,1,sj,2,...sj,i}表示第j(j=1,2,...N)个时间片段,通过时间片段集Sj,i={s1,1,s1,2,...s1,i,s2,1,s2,2,...s2,i,...sj,2,...sj,i}与用户观看电视节目的天数d构建得到每个用户d天观看电视节目集Q={q1,1,q1,2,...q1,j,q2,1,q2,2,...q2,j,...qi,2,...qi,j},其中,qi,j表示该用户在第i天的第j个时间片段sj,i里观看的电视节目集;
5)、利用隐含狄利克雷分布(LDA)模型对电视节目集Q进行分析,得到n个关于电视节目的主题Tk(k=1,2,...n),以及每个电视节目分别落在主题Tk(k=1,2,...n)下的概率TPP={P1,1,…P1,k,…,P1,n,…,Pp,1,…Pp,k,…,Pp,n},其中,Pp,k表示电视节目p落在主题Tk下的概率;
6)、对每个主题Tk(k=1,2,...n)下的电视节目按照其在该主题Tk(k=1,2,...n)下的概率TPP从大到小依次进行排序,选取该主题Tk(k=1,2,...n)下前5个电视节目作为该主题Tk(k=1,2,...n)下隐含的偏好电视节目,并将该偏好电视节目的特征作为该主题Tk(k=1,2,...n)隐含的特征;
7)、对于步骤4中得到的每个用户观看电视节目集Q的每个元素qi,j中的电视节目p,根据其在n个主题Tk(k=1,2,...n)下的概率分布为{Pp,1,…,Pp,n},当则将该电视节目p替换为其对应的主题Tk(k=1,2,...n);
8)、根据得到用户在各个时间片段中各个主题Tk(k=1,2,...n)的分布比例,其中,Count(Tk|sj)表示主题Tk(k=1,2,...n)在第j个时间片段sj={sj,1,sj,2,...sj,i}出现的总次数;
9)、将步骤9中得到的该用户在第j个时间片段sj={sj,1,sj,2,...sj,i}里观看的主题Tk(k=1,2,...n)的比例按照从大到小进行排序,选取前m个比例累加和大于0.8的主题Tk(k=1,2...n)作为用户在该时间片段sj={sj,1,sj,2,...sj,i}内的偏好主题,从而得到每个时间片段的偏好主题;10)、将步骤9中得到的每个时间片段的偏好主题以及该偏好主题下的5个偏好电视节目、偏好节目特征作为预测结果。
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (1)
1.一种面向网络电视用户的时序主题偏好预测方法,其特征在于,包括以下步骤:
1)通过网络电视运营商服务器抓取用户d天内观看网络电视节目的基本数据,其中每一天的记录时间为00:00:00到23:59:59;
2)、针对抓取的基本数据设置电视节目观看最小时间tmin、时间区间长度L、电视节目的主题Tk(k=1,2,...n)的数量n;
3)、根据用户观看每条电视节目的起始时间和结束时间分别计算出每条电视节目的观看时间t,如果t<tmin,则删除该条电视节目;
4)、将d天的每一天按照从00:00:00到23:59:59依次等分成N个时间片段,从而得到d天的时间片段集Sj,i={s1,1,s1,2,...s1,i,s2,1,s2,2,...s2,i,...sj,2,...sj,i},其中sj,i表示第i(i=1,2,...d)天的第j(j=1,2,...N)个时间片段,sj={sj,1,sj,2,...sj,i}表示第j(j=1,2,...N)个时间片段,通过时间片段集Sj,i={s1,1,s1,2,...s1,i,s2,1,s2,2,...s2,i,...sj,2,...sj,i}与用户观看电视节目的天数d构建得到用户d天观看的电视节目集Q={q1,1,q1,2,...q1,j,q2,1,q2,2,...q2,j,...qi,2,...qi,j},其中,qi,j表示该用户在第i天的第j个时间片段sj,i里观看的电视节目集;
5)、利用隐含狄利克雷分布(LDA)模型对电视节目集Q进行分析,得到n个关于电视节目的主题Tk(k=1,2,...n),以及每个电视节目分别落在主题Tk(k=1,2,...n)下的概率TPP={P1,1,…P1,k,…,P1,n,…,Pp,1,…Pp,k,…,Pp,n},其中,Pp,k表示电视节目p落在主题Tk下的概率;
6)、对每个主题Tk(k=1,2,...n)下的电视节目按照其在该主题Tk(k=1,2,...n)下的概率TPP从大到小依次进行排序,选取该主题Tk(k=1,2,...n)下前5个电视节目作为该主题Tk(k=1,2,...n)下隐含的偏好电视节目,并将该偏好电视节目的特征作为该主题Tk(k=1,2,...n)隐含的特征;
7)、对于步骤4)中得到的每个用户观看电视节目集Q的每个元素qi,j中的电视节目p,根据其在n个主题Tk(k=1,2,...n)下的概率分布为{Pp,1,…,Pp,n},当则将该电视节目p替换为其对应的主题Tk(k=1,2,...n);
8)、根据得到用户在各个时间片段中各个主题Tk(k=1,2,...n)的分布比例,其中,Count(Tk|sj)表示主题Tk(k=1,2,...n)在第j个时间片段sj={sj,1,sj,2,...sj,i}出现的总次数;
9)、将步骤8)中得到的该用户在第j个时间片段sj={sj,1,sj,2,...sj,i}里观看的主题Tk(k=1,2,...n)的分布比例按照从大到小进行排序,选取前m个分布比例累加和大于0.8的主题Tk(k=1,2...n)作为用户在该时间片段sj={sj,1,sj,2,...sj,i}内的偏好主题,从而得到每个时间片段的m个偏好主题;
10)、将步骤9)中得到的每个时间片段的偏好主题以及该偏好主题下的5个偏好电视节目、偏好节目特征作为预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610838513.9A CN106454400B (zh) | 2016-09-20 | 2016-09-20 | 一种面向网络电视用户的时序主题偏好预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610838513.9A CN106454400B (zh) | 2016-09-20 | 2016-09-20 | 一种面向网络电视用户的时序主题偏好预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106454400A CN106454400A (zh) | 2017-02-22 |
CN106454400B true CN106454400B (zh) | 2019-09-13 |
Family
ID=58166826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610838513.9A Active CN106454400B (zh) | 2016-09-20 | 2016-09-20 | 一种面向网络电视用户的时序主题偏好预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106454400B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108965937A (zh) * | 2018-06-27 | 2018-12-07 | 广东技术师范学院 | 一种面向网络电视家庭用户的动态兴趣模型构建方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102957969A (zh) * | 2012-05-18 | 2013-03-06 | 华东师范大学 | 为iptv终端用户推荐节目的装置及方法 |
CN103533393A (zh) * | 2013-09-17 | 2014-01-22 | 上海交通大学 | 基于家庭收视纪录的家庭分析及节目推荐方法 |
CN103546773A (zh) * | 2013-08-15 | 2014-01-29 | Tcl集团股份有限公司 | 电视节目的推荐方法及其系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2202655A1 (en) * | 2008-12-23 | 2010-06-30 | Axel Springer Digital TV Guide GmbH | Biased recommender system |
-
2016
- 2016-09-20 CN CN201610838513.9A patent/CN106454400B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102957969A (zh) * | 2012-05-18 | 2013-03-06 | 华东师范大学 | 为iptv终端用户推荐节目的装置及方法 |
CN103546773A (zh) * | 2013-08-15 | 2014-01-29 | Tcl集团股份有限公司 | 电视节目的推荐方法及其系统 |
CN103533393A (zh) * | 2013-09-17 | 2014-01-22 | 上海交通大学 | 基于家庭收视纪录的家庭分析及节目推荐方法 |
Non-Patent Citations (2)
Title |
---|
基于置信用户偏好模型的电视推荐系统;任品;《现代电子技术》;20140815;第37卷;全文 * |
基于贝叶斯网的智能节目推荐方法;章志凌,吴刚,肖君,夏雨仁;《计算机应用与软件》;20071031;第24卷;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN106454400A (zh) | 2017-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103209342B (zh) | 一种引入视频流行度和用户兴趣变化的协作过滤推荐方法 | |
CN103686382B (zh) | 一种节目推荐方法 | |
CN102263999B (zh) | 基于人脸识别对电视节目自动分类的方法及其系统 | |
CN105404700B (zh) | 一种基于协同过滤的视频栏目推荐系统及推荐方法 | |
CN103533393B (zh) | 基于家庭收视纪录的家庭分析及节目推荐方法 | |
CN104699705B (zh) | 信息推送方法、服务器及系统 | |
CN110430471A (zh) | 一种基于瞬时计算的电视推荐方法和系统 | |
CN104394471A (zh) | 一种智能推荐用户喜爱节目的方法 | |
CN106791966B (zh) | 一种基于改进型关联规则的直播间推荐方法及系统 | |
CN109636481A (zh) | 面向家庭用户的用户画像构建方法及装置 | |
CN104581400A (zh) | 视频内容处理方法及装置 | |
JP2020526088A (ja) | オーディオ・ビジュアルコンテンツプログラムの視聴者に関する情報を決定する方法、装置、コンピュータプログラム及びシステム | |
CN102307315B (zh) | Iptv系统中用户行为分析装置及实现分析应用的系统 | |
CN103577593A (zh) | 一种基于微博热门话题的视频聚合方法及系统 | |
CN107404658A (zh) | 一种交互式网络电视系统及用户数据实时获取方法 | |
CN102244811A (zh) | 一种电视频道推荐系统及推荐方法 | |
CN105306972A (zh) | 电视节目的推荐方法及服务器 | |
CN105163142A (zh) | 一种用户偏好确定方法、视频推荐方法和系统 | |
CN105183925A (zh) | 内容关联推荐方法及装置 | |
CN103997662A (zh) | 节目推送的方法及系统 | |
CN107370827A (zh) | 主动推送个性化服务的系统 | |
CN106028070A (zh) | 直播或轮播频道推荐方法、装置及视频服务器 | |
CN106612461A (zh) | 产品包的推荐方法、装置及系统 | |
CN106454400B (zh) | 一种面向网络电视用户的时序主题偏好预测方法 | |
Vandersmissen et al. | The rise of mobile and social short-form video: an in-depth measurement study of vine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |