CN114756762A - 数据处理方法、装置、设备、存储介质及程序产品 - Google Patents
数据处理方法、装置、设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN114756762A CN114756762A CN202210662836.2A CN202210662836A CN114756762A CN 114756762 A CN114756762 A CN 114756762A CN 202210662836 A CN202210662836 A CN 202210662836A CN 114756762 A CN114756762 A CN 114756762A
- Authority
- CN
- China
- Prior art keywords
- information
- recommended
- target
- recommendation
- vertex
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000013507 mapping Methods 0.000 claims abstract description 125
- 238000012545 processing Methods 0.000 claims abstract description 98
- 230000002452 interceptive effect Effects 0.000 claims abstract description 83
- 238000000034 method Methods 0.000 claims abstract description 58
- 230000004927 fusion Effects 0.000 claims abstract description 51
- 230000004931 aggregating effect Effects 0.000 claims abstract description 19
- 230000000875 corresponding effect Effects 0.000 claims description 217
- 238000006243 chemical reaction Methods 0.000 claims description 118
- 230000003993 interaction Effects 0.000 claims description 91
- 230000002159 abnormal effect Effects 0.000 claims description 37
- 238000004220 aggregation Methods 0.000 claims description 33
- 230000002776 aggregation Effects 0.000 claims description 32
- 230000015654 memory Effects 0.000 claims description 23
- 230000002596 correlated effect Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 230000002708 enhancing effect Effects 0.000 claims description 5
- 230000002441 reversible effect Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 34
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 15
- 238000012549 training Methods 0.000 description 12
- 230000007246 mechanism Effects 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241001235534 Graphis <ascomycete fungus> Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 229940037201 oris Drugs 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种数据处理方法、装置、设备、存储介质及程序产品,应用于云技术、人工智能、智慧交通、游戏和车载等各种信息推荐场景;该数据处理方法包括:获取待推荐对象对应的待推荐对象特征,待推荐对象特征通过待推荐对象的目标二阶信息所对应的非线性映射结果获得,目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个推荐信息为每个互动对象所转化的信息;获取待推荐信息对应的待推荐信息特征,待推荐信息为互动对象所转化的任一推荐信息;基于待推荐对象特征和待推荐信息特征的融合结果,对待推荐对象进行信息推荐。通过本申请,能够提升信息推荐的准确度。
Description
技术领域
本申请涉及人工智能领域中的信息推荐技术,尤其涉及一种数据处理方法、装置、设备、存储介质及程序产品。
背景技术
冷启动对象是指信息推荐时,转化次数为零的对象;由于冷启动用户所转化的推荐信息的数量为零,因此,转化对象与待推荐信息对应的转化二部图中,冷启动对象对应的顶点为孤立顶点;然而,孤立顶点在图神经网络中因为没有任何边的连接,信息无法有效传播,从而冷启动场景中无法确定转化概率,导致信息推荐的准确率较低,进而导致信息推荐的资源消耗较大。
发明内容
本申请实施例提供一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品,能够提升信息推荐的准确率,降低信息推荐的资源消耗。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种数据处理方法,包括:
获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
本申请实施例提供一种数据处理装置,包括:
特征获取模块,用于获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
所述特征获取模块,还用于获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
信息推荐模块,用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
在本申请实施例中,所述特征获取模块,还用于获取所述待推荐对象对应的所述目标二阶信息;获取所述目标二阶信息与指定中心信息之间的空间距离,其中,所述指定中心信息是通过多个对象二阶信息确定的,所述多个对象二阶信息包括所述目标二阶信息;基于多个指定映射参数对所述空间距离进行非线性映射,得到多个待融合二阶特征,其中,所述指定映射参数表示映射空间范围;基于多个所述待融合二阶特征对应的第一非线性映射结果,得到所述待推荐对象特征,其中,所述目标二阶信息所对应的非线性映射结果包括所述第一非线性映射结果。
在本申请实施例中,所述特征获取模块,还用于获取所述待推荐对象与所述互动对象之间的互动权重,其中,所述互动权重表示所述待推荐对象与所述互动对象之间的亲密度;获取所述互动对象与所述推荐信息之间的转化权重,其中,所述转化权重表示所述互动对象与所述推荐信息之间的转化度;获取所述互动权重与所述对象特征的第一融合结果、以及所述转化权重和所述第一信息特征的第二融合结果;将至少一个所述互动对象对应的至少一个所述第一融合结果、以及每个所述互动对象所转化的至少一个推荐信息对应的至少一个所述第二融合结果,组合为所述待推荐对象对应的所述目标二阶信息。
在本申请实施例中,所述数据处理装置还包括对象判断模块,用于获取所述待推荐对象对待推荐信息库的转化标识,其中,所述待推荐信息库包括每个所述互动对象所转化的至少一个所述推荐信息。
在本申请实施例中,所述特征获取模块,还用于当所述转化标识表示所述待推荐信息库中包括所述待推荐对象对应的至少一个已转化信息时,获取所述待推荐对象对应的目标一阶信息,其中,所述目标一阶信息通过聚合至少一个所述已转化信息分别对应的第二信息特征获得;将所述目标一阶信息对应的第二非线性映射结果与所述目标二阶信息对应的第一非线性映射结果,组合为所述待推荐对象对应的所述待推荐对象特征。
在本申请实施例中,所述特征获取模块,还用于对所述目标一阶信息对应的所述第二非线性映射结果、以及所述目标二阶信息对应的所述第一非线性映射结果进行组合,得到初始聚合信息;获取与所述初始聚合信息负相关、且与所述第一非线性映射结果正相关的第一组合权重,并获取所述第一组合权重对应的第二组合权重;对所述第一组合权重与所述第二非线性映射结果的融合结果、以及所述第二组合权重与所述第一非线性映射结果的融合结果进行组合,得到所述待推荐对象特征。
在本申请实施例中,所述特征获取模块,还用于当所述转化标识表示转化对象库与所述待推荐对象独立时,将所述目标二阶信息对应的所述第二非线性映射结果,确定为所述待推荐对象对应的所述待推荐对象特征,其中,所述转化对象库是指对所述待推荐信息库中的所述推荐信息进行转化的对象集合。
在本申请实施例中,所述待推荐对象特征和所述待推荐信息特征通过指定异构图获得,其中,所述数据处理装置还包括模型训练模块,用于基于至少两个第一对象之间的互动记录,构建对象互动图,其中,至少两个所述第一对象包括所述待推荐对象和至少一个所述互动对象;基于至少一个第二对象对至少一个初始推荐信息的转化记录,构建对象信息转化图,其中,至少一个所述初始推荐信息包括每个所述互动对象所转化的至少一个所述推荐信息;基于至少两个所述第一对象和至少一个所述第二对象之间的共同对象,对所述对象互动图和所述对象信息转化图进行融合,得到待更新异构图;基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述待更新异构图中的对象顶点;将迭代更新后的所述待更新异构图,确定为所述指定异构图。
在本申请实施例中,所述模型训练模块,还用于基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,更新所述待更新异构图中的对象顶点,得到当前异构图;对所述当前异构图中的边权重进行注意力更新,得到待更新边权重;对所述待更新边权重进行自适应增强,得到所述当前异构图中的目标边权重;基于所述目标边权重,聚合出所述当前异构图中每个当前对象顶点的二阶信息;基于所述当前对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述当前异构图中的对象顶点,得到所述指定异构图。
在本申请实施例中,所述模型训练模块,还用于获取所述当前异构图中每个所述当前对象顶点对应的至少一个相邻对象顶点;基于至少一个所述相邻对象顶点,确定所述当前对象顶点与每个所述相邻对象顶点之间的注意力互动权重;获取所述当前对象顶点对应的至少一个相邻信息顶点;基于至少一个所述相邻信息顶点,确定所述当前对象顶点与每个所述相邻信息顶点之间的注意力转化权重,其中,所述待更新边权重为所述注意力互动权重或所述注意力转化权重。
在本申请实施例中,所述模型训练模块,还用于获取与目标待更新边权重相邻、且与目标待更新边权重类型不同的至少一个所述待更新边权重,其中,所述目标待更新边权重为任一所述待更新边权重;基于至少一个所述待更新边权重,增强所述目标待更新边权重,得到所述当前异构图中的目标边权重。
在本申请实施例中,所述信息推荐模块,还用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,确定所述待推荐对象对所述待推荐信息进行转化的转化概率;当待推荐信息库包括至少两个所述待推荐信息时,基于所述待推荐对象对至少两个所述待推荐信息的至少两个所述转化概率,对至少两个待推荐信息进行倒序排列,得到待推荐信息序列;从所述待推荐信息序列中依次选择指定数量的所述待推荐信息,得到目标待推荐信息;向所述待推荐对象推荐所述目标待推荐信息。
本申请实施例提供一种数据处理设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的数据处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,所述可执行指令用于被处理器执行时,实现本申请实施例提供的数据处理方法。
本申请实施例提供一种计算机程序产品,包括计算机程序或指令,所述计算机程序或指令被处理器执行时,实现本申请实施例提供的数据处理方法。
本申请实施例至少具有以下有益效果:通过获取待推荐对象对应的目标二阶信息,并基于目标二阶信息的非线性映射结果确定待推荐对象特征的过程中;由于目标二阶信息不仅包括对象之间的交互,还包括对象与推荐信息之间的交互,是一种异质信息,因此,通过对目标二阶信息进行非线性映射来获得待推荐对象对应的待推荐对象特征,使得待推荐对象与推荐信息建立了准确的关联,从而能够准确地确定是否向待推荐对象推荐任一推荐信息,能够提升转化概率的准确度;因此,即使是冷启动用户,也能够提升信息推荐的准确率,降低信息推荐的资源消耗。
附图说明
图1是本申请实施例提供的信息推荐系统的架构示意图;
图2是本申请实施例提供的图1中的一种服务器的组成结构示意图;
图3是本申请实施例提供的数据处理方法的流程示意图;
图4是本申请实施例提供的模型训练的流程示意图;
图5是本申请实施例提供的一种示例性的信息推荐流程示意图;
图6是本申请实施例提供的一种示例性的点击二部图的示意图;
图7是本申请实施例提供的一种示例性的社交图的示意图;
图8是本申请实施例提供的一种示例性的异构图的示意图;
图9是本申请实施例提供的一种示例性的异质信息聚合示意图;
图10是本申请实施例提供的另一种示例性的异质信息聚合示意图;
图11是本申请实施例提供的一种示例性的权重更新示意图;
图12是本申请实施例提供的一种示例性的模型性能对比示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本申请实施例所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本申请实施例中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)人工智能(Artificial Intelligence,AI),是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
2)机器学习(Machine Learning,ML),是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析和算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能;重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习通常包括人工神经网络、置信网络、强化学习、迁移学习和归纳学习等技术。
3)人工神经网络,是一种模仿生物神经网络结构和功能的数学模型,本申请实施例中人工神经网络的示例性结构包括图卷积网络(Graph Convolutional Network,GCN)、深度神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional NeuralNetwork,CNN)和循环神经网络(Recurrent Neural Network,RNN)、神经状态机(NeuralState Machine,NSM)和相位函数神经网络(Phase-Functioned Neural Network,PFNN)等。本申请实施例中所涉及的指定异构图和待更新异构图即为人工神经网络对应的模型。
4)云计算(Cloud Computing),是一种计算模式,通过将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务;其中,为资源池提供资源的网络被称为“云”,“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。本申请实施例提供的数据处理方法,可通过云计算实现。
5)转化概率(Conversion Rate, CVR),是指成功转化的概率;其中,成功转化包括点击、浏览、下载、购买、运行和注册等,从而,转化概率包括点击概率(Clickthrough Rate,CTR)、浏览概率、下载概率、购买概率、运行概率和注册概率等;比如,广告曝光用户点击广告的概率,广告曝光用户对目标资源进行购买的概率。
6)同质图(Homogeneous Graph),有一种类型的节点和一种类型的边的图;本申请实施例中的对象交互图为同质图。
7)异质图(Heterogeneous Graph),顶点和边的类型中的至少一种大于等于两种的图;本申请实施例中的对象信息转化图、以及指定异构图、待更新异构图均为异质图。
8)二部图(Bipartite Graph),顶点的类型为两种,且边存在于不同类型的顶点之间的图;也就是说,二部图的顶点集包括两个互不相交的子集,且二部图中每条边两端的顶点都属于不同的两个子集,从而同一个子集中的顶点不相邻。在本申请实施例中,对象信息转化图即为二部图,包括对象集合和信息集合,边表示对象对信息成功进行了转化。
9)社交网络服务(Social Networking Service,SNS),通过对象之间的互动将对象连接起来获得的网络结构;其中,互动是指对象之间的社交行为,比如,关注,组队对局,交互虚拟资源等。
需要说明的是,为了进行信息推荐,可通过推荐信息与对象的历史转化关系,确定出对应的推荐策略,然后基于推荐策略在当前的信息推荐过程中进行信息推荐。然而,不同信息推荐周期,信息推荐的对象并不相同;也就是说,当前的待推荐对象可能在推荐信息与对象的历史转化关系中并未出现,是冷启动对象。因此,基于推荐信息与对象的历史转化关系所确定出的推荐策略,无法适用于当前的待推荐对象,导致冷启动场景中信息推荐的准确率较低,进而导致信息推荐的资源消耗较大。
另外,为了进行信息推荐,还可以通过GCN实现,比如,神经网络协同过滤(NeuralGraph Collaborative Filtering,NGCF),简化GCN(LightGCN);其中,NGCF利用对象和信息作为顶点来构建的二部图,并通过消息传播预估转化概率;简化GCN通过去除NGCF中特征转换和非线性操作,来预估转化概率。然而,在包括冷启动用户的信息推荐场景中,由于对待推荐对象所转化的推荐信息的数量为零,因此,待推荐对象与推荐信息对应的二部图中,待推荐对象为孤立顶点;然而,孤立顶点在GCN中没有边的连接,信息无法有效传播,从而冷启动场景中无法确定待推荐对象对推荐信息的转化概率,导致冷启动场景中信息推荐的准确率较低,进而导致信息推荐的资源消耗较大。
此外,为了对冷启动对象进行信息推荐,还可以采用探索(Exploration)和利用(Exploitation)策略。为了对冷启动对象进行信息推荐,又可以采用迁移学习与元学习,也就是通过学习冷启动对象与其他信息推荐场景的推荐信息的转化行为,来通过知识迁移适配到当前的信息推荐场景中的信息推荐上。为了对冷启动对象进行信息推荐,也可以基于知识图谱(Knowledge Graph,KG)来根据推荐信息在KG上的相似性进行关联推荐;也就是说,为冷启动对象推荐的信息,是冷启动对象在KG上的相似对象所转化的推荐信息。为了对冷启动对象进行信息推荐,以及可以采用异质图神经模型将“对象-推荐信息”转化二部图和“对象-对象”社交图作为全图的子图,全图通过两个子图的线性拼接结果,并利用SNS先验知识,对冷启动对象进行信息推荐。然而,采用探索和利用策略对冷启动对象进行信息推荐的过程中,由于冷启动对象对不同类别推荐信息的喜好相同,需要不断试错,找到冷启动对象潜在的共同喜好;同时,也要多推一些已知情况下用户兴趣相关的广告(比如,转化概率大于阈值的广告),来促进用户对广告素材的点击,以实现对冷启动对象的信息推荐。而融合知识图谱和“对象-推荐信息”转化二部图的信息推荐过程中,或者融合社交图和“对象-推荐信息”转化二部图的信息推荐过程中,由于不同图结构上的信息是异质信息,线性运算无法充分衡量用户间的相似性,导致冷启动场景中信息推荐的准确率较低,进而导致信息推荐的资源消耗较大。
基于此,本申请实施例提供一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品,能够提升信息推荐的准确率,降低信息推荐的资源消耗。下面说明本申请实施例提供的设备的示例性应用,本申请实施例提供的设备可以实施为智能手机、智能手表、笔记本电脑、平板电脑、台式计算机、智能家电、机顶盒、智能车载设备、便携式音乐播放器、个人数字助理、专用消息设备、智能语音交互设备、便携式游戏设备和智能音箱等各种类型的终端,也可以实施为服务器。下面,将说明设备实施为服务器时的示例性应用。
参见图1,图1是本申请实施例提供的信息推荐系统的架构示意图;如图1所示,为支撑一个信息推荐应用,在信息推荐系统100中,终端200(示例性示出了终端200-1和终端200-2)通过网络300连接服务器400(称为数据处理设备),网络300可以是广域网或者局域网,又或者是二者的组合。另外,该信息推荐系统100中还包括数据库500,用于向服务器400提供数据支持;并且,图1中示出的为数据库500独立于服务器400的一种情况,此外,数据库500还可以集成在服务器400中,本申请实施例对此不作限定。
终端200,用于在图形界面(示例性示出了图形界面210-1和图形界面210-2)显示目标待推荐信息。
服务器400,用于获取待推荐对象对应的待推荐对象特征,其中,待推荐对象特征通过待推荐对象的目标二阶信息所对应的非线性映射结果获得,目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个互动对象为与待推荐对象互动的对象,至少一个推荐信息为每个互动对象所转化的信息;获取待推荐信息对应的待推荐信息特征,其中,待推荐信息为互动对象所转化的任一推荐信息;基于待推荐对象特征和待推荐信息特征的融合结果,通过网络300向终端200发送向待推荐对象推荐的目标待推荐信息。
在一些实施例中,服务器400可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,ContentDelivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端200可以是智能手机、智能手表、笔记本电脑、平板电脑、台式计算机、智能电视、机顶盒、智能车载设备、便携式音乐播放器、个人数字助理、专用消息设备、便携式游戏设备和智能音箱等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不作限制。
参见图2,图2是本申请实施例提供的图1中的一种服务器的组成结构示意图,图2所示的服务器400包括:至少一个处理器410、存储器450、至少一个网络接口420和用户接口430。服务器400中的各个组件通过总线系统440耦合在一起。可理解,总线系统440用于实现这些组件之间的连接通信。总线系统440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统440。
处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口430包括使得能够呈现媒体内容的一个或多个输出装置431,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口430还包括一个或多个输入装置432,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器450可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器450可选地包括在物理位置上远离处理器410的一个或多个存储设备。
存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器450旨在包括任意适合类型的存储器。
在一些实施例中,存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统451,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块452,用于经由一个或多个(有线或无线)网络接口420到达其他计算机设备,示例性的网络接口420包括:蓝牙、无线相容性认证(Wi-Fi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块453,用于经由一个或多个与用户接口430相关联的输出装置431(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块454,用于对一个或多个来自一个或多个输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的数据处理装置可以采用软件方式实现,图2示出了存储在存储器450中的数据处理装置455,其可以是程序和插件等形式的软件,包括以下软件模块:特征获取模块4551、信息推荐模块4552、对象判断模块4553和模型训练模块4554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在一些实施例中,本申请实施例提供的数据处理装置可以采用硬件方式实现,作为示例,本申请实施例提供的数据处理装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的数据处理方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
在一些实施例中,终端或服务器可以通过运行计算机程序来实现本申请实施例提供的数据处理方法。举例来说,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序,如游戏APP或者视频播放APP;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
下面,将结合本申请实施例提供的数据处理设备的示例性应用和实施,说明本申请实施例提供的数据处理方法。另外,本申请实施例提供的数据处理方法应用于云技术、人工智能、智慧交通和车载等各种信息推荐场景。
参见图3,图3是本申请实施例提供的数据处理方法的流程示意图,将结合图3示出的步骤进行说明。
步骤301、获取待推荐对象对应的待推荐对象特征。
在本申请实施中,数据处理设备在对待推荐对象进行信息推荐时,先确定待推荐对象与推荐信息关联的特征表示,即为待推荐对象特征;其中,至少一个互动对象为待推荐对象所互动的对象中,包括存在转化的推荐信息的对象。
这里,待推荐对象特征可以是实时确定的,也就是说,数据处理设备先针对待推荐对象所互动的至少一个互动对象、以及每个互动对象所转化的至少一个推荐信息,获取每个互动对象的特征表示(称为对象特征)、以及每个推荐信息的特征表示(称为第一信息特征),此时,也就获得了至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征;接着,数据处理设备对至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征进行聚合,也就获得了待推荐对象的目标二阶信息,最后,数据处理设备对目标二阶信息进行非线性映射,也就获得了待推荐对象特征。另外,还可以迭代获取目标二阶信息并对目标二阶信息进行非线性映射,来获得待推荐对象特征。其中,对象特征可以是互动对象的嵌入表示,还可以是互动对象的独热码(One-Hot编码),又可以是互动对象的标签所对应的特征表示,等等,本申请实施例对此不作限定。
待推荐对象特征可以是预先确定好的,也就是说,数据处理设备预先获取包括待推荐对象的各个对象,并迭代地对每个对象的特征表示、以及每个对象转化的每个推荐信息的特征表示先进行聚合再进行非线性映射,来获得包括待推荐对象的各个对象中每个对象的更新后的特征表示,进而也就获得了待推荐对象的待推荐对象特征。
需要说明的是,待推荐对象特征为目标二阶信息所对应的非线性映射结果,目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个互动对象为与待推荐对象互动的对象,至少一个推荐信息为每个互动对象所转化的信息;另外,非线性映射是指提升特征空间维度的处理,比如,基于核函数(比如,高斯核函数)的数据处理等;通过非线性映射,使得非线性映射后的结果相比非线性映射前的数据,特征空间维度更高;也就是说,目标二阶信息为低维特征,待推荐对象特征为高维特征;如此,能够使得待推荐对象与每个推荐信息有效关联,准确地确定对象之间的相似性。此外,待推荐对象和至少一个互动对象所属的领域,还可以与至少一个互动对象与每个互动对象对应的至少一个推荐信息所属的领域相同;比如,均为游戏领域,均为即时通信领域,等等。
步骤302、获取待推荐信息对应的待推荐信息特征。
在本申请实施例中,待推荐信息为互动对象所转化的任一推荐信息,即为每个互动对象所转化的至少一个推荐信息中任一个;这里,数据处理设备获取待推荐信息的特征表示,也就获得了待推荐信息特征。
需要说明的是,待推荐信息特征用于确定待推荐信息是否为可向待推荐对象推荐的信息;另外,待推荐信息特征可以是待推荐信息的嵌入表示,还可以是待推荐信息的独热码(One-Hot编码),又可以是待推荐信息的标签所对应的特征表示,等等,本申请实施例对此不作限定。
步骤303、基于待推荐对象特征和待推荐信息特征的融合结果,对待推荐对象进行信息推荐。
在本申请实施例中,数据处理设备获得了待推荐对象特征和待推荐信息特征之后,基于待推荐对象特征和待推荐信息特征确定是否向待推荐对象推荐该待推荐信息;这里,数据处理设备先对待推荐对象特征和待推荐信息特征进行融合,再利用激活函数(比如,Sigmoid函数)对待推荐对象特征和待推荐信息特征的融合结果进行处理,也就获得了待推荐对象对待推荐信息进行转化的概率,进而基于待推荐对象对待推荐信息进行转化的概率,来确定是否向待推荐对象推荐该待推荐信息,以实现对待推荐对象的信息推荐。
可以理解的是,通过将对象之间的交互信息、以及对象与推荐信息之间的转化信息进行关联,并通过非线性映射来实现准确关联,使得对象与推荐信息之间能够有效交互,进而能够提升信息推荐的准确度。
在本申请实施例中,步骤301可通过步骤3011至步骤3014(图中未示出)实现;也就是说,获取待推荐对象对应的待推荐对象特征,包括步骤3011至步骤3014,下面对各步骤分别进行说明。
步骤3011、获取待推荐对象对应的目标二阶信息。
在本申请实施例中,数据处理设备可以直接基于至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征进行聚合,来获得目标二阶信息;比如,数据处理设备获取至少一个互动对象分别对应的对象特征的第一累加结果,并获取至少一个推荐信息分别对应的第一信息特征的第二累加结果,以及累加第一累加结果和至少一个互动对象对应的至少一个第二累加结果,来获得目标二阶信息。
数据处理设备还可以结合权重来聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征,以获得目标二阶信息。也就是说,数据处理设备获取待推荐对象对应的目标二阶信息,包括:数据处理设备获取待推荐对象与互动对象之间的互动权重,并获取互动对象与推荐信息之间的转化权重;接着,数据处理设备获取互动权重与对象特征的第一融合结果、以及转化权重和第一信息特征的第二融合结果;将至少一个互动对象对应的至少一个第一融合结果、以及每个互动对象所转化的至少一个推荐信息对应的至少一个第二融合结果,组合为待推荐对象对应的目标二阶信息。
需要说明的是,互动权重是指待推荐对象与互动对象之间的权重,表示待推荐对象与互动对象之间的亲密度;转化权重是指互动对象与推荐信息之间的权重,表示互动对象与推荐信息之间的转化度。这里,数据处理设备将互动权重与该互动权重所对应的互动对象的对象特征融合,也就获得了第一融合结果,从而,针对至少一个互动对象,也就获得了至少一个第一融合结果;数据处理设备将转化权重与该转化权重所对应的推荐信息的第一信息特征融合,也就获得了第二融合结果,从而,针对至少一个推荐信息,也就获得了至少一个第二融合结果,也即每个互动对象对应至少一个第二融合结果。另外,组合为目标二阶信息的方式可以是相加,也可以是拼接,又可以是加权融合,等等,本申请实施例对此不作限定。
还需要说明的是,第一叠加结果为数据处理设备直接对至少一个互动对象所对应的至少一个对象特征进行累加获得的;第一融合结果为数据处理设备基于待推荐对象和互动对象之间的亲密度,对至少一个对象特征进行加权累加获得的。第二叠加结果为数据处理设备直接对至少一个推荐信息所对应的至少一个第一信息特征进行累加获得的,第二融合结果为数据处理设备基于互动对象与推荐信息之间的转化度,对至少一个第一信息特征进行加权累加获得的。
可以理解的是,通过结合权重来获得目标二阶信息,进而再通过目标二阶信息获取待推荐对象特征,能够提升目标二阶信息获取的准确度,进而提升待推荐对象特征的准确度,使得待推荐对象特征能够有效与待推荐信息关联,也就能够提升信息推荐的准确度。
步骤3012、获取目标二阶信息与指定中心信息之间的空间距离。
需要说明的是,数据处理设备能够获取到指定中心信息;其中,指定中心信息是通过多个对象二阶信息确定的,多个对象二阶信息包括目标二阶信息,以及多个对象二阶信息中除目标二阶信息之后的其他对象二阶信息,可以是至少一个交互对象分别对应的二阶信息;比如,指定中心信息为所有对象的二阶信息的均值,而二阶信息即为对象所交互的对象的特征、以及每个所交互的对象所转化的信息的特征的聚合结果。
在本申请实施例中,数据处理设备获取目标二阶信息与指定中心信息之间的特征差异,并将特征差异确定为目标二阶信息与指定中心信息之间的空间距离,比如为欧式距离等。
步骤3013、基于多个指定映射参数对空间距离进行非线性映射,得到多个待融合二阶特征。
需要说明的是,数据处理设备能够获得多个指定映射参数,其中,指定映射参数表示映射空间范围,比如为高斯带宽;这里,数据处理设备利用每个指定映射参数对空间距离进行非线性映射,以将空间距离映射到不同的映射空间范围,从而,针对多个指定映射参数,能够得到多个待融合二阶特征。
步骤3014、基于多个待融合二阶特征对应的第一非线性映射结果,得到待推荐对象特征。
在本申请实施例中,数据处理设备获得了多个待融合二阶特征之后,整合多个待融合二阶特征,也就获得了第一非线性映射结果;这里,数据处理设备可以直接将第一非线性映射结果确定为待推荐对象特征,也可以将第一非线性映射结果和其他信息(比如,待推荐对象所互动的对象的信息等)结合为待推荐对象特征,等等,本申请实施例对此不作限定。从而,目标二阶信息所对应的非线性映射结果包括第一非线性映射结果。
在本申请实施例中,步骤301中数据处理设备获取待推荐对象对应的待推荐对象特征之前,该数据处理方法还包括:数据处理设备获取待推荐对象对待推荐信息库的转化标识。
需要说明的是,待推荐信息库包括至少一个互动对象中每个互动对象所转化的至少一个推荐信息;数据处理设备检测待推荐对象对待推荐信息库中每个推荐信息的转化情况,以获得转化标识;其中,转化标识表示待推荐对象是否对待推荐信息库中的推荐信息进行过转化。
相应地,在本申请实施例中,步骤301可通过步骤3015和步骤3016(图中未示出)实现;也就是说,数据处理设备获取待推荐对象对应的待推荐对象特征,包括步骤3015和步骤3016,下面对各步骤分别进行说明。
步骤3015、当转化标识表示待推荐信息库中包括待推荐对象对应的至少一个已转化信息时,数据处理设备获取待推荐对象对应的目标一阶信息。
需要说明的是,当转化标识表示待推荐信息库中包括待推荐对象对应的至少一个已转化信息时,表明待推荐对象对待推荐信息库中的推荐信息进行过转化,且所转化过的推荐信息为至少一个已转化信息,故待推荐对象为非冷启动对象;其中,每个已转化信息为待推荐信息库中被待推荐对象进行过转化的推荐信息;此时,待推荐对象与推荐信息之间的关联还可以通过自身所转化的至少一个已转化信息建立;从而,数据处理设备聚合至少一个已转化信息分别对应的第二信息特征,也就获得了待推荐对象对应的目标一阶信息,也就是说,目标一阶信息通过聚合至少一个已转化信息分别对应的第二信息特征获得。
步骤3016、将目标一阶信息对应的第二非线性映射结果与目标二阶信息对应的第一非线性映射结果,组合为待推荐对象对应的待推荐对象特征。
在本申请实施例中,数据处理设备对目标一阶信息进行非线性映射,也就获得了第二非线性映射结果;其中,数据处理设备对目标一阶信息进行非线性映射的过程,与对目标二阶信息进行非线性映射的过程类似,本申请实施例在此不再重复描述。这里,数据处理设备通过组合第一非线性映射结果和第二非线性映射结果,也就获得了待推荐对象特征;其中,组合方式可以是相加,也可以是加权相加,等等;并且,第一非线性映射结果结合其他信息获得待推荐对象特征的过程中,所结合的其他信息即为第二非线性映射结果。
可以理解的是,当待推荐对象为非冷启动对象时,在基于目标二阶信息获得待推荐对象特征的过程中,结合目标二阶信息对应的第一非线性映射结果的同时,再结合目标一阶信息对应的第二非线性映射结果来实现,提升了获取待推荐对象特征所依据数据的多样性;从而,能够提升待推荐对象特征的准确度,进而能够提升信息推荐的准确度,降低信息推荐的资源消耗。
在本申请实施例中,步骤3016中数据处理设备将目标一阶信息对应的第二非线性映射结果与目标二阶信息对应的第一非线性映射结果,组合为待推荐对象对应的待推荐对象特征,包括:数据处理设备对目标一阶信息对应的第二非线性映射结果、以及目标二阶信息对应的第一非线性映射结果进行组合,得到初始聚合信息;并获取与初始聚合信息负相关、且与第一非线性映射结果正相关的第一组合权重,并获取第一组合权重对应的第二组合权重;以及对第一组合权重与第二非线性映射结果的融合结果、以及第二组合权重与第一非线性映射结果的融合结果进行组合,得到待推荐对象特征。
需要说明的是,数据处理设备可以通过将第一非线性映射结果和第二非线性映射结果进行相加等方式的组合,来实现两者的组合,以获得初始聚合信息;另外,第一组合权重和第二组合权重负相关;此外,数据处理设备可以通过将第一组合权重与第二非线性映射结果的融合结果、以及第二组合权重与第一非线性映射结果的融合结果进行相加等方式的组合,来获得待推荐对象特征。
在本申请实施例中,步骤301中数据处理设备获取待推荐对象对应的待推荐对象特征,包括:当转化标识表示转化对象库与待推荐对象独立时,数据处理设备将目标二阶信息对应的第二非线性映射结果,确定为待推荐对象对应的待推荐对象特征。
需要说明的是,当转化标识表示待推荐信息库对应的转化对象库与待推荐对象独立时,表明待推荐对象未对待推荐信息库中的推荐信息进行过转化,待推荐对象为冷启动对象;也就是说,待推荐对象不属于转化对象库;其中,转化对象库为对待推荐信息库中的待推荐信息进行过转化的对象集合;此时,待推荐对象与推荐信息之间的关联通过目标二阶信息的第二非线性映射结果获得。
在本申请实施例中,待推荐对象特征和待推荐信息特征通过指定异构图获得;其中,指定异构图中,顶点为对象(包括待推荐对象和至少一个互动对象)的特征或推荐信息(包括每个互动对象对应的至少一个推荐信息)的特征,边为对象之间的边,或者对象与推荐信息之间的边;并且,边可以是有权边,也可以是无权边;当边为有权边时,边的权重表示两顶点之间的关联程度,比如对象之间的亲密度,对象与推荐信息之间的转化度;以及,对象的特征通过聚合所关联的对象对应的转化的推荐信息的特征获得。
参见图4,图4是本申请实施例提供的模型训练的流程示意图;如图4所示,指定异构图通过步骤305至步骤309获得,下面对各步骤分别进行说明。
步骤305、基于至少两个第一对象之间的互动记录,构建对象互动图。
需要说明的是,至少两个第一对象包括待推荐对象和至少一个互动对象;数据处理设备所构建的对象互动图中,顶点为第一对象的特征表示,边表示两个第一对象之间存在交互;当边为有权边时,表示基于两个第一对象之间的交互信息(比如,交互次数,交互频率,交互类型等)确定的亲密度。
步骤306、基于至少一个第二对象对至少一个初始推荐信息的转化记录,构建对象信息转化图。
需要说明的是,至少一个初始推荐信息包括每个互动对象所转化的至少一个推荐信息;数据处理设备所构建的对象信息转化图中,顶点为第二对象的特征表示或者初始推荐信息的特征表示,边表示第二对象对初始推荐信息进行过转化;当边为有权边时,边对应的权重表示基于第二对象对初始推荐信息的转化信息(比如,转化次数,转化时长,转化频率,转化类型等)确定的转化度。
步骤307、基于至少两个第一对象和至少一个第二对象之间的共同对象,对对象互动图和对象信息转化图进行融合,得到待更新异构图。
在本申请实施例中,数据处理设备获得了对象互动图和对象信息转化图之后,先获取至少两个第一对象和至少一个第二对象之间的共同对象;接着将共同对象在对象互动图中通过边所关联的第一对象的相关信息,与共同对象在对象信息转化图中通过边所关联的初始推荐信息的相关信息结合,也就得到了待更新异构图;也就是说,待更新异构图中,即包括共同对象与所互动的第一对象之间的互动关系,还包括共同对象与所转化的初始推荐信息之间的转化关系。
步骤308、基于待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新待更新异构图中的对象顶点。
在本申请实施例中,待更新异构图中的顶点,有的为对象顶点,有的为信息顶点;其中,对象顶点为第一对象或第二对象的特征表示,信息顶点为初始推荐信息的特征表示;这里,数据处理设备对待更新异构图的对象顶点进行迭代更新,以完成对待更新异构图的更新;以及,数据处理设备基于每个对象顶点的二阶信息所对应的非线性映射结果,来实现对应对象顶点的更新。
需要说明的是,每个对象顶点的二阶信息包括与该对象顶点所交互的对象相应的对象顶点、以及与所交互的对象所转化的初始推荐信息相应的对象顶点;另外,本申请实施例中的二阶信息通过聚合对象所交互的对象的特征、以及所交互的对象转化的推荐信息的特征获得,从而,目标二阶信息为待推荐对象的二阶信息。
步骤309、将迭代更新后的待更新异构图,确定为指定异构图。
在本申请实施例中,数据处理设备对待更新异构图进行迭代更新,当迭代更新后的待更新异构图达到指定截止条件时,结束迭代更新,并将迭代更新后的待更新异构图,确定为指定异构图。其中,指定截止条件是指当前迭代更新后的待更新异构图能够达到指定指标,比如,准确率大于指定准确率,损失函数值小于指定损失函数值,曲线下面积(AreaUnder Curve,AUC)大于指定面积等。
在本申请实施例中,步骤308可通过步骤3081至步骤3085(图中未示出)实现;也就是说,数据处理设备基于待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新待更新异构图中的对象顶点,包括步骤3081至步骤3085,下面对各步骤分别进行说明。
步骤3081、基于待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,更新待更新异构图中的对象顶点,得到当前异构图。
需要说明的是,数据处理设备获取待更新异构图中每个对象顶点的二阶信息的过程,与获取目标二阶信息的过程类似;并且,数据处理设备获取待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果的过程,与获取目标二阶信息对应的非线性映射结果的过程类似;以及,数据处理设备更新待更新异构图中对象顶点的过程,与基于目标二阶信息所对应的非线性映射结果获得待推荐对象特征的过程类似;本申请实施例在此不再重复描述。
步骤3082、对当前异构图中的边权重进行注意力更新,得到待更新边权重。
在本申请实施例中,数据处理设备对当前异构图中的边权重进行注意力更新,得到待更新边权重,包括:数据处理设备获取当前异构图中每个当前对象顶点对应的至少一个相邻对象顶点,相邻对象顶点为与当前对象顶点相邻的对象顶点;基于至少一个相邻对象顶点,确定当前对象顶点与每个相邻对象顶点之间的注意力互动权重;获取当前对象顶点对应的至少一个相邻信息顶点,相邻信息顶点为与当前对象顶点相邻的信息顶点;基于至少一个相邻信息顶点,确定当前对象顶点与每个相邻信息顶点之间的注意力转化权重;其中,待更新边权重为注意力互动权重或注意力转化权重。
需要说明的是,数据处理设备针对至少一个相邻对象顶点中的每个相邻对象顶点,在至少一个相邻对象顶点中所占的比重,确定注意力互动权重;也就是说,注意力互动权重为每个相邻对象顶点在至少一个相邻对象顶点中所占的比重;数据处理设备针对至少一个相邻对象顶点中的每个相邻信息顶点,在至少一个相邻信息顶点中所占的比重,确定注意力转化权重;也就是说,注意力转化权重为每个相邻信息顶点在至少一个相邻信息顶点中所占的比重。
步骤3083、对待更新边权重进行自适应增强,得到当前异构图中的目标边权重。
在本申请实施例中,数据处理设备对待更新边权重进行自适应增强,得到当前异构图中的目标边权重,包括:数据处理设备获取与目标待更新边权重相邻、且与目标待更新边权重类型不同的至少一个待更新边权重;并基于至少一个待更新边权重,增强目标待更新边权重,得到当前异构图中的目标边权重;其中,目标待更新边权重为任一待更新边权重。
需要说明的是,当目标待更新边权重为注意力互动权重时,数据处理设备获取与注意力互动权重相邻的至少一个注意力转化权重,将每个注意力转化权重与注意力互动权重叠加,得到第一权重叠加和;接着,数据处理设备确定与第一权重叠加和负相关、且与该注意力转化权重正相关的第一增强参数,并通过融合第一增强参数与对应的注意力转化权重获得第一增强权重;最后,数据处理设备将该注意力互动权重与至少一个注意力转化权重对应的至少一个第一增强权重叠加,得到更新后的目标待更新边权重,即为当前异构图中的目标边权重。
当目标待更新边权重为注意力转化权重时,数据处理设备获取与注意力转化权重相邻的至少一个注意力互动权重,将每个注意力互动权重与注意力转化权重叠加,得到第二权重叠加和;接着,数据处理设备确定与第二权重叠加和负相关、且与该注意力互动权重正相关的第二增强参数,并通过融合第二增强参数与对应的注意力互动权重获得第二增强权重;最后,数据处理设备将该注意力转化权重与至少一个注意力互动权重对应的至少一个第二增强权重叠加,得到更新后的目标待更新边权重,即为当前异构图中的目标边权重。
步骤3084、基于目标边权重,聚合出当前异构图中每个当前对象顶点的二阶信息。
需要说明的是,数据处理设备基于目标边权重,获得当前异构图中每个当前对象顶点的二阶信息的过程,与数据处理设备结合互动权重和交互权重获得目标二阶信息的过程类似,本申请实施例在此不再重复描述。
步骤3085、基于当前对象顶点的二阶信息所对应的非线性映射结果,迭代更新当前异构图中的对象顶点,得到指定异构图。
在本申请实施例中,数据处理设备迭代更新当前异构图的过程,与迭代更新异构图的过程类似,本申请实施例在此不再重复描述。
在本申请实施例中,步骤303中数据处理设备基于待推荐对象特征和待推荐信息特征的融合结果,对待推荐对象进行信息推荐,包括:数据处理设备基于待推荐对象特征和待推荐信息特征的融合结果,确定待推荐对象对待推荐信息进行转化的转化概率;当待推荐信息库包括至少两个待推荐信息时,基于待推荐对象对至少两个待推荐信息的至少两个转化概率,对至少两个待推荐信息进行倒序排列,得到待推荐信息序列;从待推荐信息序列中依次选择指定数量的待推荐信息,得到目标待推荐信息;向待推荐对象推荐目标待推荐信息。其中,目标待推荐信息包括至少一个待推荐信息。
需要说明的是,数据处理设备还可以将转化概率与指定概率进行比较,当转化概率大于指定概率时,向待推荐对象推荐该待推荐信息。
在本申请实施例中,当对待更新异构图进行迭代更新时,可以是对异构图中的对象顶点进行更新,还可以是对异构图中所有的顶点(包括对象顶点和信息顶点)进行更新,本申请实施例对此不作限定。并且,数据处理设备对异构图中的信息顶点进行更新的过程,与对象顶点的更新过程类似,本申请实施例对此不再重复描述。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。该示例性应用由服务器(称为数据处理设备)执行,描述了在游戏领域中,先基于历史推荐数据中用户与广告之间的历史点击情况,构建“用户-广告”点击二部图(称为对象信息转化图),并基于用户之间的互动情况,构建“用户-用户”社交图(称为对象互动图);接着,融合点击二部图和社交图,获得异构图,并对异构图中用户对应的顶点进行异质信息聚合,来实现冷启动用户与广告的信息交互,进而针对冷启动用户,能够提升信息推荐准确度。
参见图5,图5是本申请实施例提供的一种示例性的信息推荐流程示意图;如图5所示,该示例性的信息推荐流程包括数据采集阶段5-1、信息聚合阶段5-2和广告推荐阶段5-3。
在数据采集阶段5-1中,采集游戏领域内广告的历史推荐数据,并从历史推荐数据中提取用户对广告点击的数据(称为互动记录),以及基于用户对广告点击的数据构建“用户-广告”点击二部图;在点击二部图中,顶点为用户(称为第二对象)或广告(称为初始推荐信息)的向量表示(称为特征表示),顶点之间的边表示用户对广告进行了点击,以及边的权重表示用户与广告的转化关系,比如,边的权重与用户对广告点击的次数或消费时长正相关。
参见图6,图6是本申请实施例提供的一种示例性的点击二部图的示意图;如图6所示,点击二部图6-1中,顶点A、B、C和D为用户的向量表示,顶点a、b、c和d为广告的向量表示;这里,以顶点B与顶点a的连接为例进行说明:顶点B对应的用户对顶点a对应的广告进行了点击,从而顶点B与顶点a之间存在边,且该边对应的权重为。另外,顶点A分别与顶点a、b、c和d之间无边,在点击二部图6-1中为孤立顶点,从而顶点A对应的用户为冷启动用户(称为冷启动对象);而顶点B、C和D分别对应的用户为非冷启动用户(称为非冷启动对象)。
在数据采集阶段5-1中,还采集游戏领域内的历史社交数据(称为转化记录),并基于历史社交数据构建“用户-用户”社交图;在社交图中,顶点(称为第一对象)为用户的向量表示,顶点之间的边表示两用户进行了互动,比如,虚拟资源交互,组队游戏,交流等,以及边的权重表示两用户互动的亲密度。
参见图7,图7是本申请实施例提供的一种示例性的社交图的示意图;如图7所示,社交图7-1中,顶点A、B、C和D为用户的向量表示;这里,以顶点A分别与顶点B、C、以及D的连接为例进行说明:顶点A对应的用户分别与顶点B对应的用户、C对应的用户和D对应的用户进行了互动,从而顶点A分别与顶点B、C和D之间存在边,且各个边对应的权重分别依次为、和;另外,顶点C与顶点D之间的权重为。
在信息聚合阶段5-2中,首先,融合点击二部图和社交图,得到异构图(称为待更新异构图)。在异构图中,顶点V表示用户和广告分别对应的相邻表示所构成的向量集合,权重W表示用户之间、以及用户和广告之间的权重所构成的标量集合。由于该异构图是通过点击二部图和社交图两个子图融合得到的,所以,异构图G也可以表示为。其中,U为点击二部图中用户的向量表示的全集,u为用户的向量表示的个体,从而;I为社交图中广告的向量表示的全集,i为广告的向量表示的个体,从而;所以,点击二部图的顶点、边、边权重(称为转化权重)可以依次表示为或、、;社交图的顶点、边、边权重(称为互动权重)可以依次表示为;其中,m表示用户索引,n表示广告索引。
参见图8,图8是本申请实施例提供的一种示例性的异构图的示意图;如图8所示,异构图8-1是通过融合图6中的点击二部图6-1和图7中的社交图7-1获得的。异构图8-1中,通过顶点B、C和D,顶点A能够与顶点a、b、c和d建立关联;因此,在异构图中体现了冷启动用户与广告的关联。
最后,对异构图中的用户所对应的顶点进行异质信息聚合,包括冷启动用户的异质信息聚合和非冷启动用户的异质信息聚合。其中,对冷启动用户进行异质信息聚合时,采用顶点的二阶信息进行异质信息聚合;对非启动用户进行异质信息聚合时,采用顶点的一阶信息和二阶信息进行异质信息聚合。其中,一阶信息可通过式(1)实现,式(1)如下所示。
二阶信息可通过式(2)实现,式(2)如下所示。
参见图9,图9是本申请实施例提供的一种示例性的异质信息聚合示意图;如图9所示,针对图8的异构图8-1中冷启动用户所对应的顶点A,对应的二阶信息可表示为[顶点A-顶点B-顶点a;顶点A-顶点C-顶点b;顶点A-顶点C-顶点c;顶点A-顶点D-顶点d],如图9中的实线所示。
参见图10,图10是本申请实施例提供的另一种示例性的异质信息聚合示意图;如图10所示,针对图8的异构图8-1中非冷启动用户所对应的顶点C,对应的一阶信息可表示为[顶点C-顶点b;顶点C-顶点c],如图10中边10-1和边10-2所示;二阶信息可表示为[顶点C-顶点A;顶点C-顶点D-顶点d],如图10中边10-3、边10-4和边10-5所示。
在本申请实施例中,当完成一次异质信息聚合之后,接着进行权重更新。由于异构图源于两种不同的子图(点击二部图与社交图),两种不同类型的子图属于异质信息。因此,采用自适应加权注意力机制进行权重更新;也就是说,先在单个子图上分别采用注意力机制更新权重;再采用自适应加权机制来融合不同子图上的权重。从而,采用注意力机制更新异构图中属于点击二部图上的边的权重的过程如式(6)所示。
采用注意力机制更新异构图中属于社交图上的边的权重的过程如式(7)所示。
采用自适应加权机制来融合不同子图上的权重的过程如式(8)和(9)所示。
示例性地,参见图11,图11是本申请实施例提供的一种示例性的权重更新示意图;如图11所示,采用注意力机制更新权重11-1(WA-C)时,基于顶点A和顶点D实现;采用自适应加权机制更新权重11-1时,基于注意力机制更新后的权重11-1、权重11-2和权重11-3实现。
需要说明的是,基于式(1)至式(9)进行迭代处理,来更新异构图,获得最终的异构图,其中,最终的异构图中包括用户最终的向量表示和广告最终的向量表示;从而,在广告推荐阶段5-3进行广告推荐时,能够基于最终的异构图中用户u对应的顶点和广告i对应的顶点,确定广告点击概率,如式(10)所示。
这里,通过最终的异构图预估各个广告(比如N个广告,N为正整数)分别对应的广告点击概率,并基于广告点击概率进行广告排序,筛选出广告点击概率最大的广告推荐给用户,实现信息推荐。
下面说明本申请实施例提供的数据处理方法与基线模型,分别在训练数据集、验证数据集和测试数据集上进行广告点击概率预估时对应的指标数据,如表1所示。
表1
由表1可知,本申请实施例提供的数据处理方法优于基线模型。
下面说明应用过程中本申请实施例提供的数据处理方法与多个基线模型的对比结果。
参见图12,图12是本申请实施例提供的一种示例性的模型性能对比示意图;如图12所示,横坐标轴表示应用日期(0507至0511),纵坐标表示性能指标(0.06至0.13);曲线12-1位基线模型1对应的性能信息,曲线12-2为基线模型2对应的性能信息,曲线12-3为基线模型3对应的性能信息,曲线12-4为本申请实施例提供的数据处理方法所对应的性能信息。通过曲线12-1至曲线12-4,可知,本申请实施例提供的数据处理方法在性能指标上,优于基线模型1至基线模型3。
可以理解的是,通过将社交图和点击二部图融合为异构图,并对异构图中用户对应的顶点结合边权重进行非线性聚合,使得用户与广告进行了信息交互;从而,即使是冷启动用户,也和广告之间建立了有效关联。另外,由于非线性聚合过程中,在不断更新用户对应的顶点的过程中,还采用自适应注意力机制对边权重进行了更新,能够提升非线性聚合的效果;综上,本申请实施例提供的异构图聚合的方法,能够提升对冷启动用户进行信息推荐的准确度。
下面继续说明本申请实施例提供的数据处理装置455的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器450的数据处理装置455中的软件模块可以包括:
特征获取模块4551,用于获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过所述待推荐对象的目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
所述特征获取模块4551,还用于获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
信息推荐模块4552,用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
在本申请实施例中,所述特征获取模块4551,还用于获取所述待推荐对象对应的所述目标二阶信息;获取所述目标二阶信息与指定中心信息之间的空间距离,其中,所述指定中心信息是通过多个对象二阶信息确定的,所述多个对象二阶信息包括所述目标二阶信息;基于多个指定映射参数对所述空间距离进行非线性映射,得到多个待融合二阶特征,其中,所述指定映射参数表示映射空间范围;基于多个所述待融合二阶特征对应的第一非线性映射结果,得到所述待推荐对象特征,其中,所述目标二阶信息所对应的非线性映射结果包括所述第一非线性映射结果。
在本申请实施例中,所述特征获取模块4551,还用于获取所述待推荐对象与所述互动对象之间的互动权重,其中,所述互动权重表示所述待推荐对象与所述互动对象之间的亲密度;获取所述互动对象与所述推荐信息之间的转化权重,其中,所述转化权重表示所述互动对象与所述推荐信息之间的转化度;获取所述互动权重与所述对象特征的第一融合结果、以及所述转化权重和所述第一信息特征的第二融合结果;将至少一个所述互动对象对应的至少一个所述第一融合结果、以及每个所述互动对象所转化的至少一个推荐信息对应的至少一个所述第二融合结果,组合为所述待推荐对象对应的所述目标二阶信息。
在本申请实施例中,所述数据处理装置455还包括对象判断模块4553,用于获取所述待推荐对象对待推荐信息库的转化标识,其中,所述待推荐信息库包括每个所述互动对象所转化的至少一个所述推荐信息。
在本申请实施例中,所述特征获取模块4551,还用于当所述转化标识表示所述待推荐信息库中包括所述待推荐对象对应的至少一个已转化信息时,获取所述待推荐对象对应的目标一阶信息,其中,所述目标一阶信息通过聚合至少一个所述已转化信息分别对应的第二信息特征获得;将所述目标一阶信息对应的第二非线性映射结果与所述目标二阶信息对应的第一非线性映射结果,组合为所述待推荐对象对应的所述待推荐对象特征。
在本申请实施例中,所述特征获取模块4551,还用于对所述目标一阶信息对应的所述第二非线性映射结果、以及所述目标二阶信息对应的所述第一非线性映射结果进行组合,得到初始聚合信息;获取与所述初始聚合信息负相关、且与所述第一非线性映射结果正相关的第一组合权重,并获取所述第一组合权重对应的第二组合权重;对所述第一组合权重与所述第二非线性映射结果的融合结果、以及所述第二组合权重与所述第一非线性映射结果的融合结果进行组合,得到所述待推荐对象特征。
在本申请实施例中,所述特征获取模块4551,还用于当所述转化标识表示转化对象库与所述待推荐对象独立时,将所述目标二阶信息对应的所述第二非线性映射结果,确定为所述待推荐对象对应的所述待推荐对象特征,其中,所述转化对象库是指对所述待推荐信息库中的所述推荐信息进行转化的对象集合。
在本申请实施例中,所述待推荐对象特征和所述待推荐信息特征通过指定异构图获得,其中,所述数据处理装置455还包括模型训练模块4554,用于基于至少两个第一对象之间的互动记录,构建对象互动图,其中,至少两个所述第一对象包括所述待推荐对象和至少一个所述互动对象;基于至少一个第二对象对至少一个初始推荐信息的转化记录,构建对象信息转化图,其中,至少一个所述初始推荐信息包括每个所述互动对象所转化的至少一个所述推荐信息;基于至少两个所述第一对象和至少一个所述第二对象之间的共同对象,对所述对象互动图和所述对象信息转化图进行融合,得到待更新异构图;基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述待更新异构图中的对象顶点;将迭代更新后的所述待更新异构图,确定为所述指定异构图。
在本申请实施例中,所述模型训练模块4554,还用于基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,更新所述待更新异构图中的对象顶点,得到当前异构图;对所述当前异构图中的边权重进行注意力更新,得到待更新边权重;对所述待更新边权重进行自适应增强,得到所述当前异构图中的目标边权重;基于所述目标边权重,聚合出所述当前异构图中每个当前对象顶点的二阶信息;基于所述当前对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述当前异构图中的对象顶点,得到所述指定异构图。
在本申请实施例中,所述模型训练模块4554,还用于获取所述当前异构图中每个所述当前对象顶点对应的至少一个相邻对象顶点;基于至少一个所述相邻对象顶点,确定所述当前对象顶点与每个所述相邻对象顶点之间的注意力互动权重;获取所述当前对象顶点对应的至少一个相邻信息顶点;基于至少一个所述相邻信息顶点,确定所述当前对象顶点与每个所述相邻信息顶点之间的注意力转化权重,其中,所述待更新边权重为所述注意力互动权重或所述注意力转化权重。
在本申请实施例中,所述模型训练模块4554,还用于获取与目标待更新边权重相邻、且与目标待更新边权重类型不同的至少一个所述待更新边权重,其中,所述目标待更新边权重为任一所述待更新边权重;基于至少一个所述待更新边权重,增强所述目标待更新边权重,得到所述当前异构图中的目标边权重。
在本申请实施例中,所述信息推荐模块4552,还用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,确定所述待推荐对象对所述待推荐信息进行转化的转化概率;当待推荐信息库包括至少两个所述待推荐信息时,基于所述待推荐对象对至少两个所述待推荐信息的至少两个所述转化概率,对至少两个待推荐信息进行倒序排列,得到待推荐信息序列;从所述待推荐信息序列中依次选择指定数量的所述待推荐信息,得到目标待推荐信息;向所述待推荐对象推荐所述目标待推荐信息。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备(称为数据处理设备)的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的数据处理方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的数据处理方法,例如,如图3示出的数据处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算机设备上执行(此时,这一个计算机设备即数据处理设备),或者在位于一个地点的多个计算机设备上执行(此时,位于一个地点的多个计算机设备即数据处理设备),又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行(此时,分布在多个地点且通过通信网络互连的多个计算机设备即数据处理设备)。
可以理解的是,在本申请实施例中,涉及到互动等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
综上,本申请实施例通过获取待推荐对象对应的目标二阶信息,并基于目标二阶信息的非线性映射结果确定待推荐对象特征的过程中;由于目标二阶信息不仅包括对象之间的交互,还包括对象与推荐信息之间的交互,是一种异质信息,因此,通过对目标二阶信息进行非线性映射来获得待推荐对象对应的待推荐对象特征,使得待推荐对象与推荐信息建立了准确的关联,从而能够准确地确定是否向待推荐对象推荐任一推荐信息,能够提升转化概率的准确度;因此,即使是冷启动用户,也能够提升信息推荐的准确率较低,进而降低信息推荐的资源消耗。
以上,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (15)
1.一种数据处理方法,其特征在于,所述方法包括:
获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
2.根据权利要求1所述的方法,其特征在于,所述获取待推荐对象对应的待推荐对象特征,包括:
获取所述待推荐对象对应的所述目标二阶信息;
获取所述目标二阶信息与指定中心信息之间的空间距离,其中,所述指定中心信息是通过多个对象二阶信息确定的,所述多个对象二阶信息包括所述目标二阶信息;
基于多个指定映射参数对所述空间距离进行非线性映射,得到多个待融合二阶特征,其中,所述指定映射参数表示映射空间范围;
基于多个所述待融合二阶特征对应的第一非线性映射结果,得到所述待推荐对象特征,其中,所述目标二阶信息所对应的非线性映射结果包括所述第一非线性映射结果。
3.根据权利要求2所述的方法,其特征在于,所述获取所述待推荐对象对应的所述目标二阶信息,包括:
获取所述待推荐对象与所述互动对象之间的互动权重,其中,所述互动权重表示所述待推荐对象与所述互动对象之间的亲密度;
获取所述互动对象与所述推荐信息之间的转化权重,其中,所述转化权重表示所述互动对象与所述推荐信息之间的转化度;
获取所述互动权重与所述对象特征的第一融合结果、以及所述转化权重和所述第一信息特征的第二融合结果;
将至少一个所述互动对象对应的至少一个所述第一融合结果、以及每个所述互动对象所转化的至少一个推荐信息对应的至少一个所述第二融合结果,组合为所述待推荐对象对应的所述目标二阶信息。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取待推荐对象对应的待推荐对象特征之前,所述方法还包括:
获取所述待推荐对象对待推荐信息库的转化标识,其中,所述待推荐信息库包括每个所述互动对象所转化的至少一个所述推荐信息;
所述获取待推荐对象对应的待推荐对象特征,包括:
当所述转化标识表示所述待推荐信息库中包括所述待推荐对象对应的至少一个已转化信息时,获取所述待推荐对象对应的目标一阶信息,其中,所述目标一阶信息通过聚合至少一个所述已转化信息分别对应的第二信息特征获得;
将所述目标一阶信息对应的第二非线性映射结果与所述目标二阶信息对应的第一非线性映射结果,组合为所述待推荐对象对应的所述待推荐对象特征。
5.根据权利要求4所述的方法,其特征在于,所述将所述目标一阶信息对应的第二非线性映射结果与所述目标二阶信息对应的第一非线性映射结果,组合为所述待推荐对象对应的所述待推荐对象特征,包括:
对所述目标一阶信息对应的所述第二非线性映射结果、以及所述目标二阶信息对应的所述第一非线性映射结果进行组合,得到初始聚合信息;
获取与所述初始聚合信息负相关、且与所述第一非线性映射结果正相关的第一组合权重,并获取所述第一组合权重对应的第二组合权重;
对所述第一组合权重与所述第二非线性映射结果的融合结果、以及所述第二组合权重与所述第一非线性映射结果的融合结果进行组合,得到所述待推荐对象特征。
6.根据权利要求4所述的方法,其特征在于,所述获取待推荐对象对应的待推荐对象特征,包括:
当所述转化标识表示转化对象库与所述待推荐对象独立时,将所述目标二阶信息对应的所述第二非线性映射结果,确定为所述待推荐对象对应的所述待推荐对象特征,其中,所述转化对象库是指对所述待推荐信息库中的所述推荐信息进行转化的对象集合。
7.根据权利要求1所述的方法,其特征在于,所述待推荐对象特征和所述待推荐信息特征通过指定异构图获得,其中,所述指定异构图通过以下步骤获得:
基于至少两个第一对象之间的互动记录,构建对象互动图,其中,至少两个所述第一对象包括所述待推荐对象和至少一个所述互动对象;
基于至少一个第二对象对至少一个初始推荐信息的转化记录,构建对象信息转化图,其中,至少一个所述初始推荐信息包括每个所述互动对象所转化的至少一个所述推荐信息;
基于至少两个所述第一对象和至少一个所述第二对象之间的共同对象,对所述对象互动图和所述对象信息转化图进行融合,得到待更新异构图;
基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述待更新异构图中的对象顶点;
将迭代更新后的所述待更新异构图,确定为所述指定异构图。
8.根据权利要求7所述的方法,其特征在于,所述基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述待更新异构图中的对象顶点,包括:
基于所述待更新异构图中每个对象顶点的二阶信息所对应的非线性映射结果,更新所述待更新异构图中的对象顶点,得到当前异构图;
对所述当前异构图中的边权重进行注意力更新,得到待更新边权重;
对所述待更新边权重进行自适应增强,得到所述当前异构图中的目标边权重;
基于所述目标边权重,聚合出所述当前异构图中每个当前对象顶点的二阶信息;
基于所述当前对象顶点的二阶信息所对应的非线性映射结果,迭代更新所述当前异构图中的对象顶点,得到所述指定异构图。
9.根据权利要求8所述的方法,其特征在于,所述对所述当前异构图中的边权重进行注意力更新,得到待更新边权重,包括:
获取所述当前异构图中每个所述当前对象顶点对应的至少一个相邻对象顶点;
基于至少一个所述相邻对象顶点,确定所述当前对象顶点与每个所述相邻对象顶点之间的注意力互动权重;
获取所述当前对象顶点对应的至少一个相邻信息顶点;
基于至少一个所述相邻信息顶点,确定所述当前对象顶点与每个所述相邻信息顶点之间的注意力转化权重,其中,所述待更新边权重为所述注意力互动权重或所述注意力转化权重。
10.根据权利要求8或9所述的方法,其特征在于,所述对所述待更新边权重进行自适应增强,得到所述当前异构图中的目标边权重,包括:
获取与目标待更新边权重相邻、且与所述目标待更新边权重类型不同的至少一个所述待更新边权重,其中,所述目标待更新边权重为任一所述待更新边权重;
基于至少一个所述待更新边权重,增强所述目标待更新边权重,得到所述当前异构图中的目标边权重。
11.根据权利要求1至3、7至9任一项所述的方法,其特征在于,所述基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐,包括:
基于所述待推荐对象特征和所述待推荐信息特征的融合结果,确定所述待推荐对象对所述待推荐信息进行转化的转化概率;
当待推荐信息库包括至少两个所述待推荐信息时,基于所述待推荐对象对至少两个所述待推荐信息的至少两个所述转化概率,对至少两个待推荐信息进行倒序排列,得到待推荐信息序列;
从所述待推荐信息序列中依次选择指定数量的所述待推荐信息,得到目标待推荐信息;
向所述待推荐对象推荐所述目标待推荐信息。
12.一种数据处理装置,其特征在于,所述数据处理装置包括:
特征获取模块,用于获取待推荐对象对应的待推荐对象特征,其中,所述待推荐对象特征通过目标二阶信息所对应的非线性映射结果获得,所述目标二阶信息通过聚合至少一个互动对象分别对应的对象特征、以及至少一个推荐信息分别对应的第一信息特征获得,至少一个所述互动对象为与所述待推荐对象互动的对象,至少一个所述推荐信息为每个所述互动对象所转化的信息;
所述特征获取模块,还用于获取待推荐信息对应的待推荐信息特征,其中,所述待推荐信息为所述互动对象所转化的任一所述推荐信息;
信息推荐模块,用于基于所述待推荐对象特征和所述待推荐信息特征的融合结果,对所述待推荐对象进行信息推荐。
13.一种数据处理设备,其特征在于,所述数据处理设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至11任一项所述的数据处理方法。
14.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令用于被处理器执行时,实现权利要求1至11任一项所述的数据处理方法。
15.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时,实现权利要求1至11任一项所述的数据处理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210662836.2A CN114756762B (zh) | 2022-06-13 | 2022-06-13 | 数据处理方法、装置、设备及存储介质 |
PCT/CN2023/088857 WO2023241207A1 (zh) | 2022-06-13 | 2023-04-18 | 一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品 |
US18/587,671 US20240211991A1 (en) | 2022-06-13 | 2024-02-26 | Data processing method, apparatus, and computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210662836.2A CN114756762B (zh) | 2022-06-13 | 2022-06-13 | 数据处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114756762A true CN114756762A (zh) | 2022-07-15 |
CN114756762B CN114756762B (zh) | 2022-09-02 |
Family
ID=82336354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210662836.2A Active CN114756762B (zh) | 2022-06-13 | 2022-06-13 | 数据处理方法、装置、设备及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240211991A1 (zh) |
CN (1) | CN114756762B (zh) |
WO (1) | WO2023241207A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116450938A (zh) * | 2023-04-07 | 2023-07-18 | 北京欧拉认知智能科技有限公司 | 一种基于图谱的工单推荐实现方法及系统 |
WO2023241207A1 (zh) * | 2022-06-13 | 2023-12-21 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品 |
CN117786094A (zh) * | 2023-12-29 | 2024-03-29 | 北京基智科技有限公司 | 一种基于知识图谱的企业技术服务推荐方法及装置 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103995866A (zh) * | 2014-05-19 | 2014-08-20 | 北京邮电大学 | 一种基于链路预测的商品信息推送方法及装置 |
CN105320719A (zh) * | 2015-01-16 | 2016-02-10 | 焦点科技股份有限公司 | 一种基于项目标签和图形关系的众筹网站项目推荐方法 |
CN106202519A (zh) * | 2016-07-22 | 2016-12-07 | 桂林电子科技大学 | 一种结合用户评论内容和评分的项目推荐方法 |
BR112013026814A2 (pt) * | 2011-04-19 | 2017-01-10 | Nokia Corp | método, aparelho, meio de armazenamento legível por computador e produto de programa de computador |
CN106682114A (zh) * | 2016-12-07 | 2017-05-17 | 广东工业大学 | 一种融合用户信任关系和评论信息的个性化推荐方法 |
US20180268318A1 (en) * | 2017-03-17 | 2018-09-20 | Adobe Systems Incorporated | Training classification algorithms to predict end-user behavior based on historical conversation data |
CN110837598A (zh) * | 2019-11-11 | 2020-02-25 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备及存储介质 |
CN111046286A (zh) * | 2019-12-12 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 一种对象推荐方法、装置、以及计算机存储介质 |
CN111414548A (zh) * | 2020-05-09 | 2020-07-14 | 中国工商银行股份有限公司 | 对象推荐方法、装置、电子设备和介质 |
CN112883268A (zh) * | 2021-02-22 | 2021-06-01 | 中国计量大学 | 一种考虑用户多兴趣以及社交影响的会话推荐方法 |
US20210174164A1 (en) * | 2019-12-09 | 2021-06-10 | Miso Technologies Inc. | System and method for a personalized search and discovery engine |
CN112948668A (zh) * | 2021-02-04 | 2021-06-11 | 深圳大学 | 一种信息推荐方法、电子设备及存储介质 |
CN113010802A (zh) * | 2021-03-25 | 2021-06-22 | 华南理工大学 | 一种基于用户与物品多属性交互面向隐式反馈的推荐方法 |
CN113536106A (zh) * | 2020-11-23 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 待推荐信息内容确定方法 |
CN114238750A (zh) * | 2021-11-18 | 2022-03-25 | 浙江工业大学 | 基于异构网络信息嵌入模型的交互可视推荐方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291266B (zh) * | 2020-02-13 | 2023-03-21 | 深圳市雅阅科技有限公司 | 基于人工智能的推荐方法、装置、电子设备及存储介质 |
CN111553759A (zh) * | 2020-03-25 | 2020-08-18 | 平安科技(深圳)有限公司 | 一种产品信息推送方法、装置、设备及存储介质 |
CN114756762B (zh) * | 2022-06-13 | 2022-09-02 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及存储介质 |
-
2022
- 2022-06-13 CN CN202210662836.2A patent/CN114756762B/zh active Active
-
2023
- 2023-04-18 WO PCT/CN2023/088857 patent/WO2023241207A1/zh unknown
-
2024
- 2024-02-26 US US18/587,671 patent/US20240211991A1/en active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112013026814A2 (pt) * | 2011-04-19 | 2017-01-10 | Nokia Corp | método, aparelho, meio de armazenamento legível por computador e produto de programa de computador |
CN103995866A (zh) * | 2014-05-19 | 2014-08-20 | 北京邮电大学 | 一种基于链路预测的商品信息推送方法及装置 |
CN105320719A (zh) * | 2015-01-16 | 2016-02-10 | 焦点科技股份有限公司 | 一种基于项目标签和图形关系的众筹网站项目推荐方法 |
CN106202519A (zh) * | 2016-07-22 | 2016-12-07 | 桂林电子科技大学 | 一种结合用户评论内容和评分的项目推荐方法 |
CN106682114A (zh) * | 2016-12-07 | 2017-05-17 | 广东工业大学 | 一种融合用户信任关系和评论信息的个性化推荐方法 |
US20180268318A1 (en) * | 2017-03-17 | 2018-09-20 | Adobe Systems Incorporated | Training classification algorithms to predict end-user behavior based on historical conversation data |
CN110837598A (zh) * | 2019-11-11 | 2020-02-25 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备及存储介质 |
US20210174164A1 (en) * | 2019-12-09 | 2021-06-10 | Miso Technologies Inc. | System and method for a personalized search and discovery engine |
CN111046286A (zh) * | 2019-12-12 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 一种对象推荐方法、装置、以及计算机存储介质 |
CN111414548A (zh) * | 2020-05-09 | 2020-07-14 | 中国工商银行股份有限公司 | 对象推荐方法、装置、电子设备和介质 |
CN113536106A (zh) * | 2020-11-23 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 待推荐信息内容确定方法 |
CN112948668A (zh) * | 2021-02-04 | 2021-06-11 | 深圳大学 | 一种信息推荐方法、电子设备及存储介质 |
CN112883268A (zh) * | 2021-02-22 | 2021-06-01 | 中国计量大学 | 一种考虑用户多兴趣以及社交影响的会话推荐方法 |
CN113010802A (zh) * | 2021-03-25 | 2021-06-22 | 华南理工大学 | 一种基于用户与物品多属性交互面向隐式反馈的推荐方法 |
CN114238750A (zh) * | 2021-11-18 | 2022-03-25 | 浙江工业大学 | 基于异构网络信息嵌入模型的交互可视推荐方法 |
Non-Patent Citations (6)
Title |
---|
ALAHMADI D H 等: "Twitter-based recommender system to address cold-start: A genetic algorithm based trust modelling and probabilistic sentiment analysis", 《2015 IEEE 27TH INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE (ICTAI)》 * |
JIA X 等: "Collaborative restricted Boltzmann machine for social event recommendation", 《2016 IEEE/ACM INTERNATIONAL CONFERENCE ON ADVANCES IN SOCIAL NETWORKS ANALYSIS AND MINING (ASONAM)》 * |
ZHANG S 等: "Next item recommendation with self-attention", 《ARXIV PREPRINT ARXIV:1808.06414》 * |
刘雅辉: "基于深度学习与历史交互序列建模的推荐排序算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
张亚楠 等: "基于社交关系拓扑结构的冷启动推荐方法", 《浙江大学学报(工学版)》 * |
罗鹏宇: "基于时序推理的分层会话感知推荐方法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023241207A1 (zh) * | 2022-06-13 | 2023-12-21 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品 |
CN116450938A (zh) * | 2023-04-07 | 2023-07-18 | 北京欧拉认知智能科技有限公司 | 一种基于图谱的工单推荐实现方法及系统 |
CN117786094A (zh) * | 2023-12-29 | 2024-03-29 | 北京基智科技有限公司 | 一种基于知识图谱的企业技术服务推荐方法及装置 |
CN117786094B (zh) * | 2023-12-29 | 2024-08-06 | 北京基智科技有限公司 | 一种基于知识图谱的企业技术服务推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114756762B (zh) | 2022-09-02 |
WO2023241207A1 (zh) | 2023-12-21 |
US20240211991A1 (en) | 2024-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114756762B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113626719B (zh) | 信息推荐方法、装置、设备、存储介质及计算机程序产品 | |
CN111090756B (zh) | 基于人工智能的多目标推荐模型的训练方法及装置 | |
US20170308535A1 (en) | Computational query modeling and action selection | |
CN111949886B (zh) | 一种用于信息推荐的样本数据生成方法和相关装置 | |
CN116010684A (zh) | 物品推荐方法、装置及存储介质 | |
CN112085615A (zh) | 图神经网络的训练方法及装置 | |
WO2023213157A1 (zh) | 数据处理方法、装置、程序产品、计算机设备和介质 | |
CN112070542A (zh) | 信息转化率预测方法、装置、设备及可读存储介质 | |
CN114417174A (zh) | 内容推荐方法、装置、设备及计算机存储介质 | |
CN115114461A (zh) | 多媒体数据的推荐方法、设备以及计算机可读存储介质 | |
WO2024152686A1 (zh) | 确定资源信息的推荐指标的方法、装置、设备、存储介质及计算机程序产品 | |
CN114756768B (zh) | 数据处理方法、装置、设备、可读存储介质及程序产品 | |
WO2023051678A1 (zh) | 一种推荐方法及相关装置 | |
CN110866866A (zh) | 图像仿色处理方法、装置、电子设备及存储介质 | |
CN117216537A (zh) | 集成模型的训练方法、装置、设备、存储介质及程序产品 | |
CN116977661A (zh) | 一种数据处理方法、装置、设备、存储介质及程序产品 | |
CN113849735A (zh) | 一种基于混合模型的游戏推荐方法和系统 | |
CN117216361A (zh) | 推荐方法、装置、电子设备及计算机可读存储介质 | |
CN114817751B (zh) | 数据处理方法、装置、电子设备、存储介质及程序产品 | |
KR102266151B1 (ko) | 인공지능 기반 투표플랫폼을 통한 소비자 선호도를 제공하는 방법 | |
WO2024230549A1 (zh) | 一种数据处理方法及其装置 | |
CN116628236B (zh) | 多媒体信息的投放方法、装置、电子设备及存储介质 | |
CN116017068A (zh) | 直播推荐方法、装置、设备及计算机可读存储介质 | |
CN118939868A (zh) | 一种推荐方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40070918 Country of ref document: HK |