CN113946755A - 基于关联规则的信息推送方法、装置、设备及存储介质 - Google Patents
基于关联规则的信息推送方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113946755A CN113946755A CN202111277126.XA CN202111277126A CN113946755A CN 113946755 A CN113946755 A CN 113946755A CN 202111277126 A CN202111277126 A CN 202111277126A CN 113946755 A CN113946755 A CN 113946755A
- Authority
- CN
- China
- Prior art keywords
- information
- product
- target
- user
- product information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000006399 behavior Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000005065 mining Methods 0.000 claims description 12
- 238000005192 partition Methods 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 101150064138 MAP1 gene Proteins 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 101100400452 Caenorhabditis elegans map-2 gene Proteins 0.000 description 1
- 101100075995 Schizosaccharomyces pombe (strain 972 / ATCC 24843) fma2 gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及人工智能,本申请提供一种基于关联规则的信息推送方法,所述方法在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;确定产品之间和/或用户信息与产品之间的关联规则;并基于所述关联规则,完成所述目标用户对应的目标产品信息的推送。本发明根据各个组合的支持度,即产品之间的组合、用户信息与产品之间的组合,进行产品之间和/或用户信息与产品之间的关联规则的挖掘,完成目标用户对应关联的目标产品信息的推送,提高了推送信息的准确率,提高推送信息与用户的匹配度,提高了用户体验。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于关联规则的信息推送方法、装置、设备及计算机可读存储介质。
背景技术
产品信息推送指的是向用户推送适合用户的产品信息,以供用户选择。目前的产品推荐方法,一般是基于用户的基本信息确定相似用户,然后基于相似用户关联的产品进行产品推荐。因此,目前的产品推荐方法推荐的产品之间关联度较低,导致推荐的产品信息准确率较低。因此,如何解决现有信息推送准确率较低的问题,成为了目前亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种基于关联规则的信息推送方法、装置、设备及计算机可读存储介质,旨在解决现有信息推送准确率较低的技术问题。
为实现上述目的,本发明提供一种基于关联规则的信息推送方法,所述基于关联规则的信息推送方法包括:分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;根据所述目标频繁项集,确定产品之间和/或用户信息与产品之间的关联规则;获取目标用户的目标用户信息和相关产品信息,并基于所述产品之间的关联规则和/或所述用户信息与产品之间的关联规则,确定所述目标用户信息和/或所述相关产品信息对应的关联产品信息;在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户。
此外,为实现上述目的,本发明还提供一种基于关联规则的信息推送装置,所述基于关联规则的信息推送装置包括:频繁项集生成模块,用于分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;关联规则确定模块,用于根据所述目标频繁项集,确定产品之间和/或用户信息与产品之间的关联规则;关联产品确定模块,用于获取目标用户的目标用户信息和相关产品信息,并基于所述产品之间的关联规则和/或所述用户信息与产品之间的关联规则,确定所述目标用户信息和/或所述相关产品信息对应的关联产品信息;目标信息推送模块,用于在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户。
此外,为实现上述目的,本发明还提供一种基于关联规则的信息推送设备,所述基于关联规则的信息推送设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的基于关联规则的信息推送程序,其中所述基于关联规则的信息推送程序被所述处理器执行时,实现如上述的基于关联规则的信息推送方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于关联规则的信息推送程序,其中所述基于关联规则的信息推送程序被处理器执行时,实现如上述的基于关联规则的信息推送方法的步骤。
本发明提供一种基于关联规则的信息推送方法,所述方法分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;根据所述目标频繁项集,确定产品之间和/或用户信息与产品之间的关联规则;获取目标用户的目标用户信息和相关产品信息,并基于所述产品之间的关联规则和/或所述用户信息与产品之间的关联规则,确定所述目标用户信息和/或所述相关产品信息对应的关联产品信息;在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户。通过上述方式,本发明根据各个组合的支持度,即产品之间的组合、用户信息与产品之间的组合,进行产品之间和/或用户信息与产品之间的关联规则的挖掘,然后基于挖掘出的关联规则,确定目标用户信息或目标用户对应相关产品信息对应关联的目标产品信息,并进行目标产品信息的推送,提高了推送信息的准确率,提高推送信息与用户的匹配度,提高了用户体验,解决了现有信息推送准确率较低的技术问题。
附图说明
图1为本发明实施例方案中涉及的基于关联规则的信息推送设备的硬件结构示意图;
图2为本发明基于关联规则的信息推送方法第一实施例的流程示意图;
图3为本发明基于关联规则的信息推送方法第二实施例的流程示意图;
图4为本发明基于关联规则的信息推送方法第三实施例的流程示意图;
图5为本发明基于关联规则的信息推送装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的基于关联规则的信息推送方法主要应用于基于关联规则的信息推送设备,该基于关联规则的信息推送设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的基于关联规则的信息推送设备的硬件结构示意图。本发明实施例中,基于关联规则的信息推送设备可以包括处理器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对基于关联规则的信息推送设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及基于关联规则的信息推送程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的基于关联规则的信息推送程序,并执行本发明实施例提供的基于关联规则的信息推送方法。
本发明实施例提供了一种基于关联规则的信息推送方法。
参照图2,图2为本发明基于关联规则的信息推送方法第一实施例的流程示意图。
本实施例中,所述基于关联规则的信息推送方法包括以下步骤:
步骤S10,分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;
在数据挖掘处理中,数据关联规则(Association Rule)的挖掘目的是,在大量的数据项之间挖掘存在关联关系。例如,在金融行业中,通过理财产品之间的数据关联规则预测用户的业务需求。在零售领域中,通过商品之间的数据关联规则对用户购买商品进行分析,判断商品与商品之间是否能够组合销售等。
本实施例中,为了解决现有信息推送准确率较低的问题,提供一种基于关联规则的信息推送方法,即基于用户的历史产品记录挖掘产品之间的关联规则或用户信息与产品之间的关联规则,从而确定与目标用户存在关联的产品,并完成产品信息的推送。由此,提高了用户与推送产品信息之间的匹配度,提高了信息推送的准确率,提升了用户体验。
具体地,用户信息包括但不限于用户的年龄、职业、学历、专业、理财偏好信息等,用户对应的历史产品记录包括但不限于各个用户信息及各个用户信息对应的用户购买、收藏、点击、转发的产品信息。
示例性的,所述信息推送方法应用于分布式文件系统(HDFS),所述分布式文件系统包括至少两个工作节点,所述步骤S10具体包括:
分别获取各个用户信息对应的各个历史产品记录,作为待挖掘信息;
在所述所述待挖掘信息对应的数据量超过预设阈值时,将所述待挖掘信息按照预设划分单位进行分块;
将分块后的待挖掘信息分发给所述分布式文件系统中的各个工作节点,以通过所述各个工作节点对所述待挖掘信息进行并行频繁项集挖掘,生成目标频繁项集。
Apriori算法作为传统的数据挖掘算法,在面对海量的历史产品记录数据时,单机环境下的Apriori算法挖掘效率低下。为了解决上述问题,本提案进一步将传统Apriori算法与大数据平台结合,利用MapReduce思想,对大量数据进行处理,从而得到处理结果。由此解决传统算法不能处理大量数据的短板。其中,MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。MapReduce并行计算框架包括Map(映射)函数(用于把一组键值对映射成一组新的键值对)和Reduce(归约)函数(用于保证所有映射的键值对中的每一个共享相同的键组)。
本实施例中,对各个用户已经购买的各条历史产品记录进行关联规则挖掘,即根据用户同时购买的产品,挖掘产品之间的关联关系,从而确定与所述目标用户关联的产品。通过MapReduce并行计算框架,将传统Apriori算法移植到Hadoop(分布式系统基础架构)平台上。Hadoop平台包括至少两个工作节点,Hadoop平台将大规模数据进行切分,并将切分后的数据分别发送到不同的工作节点,由各个工作节点并行挖掘后再进行结果汇总。
获取到各个用户关联的各条历史产品记录数据后,控制节点根据数据量大小进行数据划分,将任务与划分后的数据分别发送到各个工作节点上,通过每个节点对接收的历史产品记录进行频繁项集挖掘。频繁项集挖掘包括通过映射函数(Map函数)生成所述各条历史产品记录对应的候选项集以及通过归约函数(Reduce函数)对各候选项集进行合并,生成频繁项集。
工作节点包括至少两个map节点以及至少两个reduce节点。
例如:
第一条产品记录T1:X1,P1,P2,P4
第二条产品记录T2:X2,P2,P3,P4
第三条产品记录T3:X3,P1,P3,P5
第四条产品记录T4:X4,P1,P3,P6
T1、T2、T3、T4为4个用户(X1、X2、X3、X4)对应的4个历史产品记录,P1、P2、P3、P4、P5、P6为6个不同产品信息,T1至T4共4条记录被分配到不同节点上,比如有两个节点,map1上处理第一条产品记录T1及第二条产品记录T2,map2处理第三条产品记录T3及第四条产品记录T4。
Map函数对map节点上的每个文件进行遍历,对文件中的每一行数据进行切分,切分后的数据形成key和value的键值对,如<P1,(T1)>(P1出现在T1记录里出现1次)或<P1,(T3,T4)>(P1在T3和T4记录出现2次),即产品以及出现产品的记录组成的键值对。
各个map节点将各个key和value的键值对发送至各个reduce节点,reduce节点分别统计各个产品对应的次数,并将统计结果进行汇总。然后将各个产品对应的次数与产品记录条数的比值,作为各个产品的支持度。并根据超过预设支持度阈值的产品,生成第一频繁项集。即map阶段会将处理的结果中,key值相同的数据发送到同一个reduce节点上。将相同key值的键值对组合起来,然后将组合后的键值对作为reduce阶段的输入传入到Reduce函数中,执行reduce程序对<key,value>进行汇总得到频繁项集。比如此时有两个reduce节点,reduce1与reduce2,map1将生成的键值对<P1,(T1)>发送到reduce1,map2将生成的键值对<P1,(T3,T4)>发送到reduce1,此时reduce1就可以得到<P1,(T1,T3,T4)>键值对。也就是P1在整个记录中出现了3次。若此时设定最小支持度阈值为0.3,那么P1满足最小支持度(P1的最小支持度为3/4=0.75,0.75大于最小支持度阈值),P2(P2的最小支持度为2/4=0.5,0.5等于最小支持度阈值),P3(P3的最小支持度为3/4=0.75,0.75大于最小支持度阈值),P4(P4的最小支持度为2/4=0.5,0.5等于最小支持度阈值),P5(P5的最小支持度为1/4=0.25,0.25小于最小支持度阈值),P6(P6的最小支持度为1/4=0.25,0.25小于最小支持度阈值),即第一频繁项集包括P1、P2、P3、P4。
可以理解的是,本实施例中的关联规则通过组合的支持度和置信度进行度量,支持度用于确定组合的频繁程度,计算公式为:
S(Pi→Pj)=Pi和Pj产品在各条产品记录中同时出现的次数/产品记录的总条数,其中,S(Pi→Pj)为在Pi产品和Pj产品同时出现的支持度;
置信度用于确定Pj在包含Pi产品的记录中出现的频繁程度,计算公式为:
C(Pi→Pj)=Pi和Pj产品在各条产品记录中同时出现的次数/Pi在各条产品记录中出现的次数。
将第一频繁项集中的各项进行两两组合,得到两两组合后的最小支持度,如<(P1,P2),T1>,(P1,P2)最小支持度为1/4=0.25,小于最小支持度阈值,
<(P1,P3),(T3,T4)>,(P1,P3)最小支持度为2/4=0.5,大于最小支持度阈值,<(P2,P3),T2>,(P2,P3)最小支持度为1/4=0.25,小于最小支持度阈值,<(P3,P4),T2>,(P3,P4)最小支持度为1/4=0.25,小于最小支持度阈值,即第二频繁项集包括(P1,P3)。Reduce阶段对相同key的键值对进行统计。若满足最小支持度则保留结果。否则,删除该项集,从而得到第二频繁项集,保存结果到HDFS。若第二频繁项集存在多项,则重复上述操作(不断迭代),即在产生频繁k+1项集时,频繁k+1项集的支持度均小于预设支持度阈值,不再迭代。并计算频繁k项集中的任意一个频繁项子集的置信度,并将置信度不小于预设置信度阈值的频繁项子集作为目标频繁项集。
步骤S20,根据所述目标频繁项集,确定产品之间和/或用户信息与产品之间的关联规则;
本实施例中,预先针对用户信息(如年龄、职业、学历、专业和/或理财偏好信息)与产品之间的关联关系进行挖掘,或预先针对产品与产品之间的关联关系进行挖掘,或针对用户信息及用户关联的产品信息与产品之间的关联关系进行挖掘,将用户信息以及与其存在关联关系的产品信息之间的关系,或将具有关联关系的产品之间的关系,或将用户信息及用户关联的产品信息存在关联关系的产品信息之间的关系,记为关联规则。根据产品之间的频繁项集,确定产品之间的关联规则,如根据频繁项集(P1,P3)确定P1->P3,即在用户购买、收藏或分享P1时,将P3作为P1的关联产品;或根据用户信息与产品之间的频繁项集,确定用户信息与产品之间的关联规则,如(I1,P1),即在用户属于I1行业时,将P1作为用户的关联产品;或根据用户信息及产品共同与产品之间的频繁项集,确定用户信息及产品与产品之间的关联规则,如<(I1,P1),P2>,即在用户属于I1行业且用户购买、收藏或分享P1时,将P2作为用户的关联产品。由此,确定产品之间的关联规则和/或用户信息与产品之间的关联规则。
步骤S30,获取目标用户的目标用户信息和相关产品信息,并基于所述产品之间的关联规则和/或所述用户信息与产品之间的关联规则,确定所述目标用户信息和/或所述相关产品信息对应的关联产品信息;
本实施例中,获取目标用户的目标用户信息以及与目标用户关联的相关产品信息,包括但不限于目标用户购买、收藏、分享或点赞的产品信息。然后根据产品之间的关联规则和/或用户信息与产品之间的关联规则,确定所述目标用户(即所述目标用户信息和/或所述相关产品信息)对应的关联产品信息。
步骤S40,在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户。
本实施例中,所述关联产品信息包括基于所述目标用户信息确定的产品信息、基于所述相关产品信息确定的产品信息和/或基于所述目标用户信息及所述相关产品信息共同确定的产品信息。可将上述产品信息中的任一种及其组合,作为目标产品信息,并推送至所述目标用户,完成产品信息的推送。
本实施例提供一种基于关联规则的信息推送方法,所述方法分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;根据所述目标频繁项集,确定产品之间和/或用户信息与产品之间的关联规则;获取目标用户的目标用户信息和相关产品信息,并基于所述产品之间的关联规则和/或所述用户信息与产品之间的关联规则,确定所述目标用户信息和/或所述相关产品信息对应的关联产品信息;在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户。通过上述方式,本发明根据各个组合的支持度,即产品之间的组合、用户信息与产品之间的组合,进行产品之间和/或用户信息与产品之间的关联规则的挖掘,然后基于挖掘出的关联规则,确定目标用户信息或目标用户对应相关产品信息对应关联的目标产品信息,并进行目标产品信息的推送,提高了推送信息的准确率,提高推送信息与用户的匹配度,提高了用户体验,解决了现有信息推送准确率较低的技术问题。
参照图3,图3为本发明基于关联规则的信息推送方法第二实施例的流程示意图。
基于上述图2所示实施例,本实施例中,所述步骤S40具体包括:
步骤S41,基于所述目标用户对应的目标用户画像,在所述关联产品信息中确定所述目标用户对应的目标产品信息,并将所述目标产品信息推送至所述目标用户。
本实施例中,通过提取用户的历史行为数据并结合用户的基础数据为用户打上个人标签,构建用户画像。用户数据按照数据类型可以分为显式特征数据和隐式特征数据两种。显示特征数据式指用户主动提交的个人信息数据,比如年龄、生日、地址、电话、家庭构成、评分和文字评价等数据;隐式特征数据则式指被服务器记录下来的用户行为信息数据,比如用户浏览、搜索、点击、收藏和购买行为等。对所收集到的数据进行相关处理,构建用户的兴趣模型。用户兴趣模型是根据用户的历史行为如分享、点击、收藏和购买等数据计算出的能反应顾客兴趣偏好的商品列表。基于用户的基本属性、社交偏好、RFM分析等进行标签规范化,以抽象出用户的个人标签,通常用户标签会采用多级标签的方式进行表达。其中,用户画像即指用户的标签化模型,用户兴趣模型是指计算出来的用户偏好产品列表。在关联产品中,确定符合所述用户画像标签的产品,或在关联产品中确定与所述用户偏好产品列表匹配的产品,作为目标产品信息。
进一步地,所述步骤S41之前,还包括:
获取所述目标用户的目标行为数据,基于第一计算公式、产品之间的相似度和所述目标行为数据,计算所述目标用户与产品的符合度,其中,所述第一计算公式为:
其中,N(u)为所述目标用户的评分产品集合,S(j,k)为与产品j相似度最大的k个产品,i为评分产品集合和k个产品的重复产品,Wij为产品i和j的相似度,rui为所述目标用户u对产品i的评分;
基于所述目标用户信息以及所述用所述目标用户与产品的符合度,构建所述目标用户的用户画像。
本实施例中,用户有行为操作的产品的评分可以从两个渠道获得:一是用户对产品的直接评分,二是通过用户对产品的操作行为计算用户对产品的兴趣评分。对不同用户行为进行相应的权重打分,将用户对产品的所有行为(即预设时间段,如一个月内或一个星期内,用户的分享、点击、收藏、搜索等行为)权重进行相加,作为用户对该产品的兴趣评分。在用户发生购买行为后,会将用户的兴趣打分减去用户购买行为权重,降低用户对该产品的兴趣打分,即不再推荐用户已购买的产品。由此,将产品之间的相似度以及目标用户对产品的评分代入上述公式,计算出目标用户与产品的符合度,从而确定目标用户的兴趣产品。产品j可以是目标用户分享、点击、收藏、搜索过的产品。在兴趣产品的基础上结合目标用户的年龄、职业、学历、专业等基础信息,添加对应标签,由此完成所述目标用户的用户画像构建。其中,产品之间的相似度可以是预先设定,或基于第二计算公式,计算所述产品之间的相似度,其中,所述第一计算公式为:
其中,|N(i)|为购买产品i的人数,|N(j)|为购买产品j的人数,|N(i)∩N(j)|为购买产品i和产品j的人数。
本实施例将关联规则与用户画像相结合,在进一步挖掘与用户关联的产品的同时,针对用户的标签推送产品信息,提高推送信息的准确率,提升用户体验。
参照图4,图4为本发明基于关联规则的信息推送方法第三实施例的流程示意图。
基于上述图3所示实施例,本实施例中,所述步骤S40还包括:
步骤S42,在所述关联产品信息为所述目标用户信息和所述相关产品信息关联的第一产品信息时,将所述第一产品信息作为所述目标产品信息,并将所述目标产品信息推送至所述目标用户。
本实施例中,在所述关联产品信息为所述用户信息和相关产品信息共同关联的产品信息时,即表示所述关联产品信息为一种类型产品信息,可将所述关联产品信息全部作为所述目标产品信息。如<(I1,P1),P2>,即在用户属于I1行业且用户购买、收藏或分享P1时,将P2作为用户的关联产品。
进一步地,所述步骤S40还包括:
在所述关联产品信息包括所述目标用户信息关联的第二产品信息以及所述相关产品信息关联的第三产品信息时,将所述第二产品信息与所述第三产品信息之间的重复产品信息,作为所述目标产品信息,并将所述目标产品信息推送至所述目标用户。如根据频繁项集(P1,P3)确定P1->P3,即在用户购买、收藏或分享P1时,将P3作为P1的关联产品;或根据用户信息与产品之间的频繁项集,确定用户信息与产品之间的关联规则,如(I1,P1),即在用户属于I1行业时,将P1作为用户的关联产品。
本实施例中,在所述关联产品信息包括第二产品信息以及所述第三产品信息等两种;产品信息时,可将所述第二产品信息以及所述第三产品信息之间的重复产品,作为所述目标产品信息。也可以将所述第一产品信息以及第二产品信息全部作为所述目标产品信息。或设置优先级,将优先级高的产品信息作为所述目标产品信息,例如优先推送所述相关产品信息关联的产品信息,即将所述第三产品信息,作为所述目标产品信息。
此外,本发明实施例还提供一种基于关联规则的信息推送装置。
参照图5,图5为本发明基于关联规则的信息推送装置第一实施例的功能模块示意图。
本实施例中,所述基于关联规则的信息推送装置包括:
频繁项集生成模块10,用于分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;
关联规则确定模块20,用于根据所述目标频繁项集,确定产品之间和/或用户信息与产品之间的关联规则;
关联产品确定模块30,用于获取目标用户的目标用户信息和相关产品信息,并基于所述产品之间的关联规则和/或所述用户信息与产品之间的关联规则,确定所述目标用户信息和/或所述相关产品信息对应的关联产品信息;
目标信息推送模块40,用于在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户。
进一步地,所述目标信息推送模块40具体包括:
第一信息推送单元,用于基于所述目标用户对应的目标用户画像,在所述关联产品信息中确定所述目标用户对应的目标产品信息,并将所述目标产品信息推送至所述目标用户。
进一步地,所述基于关联规则的信息推送装置还包括:
符合度计算模块,用于获取所述目标用户的目标行为数据,基于第一计算公式、产品之间的相似度和所述目标行为数据,计算所述目标用户与产品的符合度,其中,所述第一计算公式为:
其中,N(u)为所述目标用户的评分产品集合,S(j,k)为与产品j相似度最大的k个产品,i为评分产品集合和k个产品的重复产品,Wij为产品i和j的相似度,rui为所述目标用户u对产品i的评分;
用户画像构建模块,用于基于所述目标用户信息以及所述用所述目标用户与产品的符合度,构建所述目标用户的用户画像。
进一步地,所述基于关联规则的信息推送装置还包括:
相似度计算模块,用于基于第二计算公式,计算所述产品之间的相似度,其中,所述第一计算公式为:
其中,|N(i)|为购买产品i的人数,|N(j)|为购买产品j的人数,|N(i)∩N(j)|为购买产品i和产品j的人数。
进一步地,所述信息推送装置应用于分布式文件系统,所述分布式文件系统包括至少两个工作节点,所述频繁项集生成模块10具体包括:
待挖掘信息获取单元,用于分别获取各个用户信息对应的各个历史产品记录,作为待挖掘信息;
待挖掘信息分块单元,用于在所述所述待挖掘信息对应的数据量超过预设阈值时,将所述待挖掘信息按照预设划分单位进行分块;
频繁项集挖掘单元,用于将分块后的待挖掘信息分发给所述分布式文件系统中的各个工作节点,以通过所述各个工作节点对所述待挖掘信息进行并行频繁项集挖掘,生成目标频繁项集。
进一步地,所述目标信息推送模块40具体包括:
第二信息推送单元,用于在所述关联产品信息为所述目标用户信息和所述相关产品信息关联的第一产品信息时,将所述第一产品信息作为所述目标产品信息,并将所述目标产品信息推送至所述目标用户。
进一步地,所述目标信息推送模块40具体包括:
第三信息推送单元,用于在所述关联产品信息包括所述目标用户信息关联的第二产品信息以及所述相关产品信息关联的第三产品信息时,将所述第二产品信息与所述第三产品信息之间的重复产品信息,作为所述目标产品信息,并将所述目标产品信息推送至所述目标用户。
其中,上述基于关联规则的信息推送装置中各个模块与上述基于关联规则的信息推送方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明实施例还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有基于关联规则的信息推送程序,其中所述基于关联规则的信息推送程序被处理器执行时,实现如上述的基于关联规则的信息推送方法的步骤。
其中,基于关联规则的信息推送程序被执行时所实现的方法可参照本发明基于关联规则的信息推送方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于关联规则的信息推送方法,其特征在于,所述基于关联规则的信息推送方法包括以下步骤:
分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;
根据所述目标频繁项集,确定产品之间和/或用户信息与产品之间的关联规则;
获取目标用户的目标用户信息和相关产品信息,并基于所述产品之间的关联规则和/或所述用户信息与产品之间的关联规则,确定所述目标用户信息和/或所述相关产品信息对应的关联产品信息;
在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户。
2.如权利要求1所述的基于关联规则的信息推送方法,其特征在于,所述在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至目标用户的步骤具体包括:
基于所述目标用户对应的目标用户画像,在所述关联产品信息中确定所述目标用户对应的目标产品信息,并将所述目标产品信息推送至所述目标用户。
3.如权利要求2所述的基于关联规则的信息推送方法,其特征在于,所述基于所述目标用户对应的目标用户画像,在所述关联产品信息中确定所述目标用户对应的目标产品信息,并将所述目标产品信息推送至所述目标用户的步骤之前,还包括:
获取所述目标用户的目标行为数据,基于第一计算公式、产品之间的相似度和所述目标行为数据,计算所述目标用户与产品的符合度,其中,所述第一计算公式为:
其中,N(u)为所述目标用户的评分产品集合,S(j,k)为与产品j相似度最大的k个产品,i为评分产品集合和k个产品的重复产品,Wij为产品i和j的相似度,rui为所述目标用户u对产品i的评分;
基于所述目标用户信息以及所述用所述目标用户与产品的符合度,构建所述目标用户的用户画像。
5.如权利要求1所述的基于关联规则的信息推送方法,其特征在于,所述信息推送方法应用于分布式文件系统,所述分布式文件系统包括至少两个工作节点,所述分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集的步骤包括:
分别获取各个用户信息对应的各个历史产品记录,作为待挖掘信息;
在所述所述待挖掘信息对应的数据量超过预设阈值时,将所述待挖掘信息按照预设划分单位进行分块;
将分块后的待挖掘信息分发给所述分布式文件系统中的各个工作节点,以通过所述各个工作节点对所述待挖掘信息进行并行频繁项集挖掘,生成目标频繁项集。
6.如权利要求1所述的基于关联规则的信息推送方法,其特征在于,所述在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户的步骤包括:
在所述关联产品信息为所述目标用户信息和所述相关产品信息关联的第一产品信息时,将所述第一产品信息作为所述目标产品信息,并将所述目标产品信息推送至所述目标用户。
7.如权利要求1-6中任一项所述的基于关联规则的信息推送方法,其特征在于,所述在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户的步骤包括:
在所述关联产品信息包括所述目标用户信息关联的第二产品信息以及所述相关产品信息关联的第三产品信息时,将所述第二产品信息与所述第三产品信息之间的重复产品信息,作为所述目标产品信息,并将所述目标产品信息推送至所述目标用户。
8.一种基于关联规则的信息推送装置,其特征在于,所述基于关联规则的信息推送装置包括:
频繁项集生成模块,用于分别获取各个用户信息对应的各个历史产品记录,在各个历史产品记录对应的各个组合中确定支持度超过第一阈值的组合,作为频繁项集,并在所述频繁项集中确定置信度超过第二阈值的频繁项集,作为目标频繁项集;
关联规则确定模块,用于根据所述目标频繁项集,确定产品之间和/或用户信息与产品之间的关联规则;
关联产品确定模块,用于获取目标用户的目标用户信息和相关产品信息,并基于所述产品之间的关联规则和/或所述用户信息与产品之间的关联规则,确定所述目标用户信息和/或所述相关产品信息对应的关联产品信息;
目标信息推送模块,用于在所述关联产品信息中确定目标产品信息,并将所述目标产品信息推送至所述目标用户。
9.一种基于关联规则的信息推送设备,其特征在于,所述基于关联规则的信息推送设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的基于关联规则的信息推送程序,其中所述基于关联规则的信息推送程序被所述处理器执行时,实现如权利要求1至7中任一项所述的基于关联规则的信息推送方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于关联规则的信息推送程序,其中所述基于关联规则的信息推送程序被处理器执行时,实现如权利要求1至7中任一项所述的基于关联规则的信息推送方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111277126.XA CN113946755A (zh) | 2021-10-29 | 2021-10-29 | 基于关联规则的信息推送方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111277126.XA CN113946755A (zh) | 2021-10-29 | 2021-10-29 | 基于关联规则的信息推送方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113946755A true CN113946755A (zh) | 2022-01-18 |
Family
ID=79337223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111277126.XA Pending CN113946755A (zh) | 2021-10-29 | 2021-10-29 | 基于关联规则的信息推送方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113946755A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745492A (zh) * | 2023-12-20 | 2024-03-22 | 华南师范大学 | 一种基于教育云平台的教育资源共享方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120066087A1 (en) * | 2010-09-15 | 2012-03-15 | Alibaba Group Holding Limited | Generating product recommendations |
CN106407349A (zh) * | 2016-09-06 | 2017-02-15 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置 |
CN107251075A (zh) * | 2015-09-08 | 2017-10-13 | 深圳市赛亿科技开发有限公司 | 一种商品信息推送方法 |
CN108319628A (zh) * | 2017-02-22 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 一种用户兴趣确定方法及装置 |
CN109034935A (zh) * | 2018-06-06 | 2018-12-18 | 平安科技(深圳)有限公司 | 产品推荐方法、装置、计算机设备及存储介质 |
CN111932342A (zh) * | 2020-08-12 | 2020-11-13 | 中国银行股份有限公司 | 基于Apriori算法的用户冷启动产品推荐方法及系统 |
CN111951049A (zh) * | 2020-08-14 | 2020-11-17 | 中国工商银行股份有限公司 | 基于商品相似度的推荐方法及装置 |
CN112818226A (zh) * | 2021-01-28 | 2021-05-18 | 和美(深圳)信息技术股份有限公司 | 数据处理方法、推荐方法、装置、电子设备及存储介质 |
-
2021
- 2021-10-29 CN CN202111277126.XA patent/CN113946755A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120066087A1 (en) * | 2010-09-15 | 2012-03-15 | Alibaba Group Holding Limited | Generating product recommendations |
CN107251075A (zh) * | 2015-09-08 | 2017-10-13 | 深圳市赛亿科技开发有限公司 | 一种商品信息推送方法 |
CN106407349A (zh) * | 2016-09-06 | 2017-02-15 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置 |
CN108319628A (zh) * | 2017-02-22 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 一种用户兴趣确定方法及装置 |
CN109034935A (zh) * | 2018-06-06 | 2018-12-18 | 平安科技(深圳)有限公司 | 产品推荐方法、装置、计算机设备及存储介质 |
CN111932342A (zh) * | 2020-08-12 | 2020-11-13 | 中国银行股份有限公司 | 基于Apriori算法的用户冷启动产品推荐方法及系统 |
CN111951049A (zh) * | 2020-08-14 | 2020-11-17 | 中国工商银行股份有限公司 | 基于商品相似度的推荐方法及装置 |
CN112818226A (zh) * | 2021-01-28 | 2021-05-18 | 和美(深圳)信息技术股份有限公司 | 数据处理方法、推荐方法、装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745492A (zh) * | 2023-12-20 | 2024-03-22 | 华南师范大学 | 一种基于教育云平台的教育资源共享方法及系统 |
CN117745492B (zh) * | 2023-12-20 | 2024-05-24 | 华南师范大学 | 一种基于教育云平台的教育资源共享方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brintrup et al. | Supply chain data analytics for predicting supplier disruptions: a case study in complex asset manufacturing | |
US11995112B2 (en) | System and method for information recommendation | |
CN112148987B (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
US10235425B2 (en) | Entity fingerprints | |
US10504120B2 (en) | Determining a temporary transaction limit | |
JP6843882B2 (ja) | 履歴ログからの学習と、etlツール内のデータアセットに関するデータベースオペレーションの推奨 | |
CN102236663B (zh) | 一种基于垂直搜索的查询方法、系统和装置 | |
US20170192872A1 (en) | Interactive detection of system anomalies | |
CN106844407B (zh) | 基于数据集相关性的标签网络产生方法和系统 | |
CN116308684B (zh) | 一种网购平台店铺信息推送方法及系统 | |
WO2012115965A1 (en) | Entity fingerprints | |
CN112818230B (zh) | 内容推荐方法、装置、电子设备和存储介质 | |
CN115423555A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
JP6696568B2 (ja) | アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置 | |
CN113946755A (zh) | 基于关联规则的信息推送方法、装置、设备及存储介质 | |
Chu et al. | Adaptive convex clustering of generalized linear models with application in purchase likelihood prediction | |
CN111383072A (zh) | 一种用户信用评分方法、存储介质及服务器 | |
De Fréminville et al. | A column generation heuristic for districting the price of a financial product | |
CN113254732B (zh) | 企业关系的确定方法、装置、计算机设备和存储介质 | |
CN116186337A (zh) | 一种业务场景数据处理方法、系统及电子设备 | |
WO2021024966A1 (ja) | 企業類似度算出サーバ及び企業類似度算出方法 | |
US20110185167A1 (en) | Change impact research support device and change impact research support method | |
CN111460300A (zh) | 网络内容推送方法、装置及存储介质 | |
US10409931B1 (en) | Automatic combination of sub-process simulation results with dataset selection based on fitness under specific scenarios | |
Pappula et al. | Experimental survey on data mining techniques for association rule mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |