[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN115633366B - 用户离网预测方法、装置及计算机可读存储介质 - Google Patents

用户离网预测方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN115633366B
CN115633366B CN202211378780.4A CN202211378780A CN115633366B CN 115633366 B CN115633366 B CN 115633366B CN 202211378780 A CN202211378780 A CN 202211378780A CN 115633366 B CN115633366 B CN 115633366B
Authority
CN
China
Prior art keywords
user information
user
users
information sets
information set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211378780.4A
Other languages
English (en)
Other versions
CN115633366A (zh
Inventor
汪悦
高伟
王书元
李鹏飞
翟立柱
王思维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202211378780.4A priority Critical patent/CN115633366B/zh
Publication of CN115633366A publication Critical patent/CN115633366A/zh
Application granted granted Critical
Publication of CN115633366B publication Critical patent/CN115633366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/22Traffic simulation tools or models
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种用户离网预测方法、装置及计算机可读存储介质,涉及通信领域,能够提高用户离网预测结果的准确性。该方法包括:获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合;第一用户信息集合包括多个用户信息;第一通话信息集合包括与其他用户之间的多个通话记录;根据第一用户信息集合、第一通话信息集合和图卷积网络模型,得到待预测用户的离网预测结果;图卷积网络模型为根据多个历史用户在第二时间周期的第二用户信息集合和第二通话信息集合确定的,多个历史用户包括待预测用户,第二时间周期在第一时间周期之前。

Description

用户离网预测方法、装置及计算机可读存储介质
技术领域
本申请涉及通信领域,尤其涉及用户离网预测方法、装置及计算机可读存储介质。
背景技术
随着移动通信市场新用户增量的放缓,维护老用户对通信运营商越发重要。为维护老用户,需要先判断老用户是否想要离网,若老用户想要离网,则通信运营商可以针对该老用户施行一系列的维护措施,以降低该老用户离网的概率。
现有的用户离网预测方法主要是基于传统的机器学习分类算法和用户的用户信息预测用户是否要离网,例如,基于朴素贝叶斯算法、支持向量机(support vectormachine,SVM)算法、逻辑回归算法、径向基核函数神经网络算法、决策树算法和随机森林算法。
现有的方案仅基于用户的用户信息去预测用户是否要离网,在实际生活中,影响用户离网的因素并不只有用户本身,用户与用户之间的交互也会影响用户离网,因而,现有的用户离网预测结果的准确性较低。
发明内容
本申请提供一种用户离网预测方法、装置及计算机可读存储介质,能够提高用户离网预测结果的准确性。
为达到上述目的,本申请采用如下技术方案:
第一方面,提供了一种用户离网预测方法,该方法可以由用户离网预测装置执行,方法包括:获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合;第一用户信息集合包括多个用户信息;第一通话信息集合包括与其他用户之间的多个通话记录;根据第一用户信息集合、第一通话信息集合和图卷积网络模型,得到待预测用户的离网预测结果;图卷积网络模型为根据多个历史用户在第二时间周期的第二用户信息集合和第二通话信息集合确定的,多个历史用户包括待预测用户,第二时间周期在第一时间周期之前,每个第二用户信息集合包括每个历史用户的多个用户信息,每个第二通话信息集合包括每个历史用户与其他用户之间的多个通话记录。
基于该方案,通过获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合,根据第一用户信息集合、第一通话信息集合和图卷积网络模型,能够得到待预测用户的离网预测结果。相较于现有方案中仅基于用户信息判断用户是否想要离网的方案,本申请通过获取用户的通话信息集合,考虑了待预测用户与其他用户之间的交互对待预测用户离网的影响,因而提高了用户离网预测结果的准确性。
结合第一方面,在第一方面的某些实施方式中,方法还包括:获取多个第二用户信息集合和多个第二通话信息集合;对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合;将多个第三用户信息集合按照预设比例划分为训练集用户信息集合、验证集用户信息集合和测试集用户信息集合;对多个第二通话信息集合进行处理,得到第一拓扑结构图;第一拓扑结构图用于表征多个用户之间的通话频率;多个用户包括多个历史用户和其他用户;根据训练集用户信息集合和第一拓扑结构图对初始图卷积网络模型进行训练,得到图卷积网络模型;图卷积网络模型在验证集用户信息集合上的误差最小,图卷积网络模型在测试集用户信息集合上的离网预测结果与测试集用户信息集合对应的历史用户的离网结果一致。
基于该方案,能够实现通过获取多个第二用户信息集合和多个第二通话信息集合,确定出图卷积网络模型的方案。
结合第一方面,在第一方面的某些实施方式中,对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合,包括:对多个第二用户信息集合中取值为空值的用户信息进行补齐处理,得到多个第四用户信息集合;对多个第四用户信息集合进行归一化处理,得到多个第三用户信息集合。
基于该方案,能够实现对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合的方案。
结合第一方面,在第一方面的某些实施方式中,对多个第二通话信息集合进行处理,得到第一拓扑结构图,包括:将多个第二通话信息集合中的多个用户标识作为第一拓扑结构图中的节点;根据多个第二通话信息集合中的通话次数确定第一拓扑结构图;其中,第一拓扑结构图包括多个第一节点,三个第一节点两两之间通话次数大于第一阈值。
基于该方案,能够实现对多个第二通话信息集合进行处理,得到第一拓扑结构图的方案。
第二方面,提供了一种用户离网预测装置用于实现上述第一方面的用户离网预测方法。该用户离网预测装置包括实现上述方法相应的模块、单元、或手段(means),该模块、单元、或means可以通过硬件实现,软件实现,或者通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或单元。
结合第二方面,在第二方面的某些实施方式中,用户离网预测装置包括:获取模块和处理模块;获取模块,用于获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合;第一用户信息集合包括多个用户信息;第一通话信息集合包括与其他用户之间的多个通话记录;处理模块,用于根据第一用户信息集合、第一通话信息集合和图卷积网络模型,得到待预测用户的离网预测结果;图卷积网络模型为根据多个历史用户在第二时间周期的第二用户信息集合和第二通话信息集合确定的,多个历史用户包括待预测用户,第二时间周期在第一时间周期之前,每个第二用户信息集合包括每个历史用户的多个用户信息,每个第二通话信息集合包括每个历史用户与其他用户之间的多个通话记录。
结合第二方面,在第二方面的某些实施方式中,处理模块,还用于:获取多个第二用户信息集合和多个第二通话信息集合;对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合;将多个第三用户信息集合按照预设比例划分为训练集用户信息集合、验证集用户信息集合和测试集用户信息集合;对多个第二通话信息集合进行处理,得到第一拓扑结构图;第一拓扑结构图用于表征多个用户之间的通话频率;多个用户包括多个历史用户和其他用户;根据训练集用户信息集合和第一拓扑结构图对初始图卷积网络模型进行训练,得到图卷积网络模型;图卷积网络模型在验证集用户信息集合上的误差最小,图卷积网络模型在测试集用户信息集合上的离网预测结果与测试集用户信息集合对应的历史用户的离网结果一致。
结合第二方面,在第二方面的某些实施方式中,处理模块,还用于对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合,包括:对多个第二用户信息集合中取值为空值的用户信息进行补齐处理,得到多个第四用户信息集合;对多个第四用户信息集合进行归一化处理,得到多个第三用户信息集合。
结合第二方面,在第二方面的某些实施方式中,处理模块,还用于对多个第二通话信息集合进行处理,得到第一拓扑结构图,包括:将多个第二通话信息集合中的多个用户标识作为第一拓扑结构图中的节点;根据多个第二通话信息集合中的通话次数确定第一拓扑结构图;其中,第一拓扑结构图包括多个第一节点,三个第一节点两两之间通话次数大于第一阈值。
第三方面,提供了一种用户离网预测装置,包括:至少一个处理器、用于存储处理器可执行的指令的存储器;其中,处理器被配置为执行指令,以实现如第一方面及其任一种可能的实施方式所提供的方法。
第四方面,提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由用户离网预测装置的处理器执行时,使得用户离网预测装置能够执行如第一方面及其任一种可能的实施方式所提供的方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机可以执行上述第一方面及其任一种可能的实施方式所提供的方法。
第六方面,提供了一种芯片系统,包括:处理器和接口电路;接口电路,用于接收计算机程序或指令并传输至处理器;处理器用于执行计算机程序或指令,以使该芯片系统执执行如上述第一方面及其任一种可能的实施方式所提供的方法。
其中,第二方面至第六方面中任一种实施方式所带来的技术效果可参见上述第一方面不同实施方式所带来的技术效果,在此不再赘述。
附图说明
图1为本申请提供的一种用户离网预测系统的架构示意图;
图2为本申请提供的一种用户离网预测方法的流程示意图;
图3为本申请提供的又一种用户离网预测方法的流程示意图;
图4为本申请提供的又一种用户离网预测方法的流程示意图;
图5a为本申请提供的又一种用户离网预测方法的流程示意图;
图5b为本申请提供的一种高阶约束处理示意图;
图5c为本申请提供的又一种用户离网预测方法的流程示意图;
图6为本申请提供的一种用户离网预测装置的结构示意图;
图7为本申请提供的又一种用户离网预测装置的结构示意图。
具体实施方式
在本申请的描述中,除非另有说明,“多个”是指两个或多于两个。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
另外,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
同时,在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念,便于理解。
可以理解,说明书通篇中提到的“实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各个实施例未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。可以理解,在本申请的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
可以理解,在本申请中,“当…时”、“若”以及“如果”均指在某种客观情况下会做出相应的处理,并非是限定时间,且也不要求实现时一定要有判断的动作,也不意味着存在其它限定。
可以理解,本申请实施例中的一些可选的特征,在某些场景下,可以不依赖于其他特征,比如其当前所基于的方案,而独立实施,解决相应的技术问题,达到相应的效果,也可以在某些场景下,依据需求与其他特征进行结合。相应的,本申请实施例中给出的装置也可以相应的实现这些特征或功能,在此不予赘述。
本申请中,除特殊说明外,各个实施例之间相同或相似的部分可以互相参考。在本申请中各个实施例、以及各实施例中的各个实现方法中,如果没有特殊说明以及逻辑冲突,不同的实施例之间、以及各实施例中的各个实现方法之间的术语和/或描述具有一致性、且可以相互引用,不同的实施例、以及各实施例中的各个实现方法中的技术特征根据其内在的逻辑关系可以组合形成新的实施例、实施方式、实施方法、或实现方法。以下的本申请实施方式并不构成对本申请保护范围的限定。
图1为本申请提供的一种用户离网预测系统的架构示意图,本申请实施例的技术方案可以应用于图1所示的用户离网预测系统,如图1所示,用户离网预测系统10包括用户离网预测装置11、电子设备12。
其中,用户离网预测装置11与电子设备12直接连接或间接连接,该连接关系中,可以采用有线方式连接,也可以采用无线方式连接,本申请实施例对此不作限定。
用户离网预测装置11可以用于接收来自电子设备12的数据。
电子设备12可以用于将数据发送给用户离网预测装置11。
需要说明的是,用户离网预测装置11和电子设备12可以为相互独立的设备,也可以集成于同一设备中,本申请对此不作具体限定。
当用户离网预测装置11和电子设备12集成于同一设备时,用户离网预测装置11和电子设备12之间的通信方式为该设备内部模块之间的通信。这种情况下,二者之间的通信流程与“用户离网预测装置11和电子设备12之间相互独立的情况下,二者之间的通信流程”相同。
在本申请提供的以下实施例中,本申请以用户离网预测装置11和电子设备12相互独立设置为例进行说明。
在实际应用中,本申请实施例提供的用户离网预测方法可以应用于用户离网预测装置11,也可以应用于用户离网预测装置11中所包括的装置。
下面结合附图,以用户离网预测方法应用于用户离网预测装置11为例,对本申请实施例提供的用户离网预测方法进行描述。
图2为本申请提供的一种用户离网预测方法的流程示意图,如图2所示,该方法包括如下步骤:
S201、用户离网预测装置获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合。
其中,第一用户信息集合包括多个用户信息,第一通话信息集合包括与其他用户之间的多个通话记录。
需要说明的是,第一时间周期可以为一个月,例如,第一时间周期可以为5月份,或者,第一时间周期也可以为6月份,本申请对此不作限制。
用户信息可以为用户的个人信息,例如,用户信息可以为套餐信息,或者,用户信息也可以为通信账单信息,或者,用户信息也可以为流量消耗信息,本申请对此不作限制。
作为一种可能的实现方式,结合图1,用户离网预测装置获取来自电子设备12的消息,该消息中包括待预测用户的第一用户信息集合和待预测用户的第一通话信息集合。
S202、用户离网预测装置根据第一用户信息集合、第一通话信息集合和图卷积网络模型,得到待预测用户的离网预测结果。
其中,图卷积网络模型为根据多个历史用户在第二时间周期的第二用户信息集合和第二通话信息集合确定的,多个历史用户包括待预测用户,第二时间周期在第一时间周期之前,每个第二用户信息集合包括每个历史用户的多个用户信息,每个第二通话信息集合包括每个历史用户与其他用户之间的多个通话记录。
需要说明的是,第二时间周期可以为一个月,例如,若第一时间周期可以为5月份,第二时间周期可以为4月份,或者,若第一时间周期可以为6月份,第二时间周期可以为5月份,本申请对此不作限制。
待预测用户的离网预测结果可以通过0或1表示,例如,待预测用户的离网预测结果可以为0,0表示不离网,或者,待预测用户的离网预测结果可以为1,1表示离网,本申请对此不作限制。
作为一种可能的实现方式,用户离网预测装置对第一用户信息集合中取值为空值的用户信息进行补齐处理,得到第五用户信息集合,然后对第五用户信息集合进行归一化处理,得到第六用户信息集合,将第六信息集合和第一通话信息集合输入到图卷积网络模型中,得到待预测用户的离网预测结果。
作为一种示例,用户离网预测装置根据isnull()函数确定第一用户信息集合中的用户信息是否为空值,若存在取值为空值的用户信息,则用户离网预测装置采用线性插值法对该用户信息进行补齐数据处理,得到第五用户信息集合,然后根据构建图卷积网络模型时的相关参数对第五用户信息集合进行归一化处理,得到第六用户信息集合,最后将第六信息集合和第一通话信息集合输入到图卷积网络模型中,得到待预测用户的离网预测结果。
需要说明的是,插值法是一种从已知点计算未知点的近似计算方法,通过插值法中的多项式函数,能够通过已知点预测未知点。
基于该方案,通过获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合,根据第一用户信息集合、第一通话信息集合和图卷积网络模型,能够得到待预测用户的离网预测结果。相较于现有方案中仅基于用户信息判断用户是否想要离网的方案,本申请通过获取用户的通话信息集合,考虑了待预测用户与其他用户之间的交互对待预测用户离网的影响,因而提高了用户离网预测结果的准确性。
以上是对本申请的方案作了总体上的说明,下面将结合附图对本申请的方案作进一步的说明。
在一种设计中,图3为本申请提供的又一种用户离网预测方法的流程示意图,如图3所示,本申请提供的用户离网预测方法,还包括:
S301、用户离网预测装置获取多个第二用户信息集合和多个第二通话信息集合。
作为一种可能的实现方式,结合图1,用户离网预测装置获取来自电子设备12的消息,该消息中包括多个第二用户信息集合和多个第二通话信息集合。
S302、用户离网预测装置对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合。
作为一种可能的实现方式,用户离网预测装置将多个第二用户信息集合中取值为空值的用户信息补齐,然后再进行归一化处理,得到多个第三用户信息集合。
需要说明的是,该可能的实现方式的具体说明可以参考后续部分的说明,本申请在此不再赘述。
S303、用户离网预测装置将多个第三用户信息集合按照预设比例划分为训练集用户信息集合、验证集用户信息集合和测试集用户信息集合。
需要说明的是,预设比例可以为8:1:1,或者,预设比例也可以为6:2:2,本申请对此不作限制。
作为一种可能的实现方式,以预设比例为8:1:1为例,若多个第三用户信息集合的数量为10,则用户离网预测装置将该10个第三用户信息集合按照8:1:1的比例,划分出包括8个第三用户信息集合的训练集用户信息集合、包括1个第三用户信息集合的验证集用户信息集合和包括1个第三用户信息集合的测试集用户信息集合。
S304、用户离网预测装置对多个第二通话信息集合进行处理,得到第一拓扑结构图。
其中,第一拓扑结构图用于表征多个用户之间的通话频率,多个用户包括多个历史用户和其他用户。
作为一种可能的实现方式,用户离网预测装置将多个第二通话信息集合中的所有用户作为第一拓扑结构图中的节点,在多个用户中两两之间通话次数大于第一阈值的三个用户之间两两建立边,得到第一拓扑结构图。
需要说明的是,该可能的实现方式的具体说明可以参考后续部分的说明,本申请在此不再赘述。
S305、用户离网预测装置根据训练集用户信息集合和第一拓扑结构图对初始图卷积网络模型进行训练,得到图卷积网络模型。
其中,图卷积网络模型在验证集用户信息集合上的误差最小,图卷积网络模型在测试集用户信息集合上的离网预测结果与测试集用户信息集合对应的历史用户的离网结果一致。
需要说明的是,对于一张拓扑结构图G,拓扑结构图G包括节点V、边E和邻接矩阵A,节点V和边E可以表示为G=(V,E)。
图卷积网络模型是一种从拓扑结构图中提取特征的模型,能够解决节点分类、图分类、边预测等问题。图卷积网络模型中每层的计算公式如下公式1所示:
其中,H表示层,l表示层数,W表示层与层之间的权值矩阵,I为单位矩阵,的次数矩阵,是对邻接矩阵A作了一个对称的归一化,σ表示预设系数。
在确定每层的计算结果后,接两层全连接层,通过sigmoid函数确定预测结果。
表1为本申请提供的一种图卷积网络模型运行环境示例。
表1:图卷积网络模型运行环境
中央处理器(central processing unit,CPU) Intel(R)Core(TM)i7-10870H
图形处理器(graphics processing unit,GPU) NVIDIA GeForce RTX 3060
内存 32G
Python 3.6.5
Pytorch 1.8.0+cu111
如表1所示,运行图卷积网络模型的设备的CPU为Intel(R)Core(TM)i7-10870H,GPU为NVIDIA GeForce RTX 3060,内存为32G,Python版本为3.6.5,Pytorch版本为1.8.0+cu111。
表2为本申请提供的一种预设图卷积网络模型参数示例。
表2:预设图卷积网络模型参数
batch size 16
epoch 50
learning rate 0.001
dropout 0.3
weight decay rate 0.0001
clip 5
gcn层数 2
如表2所示预设图卷积网络模型的batch size为16,epoch为50,learning rate为0.001,dropout为0.3,weight decay rate为0.0001,clip为5,gcn层数为2。
作为一种可能的实现方式,用户离网预测装置将训练集用户信息集合和第一拓扑结构图输入初始图卷积网络模型,通过多次训练,直至初始图卷积网络模型在验证集用户信息集合上的误差不再下降,得到中间图卷积网络模型。基于中间图卷积网络模型的最优参数在测试集上确定测试集的离网预测结果,在离网预测结果与测试集用户信息集合对应的历史用户的离网结果一致的情况下,将中间图卷积网络模型确定为图卷积网络模型。
基于该方案,能够实现通过获取多个第二用户信息集合和多个第二通话信息集合,确定出图卷积网络模型的方案。
在一种设计中,图4为本申请提供的又一种用户离网预测方法的流程示意图,如图4所示,本申请具体实施方式提供的S302,具体包括:
S401、用户离网预测装置对多个第二用户信息集合中取值为空值的用户信息进行补齐处理,得到多个第四用户信息集合;
作为一种可能的实现方式,用户离网预测装置根据isnull()函数确定多个第二用户信息集合中的用户信息是否为空值,若存在取值为空值的用户信息,则用户离网预测装置采用线性插值法将该用户信息进行补齐数据处理,得到多个第四用户信息集合。
该可能的实现方式的具体实现方案可以参考现有的方案,本申请在此不再说明。
S402、用户离网预测装置对多个第四用户信息集合进行归一化处理,得到多个第三用户信息集合。
作为一种可能的实现方式,用户离网预测装置通过以下公式2对多个第四用户信息集合中的每个用户信息进行归一化处理。
其中,x*表示归一化处理后的用户信息,x表示用户信息,min表示第四用户信息集合中与用户信息x同类型的多个用户信息中的最小值,max表示第四用户信息集合中与用户信息x同类型的多个用户信息中的最大值。基于公式2,用户离网预测装置能够将多个第四用户信息集合映射到[0,1]区间,得到第三用户信息集合。
基于该方案,能够实现对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合的方案。
在一种设计中,图5a为本申请提供的又一种用户离网预测方法的流程示意图,如图5a所示,本申请具体实施方式提供的S304,具体包括:
S501、用户离网预测装置将多个第二通话信息集合中的多个用户标识作为第一拓扑结构图中的节点。
作为一种可能的实现方式,用户离网预测装置获取多个第二通话信息集合中的多个初始用户标识,对多个初始用户标识进行去重处理,得到多个用户标识,将该多个用户标识作为第一拓扑结构中的节点。
S502、用户离网预测装置根据多个第二通话信息集合中的通话次数确定第一拓扑结构图。
其中,第一拓扑结构图包括多个第一节点,三个第一节点两两之间通话次数大于第一阈值。
需要说明的是,第一阈值可以为5,或者,第一阈值也可以为6,本申请对此不作限制。
作为一种可能的实现方式,以第一阈值为5为例,用户离网预测装置在存在通话记录的两个节点之间建立边,得到初始第一拓扑结构图,删除初始第一拓扑结构图中通话次数少于5次的两个节点之间的边,得到中间第一拓扑结构图,对中间第一拓扑结构图进行高阶约束处理,得到第一拓扑结构图。
示例性的,图5b为本申请提供的一种高阶约束处理示意图,如图5b所示,图5b中的(1)为中间第一拓扑结构图,中间第一拓扑结构图未经过高阶约束处理,图5b中的(2)为第一拓扑结构图,第一拓扑结构图经过了高阶约束处理。
基于该方案,能够实现对多个第二通话信息集合进行处理,得到第一拓扑结构图的方案。
图5c为本申请提供的又一种用户离网预测方法的流程示意图,如图5c所示,该方法包括如下步骤:
S601、用户离网预测装置获取多个第二用户信息集合和多个第二通话信息集合。
需要说明的是,该步骤的具体说明可以参考上述S301的说明,本申请在此不再赘述。
S602、用户离网预测装置对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合。
需要说明的是,该步骤的具体说明可以参考上述S302的说明,本申请在此不再赘述。
S603、用户离网预测装置将多个第三用户信息集合按照预设比例划分为训练集用户信息集合、验证集用户信息集合和测试集用户信息集合。
需要说明的是,该步骤的具体说明可以参考上述S303的说明,本申请在此不再赘述。
S604、用户离网预测装置对多个第二通话信息集合进行处理,得到第一拓扑结构图。
需要说明的是,该步骤的具体说明可以参考上述S304的说明,本申请在此不再赘述。
S605、用户离网预测装置根据训练集用户信息集合和第一拓扑结构图对初始图卷积网络模型进行训练。
需要说明的是,该步骤对初始图卷积网络模型进行训练的具体方案可以参考现有的模型训练方案,本申请对此不再赘述。
S606、用户离网预测装置判断图卷积网络模型在验证集用户信息集合上的误差是否最小。
需要说明的是,在图卷积网络模型在验证集用户信息集合上的误差不再下降的情况下,确定图卷积网络模型在验证集用户信息集合上的误差最小。
在是的情况下,用户离网预测装置执行S607。在否的情况下,用户离网预测装置重复执行S606。
S607、用户离网预测装置得到图卷积网络模型。
在得到图卷积网络模型后,后续即能通过该模型判断用户是否要离网。
上述主要从用户离网预测装置执行用户离网预测方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,用户离网预测装置包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对用户离网预测装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。可选的,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。此外,这里的“模块”可以指特定专用集成电路(application-specific integrated circuit,ASIC),电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。
在采用功能模块划分的情况下,图6示出了一种用户离网预测装置的结构示意图。如图6所示,该用户离网预测装置60包括获取模块601和处理模块602。
在一些实施例中,该用户离网预测装置60还可以包括存储模块(图6中未示出),用于存储程序指令和数据。
其中,获取模块601,用于获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合;第一用户信息集合包括多个用户信息;第一通话信息集合包括与其他用户之间的多个通话记录;处理模块602,用于根据第一用户信息集合、第一通话信息集合和图卷积网络模型,得到待预测用户的离网预测结果;图卷积网络模型为根据多个历史用户在第二时间周期的第二用户信息集合和第二通话信息集合确定的,多个历史用户包括待预测用户,第二时间周期在第一时间周期之前,每个第二用户信息集合包括每个历史用户的多个用户信息,每个第二通话信息集合包括每个历史用户与其他用户之间的多个通话记录。
可选的,处理模块602,还用于:获取多个第二用户信息集合和多个第二通话信息集合;对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合;将多个第三用户信息集合按照预设比例划分为训练集用户信息集合、验证集用户信息集合和测试集用户信息集合;对多个第二通话信息集合进行处理,得到第一拓扑结构图;第一拓扑结构图用于表征多个用户之间的通话频率;多个用户包括多个历史用户和其他用户;根据训练集用户信息集合和第一拓扑结构图对初始图卷积网络模型进行训练,得到图卷积网络模型;图卷积网络模型在验证集用户信息集合上的误差最小,图卷积网络模型在测试集用户信息集合上的离网预测结果与测试集用户信息集合对应的历史用户的离网结果一致。
可选的,处理模块602,还用于对多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合,包括:对多个第二用户信息集合中取值为空值的用户信息进行补齐处理,得到多个第四用户信息集合;对多个第四用户信息集合进行归一化处理,得到多个第三用户信息集合。
可选的,处理模块602,还用于对多个第二通话信息集合进行处理,得到第一拓扑结构图,包括:将多个第二通话信息集合中的多个用户标识作为第一拓扑结构图中的节点;根据多个第二通话信息集合中的通话次数确定第一拓扑结构图;其中,第一拓扑结构图包括多个第一节点,三个第一节点两两之间通话次数大于第一阈值。
上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
在采用硬件的形式实现上述功能模块的功能的情况下,图7示出了一种用户离网预测装置的结构示意图。如图7所示,该用户离网预测装置70包括处理器701,存储器702以及总线703。处理器701与存储器702之间可以通过总线703连接。
处理器701是用户离网预测装置70的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器701可以是一个通用中央处理单元(central processingunit,CPU),也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
作为一种实施例,处理器701可以包括一个或多个CPU,例如图7中所示的CPU 0和CPU 1。
存储器702可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
作为一种可能的实现方式,存储器702可以独立于处理器701存在,存储器702可以通过总线703与处理器701相连接,用于存储指令或者程序代码。处理器701调用并执行存储器702中存储的指令或程序代码时,能够实现本申请实施例提供的用户离网预测方法。
另一种可能的实现方式中,存储器702也可以和处理器701集成在一起。
总线703,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外围设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
需要指出的是,图7示出的结构并不构成对该用户离网预测装置70的限定。除图7所示部件之外,该用户离网预测装置70可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
作为一个示例,结合图6,用户离网预测装置60中的获取模块601和处理模块602实现的功能与图7中的处理器701的功能相同。
可选的,如图7所示,本申请实施例提供的用户离网预测装置70还可以包括通信接口704。
通信接口704,用于与其他设备通过通信网络连接。该通信网络可以是以太网,无线接入网,无线局域网(wireless local area networks,WLAN)等。通信接口704可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。
在一种可能的实现方式中,本申请实施例提供的用户离网预测装置70中,通信接口704还可以集成在处理器701中,本申请实施例对此不做具体限定。
作为一种可能的产品形态,本申请实施例的用户离网预测装置,还可以使用下述来实现:一个或多个现场可编程门阵列(field programmable gate array,FPGA)、可编程逻辑器件(programmable logic device,PLD)、控制器、状态机、门逻辑、分立硬件部件、任何其它适合的电路、或者能够执行本申请通篇所描述的各种功能的电路的任意组合。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元的划分进行举例说明。在实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将装置的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序或指令,计算机程序或指令被执行时使得计算机执行上述方法实施例所示的方法流程中的各个步骤。
本申请的实施例提供一种包含指令的计算机程序产品,当指令在计算机上运行时,使得计算机执行上述方法实施例所示的方法流程中的各个步骤。
本申请实施例提供一种芯片系统,包括:处理器和接口电路;接口电路,用于接收计算机程序或指令并传输至处理器;处理器用于执行计算机程序或指令,以使该芯片系统执行上述方法实施例所示的方法流程中的各个步骤。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘。随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的人以合适的组合、或者本领域数值的任何其他形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途ASIC中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
由于本实施例提供的用户离网预测装置、计算机可读存储介质、计算机程序产品可以应用于上述由于本实施例提供的用户离网预测方法,因此,其所能获得的技术效果也可参考上述方法实施例,本申请实施例在此不再赘述。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (6)

1.一种用户离网预测方法,其特征在于,所述方法包括:
获取多个历史用户在第二时间周期的多个第二用户信息集合和多个第二通话信息集合;每个所述第二用户信息集合包括每个所述历史用户的多个用户信息,每个所述第二通话信息集合包括每个所述历史用户与其他用户之间的多个通话记录;
对所述多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合;
将所述多个第三用户信息集合按照预设比例划分为训练集用户信息集合、验证集用户信息集合和测试集用户信息集合;
将所述多个第二通话信息集合中的多个用户标识作为节点,在存在通话记录的两个节点之间建立边,得到初始第一拓扑结构图;
删除所述初始第一拓扑结构图中通话次数少于第一阈值的两个节点之间的边,得到中间第一拓扑结构图;
对所述中间第一拓扑结构图进行高阶约束处理,得到第一拓扑结构图;所述第一拓扑结构图用于表征多个用户之间的通话频率;所述多个用户包括所述多个历史用户和所述其他用户;
根据所述训练集用户信息集合和所述第一拓扑结构图对初始图卷积网络模型进行训练,得到图卷积网络模型;所述图卷积网络模型在所述验证集用户信息集合上的误差最小,所述图卷积网络模型在所述测试集用户信息集合上的离网预测结果与所述测试集用户信息集合对应的历史用户的离网结果一致;所述图卷积网络模型中每层的计算公式满足以下公式:
其中,H表示层,l表示层数,W表示层与层之间的权值矩阵,I为单位矩阵,的次数矩阵,是对邻接矩阵A作了一个对称的归一化,σ表示预设系数;所述图卷积网络模型的预测结果为确定每层的计算结果后,接两层全连接层,通过sigmoid函数确定的;
获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合;所述第一用户信息集合包括多个用户信息;所述第一通话信息集合包括与所述其他用户之间的多个通话记录,所述第一时间周期在所述第二时间周期之后;
根据所述第一用户信息集合、所述第一通话信息集合和所述图卷积网络模型,得到所述待预测用户的离网预测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合,包括:
对所述多个第二用户信息集合中取值为空值的用户信息进行补齐处理,得到多个第四用户信息集合;
对所述多个第四用户信息集合进行归一化处理,得到所述多个第三用户信息集合。
3.一种用户离网预测装置,其特征在于,所述用户离网预测装置包括:获取模块和处理模块;
所述处理模块,用于:
获取多个历史用户在第二时间周期的多个第二用户信息集合和多个第二通话信息集合;每个所述第二用户信息集合包括每个所述历史用户的多个用户信息,每个所述第二通话信息集合包括每个所述历史用户与其他用户之间的多个通话记录;
对所述多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合;
将所述多个第三用户信息集合按照预设比例划分为训练集用户信息集合、验证集用户信息集合和测试集用户信息集合;
将所述多个第二通话信息集合中的多个用户标识作为节点,在存在通话记录的两个节点之间建立边,得到初始第一拓扑结构图;
删除所述初始第一拓扑结构图中通话次数少于第一阈值的两个节点之间的边,得到中间第一拓扑结构图;
对所述中间第一拓扑结构图进行高阶约束处理,得到第一拓扑结构图;所述第一拓扑结构图用于表征多个用户之间的通话频率;所述多个用户包括所述多个历史用户和所述其他用户;
根据所述训练集用户信息集合和所述第一拓扑结构图对初始图卷积网络模型进行训练,得到图卷积网络模型;所述图卷积网络模型在所述验证集用户信息集合上的误差最小,所述图卷积网络模型在所述测试集用户信息集合上的离网预测结果与所述测试集用户信息集合对应的历史用户的离网结果一致;所述图卷积网络模型中每层的计算公式满足以下公式:
其中,H表示层,l表示层数,W表示层与层之间的权值矩阵,I为单位矩阵,的次数矩阵,是对邻接矩阵A作了一个对称的归一化,σ表示预设系数;所述图卷积网络模型的预测结果为确定每层的计算结果后,接两层全连接层,通过sigmoid函数确定的;
所述获取模块,用于获取待预测用户在第一时间周期的第一用户信息集合和第一通话信息集合;所述第一用户信息集合包括多个用户信息;所述第一通话信息集合包括与所述其他用户之间的多个通话记录,所述第一时间周期在所述第二时间周期之后;
所述处理模块,还用于根据所述第一用户信息集合、第一通话信息集合和图卷积网络模型,得到所述待预测用户的离网预测结果。
4.根据权利要求3所述的用户离网预测装置,其特征在于,所述处理模块,还用于对所述多个第二用户信息集合进行归一化处理,得到多个第三用户信息集合,包括:
对所述多个第二用户信息集合中取值为空值的用户信息进行补齐处理,得到多个第四用户信息集合;
对所述多个第四用户信息集合进行归一化处理,得到所述多个第三用户信息集合。
5.一种用户离网预测装置,其特征在于,所述用户离网预测装置包括:处理器,所述处理器与存储器耦合,所述存储器用于存储程序或指令,当所述程序或指令被所述处理器执行时,使得所述用户离网预测装置执行如权利要求1或2所述的方法。
6.一种计算机可读存储介质,其上存储有计算机程序或指令,其特征在于,所述计算机程序或指令被执行时使得计算机执行如权利要求1或2所述的方法。
CN202211378780.4A 2022-11-04 2022-11-04 用户离网预测方法、装置及计算机可读存储介质 Active CN115633366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211378780.4A CN115633366B (zh) 2022-11-04 2022-11-04 用户离网预测方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211378780.4A CN115633366B (zh) 2022-11-04 2022-11-04 用户离网预测方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN115633366A CN115633366A (zh) 2023-01-20
CN115633366B true CN115633366B (zh) 2024-07-19

Family

ID=84908087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211378780.4A Active CN115633366B (zh) 2022-11-04 2022-11-04 用户离网预测方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN115633366B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610552A (zh) * 2021-06-25 2021-11-05 清华大学 一种用户流失预测方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7801905B1 (en) * 2003-11-25 2010-09-21 Prabhdeep Singh Knowledge archival and recollection systems and methods
CN108712279B (zh) * 2018-04-27 2021-08-17 中国联合网络通信集团有限公司 用户离网的预测方法及装置
US11373233B2 (en) * 2019-02-01 2022-06-28 Target Brands, Inc. Item recommendations using convolutions on weighted graphs
CN111612122B (zh) * 2019-02-25 2023-08-08 北京嘀嘀无限科技发展有限公司 实时需求量的预测方法、装置及电子设备
CN112583610B (zh) * 2019-09-27 2023-04-11 顺丰科技有限公司 系统状态的预测方法、装置、服务器及存储介质
CN110971460A (zh) * 2019-12-03 2020-04-07 北京红山信息科技研究院有限公司 一种离网预测方法、装置、服务器和存储介质
CN111047410B (zh) * 2019-12-16 2024-02-20 腾讯科技(深圳)有限公司 推荐方法、装置、终端设备以及存储介质
CN111917574B (zh) * 2020-07-21 2023-06-20 上海阿尔卡特网络支援系统有限公司 社交网络拓扑模型及构建方法、用户置信度和亲密度计算方法及电信诈骗智能拦截系统
CN113706187A (zh) * 2021-07-13 2021-11-26 杭州电子科技大学 一种基于时空图卷积的电信用户流失行为预测方法及系统
CN114117200A (zh) * 2021-10-23 2022-03-01 北京奇保信安科技有限公司 一种提升用户转化率的资源展示方法、系统和电子设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610552A (zh) * 2021-06-25 2021-11-05 清华大学 一种用户流失预测方法及装置

Also Published As

Publication number Publication date
CN115633366A (zh) 2023-01-20

Similar Documents

Publication Publication Date Title
CN110533085A (zh) 同人识别方法及装置、存储介质、计算机设备
CN110971460A (zh) 一种离网预测方法、装置、服务器和存储介质
CN112308345A (zh) 通信网络负荷预测方法、装置及服务器
CN114816738A (zh) 算力节点的确定方法、装置、设备及计算机可读存储介质
CN106327236B (zh) 一种确定用户行动轨迹的方法及装置
CN111275453A (zh) 一种物联网设备的行业识别方法及系统
CN115633366B (zh) 用户离网预测方法、装置及计算机可读存储介质
CN107659982B (zh) 一种无线网络接入点的分类方法及装置
CN109508087A (zh) 脑纹信号识别方法及终端设备
CN107528969A (zh) 电话拨打时间的管理方法、管理装置及终端设备
CN113795032B (zh) 室分隐形故障的判断方法、装置、存储介质及设备
CN113438689B (zh) 一种基站节能方法、装置、设备及存储介质
CN113486933A (zh) 模型训练方法、用户身份信息预测方法及装置
CN116669150A (zh) 星地融合网络选择方法、装置及计算机可读存储介质
CN115797726A (zh) 模型获得方法、装置、电子设备及存储介质
CN111026816B (zh) 基于知识图谱的高净值客户群识别方法、装置及存储介质
CN114399173A (zh) 一种5g基站站址的评估方法、装置及电子设备
CN115767569A (zh) 业务预测方法和装置、电子设备及可读存储介质
CN113205231A (zh) 一种离网预测方法及装置
CN112764923A (zh) 计算资源分配方法、装置、计算机设备及存储介质
CN113516562A (zh) 家庭社交网络构建方法、装置、设备及存储介质
CN116112381B (zh) 维系渠道的确定方法、装置及计算机可读存储介质
CN117715046A (zh) 数据处理方法、装置及计算机可读存储介质
US20240013027A1 (en) Model recommendation method and apparatus, and computer device
CN117592437A (zh) 数据处理方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant