具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在淘宝等交易平台上往往会存在很多垃圾账号,垃圾账号可以理解为通过机器行为注册生成的具有团伙性质的批量账号。这些批量垃圾账号通常具有强烈的利益倾向,比如进行平台刷单炒作、营销活动作弊套利等风险行为。
垃圾账号在进行风险行为时往往会与其他账号发生一些资金关系(比如转账、交易)。一般情况下,会由一个资金大号统一为团伙内的垃圾账号提供进行风险行为的门槛资金(如刷单资金),同时垃圾账号的交易也都会在特定的商家或者交易对方聚集。
已知的常规垃圾账户识别规则中,会累计一段时间内与某个账户发生资金关系的账户数量,当超过一定阈值时就会认为有风险,比如:1天内收到某个相同账户转账的账户数大于20个,则认为这20个账户属于一个垃圾注册团伙;或,1天内与同一个商家发生交易的新注册账户数大于100个,则认为这100个账户属于一个垃圾注册团伙,等等。如果其中一些资金账户属于热点账户(天然会与较多账户有资金关系的账户,如财务账户、大商家),则会出现准确率不够的问题。
针对以上问题,本说明书实施例提供一种可疑群组识别方法,以及一种用于执行该方法的可疑群组识别装置。本说明书实施例提到的方法主要应用于交易平台,具体地,交易平台可以包括淘宝、京东等网上交易平台。
下面对本实施例涉及的可疑群组识别方法进行详细说明,参见图1所示,该方法可以包括以下步骤:
S101,确定描述不同账户节点之间资金流向的资金关系;
通常情况下,需要先获取一段时间之内的交易事件,并获取各个交易事件中的交易信息,其中,交易信息可包括每笔交易事件中的资金支出账户、资金收入账户、交易金额、交易类型,交易时间等等。
本步骤中,需要确定两两账户之间的资金流向关系,参见图2,将交易中的账户视为节点,账户间产生的资金关系视为边。当两个账户节点间存在资金流向关系时,为所述两个账户节点之间添加包含指向的边,以获取描述各个账户之间资金流向关系的网状图,将所述网状图确定为各个交易账户之间的资金关系图。其中,资金流向关系可以包括转账,支付等关系。
S102,从所述资金关系中筛选具有相同资金来源方和相同资金交易对方的账户节点,将筛选出的账户节点确定为具有相似关系的账户节点;
参见图3所示,左端的账户节点为资金来源方,右端的账户节点为资金交易对方,中间的多个账户节点接收同一个账户流入的资金,并向同一个账户流出资金。
以淘宝平台进行举例说明,垃圾团伙在进行风险活动时,例如为一个商品刷单时,需要动用批量垃圾账号分别和同一个店家完成多比交易,也就是向同一个资金交易对方完成多次资金流入。而批量垃圾账号中用于刷单的资金通常由垃圾团伙的一个资金账号来提供。
风险活动的通常流程为:确定风险活动需要的门槛资金,确定进行风险活动的多个垃圾账号,通过垃圾团伙的资金账号将门槛资金分别转账给多个垃圾账号,多个垃圾账号进行风险活动(刷单等),将门槛资金交易给同一店铺账号。
因此,存在一个账户A,称所有与账户A具有相同资金来源方和资金交易对方的账户为相似账户节点,称包括账户A在内的相似账户节点们为具有相似关系的群组。
进一步地,参见图4,还可通过交易事件中的具体属性信息筛选出相似度更符合预期的群组。也就是在具有相似关系的群组中,判断账户节点间的交易属性信息的一致性是否符合条件。
具体地,交易属性信息可以包括交易金额,交易时间,交易类型(支付,被支付,转账,被转账等)等。举例说明:在具有相似关系的账户群组中筛选出与交易对方之间交易金额相近的账户,或,在具有相似关系的账户群组中筛选出与资金来源方之间交易类型均为转账的账户……进而筛选出这些具有相似交易属性的账户,图4中,使用不同深度的线条在相似账户群组中进一步标识出相似交易属性账户,通过交易属性信息的一致性筛选,可使可疑群组的识别准确性更高。
S103,将具有相似关系的多个账户节点确定为可疑群组。
确定可疑群组后,还可根据可疑群组中具有相似资金关系的账户节点的数量确定该可疑群组的规模,根据所述可疑群组的规模估算对应的风险程度。
进一步地,可以通过控制规模的大小捕捉不同风险程度的垃圾团伙。应用在实际情况中可以是:将不同规模的可疑群组按照预先设定的相似账户的数量阈值分别划分到高风险区,中风险区,低风险区等。以便工作人员根据风险程度的不同安排不同的处理优先级。
本说明书实施例还提供一种更为具体的可疑群组识别方法,参见图5所示,该方法可以包括以下步骤:
S501,根据预定时间内的不同交易事件确定多个账户节点,当两个账户节点间存在资金流向关系时,为所述两个账户节点之间添加包含指向的边,以获取描述各个账户之间资金流向关系的网状图,将所述网状图确定为资金关系图。
S502,从所述资金关系中筛选具有相同资金来源方和相同资金交易对方的账户节点,将筛选出的账户节点确定为具有相似关系的账户节点;
S503,获取不同账户节点的交易事件中包含的交易属性信息,通过具有相似资金关系的账户节点间交易属性信息的一致性进一步筛选具有相似交易属性的账户节点;
S504,将具有相似关系的多个账户节点确定为可疑群组;
S505,根据可疑群组中具有相似资金关系的账户节点的数量确定所述可疑群组的规模,根据所述可疑群组的规模估算对应的风险程度。
相应于上述方法实施例,本说明书实施例还提供一种可疑群组识别装置,参见图6所示,所述装置可以包括:关系确定模块610,账户筛选模块620和群组确定模块630;
关系确定模块610:用于确定描述不同账户节点之间资金流向的资金关系;
账户筛选模块620:用于从所述资金关系中筛选具有相同资金来源方和相同资金交易对方的账户节点,将筛选出的账户节点确定为具有相似关系的账户节点;
群组确定模块630:用于将具有相似关系的多个账户节点确定为可疑群组。
本说明书提供的一种实施例中,可疑群组识别装置还包括:
风险估算模块:用于根据可疑群组中具有相似资金关系的账户节点的数量确定所述可疑群组的规模,根据所述可疑群组的规模估算对应的风险程度。
本说明书提供的一种实施例中,可疑群组识别装置还包括:
属性判断模块:用于获取不同账户节点的交易事件中包含的交易属性信息,通过具有相似资金关系的账户节点间交易属性信息的一致性进一步筛选具有相似交易属性的账户节点。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现前述可疑群组识别方法,所述方法至少包括:
确定描述不同账户节点之间资金流向的资金关系;
从所述资金关系中筛选具有相同资金来源方和相同资金交易对方的账户节点,将筛选出的账户节点确定为具有相似关系的账户节点;
将具有相似关系的多个账户节点确定为可疑群组。
图7示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的可疑群组识别方法,所述方法至少包括:
确定描述不同账户节点之间资金流向的资金关系;
从所述资金关系中筛选具有相同资金来源方和相同资金交易对方的账户节点,将筛选出的账户节点确定为具有相似关系的账户节点;
将具有相似关系的多个账户节点确定为可疑群组。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。