[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN108093405A - 一种诈骗电话号码分析方法和设备 - Google Patents

一种诈骗电话号码分析方法和设备 Download PDF

Info

Publication number
CN108093405A
CN108093405A CN201711079207.2A CN201711079207A CN108093405A CN 108093405 A CN108093405 A CN 108093405A CN 201711079207 A CN201711079207 A CN 201711079207A CN 108093405 A CN108093405 A CN 108093405A
Authority
CN
China
Prior art keywords
fraudulent call
call number
fraudulent
telephone number
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711079207.2A
Other languages
English (en)
Inventor
双锴
张俊丰
杨烨蔓
苏森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201711079207.2A priority Critical patent/CN108093405A/zh
Publication of CN108093405A publication Critical patent/CN108093405A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/22Traffic simulation tools or models

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种诈骗电话号码分析方法和设备,分析方法包括:获取原始话单中电话号码的异常行为数据和特征数据;异常行为数据包括异常号码呼叫次数、空号呼叫次数和陌生号码呼叫次数中一种或多种;特征数据包括活跃程度和通话数据,其中,活跃程度包括日呼叫频次和/或呼叫密集时段,通话数据包括接通率、最早通话时间、最晚通话时间、平均通话时长、主要呼叫地区和平均振铃时间中一种或多种;将两种数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果。本发明能对电话号码是否是诈骗电话号码进行精确分析;得到多维度诈骗电话号码分析模型,从而能够全面地对电话号码是否是诈骗电话号码进行分析。

Description

一种诈骗电话号码分析方法和设备
技术领域
本发明涉及电信诈骗监测防护领域,更具体地,涉及一种诈骗电话号码分析方法和设备。
背景技术
近年来利用电话进行的诈骗的事件呈爆发趋势,受骗面广,受害者受骗金额巨大,电信诈骗成为电信用户的痛点。目前的诈骗电话手段也多种多样,诈骗者常通过软件进行改号,并仿冒银行,运营商,熟人,社保等进行欺诈行为。2013年,全国通信诈骗案有30余万起,受害者受骗近100亿元;2014年,全国通信诈骗案有40余万起,受害者受骗近107亿元;2015年全国公安机关共立电信诈骗案件59万起,同比上升32.5%,造成经济损失近222亿元。
近10年来,我国电信诈骗案件每年以20%-30%的速度快速增长。全国共发生被骗千万元以上的电信诈骗案件104起,百万元以上的案件2392起。很多群众的“养老钱”“救命钱”被骗,倾家荡产、家破人亡;有的企业资金被骗,破产倒闭,引发很多群体性事件。在目前的电信诈骗当中,诈骗者拥有多样的诈骗手段,让人防不胜防,严重影响了电信安全和通话秩序,损害了电信用户的利益以及电信网的信誉。
有鉴于上述电信诈骗案件频发,社会影响恶劣的背景下,出现了一些对于诈骗电话号码进行分析比较的方法,但是,在现有的方法中,大都只是对话单中的抽样的电话号码进行多次筛选和比较,并进行一系列复杂的运算,这些方法比较复杂,不够简单全面。
发明内容
本发明提供一种克服上述现有的方法中,比较复杂,不够简单全面的一种诈骗电话号码分析方法和设备。
根据本发明的一个方面,提供一种诈骗电话号码分析方法,包括:获取原始话单中的电话号码的异常行为数据和特征数据;所述异常行为数据包括异常号码呼叫次数、空号呼叫次数和陌生号码呼叫次数中的一种或多种;所述特征数据包括活跃程度和通话数据,其中,所述活跃程度包括日呼叫频次和/或呼叫密集时段,所述通话数据包括接通率、最早通话时间、最晚通话时间、平均通话时长、主要呼叫地区和平均振铃时间中的一种或多种;将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果。
优选地,所述训练好的诈骗电话号码分析模型通过以下步骤获取:根据已知的诈骗电话号码库和非诈骗电话号码库构建训练集;对所述训练集中的数据提取异常行为数据和特征数据,并输入诈骗电话号码分析模型进行逐层训练:确定所述异常行为数据和所述特征数据的异常取值范围,并确定每一特征数据的权重;通过权重系数算法获取电话号码属于诈骗电话号码的条件概率,并通过加权朴素贝叶斯分类算法获得所述训练好的诈骗电话号码分析模型。
优选地,所述将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果进一步包括:在所述诈骗电话号码分析模型的第一层中判断所述话单中的电话号码是否具有异常行为,将具有异常行为的电话号码录入所述诈骗电话号码分析结果,除录入的所述电话号码外,余下的电话号码进入所述诈骗电话号码分析模型的第二层;在所述诈骗电话号码分析模型的第二层中获取所述诈骗电话号码分析结果。
优选地,所述在所述诈骗电话号码分析模型的第一层中判断所述话单中的电话号码是否具有异常行为,将具有异常行为的电话号码录入所述诈骗电话号码分析结果进一步包括:在所述诈骗电话号码分析模型的第一层,若在一段时间内任一电话号码中所述异常行为数据的值处于所述异常取值范围,则确定所述任一电话号码具有异常行为,将所述任一电话号码识别为诈骗电话号码,并将所述诈骗电话号码录入所述诈骗电话号码分析结果。
优选地,所述在所述诈骗电话号码分析模型的第二层中获取所述诈骗电话号码分析结果进一步包括:在所述诈骗电话号码分析模型的第二层,根据所述特征数据和所述异常取值范围,通过权重系数算法,获取任一所述特征数据对应的电话号码为诈骗电话号码的条件概率;根据所述条件概率和所述权重,通过加权朴素贝叶斯分类算法,将任一所述特征数据对应的电话号码分类成诈骗电话号码、疑似诈骗电话号码和正常电话号码中的任一种,并将任一所述特征数据对应的电话号码的类型作为所述诈骗电话号码分析结果。
优选地,所述将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果之后还包括:分析所述诈骗电话号码的所在地和仿冒类型,并录入所述诈骗电话号码分析结果。
优选地,所述诈骗电话号码分析结果包括:在诈骗电话号码分析模型的第一层录入的诈骗电话号码;在诈骗电话号码分析模型的第二层,将任一所述特征数据对应的电话号码分类成诈骗电话号码、疑似诈骗电话号码和正常电话号码中的任一种;每一所述诈骗电话号码的所在地和仿冒类型。
优选地,所述获取原始话单中的电话号码的异常行为数据和特征数据进一步包括:从大数据中获取所述原始话单中的电话号码,并对所述原始话单中的电话号码进行预处理,获取所述异常行为数据和所述特征数据。
优选地,所述分析所述诈骗电话号码的所在地和仿冒类型,并录入所述诈骗电话号码分析结果之后还包括:将所述诈骗电话号码分析结果导入所述训练集。
根据本发明的另一个方面,提供一种诈骗电话号码分析设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上述任一所述的分析方法。
本发明提供的一种诈骗电话号码分析方法和设备,通过设置在训练好的诈骗电话号码分析模型中通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果,能够简单地对电话号码是否是诈骗电话号码进行精确分析,维护电信网的安全;通过对异常行为数据和特征数据进行分类,能够得到针对多维度的诈骗电话号码分析模型,从而能够全面地对电话号码是否是诈骗电话号码进行分析。
附图说明
图1为本发明实施例中的一种诈骗电话号码分析方法的流程图;
图2为本发明实施例中的一种诈骗电话号码分析设备的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
图1为本发明实施例中的一种诈骗电话号码分析方法的流程图,如图1所示,所述分析方法包括:获取原始话单中的电话号码的异常行为数据和特征数据;所述异常行为数据包括异常号码呼叫次数、空号呼叫次数和陌生号码呼叫次数中的一种或多种;所述特征数据包括活跃程度和通话数据,其中,所述活跃程度包括日呼叫频次和/或呼叫密集时段,所述通话数据包括接通率、最早通话时间、最晚通话时间、平均通话时长、主要呼叫地区和平均振铃时间中的一种或多种;将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果。
具体地,所述异常行为数据包括异常号码呼叫次数、空号呼叫次数和陌生号码呼叫次数。其中,所述异常号码呼叫是指对手机无法识别的电话号码或者特殊号段电话号码进行呼叫。所述空号呼叫是指诈骗者使用软件对空号进行呼叫,空号是在电信网中由于用户销户、换号、挂失和欠费停机等情况出现的电话号码段为空的情况。所述陌生号码呼叫是指诈骗者对某号段号码进行连续呼叫产生的陌生号码呼叫。
进一步地,所述特征数据包括活跃程度和通话数据。其中,所述活跃程度包括日呼叫频次和呼叫密集时段,但不限于此。所述通话数据包括接通率,最早通话时间、最晚通话时间,平均通话时长,主要呼叫地区和平均振铃时间,但不限于此。
进一步地,所述加权朴素贝叶斯分类算法是指通过计算后验概率来对样本进行分类。例如:假定X表示主叫平均振铃时长小于0.5秒并且被叫平均通话时长小于1秒,H表示假定X是骚扰电话,则P(H|X)表示当电话号码X的主叫平均时长小于0.5秒并且被叫平均通话时长小于1秒时,电话号码X是诈骗电话号码的确信程度。
在加权朴素贝叶斯分类算法中,根据重要性为各特征数据赋予权值,特征数据的权值越大,代表该特征数据对分类的影响就越大。优选地,特征数据中的活跃程度及通话情况是判断诈骗电话号码的重要依据,可以将其权值设定比重加大,以提高识别效率。
本发明提供的一种诈骗电话号码分析方法,通过设置在训练好的诈骗电话号码分析模型中通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果,能够简单地对电话号码是否是诈骗电话号码进行精确分析,维护电信网的安全;通过对异常行为数据和特征数据进行分类,能够得到针对多维度的诈骗电话号码分析模型,从而能够全面地对电话号码是否是诈骗电话号码进行分析。本发明提供的一种诈骗电话号码分析方法,通过设置对原始话单中的电话号码进行格式转换,使得获取的经格式转换后的话单中的电话号码便于后续的诈骗电话号码分析。
基于上述实施例,所述训练好的诈骗电话号码分析模型通过以下步骤获取:根据已知的诈骗电话号码库和非诈骗电话号码库构建训练集;对所述训练集中的数据提取异常行为数据和特征数据,并输入诈骗电话号码分析模型进行逐层训练:确定所述异常行为数据和所述特征数据的异常取值范围,并确定每一特征数据的权重;通过权重系数算法获取电话号码属于诈骗电话号码的条件概率,并通过加权朴素贝叶斯分类算法获得所述训练好的诈骗电话号码分析模型。
具体地,异常行为数据和特征数据的异常取值范围是通过统计学确定的。
具体地,以所述异常取值范围界定特征属性取值有重合部分的诈骗电话和正常主叫电话,而对于特征属性没有重合部分的情况,直接根据特殊属性的异常取值范围即可进行判断。所述权重为所述活跃程度的权重和所述通话数据的权重。
需要说明的是,对于异常取值范围没有重合的特征数据,具有较高的权重。
进一步地,所述进行逐层训练具有周期性。
本发明提供的一种诈骗电话号码分析方法,通过设置周期性对诈骗电话号码分析模型进行训练,能够不断提高其效率和准确度。
基于上述实施例,所述将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果进一步包括:在所述诈骗电话号码分析模型的第一层中判断所述话单中的电话号码是否具有异常行为,将具有异常行为的电话号码录入所述诈骗电话号码分析结果,除录入的所述电话号码外,余下的电话号码进入所述诈骗电话号码分析模型的第二层;在所述诈骗电话号码分析模型的第二层中获取所述诈骗电话号码分析结果。
基于上述实施例,所述在所述诈骗电话号码分析模型的第一层中判断所述话单中的电话号码是否具有异常行为,将具有异常行为的电话号码录入所述诈骗电话号码分析结果进一步包括:在所述诈骗电话号码分析模型的第一层,若在一段时间内任一电话号码中所述异常行为数据的值处于所述异常取值范围,则确定所述任一电话号码具有异常行为,将所述任一电话号码识别为诈骗电话号码,并将所述诈骗电话号码录入所述诈骗电话号码分析结果。
具体地,所述异常行为包括异常号码呼叫、空号呼叫和陌生号码呼叫。所述异常号码呼叫,所述空号呼叫和所述陌生号码呼叫均为小概率的事件。若在一段时间内,任一电话号码中所述异常行为连续触发,即在一段时间内任一电话号码中所述异常行为数据的值处于所述异常取值范围,则确定所述任一电话号码具有异常行为。需要说明的是,所述异常行为数据的值为所述异常号码呼叫次数、空号呼叫次数和陌生号码呼叫次数的和值。异常取值范围通过对诈骗电话号码分析模型训练获取。
进一步地,电话号码历史呼叫中的高频陌生号码呼叫次数可作为判定诈骗号码的重要依据。若在诈骗电话号码分析模型的第一层即将任一电话号码识别为诈骗电话号码,则所述任一电话号码不进行后续诈骗电话号码分析模型的第二层的分析。
基于上述实施例,所述在所述诈骗电话号码分析模型的第二层中获取所述诈骗电话号码分析结果进一步包括:在所述诈骗电话号码分析模型的第二层,根据所述特征数据和所述异常取值范围,通过权重系数算法,获取任一所述特征数据对应的电话号码为诈骗电话号码的条件概率;根据所述条件概率和所述权重,通过加权朴素贝叶斯分类算法,将任一所述特征数据对应的电话号码分类成诈骗电话号码、疑似诈骗电话号码和正常电话号码中的任一种,并将任一所述特征数据对应的电话号码的类型作为所述诈骗电话号码分析结果。
具体地,本实施例进一步包括计算条件概率P(A|B),其中,A表示该电话号码是诈骗号码,B表示该电话号码对应的特征数据落入所述电话号码对应的特征数据的取值范围。
进一步地,通过权重系数算法,获取任一所述特征数据对应的电话号码为诈骗电话号码的条件概率具体包括:依据权重系数算法,将任一特征数据的后验概率和任一特征数据的权重相乘,获取任一所述特征数据对应的电话号码为诈骗电话号码的条件概率。
进一步地,根据所述条件概率和所述权重,通过加权朴素贝叶斯分类算法,计算任一所述特征数据的先验概率,并获取任一所述特征数据的权值,若所述任一所述特征数据具有高权值,则分类成诈骗电话号码;若所述任一所述特征数据具有中权值,则分类成疑似诈骗电话号码;所述任一所述特征数据具有低权值,则分类成正常电话号码。
进一步地,所述诈骗电话号码分析结果是指:话单中的任一电话号码的类型,及话单中的任一电话号码为诈骗电话号码,或者疑似诈骗电话号码,或者正常电话号码。
本发明提供的一种诈骗电话号码分析方法,通过设置对诈骗电话号码分析模型分层分析,能够准确地对电话号码是否是诈骗电话号码进行分析。
基于上述实施例,所述将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果之后还包括:分析所述诈骗电话号码的所在地和仿冒类型,并录入所述诈骗电话号码分析结果。
具体地,所述所在地是指:诈骗电话号码的所在地域情况,如国内或国外。所述所在地可以作为诈骗电话号码追溯的依据,用来判断各地区的诈骗猖獗程度。
进一步地,所述仿冒类型是指:诈骗电话号码可能的诈骗类型,比如仿冒银行,社保,熟人等。
进一步地,所在地是作为在将电话号码识别为诈骗电话之后,进一步分析诈骗常发地区的依据;仿冒类型根据诈骗电话号码仿冒的电话号码类型来进行识别判断。
基于上述实施例,所述诈骗电话号码分析结果包括:在诈骗电话号码分析模型的第一层录入的诈骗电话号码;在诈骗电话号码分析模型的第二层,将任一所述特征数据对应的电话号码分类成诈骗电话号码、疑似诈骗电话号码和正常电话号码中的任一种;每一所述诈骗电话号码的所在地和仿冒类型。
进一步地,所述诈骗电话号码分析结果中包括:所述话单中的每一电话号码的类型,以及每一诈骗电话号码的所在地和仿冒类型。
基于上述实施例,所述获取原始话单中的电话号码的异常行为数据和特征数据进一步包括:从大数据中获取所述原始话单中的电话号码,并对所述原始话单中的电话号码进行预处理获取所述异常行为数据和所述特征数据。
具体地,所述大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
进一步地,大数据带来了三个颠覆性观念转变:是全部数据,而不是随机采样;是大体方向,而不是精确制导;是相关关系,而不是因果关系。
所述是全部数据,而不是随机采样是指:在大数据时代,可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。
所述是大体方向,而不是精确制是指:研究数据如此之多,以至于无需追求高精确度;之前需要分析的数据很少,所以必须尽可能精确地量化记录,随着规模的扩大,对精确度的要求降低;拥有了大数据,则不再需要对一个现象刨根问底,只要掌握了大体的发展方向即可,适当忽略微观层面上的精确度,会使得宏观层面拥有更好的洞察力。
所述是相关关系,而不是因果关系是指:寻找因果关系是人类长久以来的习惯,在大数据时代,无须紧盯事物之间的因果关系,而去寻找事物之间的相关关系;相关关系也许不能准确地告知某件事情为何会发生,但是会提醒这件事情正在发生。
本发明提供的一种诈骗电话号码分析方法,通过设置从大数据中获取所述原始话单中的电话号码,能够从多个维度全面的分析话单信息,并从海量的数据当中训练出一个效率高,识别率高的诈骗电话号码分析模型,实现对诈骗电话的有效识别,规避了对个别的电话号码进行分析很难辨别该电话号码是否是诈骗电话号码的问题。
基于上述实施例,所述分析所述诈骗电话号码的所在地和仿冒类型,并录入所述诈骗电话号码分析结果之后还包括:将所述诈骗电话号码分析结果导入所述训练集。
具体地,所述诈骗电话号码分析结果在导出前还进行了保存。
本发明提供的一种诈骗电话号码分析方法,通过设置将所述诈骗电话号码分析结果导入所述训练集,能够增加诈骗电话号码分析模型的精确度及识别效率。
作为一个优选实施例,下面对本发明提供的一种诈骗电话号码分析方法的具体步骤做出说明:
首先,对原始话单进行预处理,对原始话单中的电话号码进行格式转换,获取所述话单中的电话号码的异常行为数据和特征数据和对应的关系,所述异常行为数据包括异常号码呼叫次数、空号呼叫次数和陌生号码呼叫次数,所述特征数据包括活跃程度和通话数据;其中,所述活跃程度包括日呼叫频次和呼叫密集时段,所述通话数据包括接通率、最早通话时间、最晚通话时间、平均通话时长、主要呼叫地区和平均振铃时间。
其次,根据已知的诈骗电话号码库构建训练集;将所述训练集中的数据输入诈骗电话号码分析模型进行逐层训练,并获得所述训练好的诈骗电话号码分析模型。
再次,对实时的话单进行诈骗电话号码分析,并获取诈骗电话号码分析结果,将诈骗电话号码分析结果保存并导出。
在最后,将所述诈骗电话号码分析结果导入所述训练集,并进行后续处理,如将分析识别出的诈骗电话号码加入黑名单或者上报有关部门。
基于上述实施例,图2为本发明实施例中的一种诈骗电话号码分析设备的结构示意图,如图2所示,该设备包括:至少一个处理器301;以及与所述处理器301通信连接的至少一个存储器302,其中:所述存储器302存储有可被所述处理器301执行的程序指令,所述处理器301调用所述程序指令能够执行上述各实施例所提供的诈骗电话号码分析方法,例如包括:获取话单中的电话号码的异常行为数据和特征数据,所述异常行为数据包括异常号码呼叫次数、空号呼叫次数和陌生号码呼叫次数,所述特征数据包括活跃程度和通话数据;将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果。
本发明提供的一种诈骗电话号码分析方法和设备,通过设置在训练好的诈骗电话号码分析模型中通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果,能够简单地对电话号码是否是诈骗电话号码进行精确分析,维护电信网的安全;通过对异常行为数据和特征数据进行分类,能够得到针对多维度的诈骗电话号码分析模型,从而能够全面地对电话号码是否是诈骗电话号码进行分析。
最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种诈骗电话号码分析方法,其特征在于,包括:
获取原始话单中的电话号码的异常行为数据和特征数据;所述异常行为数据包括异常号码呼叫次数、空号呼叫次数和陌生号码呼叫次数中的一种或多种;所述特征数据包括活跃程度和通话数据,其中,所述活跃程度包括日呼叫频次和/或呼叫密集时段,所述通话数据包括接通率、最早通话时间、最晚通话时间、平均通话时长、主要呼叫地区和平均振铃时间中的一种或多种;
将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果。
2.根据权利要求1所述的分析方法,其特征在于,所述训练好的诈骗电话号码分析模型通过以下步骤获取:
根据已知的诈骗电话号码库和非诈骗电话号码库构建训练集;
对所述训练集中的数据提取异常行为数据和特征数据,并输入诈骗电话号码分析模型进行逐层训练:
确定所述异常行为数据和所述特征数据的异常取值范围,并确定每一特征数据的权重;通过权重系数算法获取电话号码属于诈骗电话号码的条件概率,并通过加权朴素贝叶斯分类算法获得所述训练好的诈骗电话号码分析模型。
3.根据权利要求2所述的分析方法,其特征在于,所述将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果进一步包括:
在所述诈骗电话号码分析模型的第一层中判断所述话单中的电话号码是否具有异常行为,将具有异常行为的电话号码录入所述诈骗电话号码分析结果,除录入的所述电话号码外,余下的电话号码进入所述诈骗电话号码分析模型的第二层;在所述诈骗电话号码分析模型的第二层中获取所述诈骗电话号码分析结果。
4.根据权利要求3所述的分析方法,其特征在于,所述在所述诈骗电话号码分析模型的第一层中判断所述话单中的电话号码是否具有异常行为,将具有异常行为的电话号码录入所述诈骗电话号码分析结果进一步包括:
在所述诈骗电话号码分析模型的第一层,若在一段时间内任一电话号码中所述异常行为数据的值处于所述异常取值范围,则确定所述任一电话号码具有异常行为,将所述任一电话号码识别为诈骗电话号码,并将所述诈骗电话号码录入所述诈骗电话号码分析结果。
5.根据权利要求3所述的分析方法,其特征在于,所述在所述诈骗电话号码分析模型的第二层中获取所述诈骗电话号码分析结果进一步包括:
在所述诈骗电话号码分析模型的第二层,根据所述特征数据和所述异常取值范围,通过权重系数算法,获取任一所述特征数据对应的电话号码为诈骗电话号码的条件概率;
根据所述条件概率和所述权重,通过加权朴素贝叶斯分类算法,将任一所述特征数据对应的电话号码分类成诈骗电话号码、疑似诈骗电话号码和正常电话号码中的任一种,并将任一所述特征数据对应的电话号码的类型作为所述诈骗电话号码分析结果。
6.根据权利要求5所述的分析方法,其特征在于,所述将所述异常行为数据和所述特征数据输入训练好的诈骗电话号码分析模型,通过加权朴素贝叶斯分类算法,获取诈骗电话号码分析结果之后还包括:
分析所述诈骗电话号码的所在地和仿冒类型,并录入所述诈骗电话号码分析结果。
7.根据权利要求1所述的分析方法,其特征在于,所述诈骗电话号码分析结果包括:
在诈骗电话号码分析模型的第一层录入的诈骗电话号码;
在诈骗电话号码分析模型的第二层,将任一所述特征数据对应的电话号码分类成诈骗电话号码、疑似诈骗电话号码和正常电话号码中的任一种;
每一所述诈骗电话号码的所在地和仿冒类型。
8.根据权利要求1所述的分析方法,其特征在于,所述获取原始话单中的电话号码的异常行为数据和特征数据进一步包括:
从大数据中获取所述原始话单中的电话号码,并对所述原始话单中的电话号码进行预处理,获取所述异常行为数据和所述特征数据。
9.根据权利要求6所述的分析方法,其特征在于,所述分析所述诈骗电话号码的所在地和仿冒类型,并录入所述诈骗电话号码分析结果之后还包括:
将所述诈骗电话号码分析结果导入所述训练集。
10.一种诈骗电话号码分析设备,其特征在于,包括:
至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至9任一所述的分析方法。
CN201711079207.2A 2017-11-06 2017-11-06 一种诈骗电话号码分析方法和设备 Pending CN108093405A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711079207.2A CN108093405A (zh) 2017-11-06 2017-11-06 一种诈骗电话号码分析方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711079207.2A CN108093405A (zh) 2017-11-06 2017-11-06 一种诈骗电话号码分析方法和设备

Publications (1)

Publication Number Publication Date
CN108093405A true CN108093405A (zh) 2018-05-29

Family

ID=62171941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711079207.2A Pending CN108093405A (zh) 2017-11-06 2017-11-06 一种诈骗电话号码分析方法和设备

Country Status (1)

Country Link
CN (1) CN108093405A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108924333A (zh) * 2018-06-12 2018-11-30 阿里巴巴集团控股有限公司 诈骗电话识别方法、装置和系统
CN109274834A (zh) * 2018-09-27 2019-01-25 杭州东信北邮信息技术有限公司 一种基于通话行为的快递号码识别方法
CN109327627A (zh) * 2018-11-27 2019-02-12 深圳声笑科技有限公司 基于区块链的电话号码识别方法、装置及存储介质
CN109711984A (zh) * 2019-01-23 2019-05-03 北京市天元网络技术股份有限公司 一种基于催收的贷前风险监控方法及装置
CN110087230A (zh) * 2019-04-26 2019-08-02 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110213449A (zh) * 2019-05-17 2019-09-06 国家计算机网络与信息安全管理中心 一种漫游诈骗号码的识别方法
CN111031546A (zh) * 2019-11-29 2020-04-17 武汉烽火众智数字技术有限责任公司 一种应用于电话号码分析的lr模型训练方法及使用方法
CN111385420A (zh) * 2018-12-29 2020-07-07 中兴通讯股份有限公司 用户的识别方法及装置
CN111465021A (zh) * 2020-04-01 2020-07-28 北京中亦安图科技股份有限公司 基于图的骚扰电话识别模型构建方法
CN113163057A (zh) * 2021-01-20 2021-07-23 北京工业大学 一种诈骗电话动态识别区间构建方法
CN113556422A (zh) * 2020-04-21 2021-10-26 亚信科技(南京)有限公司 电信欺诈的识别方法、装置、设备及计算机存储介质
CN113727351A (zh) * 2020-05-12 2021-11-30 中国移动通信集团广东有限公司 一种通信欺诈识别方法、装置及电子设备
CN114363465A (zh) * 2021-12-27 2022-04-15 中国电信股份有限公司 信息处理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150269941A1 (en) * 2014-03-21 2015-09-24 Wells Fargo Bank, N.A. Fraud detection
CN106686261A (zh) * 2017-01-19 2017-05-17 腾讯科技(深圳)有限公司 一种信息处理方法及系统
CN106791220A (zh) * 2016-11-04 2017-05-31 国家计算机网络与信息安全管理中心 防止电话诈骗的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150269941A1 (en) * 2014-03-21 2015-09-24 Wells Fargo Bank, N.A. Fraud detection
CN106791220A (zh) * 2016-11-04 2017-05-31 国家计算机网络与信息安全管理中心 防止电话诈骗的方法及系统
CN106686261A (zh) * 2017-01-19 2017-05-17 腾讯科技(深圳)有限公司 一种信息处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘剑: "基于数据挖掘技术实现骚扰电话识别", 《CNKI中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108924333A (zh) * 2018-06-12 2018-11-30 阿里巴巴集团控股有限公司 诈骗电话识别方法、装置和系统
CN109274834B (zh) * 2018-09-27 2021-04-20 杭州东信北邮信息技术有限公司 一种基于通话行为的快递号码识别方法
CN109274834A (zh) * 2018-09-27 2019-01-25 杭州东信北邮信息技术有限公司 一种基于通话行为的快递号码识别方法
CN109327627A (zh) * 2018-11-27 2019-02-12 深圳声笑科技有限公司 基于区块链的电话号码识别方法、装置及存储介质
CN111385420B (zh) * 2018-12-29 2022-04-29 中兴通讯股份有限公司 用户的识别方法、装置、存储介质及电子装置
CN111385420A (zh) * 2018-12-29 2020-07-07 中兴通讯股份有限公司 用户的识别方法及装置
CN109711984A (zh) * 2019-01-23 2019-05-03 北京市天元网络技术股份有限公司 一种基于催收的贷前风险监控方法及装置
CN110087230B (zh) * 2019-04-26 2020-09-15 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110087230A (zh) * 2019-04-26 2019-08-02 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110213449A (zh) * 2019-05-17 2019-09-06 国家计算机网络与信息安全管理中心 一种漫游诈骗号码的识别方法
CN111031546A (zh) * 2019-11-29 2020-04-17 武汉烽火众智数字技术有限责任公司 一种应用于电话号码分析的lr模型训练方法及使用方法
CN111031546B (zh) * 2019-11-29 2023-09-19 武汉烽火众智数字技术有限责任公司 一种应用于电话号码分析的lr模型训练方法及使用方法
CN111465021B (zh) * 2020-04-01 2023-06-09 北京中亦安图科技股份有限公司 基于图的骚扰电话识别模型构建方法
CN111465021A (zh) * 2020-04-01 2020-07-28 北京中亦安图科技股份有限公司 基于图的骚扰电话识别模型构建方法
CN113556422A (zh) * 2020-04-21 2021-10-26 亚信科技(南京)有限公司 电信欺诈的识别方法、装置、设备及计算机存储介质
CN113727351A (zh) * 2020-05-12 2021-11-30 中国移动通信集团广东有限公司 一种通信欺诈识别方法、装置及电子设备
CN113727351B (zh) * 2020-05-12 2024-03-19 中国移动通信集团广东有限公司 一种通信欺诈识别方法、装置及电子设备
CN113163057A (zh) * 2021-01-20 2021-07-23 北京工业大学 一种诈骗电话动态识别区间构建方法
CN113163057B (zh) * 2021-01-20 2022-09-30 北京工业大学 一种诈骗电话动态识别区间构建方法
CN114363465A (zh) * 2021-12-27 2022-04-15 中国电信股份有限公司 信息处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108093405A (zh) 一种诈骗电话号码分析方法和设备
CN108924333B (zh) 诈骗电话识别方法、装置和系统
CN106791220B (zh) 防止电话诈骗的方法及系统
CN109451182B (zh) 一种诈骗电话的检测方法和装置
Becker et al. Fraud detection in telecommunications: History and lessons learned
Xing et al. Employing latent dirichlet allocation for fraud detection in telecommunications
CN107506776A (zh) 一种诈骗电话号码的分析方法
Lu et al. Telecom fraud identification based on ADASYN and random forest
CN109168168B (zh) 一种检测国际盗打的方法
CN108243049A (zh) 电信欺诈识别方法及装置
Arafat et al. Detection of wangiri telecommunication fraud using ensemble learning
CN113961712B (zh) 一种基于知识图谱的诈骗电话分析方法
CN111626754B (zh) 养卡用户识别方法及装置
CN110493476B (zh) 一种检测方法、装置、服务器及存储介质
CN110213448A (zh) 恶意号码识别方法、装置、存储介质和计算机设备
CN111131627B (zh) 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质
CN109525739A (zh) 一种电话号码识别方法、装置及服务器
CN108810290A (zh) 一种诈骗电话的识别的方法及系统
CN115222303A (zh) 基于大数据的行业风险数据分析方法、系统及存储介质
CN114513791A (zh) 一种基于机器学习的电信反欺诈方法
CN113837512B (zh) 异常用户的识别方法及装置
CN111105064A (zh) 确定欺诈事件的嫌疑信息的方法及装置
KR20130083286A (ko) 이동통신 단말기의 스팸 처리 시스템
CN117439764A (zh) 一种基于流量的诈骗技术反制方法
Panigrahi et al. Use of dempster-shafer theory and Bayesian inferencing for fraud detection in mobile communication networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180529