CN103415004B - 一种检测垃圾短消息的方法及装置 - Google Patents
一种检测垃圾短消息的方法及装置 Download PDFInfo
- Publication number
- CN103415004B CN103415004B CN201310319875.3A CN201310319875A CN103415004B CN 103415004 B CN103415004 B CN 103415004B CN 201310319875 A CN201310319875 A CN 201310319875A CN 103415004 B CN103415004 B CN 103415004B
- Authority
- CN
- China
- Prior art keywords
- short message
- spam
- contact information
- contact
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000001514 detection method Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 abstract description 8
- 238000001914 filtration Methods 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 9
- 230000008520 organization Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/40—Security arrangements using identity modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
- H04W12/126—Anti-theft arrangements, e.g. protection against subscriber identity module [SIM] cloning
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种检测垃圾短消息的方法及装置,包括识别出短消息中包含的联系信息,根据短消息中的联系信息检查当前短消息是否具有垃圾特征;提取具有垃圾特征的垃圾短消息对应的主叫号码,并将该主叫号码加入垃圾短信列表。本发明提供的方案中,基于大量数据统计和分析得知,短消息中的联系信息对于正常短消息和垃圾短消息是存在本质区别的,而本发明正是利用短消息中的联系信息对短消息的垃圾特征进行准确的判断,提高了对垃圾短消息的识别准确率,从而更好地避免了用户和运营商的利益受到损害。
Description
技术领域
本发明涉及短消息处理技术,尤指一种检测垃圾短消息的方法及装置。
背景技术
短消息业务是移动通信领域的一个成功典范,它诞生时间不长却给人们的工作和生活的诸方面带来了深刻的变化。简单、易用、廉价、开放的设计理念,使短消息成为当今最重要的通信方式之一。据信息产业部统计显示,到2013年第一季度,全国手机用户数接近11亿户,而手机短消息发送量已达到上亿条。
短消息业务在给人们提供便捷通信手段的同时,也导致了手机间的垃圾信息泛滥成灾,比如各种色情暴力、政治谣言、反动言论、诈骗信息和非法广告大肆传播等,可见,垃圾短消息越来越成为影响社会稳定、危害公共安全的重要因素。垃圾短消息是指对接收者没有价值,不请自来的短消息。根据中国互联网协会发布的调查结果显示,我国手机用户平均每周收到8.29条垃圾短消息。因此,开发大规模的垃圾短消息过滤系统对保障手机用户、运营商的利益,促进移动通信行业和整个社会的和谐发展具有重大意义。
目前,垃圾短消息按照其发送的方式可以分为两种模式,一种模式是利用移动运营商的短消息网关进行发送,用户收到短消息时,其显示的发送号码为短消息的接入号,而不是普通用户的手机号码。通过这种模式发送的垃圾短消息具有速度快,操作简单,需要运营商许可等特点,短消息类型以商品广告、服务类居多。
另一种模式是点对点发送。使用者或是购买大量无需注册的手机卡(如动感地带、神州行等)来进行透支,或是通过优惠套餐利用群发工具大量发送短消息。通常不法分子能在很短的时间内群发上万条的短消息,因此运营商往往来不及计费就被恶意透支话费。用户在收到短消息时,其显示的发送号码为普通的手机号码。通过这种模式,发送的垃圾短消息具有号码多,速度快,不需运营商许可等特点,短消息类型以诈骗、谣言、色情信息为主,具有较大的危害性。
现有短消息过滤技术大致包括内容过滤技术、短信流量统计技术,以及话单分析机制。其中,
比较常用的过滤技术是内容过滤技术,比如基于规则的过滤方法,即通过预先设置一些过滤规则,如中奖、发财等,只要收到符合这些过滤规则的短消息,就认为是垃圾短信。采用基于规则的过滤技术,优点在于其原理和实现方式都较为简单,应用成本较低。但是其不足之处在于:首先,过滤规则都是人工指定的,需要人们不断去发现、总结和更新,付出较大的人工维护开销;再者,过滤规则选取难度大,仅通过关键字匹配很难判断出短信内容的合法性,因此很容易造成误判;最后,垃圾短消息发送者很容易通过使用拼音或同音字等方法即“变种”垃圾短息绕过过滤规则。
除此之外,人们还采用了散列技术、贝叶斯算法、支持向量机方法等。这些方法可以学习词的频率和模式,这样可以同垃圾短消息和正常短消息关联起来进行判断。这些又是一种相对于关键字来说,更复杂和更智能化的内容过滤技术,但其对垃圾短消息的识别效率低如速度慢较为明显,而且需要用户不断更新过滤规则库或训练集,随着垃圾短消息制造者的技术水平不断提高,这种方法很容易失效即降低了对垃圾短消息的识别准确率等。
可见,内容过滤技术需要付出较大的维护开销,需要用户不断更新过滤规则库或训练集,垃圾短信监测、分析的工作量大;而如果关键字更新不及时,未能及时拦截“变种”垃圾短信,将会导致不能发现新型垃圾短消息特征,很难识别垃圾短消息的局部变异。
另一种过滤技术是短信流量统计技术,即对某一个手机或某一个SP单位时间发送或接收的短信流量进行统计,一旦发现该统计值超过某一个预先设置的阈值就认为该短消息为垃圾短消息。如果检测到大量发送垃圾短信的个人或者服务商,立即对其进行监管和过滤。为了检测单位时间用户发送短信的数目,需要为每个用户配置一个计数器,每发送一条短信计数器自动加一,这样,如果发送短信条数达到规定数目,则由计数器自动报警。也可以用过检测两条短信发送的间隔时间,即对短信的发送频率进行监控,当两条短信间隔过短,即表示该用户发送短信频繁,则自动报警。但是,关键字与发送频次结合的监控和拦截机制模式单一、应变能力差,容易让犯罪分子找到过滤规律,“变种”垃圾短信也会从而频繁出现。另外,短消息流量统计存在风险,如果阀值设置过低,会容易造成误拦截,引起用户投诉,如果阀值设置过高,则又很难真正实现对垃圾短信的拦截。
还有一种过滤技术是话单分析机制,是将计费服务器上的原始话单文件作为统计数据源,统计各号码在一定时间段内的发送短消息的条数和发送的成功率,当均超过预先设置的域值则认为该号码为可疑用户,并提交给操作人员判定是否需要将该号码加入黑名单。话单分析机制的不足之处在于采用了离线处理方式,实时性较差,从短消息发送到话单采集存在时间差(大概超过15分钟),而不法分子可利用这个时间差,通过大量复制SIM卡的方式,发送数以万计的垃圾短消息。现有技术中,从短信中提取的手机号码、网址、账号信息,主要用于白名单比对(即比较这些信息是否为运营商、银行等特有号码),以及黑名单比对(即与预先建立的垃圾短信发送号码、网址等黑名单进行比较),以检测出垃圾短信。
从现有垃圾短消息的检测方法可以看出,要么对垃圾短消息的识别准确率低,要么实时性较差。这样,必然影响用户对业务提供商的满意度,同时,用户和运营商的利益也受到了损害。
发明内容
为了解决上述技术问题,本发明提供了一种检测垃圾短消息的方法及装置,能够提高对垃圾短消息的识别效率与识别准确率,更好地保护用户、运营商利益。
为了达到本发明目的,本发明提供了一种检测垃圾短消息的方法,其特征在于,包括:
识别出短消息中包含的联系信息;根据短消息中的联系信息检查当前短消息是否具有垃圾特征;
记录具有垃圾特征的垃圾短消息对应的信息。
该方法之前还包括:对所述短消息进行逐字节处理,记录短消息长度;在所述短消息长度不小于预先设置的门限值时,对当前短消息继续进行识别。
所述联系信息为手机号码或固定电话号码;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,通过比对得出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
所述联系信息为银行账号;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,通过比对得到短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
所述联系信息中包含手机号码或固定电话号码,以及银行账号;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,如果所述短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为垃圾短消息。
该方法还包括:确定出所述短消息中包含有联系主体信息;
所述检查当前短消息是否具有垃圾特征还包括:
比对所述短消息中的联系主体信息与预先设置的联系主体表,如果联系主体所在的短消息中的联系信息与联系主体表中预先设置的与该联系主体对应的联系信息不一致,则所述短消息具有垃圾特征,且将其标识为垃圾短消息;
如果所述联系信息或联系主体信息采用变形手段;所述检查当前短消息是否具有垃圾特征还包括:所述短消息具有垃圾特征,且将其标识为垃圾短消息。
该方法还包括:结合预先设置的黑名单库和白名单库,对所述短消息中的联系信息进行进一步检测。
本发明还公开一种检测垃圾短消息的装置,包括识别模块、检测模块,以及处理模块,其中,
识别模块,用于识别出短消息中包含的联系信息,并输出给检测模块;
检测模块,用于根据识别出的联系信息检查当前短消息是否具有垃圾特征,并将垃圾特征信息输出给处理模块;
处理模块,用于根据垃圾特征信息,记录具有垃圾特征的垃圾短消息对应的信息;
所述识别模块,还用于对短消息的逐字节处理,记录短消息长度,在短消息长度不小于预先设置的门限值时,对当前短消息继续进行识别。
所述检测模块具体用于:
当接收到的联系信息为手机号码或固定电话号码时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,则垃圾特征信息包括该条短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息为银行账号时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则垃圾特征信息包括该条短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息中既包含手机号码或固定电话号码,也包含银行账号时,如果检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息。
所述识别模块,还用于识别出短消息中包含有联系主体信息,并输出给检测模块;所述检测模块,还用于比对接收到的联系主体信息与预先设置的联系主体表,如果联系主体所在的短消息中的联系信息与联系主体表中预先设置的与该联系主体对应的联系信息不一致,则所述垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息;和/或,
所述识别模块,还用于识别出联系信息或联系主体信息采用变形手段,并输出给检测模块。检测模块,还用于将所述垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息
所述检测模块,还用于结合黑名单库和白名单库,对所述短消息中的联系信息进行检查。
与现有技术相比,本发明包括识别出短消息中包含的联系信息,根据短消息中的联系信息检查当前短消息是否具有垃圾特征;提取具有垃圾特征的垃圾短消息对应的主叫号码,并将该主叫号码加入垃圾短信列表。本发明提供的方案中,从发明人的大量数据统计和分析得知,短消息中的联系信息对于正常短消息和垃圾短消息是存在本质区别的,而本发明正是利用短消息中的联系信息对短消息的垃圾特征进行准确的判断,提高了对垃圾短消息的识别准确率,从而更好地避免了用户和运营商的利益受到损害。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明检测垃圾短消息的方法的流程图;
图2为本发明检测垃圾短消息的装置的组成结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
发明人通过对大量垃圾短消息的分析统计得到,垃圾短消息中占比最大的为欺诈类短信。欺诈类短信一般具有如下特点:其发送者不断变换策略如使用同音字、替代符、加入随机字符、特别设计的字符来对抗现有过滤规则,大多数的垃圾短消息中均含有联系信息,如固定电话号码、手机号码、网址、QQ号码、银行卡账号等,联系信息用于诱使接收者与犯罪分子联系,以便犯罪分子利用欺骗手段从用户处获取经济利益。而且,根据统计可知,垃圾短消息的发送号码通常与联系信息中的电话号码或手机号码属于不同的地理区域(利用各省过滤策略的差异,跨省发送垃圾短消息);联系信息或短消息的其他内容常使用替换、逃避等手段;垃圾短消息中常出现公众机构,如社保部门、热门节目如“非常六加一”抽奖等。
正常短消息的发送是以正常社会交往为目的,用户正常的短消息中也会出现联系信息,如更换手机号码时,短消息中会包含有更换后的手机号码;通过短消息告知自己或他人的联系方式时,也会在短消息中携带有电话号码等;在正常交易汇款时,会在短消息中包含账号等。但是,正常短消息中不会出现特殊的字符等变形手段,而且,短消息的发送号码与短消息中的联系号码存在关联性,比如发送短消息的发送号码,与短消息中的联系信息中显示的更改后的手机号通常是属于同一个地区等。
从上述数据统计和分析可见,含有联系信息的正常短消息和垃圾短消息是存在本质区别的,而本发明正是利用这些联系信息的区别,对垃圾短消息进行检测,以高效、准确地识别垃圾短消息或可疑短消息。
图1为本发明检测垃圾短消息的方法的流程图,如图1所示,包括:
步骤100:识别出短消息中包含的联系信息。
本步骤中,对短消息进行逐字节处理,识别出短消息中包含的联系信息,如电话号码、手机号码、网址、QQ号码、银行卡账号等。如果短消息中未包含联系信息,则不对当前短消息进行检测,返回继续对下一条短消息进行检测。其中,逐字节处理的方法属于本领域技术人员的惯用技术手段,其具体实现并不用于限定本发明的保护范围,这里不再赘述。
进一步地,本步骤之前还包括对短消息的逐字节处理,记录短消息长度,并且,如果短消息长度小于预先设置的门限值L(如50字节),则不对当前短消息进行检测,对下一条短消息进行检测;否则,继续执行本步骤中的识别短消息中的联系信息。
进一步地,本步骤还包括:确定短消息中是否有联系主体信息,如个人如张经理、公司机构名如中国联通、热门节目如中国好声音等。
进一步识别联系信息或联系主体信息是否采用变形手段,如采用小写字母l或字母i替换数字1等,是否加入特殊字符、是否网址全部大写等。
本步骤中的具体识别方法属于本领域技术人员的惯用技术手段,并且其具体实现不用于限定本发明的保护范围,这里不再赘述。
步骤101:根据短消息中的联系信息检查当前短消息是否具有垃圾特征。
本发明方法之前还包括:预先设置联系信息表,用于存储国内运营商分配的手机号码段、固定电话号码段、银行卡账号段及其所对应的地理位置信息,可以精确到城市;进一步地,预先设置联系主体表,用于存储常见机构、公司及其对应的电话号码,热点节目名称等。
本步骤具体包括:
当联系信息为手机号码或固定电话号码时,根据预先设置的联系信息表,比对短消息的主叫号码与联系信息中的号码是否属于同一运营商,或者是否属于同一归属地如省份或城市,如果不属于同一运营商,或者不属于同一归属地如省份或城市,则认为该条短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
当联系信息为银行账号时,根据预先设置的联系信息表,比对短消息的主叫号码与联系信息中的银行账号是否属于同一归属地如省份或城市,如果不属于同一归属地如省份或城市,则认为该条短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
当联系信息中既包含手机号码或固定电话号码,也包含银行账号时,如果短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地如省份或城市,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地如省份或城市,则认为该条短消息具有垃圾特征,且将其标识为垃圾短消息。
进一步地,在根据联系信息确认短消息为可疑垃圾短消息,或者短消息中有联系信息但根据联系信息确认短消息为正常短消息后,如果确定出短消息中包含有联系主体信息,如个人如张经理、公司机构名如中国联通、热门节目如中国好声音等,本步骤还包括:
比对短消息中的联系主体信息与预先设置的联系主体表,如果联系主体为公司机构,而该联系主体信息所在的短消息中的联系信息与联系主体表中预先设置的与该公司机构对应的联系信息(如官方电话号码)不一致,则认为该条短消息具有垃圾特征,且将其标识为垃圾短消息;否则认为该条短消息不具有垃圾特征。
进一步地,在根据联系信息确认短消息为可疑垃圾短消息,或者短消息中有联系信息但根据联系信息确认短消息为正常短消息后,当识别出联系信息或联系主体信息采用变形手段时,本步骤还包括:如果联系信息存在变形手段,比如包括网址大写、加入特殊符号,号码形似字替换等,则认为该条短消息具有垃圾特征,且将其标识为垃圾短消息。
进一步地,本步骤也可以结合黑名单库和白名单库,对短消息中的联系信息做进一步判断,比如,虽然短消息的主叫号码与联系信息中号码属于同一运营商,或者属于同一归属地如省份或城市,但是该号码在黑名单库中,那么,认为该条短消息具有垃圾特征,且将其标识为垃圾短消息。再如,虽然短消息的主叫号码与联系信息中的银行账号属于同一归属地如城市,但是该银行账号在黑名单库中,那么,认为该条短消息具有垃圾特征,且将其标识为垃圾短消息。其中,黑名单库用于存储已知的恶意联系信息,包括恶意手机号码、电话号码、网址、银行账号等;白名单库用于存储直接放行的联系信息,包括手机号码、电话号码、网址。需要说明的是,这里只是举例说明,并不用于限定本发明中根据短消息中的联系信息检查当前短消息是否具有垃圾特征的方法,与现有垃圾短消息检测方法的结合使用方式。
本步骤中,如果确定短消息不具有垃圾特征,则可认为该短消息是正常短消息,继续对下一条短消息进行检测处理。
步骤102:记录具有垃圾特征的垃圾短消息对应的信息。
对于垃圾特征为可疑的垃圾短消息,记录该短消息对应的主叫号码,比如存储到预先指定的空间,以便后续管理人员离线验证联系信息及短消息内容,在被证实确实为垃圾短消息时,将该短消息的相应信息如主叫号码、联系信息等填入垃圾短信列表如黑名单库中。对于垃圾特征为垃圾短消息,将该短消息对应的主叫号码,以及联系信息等直接填入垃圾短信列表如黑名单库或采用人工核查方式进行处理等,具体实现方式很多,是本领域技术人员的惯用技术手段,并不用于限定本发明的保护范围。通过本发明对可疑短消息的处理,实现了对短消息的垃圾特征进一步的准确判断,提高了对垃圾短消息的识别准确率。
本发明方法还包括:定期更新黑名单库中的信息如号码、网址、账号信息等,去掉已经作废(如号码已销号等)的信息;定期更新联系主体表,比如管理人员结合近期舆论和实际情况,去掉或者替换相应规则,比如去掉过期的热点节目“非常六加一”等。
本发明中,从发明人的大量数据统计和分析得知,短消息中的联系信息对于正常短消息和垃圾短消息是存在本质区别的,而本发明正是利用短消息中的联系信息对短消息的垃圾特征进行准确的判断,提高了对垃圾短消息的识别准确率,从而更好地避免了用户和运营商的利益受到损害。
本发明还提供一种检测垃圾短消息的装置,本发明装置可以部署在用户终端上,也可以部署在运营商垃圾短信过滤网关中,如图2所示,包括识别模块、检测模块,以及处理模块,其中,
识别模块,用于识别出短消息中包含的联系信息,并输出给检测模块。
检测模块,用于根据识别出的联系信息检查当前短消息是否具有垃圾特征,并将垃圾特征信息输出给处理模块。
处理模块,用于根据垃圾特征信息,记录具有垃圾特征的垃圾短消息对应的信息。
其中,识别模块,还用于对短消息的逐字节处理,记录短消息长度,在短消息长度小于预先设置的门限值时,不对当前短消息进行检测,对下一条短消息进行检测;否则,对当前短消息继续进行识别。
识别模块,还用于识别出短消息中包含有联系主体信息,并输出给检测模块。
识别模块,还用于识别出联系信息或联系主体信息采用变形手段,并输出给检测模块。
检测模块,具体用于当接收到的联系信息为手机号码或固定电话号码时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地如省份或城市,则垃圾特征信息包括该条短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息为银行账号时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的银行账号不属于同一归属地如省份或城市,则垃圾特征信息包括该条短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息中既包含手机号码或固定电话号码,也包含银行账号时,如果检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地如省份或城市,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地如省份或城市,则垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息。
检测模块,还用于比对接收到的联系主体信息与预先设置的联系主体表,如果联系主体为公司机构,而该联系主体信息所在的短消息中的联系信息与联系主体表中预先设置的与该公司机构对应的联系信息(如官方电话号码)不一致,则垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息。
检测模块,还用于如果检查出变性手段包括网址大写、和/或加入特殊符号,和/或号码形似字替换等,则垃圾特征信息包括该条短消息具有垃圾特征且标识为垃圾短消息。
检测模块,还用于结合黑名单库和白名单库,对短消息中的联系信息进行检查
处理模块,具体用于在接收到的垃圾特征信息显示为可疑的垃圾短消息时,记录该短消息的主叫号码;或者,
在接收到的垃圾特征信息显示为垃圾短消息,将该短消息对应的主叫号码直接填入垃圾短信列表如黑名单库或采用人工核查方式进行处理等。
处理模块,还用于定期更新黑名单库,或定期更新联系主体表。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (7)
1.一种检测垃圾短消息的方法,其特征在于,包括:
识别出短消息中包含的联系信息;根据短消息中的联系信息检查当前短消息是否具有垃圾特征;
记录具有垃圾特征的垃圾短消息对应的信息;
所述联系信息为手机号码或固定电话号码;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,通过比对得出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
所述联系信息为银行账号;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,通过比对得到短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为可疑垃圾短消息;或者,
所述联系信息中包含手机号码或固定电话号码,以及银行账号;所述检查当前短消息是否具有垃圾特征包括:
根据预先设置的联系信息表,如果所述短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征,且将其标识为垃圾短消息;
其中,所述联系信息表包括:联系信息及其所对应运营商、归属地。
2.根据权利要求1所述的方法,其特征在于,该方法之前还包括:对所述短消息进行逐字节处理,记录短消息长度;在所述短消息长度不小于预先设置的门限值时,对当前短消息继续进行识别。
3.根据权利要求1所述的方法,其特征在于,该方法还包括:确定出所述短消息中包含有联系主体信息;
所述检查当前短消息是否具有垃圾特征还包括:
比对所述短消息中的联系主体信息与预先设置的联系主体表,如果联系主体所在的短消息中的联系信息与联系主体表中预先设置的与该联系主体对应的联系信息不一致,则所述短消息具有垃圾特征,且将其标识为垃圾短消息;
其中,所述联系主体包括:个人、公司机构或热门节目,所述联系主体表包括:联系主体及其所对应的联系信息;
如果所述联系信息或联系主体信息采用变形手段;所述检查当前短消息是否具有垃圾特征还包括:所述短消息具有垃圾特征,且将其标识为垃圾短消息。
4.根据权利要求1或2所述的方法,其特征在于,该方法还包括:结合预先设置的黑名单库和白名单库,对所述短消息中的联系信息进行进一步检测。
5.一种检测垃圾短消息的装置,其特征在于,包括识别模块、检测模块,以及处理模块,其中,
识别模块,用于识别出短消息中包含的联系信息,并输出给检测模块;
检测模块,用于根据识别出的联系信息检查当前短消息是否具有垃圾特征,并将垃圾特征信息输出给处理模块;
处理模块,用于根据垃圾特征信息,记录具有垃圾特征的垃圾短消息对应的信息;
所述检测模块具体用于:
当接收到的联系信息为手机号码或固定电话号码时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,则所述短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息为银行账号时,根据预先设置的联系信息表,通过比对检查出短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征且标识为可疑垃圾短消息;或者,
当接收到的联系信息中既包含手机号码或固定电话号码,也包含银行账号时,如果检查出短消息的主叫号码与联系信息中的号码不属于同一运营商,或者不属于同一归属地,而且短消息的主叫号码与联系信息中的银行账号不属于同一归属地,则所述短消息具有垃圾特征且标识为垃圾短消息;
其中,所述联系信息表包括:联系信息及其所对应运营商、归属地。
6.根据权利要求5所述的装置,其特征在于,所述识别模块,还用于对短消息的逐字节处理,记录短消息长度,在短消息长度不小于预先设置的门限值时,对当前短消息继续进行识别。
7.根据权利要求5或6所述的装置,其特征在于,所述检测模块,还用于结合黑名单库和白名单库,对所述短消息中的联系信息进行检查。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310319875.3A CN103415004B (zh) | 2013-07-26 | 2013-07-26 | 一种检测垃圾短消息的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310319875.3A CN103415004B (zh) | 2013-07-26 | 2013-07-26 | 一种检测垃圾短消息的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103415004A CN103415004A (zh) | 2013-11-27 |
CN103415004B true CN103415004B (zh) | 2016-09-21 |
Family
ID=49607979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310319875.3A Active CN103415004B (zh) | 2013-07-26 | 2013-07-26 | 一种检测垃圾短消息的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103415004B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105898752A (zh) * | 2014-05-05 | 2016-08-24 | 王正伟 | 消息过滤方法 |
CN104168548A (zh) * | 2014-08-21 | 2014-11-26 | 北京奇虎科技有限公司 | 短信拦截方法及装置、云端服务器 |
CN106507319A (zh) * | 2015-08-04 | 2017-03-15 | 北京壹人壹本信息科技有限公司 | 一种恶意短信息的识别方法及装置 |
CN105246058B (zh) * | 2015-09-01 | 2019-08-06 | 中国联合网络通信集团有限公司 | 短信的验证方法和短信服务器 |
CN105335354A (zh) * | 2015-12-09 | 2016-02-17 | 中国联合网络通信集团有限公司 | 欺诈信息识别方法和装置 |
CN106157214A (zh) * | 2016-06-24 | 2016-11-23 | 北京奇虎科技有限公司 | 信息追踪的方法及装置 |
CN109145284A (zh) * | 2017-06-19 | 2019-01-04 | 阿里巴巴集团控股有限公司 | 信息处理方法和装置 |
CN108391240B (zh) * | 2018-05-23 | 2021-08-24 | 中国联合网络通信集团有限公司 | 垃圾彩信判断方法和装置 |
CN108769933B (zh) * | 2018-05-31 | 2021-06-04 | 中国联合网络通信集团有限公司 | 彩信识别方法和彩信识别系统 |
CN109660961B (zh) * | 2018-12-17 | 2021-03-30 | 珠海市小源科技有限公司 | 短信号码及其归属信息的匹配方法、装置及存储介质 |
CN111093199A (zh) * | 2019-11-25 | 2020-05-01 | 维沃移动通信有限公司 | 信息提示方法、电子设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101031102B (zh) * | 2007-03-20 | 2010-05-26 | 华为技术有限公司 | 一种短消息处理的系统、装置和方法 |
CN101335920B (zh) * | 2008-07-15 | 2011-04-13 | 中国联合网络通信集团有限公司 | 基于主叫号码位置和发送内容的垃圾短消息识别系统及方法 |
CN102711112A (zh) * | 2012-06-18 | 2012-10-03 | 奇智软件(北京)有限公司 | 短信拦截方法及装置 |
CN102801859B (zh) * | 2012-08-03 | 2014-05-07 | 陈伟 | 垃圾短信的识别方法、装置和具有该装置的移动通信终端 |
-
2013
- 2013-07-26 CN CN201310319875.3A patent/CN103415004B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103415004A (zh) | 2013-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103415004B (zh) | 一种检测垃圾短消息的方法及装置 | |
CN110517097B (zh) | 识别异常用户的方法、装置、设备及存储介质 | |
CN106791220B (zh) | 防止电话诈骗的方法及系统 | |
Zhang et al. | Lies in the air: Characterizing fake-base-station spam ecosystem in china | |
CN101350957B (zh) | 屏蔽垃圾短信的方法和设备 | |
CN102802133B (zh) | 垃圾信息的识别方法、装置及系统 | |
CN104462509A (zh) | 垃圾评论检测方法及装置 | |
CN103763690A (zh) | 检测伪基站向移动终端发送短信息的方法和装置 | |
CN103458412A (zh) | 防止电话诈骗的系统、方法及移动终端、云端分析服务器 | |
CN105335354A (zh) | 欺诈信息识别方法和装置 | |
CN106713579B (zh) | 一种电话号码识别方法及装置 | |
CN107426079A (zh) | 一种通知栏消息的处理方法及装置 | |
CN110139280A (zh) | 诈骗号码的检测方法、装置及存储介质 | |
CN101389085B (zh) | 基于发送行为的垃圾短消息识别系统及方法 | |
CN102368853A (zh) | 通信事件处理方法及系统 | |
Tang et al. | Clues in tweets: Twitter-guided discovery and analysis of SMS spam | |
CN107094291B (zh) | 一种反电信诈骗的系统、方法及终端 | |
EP1955504B1 (en) | Anti-spam application storage system | |
CN110337107A (zh) | 一种诈骗短信智能监控告警装置 | |
Wang et al. | A behavior-based SMS antispam system | |
CN110113748B (zh) | 骚扰电话监控方法、装置 | |
KR20170006158A (ko) | 문자 메시지 부정 사용 탐지 방법 및 시스템 | |
CN113923011B (zh) | 一种网络诈骗的预警方法、装置、计算机设备及存储介质 | |
CN102804732B (zh) | 在数字广播系统的受众测量中保护个人隐私信息的方法 | |
TWI507009B (zh) | 智慧型手機之防詐騙系統及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |