CN107871190B - 一种业务指标监控方法及装置 - Google Patents
一种业务指标监控方法及装置 Download PDFInfo
- Publication number
- CN107871190B CN107871190B CN201610849587.2A CN201610849587A CN107871190B CN 107871190 B CN107871190 B CN 107871190B CN 201610849587 A CN201610849587 A CN 201610849587A CN 107871190 B CN107871190 B CN 107871190B
- Authority
- CN
- China
- Prior art keywords
- data
- monitored
- sequence
- time
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 218
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000002159 abnormal effect Effects 0.000 claims abstract description 91
- 238000001514 detection method Methods 0.000 claims abstract description 61
- 238000007619 statistical method Methods 0.000 claims abstract description 27
- 230000008859 change Effects 0.000 claims description 148
- 238000009825 accumulation Methods 0.000 claims description 73
- 230000001186 cumulative effect Effects 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000002547 anomalous effect Effects 0.000 claims 3
- 230000035945 sensitivity Effects 0.000 abstract description 10
- 238000012806 monitoring device Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 15
- 238000003860 storage Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000003068 static effect Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 102220124522 rs746215581 Human genes 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种业务指标监控方法及装置,可采用对待监控业务指标的历史监控样本数据进行统计分析的方式,自动预测待监控业务指标的待监控数据的上下限阈值,并基于预测得到的上下限阈值,确定待监控数据是否为异常数据;或者,可采用变点检测的方式,识别待监控业务指标的待监控时间序列数据中的异常数据。由于无需依赖人工方式设置固定的同环比阈值,因而,可以在降低监控成本、扩大监控范围的基础上,避免误报、漏报等情况的发生,提高业务指标监控的灵敏性以及准确性。
Description
技术领域
本申请涉及业务指标监控技术领域,尤其涉及一种业务指标监控方法及装置。
背景技术
对于互联网广告业务等各类业务来说,为了保证其能够正常运行,常常需要对其进行业务指标的实时或定时监控。
具体地,目前业界常采用人工配置各业务指标的同环比阈值的方式(即,由运维人员采用人工方式逐一配置业务监控项,并对每一业务监控项的各监控指标配置固定的同环比阈值),对各业务指标进行监控,当同比和环比变化幅度同时超过对应的静态阈值时,则认为是异常点,从而导致可能会存在以下问题:
问题一:由于业务监控项、业务指标种类繁多,且,每个业务监控项可存在多个具备不同特征的监控时段,导致一个业务监控项通常需要配置10~20个阈值,使得阈值配置的过程复杂繁琐,监控成本高。
问题二:当新增业务监控项时,如果没有及时通知到运维人员,则新增业务监控项的各业务指标将处于监控盲区的状态,导致可能会出现监控纰漏。
问题三:由于同比是检测值与上周同一时间对比,环比是检测值与昨天同一时间对比,且,周末节假日等的流量特征与其他日期相差甚远,所以对于人工设置同环比阈值的监控方式而言,由于容易出现漏报、误报等情况,如在节假日与工作日交替的日期经常出现误报或漏报。
也就是说,现有的业务指标监控方式存在准确性较低、以及监控成本较高等的问题,因此,亟需提供一种新的业务指标监控方法以解决上述问题。
发明内容
本申请实施例提供了一种业务指标监控方法及装置,用以解决现有的业务指标监控方式所存在的准确性较低、以及监控成本较高等的问题。
一方面,本申请实施例提供了一种业务指标监控方法,包括:
获取待监控业务指标的待监控数据;
针对获取到的每一待监控数据,根据设定的、与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值;
若判断结果为是,则确定该待监控数据为候选异常数据;
其中,与该待监控数据相对应的上限阈值以及下限阈值是通过对该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析所得到的。
另一方面,本申请实施例提供了另一种业务指标监控方法,包括:
获取待监控业务指标的待监控时间序列数据;
基于设定的变点检测算法对所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;
若存在,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据。
又一方面,本申请实施例提供了一种业务指标监控装置,包括:
数据获取单元,用于获取待监控业务指标的待监控数据;
统计分析单元,用于针对所述数据获取单元获取到的每一待监控数据,通过对该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析,得到与该待监控数据相对应的上限阈值以及下限阈值;
指标判断单元,用于针对所述数据获取单元获取到的每一待监控数据,根据所述统计分析单元分析得到的与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值;
异常确定单元,用于若根据所述指标判断单元的判断结果,确定针对该待监控数据的判断结果为是,则确定该待监控数据为候选异常数据。
再一方面,本申请实施例提供了另一种业务指标监控装置,包括:
数据获取单元,用于获取待监控业务指标的待监控时间序列数据;
变点检测单元,用于基于设定的变点检测算法对所述数据获取单元获取到的所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;
异常确定单元,用于若根据所述变点检测单元的检测结果,确定所述待监控时间序列数据中存在变点,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据。
另一方面,本申请实施例还提供了又一种业务指标监控装置,包括:
存储器,用于存储软件程序以及模块;
处理器,用于通过运行存储在存储器内的软件程序以及模块,执行以下操作:
获取待监控业务指标的待监控数据;并针对获取到的每一待监控数据,根据设定的、与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值;
若判断结果为是,则确定该待监控数据为候选异常数据;
其中,与该待监控数据相对应的上限阈值以及下限阈值是所述处理器通过对该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析所得到的。
又一方面,本申请实施例还提供了再一种业务指标监控装置,包括:
存储器,用于存储软件程序以及模块;
处理器,用于通过运行存储在存储器内的软件程序以及模块,执行以下操作:
获取待监控业务指标的待监控时间序列数据;并基于设定的变点检测算法对所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;若存在,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据。
本申请有益效果如下:
本申请实施例提供了一种业务指标监控方法及装置,可采用对待监控业务指标的历史监控样本数据进行统计分析的方式,自动预测待监控业务指标的待监控数据的上下限阈值,并基于预测得到的上下限阈值,确定待监控数据是否为异常数据;或者,可采用变点检测的方式,识别待监控业务指标的待监控时间序列数据中的异常数据。由于无需依赖人工方式设置固定的同环比阈值,因而,可以在降低监控成本、扩大监控范围的基础上,避免误报、漏报等情况的发生,提高业务指标监控的灵敏性以及准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示为本申请实施例一提供的业务指标监控方法的一种可能的流程示意图;
图2所示为本申请实施例一提供的动态阈值预测的一种可能的流程示意图;
图3所示为本申请实施例一提供的变点检测的一种可能的流程示意图;
图4所示为本申请实施例一提供的业务指标监控方法的一种可能的应用场景示意图;
图5所示为本申请实施例二提供的一种业务指标监控装置的结构示意图;
图6所示为本申请实施例二提供的另一种业务指标监控装置的结构示意图;
图7所示为本申请实施例二提供的又一种业务指标监控装置的结构示意图;
图8所示为本申请实施例二提供的再一种业务指标监控装置的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
实施例一:
为了解决现有的业务指标监控方式所存在的准确性较低、以及监控成本较高等的问题,本申请实施例一提供了一种业务指标监控方法,可适用于互联网广告业务等各种业务的各种业务指标的监控。如图1所示,其为本申请实施例一提供的业务指标监控方法的一种可能的流程示意图。由图1可知,所述业务指标监控方法可包括两个可独立运行的监控方案:
一为基于动态阈值预测的业务指标监控方案,其具体可包括S11:动态阈值预测;S12:判断阈值击穿与否;S13:确定候选异常数据等步骤。其中,在S11中,可采用对待监控业务指标在与待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析的方式,自动预测待监控数据的上下限阈值;在S12中,可基于预测得到的待监控数据的上下限阈值,判断该待监控数据的取值是否超过对应的阈值,如判断待监控数据的取值是否满足以下条件:不低于对应的上限阈值、或不高于对应的下限阈值;相应地,在该监控方案的S13中,可根据S12的判断结果,确定候选异常数据,如,将取值不低于对应的上限阈值、或不高于对应的下限阈值的待监控数据作为候选异常数据。
另一为基于变点检测算法的业务指标监控方案,其具体可包括S10:变点检测,以判断待监控业务指标的待监控时间序列数据中是否存在变点;S13:确定候选异常数据等步骤。其中,在S10中,可基于设定的变点检测算法对待监控业务指标的待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;相应地,在该监控方案的S13中,可根据S10的判断结果,确定候选异常数据,如,将待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为待监控时间序列数据中的候选异常数据。
在第一种监控方案中,由于可以做到阈值动态产生,无需运维人员参与,并且动态阈值可以在一定程度上适应节假日、周末与工作日的差异变化以及不同监控时段的流量特征差异等,因而,与人工设置静态阈值的方式相比,可在降低监控成本、扩大监控范围的基础上,提高业务指标监控的灵敏性以及准确性。
而在第二种监控方案中,由于变点检测也无需依赖人工设置同环比阈值,且能够识别出数据的持续微量变化,因而,也可以在降低监控成本、扩大监控范围的基础上,通过避免因持续微量变化累积造成的漏报等的发生来提高业务指标监控的灵敏性以及准确性。
也就是说,在本申请实施例所述方案中,可采用对待监控业务指标的历史监控样本数据进行统计分析的方式,自动预测待监控业务指标的待监控数据的上下限阈值,并基于预测得到的上下限阈值,确定待监控数据是否为异常数据;或者,可采用变点检测的方式,识别待监控业务指标的待监控时间序列数据中的异常数据。由于无需依赖人工方式设置固定的同环比阈值,因而,可以在降低监控成本、扩大监控范围的基础上,避免误报、漏报等情况的发生,提高业务指标监控的灵敏性以及准确性。另外,在识别出待监控业务指标的异常数据后,还可进行告警和/或对异常数据进行异常原因分析等操作,以尽可能地避免异常数据的存在给用户带来的经济损失,提高用户的应用体验。
再有,需要说明的是,本申请实施例提供的上述两个监控方案除了可各自独立运行之外,还可相互结合使用。如,在基于动态阈值预测对待监控数据进行监控的同时或之后,还可对其进行变点检测,或者,先对待监控数据进行变点检测,之后再基于动态阈值预测对待监控数据进行监控等,以进一步提高业务指标监控的灵敏性以及准确性,对此不作限定。
下面将结合图2、图3对本申请实施例的上述两个监控方案所涉及到的各步骤进行进一步地详细说明。
可选地,在第一监控方案中,在执行S11之前,通常可首先获取待监控业务指标的待监控数据。
可选地,在本申请所述实施例中,可通过以下方式获取待监控业务指标的待监控数据:
接收用于存储待监控业务指标数据的业务服务器推送的待监控业务指标的待监控数据;或者,从该业务服务器处主动获取待监控业务指标的待监控数据。
即,可采用被动接收或主动获取两种方式,从相应的业务服务器处获取所需要的待监控数据。另外,获取到的待监控数据可为一个或多个待监控业务指标的一种或多种待监控数据,对此不作赘述。
其中,业务服务器可为Tair、Treasure、HBase、UPS等在线存储服务器或在线存储系统,或者ODPS(Open Data Processing Service,大数据计算服务)等离线存储服务器或离线存储系统。另外,以待监控业务为互联网广告业务(也可称为互联网信息投放业务)为例,所述待监控业务指标可包括以下指标中的任意一种或多种:待监控业务的新用户注册数量,以及,点击率(CTR,Click Through Rate)、单次点击收益(CPC,Cost Per Click)、千次曝光收益(RPM,Ad revenue Per thousand Impressions)等投放反馈指标,对此均不作赘述。
进一步地,在获取待监控业务指标的待监控数据时,还可指定相应的待监控时间段(该时间段的具体取值可根据实际情况灵活调整),以便从业务服务器处获取待监控业务指标在该设定的待监控时间段内的数据,并将该数据作为所述待监控业务指标的待监控数据。
另外,需要说明的是,获取到的待监控数据通常可为待监控时间序列数据,其中,时间序列(或称动态数列)是指将同一指标的数值按其发生的时间先后顺序排列而成的数列;且,为了便于动态阈值调优,获取到的待监控时间序列数据通常可为正太分布特征足够明显的时间序列数据,即数值波动较小(如,相邻数据之间的差值小于设定的第一阈值)或者对应的标准方差较小(如,对应的标准方差小于设定的第二阈值)的时间序列数据;其中,第一阈值、第二阈值可根据实际情况灵活设定。
例如,以从业务服务器处主动获取待监控业务指标的待监控数据为例,若需要对待监控业务指标在某一天的05:00~06:00这一时间段内的数据进行监控,则可从业务服务器处主动获取待监控业务指标在该某一天的05:00~06:00时间段内的时间序列数据,并将该时间序列数据作为所述待监控业务指标的待监控数据。
另外,可选地,在获取到待监控业务指标的待监控数据后,还可根据实际需求,将所述待监控数据格式化成后续数据处理所需要的格式,对此不作赘述。
相应地,在获取到待监控业务指标的待监控数据之后,即可执行S11所述的操作。具体地,如图2所示(图2为动态阈值预测的一种可能的流程示意图),在S11中,针对待监控业务指标的每一待监控数据,可通过以下步骤预测得到与该待监控数据相对应的上限阈值以及下限阈值:
S21:获取待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据。
可选地,可从待监控业务指标在设定的历史时间段内的历史数据(这些历史数据可从相应的业务服务器中获取)中,获取与该待监控数据相对应的历史监控样本数据;其中,所述设定的历史时间段的具体取值可根据实际情况灵活调整,对此不作赘述。
例如,若要对待监控业务指标A在2016年09月25日9:00am的数据的上下限阈值进行预测,可获取过去1~2个月(也可以更长或更短,可根据需要进行调整)内待监控业务指标A在9:00am的一个或多个指标值,并将获取到的各指标值作为该待监控业务指标A在2016年09月25日9:00am的数据的历史监控样本数据。
另外,需要说明的是,每一时间点的历史同期时间点通常是指与该时间点处于同一时间标准(如24小时制或12小时制)下,且与该时间点相对应的历史时间点。例如,针对时间点2016年03月31日9:00am而言,该时间点的历史同期时间点可为2016年03月30日9:00am、2016年03月20日9:00am、2015年03月31日9:00am等等。
再有,需要说明的是,待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据(即,与该待监控数据相对应的历史监控样本数据)通常可为对应的时间段属性与该待监控数据对应的时间段属性相一致的历史监控样本数据。
也就是说,为了区分样本的差异,以防止标准方差过大造成上下限阈值预测的不准确,在选取样本时可根据需要选择与待监控数据具有相同特征的数据样本,以提高后续的预测效果。
例如,以互联网广告业务的点击率、单次点击收益、千次曝光收益等投放反馈指标为例,由于工作日和节假日的流量特征差异较大,所以在确定该指标的各待监控数据的历史监控样本数据时,还可先确定各待监控数据的时间段属性(如为工作日、或节假日等),并根据每一待监控数据的时间段属性,选择对应的时间段属性与该待监控数据对应的时间段属性相一致的历史数据作为该待监控数据的历史监控样本数据。
另外,为了进一步提高上下限阈值预测的准确性,在获取到与该待监控数据相对应的历史监控样本数据之后,还可过滤掉历史监控样本数据中的噪声数据(即,出现过异常的数据),以使得样本序列的正太分布特征足够明显。
再有,可选地,在获取与待监控数据相对应的历史监控样本数据之前,还可根据实际需求,将待监控业务指标在设定的历史时间段内的历史数据格式化成后续数据处理所需要的格式,以便基于格式化后的历史数据,获取待监控数据的历史监控样本数据。
S22:确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值。
可选地,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值,可具体实施为:
计算该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的加权平均值或算术平均值;
将计算得到的加权平均值或算术平均值作为该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值。
也就是说,可采用计算加权平均值的方式或者计算算术平均值的方式计算得到待监控数据的历史监控样本数据的平均值。
例如,若待监控数据的历史监控样本数据长期来看呈规律性变化(如持续上涨或持续下降等),则可采用计算加权平均值的方式计算得到该待监控数据的历史监控样本数据的平均值,其中,该待监控数据的历史监控样本数据中的各样本数据对应的权重可根据规律性变化的幅度设置,如可按照距离当前时间点越近,则权重越高的方式进行设置;或者,若该待监控数据的历史监控样本数据长期来看相对稳定不易变化,则可采用计算算术平均值的方式计算得到该待监控数据的历史监控样本数据的平均值。
另外,需要说明的是,待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值也可被称为该待监控数据的基准值,对此不作赘述。
S23:将第一设定系数倍的该平均值,作为与该待监控数据相对应的上限阈值,以及,将第二设定系数倍的该平均值,作为与该待监控数据相对应的下限阈值,其中,所述第一设定系数不小于1、所述第二设定系数不大于1。
另外,所述第一设定系数与所述第二设定系数通常互不相同,对此不作赘述。
再有,如图2所示,在执行完S21以及S22之后,也可不执行S23,而是执行以下步骤:
S24:确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的标准方差。
其中,与该待监控数据相对应的历史监控样本数据的标准方差可基于步骤S22所计算得到的平均值以及现有的标准方差计算公式计算得到,对此不作赘述。
S25:将该平均值与第三设定系数倍的该标准方差之和作为与该待监控数据相对应的上限阈值,将该平均值与第四设定系数倍的该标准方差之差作为与该待监控数据相对应的下限阈值,其中,所述第三设定系数、所述第四设定系数均不小于0。
也就是说,待监控数据所对应的上下限阈值可根据待监控数据的基准值的直接系数调节得出,另外,也可以根据待监控数据的基准值和待监控数据的历史监控样本数据的标准方差调节得出,对此不作限定。
进一步地,需要说明的是,针对待监控业务指标的每一待监控数据,在根据上述步骤预测得到该待监控数据所对应的上下限阈值之后,即可针对该待监控数据,执行S12以及S13所述的操作,以确定该待监控数据是否为候选异常数据。也就是说,由于待监控数据通常可为多个,因而,S11、与S12、S13通常可穿插进行,对此不作赘述。
另外,需要说明的是,在本申请所述实施例中,每一待监控数据所对应的上下限阈值除了可以是事先基于该待监控数据的历史监控样本数据预测得到的之外,也可以是在监控的过程中,实时地基于该待监控数据的历史监控样本数据预测得到的;且,在预测得到该待监控数据所对应的上下限阈值之后,还可根据最新的样本数据对其进行实时或定时更新,对此也不作赘述。
由上述内容可知,在S11、S12以及S13所述的第一监控方案中,由于可以采用对待监控业务指标的历史监控样本数据进行统计分析的方式,自动预测待监控业务指标的待监控数据的上下限阈值,并基于预测得到的上下限阈值,确定待监控数据是否为异常数据。即,可以做到阈值动态产生,无需运维人员参与,因而,与人工设置静态阈值的方式相比,可在降低监控成本、扩大监控范围的基础上,提高业务指标监控的灵敏性以及准确性。
但是,由于业务指标监控中有些指标数据只有在持续微量变化累积到一定程度后才会被发现,这种情况下不管是静态阈值还是动态阈值都很难发现。因而,为了解决这一问题,以弥补动态阈值方式在检测持续微量变化中的不足,在本申请实施例所述方案中,还可采用变点检测算法(changepoint算法)对待监控业务指标的待监控数据进行变点检测,进而识别出候选异常数据(即采用图1中的包括S10以及S13在内的第二监控方案对待监控业务指标的待监控数据进行监控),以防止因持续微量变化累积造成的漏报等的发生,提高业务指标监控的准确性。
可选地,由于变点检测算法通常可以用于检测给定的完整时间序列数据中的变点,因而,在第二监控方案中,在执行S10之前,通常可首先获取待监控业务指标的待监控时间序列数据。
可选地,与前述相关描述类似,可采用被动接收或主动获取两种方式,从相应的业务服务器处获取待监控业务指标的待监控时间序列数据。且,在获取待监控业务指标的待监控时间序列数据时,还可指定相应的待监控时间段。另外,以待监控业务为互联网广告业务为例,所述待监控业务指标可包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益、千次曝光收益等,对此均不作赘述。
再有,为了提高变点检测的准确性,获取到的待监控时间序列数据通常可为正太分布特征足够明显的时间序列数据,即数值波动较小或者对应的标准方差较小的时间序列数据。且,在获取到待监控时间序列数据后,还可根据实际需求,将所述待监控时间序列数据格式化成后续数据处理所需要的格式,对此也不作赘述。
相应地,在获取到待监控业务指标的待监控时间序列数据之后,即可执行S10所述的操作。具体地,如图3所示(图3为变点检测的一种可能的流程示意图),S10可具体包括以下步骤:
S31:确定与所述待监控时间序列数据相对应的差值累积和序列。
可选地,可通过以下方式确定与所述待监控时间序列数据相对应的差值累积和序列(即CUSUM序列):
依次确定所述待监控时间序列数据中的各数据的差值累积和数据;
根据依次确定的所述待监控时间序列数据中的各数据的差值累积和数据,得到与所述待监控时间序列数据相对应的差值累积和序列。
另外,针对所述待监控时间序列数据中的任一数据,确定所述任一数据的差值累积和数据,可包括以下步骤:
计算该任一数据的取值与所述待监控时间序列数据的平均值之间的差值、以及所述待监控时间序列数据中的时间点位于该任一数据的时间点之前的各数据的取值与所述待监控时间序列数据的平均值之间的差值;
将计算得到的上述各差值之和作为该任一数据的差值累积和数据。
其中,需要说明的是,由于所述待监控时间序列数据是连续时间点上的序列数据,所以可采用计算算术平均值的方式计算得到所述待监控时间序列数据的平均值;当然,也可采用计算加权平均值的方式计算得到所述待监控时间序列数据的平均值,对此不作限定。
即,以待监控时间序列数据为[X1,X2,X3,X4,…,X10]为例,可通过以下方式计算其中的各数据的差值累积和数据:
1)、计算该待监控时间序列数据的平均值Xavg,如,可以是(X1+X2+X3+X4+...+X10)/10,也可以是(X1*m1+X2*m2+...+X10*m10)/10,其中,m1,m2,m3,…,m10分别为X1,X2,X3,X4,…,X10的权重;
2)、依次检查该待监控时间序列数据中的每个样本数据偏离平均值的幅度,并且在这个过程中,在每个样本数据的时刻累加之前所有样本数据偏离平均值的幅度之和,得到以下结果:
S1=(X1-Xavg);
S2=S1+(X2-Xavg);
...
S10=S9+(X10-Xavg)。
其中,S1,S2,S3,…,S10分别为X1,X2,X3,X4,…,X10的差值累积和数据。
也就是说,每一数据对应的差值累积和数据为该数据以及该数据之前的各数据与目标值(即,待监控时间序列数据的平均值)的偏差的累积和,从而使得即使是过程均值中的微小波动也会导致累积偏差值的稳定增加(或降低),使得差值累积和序列能够反映所述待监控时间序列数据中的数据随着时间推移发生微量变化的累积趋势。
可选地,为了提高后续变点确定的准确性,以进一步提高业务指标监控的准确性,在确定与所述待监控时间序列数据相对应的差值累积和序列之前,所述方法还可包括以下步骤:
S30:依次确定所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,并根据依次确定的所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,得到与所述待监控时间序列数据相对应的差值序列。
其中,待监控时间序列数据中的每一数据的基准值可采用第一种监控方案中所述的基准值计算方式计算得到,以提高基准值的准确性,进而提高后续变点检测的准确性。当然,需要说明的是,在第二监控方案中,还可根据经验人为设定各数据对应的基准值,对此不作限定。
相应地,S31所述的确定与所述待监控时间序列数据相对应的差值累积和序列,可包括:
根据所述差值序列确定与所述待监控时间序列数据相对应的差值累积和序列。
其中,根据所述差值序列确定与所述待监控时间序列数据相对应的差值累积和序列的具体实施方式与直接根据所述待监控时间序列数据确定与所述待监控时间序列数据相对应的差值累积和序列的具体实施方式类似,如,可依次确定所述差值序列中的各数据的差值累积和数据,并根据依次确定的所述差值序列中的各数据的差值累积和数据,得到与所述待监控时间序列数据相对应的差值累积和序列,对此不作赘述。
也就是说,本实施例中,可以直接基于获取到的待监控时间序列数据(即检测数据)确定差值累积和序列,并应用算法检测变点,也可以将待监控时间序列数据中的各数据与对应的基准值依次相减得出检测数据与基准值的差值序列,然后再基于该差值序列确定差值累积和序列并应用算法检测变点,对此不作限定。
S32:判断所述差值累积和序列中是否存在变点。
可选地,判断所述差值累积和序列中是否存在变点,可包括:
判断所述差值累积和序列中是否存在一阶导数从正数变为负数、或从负数变为正数的状态变化点;
若存在(若不存在状态变化点,则可说明所述差值累积和序列中不存在变点),则判断该状态变化点之后的、包括与该状态变化点紧邻的点在内的连续设定个数(该设定个数可根据实际情况灵活调整)的点的一阶导数的正负性是否与该状态变化点的一阶导数的正负性相同,若是,则将该状态变化点作为所述差值累积和序列中的变点(即,可确定所述差值累积和序列中存在变点)。
例如,若确定所述差值累积和序列对应的曲线上每个点的一阶导数由正数变为负数、或负数变为正数的变化状态持续3个点,则可认为首次出现变化的点为变点。
这是因为,由于差值累积和序列能够反映待监控时间序列数据中的数据随着时间推移发生微量变化的累积趋势,因而,如果该序列没有变点的情况下,这个序列对应的曲线上不会有显著拐点,如果发现存在显著拐点则说明该序列有变点存在。
可选地,在将该状态变化点作为所述差值累积和序列中的变点之前,所述方法还可包括:
计算所述差值累积和序列中的变点的置信度;并
确定所述差值累积和序列中的变点的置信度不低于设定的置信度阈值(该置信度阈值可根据实际情况灵活调整)。
即,为了提高业务监控的准确性,可在对差值累积和序列中的候选变点进行置信验证后,再将该候选变点作为最终所需的变点。
可选地,所述差值累积和序列中的变点的置信度可以通过反复迭代计算待监控时间序列数据的累积变量的最大值和最小值的差异Sdiffi来得到。其中,迭代的样本差异主要通过随机打乱样本序列(即待监控时间序列数据)的顺序来定义,如果迭代n次中,Sdiffi小于原始顺序得到的Sdiff的次数为m,则待监控时间序列数据的差值累积和序列中的变点的置信度(或也可称为待监控时间序列数据中的变点的置信度)则为m/n*100%。由于置信度在95%以上的样本序列在1000次以上的更多迭代中置信度已稳定,所以当变点的置信度为95%以上时,可将所述差值累积和序列中的变点作为实际变点。
进一步地,在按照上述方式识别出变点之后,即可执行步骤S13所述的操作,以将待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为待监控时间序列数据中的候选异常数据。
由上述内容可知,在S10以及S13所述的第二监控方案中,可采用变点检测的方式,识别待监控业务指标的待监控时间序列数据中的异常数据。由于变点检测无需依赖人工设置同环比阈值,且能够识别出数据的持续微量变化,因而,也可以在降低监控成本、扩大监控范围的基础上,通过避免因持续微量变化累积造成的漏报等的发生来提高业务指标监控的灵敏性以及准确性。
进一步地,如图1所示,由于当数据样本的分布不是理想的正态分布时,动态阈值检测或变点检测均会受到影响,因而,为了过滤掉一些不必要的误报,进一步提高业务指标监控的准确性,所述方法还可包括以下步骤:
S14:针对每一候选异常数据,根据设定的、与该候选异常数据相对应的同比阈值以及环比阈值(该两个阈值可根据实际情况灵活设定),判断该候选异常数据是否满足以下条件,若是,则将该候选异常数据作为实际异常数据,否则,将该候选异常数据作为非异常数据:
同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
也就是说,本申请所述实施例中,可通过同环比静态阈值兜底的方式对候选异常数据进行回归验证,以防止因自动检测方式受样本质量不好的影响所造成的误报,对此不作赘述。
另外,需要说明的是,在识别出待监控业务指标的异常数据后,还可进行告警(声音告警和/或信息告警)和/或对异常数据进行异常原因分析等操作,以尽可能地避免异常数据的存在给用户带来的经济损失,提高用户的应用体验。
最后,以将图1所示的所述业务指标监控方法应用于互联网广告领域为例,结合图4所示的应用场景(图4为此种情况下所述业务指标监控方法的一种可能的应用场景示意图),对该种场景下的业务指标监控的具体实现流程进行简要说明,该场景例如可以包括:广告服务器41(或可称为信息投放服务器)以及监控服务器42,其中:
广告服务器41中可存储有互联网广告业务运行过程中产生的各种业务指标数据,如,互联网广告业务的新用户注册数量、互联网广告(或广告位)的点击率、单次点击收益以及千次曝光收益等中的任意一种或多种指标数据。
相应地,监控服务器42可根据实际需求,采用被动接收或主动获取等方式从广告服务器41处获取待监控广告业务指标的待监控数据,如,待监控广告业务指标的正太分布特征足够明显的时间序列数据等,并对获取到的待监控数据进行监控。如,
监控服务器42可针对获取到的每一待监控数据,根据设定的、与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值;若判断结果为是,则确定该待监控数据为候选异常数据;其中,与该待监控数据相对应的上限阈值以及下限阈值是通过对该待监控广告业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析所得到的。
也就是说,监控服务器42可采用对待监控广告业务指标的历史监控样本数据进行统计分析的方式,自动预测待监控广告业务指标的待监控数据的上下限阈值,并基于预测得到的上下限阈值,确定待监控数据是否为异常数据。由于可以做到阈值动态产生,无需运维人员参与,并且动态阈值可以在一定程度上适应节假日、周末与工作日的差异变化以及不同监控时段的流量特征差异等,因而,与人工设置静态阈值的方式相比,可在降低监控成本、扩大监控范围的基础上,避免误报、漏报等情况的发生,提高互联网广告业务指标监控的灵敏性以及准确性。
另外,若监控服务器42从广告服务器41处获取到的待监控数据为待监控时间序列数据,则监控服务器42还可基于设定的变点检测算法对所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;若存在,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据。
也就是说,监控服务器42还可采用变点检测的方式,识别待监控广告业务指标的待监控时间序列数据中的异常数据。由于变点检测也无需依赖人工设置同环比阈值,且能够识别出数据的持续微量变化,因而,也可以在降低监控成本、扩大监控范围的基础上,避免误报、漏报等情况的发生,提高互联网广告业务指标监控的灵敏性以及准确性。
另外,需要说明的是,广告服务器41和监控服务器42可通过通信网络进行通信连接,该网络可以为局域网、广域网等。其中,广告服务器41可以为Tair、Treasure、HBase、UPS等在线存储服务器或在线存储系统,或者ODPS等离线存储服务器或离线存储系统。监控服务器42可以为任何能够支持业务指标监控等处理操作的服务器设备。
再有,需要注意的是,图4所示的应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。相反,本申请的实施方式可以应用于适用的任何场景,如其它非互联网广告业务的监控场景,或者商业预测、决策支持等应用场景,对此不再赘述。
最后,需要说明的是,本申请实施例所述方案无语言、软件或者硬件的限制。但是,为了提高数据处理的效率,可优先选用JAVA语言、R语言等便于统计分析的编程语言,和性能高的硬件等来实现,本申请实施例对此也不作赘述。
实施例二:
基于与本申请实施例一中的第一种监控方案同样的发明构思,本申请实施例二提供了一种业务指标监控装置,该业务指标监控装置的具体实施可参见本申请实施例一中的第一种监控方案的相关描述,对此不作赘述。具体地,如图5所示,该业务指标监控装置50可包括:
数据获取单元51,可用于获取待监控业务指标的待监控数据;
统计分析单元52,可用于针对所述数据获取单元51获取到的每一待监控数据,通过对该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析,得到与该待监控数据相对应的上限阈值以及下限阈值;
指标判断单元53,可用于针对所述数据获取单元51获取到的每一待监控数据,根据所述统计分析单元52分析得到的与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值;
异常确定单元54,可用于若根据所述指标判断单元53的判断结果,确定针对该待监控数据的判断结果为是,则确定该待监控数据为候选异常数据。
可选地,所述数据获取单元51,具体可用于接收用于存储待监控业务指标数据的业务服务器推送的待监控业务指标的待监控数据;或者,从该业务服务器处主动获取待监控业务指标的待监控数据。
其中,所述待监控业务指标可包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益等。
可选地,所述统计分析单元52具体可用于针对待监控业务指标的每一待监控数据,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值;并将第一设定系数倍的该平均值,作为与该待监控数据相对应的上限阈值,将第二设定系数倍的该平均值,作为与该待监控数据相对应的下限阈值,其中,所述第一设定系数不小于1、所述第二设定系数不大于1。
或者,
所述统计分析单元52具体可用于针对待监控业务指标的每一待监控数据,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值以及标准方差;并将该平均值与第三设定系数倍的该标准方差之和作为与该待监控数据相对应的上限阈值,将该平均值与第四设定系数倍的该标准方差之差作为与该待监控数据相对应的下限阈值,其中,所述第三设定系数、所述第四设定系数均不小于0。
其中,该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据通常可为对应的时间段属性与该待监控数据对应的时间段属性相一致的历史监控样本数据。
另外,该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值,可以是所述统计分析单元52通过以下方式计算得到的:
计算该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的加权平均值或算术平均值;
将计算得到的加权平均值或算术平均值作为该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值。
进一步地,如图5所示,该业务指标监控装置50还可包括:
回归验证单元55,可用于在所述异常确定单元54确定该待监控数据为候选异常数据之后,根据设定的、与该待监控数据相对应的同比阈值以及环比阈值,判断该待监控数据是否满足以下条件,若是,则将该待监控数据作为实际异常数据,否则,将该待监控数据作为非异常数据:
同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
进一步地,基于与本申请实施例一中的第一种监控方案同样的发明构思,本申请实施例二还提供了另一种业务指标监控装置,该另一种业务指标监控装置的具体实施可参见本申请实施例一中的第一种监控方案的相关描述,对此不作赘述。具体地,如图6所示,该另一种业务指标监控装置60可包括:
存储器61,可用于存储软件程序以及模块;
处理器62,可用于通过运行存储在存储器61内的软件程序以及模块,执行以下操作:
获取待监控业务指标的待监控数据;并针对获取到的每一待监控数据,根据设定的、与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值;
若判断结果为是,则确定该待监控数据为候选异常数据;
其中,与该待监控数据相对应的上限阈值以及下限阈值是所述处理器61通过对该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析所得到的。
可选地,所述处理器61具体可用于接收用于存储待监控业务指标数据的业务服务器推送的待监控业务指标的待监控数据;或者,从该业务服务器处主动获取待监控业务指标的待监控数据。
其中,所述待监控业务指标可包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益等。
进一步地,所述处理器61具体可用于针对待监控业务指标的每一待监控数据,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值;并将第一设定系数倍的该平均值,作为与该待监控数据相对应的上限阈值,将第二设定系数倍的该平均值,作为与该待监控数据相对应的下限阈值,其中,所述第一设定系数不小于1、所述第二设定系数不大于1。
或者,
所述处理器61具体可用于针对待监控业务指标的每一待监控数据,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值以及标准方差;并将该平均值与第三设定系数倍的该标准方差之和作为与该待监控数据相对应的上限阈值,将该平均值与第四设定系数倍的该标准方差之差作为与该待监控数据相对应的下限阈值,其中,所述第三设定系数、所述第四设定系数均不小于0。
其中,该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据通常可为对应的时间段属性与该待监控数据对应的时间段属性相一致的历史监控样本数据。
另外,该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值,可以是所述处理器62通过以下方式计算得到的:
计算该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的加权平均值或算术平均值;
将计算得到的加权平均值或算术平均值作为该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值。
进一步地,所述处理器62还可用于在确定该待监控数据为候选异常数据之后,根据设定的、与该待监控数据相对应的同比阈值以及环比阈值,判断该待监控数据是否满足以下条件,若是,则将该待监控数据作为实际异常数据,否则,将该待监控数据作为非异常数据:
同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
即,在一种可能的设计中,该另一种业务指标监控装置60的结构中可包括存储器61和处理器62,所述处理器62被配置为支持执行本申请实施例一中的第一种监控方案中相应的功能。所述存储器61用于与处理器62耦合,其保存处理器62执行本申请实施例一中的第一种监控方案中相应的功能所必要的程序指令和数据。
其中,存储器61可包括内存611和外部存储器612,内存611用于暂时存放处理器62中的运算数据,以及与硬盘等外部存储器612交换的数据,处理器62通过内存611与外部存储器612进行数据交换。内存611可以为非易失存储器(Non-Volatile Random AccessMemory,NVRAM)、动态随机存储器(Dynamic Random Access Memory,DRAM)、静态随机存储器(Static RAM,SRAM)、Flash闪存等其中之一;外部存储器612可以为硬盘、光盘、USB盘、软盘或磁带机等。
另外,处理器62可以是中央处理器(CPU),通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC),现场可编程门阵列(FPGA)或者其他可编程逻辑器件、晶体管逻辑器件,硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器62也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。
再有,本领域普通技术人员可以理解,所述存储器61和所述处理器62之间可通过图6中所示的总线63通信相连;且,图6所示的结构仅为示意,其并不对该另一种业务指标监控装置60的结构造成限定。例如,该另一种业务指标监控装置60还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置等。
进一步地,基于与本申请实施例一中的第二种监控方案同样的发明构思,本申请实施例二还提供了又一种业务指标监控装置,该又一种业务指标监控装置的具体实施可参见本申请实施例一中的第二种监控方案的相关描述,对此不作赘述。具体地,如图7所示,该又一种业务指标监控装置70可包括:
数据获取单元71,可用于获取待监控业务指标的待监控时间序列数据;
变点检测单元72,可用于基于设定的变点检测算法对所述数据获取单元71获取到的所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;
异常确定单元73,可用于若根据所述变点检测单元72的检测结果,确定所述待监控时间序列数据中存在变点,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据。
可选地,所述数据获取单元71,具体可用于接收用于存储待监控业务指标数据的业务服务器推送的待监控业务指标的待监控时间序列数据;或者,从该业务服务器处主动获取待监控业务指标的待监控时间序列数据。
其中,所述待监控业务指标可包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益等。
可选地,所述变点检测单元72具体可用于确定与所述待监控时间序列数据相对应的差值累积和序列,并判断所述差值累积和序列中是否存在变点。
具体地,所述变点检测单元72具体可用于依次确定所述待监控时间序列数据中的各数据的差值累积和数据;并根据依次确定的所述待监控时间序列数据中的各数据的差值累积和数据,得到与所述待监控时间序列数据相对应的差值累积和序列。
其中,针对所述待监控时间序列数据中的任一数据,所述变点检测单元72具体可用于通过以下方式确定所述任一数据的差值累积和数据:
计算该任一数据的取值与所述待监控时间序列数据的平均值之间的差值、以及所述待监控时间序列数据中的时间点位于该任一数据的时间点之前的各数据的取值与所述待监控时间序列数据的平均值之间的差值;
将计算得到的上述各差值之和作为该任一数据的差值累积和数据。
可选地,如图7所示,该又一种业务指标监控装置70还可包括差值序列确定单元74:
所述差值序列确定单元74,可用于在所述变点检测单元72确定与所述待监控时间序列数据相对应的差值累积和序列之前,依次确定所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,并根据依次确定的所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,得到与所述待监控时间序列数据相对应的差值序列;
相应地,所述变点检测单元72具体可用于根据所述差值序列确定与所述待监控时间序列数据相对应的差值累积和序列。
其中,针对所述待监控时间序列数据中的任一数据,该数据的基准值可以是所述变点检测单元72通过以下方式得到的:
获取待监控业务指标在与该数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据;
计算获取到的历史监控样本数据的平均值,并将计算得到的平均值作为该数据的基准值。
进一步可选地,所述变点检测单元72具体可用于判断所述差值累积和序列中是否存在一阶导数从正数变为负数、或从负数变为正数的状态变化点;若存在,则判断该状态变化点之后的、包括与该状态变化点紧邻的点在内的连续设定个数的点的一阶导数的正负性是否与该状态变化点的一阶导数的正负性相同,若是,则将该状态变化点作为所述差值累积和序列中的变点。
另外,所述变点检测单元72还可用于在将该状态变化点作为所述差值累积和序列中的变点之前,计算所述差值累积和序列中的变点的置信度;并确定所述差值累积和序列中的变点的置信度不低于设定的置信度阈值。
进一步地,如图7所示,该又一种业务指标监控装置70还可包括:
回归验证单元75,可用于针对所述待监控时间序列数据中的每一候选异常数据,根据设定的、与该候选异常数据相对应的同比阈值以及环比阈值,判断该候选异常数据是否满足以下条件,若是,则将该候选异常数据作为实际异常数据,否则,将该候选异常数据作为非异常数据:
同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
进一步地,基于与本申请实施例一中的第二种监控方案同样的发明构思,本申请实施例二还提供了再一种业务指标监控装置,该再一种业务指标监控装置的具体实施可参见本申请实施例一中的第二种监控方案的相关描述,对此不作赘述。具体地,如图8所示,该再一种业务指标监控装置80可包括:
存储器81,可用于存储软件程序以及模块;
处理器82,可用于通过运行存储在存储器内的软件程序以及模块,执行以下操作:
获取待监控业务指标的待监控时间序列数据;并基于设定的变点检测算法对所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;若存在,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据。
可选地,所述处理器82,具体可用于接收用于存储待监控业务指标数据的业务服务器推送的待监控业务指标的待监控时间序列数据;或者,从该业务服务器处主动获取待监控业务指标的待监控时间序列数据。
其中,所述待监控业务指标可包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益等。
可选地,所述处理器82具体可用于确定与所述待监控时间序列数据相对应的差值累积和序列,并判断所述差值累积和序列中是否存在变点。
具体地,所述处理器82具体可用于依次确定所述待监控时间序列数据中的各数据的差值累积和数据;并根据依次确定的所述待监控时间序列数据中的各数据的差值累积和数据,得到与所述待监控时间序列数据相对应的差值累积和序列。
其中,针对所述待监控时间序列数据中的任一数据,所述处理器82具体可用于通过以下方式确定所述任一数据的差值累积和数据:
计算该任一数据的取值与所述待监控时间序列数据的平均值之间的差值、以及所述待监控时间序列数据中的时间点位于该任一数据的时间点之前的各数据的取值与所述待监控时间序列数据的平均值之间的差值;
将计算得到的上述各差值之和作为该任一数据的差值累积和数据。
可选地,所述处理器82还可用于在确定与所述待监控时间序列数据相对应的差值累积和序列之前,依次确定所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,并根据依次确定的所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,得到与所述待监控时间序列数据相对应的差值序列,以根据所述差值序列确定与所述待监控时间序列数据相对应的差值累积和序列。
其中,针对所述待监控时间序列数据中的任一数据,该数据的基准值可以是所述处理器82通过以下方式得到的:
获取待监控业务指标在与该数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据;
计算获取到的历史监控样本数据的平均值,并将计算得到的平均值作为该数据的基准值。
进一步可选地,所述处理器82具体可用于判断所述差值累积和序列中是否存在一阶导数从正数变为负数、或从负数变为正数的状态变化点;若存在,则判断该状态变化点之后的、包括与该状态变化点紧邻的点在内的连续设定个数的点的一阶导数的正负性是否与该状态变化点的一阶导数的正负性相同,若是,则将该状态变化点作为所述差值累积和序列中的变点。
另外,所述处理器82还可用于在将该状态变化点作为所述差值累积和序列中的变点之前,计算所述差值累积和序列中的变点的置信度;并确定所述差值累积和序列中的变点的置信度不低于设定的置信度阈值。
进一步地,所述处理器82还可用于针对所述待监控时间序列数据中的每一候选异常数据,根据设定的、与该候选异常数据相对应的同比阈值以及环比阈值,判断该候选异常数据是否满足以下条件,若是,则将该候选异常数据作为实际异常数据,否则,将该候选异常数据作为非异常数据:
同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
即,在一种可能的设计中,该另一种业务指标监控装置80的结构中可包括存储器81和处理器82,所述处理器82被配置为支持执行本申请实施例一中的第二种监控方案中相应的功能。所述存储器81用于与处理器82耦合,其保存处理器82执行本申请实施例一中的第二种监控方案中相应的功能所必要的程序指令和数据。
其中,存储器81可包括内存811和外部存储器812,内存811用于暂时存放处理器82中的运算数据,以及与硬盘等外部存储器812交换的数据,处理器82通过内存811与外部存储器812进行数据交换。内存811可以为非易失存储器、动态随机存储器、静态随机存储器、Flash闪存等其中之一;外部存储器812可以为硬盘、光盘、USB盘、软盘或磁带机等。
另外,处理器82可以是中央处理器(CPU),通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC),现场可编程门阵列(FPGA)或者其他可编程逻辑器件、晶体管逻辑器件,硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器82也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。
再有,本领域普通技术人员可以理解,所述存储器81和所述处理器82之间可通过图8中所示的总线83通信相连;且,图8所示的结构仅为示意,其并不对该另一种业务指标监控装置80的结构造成限定。例如,该另一种业务指标监控装置80还可包括比图8中所示更多或者更少的组件,或者具有与图8所示不同的配置等。
本领域技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (33)
1.一种业务指标监控方法,其特征在于,包括:
获取待监控业务指标的待监控数据,其中,所述待监控业务指标包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益;
针对获取到的每一待监控数据,根据设定的、与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值;
若判断结果为是,则确定该待监控数据为候选异常数据,根据设定的、与该待监控数据相对应的同比阈值以及环比阈值,判断该待监控数据是否满足以下条件,若是,则将该待监控数据作为实际异常数据,否则,将该待监控数据作为非异常数据:同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值;
其中,与该待监控数据相对应的上限阈值以及下限阈值是通过对该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析所得到的。
2.如权利要求1所述的方法,其特征在于,获取待监控业务指标的待监控数据,包括:
接收用于存储待监控业务指标数据的业务服务器推送的待监控业务指标的待监控数据;或者,
从该业务服务器处主动获取待监控业务指标的待监控数据。
3.如权利要求1所述的方法,其特征在于,针对待监控业务指标的每一待监控数据,与该待监控数据相对应的上限阈值以及下限阈值是通过以下方式得到的:
确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值;
将第一设定系数倍的该平均值,作为与该待监控数据相对应的上限阈值,以及,将第二设定系数倍的该平均值,作为与该待监控数据相对应的下限阈值,其中,所述第一设定系数不小于1、所述第二设定系数不大于1。
4.如权利要求1所述的方法,其特征在于,针对待监控业务指标的每一待监控数据,与该待监控数据相对应的上限阈值以及下限阈值是通过以下方式得到的:
确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值以及标准方差;
将该平均值与第三设定系数倍的该标准方差之和作为与该待监控数据相对应的上限阈值,将该平均值与第四设定系数倍的该标准方差之差作为与该待监控数据相对应的下限阈值,其中,所述第三设定系数、所述第四设定系数均不小于0。
5.如权利要求3或4所述的方法,其特征在于,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值,包括:
计算该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的加权平均值或算术平均值;
将计算得到的加权平均值或算术平均值作为该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值。
6.如权利要求1所述的方法,其特征在于,该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据为对应的时间段属性与该待监控数据对应的时间段属性相一致的历史监控样本数据。
7.一种业务指标监控方法,其特征在于,包括:
获取待监控业务指标的待监控时间序列数据,其中,所述待监控业务指标包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益;
基于设定的变点检测算法对所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;
若存在,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据;
针对所述待监控时间序列数据中的每一候选异常数据,根据设定的、与该候选异常数据相对应的同比阈值以及环比阈值,判断该候选异常数据是否满足以下条件,若是,则将该候选异常数据作为实际异常数据,否则,将该候选异常数据作为非异常数据:同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
8.如权利要求7所述的方法,其特征在于,获取待监控业务指标的待监控时间序列数据,包括:
接收用于存储待监控业务指标数据的业务服务器推送的待监控业务指标的待监控时间序列数据;或者,
从该业务服务器处主动获取待监控业务指标的待监控时间序列数据。
9.如权利要求7所述的方法,其特征在于,基于设定的变点检测算法对所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点,包括:
确定与所述待监控时间序列数据相对应的差值累积和序列,并判断所述差值累积和序列中是否存在变点。
10.如权利要求9所述的方法,其特征在于,确定与所述待监控时间序列数据相对应的差值累积和序列,包括:
依次确定所述待监控时间序列数据中的各数据的差值累积和数据;
根据依次确定的所述待监控时间序列数据中的各数据的差值累积和数据,得到与所述待监控时间序列数据相对应的差值累积和序列。
11.如权利要求10所述的方法,其特征在于,针对所述待监控时间序列数据中的任一数据,确定所述任一数据的差值累积和数据,包括:
计算该任一数据的取值与所述待监控时间序列数据的平均值之间的差值、以及所述待监控时间序列数据中的时间点位于该任一数据的时间点之前的各数据的取值与所述待监控时间序列数据的平均值之间的差值;
将计算得到的上述各差值之和作为该任一数据的差值累积和数据。
12.如权利要求9所述的方法,其特征在于,在确定与所述待监控时间序列数据相对应的差值累积和序列之前,所述方法还包括:
依次确定所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,并根据依次确定的所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,得到与所述待监控时间序列数据相对应的差值序列;
确定与所述待监控时间序列数据相对应的差值累积和序列,包括:
根据所述差值序列确定与所述待监控时间序列数据相对应的差值累积和序列。
13.如权利要求12所述的方法,其特征在于,针对所述待监控时间序列数据中的任一数据,该数据的基准值是通过以下方式得到的:
获取待监控业务指标在与该数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据;
计算获取到的历史监控样本数据的平均值,并将计算得到的平均值作为该数据的基准值。
14.如权利要求9所述的方法,其特征在于,判断所述差值累积和序列中是否存在变点,包括:
判断所述差值累积和序列中是否存在一阶导数从正数变为负数、或从负数变为正数的状态变化点;
若存在,则判断该状态变化点之后的、包括与该状态变化点紧邻的点在内的连续设定个数的点的一阶导数的正负性是否与该状态变化点的一阶导数的正负性相同,若是,则将该状态变化点作为所述差值累积和序列中的变点。
15.如权利要求14所述的方法,其特征在于,在将该状态变化点作为所述差值累积和序列中的变点之前,所述方法还包括:
计算所述差值累积和序列中的变点的置信度;并
确定所述差值累积和序列中的变点的置信度不低于设定的置信度阈值。
16.一种业务指标监控装置,其特征在于,包括:
数据获取单元,用于获取待监控业务指标的待监控数据,其中,所述待监控业务指标包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益;
统计分析单元,用于针对所述数据获取单元获取到的每一待监控数据,通过对该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析,得到与该待监控数据相对应的上限阈值以及下限阈值;
指标判断单元,用于针对所述数据获取单元获取到的每一待监控数据,根据所述统计分析单元分析得到的与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值;
异常确定单元,用于若根据所述指标判断单元的判断结果,确定针对该待监控数据的判断结果为是,则确定该待监控数据为候选异常数据,根据设定的、与该待监控数据相对应的同比阈值以及环比阈值,判断该待监控数据是否满足以下条件,若是,则将该待监控数据作为实际异常数据,否则,将该待监控数据作为非异常数据:同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
17.如权利要求16所述的装置,其特征在于,
所述统计分析单元,具体用于针对待监控业务指标的每一待监控数据,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值;并将第一设定系数倍的该平均值,作为与该待监控数据相对应的上限阈值,将第二设定系数倍的该平均值,作为与该待监控数据相对应的下限阈值,其中,所述第一设定系数不小于1、所述第二设定系数不大于1。
18.如权利要求16所述的装置,其特征在于,
所述统计分析单元,具体用于针对待监控业务指标的每一待监控数据,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值以及标准方差;并将该平均值与第三设定系数倍的该标准方差之和作为与该待监控数据相对应的上限阈值,将该平均值与第四设定系数倍的该标准方差之差作为与该待监控数据相对应的下限阈值,其中,所述第三设定系数、所述第四设定系数均不小于0。
19.一种业务指标监控装置,其特征在于,包括:
数据获取单元,用于获取待监控业务指标的待监控时间序列数据,其中,所述待监控业务指标包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益;
变点检测单元,用于基于设定的变点检测算法对所述数据获取单元获取到的所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;
异常确定单元,用于若根据所述变点检测单元的检测结果,确定所述待监控时间序列数据中存在变点,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据,针对所述待监控时间序列数据中的每一候选异常数据,根据设定的、与该候选异常数据相对应的同比阈值以及环比阈值,判断该候选异常数据是否满足以下条件,若是,则将该候选异常数据作为实际异常数据,否则,将该候选异常数据作为非异常数据:同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
20.如权利要求19所述的装置,其特征在于,
所述变点检测单元,具体用于确定与所述待监控时间序列数据相对应的差值累积和序列,并判断所述差值累积和序列中是否存在变点。
21.如权利要求20所述的装置,其特征在于,
所述变点检测单元,具体用于依次确定所述待监控时间序列数据中的各数据的差值累积和数据;并根据依次确定的所述待监控时间序列数据中的各数据的差值累积和数据,得到与所述待监控时间序列数据相对应的差值累积和序列。
22.如权利要求21所述的装置,其特征在于,所述装置还包括差值序列确定单元:
所述差值序列确定单元,用于在所述变点检测单元确定与所述待监控时间序列数据相对应的差值累积和序列之前,依次确定所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,并根据依次确定的所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,得到与所述待监控时间序列数据相对应的差值序列;
所述变点检测单元,具体用于根据所述差值序列确定与所述待监控时间序列数据相对应的差值累积和序列。
23.如权利要求20所述的装置,其特征在于,
所述变点检测单元,具体用于判断所述差值累积和序列中是否存在一阶导数从正数变为负数、或从负数变为正数的状态变化点;若存在,则判断该状态变化点之后的、包括与该状态变化点紧邻的点在内的连续设定个数的点的一阶导数的正负性是否与该状态变化点的一阶导数的正负性相同,若是,则将该状态变化点作为所述差值累积和序列中的变点。
24.如权利要求23所述的装置,其特征在于,
所述变点检测单元,还用于在将该状态变化点作为所述差值累积和序列中的变点之前,计算所述差值累积和序列中的变点的置信度;并确定所述差值累积和序列中的变点的置信度不低于设定的置信度阈值。
25.一种业务指标监控装置,其特征在于,包括:
存储器,用于存储软件程序以及模块;
处理器,用于通过运行存储在存储器内的软件程序以及模块,执行以下操作:
获取待监控业务指标的待监控数据;并针对获取到的每一待监控数据,根据设定的、与该待监控数据相对应的上限阈值以及下限阈值,判断该待监控数据是否满足以下条件:该待监控数据的取值不低于对应的上限阈值、或不高于对应的下限阈值,其中,所述待监控业务指标包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益;
若判断结果为是,则确定该待监控数据为候选异常数据,根据设定的、与该待监控数据相对应的同比阈值以及环比阈值,判断该待监控数据是否满足以下条件,若是,则将该待监控数据作为实际异常数据,否则,将该待监控数据作为非异常数据:同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值;
其中,与该待监控数据相对应的上限阈值以及下限阈值是所述处理器通过对该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据进行统计分析所得到的。
26.如权利要求25所述的装置,其特征在于,
所述处理器,具体用于针对待监控业务指标的每一待监控数据,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值;并将第一设定系数倍的该平均值,作为与该待监控数据相对应的上限阈值,将第二设定系数倍的该平均值,作为与该待监控数据相对应的下限阈值,其中,所述第一设定系数不小于1、所述第二设定系数不大于1。
27.如权利要求25所述的装置,其特征在于,
所述处理器,具体用于针对待监控业务指标的每一待监控数据,确定该待监控业务指标在与该待监控数据所在的时间点相对应的一个或多个历史同期时间点的历史监控样本数据的平均值以及标准方差;并将该平均值与第三设定系数倍的该标准方差之和作为与该待监控数据相对应的上限阈值,将该平均值与第四设定系数倍的该标准方差之差作为与该待监控数据相对应的下限阈值,其中,所述第三设定系数、所述第四设定系数均不小于0。
28.一种业务指标监控装置,其特征在于,包括:
存储器,用于存储软件程序以及模块;
处理器,用于通过运行存储在存储器内的软件程序以及模块,执行以下操作:
获取待监控业务指标的待监控时间序列数据;并基于设定的变点检测算法对所述待监控时间序列数据进行变点检测,以判断所述待监控时间序列数据中是否存在变点;若存在,则将所述待监控时间序列数据中的、与所述变点对应的时间点相对应的数据,作为所述待监控时间序列数据中的候选异常数据,其中,所述待监控业务指标包括以下指标中的任意一种或多种:待监控业务的新用户注册数量、点击率、单次点击收益以及千次曝光收益;
针对所述待监控时间序列数据中的每一候选异常数据,根据设定的、与该候选异常数据相对应的同比阈值以及环比阈值,判断该候选异常数据是否满足以下条件,若是,则将该候选异常数据作为实际异常数据,否则,将该候选异常数据作为非异常数据:同比变化幅度不低于对应的同比阈值、且环比变化幅度不低于对应的环比阈值。
29.如权利要求28所述的装置,其特征在于,
所述处理器,具体用于确定与所述待监控时间序列数据相对应的差值累积和序列,并判断所述差值累积和序列中是否存在变点。
30.如权利要求29所述的装置,其特征在于,
所述处理器,具体用于依次确定所述待监控时间序列数据中的各数据的差值累积和数据;并根据依次确定的所述待监控时间序列数据中的各数据的差值累积和数据,得到与所述待监控时间序列数据相对应的差值累积和序列。
31.如权利要求30所述的装置,其特征在于,
所述处理器,还用于在确定与所述待监控时间序列数据相对应的差值累积和序列之前,依次确定所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,并根据依次确定的所述待监控时间序列数据中的每一数据与该数据的基准值的差值数据,得到与所述待监控时间序列数据相对应的差值序列,以根据所述差值序列确定与所述待监控时间序列数据相对应的差值累积和序列。
32.如权利要求29所述的装置,其特征在于,
所述处理器,具体用于判断所述差值累积和序列中是否存在一阶导数从正数变为负数、或从负数变为正数的状态变化点;若存在,则判断该状态变化点之后的、包括与该状态变化点紧邻的点在内的连续设定个数的点的一阶导数的正负性是否与该状态变化点的一阶导数的正负性相同,若是,则将该状态变化点作为所述差值累积和序列中的变点。
33.如权利要求32所述的装置,其特征在于,
所述处理器,还用于在将该状态变化点作为所述差值累积和序列中的变点之前,计算所述差值累积和序列中的变点的置信度;并确定所述差值累积和序列中的变点的置信度不低于设定的置信度阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610849587.2A CN107871190B (zh) | 2016-09-23 | 2016-09-23 | 一种业务指标监控方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610849587.2A CN107871190B (zh) | 2016-09-23 | 2016-09-23 | 一种业务指标监控方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107871190A CN107871190A (zh) | 2018-04-03 |
CN107871190B true CN107871190B (zh) | 2021-12-14 |
Family
ID=61751226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610849587.2A Active CN107871190B (zh) | 2016-09-23 | 2016-09-23 | 一种业务指标监控方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107871190B (zh) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108667688A (zh) * | 2018-04-19 | 2018-10-16 | 北京搜狐新媒体信息技术有限公司 | 一种数据监控方法及装置 |
CN110474862B (zh) * | 2018-05-10 | 2021-08-13 | 中移(苏州)软件技术有限公司 | 一种网络流量异常检测方法及装置 |
CN108984376B (zh) * | 2018-05-31 | 2021-11-19 | 创新先进技术有限公司 | 一种系统异常检测方法、装置及设备 |
CN108845910B (zh) * | 2018-05-31 | 2024-02-06 | 康键信息技术(深圳)有限公司 | 大规模微服务系统的监控方法、装置及存储介质 |
CN108984370B (zh) * | 2018-07-13 | 2022-02-01 | 北京京东尚科信息技术有限公司 | 一种确定监控阈值的方法和装置 |
CN109189827B (zh) * | 2018-08-16 | 2022-04-15 | 创新先进技术有限公司 | 时间序列处理方法和装置、电子设备 |
CN110874674B (zh) * | 2018-08-29 | 2023-06-27 | 阿里巴巴集团控股有限公司 | 一种异常检测方法、装置及设备 |
CN109688188B (zh) * | 2018-09-07 | 2022-08-19 | 平安科技(深圳)有限公司 | 监控告警方法、装置、设备及计算机可读存储介质 |
CN110399400B (zh) * | 2018-10-31 | 2023-08-15 | 腾讯科技(深圳)有限公司 | 检测异常数据的方法、装置、设备以及介质 |
CN110032488B (zh) * | 2018-11-22 | 2023-09-29 | 创新先进技术有限公司 | 集群中特定节点的监控系统、方法、装置及业务服务器 |
CN109697247B (zh) * | 2018-12-30 | 2021-05-18 | 北京奇艺世纪科技有限公司 | 一种数据准确性的检测方法及装置 |
CN110033130A (zh) * | 2019-03-28 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 异常业务的监控方法及装置 |
CN111818548B (zh) * | 2019-04-11 | 2024-03-22 | 中国移动通信集团天津有限公司 | 一种数据的处理方法、装置及设备 |
CN111866924B (zh) * | 2019-04-25 | 2022-12-16 | 中国移动通信集团安徽有限公司 | 性能指标监控方法、装置、计算设备及计算机存储介质 |
CN111861062B (zh) * | 2019-04-30 | 2023-09-26 | 北京嘀嘀无限科技发展有限公司 | 用户指标管理方法、装置、服务器及计算机可读存储介质 |
CN110299208A (zh) * | 2019-05-22 | 2019-10-01 | 平安科技(深圳)有限公司 | 疾病监测数据异常检测方法、系统、设备及存储介质 |
CN110247796B (zh) * | 2019-05-30 | 2022-09-20 | 平安科技(深圳)有限公司 | 监控告警方法、装置及相关设备 |
CN110348718B (zh) * | 2019-06-28 | 2023-11-14 | 北京淇瑀信息科技有限公司 | 业务指标监控方法、装置及电子设备 |
CN110503567B (zh) * | 2019-08-15 | 2023-08-22 | 中国平安财产保险股份有限公司 | 数据校验方法、设备、存储介质及装置 |
CN110457159A (zh) * | 2019-08-21 | 2019-11-15 | 深圳前海微众银行股份有限公司 | 一种处理批量任务的方法、装置、计算设备及存储介质 |
CN112445835B (zh) * | 2019-09-03 | 2023-02-24 | 中移(苏州)软件技术有限公司 | 一种业务数据处理方法及装置、网管服务器、存储介质 |
CN110738333B (zh) * | 2019-09-30 | 2023-09-26 | 佛山科学技术学院 | 一种基于大数据的生产线运维方法及装置 |
CN111143163B (zh) * | 2019-12-13 | 2024-04-16 | 上海硬通网络科技有限公司 | 数据监控方法、装置、计算机设备和存储介质 |
CN111163073A (zh) * | 2019-12-24 | 2020-05-15 | 山石网科通信技术股份有限公司 | 流量数据处理方法和装置 |
CN113052582B (zh) * | 2019-12-27 | 2024-03-22 | 中移动信息技术有限公司 | 一种账单校验的方法、装置、设备及计算机存储介质 |
CN111241155B (zh) * | 2020-01-06 | 2024-03-01 | 广州虎牙科技有限公司 | 时序数据异常检测方法、装置、设备及存储介质 |
CN111831517A (zh) * | 2020-01-15 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
CN111400141B (zh) * | 2020-03-19 | 2021-11-09 | 深圳前海微众银行股份有限公司 | 一种异常检测的方法及装置 |
CN111611517B (zh) * | 2020-05-13 | 2023-07-21 | 咪咕文化科技有限公司 | 指标监控方法、装置、电子设备及存储介质 |
CN111582763A (zh) * | 2020-06-01 | 2020-08-25 | 泰康保险集团股份有限公司 | 保险业绩数据监控方法及装置 |
CN113992496B (zh) * | 2020-07-10 | 2023-11-17 | 中国移动通信集团湖北有限公司 | 基于四分位算法的异动告警方法、装置及计算设备 |
CN111882338B (zh) * | 2020-08-11 | 2023-06-30 | 网易(杭州)网络有限公司 | 在线人数的异常检测方法、装置及电子设备 |
CN112131081B (zh) * | 2020-09-28 | 2024-01-02 | 北京达佳互联信息技术有限公司 | 一种故障报警参数调整方法、装置、电子设备及存储介质 |
CN112633693B (zh) * | 2020-12-24 | 2022-05-20 | 国网福建省电力有限公司电力科学研究院 | 一种基于pot模型拟定大坝监控指标的方法和设备 |
CN112613995A (zh) * | 2020-12-30 | 2021-04-06 | 中国工商银行股份有限公司 | 异常诊断方法和装置 |
CN112882889A (zh) * | 2021-01-22 | 2021-06-01 | 北京奇艺世纪科技有限公司 | 异常监控方法、系统、电子设备和存储介质 |
CN112905419B (zh) * | 2021-03-02 | 2022-11-15 | 广州虎牙科技有限公司 | 指标数据监测阈值范围确定方法、装置和可读存储介质 |
CN115134246B (zh) * | 2021-03-22 | 2023-07-21 | 中国移动通信集团河南有限公司 | 网络性能指标监控方法、装置、设备和存储介质 |
CN112988542B (zh) * | 2021-04-08 | 2021-11-30 | 马上消费金融股份有限公司 | 一种应用评分方法、装置、设备和可读存储介质 |
CN113407219A (zh) * | 2021-07-07 | 2021-09-17 | 安测半导体技术(江苏)有限公司 | 一种半导体测试程序阈值更新的方法及系统 |
CN113673319B (zh) * | 2021-07-12 | 2024-05-03 | 浙江大华技术股份有限公司 | 异常姿态检测方法、装置、电子装置和存储介质 |
CN113641720B (zh) * | 2021-08-17 | 2024-08-06 | 连连宝(杭州)信息技术有限公司 | 一种数据处理方法、装置、计算机设备及可读存储介质 |
CN114065533A (zh) * | 2021-11-22 | 2022-02-18 | 国家电网有限公司客户服务中心 | 电力客服系统波动监测方法 |
CN114500231B (zh) * | 2022-01-20 | 2023-07-25 | 中通服创立信息科技有限责任公司 | 一种流量波动的预警方法、系统、电子设备及存储介质 |
CN115499288A (zh) * | 2022-07-12 | 2022-12-20 | 平安国际融资租赁有限公司 | 业务监控方法、装置、设备及介质 |
CN116909851A (zh) * | 2023-04-24 | 2023-10-20 | 山东溯源安全科技有限公司 | 一种监控方法、装置、电子设备及存储介质 |
CN116185783B (zh) * | 2023-04-24 | 2023-07-14 | 山东溯源安全科技有限公司 | 一种电子设备的监控方法、装置、电子设备及存储介质 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1351422A (zh) * | 2000-10-26 | 2002-05-29 | 富士通株式会社 | 分段电路 |
CN1967587A (zh) * | 2006-11-02 | 2007-05-23 | 深圳市莫比奇网络科技有限公司 | 一种无线互联网广告营销平台 |
CN101072057A (zh) * | 2006-05-11 | 2007-11-14 | 大唐移动通信设备有限公司 | 一种查找信号峰值功率并削峰的方法和装置 |
CN101233491A (zh) * | 2005-07-14 | 2008-07-30 | 国际商业机器公司 | 检测集群环境中动态工作负载调度的不平衡的系统和方法 |
FR2939928A1 (fr) * | 2008-12-15 | 2010-06-18 | Snecma | Standardisation de donnees utilisees pour la surveillance d'un moteur d'aeronef |
CN101854225A (zh) * | 2009-03-30 | 2010-10-06 | 日电(中国)有限公司 | 从位置数据流检测目标状态改变的方法和系统 |
CN102111307A (zh) * | 2009-12-29 | 2011-06-29 | 亿阳信通股份有限公司 | 网络风险监控方法和装置 |
CN102238604A (zh) * | 2011-08-18 | 2011-11-09 | 无锡儒安科技有限公司 | 无线传感器网络故障诊断方法 |
CN102301698A (zh) * | 2009-01-29 | 2011-12-28 | 日本电气株式会社 | 时间分段表示特征矢量生成设备 |
CN102539077A (zh) * | 2012-01-02 | 2012-07-04 | 税爱社 | 大罐统计物料平衡检漏方法及检漏系统 |
CA2781261A1 (en) * | 2011-06-27 | 2012-12-27 | Weatherford/Lamb, Inc. | Operational logic for pressure control of a wellhead |
CN102855300A (zh) * | 2012-08-16 | 2013-01-02 | 华为技术有限公司 | 一种报表的快速查看方法和装置 |
CN104041063A (zh) * | 2012-12-24 | 2014-09-10 | 华为技术有限公司 | 视频的关联信息库制作和视频播放的方法、平台及系统 |
CN104216814A (zh) * | 2014-09-22 | 2014-12-17 | 北京国双科技有限公司 | 一种日志压缩监控方法及装置 |
CN104809059A (zh) * | 2015-04-01 | 2015-07-29 | 百度在线网络技术(北京)有限公司 | 应用上线指标的检测方法及装置 |
CN105406991A (zh) * | 2015-10-26 | 2016-03-16 | 上海华讯网络系统有限公司 | 基于网络监控指标由历史数据生成业务阈值的方法及系统 |
CN105718715A (zh) * | 2015-12-23 | 2016-06-29 | 华为技术有限公司 | 异常检测方法和设备 |
CN105893213A (zh) * | 2016-06-22 | 2016-08-24 | 北京蓝海讯通科技股份有限公司 | 一种异常检测方法、应用和监控设备 |
-
2016
- 2016-09-23 CN CN201610849587.2A patent/CN107871190B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1351422A (zh) * | 2000-10-26 | 2002-05-29 | 富士通株式会社 | 分段电路 |
CN101233491A (zh) * | 2005-07-14 | 2008-07-30 | 国际商业机器公司 | 检测集群环境中动态工作负载调度的不平衡的系统和方法 |
CN101072057A (zh) * | 2006-05-11 | 2007-11-14 | 大唐移动通信设备有限公司 | 一种查找信号峰值功率并削峰的方法和装置 |
CN1967587A (zh) * | 2006-11-02 | 2007-05-23 | 深圳市莫比奇网络科技有限公司 | 一种无线互联网广告营销平台 |
FR2939928A1 (fr) * | 2008-12-15 | 2010-06-18 | Snecma | Standardisation de donnees utilisees pour la surveillance d'un moteur d'aeronef |
CN102301698A (zh) * | 2009-01-29 | 2011-12-28 | 日本电气株式会社 | 时间分段表示特征矢量生成设备 |
CN101854225A (zh) * | 2009-03-30 | 2010-10-06 | 日电(中国)有限公司 | 从位置数据流检测目标状态改变的方法和系统 |
CN102111307A (zh) * | 2009-12-29 | 2011-06-29 | 亿阳信通股份有限公司 | 网络风险监控方法和装置 |
CA2781261A1 (en) * | 2011-06-27 | 2012-12-27 | Weatherford/Lamb, Inc. | Operational logic for pressure control of a wellhead |
CN102238604A (zh) * | 2011-08-18 | 2011-11-09 | 无锡儒安科技有限公司 | 无线传感器网络故障诊断方法 |
CN102539077A (zh) * | 2012-01-02 | 2012-07-04 | 税爱社 | 大罐统计物料平衡检漏方法及检漏系统 |
CN102855300A (zh) * | 2012-08-16 | 2013-01-02 | 华为技术有限公司 | 一种报表的快速查看方法和装置 |
CN104041063A (zh) * | 2012-12-24 | 2014-09-10 | 华为技术有限公司 | 视频的关联信息库制作和视频播放的方法、平台及系统 |
CN104216814A (zh) * | 2014-09-22 | 2014-12-17 | 北京国双科技有限公司 | 一种日志压缩监控方法及装置 |
CN104809059A (zh) * | 2015-04-01 | 2015-07-29 | 百度在线网络技术(北京)有限公司 | 应用上线指标的检测方法及装置 |
CN105406991A (zh) * | 2015-10-26 | 2016-03-16 | 上海华讯网络系统有限公司 | 基于网络监控指标由历史数据生成业务阈值的方法及系统 |
CN105718715A (zh) * | 2015-12-23 | 2016-06-29 | 华为技术有限公司 | 异常检测方法和设备 |
CN105893213A (zh) * | 2016-06-22 | 2016-08-24 | 北京蓝海讯通科技股份有限公司 | 一种异常检测方法、应用和监控设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107871190A (zh) | 2018-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107871190B (zh) | 一种业务指标监控方法及装置 | |
CN111143102B (zh) | 异常数据检测方法、装置、存储介质及电子设备 | |
CN109981328B (zh) | 一种故障预警方法及装置 | |
CN105721187B (zh) | 一种业务故障诊断方法及装置 | |
CN112188531B (zh) | 异常检测方法、装置、电子设备及计算机存储介质 | |
CN110601900B (zh) | 一种网络故障预警方法及装置 | |
CN110874674B (zh) | 一种异常检测方法、装置及设备 | |
CN107852771B (zh) | 基于自适应滤波的网络异常检测 | |
CN108429649B (zh) | 基于多次单类型采集结果的综合异常判断的系统 | |
CN113590429B (zh) | 一种服务器故障诊断方法、装置及电子设备 | |
US9600391B2 (en) | Operations management apparatus, operations management method and program | |
CN113672600B (zh) | 一种异常检测方法及系统 | |
US20130173215A1 (en) | Adaptive trend-change detection and function fitting system and method | |
JP2016095751A (ja) | 異常機器特定プログラム、異常機器特定方法、及び、異常機器特定装置 | |
US9860109B2 (en) | Automatic alert generation | |
CN109951466B (zh) | 端口流量监控方法、装置、电子设备及机器可读存储介质 | |
CN106503841B (zh) | 指标阈值的确定方法和装置 | |
CN108306997B (zh) | 域名解析监控方法及装置 | |
CN109976986B (zh) | 异常设备的检测方法及装置 | |
JP2015194797A (ja) | 監視漏れ特定処理プログラム,監視漏れ特定処理方法及び監視漏れ特定処理装置 | |
CN110971435A (zh) | 一种报警方法及装置 | |
JP6625839B2 (ja) | 負荷実績データ判別装置、負荷予測装置、負荷実績データ判別方法及び負荷予測方法 | |
CN113342608A (zh) | 流式计算引擎任务的监控方法及装置 | |
CN114938339B (zh) | 一种数据处理方法和相关装置 | |
CN117522370A (zh) | 设备检测方法、计算机设备及机器可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |