CN100433647C - 一种告警管理方法和系统 - Google Patents
一种告警管理方法和系统 Download PDFInfo
- Publication number
- CN100433647C CN100433647C CNB200510109282XA CN200510109282A CN100433647C CN 100433647 C CN100433647 C CN 100433647C CN B200510109282X A CNB200510109282X A CN B200510109282XA CN 200510109282 A CN200510109282 A CN 200510109282A CN 100433647 C CN100433647 C CN 100433647C
- Authority
- CN
- China
- Prior art keywords
- alarm
- father
- child
- warning information
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title description 12
- 238000007726 management method Methods 0.000 claims abstract description 21
- 238000011084 recovery Methods 0.000 claims description 11
- 230000010365 information processing Effects 0.000 claims description 8
- 230000000694 effects Effects 0.000 abstract description 2
- 230000002349 favourable effect Effects 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 12
- 238000012423 maintenance Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 230000001364 causal effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种告警管理方法及系统,本发明是在对告警之间的联系进行分析的基础上设置告警之间的父子关系,并在告警上报处理时,如果存在父告警,则不上报对应的子告警。因此,本发明的实现可以有效减少告警数量,上报父告警以保持告警功能的完整性并有利于查找故障源,从而达到了告警精简优化的效果,方便故障的诊断和维护。
Description
技术领域
本发明涉及网络管理中的数据处理,尤其涉及一种告警管理方法及系统。
背景技术
通信网络由各种网络通信设备组成,各网络通信设备间需要协同工作以实现相应的通信业务。为保证网络通信设备的正常工作,需要对其采用必要的维护手段进行维护。其中,通信设备告警便是一种重要的针对网络设备的维护手段,通常由通信设备各地区管理系统实现。
所述的通信设备告警管理系统主要由两大部分组成:
1、告警产生和上报设备:用于产生并上报网络通信设备的告警信息;比如GPRS(通用无线分组业务)服务支持节点SGSN、通用无线分组业务GPRS网关支持节点GGSN等通信网络设备均属于告警产生设备,同时每种设备都将产生的告警上报到告警管理系统。
2、告警管理系统:接受告警产生和上报设备(如各网元)上报的告警信息,并向用户提供各种告警管理操作,同时,完成向各网元下发告警管理命令的功能。
通常,告警是通过声光等方式及时直观的显示系统的运行情况,为用户设备维护、网络优化、业务分析等工作提供数据依据。告警台显示的故障告警项用于提供给设备的维护人员,以便于维护人员进行相应的维护操作,告警台是网络故障管理的核心组成部分;为保证所述故障告警项的高可用性,要求相应的数据必需注重于对客户而言的实用性。
然而,目前网络通信设备的告警系统普遍存在告警太多、频率过高、重点不突出等问题。因此,不利于用户迅速有效地定位设备故障源,并针对故障进行后续诊断、维护工作。
为此,需要对告警进行精简,以消除告警过多、重点不突出等问题。
现在已经广泛使用的消除告警过多的手段是告警屏蔽。通过配置对某类告警进行屏蔽处理,一旦系统中此类告警发生,则一概屏蔽掉,不上报告警给用户。因为告警被全部屏蔽,等价于关闭了此类告警的上报功能,虽然告警数量是减少了,却无法再反映出某类系统故障的特征,不利于用户对设备的维护。
发明内容
鉴于上述现有技术所存在的问题,本发明的目的是提供一种告警管理方法和系统,从而能够有效减少告警数量、方便查找故障源而不丧失告警功能完整性告警管理方法。
本发明的目的是通过以下技术方案实现的:
本发明提供了一种告警管理方法,包括如下步骤:
A、将网络中具有相关性的各告警分别根据告警之间的因果关系设置为父告警和对应的子告警;
B、根据所述的父告警和对应子告警的相关性,对告警信息进行处理,所述对告警信息进行处理为:若所述父告警在未被恢复的子告警产生后的预定的时间内产生,则对所述未被恢复的子告警进行相关性恢复,所述相关性恢复具体为:由于所述父告警的存在而对所述未被恢复的子告警进行屏蔽。
所述步骤A中的父告警和对应的子告警相关性设置保存于配置的存储数据库中,并提供有对其进行更新的管理接口。
所述步骤A中的父告警与子告警之间的相关性包括父告警必然会引起对应的子告警,且所述的父告警包括组合父告警,所述组合父告警是多个同时出现的父告警组合构成;当该组合父告警出现时必然产生子告警。
本发明中,当确定需要上报子告警时,如果其对应的父告警已经存在,则不上报该子告警。
本发明中,所述对告警信息进行处理还包括:当父告警恢复时,如果子告警仍然没有恢复,则上报该子告警。
本发明中,所述对告警信息进行处理还包括:当子告警恢复时,如果父告警仍然没有恢复,则上报子告警恢复消息。
本发明中,当子告警进行正常恢复时如果父告警还未恢复,则把子告警的相关性恢复更新为正常恢复。
本发明还公开了一种告警管理系统,包括告警信息接收模块和告警信息发送模块,其特征在于,所述系统还包括告警信息处理模块,其中
告警信息处理模块,用于将接收到的告警信息中的具有相关性的告警根据告警间的因果关系分别设置为父告警和对应的子告警;
所述告警信息处理模块进一步包括相关性处理模块,所述相关性处理模块,用于根据预先设置的告警信息的相关性,对告警信息进行屏蔽和上报,所述对告警信息进行屏蔽为,由于所述父告警的存在而对所述未被恢复的子告警进行屏蔽。
由上述本发明提供的技术方案可以看出,本发明在对告警之间的联系进行分析的基础上设置告警之间的父子关系,即产生父告警时必然也产生子告警,并在告警上报处理时不上报子告警以减少告警数量,上报父告警以保持告警功能的完整性并有利于查找故障源,从而达到了告警精简优化的效果,方便故障的诊断和维护。
其中告警之间父子关系可以存储在一个数据库中,而且父告警可以是一种组合父告警,即该组合父告警是由多个告警的组合,因此,这个告警数据库就能够包含告警之间所有的父子关系即告警产生之间的所有必然因果关系。这样,通过对告警相关性的分析,对有必然因果关系的多个告警,只上报父告警,减少设备上报给用户的告警数量,帮助用户有效的定位设备故障源,迅速找到父告警,针对父告警进行后续故障诊断、故障维护工作,提高了告警实用性和设备维护效率。
另外,通过在告警上报处理过程中的相关对应配套措施,使得本发明的网络管理告警上报处理优化方法更加完善、方便实用。
附图说明
图1为本发明所述的方法的处理流程示意图;
图2为本发明所述系统的结构示意图。
具体实施方式
本发明的核心思想是在对告警之间的联系进行分析的基础上设置告警之间的父子关系,即确定各告警之间的相关性,并在告警上报处理时,根据所述的相关性进行告警上报处理,具体为:如果父告警存在时,则不上报子告警以减少上报告警数量,而仅上报父告警,以保持告警功能的完整性并有利于查找故障源,从而达到了告警精简优化的目的。
可以看出,为实现本发明的目的需要在系统中进行合理的告警之间的相关性设置。为对本发明有更好地理解,下面将首先对本发明中告警之间的相关性进行分析说明:
在通信设备中上报的告警实例并不是孤立存在的,例如,如果发生一个底层功能的故障,会导致上层的基于该功能的其他功能也无法正常工作,那么实际向用户上报的告警实例便既有底层故障告警,也有上层故障告警。可以看出,这些告警之间存在因果关系,本发明中设置:如A告警必然引起B告警,则这些告警称为相关性告警,A告警是B告警的父告警,B告警是A告警的子告警。
在实际故障定位中,只要分析父告警的原因,并排除该故障,那么所有相关的告警都会被恢复。因此,可以由告警系统分析告警实例间的相关性,利用父告警屏蔽或恢复子告警,减少系统上报给用户的告警数量,并且帮助用户有效地定位设备故障源。
所述的告警相关性是告警实例间的关系。例如子系统A上的某链路断链,会导致建立在该链路上的信道中断,那么该子系统上的断链告警a和信道中断告警b是存在相关性的;如果此时子系统B上的信道也发生了故障,上报了信道中断告警c,这个信道中断告警就和断链告警a没有相关性了。
因此,判断告警实例是否存在相关性,具体的实现方式包括:
(1)判断告警项是否存在相关性的基础:
如断链告警和信道中断告警存在逻辑上的关联,可以认为它们存在相关性的基础,对于不存在逻辑关联的告警项就不存在相关性的基础;
(2)判断告警实例的关键属性是否存在逻辑关联:
告警实例的关键属性确定了该告警实例来自于哪个故障,如果两个告警实例对应的告警项存在相关性基础,而且它们的关键属性相匹配,才可以真正判断它们之间存在相关性关系。
综合上述分析,如果事先定义存在相关性基础的告警项,并明确定义该相关性需要匹配的告警属性,就可以在告警实例上报时,根据定义的告警相关性规则判断出告警实例间的相关性关系,对子告警进行后续的屏蔽处理。
下面结合附图对本发明作进一步的详细说明。
本发明所述的方法的具体实现如图1所示,包括以下步骤:
步骤100:在数据库中配置告警之间的父子关系,即配置父告警与子告警之间的相关性。
在数据库中设置告警之间的父子关系,是建立在对告警相关性分析的基础上的,并且可以根据情况的变化变化进行更新或者重新配置。
在配置过程中对于两告警之间的相关性符合一个告警产生时必然产生另一个告警的情况,则可以将前一告警称为父告警,后一告警称为子告警。
当一个告警产生时必然会有多个告警产生,则可以建立多个父子关系;
如果多个告警同时出现时才必然产生另一个告警,则只能建立一个多对一的父子关系,此时把父告警称为组合父告警;当该组合中的一个或者多个告警没有同时出现时,并不必然出现子告警。因此,如果一个组合父告警产生时必然产生多个告警时,可以建立多个多对一的父子关系。
这样,经过步骤101的配置,告警之间的各种必然因果关系都可以分解为一对一或者是多对一的父子对应关系,并且,各对应关系都可以用数据库的形式方便地进行存储配置,及修改更新。
配置好告警之间的父子关系之后,就可以把它们应用到告警上报的优化处理中去;
步骤101:等待接收新的告警/恢复消息;
步骤102:当收到新的告警/恢复消息后,首先要进行判断收到的是新的告警还是恢复消息,如果收到的是新的告警,则执行步骤103,否则,执行步骤107:
步骤103:进一步判断是否存在未被恢复的父告警,如果存在,则执行步骤105,否则,执行步骤104;
步骤104:正常上报该告警信息,并执行步骤105;
步骤105:判断是否存在此前10秒内(或者其它可以认为父告警与子告警同时产生甚至更早产生的时间范围,且该10秒时间也可以根据实际需要进行调整,即并不固定为10秒)产生且未被恢复的子告警,如果是,则执行步骤106,否则,过程结束,并重新执行步骤101。
此处,需要说明的是:步骤103和步骤105所描述的两个判断执行的先后顺序是可以调换的,当然,其相应的处理措施也同时调换顺序。总之,如果存在未被恢复的父告警,则不上报新告警;如果不存在未被恢复的父告警,则正常上报新告警。如果存在此前10秒内未被恢复的子告警,则执行步骤106;否则,不需要特别处理;
步骤106:对该子告警进行相关性恢复,过程结束,等待重新收到新的告警/恢复消息后执行步骤101;
所述的相关性恢复是指:由于父告警的存在而对子告警进行屏蔽。
步骤107:如果步骤104中判断收到的不是新的告警,而是告警的恢复消息,则还要判断该恢复消息对应的告警是否已经上报,如果是,则执行步骤108,否则,执行步骤111;
步骤108:判断已上报的对应告警是否处于相关性恢复的状态,如果是,则表明对应告警的父告警在采用相关性恢复措施后父告警仍未恢复,需要执行步骤109,否则,执行步骤110;
步骤109:将对应故障的相关性恢复更新为正常恢复,并执行步骤111;
步骤110:正常上报恢复消息,并执行步骤111;
步骤111:判断对应告警的子告警是否未恢复,如果是,则执行步骤112,否则,过程结束,并重新执行步骤101;
此处,需要说明的是:步骤107和步骤111所述的两个判断处理过程的先后顺序也是可以调换的,当然,其相应的处理措施也同时调换顺序。
步骤112:判断对应告警的子告警仍然未恢复,则激活此子告警,重新上报此子告警。
本发明还提供了一种告警管理系统,图2所示,包括用于接收告警信息的告警信息接收模块、用于对告警信息进行处理的告警信息处理模块和用于上报告警信息的告警信息发送模块,同时,在该系统中加入相关性处理模块,具体为在所述的告警信息处理模块中增加设置相关性处理模块,用于根据预先设置的告警信息的相关性,对告警信息进行相应的屏蔽和上报,具体的屏蔽和上报处理方式前面已经描述,故此处不再详述。
综上所述,本发明通过针对各告警相关性的分析,从而有效简化了网管过程中上报的告警量,并可以保证告警功能的可靠实现,因此,本发明的实现可以提高告警实用性及设备的可维护性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (8)
1、一种告警管理方法,其特征在于,包括如下步骤:
A、将网络中各具有相关性的告警分别根据告警间的因果关系设置为父告警和对应的子告警;
B、根据所述父告警和对应的子告警的相关性,对告警信息进行处理,所述对告警信息进行处理为:若所述父告警在未被恢复的子告警产生后的预定的时间内产生,则对所述未被恢复的子告警进行相关性恢复,所述相关性恢复具体为:由于所述父告警的存在而对所述未被恢复的子告警进行屏蔽。
2、根据权利要求1所述的告警管理方法,其特征在于,所述步骤A中的父告警和对应的子告警相关性设置保存于配置的存储数据库中,并提供有对其进行更新的管理接口。
3、根据权利要求1所述的告警管理方法,其特征在于,所述步骤A中的父告警与子告警之间的相关性包括父告警必然会引起对应的子告警,且所述的父告警包括组合父告警,所述组合父告警是多个同时出现的父告警组合构成;当该组合父告警出现时必然产生子告警。
4、根据权利要求1所述的告警管理方法,其特征在于,所述对告警信息进行处理还包括:当确定需要上报子告警时,如果其对应的父告警已经存在,则不上报该子告警。
5、根据权利要求1所述的告警管理方法,其特征在于,所述对告警信息进行处理还包括:当父告警恢复时,如果子告警仍然没有恢复,则上报该子告警。
6、根据权利要求1所述的告警管理方法,其特征在于,所述对告警信息进行处理还包括:当子告警恢复时,如果父告警仍然没有恢复,则上报子告警恢复消息。
7、根据权利要求1所述的告警管理方法,其特征在于,所述对告警信息进行处理还包括:当子告警进行正常恢复时如果父告警还未恢复,则把子告警的相关性恢复更新为正常恢复。
8、一种告警管理系统,包括告警信息接收模块和告警信息发送模块,其特征在于,所述系统还包括告警信息处理模块,其中
告警信息处理模块,用于将接收到的告警信息中的具有相关性的告警根据告警间的因果关系分别设置为父告警和对应的子告警;
所述告警信息处理模块进一步包括相关性处理模块,所述相关性处理模块,用于根据预先设置的告警信息的相关性,对告警信息进行屏蔽和上报,所述对告警信息进行屏蔽为,由于所述父告警的存在而对所述未被恢复的子告警进行屏蔽。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB200510109282XA CN100433647C (zh) | 2005-10-20 | 2005-10-20 | 一种告警管理方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB200510109282XA CN100433647C (zh) | 2005-10-20 | 2005-10-20 | 一种告警管理方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1863080A CN1863080A (zh) | 2006-11-15 |
CN100433647C true CN100433647C (zh) | 2008-11-12 |
Family
ID=37390413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB200510109282XA Expired - Fee Related CN100433647C (zh) | 2005-10-20 | 2005-10-20 | 一种告警管理方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100433647C (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102111788A (zh) * | 2009-12-29 | 2011-06-29 | 中兴通讯股份有限公司 | 一种告警处理方法及告警管理系统 |
CN102136922B (zh) * | 2010-01-22 | 2014-04-16 | 华为技术有限公司 | 相关性分析的方法、设备及系统 |
CN102387035B (zh) * | 2011-09-13 | 2014-02-05 | 瑞斯康达科技发展股份有限公司 | 一种告警处理方法和装置 |
CN102832998B (zh) * | 2012-09-12 | 2015-09-02 | 上海斐讯数据通信技术有限公司 | 一种告警屏蔽配置方法 |
CN104009854B (zh) | 2013-02-21 | 2019-01-22 | 中兴通讯股份有限公司 | 一种告警处理方法及装置、告警关联信息设置方法 |
CN103209096A (zh) * | 2013-04-01 | 2013-07-17 | 大唐移动通信设备有限公司 | 告警处理方法和设备 |
CN103607295A (zh) * | 2013-10-31 | 2014-02-26 | 南京中兴新软件有限责任公司 | 一种告警处理的方法及告警系统 |
CN106730196B (zh) * | 2016-12-12 | 2019-11-15 | 北京怡和嘉业医疗科技股份有限公司 | 一种报警方法、装置及呼吸机 |
WO2018119776A1 (zh) * | 2016-12-28 | 2018-07-05 | 深圳中兴力维技术有限公司 | 告警处理方法和装置 |
CN110138609A (zh) * | 2019-05-10 | 2019-08-16 | 江西山水光电科技股份有限公司 | 一种光传送网otn中的告警相关性抑制方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1462130A (zh) * | 2002-05-27 | 2003-12-17 | 华为技术有限公司 | 网络管理系统中闪断告警的处理方法 |
CN1474542A (zh) * | 2002-08-06 | 2004-02-11 | 华为技术有限公司 | 电信设备故障信息管理方法 |
US6707795B1 (en) * | 1999-04-26 | 2004-03-16 | Nortel Networks Limited | Alarm correlation method and system |
CN1492624A (zh) * | 2002-10-22 | 2004-04-28 | 华为技术有限公司 | 通信网络告警的处理方法和相关性分析管理器 |
-
2005
- 2005-10-20 CN CNB200510109282XA patent/CN100433647C/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6707795B1 (en) * | 1999-04-26 | 2004-03-16 | Nortel Networks Limited | Alarm correlation method and system |
CN1462130A (zh) * | 2002-05-27 | 2003-12-17 | 华为技术有限公司 | 网络管理系统中闪断告警的处理方法 |
CN1474542A (zh) * | 2002-08-06 | 2004-02-11 | 华为技术有限公司 | 电信设备故障信息管理方法 |
CN1492624A (zh) * | 2002-10-22 | 2004-04-28 | 华为技术有限公司 | 通信网络告警的处理方法和相关性分析管理器 |
Also Published As
Publication number | Publication date |
---|---|
CN1863080A (zh) | 2006-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6792269B2 (en) | System, method and apparatus for tracking deployment of cellular telephone network sites | |
US7080144B2 (en) | System enabling access to obtain real-time information from a cell site when an emergency event occurs at the site | |
US7945817B1 (en) | Method and system for automatically recognizing alarm patterns in a communications network | |
US8332502B1 (en) | Business to business network management event detection and response system and method | |
US6788933B2 (en) | System, method and apparatus for capturing and processing call processing failures occurring at a digital wireless switch | |
US7301448B1 (en) | Method and system for deduplicating status indications in a communications network | |
US20030086549A1 (en) | System, method and apparatus for court-ordered surveillance of call records | |
CN102624554B (zh) | 一种结合了设备管理和业务管理的综合网络管理方法 | |
CN100433647C (zh) | 一种告警管理方法和系统 | |
US7099660B2 (en) | System, method and apparatus for a network-organized repository of data | |
WO2007143943A1 (fr) | Procédé, système et dispositif réseau de maintenance centralisée de dispositifs multiples | |
JP2002525943A (ja) | 電気通信ネットワークにおけるネットワーク・デバイスの統合監視・管理のためのインターフェースシステム | |
US7295829B2 (en) | System, apparatus and method for managing telephone call records | |
CN104838620A (zh) | 电信网中的事件管理 | |
CN101388794B (zh) | 一种定位网络管理系统异常事件的方法和系统 | |
CN106878038A (zh) | 一种通信网络中故障定位方法及装置 | |
US6975705B2 (en) | System, method and apparatus for capturing and processing call processing failures occurring at a telephone switch control processor | |
CN108449212B (zh) | 基于事件关联的mas消息传递方法 | |
CN105763371A (zh) | 一种告警处理方法及装置 | |
CN117235035A (zh) | 一种管理企业内部elasticsearch集群的自动化管理系统 | |
CN102223659A (zh) | 一种屏蔽冗余历史告警方法和装置 | |
JP2004363946A (ja) | 故障措置システム、及び、故障要因特定方法 | |
US11862007B2 (en) | Method for automatically analyzing and filtering out redundant alarms in the fault management system of radio transceiver stations | |
CN100414883C (zh) | 一种上级网管获取信息的方法 | |
CN118838958A (zh) | 一种云环境下的基于cmdb的数据管控方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20081112 |
|
CF01 | Termination of patent right due to non-payment of annual fee |