[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN113489609A - 受限网络下系统的监控方法、装置及电子设备 - Google Patents

受限网络下系统的监控方法、装置及电子设备 Download PDF

Info

Publication number
CN113489609A
CN113489609A CN202110738623.9A CN202110738623A CN113489609A CN 113489609 A CN113489609 A CN 113489609A CN 202110738623 A CN202110738623 A CN 202110738623A CN 113489609 A CN113489609 A CN 113489609A
Authority
CN
China
Prior art keywords
monitoring
network
notification information
alarm notification
limited network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110738623.9A
Other languages
English (en)
Other versions
CN113489609B (zh
Inventor
沙云
李勉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Senpu Information Service Co ltd
Original Assignee
Shanghai Senpu Information Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Senpu Information Service Co ltd filed Critical Shanghai Senpu Information Service Co ltd
Priority to CN202110738623.9A priority Critical patent/CN113489609B/zh
Publication of CN113489609A publication Critical patent/CN113489609A/zh
Application granted granted Critical
Publication of CN113489609B publication Critical patent/CN113489609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种受限网络下系统的监控方法、装置及电子设备,其中方法包括:基于受限网络下监控对象的业务逻辑定义监控规则,并推送到受限网络监控工具;利用CMDB获取监控对象的底层资源和配置参数;通过外部网络监控工具监控上下游系统中的关联业务场景,将第一告警通知信息推送到受限网络监控工具;通过受限网络监控工具获取配置参数,生成第二告警通知信息,将第一告警通知信息和第二告警通知信息推送到受限网络通知对象。本发明自动化配置并维护监控规则,提升了监控规则维护的准确性和及时性,减少了人工维护的时间与成本;从业务角度出发,在多个外部网络环境中设置涵盖关联业务场景的多套监控工具,提升了监控的覆盖度。

Description

受限网络下系统的监控方法、装置及电子设备
技术领域
本发明涉及监控领域,具体涉及一种受限网络下系统的监控方法、装置及电子设备。
背景技术
监控是运维日常工作中必不可少的一环,一个可靠、全面的监控体系能有效地提升运维对象的可用性。
在对受限网络环境下的系统进行监控时,相关技术通常会在该受限的网络环境中,建设一套监控工具,依据事先定义好的规则,对被监控对象的各项运行状态进行记录、分析、判断和告警,整个监控工作流程的影响范围均在受限的网络环境之内,如图1所示。但这种监控方式存在以下不足:
1)所有的监控规则需要在受限的网络环境中提前配置好,随着底层资源、系统参数、业务逻辑的变化,每次都需要以人工的方式对监控规则进行调整,一旦系统架构和业务逻辑的复杂性以及敏捷性提升到一定的程度,就难以保障监控规则配置更新的准确性和及时性。
2)所有的监控工具和配套资源,需要在受限的网络环境中提前准备好,并且只能用来监控对象在受限网络环境内部的业务,如果监控对象在受限网络环境外也存在上下游业务联系,则无法对这部分业务场景进行有效地监控。
发明内容
本发明的主要目的在于提供一种受限网络下系统的监控方法及装置,以解决受限网络监控中监控规则调整不及时和监控范围覆盖度低的问题。
为了实现上述目的,本发明的第一方面提供了一种受限网络下系统的监控方法,包括:
基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具;
利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数;
通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具,其中,所述监控对象的上下游系统位于受限网络外的外部网络,所述第一告警通知信息为关联业务场景的告警通知信息;
通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,并将所述第一告警通知信息和第二告警通知信息推送到受限网络通知对象,其中,所述第二告警通知信息为受限网络的告警通知信息。
可选地,所述基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具,包括:
在监控对象中进行埋点,基于受限网络下监控对象的业务逻辑,定义监控规则;
将所述监控规则通过API推送到受限网络监控工具。
可选地,所述利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数包括:
利用CMDB自动获取所述监控对象的底层资源和所述监控规则的配置参数;
其中,所述监控规则的配置参数包括各项监控规则的阈值、监控对象中的埋点数量和埋点位置。
可选地,所述通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具,包括:
确定所述监控对象的上下游系统分别所属的外部网络;
在所述外部网络中分别建立各自的外部网络监控工具,监控上下游系统中存在的关联业务场景;
当所述关联业务场景触发告警时,所述外部网络监控工具生成第一告警通知信息,并将所述第一告警通知信息通过网关推送到受限网络监控工具。
可选地,所述通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,包括:
所述受限网络监控工具通过API自动获取配置参数;
当根据所述监控规则和配置参数在受限网络内监控到异常情况时,生成第二告警通知信息。
可选地,所述方法还包括:
利用CMDB定义每项监控规则对应的外部网络通知对象;
通过所述受限网络监控工具自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系,并将所述第二告警通知信息推送到所述监控规则对应的外部网络通知对象。
进一步地,所述通过所述受限网络监控工具自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系,并将所述第二告警通知信息推送到所述监控规则对应的外部网络通知对象,包括:
所述受限网络监控工具通过API自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系;
根据所述对应关系将第二告警通知信息通过网关推送到对应的外部网络监控工具;
所述外部网络监控工具将第二告警通知信息推送到外部网络通知对象。
本发明的第二方面提供了一种受限网络下系统的监控装置,包括:
定义单元,用于基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具;
自动获取单元,用于利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数;
第一推送单元,用于通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具,其中,所述监控对象的上下游系统位于受限网络外的外部网络,所述第一告警通知信息为关联业务场景的告警通知信息;
第二推送单元,用于通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,并将所述第一告警通知信息和第二告警通知信息推送到受限网络通知对象,其中,所述第二告警通知信息为受限网络的告警通知信息。
本发明的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面任意一项提供的受限网络下系统的监控方法。
本发明的第四方面提供了一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项提供的受限网络下系统的监控方法。
在本发明实施例提供的受限网络下系统的监控方法中,基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具,利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数;通过自动化和半自动化的方式维护监控规则,提升了监控规则维护的准确性和及时性,并减少了人工维护的时间与成本。
通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具;通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,并将所述第一告警通知信息和第二告警通知信息推送到受限网络通知对象;从业务角度出发,在多个网络环境中设置涵盖业务上下游业务场景的1+N多套监控工具,扫除业务盲点,提升监控覆盖的完整性;通过对接CMDB和外部网络监控工具,将监控体系从传统的“1套监控工具”升级为“1套本受限网络环境的监控工具”+“1套CMDB”+“N套外部网络环境的监控工具”的1+1+N立体化监控生态,提升监控范围在业务场景的覆盖度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为网络环境受限情况下现有的监控方式示意图;
图2为本发明实施例提供的受限网络下系统的监控方法流程示意图;
图3为本发明实施例提供的配置参数类监控规则自动化和业务逻辑类监控规则半自动化维护原理图;
图4为本发明实施例提供的外部网络环境上下游系统中关联业务场景的监控覆盖原理图;
图5为本发明实施例提供的向外部网络通知对象传递告警通知信息的原理图;
图6为本发明实施例提供的受限网络下系统的监控方法的整体原理图;
图7为本发明实施例提供的受限网络下系统的监控装置框图;
图8为本发明实施例提供的电子设备框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本发明中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本发明及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本发明中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
在对受限网络环境下的系统进行监控时,现有技术通常会在该受限的网络环境中,建设一套监控工具,依据事先定义好的规则,对被监控对象的各项运行状态进行记录、分析、判断和告警,整个监控工作流程的影响范围均在受限的网络环境之内,如图1所示,这种监控方式下,监控中所有的告警只能在受限的网络环境中进行传播,如果需要受限网络环境外相关的资源进行问题诊断或故障处理,会存在时效性上的不足。
针对现有受限网络监控中监控规则调整不及时、监控范围覆盖度低的问题,本发明实施例提供了一种受限网络下系统的监控方法,如图2所示,该方法包括如下的步骤S101至步骤S104:
步骤S101:基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具;
受限网络下的系统即受限网络下被监控的监控对象,该受限网络下被监控对象,通常为一套运行具体业务的信息化系统,业务逻辑包括下述字段:业务场景(BusinessScenario)、业务描述(Business Description)、业务状态(Business Status)、业务级别(Business Level)、监控时段频率(Monitoring Schedule)和告警规则(Alerting Rule),业务状态包括正常、预警和异常;监控规则为用来定义具体监控工作的一系列规则,包括:监控对象、监控类型、监控时间、监控频率、告警触发规则、告警级别、告警通知时间、告警通知方式、告警通知人、告警升级触发条件、告警升级通知人、告警升级通知方式等,基于业务逻辑定义的监控规则从宏观层面定义监控哪些内容以及对哪些业务系统进行埋点,监控规则通常会以结构化或非结构化的数据形式存放在数据库或配置文件中;
传输监控规则时,由监控对象以主动推送的方式传输到受限网络监控工具,由监控对象下的业务掌握主导权,避免对业务产生干扰;如果传输方式为受限网络监控工具拉取监控对象中监控规则,会导致监控对象承担负荷过重,因此,由监控对象主动推送监控规则,以监控对象下业务的变动为依据主动推送,由业务掌握主导权,避免对监控对象造成负担。
具体的,所述步骤S101包括:
在监控对象中进行埋点,基于受限网络下监控对象的业务逻辑,定义监控规则;
将所述监控规则通过API推送到受限网络监控工具。其中,API(ApplicationProgramming Interface,应用程序接口)为预先定义的接口,监控工具是用来进行具体监控工作的工具,通常是一套独立的信息化系统,也可以是一个可执行的程序文件,此处受限网络监控工具即设置于受限网络下的监控工具。
步骤S102:利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数;其中,CMDB(Configuration Management Database,配置管理数据库),通常记录运维相关的各类配置信息,包括基础设施、设备、运行环境、进程监控信息等。
具体的,所述步骤S102包括:
利用CMDB自动获取所述监控对象的底层资源和所述监控规则的配置参数;
其中,所述监控规则的配置参数包括各项监控规则的阈值、监控对象中的埋点数量和埋点位置。监控规则的配置参数从微观层面对监控规则进行配置,在具体操作层面上进行通用的设置或配置,包括调节监控的阈值、增加或减少对监控下业务系统的埋点数量、改变埋点的业务系统、以及根据通用CPU和内存的数值大小对告警通知对象的异常报警等。
上述步骤S101和步骤S102,通过在监控对象中进行埋点,定义标准化业务逻辑监控规则信息,通过API对接监控工具,实现从监控对象上游推送业务逻辑类监控规则的半自动配置与维护;采用CMDB自动获取并存放监控对象的底层资源和配置参数,通过API对接监控工具,实现底层资源和配置参数类监控规则的自动配置与维护。本发明实施例提供的配置参数类监控规则自动化和业务逻辑类监控规则半自动化维护原理图如图3所示:
其中,CMDB通过自动化方式获取受限网络下监控对象的底层资源和配置参数信息,受限网络环境下的监控工具A通过API自动获取该底层资源和配置参数信息;监控对象定义开发标准,在系统上线前根据业务逻辑预设基线版本业务监控规则与输出信息,每次系统升级,同步更新业务逻辑类监控规则与输出信息,通过API推送到受限网络环境下的监控工具A。
通过自动化和半自动化的方式维护监控规则,提升了监控规则维护的准确性和及时性,并减少了人工维护的时间与成本。
步骤S103:通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具,其中,所述监控对象的上下游系统位于受限网络外的外部网络,所述第一告警通知信息为关联业务场景的告警通知信息;
外部网络是在受限的网络环境外的其他网络环境,上下游系统是外部网络中和受限网络的监控对象存在上下游业务交互的信息化系统,包括与监控对象存在上游业务交互的信息化系统,以及与监控对象存在下游业务交互的信息化系统。在监控对象的上下游环节,基于业务逻辑建立监控规则和监控工具,提升监控范围在业务场景的覆盖度,从业务角度出发,在多个外部网络环境中设置涵盖业务上下游业务场景的多套外部网络监控工具,扫除业务盲点,提升监控覆盖的完整性。
具体的,所述步骤S103包括:
确定所述监控对象的上下游系统分别所属的外部网络;
在所述外部网络中分别建立各自的外部网络监控工具,监控上下游系统中存在的关联业务场景;
当所述关联业务场景触发告警时,所述外部网络监控工具生成第一告警通知信息,并将所述第一告警通知信息通过网关推送到受限网络监控工具。其中,网关又称为网间连接器,在网络层实现网络互联,可用于将受限的网络与外部其他网络进行互联。
步骤S104:通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,并将所述第一告警通知信息和第二告警通知信息推送到受限网络通知对象,其中,所述第二告警通知信息为受限网络的告警通知信息。
在获取配置参数时,由于CMDB中的配置参数为运维团队内部数据,需由受限网络监控工具通过主动拉取的方式自动获取配置参数,以减少CMDB的行为操作;如果数据的传输方向为CMDB推送配置参数到受限网络监控工具,会对CMDB造成较大压力。
具体的,所述步骤S104包括:
所述受限网络监控工具通过API自动获取配置参数;
当根据所述监控规则和配置参数在受限网络内监控到异常情况时,生成第二告警通知信息。
根据上述步骤S103和步骤S104,通过在监控对象的上下游系统中,定义关联业务场景的监控规则,并在外部网络环境中实施对应的监控工作,告警通知范围覆盖所述监控对象的通知人群;在上下游系统监控到异常信息后,通过对应网关传递关联业务告警通知信息到所述受限网络中,通知受限网络中监控对象的告警通知人群或通知对象,从而提升受限网络中监控对象的业务监控覆盖度。本发明实施例提供的外部网络环境上下游系统中关联业务场景的监控覆盖原理图如图4所示:
其中,外部网络环境下,基于业务监控规则,通过设置的外部监控工具在外部网络监控上下游系统中的对应关联业务场景,当监控到关联业务场景存在异常事务,触发告警,并通过API推送第一告警通知信息到受限网络的网关;受限网络的网关推送第一告警信息到受限网络的监控工具;
同时,受限网络的监控对象将所采集的监控信息推送到受限网络的监控工具;受限网络环境下的监控工具推送告警通知信息到通知对象;其中,告警通知信息包括受限网络内监控到的异常情况,监控对象采集的监控信息,即第二告警通知信息,和外部上下游系统的关联业务告警内容,对应关联业务场景的告警信息,即第一告警通知信息。
从业务角度出发,在受限网络环境和多个外部网络环境中设置涵盖监控对象和上下游系统中关联业务场景的1+N多套监控工具,包括1套受限网络监控工具和多套外部网络监控工具,扫除业务盲点,提升监控覆盖的完整性;通过对接CMDB、外部网络监控工具,将监控体系从“1套监控工具”升级为“1套本网络环境的监控工具”+“1套CMDB”+“N套外部网络环境的监控工具”的1+1+N立体化监控生态。
具体的,所述方法还包括:
利用CMDB定义每项监控规则对应的外部网络通知对象;
通过所述受限网络监控工具自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系,并将所述第二告警通知信息推送到所述监控规则对应的外部网络通知对象。
为了解决对外部资源存在依赖的异常问题,进一步精确扩大监控告警的通知范围,本发明实施例基于CMDB中预配置的每项监控规则和外部网络通知对象的对应信息,通过获取上下游告警,可以获取到更及时、更全面的告警信息,缩短获取本受限网络告警信息的时间,提前对可能的问题进行处理;在内部受限系统中,通过在监控对象中埋点和通用的监控CPU,可以提前应对故障发生的时间,提升了监控告警规则的管理精细度,并在此基础上提升了告警触达通知对象的时效,降低了故障的持续时间。
其中,所述通过所述受限网络监控工具自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系,并将所述第二告警通知信息推送到所述监控规则对应的外部网络通知对象,包括:
所述受限网络监控工具通过API自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系;
根据所述对应关系将第二告警通知信息通过网关推送到对应的外部网络监控工具;
所述外部网络监控工具将第二告警通知信息推送到外部网络通知对象。
通过在受限网络的CMDB中定义每项监控规则对应的通知人群或通知对象,通过API对接受限网络监控工具A,在监控工具A产生告警信息后,基于CMDB中预先定义的监控规则和通知对象的对应关系,通过受限网络的网关传递符合规则的告警通知内容到受限网络的外部,通过外部监控工具传递到外部网络通知对象,即外部资源,以精确满足合理的告警通知范围。本发明实施例提供的向外部网络通知对象传递告警通知信息的原理图如图5所示:
其中,受限网络下的监控对象采集监控信息推送到受限网络监控工具A;在CMDB的监控规则中,包含具体的告警规则,告警规则定义具体的通知对象是否包含外部资源这一对应关系,监控工具基于CMDB中的告警规则和通知对象的对应信息,对告警通知规则进行判断,在符合通知外部资源的情况下,推送对应告警通知信息到网关,网关推送对应告警通知信息到外部监控工具,外部监控工具推送对应告警通知信息到外部网络通知对象,即外部资源;同时,受限网络监控工具A推送告警通知信息到受限网络通知对象。
本发明实施例还提供了受限网络下系统的监控方法的整体原理图,如图6所示,包含图3、图4和图5所示原理图中的信息,除了包含受限网络监控工具A外,还包含多个外部网络:外部网络1、外部网络2……外部网络n,各外部网络环境下分别包含监控工具B、监控工具C……监控工具X;
各个外部网络的监控工具监控到关联业务场景存在异常时触发告警,推送第一告警通知信息到网关,网关推送第一告警通知信息到受限网络的监控工具A,受限网络监控工具A将第一告警通知信息推送到受限网络通知对象;外部网关第一告警通知信息推送到受限网络内部,可以在受限网络环境下监控外部关联业务场景,提升监控范围的覆盖度;
并且,受限网络环境下的监控对象推送所采集的监控信息和业务监控规则到受限网络监控工具A,受限网络监控工具A自动获取CMDB中的监控规则和告警外发规则,受限网络监控工具A根据CMDB中的监控规则和告警外发规则包含的通知对象的对应关系,推送第二告警通知信息到通知对象和网关,网关推送第二告警通知信息到外部上下游系统的各个外部网络下的各个监控工具;受限网络内部的第二告警通知信息通知到外部资源,向外部资源传播告警或通知,扩大了监控告警的通知范围。
相较传统“通用先行”的监控体系,本发明实施例从业务角度出发,建立“监控前:业务监控规则”、“监控中:上下游业务场景覆盖”和“监控后:外部业务资源通知”三大保障,完整覆盖监控工作的全生命周期,提升对业务的运维保障能力。
从以上的描述中,可以看出,本发明实现了如下技术效果:
1)以自动化、半自动化的方式,对监控规则进行配置,实现底层资源和配置参数类监控规则的自动配置与维护,实现从上游推送业务逻辑类监控规则的半自动配置与维护;通过自动化和半自动化的方式维护监控规则,提升了监控规则维护的准确性和及时性,并减少了人工维护的时间与成本。
2)在监控对象的上下游环节,基于业务逻辑建立监控规则和监控工具,提升监控范围在业务场景的覆盖度,从业务角度出发,在多个网络环境中设置涵盖业务上下游业务场景的1+N多套监控工具,扫除业务盲点,提升监控覆盖的完整性;通过对接CMDB、外部网络监控工具,将监控体系从“1套监控工具”升级为“1套本网络环境的监控工具”+“1套CMDB”+“N套外部网络环境的监控工具”的1+1+N立体化监控生态。
3)针对对外部资源存在依赖的异常问题,进一步精确扩大监控告警的通知范围,基于CMDB中预配置的信息,提升监控告警规则的管理精细度,并在此基础上提升告警触达通知对象的时效,降低故障的持续时间。
4)相较传统“通用先行”的监控体系,本发明从业务角度出发,建立“监控前:业务监控规则”、“监控中:上下游业务场景覆盖”和“监控后:外部业务资源通知”三大保障,完整覆盖监控工作的全生命周期,提升对业务的运维保障能力。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例还提供了一种用于实施上述受限网络下系统的监控方法的受限网络下系统的监控装置,如图7所示,该装置包括:
定义单元71,用于基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具;
自动获取单元72,用于利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数;
第一推送单元73,用于通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具,其中,所述监控对象的上下游系统位于受限网络外的外部网络,所述第一告警通知信息为关联业务场景的告警通知信息;
第二推送单元74,用于通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,并将所述第一告警通知信息和第二告警通知信息推送到受限网络通知对象,其中,所述第二告警通知信息为受限网络的告警通知信息。
本发明实施例还提供了一种电子设备,如图8所示,该电子设备包括一个或多个处理器81以及存储器82,图8中以一个处理器81为例。
该控制器还可以包括:输入装置83和输出装置84。
处理器81、存储器82、输入装置83和输出装置84可以通过总线或者其他方式连接,图8中以通过总线连接为例。
处理器81可以为中央处理器(Central Processing Unit,简称为CPU),处理器81还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,简称为DSP)、专用集成电路(Application Specific Integrated Circuit,简称为ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称为FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合,通用处理器可以是微处理器或者任何常规的处理器。
存储器82作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的控制方法对应的程序指令/模块。处理器81通过运行存储在存储器82中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的受限网络下系统的监控方法。
存储器82可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外,存储器82可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器82可选包括相对于处理器81远程设置的存储器,这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置83可接收输入的数字或字符信息,以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置84可包括显示屏等显示设备。
一个或者多个模块存储在存储器82中,当被一个或者多个处理器81执行时,执行如图2所示的方法。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各电机控制方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,简称为ROM)、随机存储记忆体(Random AccessMemory,简称为RAM)、快闪存储器(Flash Memory,简称为FM)、硬盘(Hard Disk Drive,简称为HDD)或固态硬盘(Solid-State Drive,简称为SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种受限网络下系统的监控方法,其特征在于,包括:
基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具;
利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数;
通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具,其中,所述监控对象的上下游系统位于受限网络外的外部网络,所述第一告警通知信息为关联业务场景的告警通知信息;
通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,并将所述第一告警通知信息和第二告警通知信息推送到受限网络通知对象,其中,所述第二告警通知信息为受限网络的告警通知信息。
2.根据权利要求1所述的方法,其特征在于,所述基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具,包括:
在监控对象中进行埋点,基于受限网络下监控对象的业务逻辑,定义监控规则;
将所述监控规则通过API推送到受限网络监控工具。
3.根据权利要求1所述的方法,其特征在于,所述利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数包括:
利用CMDB自动获取所述监控对象的底层资源和所述监控规则的配置参数;
其中,所述监控规则的配置参数包括各项监控规则的阈值、监控对象中的埋点数量和埋点位置。
4.根据权利要求1所述的方法,其特征在于,所述通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具,包括:
确定所述监控对象的上下游系统分别所属的外部网络;
在所述外部网络中分别建立各自的外部网络监控工具,监控上下游系统中存在的关联业务场景;
当所述关联业务场景触发告警时,所述外部网络监控工具生成第一告警通知信息,并将所述第一告警通知信息通过网关推送到受限网络监控工具。
5.根据权利要求1所述的方法,其特征在于,所述通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,包括:
所述受限网络监控工具通过API自动获取配置参数;
当根据所述监控规则和配置参数在受限网络内监控到异常情况时,生成第二告警通知信息。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用CMDB定义每项监控规则对应的外部网络通知对象;
通过所述受限网络监控工具自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系,并将所述第二告警通知信息推送到所述监控规则对应的外部网络通知对象。
7.根据权利要求6所述的方法,其特征在于,所述通过所述受限网络监控工具自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系,并将所述第二告警通知信息推送到所述监控规则对应的外部网络通知对象,包括:
所述受限网络监控工具通过API自动获取CMDB中定义的监控规则与外部网络通知对象的对应关系;
根据所述对应关系将第二告警通知信息通过网关推送到对应的外部网络监控工具;
所述外部网络监控工具将第二告警通知信息推送到外部网络通知对象。
8.一种受限网络下系统的监控装置,其特征在于,包括:
定义单元,用于基于受限网络下监控对象的业务逻辑定义监控规则,并将所述监控规则推送到受限网络监控工具;
自动获取单元,用于利用CMDB自动获取并存放所述监控对象的底层资源和所述监控规则的配置参数;
第一推送单元,用于通过外部网络监控工具监控所述监控对象的上下游系统中存在的关联业务场景,将第一告警通知信息推送到受限网络监控工具,其中,所述监控对象的上下游系统位于受限网络外的外部网络,所述第一告警通知信息为关联业务场景的告警通知信息;
第二推送单元,用于通过所述受限网络监控工具自动获取配置参数,基于所述监控规则和配置参数生成第二告警通知信息,并将所述第一告警通知信息和第二告警通知信息推送到受限网络通知对象,其中,所述第二告警通知信息为受限网络的告警通知信息。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-7任意一项所述的受限网络下系统的监控方法。
10.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-7任意一项所述的受限网络下系统的监控方法。
CN202110738623.9A 2021-06-30 2021-06-30 受限网络下系统的监控方法、装置及电子设备 Active CN113489609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110738623.9A CN113489609B (zh) 2021-06-30 2021-06-30 受限网络下系统的监控方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110738623.9A CN113489609B (zh) 2021-06-30 2021-06-30 受限网络下系统的监控方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN113489609A true CN113489609A (zh) 2021-10-08
CN113489609B CN113489609B (zh) 2022-12-02

Family

ID=77937115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110738623.9A Active CN113489609B (zh) 2021-06-30 2021-06-30 受限网络下系统的监控方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113489609B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277385A (zh) * 2022-07-01 2022-11-01 浪潮云信息技术股份公司 分布式云的cmdb自动配置方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008244635A (ja) * 2007-03-26 2008-10-09 Oki Electric Ind Co Ltd ネットワーク監視システム、ネットワーク監視方法、ネットワーク監視プログラム及び収集装置
CN101714930A (zh) * 2009-12-30 2010-05-26 北京世纪互联宽带数据中心有限公司 一种实现网络监控的方法及系统
JP2016100799A (ja) * 2014-11-25 2016-05-30 株式会社日立製作所 監視システムおよび監視方法
CN110635938A (zh) * 2019-08-19 2019-12-31 腾讯科技(深圳)有限公司 一种监控方法、系统、设备及介质
CN111343033A (zh) * 2020-05-22 2020-06-26 中国人民解放军国防科技大学 一种面向多层差异的网络管理系统
CN111611137A (zh) * 2020-06-30 2020-09-01 平安银行股份有限公司 告警监控方法、装置、计算机设备及存储介质
CN112350862A (zh) * 2020-10-30 2021-02-09 广州市汇聚支付电子科技有限公司 一种监控报警及故障自愈系统
CN112532456A (zh) * 2020-12-04 2021-03-19 浪潮云信息技术股份公司 一种云环境下的告警监控方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008244635A (ja) * 2007-03-26 2008-10-09 Oki Electric Ind Co Ltd ネットワーク監視システム、ネットワーク監視方法、ネットワーク監視プログラム及び収集装置
CN101714930A (zh) * 2009-12-30 2010-05-26 北京世纪互联宽带数据中心有限公司 一种实现网络监控的方法及系统
JP2016100799A (ja) * 2014-11-25 2016-05-30 株式会社日立製作所 監視システムおよび監視方法
CN110635938A (zh) * 2019-08-19 2019-12-31 腾讯科技(深圳)有限公司 一种监控方法、系统、设备及介质
CN111343033A (zh) * 2020-05-22 2020-06-26 中国人民解放军国防科技大学 一种面向多层差异的网络管理系统
CN111611137A (zh) * 2020-06-30 2020-09-01 平安银行股份有限公司 告警监控方法、装置、计算机设备及存储介质
CN112350862A (zh) * 2020-10-30 2021-02-09 广州市汇聚支付电子科技有限公司 一种监控报警及故障自愈系统
CN112532456A (zh) * 2020-12-04 2021-03-19 浪潮云信息技术股份公司 一种云环境下的告警监控方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277385A (zh) * 2022-07-01 2022-11-01 浪潮云信息技术股份公司 分布式云的cmdb自动配置方法及系统

Also Published As

Publication number Publication date
CN113489609B (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
AU2017207319B2 (en) Architecture for data center infrastructure monitoring
US10116532B2 (en) Cloud-based operator interface for industrial automation
US10061371B2 (en) System and method for monitoring and managing data center resources in real time incorporating manageability subsystem
US9921877B2 (en) Intelligent auto-scaling
US10268961B2 (en) Generating predictive models to reconfigure electronic devices
CN113055417A (zh) 一种智能工业物联网系统
US10536348B2 (en) Operational micro-services design, development, deployment
CN105471932A (zh) 一种前端应用的监控方法、设备和系统
CN114244676A (zh) 一种智能it综合网关系统
CN111679888A (zh) 一种代理容器的部署方法及装置
CN110688277A (zh) 用于微服务框架的数据监控方法及装置
CN113489609B (zh) 受限网络下系统的监控方法、装置及电子设备
WO2021102838A1 (zh) 确定采集频率的方法、装置、计算设备和存储介质
CN112165528B (zh) 车辆事件及其事件文件数据的管理方法、系统及存储介质
DE102016115219A1 (de) Prozesssteuerungsalarmüberwachung
US20220283990A1 (en) Method for configuring priority level, cloud platform, system, computing device, and medium
CN113254311B (zh) 一种分布式电源系统的监控系统和监控方法
CN110855003A (zh) 一种主站自适应配置召唤与比对的方法及装置
CN117234673A (zh) 数据处理的方法、系统及电子设备
CN111324504B (zh) 电力通信网络运行状态监测方法和装置
CN108280763A (zh) 股票行情数据处理方法及相关设备
CN113381880B (zh) 物联网设备管理方法、装置及系统
DE102018114758A1 (de) Loop-schnittstelle
CN116431277A (zh) 多地运维容器化方法、装置、计算机设备及存储介质
CN115865623B (zh) 面向多平台的告警数据处理方法以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant