[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN112817814A - 异常监控方法、系统、存储介质及电子装置 - Google Patents

异常监控方法、系统、存储介质及电子装置 Download PDF

Info

Publication number
CN112817814A
CN112817814A CN202110081846.2A CN202110081846A CN112817814A CN 112817814 A CN112817814 A CN 112817814A CN 202110081846 A CN202110081846 A CN 202110081846A CN 112817814 A CN112817814 A CN 112817814A
Authority
CN
China
Prior art keywords
abnormal
information
event
anomaly
system configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110081846.2A
Other languages
English (en)
Inventor
熊志坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Networks Technology Co ltd
Original Assignee
Networks Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Networks Technology Co ltd filed Critical Networks Technology Co ltd
Priority to CN202110081846.2A priority Critical patent/CN112817814A/zh
Publication of CN112817814A publication Critical patent/CN112817814A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种异常监控方法、系统、存储介质及电子装置,该方法包括:在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;发出与异常根因信息相匹配的预警信息。本发明能够提高异常监控效率。

Description

异常监控方法、系统、存储介质及电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种异常监控方法、系统、存储介质及电子装置。
背景技术
目前,随着云架构、微服务等技术的不断发展,运维管理的难度也随之提升。
在实践中发现,在复杂的计算机架构中,会出现大量的异常告警以及相应的日志事件,需要人为在这大量的异常告警以及日志事件中确定异常原因,以此针对异常原因进行处理,来解决异常事件。这一过程需要进行大量的分析排查,效率较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种异常监控方法、系统、存储介质及电子装置,以至少提高异常监控效率。
根据本发明实施例的一个方面,提供了一种异常监控方法,包括:在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;对上述异常数据信息以及上述系统配置信息进行异常定位分析,获得异常根因信息;发出与上述异常根因信息相匹配的预警信息。
作为一种可选的实施方式,在上述获取目标系统的异常数据信息以及系统配置信息之后,还包括:获取异常知识信息;在上述发出与上述异常根因信息相匹配的预警信息之后,还包括:在上述异常知识信息中确定与上述异常根因信息相匹配的异常解决建议信息;输出上述异常解决建议信息,以使按照上述异常解决建议信息解决上述异常事件。
作为一种可选的实施方式,在上述获取目标系统的异常数据信息以及系统配置信息之后,还包括:根据上述异常数据信息以及上述系统配置信息对故障事件进行预测,获得预测结果;输出上述预测结果,以使按照上述预测结果执行上述故障事件相匹配的故障规避操作。
作为一种可选的实施方式,在上述获取目标系统的异常数据信息以及系统配置信息之前,还包括:对异常数据执行数据抽取操作,并利用执行上述数据抽取操作之后的上述异常数据进行建模,获得异常知识图谱;上述对上述异常数据信息以及上述系统配置信息进行异常定位分析,获得异常根因信息,包括:根据上述异常知识图谱对上述异常数据信息以及上述系统配置信息进行异常定位分析,获得异常根因信息。
作为一种可选的实施方式,在上述获取目标系统的异常数据信息以及系统配置信息之前,还包括:通过上述事件驱动检测多个目标事件;对上述目标事件进行分组聚类处理,获得分组聚类处理后的上述目标事件;在分组聚类处理后的上述目标事件中包含上述异常事件的情况下,确定通过上述事件驱动检测到异常事件。
根据本发明实施例的另一方面,还提供了一种异常监控系统,包括:第一获取单元,用于在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;第二获取单元,用于对上述异常数据信息以及上述系统配置信息进行异常定位分析,获得异常根因信息;预警单元,用于发出与上述异常根因信息相匹配的预警信息。
作为一种可选的实施方式,上述系统还包括:第三获取单元,用于在上述获取目标系统的异常数据信息以及系统配置信息之后,获取异常知识信息;确定单元,用于在上述发出与上述异常根因信息相匹配的预警信息之后,在上述异常知识信息中确定与上述异常根因信息相匹配的异常解决建议信息;输出单元,用于输出上述异常解决建议信息,以使按照上述异常解决建议信息解决上述异常事件。
作为一种可选的实施方式,上述系统还包括:预测单元,用于在上述获取目标系统的异常数据信息以及系统配置信息之后,根据上述异常数据信息以及上述系统配置信息对故障事件进行预测,获得预测结果;上述输出单元,还用于输出上述预测结果,以使按照上述预测结果执行上述故障事件相匹配的故障规避操作。
作为一种可选的实施方式,上述系统还包括:建模单元,用于在上述获取目标系统的异常数据信息以及系统配置信息之前,对异常数据执行数据抽取操作,并利用执行上述数据抽取操作之后的上述异常数据进行建模,获得异常知识图谱;上述第二获取单元用于对上述异常数据信息以及上述系统配置信息进行异常定位分析,获得异常根因信息的方式具体为:上述第二获取单元,用于根据上述异常知识图谱对上述异常数据信息以及上述系统配置信息进行异常定位分析,获得异常根因信息。
作为一种可选的实施方式,上述系统还包括:检测单元,用于在上述获取目标系统的异常数据信息以及系统配置信息之前,通过上述事件驱动检测多个目标事件;聚类单元,用于对上述目标事件进行分组聚类处理,获得分组聚类处理后的上述目标事件;上述确定单元,还用于在分组聚类处理后的上述目标事件中包含上述异常事件的情况下,确定通过上述事件驱动检测到异常事件。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述异常监控方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的异常监控方法。
在本发明实施例中,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;发出与异常根因信息相匹配的预警信息。这一过程能够在异常监控的过程中,根据异常数据信息以及系统配置信息自动确定异常根因信息,并进行相应的预警,无需人工在大量的异常告警以及日志事件中确定异常原因,以此针对异常原因进行处理,来解决异常事件,从而提高了异常监控效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的异常监控方法的流程图;
图2是根据本发明实施例的另一种可选的异常监控方法的流程图;
图3是根据本发明实施例的另一种可选的异常监控方法的流程图;
图4是根据本发明实施例的一种可选的异常监控系统的结构示意图;
图5是根据本发明实施例的另一种可选的异常监控系统的结构示意图;
图6是根据本发明实施例的一种可选的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种可选的异常监控方法,如图1所示,该异常监控方法包括:
S101,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;
S102,对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;
S103,发出与异常根因信息相匹配的预警信息。
本发明实施例中,目标系统为出现上述异常事件的系统,异常数据信息为异常事件对应的事件类数据,可以包括但不限于机器日志、告警等信息,系统配置信息可以为出现上述异常事件的系统的配置信息,可以包括但不限于系统中的业务调用关系信息、配置管理数据库信息等,本发明实施例中不做限定。在通过事件驱动检测到异常事件的情况下,可以对上述异常数据信息以及系统配置信息进行异常定位分析,自动分析异常事件的异常根因信息,并发出与异常根因信息相匹配的预警信息,实现及时预警。
进一步的,本发明实施例所描述的异常监控方法可以采用监控采集环节、数据处理环节、算法处理环节以及场景交互环节来实现,具体的,监控采集环节可以用于采集目标系统的异常数据信息以及系统配置信息,数据处理环节可以用于根据历史异常事件数据库中的历史异常数据信息对异常数据信息以及系统配置信息进行数据抽取等数据处理操作,算法处理环节可以用于对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息,场景交互环节可以用于发出与异常根因信息相匹配的预警信息。通过实施上述异常监控方法,可以实现对异常事件的智能分析。可选的,还可以在上述数据处理环节中存储各个历史异常事件信息,以此构建运维知识图谱,在发出异常根因信息相匹配的预警信息的情况下,还可以输出运维知识图谱来辅助异常事件的解决。进一步可选的,还可以通过检索运维知识数据库来检索运维知识,实现知识搜索功能,这一过程使得异常事件的解决更加顺畅,运维管理更加便捷。
在本发明实施例中,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;发出与异常根因信息相匹配的预警信息。这一过程能够在异常监控的过程中,根据异常数据信息以及系统配置信息自动确定异常根因信息,并进行相应的预警,无需人工在大量的异常告警以及日志事件中确定异常原因,以此针对异常原因进行处理,来解决异常事件,从而提高了异常监控效率。
进一步的,本发明实施例提供了另一种可选的异常监控方法,如图2所示,该异常监控方法包括:
S201,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;
S202,根据异常数据信息以及系统配置信息对故障事件进行预测,获得预测结果;
S203,输出预测结果,以使按照预测结果执行故障事件相匹配的故障规避操作;
S204,获取异常知识信息;
S205,对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;
S206,发出与异常根因信息相匹配的预警信息;
S207,在异常知识信息中确定与异常根因信息相匹配的异常解决建议信息;
S208,输出异常解决建议信息,以使按照异常解决建议信息解决异常事件。
作为一种可选的实施方式,在获取目标系统的异常数据信息以及系统配置信息之后,还可以执行以下步骤:
获取异常知识信息;
可选的,在发出与异常根因信息相匹配的预警信息之后,还可以执行以下步骤:
S1,在异常知识信息中确定与异常根因信息相匹配的异常解决建议信息;
S2,输出异常解决建议信息,以使按照异常解决建议信息解决异常事件。
本发明实施例中,在获取目标系统的异常数据信息以及系统配置信息之后,还可以获取异常知识信息,其中,异常知识信息为上述数据处理环节中数据库中存储的信息,是根据历史异常事件信息分析得到的信息,可以包括但不限于运维知识图谱信息、运维知识点信息等,本发明实施例中不做限定。进一步的,在发出预警信息之后,还可以在异常知识信息中确定与异常根因信息相匹配的异常解决建议信息,异常解决建议信息用于指示解决上述异常事件的方案,通过输出异常解决建议信息,能够使得工作人员按照异常解决建议信息解决该异常事件。这一过程可以及时输出针对异常事件的异常解决建议信息,无需人工确定解决异常事件的解决方案,智能化程度更高,异常解决效果更好。
作为一种可选的实施方式,在获取目标系统的异常数据信息以及系统配置信息之后,还可以执行以下步骤:
S1,根据异常数据信息以及系统配置信息对故障事件进行预测,获得预测结果;
S2,输出预测结果,以使按照预测结果执行故障事件相匹配的故障规避操作。
本发明实施例中,在获取目标系统的异常数据信息以及系统配置信息之后,还可以根据异常数据信息以及系统配置信息对故障事件进行预测,获得预测结果。其中,预测结果用于指示故障事件出现的概率情况以及大概率出现的故障事件的故障规避操作。通过输出预测结果,可以使得工作人员按照预测结果执行故障事件相匹配的故障规避操作,使得运维工作能够在故障发生前就进行排查解决,降低异常事件的发生概率。
在本发明实施例中,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;发出与异常根因信息相匹配的预警信息。这一过程能够在异常监控的过程中,根据异常数据信息以及系统配置信息自动确定异常根因信息,并进行相应的预警,无需人工在大量的异常告警以及日志事件中确定异常原因,以此针对异常原因进行处理,来解决异常事件,从而提高了异常监控效率。
进一步的,本发明实施例提供了另一种可选的异常监控方法,如图3所示,该异常监控方法包括:
S301,对异常数据执行数据抽取操作,并利用执行数据抽取操作之后的异常数据进行建模,获得异常知识图谱;
S302,通过事件驱动检测多个目标事件;
S303,对目标事件进行分组聚类处理,获得分组聚类处理后的目标事件;
S304,在分组聚类处理后的目标事件中包含异常事件的情况下,确定通过事件驱动检测到异常事件,获取目标系统的异常数据信息以及系统配置信息;
S305,根据异常数据信息以及系统配置信息对故障事件进行预测,获得预测结果;
S306,输出预测结果,以使按照预测结果执行故障事件相匹配的故障规避操作;
S307,获取异常知识信息;
S308,根据异常知识图谱对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;
S309,发出与异常根因信息相匹配的预警信息;
S310,在异常知识信息中确定与异常根因信息相匹配的异常解决建议信息;
S311,输出异常解决建议信息,以使按照异常解决建议信息解决异常事件。
作为一种可选的实施方式,在获取目标系统的异常数据信息以及系统配置信息之前,还可以执行以下步骤:
对异常数据执行数据抽取操作,并利用执行数据抽取操作之后的异常数据进行建模,获得异常知识图谱;
对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息可以包括:
根据异常知识图谱对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息。
本发明实施例中,在获取异常数据信息以及系统配置信息之前,可以对历史出现异常事件的异常数据执行数据抽取操作,获得执行数据抽取操作之后的异常数据,利用执行数据抽取操作之后的异常数据进行建模,获得异常知识图谱,在进行异常定位分析的情况下,可以利用异常知识图谱解析异常数据信息以及系统配置信息,获得异常根因信息,能够提高获取到的异常根因信息的准确度。
作为一种可选的实施方式,在获取目标系统的异常数据信息以及系统配置信息之前,还可以执行以下步骤:
S1,通过事件驱动检测多个目标事件;
S2,对目标事件进行分组聚类处理,获得分组聚类处理后的目标事件;
S3,在分组聚类处理后的目标事件中包含异常事件的情况下,确定通过事件驱动检测到异常事件。
本发明实施例中,在通过事件驱动检测到多个目标事件的情况下,可以先对目标事件进行分组聚类处理,可选的,可以按照目标事件的事件模式提取与每一目标事件相匹配的关键词,利用关键词对目标事件进行分组聚类,将相同关键词的目标事件分为相同组,在检测异常事件的情况下,可以按照组来检测每组目标事件中是否存在异常事件,如果存在,确定通过事件驱动检测到异常事件,这一过程可以分组检测异常事件,能够提高异常事件的检测效率。
进一步的,除上述监控采集环节、数据处理环节、算法处理环节以及场景交互环节之外,还可以包括数据存储环节,数据存储环节用于存储异常知识图谱、异常知识点等信息。其中,监控采集环节所使用的事件传输方式可以为消息队列的方式。并且数据处理环节可以进行异常根因信息的定位处理、异常事件分析处理、异常知识图谱管理处理、异常知识数据库管理处理、异常事件解析处理以及语义编码处理等。其中,异常根因信息的定位处理可以根据根因定位算法生成根因路径模型,以便后续算法处理环节根据根因路径模型确定异常根因信息。异常事件分析处理可以解析每一异常事件,确定出每一异常事件对应的事件模式,并为相应的事件模式提取关键词进行分类标注处理。异常知识图谱管理处理可以对目标系统的系统配置信息进行关系定义处理、实体定义处理等操作,异常知识数据库管理能够管理数据存储环节中数据库中的数据信息,异常事件解析处理能够为异常事件提供解释信息,并根据异常事件匹配异常解决方案,语义编码处理能够对异常事件进行语义编码,提高了事件模式的泛化性。进一步的,算法处理环节能够根据根因路径模型确定异常根因信息,还可以利用人工标注事件模式的样本数据来训练模型的自学习能力,实现对异常事件的计算处理。进一步的,数据存储环节中存储的数据可以包括但不限于事件类型数据、图谱数据以及知识数据,其中,事件类型数据可以包括异常事件日志数据、异常事件告警数据,图谱数据可以包括系统配置图谱、业务图谱等,知识数据可以包括故障手册数据、厂家开发文档数据、告警数据等,本发明实施例中不做限定。进一步的,场景交互环节可以接收用户触发的指令,来解析异常事件,获取目标系统的异常数据信息以及系统配置信息,并对该信息进行异常定位分析,获得异常根因信息,实现智能的异常监控以及运维管理。
进一步的,通过事件驱动检测异常事件的方式具体可以为:通过事件驱动获取多个目标事件;对目标事件进行分组聚类处理,获取每组目标事件对应的标签信息;按照标签信息确定每组目标事件对应的识别顺序,其中,标签信息的优先级别越高,识别顺序越早;按照识别顺序识别每组目标事件,检测每组目标事件中是否存在异常事件,如果是,确定检测到异常事件。其中,异常事件中可以包括普通异常事件以及新奇异常事件,普通异常事件为事件数量异常的事件或者当前周期新出现的事件,新奇异常事件为从未出现过的新事件。通过对异常数据信息以及系统配置信息进行异常定位分析,可以获得异常根因信息,异常根因信息可以为已发生故障对应的根因信息,也可以为未发生故障但预测将会出现故障的根因信息。具体的,可以利用机器学习算法学习事件规律和行为趋势确定出异常根因信息。进一步的,在获得异常根因信息并发出与异常根因信息相匹配的预警信息之后,还可以根据异常根因信息进行自动调参,将目标系统的异常指标参数调整至标准范围内,以此辅助解决异常事件,提高目标系统的运行效果。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述异常监控方法的异常监控系统。如图4所示,该系统包括:
第一获取单元401,用于在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;
第二获取单元402,用于对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;
预警单元403,用于发出与异常根因信息相匹配的预警信息。
本发明实施例中,目标系统为出现上述异常事件的系统,异常数据信息为异常事件对应的事件类数据,可以包括但不限于机器日志、告警等信息,系统配置信息可以为出现上述异常事件的系统的配置信息,可以包括但不限于系统中的业务调用关系信息、配置管理数据库信息等,本发明实施例中不做限定。在通过事件驱动检测到异常事件的情况下,可以对上述异常数据信息以及系统配置信息进行异常定位分析,自动分析异常事件的异常根因信息,并发出与异常根因信息相匹配的预警信息,实现及时预警。
进一步的,本发明实施例所描述的异常监控方法可以采用监控采集环节、数据处理环节、算法处理环节以及场景交互环节来实现,具体的,监控采集环节可以用于采集目标系统的异常数据信息以及系统配置信息,数据处理环节可以用于根据历史异常事件数据库中的历史异常数据信息对异常数据信息以及系统配置信息进行数据抽取等数据处理操作,算法处理环节可以用于对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息,场景交互环节可以用于发出与异常根因信息相匹配的预警信息。通过实施上述异常监控方法,可以实现对异常事件的智能分析。可选的,还可以在上述数据处理环节中存储各个历史异常事件信息,以此构建运维知识图谱,在发出异常根因信息相匹配的预警信息的情况下,还可以输出运维知识图谱来辅助异常事件的解决。进一步可选的,还可以通过检索运维知识数据库来检索运维知识,实现知识搜索功能,这一过程使得异常事件的解决更加顺畅,运维管理更加便捷。
在本发明实施例中,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;发出与异常根因信息相匹配的预警信息。这一过程能够在异常监控的过程中,根据异常数据信息以及系统配置信息自动确定异常根因信息,并进行相应的预警,无需人工在大量的异常告警以及日志事件中确定异常原因,以此针对异常原因进行处理,来解决异常事件,从而提高了异常监控效率。
作为一种可选的实施方式,本发明实施例还提供了一种用于实施上述异常监控方法的异常监控系统,如图5所示,该异常监控系统是在图4所示的异常监控系统的基础上进行改进得到的,与图4所示的异常监控系统相比,在图5所示的异常监控系统中,还可以包括:
第三获取单元404,用于在获取目标系统的异常数据信息以及系统配置信息之后,获取异常知识信息;
确定单元405,用于在发出与异常根因信息相匹配的预警信息之后,在异常知识信息中确定与异常根因信息相匹配的异常解决建议信息;
输出单元406,用于输出异常解决建议信息,以使按照异常解决建议信息解决异常事件。
本发明实施例中,在获取目标系统的异常数据信息以及系统配置信息之后,还可以获取异常知识信息,其中,异常知识信息为上述数据处理环节中数据库中存储的信息,是根据历史异常事件信息分析得到的信息,可以包括但不限于运维知识图谱信息、运维知识点信息等,本发明实施例中不做限定。进一步的,在发出预警信息之后,还可以在异常知识信息中确定与异常根因信息相匹配的异常解决建议信息,异常解决建议信息用于指示解决上述异常事件的方案,通过输出异常解决建议信息,能够使得工作人员按照异常解决建议信息解决该异常事件。这一过程可以及时输出针对异常事件的异常解决建议信息,无需人工确定解决异常事件的解决方案,智能化程度更高,异常解决效果更好。
在本发明实施例中,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;发出与异常根因信息相匹配的预警信息。这一过程能够在异常监控的过程中,根据异常数据信息以及系统配置信息自动确定异常根因信息,并进行相应的预警,无需人工在大量的异常告警以及日志事件中确定异常原因,以此针对异常原因进行处理,来解决异常事件,从而提高了异常监控效率。
作为一种可选的实施方式,上述系统还可以包括:
预测单元,用于在获取目标系统的异常数据信息以及系统配置信息之后,根据异常数据信息以及系统配置信息对故障事件进行预测,获得预测结果;
输出单元,还用于输出预测结果,以使按照预测结果执行故障事件相匹配的故障规避操作。
本发明实施例中,在获取目标系统的异常数据信息以及系统配置信息之后,还可以根据异常数据信息以及系统配置信息对故障事件进行预测,获得预测结果。其中,预测结果用于指示故障事件出现的概率情况以及大概率出现的故障事件的故障规避操作。通过输出预测结果,可以使得工作人员按照预测结果执行故障事件相匹配的故障规避操作,使得运维工作能够在故障发生前就进行排查解决,降低异常事件的发生概率。
作为一种可选的实施方式,上述系统还可以包括:建模单元,用于在上述获取目标系统的异常数据信息以及系统配置信息之前,对异常数据执行数据抽取操作,并利用执行上述数据抽取操作之后的上述异常数据进行建模,获得异常知识图谱;上述第二获取单元用于对上述异常数据信息以及上述系统配置信息进行异常定位分析,获得异常根因信息的方式具体为:上述第二获取单元,用于根据上述异常知识图谱对上述异常数据信息以及上述系统配置信息进行异常定位分析,获得异常根因信息。
本发明实施例中,在获取异常数据信息以及系统配置信息之前,可以对历史出现异常事件的异常数据执行数据抽取操作,获得执行数据抽取操作之后的异常数据,利用执行数据抽取操作之后的异常数据进行建模,获得异常知识图谱,在进行异常定位分析的情况下,可以利用异常知识图谱解析异常数据信息以及系统配置信息,获得异常根因信息,能够提高获取到的异常根因信息的准确度。
作为一种可选的实施方式,上述系统还可以包括:检测单元,用于在上述获取目标系统的异常数据信息以及系统配置信息之前,通过上述事件驱动检测多个目标事件;聚类单元,用于对上述目标事件进行分组聚类处理,获得分组聚类处理后的上述目标事件;上述确定单元,还用于在分组聚类处理后的上述目标事件中包含上述异常事件的情况下,确定通过上述事件驱动检测到异常事件。
本发明实施例中,在通过事件驱动检测到多个目标事件的情况下,可以先对目标事件进行分组聚类处理,可选的,可以按照目标事件的事件模式提取与每一目标事件相匹配的关键词,利用关键词对目标事件进行分组聚类,将相同关键词的目标事件分为相同组,在检测异常事件的情况下,可以按照组来检测每组目标事件中是否存在异常事件,如果存在,确定通过事件驱动检测到异常事件,这一过程可以分组检测异常事件,能够提高异常事件的检测效率。
进一步的,除上述监控采集环节、数据处理环节、算法处理环节以及场景交互环节之外,还可以包括数据存储环节,数据存储环节用于存储异常知识图谱、异常知识点等信息。其中,监控采集环节所使用的事件传输方式可以为消息队列的方式。并且数据处理环节可以进行异常根因信息的定位处理、异常事件分析处理、异常知识图谱管理处理、异常知识数据库管理处理、异常事件解析处理以及语义编码处理等。其中,异常根因信息的定位处理可以根据根因定位算法生成根因路径模型,以便后续算法处理环节根据根因路径模型确定异常根因信息。异常事件分析处理可以解析每一异常事件,确定出每一异常事件对应的事件模式,并为相应的事件模式提取关键词进行分类标注处理。异常知识图谱管理处理可以对目标系统的系统配置信息进行关系定义处理、实体定义处理等操作,异常知识数据库管理能够管理数据存储环节中数据库中的数据信息,异常事件解析处理能够为异常事件提供解释信息,并根据异常事件匹配异常解决方案,语义编码处理能够对异常事件进行语义编码,提高了事件模式的泛化性。进一步的,算法处理环节能够根据根因路径模型确定异常根因信息,还可以利用人工标注事件模式的样本数据来训练模型的自学习能力,实现对异常事件的计算处理。进一步的,数据存储环节中存储的数据可以包括但不限于事件类型数据、图谱数据以及知识数据,其中,事件类型数据可以包括异常事件日志数据、异常事件告警数据,图谱数据可以包括系统配置图谱、业务图谱等,知识数据可以包括故障手册数据、厂家开发文档数据、告警数据等,本发明实施例中不做限定。进一步的,场景交互环节可以接收用户触发的指令,来解析异常事件,获取目标系统的异常数据信息以及系统配置信息,并对该信息进行异常定位分析,获得异常根因信息,实现智能的异常监控以及运维管理。
进一步的,通过事件驱动检测异常事件的方式具体可以为:通过事件驱动获取多个目标事件;对目标事件进行分组聚类处理,获取每组目标事件对应的标签信息;按照标签信息确定每组目标事件对应的识别顺序,其中,标签信息的优先级别越高,识别顺序越早;按照识别顺序识别每组目标事件,检测每组目标事件中是否存在异常事件,如果是,确定检测到异常事件。其中,异常事件中可以包括普通异常事件以及新奇异常事件,普通异常事件为事件数量异常的事件或者当前周期新出现的事件,新奇异常事件为从未出现过的新事件。通过对异常数据信息以及系统配置信息进行异常定位分析,可以获得异常根因信息,异常根因信息可以为已发生故障对应的根因信息,也可以为未发生故障但预测将会出现故障的根因信息。具体的,可以利用机器学习算法学习事件规律和行为趋势确定出异常根因信息。进一步的,在获得异常根因信息并发出与异常根因信息相匹配的预警信息之后,还可以根据异常根因信息进行自动调参,将目标系统的异常指标参数调整至标准范围内,以此辅助解决异常事件,提高目标系统的运行效果。
根据本发明实施例的又一个方面,还提供了一种用于实施上述异常监控方法的电子装置,如图6所示,该电子装置包括存储器602和处理器604,该存储器602中存储有计算机程序,该处理器604被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;
S2,对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;
S3,发出与异常根因信息相匹配的预警信息。
可选地,本领域普通技术人员可以理解,图6所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图6其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图6中所示更多或者更少的组件(如网络接口等),或者具有与图6所示不同的配置。
其中,存储器602可用于存储软件程序以及模块,如本发明实施例中的异常监控方法和装置对应的程序指令/模块,处理器604通过运行存储在存储器602内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的异常监控方法。存储器602可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器602可进一步包括相对于处理器604远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器602具体可以但不限于用于存储操作指令等信息。作为一种示例,如图6所示,上述存储器602中可以但不限于包括上述异常监控装置中的第一获取单元401、第二获取单元402以及预警单元403。此外,还可以包括但不限于上述异常监控装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置606用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置606包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置606为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还包括:显示器608,用于显示上述预警信息;和连接总线610,用于连接上述电子装置中的各个模块部件。
根据本发明的实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;
S2,对异常数据信息以及系统配置信息进行异常定位分析,获得异常根因信息;
S3,发出与异常根因信息相匹配的预警信息。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种异常监控方法,其特征在于,包括:
在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;
对所述异常数据信息以及所述系统配置信息进行异常定位分析,获得异常根因信息;
发出与所述异常根因信息相匹配的预警信息。
2.根据权利要求1所述的方法,其特征在于,在所述获取目标系统的异常数据信息以及系统配置信息之后,还包括:
获取异常知识信息;
在所述发出与所述异常根因信息相匹配的预警信息之后,还包括:
在所述异常知识信息中确定与所述异常根因信息相匹配的异常解决建议信息;
输出所述异常解决建议信息,以使按照所述异常解决建议信息解决所述异常事件。
3.根据权利要求1所述的方法,其特征在于,在所述获取目标系统的异常数据信息以及系统配置信息之后,还包括:
根据所述异常数据信息以及所述系统配置信息对故障事件进行预测,获得预测结果;
输出所述预测结果,以使按照所述预测结果执行所述故障事件相匹配的故障规避操作。
4.根据权利要求1所述的方法,其特征在于,在所述获取目标系统的异常数据信息以及系统配置信息之前,还包括:
对异常数据执行数据抽取操作,并利用执行所述数据抽取操作之后的所述异常数据进行建模,获得异常知识图谱;
所述对所述异常数据信息以及所述系统配置信息进行异常定位分析,获得异常根因信息,包括:
根据所述异常知识图谱对所述异常数据信息以及所述系统配置信息进行异常定位分析,获得异常根因信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,在所述获取目标系统的异常数据信息以及系统配置信息之前,还包括:
通过所述事件驱动检测多个目标事件;
对所述目标事件进行分组聚类处理,获得分组聚类处理后的所述目标事件;
在分组聚类处理后的所述目标事件中包含所述异常事件的情况下,确定通过所述事件驱动检测到异常事件。
6.一种异常监控系统,其特征在于,包括:
第一获取单元,用于在通过事件驱动检测到异常事件的情况下,获取目标系统的异常数据信息以及系统配置信息;
第二获取单元,用于对所述异常数据信息以及所述系统配置信息进行异常定位分析,获得异常根因信息;
预警单元,用于发出与所述异常根因信息相匹配的预警信息。
7.根据权利要求6所述的系统,其特征在于,还包括:
第三获取单元,用于在所述获取目标系统的异常数据信息以及系统配置信息之后,获取异常知识信息;
确定单元,用于在所述发出与所述异常根因信息相匹配的预警信息之后,在所述异常知识信息中确定与所述异常根因信息相匹配的异常解决建议信息;
输出单元,用于输出所述异常解决建议信息,以使按照所述异常解决建议信息解决所述异常事件。
8.根据权利要求6所述的系统,其特征在于,还包括:
预测单元,用于在所述获取目标系统的异常数据信息以及系统配置信息之后,根据所述异常数据信息以及所述系统配置信息对故障事件进行预测,获得预测结果;
所述输出单元,还用于输出所述预测结果,以使按照所述预测结果执行所述故障事件相匹配的故障规避操作。
9.一种计算机可读的存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至5任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至5任一项中所述的方法。
CN202110081846.2A 2021-01-21 2021-01-21 异常监控方法、系统、存储介质及电子装置 Pending CN112817814A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110081846.2A CN112817814A (zh) 2021-01-21 2021-01-21 异常监控方法、系统、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110081846.2A CN112817814A (zh) 2021-01-21 2021-01-21 异常监控方法、系统、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN112817814A true CN112817814A (zh) 2021-05-18

Family

ID=75858516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110081846.2A Pending CN112817814A (zh) 2021-01-21 2021-01-21 异常监控方法、系统、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN112817814A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343063A (zh) * 2021-05-24 2021-09-03 泛测(北京)环境科技有限公司 一种异常事件智能识别方法及系统
CN114020352A (zh) * 2021-10-27 2022-02-08 郑州云海信息技术有限公司 一种云平台配置方法、装置、设备以及存储介质
CN116594364A (zh) * 2023-06-13 2023-08-15 宁夏迎福食品科技有限公司 基于预制菜生产控制系统的优化方法及系统
CN116823452A (zh) * 2023-08-30 2023-09-29 北京中关村科金技术有限公司 基于人工智能的异常事件识别方法、装置及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8903411B1 (en) * 2010-07-02 2014-12-02 Sprint Communications Company L.P. Applying call events in association with user devices based on priority levels
CN106936620A (zh) * 2015-12-31 2017-07-07 北京神州泰岳软件股份有限公司 一种告警事件的处理方法和处理装置
CN107122239A (zh) * 2017-04-28 2017-09-01 武汉票据交易中心有限公司 一种多线程事件分发方法和系统
EP3312725A2 (en) * 2016-10-21 2018-04-25 Accenture Global Solutions Limited Application monitoring and failure prediction
CN109784575A (zh) * 2019-01-24 2019-05-21 新奥数能科技有限公司 设备状态的预测方法及装置、存储介质、电子装置
CN110069401A (zh) * 2019-03-18 2019-07-30 平安科技(深圳)有限公司 基于数据建模的系统测试异常定位方法及系统
CN111694719A (zh) * 2020-06-10 2020-09-22 腾讯科技(深圳)有限公司 服务器故障处理方法、装置、存储介质及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8903411B1 (en) * 2010-07-02 2014-12-02 Sprint Communications Company L.P. Applying call events in association with user devices based on priority levels
CN106936620A (zh) * 2015-12-31 2017-07-07 北京神州泰岳软件股份有限公司 一种告警事件的处理方法和处理装置
EP3312725A2 (en) * 2016-10-21 2018-04-25 Accenture Global Solutions Limited Application monitoring and failure prediction
CN107122239A (zh) * 2017-04-28 2017-09-01 武汉票据交易中心有限公司 一种多线程事件分发方法和系统
CN109784575A (zh) * 2019-01-24 2019-05-21 新奥数能科技有限公司 设备状态的预测方法及装置、存储介质、电子装置
CN110069401A (zh) * 2019-03-18 2019-07-30 平安科技(深圳)有限公司 基于数据建模的系统测试异常定位方法及系统
CN111694719A (zh) * 2020-06-10 2020-09-22 腾讯科技(深圳)有限公司 服务器故障处理方法、装置、存储介质及电子设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343063A (zh) * 2021-05-24 2021-09-03 泛测(北京)环境科技有限公司 一种异常事件智能识别方法及系统
CN114020352A (zh) * 2021-10-27 2022-02-08 郑州云海信息技术有限公司 一种云平台配置方法、装置、设备以及存储介质
CN114020352B (zh) * 2021-10-27 2023-09-15 郑州云海信息技术有限公司 一种云平台配置方法、装置、设备以及存储介质
CN116594364A (zh) * 2023-06-13 2023-08-15 宁夏迎福食品科技有限公司 基于预制菜生产控制系统的优化方法及系统
CN116594364B (zh) * 2023-06-13 2024-06-14 浙江齐呈数字科技集团有限公司 基于预制菜生产控制系统的优化方法及系统
CN116823452A (zh) * 2023-08-30 2023-09-29 北京中关村科金技术有限公司 基于人工智能的异常事件识别方法、装置及设备
CN116823452B (zh) * 2023-08-30 2023-12-05 北京中关村科金技术有限公司 基于人工智能的异常事件识别方法、装置及设备

Similar Documents

Publication Publication Date Title
CN112817814A (zh) 异常监控方法、系统、存储介质及电子装置
CN108445410B (zh) 一种监测蓄电池组运行状态的方法及装置
CN110221145B (zh) 电力设备故障诊断方法、装置及终端设备
CN112491611B (zh) 故障定位系统、方法、装置、电子设备和计算机可读介质
CN106201757B (zh) 一种异常处理方法和装置
CN109992484B (zh) 一种网络告警相关性分析方法、装置和介质
CN111290913A (zh) 一种基于运维数据预测的故障定位可视化系统和方法
CN112214577B (zh) 目标用户的确定方法、装置、设备及计算机存储介质
CN111400189A (zh) 代码覆盖率监测方法、装置、电子设备及存储介质
CN113313280A (zh) 云平台的巡检方法、电子设备及非易失性存储介质
CN116074215B (zh) 网络质量检测方法、装置、设备及存储介质
CN117220957A (zh) 一种基于威胁情报的攻击行为响应方法及系统
CN107871055B (zh) 一种数据分析方法和装置
JP2019159431A (ja) 評価プログラム、評価方法および評価装置
CN116010456A (zh) 设备的处理方法、服务器和轨道交通系统
CN113282920B (zh) 日志异常检测方法、装置、计算机设备和存储介质
CN104461847B (zh) 数据处理程序检测方法及装置
CN116204386B (zh) 应用服务关系自动识别及监控方法、系统、介质和设备
CN112816933A (zh) 一种电能表终端的维护诊断方法和系统
CN111784865A (zh) 加氢站巡检数据处理方法及加氢站巡检装置
CN117395176A (zh) 一种网络故障识别方法、装置、设备及存储介质
CN115545452A (zh) 运维方法、运维系统、设备及存储介质
CN113240140A (zh) 物理设备的故障检测方法、装置、设备及存储介质
CN114236329A (zh) 高压电缆的运行状态的检测方法及装置
CN114021759A (zh) 基于aiot和mr技术在数字工厂设备管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210518