CN115827038A - 应用于数据中心的运维管控方法及系统 - Google Patents
应用于数据中心的运维管控方法及系统 Download PDFInfo
- Publication number
- CN115827038A CN115827038A CN202211543582.9A CN202211543582A CN115827038A CN 115827038 A CN115827038 A CN 115827038A CN 202211543582 A CN202211543582 A CN 202211543582A CN 115827038 A CN115827038 A CN 115827038A
- Authority
- CN
- China
- Prior art keywords
- maintenance
- fault
- data center
- information
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 296
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000008439 repair process Effects 0.000 claims abstract description 76
- 238000012544 monitoring process Methods 0.000 claims abstract description 24
- 238000011161 development Methods 0.000 claims description 8
- 238000013475 authorization Methods 0.000 claims description 3
- 238000010191 image analysis Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 16
- 238000007726 management method Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明适用于数据中心运维技术领域,提供了应用于数据中心的运维管控方法及系统,包括以下步骤:接收数据中心故障信息,数据中心故障信息包括数据设备信息和故障代码;根据数据中心故障信息确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维;当不存在时,将数据中心故障信息发送给人工运维中心;对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,使得所述数据设备开启运维操作录制功能;此外,本发明还会对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,说明运维人员在进行不正当操作,生成警告信息,实现对运维人员的监控。
Description
技术领域
本发明涉及数据中心运维技术领域,具体是涉及一种应用于数据中心的运维管控方法及系统。
背景技术
随着电子信息行业的快速发展,各种软件应用系统背后是不计其数的服务器、网络设备以及数据存储设备在做支撑,通信网络的规模逐渐扩大,通信网络设备也不断增加,数据中心的运维管控工作也更加繁杂,当数据中心发生异常时,往往需要工程师前往数据中心进行处理。整个运维操作由工程师主导,即人为主观因素很强,可能会在运维过程中发生泄密,缺少对工程师运维工作的监控。因此,需要提供一种应用于数据中心的运维管控方法及系统,旨在解决上述问题。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种应用于数据中心的运维管控方法及系统,以解决上述背景技术中存在的问题。
本发明是这样实现的,一种应用于数据中心的运维管控方法,所述方法包括以下步骤:
接收数据中心故障信息,所述数据中心故障信息包括数据设备信息和故障代码;
根据数据中心故障信息确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维;当不存在时,执行下一步骤;
将数据中心故障信息发送给人工运维中心;
对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,使得所述数据设备开启运维操作录制功能,获取运维操作信息;
对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,生成警告信息。
作为本发明进一步的方案:所述根据数据中心故障信息确定是否存在故障自动修复程序的步骤,具体包括:
将数据中心故障信息输入至修复程序库中进行匹配,所述修复程序库包括所有的数据设备信息,每个数据设备信息对应若干个故障代码,每个故障代码对应有故障自动修复程序;
当数据中心故障信息中的故障代码与修复程序库中的故障代码匹配成功时,则判定存在故障自动修复程序;否则判定不存在故障自动修复程序。
作为本发明进一步的方案:所述将数据中心故障信息发送给人工运维中心的步骤,具体包括:
将数据中心故障信息发送给人工运维中心;
根据数据中心故障信息中的故障代码将运维任务派发给运维人员终端;
将对应的运维人员身份信息发送给数据中心室的门禁系统,使得该运维人员能够进入数据中心室。
作为本发明进一步的方案:所述对运维人员的行为进行检测的步骤,具体包括:
对数据中心室的监控图像进行分析,当检测到运维人员在某个区域的停留时间超过设定时长;
确定所述区域与需要运维的数据设备之间的距离值,当所述距离值大于设定距离时,判定运维人员正在操作不需要运维的数据设备。
作为本发明进一步的方案:所述方法还包括:
对所有录制的运维操作信息进行分组,得到若干个运维操作组,每个运维操作组中任意两个运维操作信息中的相似度均大于设定相似值;
对每个运维操作组中运维操作信息的数量进行判定,当运维操作信息的数量大于设定数量值时,将所述运维操作组标记为修复程序开发组;
将修复程序开发组发送至程序开发中心。
本发明的另一目的在于提供一种应用于数据中心的运维管控系统,所述系统包括:
故障信息接收模块,用于接收数据中心故障信息,所述数据中心故障信息包括数据设备信息和故障代码;
程序自动运维模块,用于根据数据中心故障信息确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维;当不存在时,执行故障信息发送模块中的步骤;
故障信息发送模块,用于将数据中心故障信息发送给人工运维中心;
运维操作录制模块,用于对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,使得所述数据设备开启运维操作录制功能,获取运维操作信息;
运维行为监测模块,用于对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,生成警告信息。
作为本发明进一步的方案:所述程序自动运维模块包括:
修复程序匹配单元,用于将数据中心故障信息输入至修复程序库中进行匹配,所述修复程序库包括所有的数据设备信息,每个数据设备信息对应若干个故障代码,每个故障代码对应有故障自动修复程序;
修复程序判定单元,当数据中心故障信息中的故障代码与修复程序库中的故障代码匹配成功时,则判定存在故障自动修复程序;否则判定不存在故障自动修复程序。
作为本发明进一步的方案:所述故障信息发送模块包括:
故障信息发送单元,用于将数据中心故障信息发送给人工运维中心;
运维任务派发单元,用于根据数据中心故障信息中的故障代码将运维任务派发给运维人员终端;
门禁系统授权单元,用于将对应的运维人员身份信息发送给数据中心室的门禁系统,使得该运维人员能够进入数据中心室。
作为本发明进一步的方案:所述运维行为监测模块包括:
监控图像分析单元,用于对数据中心室的监控图像进行分析,当检测到运维人员在某个区域的停留时间超过设定时长;
距离值判定单元,用于确定所述区域与需要运维的数据设备之间的距离值,当所述距离值大于设定距离时,判定运维人员正在操作不需要运维的数据设备。
作为本发明进一步的方案:所述系统还包括运维操作开发模块,运维操作开发模块具体包括:
运维操作分组单元,用于对所有录制的运维操作信息进行分组,得到若干个运维操作组,每个运维操作组中任意两个运维操作信息中的相似度均大于设定相似值;
修复程序开发组单元,用于对每个运维操作组中运维操作信息的数量进行判定,当运维操作信息的数量大于设定数量值时,将所述运维操作组标记为修复程序开发组;
程序开发组发送单元,用于将修复程序开发组发送至程序开发中心。
与现有技术相比,本发明的有益效果是:
本发明会对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,使得所述数据设备开启运维操作录制功能,获取运维操作信息,方便进行追溯;此外,本发明还会对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,说明运维人员在进行不正当操作,生成警告信息,实现对运维人员的监控。
附图说明
图1为一种应用于数据中心的运维管控方法的流程图。
图2为一种应用于数据中心的运维管控方法中根据数据中心故障信息确定是否存在故障自动修复程序的流程图。
图3为一种应用于数据中心的运维管控方法中将数据中心故障信息发送给人工运维中心的流程图。
图4为一种应用于数据中心的运维管控方法中对运维人员的行为进行检测的流程图。
图5为一种应用于数据中心的运维管控方法中对所有录制的运维操作信息进行分组的流程图。
图6为一种应用于数据中心的运维管控系统的结构示意图。
图7为一种应用于数据中心的运维管控系统中程序自动运维模块的结构示意图。
图8为一种应用于数据中心的运维管控系统中故障信息发送模块的结构示意图。
图9为一种应用于数据中心的运维管控系统中运维行为监测模块的结构示意图。
图10为一种应用于数据中心的运维管控系统中运维操作开发模块的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清晰,以下结合附图及具体实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,本发明实施例提供了一种应用于数据中心的运维管控方法,所述方法包括以下步骤:
S100,接收数据中心故障信息,所述数据中心故障信息包括数据设备信息和故障代码;
S200,根据数据中心故障信息确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维;当不存在时,执行下一步骤;
S300,将数据中心故障信息发送给人工运维中心;
S400,对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,使得所述数据设备开启运维操作录制功能,获取运维操作信息;
S500,对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,生成警告信息。
需要说明的是,当数据中心发生异常时,往往需要工程师前往数据中心进行处理。整个运维操作由工程师主导,即人为主观因素很强,可能会在运维过程中发生泄密,缺少对工程师运维工作的监控。本发明实施例旨在解决上述问题。
本发明实施例中,当出现数据中心故障信息时,会根据数据中心故障信息的具体内容确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维,容易理解,一些简单的常见的故障问题可以通过事先设定的修复程序进行自动修复,以增加运维管控的效率,并降低人工成本;当不存在对应的故障自动修复程序时,本发明实施例会将数据中心故障信息发送给人工运维中心,人工运维中心会安排运维人员前往数据中心进行处理,本发明实施例还会通过监控设备对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,例如,进入数据中心室时会进行人脸识别,就可以确定运维人员身份信息,结合人工运维中心安排给该运维人员的运维任务,进一步确定需要运维的数据设备,会对需要运维的数据设备进行远程控制,使得所述数据设备开启运维操作录制功能,获取运维操作信息,对运维操作信息进行存储,方便进行追溯;此外,本发明实施例还会对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,说明运维人员在进行不正当操作,生成警告信息,实现对运维人员的监控。
如图2所示,作为本发明一个优选的实施例,所述根据数据中心故障信息确定是否存在故障自动修复程序的步骤,具体包括:
S201,将数据中心故障信息输入至修复程序库中进行匹配,所述修复程序库包括所有的数据设备信息,每个数据设备信息对应若干个故障代码,每个故障代码对应有故障自动修复程序;
S202,当数据中心故障信息中的故障代码与修复程序库中的故障代码匹配成功时,则判定存在故障自动修复程序;否则判定不存在故障自动修复程序。
本发明实施例中,事先建立有修复程序库,所述修复程序库包括所有的数据设备信息,每个数据设备信息对应若干个故障代码,每个故障代码对应有故障自动修复程序,将数据中心故障信息输入至修复程序库中进行匹配,当数据中心故障信息中的数据设备信息和故障代码与修复程序库中的数据设备信息和故障代码出现一致时,视为匹配成功,判定存在故障自动修复程序,直接调用所述故障自动修复程序进行自动运维即可。
如图3所示,作为本发明一个优选的实施例,所述将数据中心故障信息发送给人工运维中心的步骤,具体包括:
S301,将数据中心故障信息发送给人工运维中心;
S302,根据数据中心故障信息中的故障代码将运维任务派发给运维人员终端;
S303,将对应的运维人员身份信息发送给数据中心室的门禁系统,使得该运维人员能够进入数据中心室。
本发明实施例中,将数据中心故障信息发送给人工运维中心后,人工运维中心会根据数据中心故障信息中的故障代码将运维任务派发给对应的运维人员终端,容易理解,基本上不同的运维人员擅长解决的故障代码不同,还需要将对应的运维人员身份信息发送给数据中心室的门禁系统,这样门禁系统就会授予该运维人员临时的权限,该运维人员也就能够进入数据中心室进行运维工作了。也就是说,在本发明实施例中,即使是专门的运维人员,也不能够随意进入数据中心室,进一步保证了数据中心室的安全。
如图4所示,作为本发明一个优选的实施例,所述对运维人员的行为进行检测的步骤,具体包括:
S501,对数据中心室的监控图像进行分析,当检测到运维人员在某个区域的停留时间超过设定时长;
S502,确定所述区域与需要运维的数据设备之间的距离值,当所述距离值大于设定距离时,判定运维人员正在操作不需要运维的数据设备。
本发明实施例中,每个运维任务都会包含数据设备信息,如此,运维人员直接前往对应的数据设备进行运维工作即可,如果检测到运维人员在某个区域的停留时间超过设定时长,所述设定时长为提前设定的定值,说明运维人员在该区域进行了某种活动,紧接着会确定所述区域与需要运维的数据设备之间的距离值,当所述距离值大于设定距离时,所述设定距离为提前设定的定值,说明所述某种活动并不是对需要运维的数据设备进行运维工作,运维人员很可能在进行非正常的工作,生成警告信息。
如图5所示,作为本发明一个优选的实施例,所述方法还包括:
S601,对所有录制的运维操作信息进行分组,得到若干个运维操作组,每个运维操作组中任意两个运维操作信息中的相似度均大于设定相似值;
S602,对每个运维操作组中运维操作信息的数量进行判定,当运维操作信息的数量大于设定数量值时,将所述运维操作组标记为修复程序开发组;
S603,将修复程序开发组发送至程序开发中心。
本发明实施例中,会对运维人员的运维操作信息进行进一步的处理,具体的,对所有录制的运维操作信息进行分组,得到若干个运维操作组,每个运维操作组中任意两个运维操作信息中的相似度均大于设定相似值,所述设定相似值为提前设定的定值,如此,每个运维操作组中的所有运维操作信息实质是相同的,接着对每个运维操作组中运维操作信息的数量进行判定,当运维操作信息的数量大于设定数量值时,说明该类运维操作信息会被高频使用,值得被开发成故障自动修复程序,则将所述运维操作组标记为修复程序开发组,最后将所有的修复程序开发组发送至程序开发中心,工程师会进行程序的开发,如此修复程序库会被不断更新和完善。
如图6所示,本发明实施例还提供了一种应用于数据中心的运维管控系统,所述系统包括:
故障信息接收模块100,用于接收数据中心故障信息,所述数据中心故障信息包括数据设备信息和故障代码;
程序自动运维模块200,用于根据数据中心故障信息确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维;当不存在时,执行故障信息发送模块300中的步骤;
故障信息发送模块300,用于将数据中心故障信息发送给人工运维中心;
运维操作录制模块400,用于对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,使得所述数据设备开启运维操作录制功能,获取运维操作信息;
运维行为监测模块500,用于对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,生成警告信息。
本发明实施例中,当出现数据中心故障信息时,会根据数据中心故障信息的具体内容确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维,容易理解,一些简单的常见的故障问题可以通过事先设定的修复程序进行自动修复,以增加运维管控的效率,并降低人工成本;当不存在对应的故障自动修复程序时,本发明实施例会将数据中心故障信息发送给人工运维中心,人工运维中心会安排运维人员前往数据中心进行处理,本发明实施例还会通过监控设备对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,例如,进入数据中心室时会进行人脸识别,就可以确定运维人员身份信息,结合人工运维中心安排给该运维人员的运维任务,进一步确定需要运维的数据设备,会对需要运维的数据设备进行远程控制,使得所述数据设备开启运维操作录制功能,获取运维操作信息,对运维操作信息进行存储,方便进行追溯;此外,本发明实施例还会对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,说明运维人员在进行不正当操作,生成警告信息,实现对运维人员的监控。
如图7所示,作为本发明一个优选的实施例,所述程序自动运维模块200包括:
修复程序匹配单元201,用于将数据中心故障信息输入至修复程序库中进行匹配,所述修复程序库包括所有的数据设备信息,每个数据设备信息对应若干个故障代码,每个故障代码对应有故障自动修复程序;
修复程序判定单元202,当数据中心故障信息中的故障代码与修复程序库中的故障代码匹配成功时,则判定存在故障自动修复程序;否则判定不存在故障自动修复程序。
如图8所示,作为本发明一个优选的实施例,所述故障信息发送模块300包括:
故障信息发送单元301,用于将数据中心故障信息发送给人工运维中心;
运维任务派发单元302,用于根据数据中心故障信息中的故障代码将运维任务派发给运维人员终端;
门禁系统授权单元303,用于将对应的运维人员身份信息发送给数据中心室的门禁系统,使得该运维人员能够进入数据中心室。
如图9所示,作为本发明一个优选的实施例,所述运维行为监测模块500包括:
监控图像分析单元501,用于对数据中心室的监控图像进行分析,当检测到运维人员在某个区域的停留时间超过设定时长;
距离值判定单元502,用于确定所述区域与需要运维的数据设备之间的距离值,当所述距离值大于设定距离时,判定运维人员正在操作不需要运维的数据设备。
如图10所示,作为本发明一个优选的实施例,所述系统还包括运维操作开发模块600,运维操作开发模块600具体包括:
运维操作分组单元601,用于对所有录制的运维操作信息进行分组,得到若干个运维操作组,每个运维操作组中任意两个运维操作信息中的相似度均大于设定相似值;
修复程序开发组单元602,用于对每个运维操作组中运维操作信息的数量进行判定,当运维操作信息的数量大于设定数量值时,将所述运维操作组标记为修复程序开发组;
程序开发组发送单元603,用于将修复程序开发组发送至程序开发中心。
以上仅对本发明的较佳实施例进行了详细叙述,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实施例处的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
Claims (10)
1.应用于数据中心的运维管控方法,其特征在于,所述方法包括以下步骤:
接收数据中心故障信息,所述数据中心故障信息包括数据设备信息和故障代码;
根据数据中心故障信息确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维;当不存在时,执行下一步骤;
将数据中心故障信息发送给人工运维中心;
对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,使得所述数据设备开启运维操作录制功能,获取运维操作信息;
对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,生成警告信息。
2.根据权利要求1所述的应用于数据中心的运维管控方法,其特征在于,所述根据数据中心故障信息确定是否存在故障自动修复程序的步骤,具体包括:
将数据中心故障信息输入至修复程序库中进行匹配,所述修复程序库包括所有的数据设备信息,每个数据设备信息对应若干个故障代码,每个故障代码对应有故障自动修复程序;
当数据中心故障信息中的故障代码与修复程序库中的故障代码匹配成功时,则判定存在故障自动修复程序;否则判定不存在故障自动修复程序。
3.根据权利要求1所述的应用于数据中心的运维管控方法,其特征在于,所述将数据中心故障信息发送给人工运维中心的步骤,具体包括:
将数据中心故障信息发送给人工运维中心;
根据数据中心故障信息中的故障代码将运维任务派发给运维人员终端;
将对应的运维人员身份信息发送给数据中心室的门禁系统,使得该运维人员能够进入数据中心室。
4.根据权利要求1所述的应用于数据中心的运维管控方法,其特征在于,所述对运维人员的行为进行检测的步骤,具体包括:
对数据中心室的监控图像进行分析,当检测到运维人员在某个区域的停留时间超过设定时长;
确定所述区域与需要运维的数据设备之间的距离值,当所述距离值大于设定距离时,判定运维人员正在操作不需要运维的数据设备。
5.根据权利要求1所述的应用于数据中心的运维管控方法,其特征在于,所述方法还包括:
对所有录制的运维操作信息进行分组,得到若干个运维操作组,每个运维操作组中任意两个运维操作信息中的相似度均大于设定相似值;
对每个运维操作组中运维操作信息的数量进行判定,当运维操作信息的数量大于设定数量值时,将所述运维操作组标记为修复程序开发组;
将修复程序开发组发送至程序开发中心。
6.应用于数据中心的运维管控系统,其特征在于,所述系统包括:
故障信息接收模块,用于接收数据中心故障信息,所述数据中心故障信息包括数据设备信息和故障代码;
程序自动运维模块,用于根据数据中心故障信息确定是否存在故障自动修复程序,当存在时,使用故障自动修复程序进行自动运维;当不存在时,执行故障信息发送模块中的步骤;
故障信息发送模块,用于将数据中心故障信息发送给人工运维中心;
运维操作录制模块,用于对数据中心室进行实时监控,当检测到有运维人员进入数据中心室时,确定运维人员身份信息和需要运维的数据设备,使得所述数据设备开启运维操作录制功能,获取运维操作信息;
运维行为监测模块,用于对运维人员的行为进行检测,当检测到运维人员操作不需要运维的数据设备时,生成警告信息。
7.根据权利要求6所述的应用于数据中心的运维管控系统,其特征在于,所述程序自动运维模块包括:
修复程序匹配单元,用于将数据中心故障信息输入至修复程序库中进行匹配,所述修复程序库包括所有的数据设备信息,每个数据设备信息对应若干个故障代码,每个故障代码对应有故障自动修复程序;
修复程序判定单元,当数据中心故障信息中的故障代码与修复程序库中的故障代码匹配成功时,则判定存在故障自动修复程序;否则判定不存在故障自动修复程序。
8.根据权利要求6所述的应用于数据中心的运维管控系统,其特征在于,所述故障信息发送模块包括:
故障信息发送单元,用于将数据中心故障信息发送给人工运维中心;
运维任务派发单元,用于根据数据中心故障信息中的故障代码将运维任务派发给运维人员终端;
门禁系统授权单元,用于将对应的运维人员身份信息发送给数据中心室的门禁系统,使得该运维人员能够进入数据中心室。
9.根据权利要求6所述的应用于数据中心的运维管控系统,其特征在于,所述运维行为监测模块包括:
监控图像分析单元,用于对数据中心室的监控图像进行分析,当检测到运维人员在某个区域的停留时间超过设定时长;
距离值判定单元,用于确定所述区域与需要运维的数据设备之间的距离值,当所述距离值大于设定距离时,判定运维人员正在操作不需要运维的数据设备。
10.根据权利要求6所述的应用于数据中心的运维管控系统,其特征在于,所述系统还包括运维操作开发模块,运维操作开发模块具体包括:
运维操作分组单元,用于对所有录制的运维操作信息进行分组,得到若干个运维操作组,每个运维操作组中任意两个运维操作信息中的相似度均大于设定相似值;
修复程序开发组单元,用于对每个运维操作组中运维操作信息的数量进行判定,当运维操作信息的数量大于设定数量值时,将所述运维操作组标记为修复程序开发组;
程序开发组发送单元,用于将修复程序开发组发送至程序开发中心。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211543582.9A CN115827038A (zh) | 2022-12-03 | 2022-12-03 | 应用于数据中心的运维管控方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211543582.9A CN115827038A (zh) | 2022-12-03 | 2022-12-03 | 应用于数据中心的运维管控方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115827038A true CN115827038A (zh) | 2023-03-21 |
Family
ID=85543897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211543582.9A Withdrawn CN115827038A (zh) | 2022-12-03 | 2022-12-03 | 应用于数据中心的运维管控方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115827038A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116743603A (zh) * | 2023-08-16 | 2023-09-12 | 广州海晟科技有限公司 | 一种私有云平台信息系统安全运维方法和系统 |
-
2022
- 2022-12-03 CN CN202211543582.9A patent/CN115827038A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116743603A (zh) * | 2023-08-16 | 2023-09-12 | 广州海晟科技有限公司 | 一种私有云平台信息系统安全运维方法和系统 |
CN116743603B (zh) * | 2023-08-16 | 2023-10-20 | 广州海晟科技有限公司 | 一种私有云平台信息系统安全运维方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109669844B (zh) | 设备故障处理方法、装置、设备和存储介质 | |
CN109656205B (zh) | 不良品的管控方法和装置、电子设备、可读存储介质 | |
CN110378273B (zh) | 一种监测作业流程的方法和装置 | |
CN113533887B (zh) | 一种配电终端智能调试方法及系统 | |
CN115827038A (zh) | 应用于数据中心的运维管控方法及系统 | |
CN109059198A (zh) | 设备自动工程调试方法、装置、系统和计算机设备 | |
CN115776438B (zh) | 一种工控数据传输方法及系统 | |
CN113886262A (zh) | 软件自动化测试方法、装置、计算机设备和存储介质 | |
CN111177488B (zh) | 计量设备检修处理方法、装置、计算机设备和存储介质 | |
CN113821242A (zh) | 一种固件智能匹配方法及系统 | |
CN113206823A (zh) | 工业信息安全监测方法、装置、计算机设备和存储介质 | |
CN115953880B (zh) | 一种柠檬酸生产用的监控预警系统及方法 | |
CN103825758A (zh) | 一种用于电力通信网运维监控系统的故障处理方法 | |
CN113778552B (zh) | 监控参数修改方法、装置、计算机设备 | |
CN117979254B (zh) | 一种气体探测器的物联网入网方法和系统 | |
CN110806729B (zh) | 生产线的开关机及供断电控制方法和系统 | |
CN111141981B (zh) | 线损点检方法、装置、计算机设备和存储介质 | |
CN114358627A (zh) | 一种电力运维管理系统及其运维方法 | |
CN114139853A (zh) | 一种基于大数据的钢结构产品清单处理方法和装置 | |
CN114219434A (zh) | 建设工程智慧监管系统 | |
CN112737120A (zh) | 区域电网控制报告的生成方法、装置和计算机设备 | |
CN116743603B (zh) | 一种私有云平台信息系统安全运维方法和系统 | |
CN116825140B (zh) | 一种用于操作票中规范动作流程的语音交互方法及系统 | |
CN113157532B (zh) | 一种基于终端联动的仪器故障告警方法和装置 | |
CN118331798A (zh) | 一种计算机故障检测、报警系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230321 |