具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
下面对本申请实施例中的术语解释如下:
知识图谱(Knowledge Graph):在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
参照图1所示,根据本申请实施例提出的应用于运维平台的运维方法,方法包括:
步骤S110、获取至少一个被监控设备的运维数据。
需说明的是,运维数据包括通过埋点方式获取得到的通信埋点数据以及采用摄像方式获取的设备数据。运维数据表示能用于运维分析且与被监控设备相关的运行过程的数据。
需说明的是,运维数据可以直接向被监控设备主动查询或者是被监控设备主送发送的,也可以是通过边缘服务器进行采集。对此,在该步骤S110中不做限制。本领域技术人员可以根据实际的需求进行设置。
步骤S120、根据运维数据,确定第一知识图谱和第二知识图谱;其中,第一知识图谱用于表征基础运维数据的图谱信息;第二知识图谱用于表征关键资产的图谱信息。
需说明的是,运维数据可以用于建立第一知识图谱和第二知识图谱,也可以用于增量更新已创建的第一知识图谱和第二知识图谱。
需说明的是,基础运维数据表示满足被监控设备的一般生产需求的运行过程的数据(如保养需求和检修情况等)和异常数据,第一知识图谱能用于初级或者高级工程师的培养和一般设备的维护。关键资产可以表示为重点设备或者是重点设备中与核心生产需求关联的生产部件。当关键资产为重点设备中与核心生产需求关联的生产部件,在基础运维数据中也包含该重点设备的一般生产需求的运行过程的数据和异常数据。
通过设置第一知识图谱和第二知识图谱,可以满足在运维过程中不同的监控需求,同时可以兼顾运维培养,使得运维风险管控的精度更高。且通过知识图谱的方式展示,可以更加直观了解设备和设备之间的运行情况。
需说明的是,关键资产对应的重点知识数据和基础运维数据,其获取方式以及采集频次均不相同,进而进一步实现对不同设备的精准监控。其中,重点知识数据用于表示关键资产和生产需求相关的运行过程的安全相关的数据和异常数据。
需说明的是,参照图2所示,第一知识图谱是运维数据经实体抽取、关系抽取和属性抽取后得到的知识构建数据进行知识校正得到的。对于第二知识图谱而言,其更新或创建可以基于检测服务对知识构建数据巡检判断是否需要处理,再通过设备监控服务确认是否存在与预设的监控项匹配的运维数据,检测服务参照图2所示,可以采用设备异常检测服务、设备安全性检测服务。监控服务可以采用设备异常监控服务和设备安全性监控服务。
步骤S130、根据第一知识图谱和第二知识图谱,对被监控设备进行运维风险管控。
需说明的是,第一知识图谱和第二知识图谱中均记录了保养需求、检修情况以及异常情况之间的关联,因此,可以基于第一知识图谱和第二知识图谱进行查询,确定存在的风险或者进行安全预知等运维风险管控,使得运维风险管控的精准度更高。
需说明的是,当运维风险管控仅涉及一个知识图谱,则仅需针对其中一个知识图谱进行查询。
因此,本申请的上述实施例,通过根据运维数据确定第一知识图谱和第二知识图谱,使得运维监控管理是基于第一知识图谱和第二知识图谱得到的,由于第一知识图谱和第二知识图谱均记录了与被监控设备之间的关系,因此,可以使得运维的精准度更高。同时,通过用第一知识图谱表征基础运维数据的图谱信息;第二知识图谱表征关键资产的图谱信息,可以对不同类型的被监控设备统一管理且进行更加精细化的运维风险管控,因此,和相关技术相比,本申请实施例能提升对设备的运维风险管控的精准度。
可理解的是,步骤S110、获取至少一个被监控设备的运维数据,包括:获取被监控设备进行通信时产生的通信埋点数据;获取被监控设备进行生产控制的图像数据。
需说明的是,通信埋点数据是监控和通信相关的数据,如数据传输容量、数据完整性、数据安全性以及数据隔离等。在一些实施例中,被监控设备存在和非生产设备之间的通信,此时需要监控通信接口的性能、带宽等数据传输容量相关的监控。在另一些实施例,被监控设备存在生产数据的传输,需要检查生产数据是否数据格式正确,是否有加密等数据安全性相关的监控。在另一些实施例中,数据传输时,存在数据量传输较大,可以增加对监控数据完整性的监控。在另一些实施例中,如金融等,需要与个人通信业务进行隔离,因此,增加与数据隔离相关的监控。
需说明的是,图像数据是通过摄像等方式监控被监控设备的设备姿态数据,以上下料为例,图像数据包括检测设备到位和设备装料的视频或照片。
可理解的是,通信埋点数据包括设备接口埋点日志、数据拦截埋点日志、网络埋点日志和隔离埋点日志中的至少一个,步骤S110、获取被监控设备进行通信时产生的通信埋点数据,包括如下至少之一:
获取被监控设备的设备接口埋点日志;
获取被监控设备的数据拦截埋点日志;
获取被监控设备的网络埋点日志;
获取被监控设备的隔离埋点日志。
需说明的是,设备接口埋点日志主要指在生产设备与非生产设备之间的设备接口埋点相关的日志。设备接口埋点可以是网络硬件或软件接口。设备接口埋点日志用于收集与性能、带宽(利用率)、错误和丢弃率有关的数据。
数据拦截埋点日志主要是检查设备数据传输是否正确相关的日志。可以通过抽样检查设备生产的数据,检查数据安全性问题,数据拦截埋点日志用于记录抽检传输的生产数据是否有加密、数据格式是否正确等有关的数据。
网络埋点日志是根据检测被监控设备与互联网之间的数据传输是否完整性如是否有丢包现象、网络带宽是否足够等生成的日志。
隔离埋点日志用于针对接入网(含空口、基带、协议栈等)、传输网和核心网三个层面等定制不同的隔离策略的检测生成的日志。在大型系统中尤其是金融方面的系统,金融行业与其他行业及个人用户通信业务之间,以及金融行业自身不同分区业务之间,存在仅部分应用需要从生产网络隔离区穿透到互联网隔离区,因此,通过设置隔离埋点进行检测生成的隔离埋点日志,能判断是否存在隔离风险。
可理解的是,步骤S110、获取至少一个被监控设备的运维数据,包括:通过预设的第一日志接收微服务解析被监控设备发送的资源请求,得到资源数据,并将资源数据存入预设的数据队列;通过预设的第二日志接收微服务将被监控设备发送的日志数据存入数据队列;根据数据队列确定运维数据。
需说明的是,资源请求为http发送的rest请求,通过解析rest请求的资源连接地址,可以得到资源数据。资源数据为通过链接方式提供的被监控设备的运维数据。参照图2所示,在一些实施例中,第一日志接收微服务包括第三日志接收微服务和第四日志接收微服务;资源请求的解析由第三日志接收微服务处理,资源数据由第四日志接收微服务存入数据队列。
需说明的是,日志数据包括如上设备接口埋点日志、数据拦截埋点日志、网络埋点日志和隔离埋点日志中至少一种,在一些实施例中,也包括图像数据对应的日志。
需说明的是,第二日志接收微服务可以进行kafka日志读取。
需说明的是,通过设置两种日志接收微服务,可以分别处理不同方式采集日志的需求。如在一些实施例中,采用kafka采集基础运维数据,此时通过第二日志接收微服务获取该基础运维数据。采用rest请求采集关键资产的运维数据,可以及时获取关键资产的运维数据,进而及时更新第二知识图谱,使得运维监控的精度更高。对此,本申请实施例对第一日志接收微服务和第二日志接收微服务的用途不做限制。
需说明的是,数据队列中的数据表示能用于第一知识图谱和第二知识图谱的更新或创建。通过读取数据队列中的数据来更新或创建第一知识图谱和第二知识图谱。
可理解的是,步骤S120、根据运维数据,确定第一知识图谱和第二知识图谱,包括:对运维数据分别进行实体抽取、关系抽取和属性抽取,得到实体数据、关系数据和属性数据;根据实体数据、关系数据和属性数据进行知识构建,得到知识构建数据;对知识构建数据进行知识校正,确定第一知识图谱;从知识构建数据中筛选出关键资产对应的重点知识数据,并根据重点知识数据确定第二知识图谱。
需说明的是,重点知识数据用于表示关键资产和生产需求相关的运行过程的安全相关数据和异常数据。
需说明的是,实体抽取、关系抽取和属性抽取为知识图谱中常规的操作,对此,本申请实施例不做赘述。
需说明的是,知识校正是对知识构建数据进行知识补全或知识校验,知识补全可以通过知识推理的方式将知识构建数据中残缺的信息补全,知识校验是对知识错误与冲突进行核查和修正,如通过聚类算法,将置信度小于预设值的实体重新聚类,以更新实体之间的关系,对此,本申请实施例对知识校正的具体内容不做限制。
需说明的是,重点知识数据的筛选可以通过创建设备检测服务进行监控;当设备检测服务检测到数据列队存在更新,通知设备监控服务进一步判断是否存在关键资产的数据,存在,则创建或者更新第二知识图谱。
可理解的是,步骤S130、根据第一知识图谱和第二知识图谱,对被监控设备进行运维风险管控,包括:根据第一知识图谱,得到被监控设备的基础运维数据;根据第二知识图谱,得到被监控设备的异常数据;根据基础运维数据和异常数据,对被监控设备进行风险预测。
可理解的是,根据基础运维数据和异常数据,对被监控设备进行风险预测,包括如下至少之一:
将异常数据与预设的检修告警对应的阈值数据进行匹配,并根据匹配结果判断是否对被监控设备进行检修预警;
根据基础运维数据和异常数据,计算被监控设备的安全风险评分,并根据安全风险评分对被监控设备进行安全风险评估;
将基础运维数据和异常数据进行风险匹配处理,得到安全异常风险概率,并根据安全异常风险概率对被监控设备进行安全异常风险预警。
需说明的是,检修预警表示提前通知用户进行检修。安全风险评估用于评估被监控设备的安全性。安全异常风险预警用于预测被监控设备出现预设的故障的概率,预设的故障可以是一个或者是多个。因此,通过将风险预测细分为检修预警、安全风险评估和安全异常风险预警,可以从多个维度进行风险预测,使得运维风险管控的精度更高。
需说明的是,检修告警为被监控设备会产生的告警,阈值数据表示出现符合该检修告警产生条件对应的运维数据出现的概率或次数。安全风险评分可以基于基础运维数据中同一生产行为正常与异常的比例,计算得到,同理安全异常风险可以根据异常数据中与预设的故障匹配的运维数据出现的频次和正常生产行为的比例计算得到,对此,本申请实施例对安全风险评分、安全异常风险概率的计算方式不做限制。
可理解的是,步骤S130、根据第一知识图谱和第二知识图谱,对被监控设备进行运维风险管控,包括:根据第一知识图谱和第二知识图谱,生成预设的重点设备的质量画像,重点设备为至少一个被监控设备之一。
需说明的是,在一些实施例中,重点设备存在部分的维护以及异常在第一知识图谱中体现,也存在部分的维护以及异常在第二知识图谱中,因此,会同时查询第一知识图谱和第二知识图谱,以得到质量画像。
需说明的是,通过提供重点设备的质量画像,可以更好的跟踪重点设备的历史运维情况,进而做到对设备的精准运维。
需说明的是,在一些实施例中,运维风险管控包括风险预测以及质量画像生成。
可理解的是,步骤S130、根据第一知识图谱和第二知识图谱,对被监控设备进行运维风险管控,包括:根据第一知识图谱和第二知识图谱,得到所述被监控设备的风险预测数据;根据所述风险预测数据和所述质量画像,确定被监控设备的采购策略。
需说明的是,将运维和采购相关联,可以及时补充故障设备的补给,进而减少因采购导致的生产延迟,进一步提升运维管控的精度。
需说明的是,风险预测数据包括预设的检修告警相关的检修预警、安全风险评分以及安全异常风险概率中的至少一项。示例性的,如安全风险评分低于采购对应的风险值,则需要重新购买,如安全异常风险高于采购对应的风险值,则需要重新购买。
可理解的是,当被监控设备包括关键资产,步骤S130、根据第一知识图谱和第二知识图谱,对被监控设备进行运维风险管控,包括:根据所述第一知识图谱和所述第二知识图谱,计算所述被监控设备的使用率以及异常频次;根据所述使用率和所述异常频次,按照预设的排产计算规则计算所述被监控设备的排产数据。
需说明的是,使用率表示预设的时间段内被使用的次数,对于使用率较低的,需要提升其使用率。异常频次表示出故障的次数,对于异常频次较高的,需要降低其使用率或者安排不紧急的产品生产,因此,基于使用率和异常频次,能得到排产数据。需说明的是,排产计算规则定义了每一待生产产品排产规则、被监控设备的使用率和异常频次的权重。如排产计算规则中定义了被监控设备的得分在第一阈值范围内,则生产产品A,在第二阈值范围内则生产产品B,同时排产计算规则中也定义了被监控设备根据使用率和异常频次的权重计算的得分,此时,可以根据上述排产计算规则确定排产数据。在另一些实施例中,根据使用率和异常频次的权重,能确定被监控设备的使用优先级,进而可以根据该使用优先级确定待生产产品的生产排序,得到排产数据。
需说明的是,排产数据用于表示被监控设备的生产产品的生产计划。通过计算排产数据,可以进一步提升被监控设备的生产效率。
需说明的是,运维风险管控包括风险预测、质量画像、采购策略以及排产数据中任意一个或多个。
示例性的,参照图2所示,描述本申请实施例的运维平台的运维方法的内部软件流程示意图:
第三日志接收微服务解析rest请求解析得到资源数据并转发给第四日志接收微服务,第四日志接收微服务和第二日志接收微服务将接收到的各数据放入数据队列,根据数据队列中的数据依次进行实体抽取、关系抽取、属性抽取后进行知识构建得到知识构建数据,在知识构建后,通过设备异常检测服务、设备异常监控服务、设备安全性检测服务以及设备安全性监控服务从知识构建数据获取与重点设备的关键资产相关的重点知识数据,以更新第二知识图谱。同时,将知识构建数据进行知识校正得到第一知识图谱。使用时,通过检修分析操作终端发起分析请求到搜索引擎,搜索引擎根据分析请求判断是否向第一知识图谱、第二知识图谱进行查询,并得到查询结果反馈给检修分析操作终端。此时,根据查询结果在监控显示页面显示如指定的重点设备的质量画像、检修告警、安全风险评估、异常风险预警等,并相应生成对应的采购策略。
需说明的是,参照图2所示,设备异常检测服务用于按照预设的时间间隔向知识构建数据查询是否存在异常数据;设备异常监控服务用于判断该异常数据是否属于关键资产;设备安全性检测服务用于周期查询知识构建数据中的安全数据;设备安全性监控服务用于查询知识构建数据是否存在关键资产相关的安全数据,进而根据该异常数据和安全数据确定重点知识数据以更新第二知识图谱。
可理解的是,参照图3所示,根据本申请实施例应用于边缘服务器的运维方法,包括:
步骤S210、采集被监控设备的生产数据。
需说明的是,生产数据表示被监控设备在运行过程中生成的监控数据。监控数据包括设备接口埋点、设备数据拦截埋点、设备网络埋点、网络隔离埋点以及视频监控等至少一种对应的数据。
步骤S220、将生产数据进行脱敏和归类汇总处理,得到运维数据。
需说明的是,脱敏是为了去除与用户相关或者敏感的数据,以提升使用的安全性。将生产数据进行归类汇总,可以提升后期进行知识图谱创建的数据处理效率。归类汇总包括同一设备的不同部件或者不同预警进行分类汇总。
步骤S230、将运维数据发送给运维平台,以使运维平台根据运维数据对应的第一知识图谱和第二知识图谱,对被监控设备进行运维风险管控。
可理解的是,参照图4所示,根据本申请实施例提供的一种运维系统,运维系统包括边缘组件100和运维平台200;
边缘组件100包括至少一个边缘服务器110,每一边缘服务器与至少一个被监控设备300对应设置;每一边缘服务器110用于采集被监控设备300的生产数据;将生产数据进行脱敏和归类汇总处理,得到运维数据;将运维数据发送给运维平台200;
运维平台200用于获取至少一个被监控设备300的运维数据;根据运维数据,确定第一知识图谱和第二知识图谱;其中,第一知识图谱用于表征基础运维数据的图谱信息;第二知识图谱用于表征关键资产的图谱信息;根据第一知识图谱和第二知识图谱,对被监控设备300进行运维风险管控。
需说明的是,边缘服务器110设置有多个时,采用分布式架构部署于被监控设备300的附近或生产数据源头的网络边缘侧,以就近提供边缘智能数据采集服务。
可理解的是,边缘组件100还包括多个采集设备120和路由设备130,被监控设备300通过路由设备130寻址确定距离最近的采集设备120,采集设备120采集被监控设备300的生产数据并发送给边缘服务器110。
通过设置路由设备130,可以使得被监控设备300能就近原则向采集设备120提供日志等生产数据。生产数据通过加密的流协议方式,以提升生产数据传输的保密高效。
可理解的是,根据本申请实施例提供的电子设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述应用于运维平台的运维方法或应用于边缘服务器的运维方法。
该电子设备可以为包括平板电脑、车载电脑等任意智能终端。
请参见图5,图5示意了另一实施例的电子设备的硬件结构,电子设备包括:
处理器401,可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请实施例所提供的技术方案;
存储器402,可以采用只读存储器(Read Only Memory,ROM)、静态存储设备、动态存储设备或者随机存取存储器(Random Access Memory,RAM)等形式实现。存储器402可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器402中,并由处理器401来调用执行本申请实施例的运维方法;
输入/输出接口403,用于实现信息输入及输出;
通信接口404,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信;和,
总线405,在设备的各个组件(例如处理器401、存储器402、输入/输出接口403和通信接口404)之间传输信息;
其中处理器401、存储器402、输入/输出接口403和通信接口404通过总线405实现彼此之间在设备内部的通信连接。
可理解的是,根据本申请实施例提供的计算机可读存储介质,存储介质存储有计算机程序,计算机程序被处理器执行时实现上述应用于运维平台的运维方法或应用于边缘服务器的运维方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例的方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上参照附图说明了本申请实施例的优选实施例,并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本申请实施例的权利范围之内。