[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111506480A - 集群中组件的状态检测方法、装置和系统 - Google Patents

集群中组件的状态检测方法、装置和系统 Download PDF

Info

Publication number
CN111506480A
CN111506480A CN202010327466.8A CN202010327466A CN111506480A CN 111506480 A CN111506480 A CN 111506480A CN 202010327466 A CN202010327466 A CN 202010327466A CN 111506480 A CN111506480 A CN 111506480A
Authority
CN
China
Prior art keywords
component
monitored
monitoring tool
cluster
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010327466.8A
Other languages
English (en)
Other versions
CN111506480B (zh
Inventor
杨超
尹淑彬
郑靖博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dameng Database Co Ltd
Original Assignee
Shanghai Dameng Database Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dameng Database Co Ltd filed Critical Shanghai Dameng Database Co Ltd
Priority to CN202010327466.8A priority Critical patent/CN111506480B/zh
Publication of CN111506480A publication Critical patent/CN111506480A/zh
Application granted granted Critical
Publication of CN111506480B publication Critical patent/CN111506480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明实施例公开了一种集群中组件的状态检测方法、装置和系统。所述方法包括:主监控工具获取集群中待监控组件的组件标识;所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,所述从监控工具与所述待监控组件安装于所述集群的同一节点中。本发明实施例通过采用上述技术方案,通过与待监控组件安装于同一节点中的从监控工具检测待监控组件的运行状态,而无需再由待监控组件检测自身的运行状态,能够降低待监控组件的负担,提高待监控组件的运行速度,从而提高待监控组件的响应速度,减少用户的等待时间。

Description

集群中组件的状态检测方法、装置和系统
技术领域
本发明涉及集群监控技术领域,尤其涉及一种集群中组件的状态检测方法、装置和系统。
背景技术
当采用多节点集群提供服务时,需要对多节点集群各节点上安装的组件进行监控。
在对各组件进行监控时,需要获取每个组件的运行状态信息。现有技术在获取每个组件的运行状态信息时,通常需要每个组件收集自身的运行状态信息,并将所收集的运行状态信息发送给多节点集群中的中心组件,从而,监控工具可以从该中心组件中获取到各组件的运行状态信息。
但是,在现有的运行状态信息获取方法中,每个组件除了需要实现多节点集群的相关功能之外,还需要额外实现收集监控工具所需的运行状态信息的功能,增加了各组件的负担,导致各组件在实现自身功能时的运行速度降低,各组件自身功能的实现需要花费较长的时间。
发明内容
有鉴于此,本发明实施例提供一种集群中组件的状态检测方法、装置和系统,以降低多节点集群中各组件的负担,提高各组件在实现自身功能时的运行速度。
第一方面,本发明实施例提供了一种集群中组件的状态检测方法,包括:
主监控工具获取集群中待监控组件的组件标识;
所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,所述从监控工具与所述待监控组件安装于所述集群的同一节点中。
进一步地,主监控工具获取集群中待监控组件的组件标识,包括:主监控工具向集群的中心组件发送标识查询请求;所述中心组件在接收到所述标识查询请求时,获取安装有所述中心组件的中心节点中存储的待监控组件的组件标识,并将所述组件标识发送给所述主监控工具,以使所述主监控工具获取到所述组件标识。
进一步地,所述集群中组件的状态检测方法还包括:集群中的待监控组件在启动后,获取本组件的组件标识,并将所述组件标识发送给中心组件进行存储。
进一步地,所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,包括:所述主监控工具根据所述组件标识确定安装所述待监控组件的待监控节点的IP地址,并基于所述IP地址向所述待监控节点上安装的从监控工具发送状态检测指令,所述状态检测指令中携带有所述组件标识;所述从监控工具根据所述组件标识获取所述待监控组件的运行状态信息,并将所述运行状态信息发送给所述主监控工具,以使所述主监控工具确定所述待监控组件的运行状态。
进一步地,在所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态之后,还包括:所述主监控工具根据所述运行状态对所述待监控组件进行控制。
第二方面,本发明实施例提供了一种集群中组件的状态检测装置,包括:
标识获取模块,用于获取集群中待监控组件的组件标识;
组件控制模块,用于控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,所述从监控工具与所述待监控组件安装于所述集群的同一节点中。
进一步地,所述标识获取模块包括:请求发送单元,用于向集群的中心组件发送标识查询请求;标识获取单元,用于在接收到所述标识查询请求时,获取安装有所述中心组件的中心节点中存储的待监控组件的组件标识,并将所述组件标识发送给主监控工具,以使所述主监控工具获取到所述组件标识。
进一步地,所述集群中组件的状态检测装置还包括:标识发送模块,用于在待监控组件启动后,获取本组件的组件标识,并将所述组件标识发送给中心组件进行存储。
进一步地,所述组件控制模块包括:指令发送单元,用于根据所述组件标识确定安装所述待监控组件的待监控节点的IP地址,并基于所述IP地址向所述待监控节点上安装的从监控工具发送状态检测指令,所述状态检测指令中携带有所述组件标识;信息获取单元,用于根据所述组件标识获取所述待监控组件的运行状态信息,并将所述运行状态信息发送给主监控工具,以使所述主监控工具确定所述待监控组件的运行状态。
进一步地,所述集群中组件的状态检测装置还包括:组件控制模块,用于在所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态之后,根据所述运行状态对所述待监控组件进行控制。
第三方面,本发明实施例还提供了一种集群中组件的状态检测系统,包括监控设备和多节点集群,所述监控设备上安装有主监控工具,所述多节点集群包括至少一个待监控节点,所述待监控节点上安装有至少一个待监控组件,其中,所述监控设备与所述待监控节点相连,用于获取所述待监控组件的组件标识,并控制所述待监控节点基于所述组件标识检测所述待监控组件的运行状态。
在上述检测集群中组件的状态的技术方案中,主监控工具获取集群中待监控组件的组件标识,并控制从监控工具根据该组件标识检测待监控组件的运行状态。本发明实施例通过采用上述技术方案,通过与待监控组件安装于同一节点中的从监控工具检测待监控组件的运行状态,而无需再由待监控组件检测自身的运行状态,能够降低待监控组件的负担,提高待监控组件的运行速度,从而提高待监控组件的响应速度,减少用户的等待时间。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例一提供的一种集群中组件的状态检测方法的流程示意图;
图2为本发明实施例二提供的一种集群中组件的状态检测方法的流程示意图;
图3为本发明实施例二提供的一种集群中组件的状态检测方法的数据流转图;
图4为本发明实施例三提供的一种集群中组件的状态检测装置的结构框图;
图5为本发明实施例四提供的一种集群中组件的状态检测系统的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合
实施例一
本发明实施例一提供一种集群中组件的状态检测方法。该方法可以由集群中组件的状态检测装置执行,该装置可以由软件和/或硬件实现,一般可集成于集群中组件的状态检测系统中。图1是本发明实施例一提供的集群中组件的状态检测方法的流程示意图,如图1所示,所述方法包括:
S110、主监控工具获取集群中待监控组件的组件标识。
在本步骤中,主监控工具可以从集群的中心组件、待监控组件或从监控工具获取待监控组件的组件标识。其中,所述主监控工具具体可以理解为用于对集群中的待监控组件进行监控的程序,其可以安装于监控设备上,该监控设备可以为集群中的一个节点(即集群中的一台设备),也可以为独立于集群存在的其他设备。待监控组件可以理解为集群中需要进行监控的组件,该组件具体可以为集群中各节点上安装的程序,集群的待监控组件可以包括集群中的所有或部分组件,即主监控工具可以监控集群中所有组件的运行状态,也可以仅监控集群中被标记为待监控组件的部分组件的运行状态,具体可以由工作人员进行设置。待监控组件的组件标识具体可以理解为能够唯一确定待监控组件的标识信息,其可以为待监控组件所对应的操作系统的运行进程的进程ID,也可以为待监控组件所提供服务的服务名等,本实施例不对此进行限制。
举例而言,集群中的待监控组件在启动后,可以主动将自身的组件标识发送给集群中的中心组件;中心组件接收并记录待监控组件发送的组件标识,并主动将其发送给主监控工具,或者,主监控工具向中心组件发送标识查询请求,中心组件在接收到主监控工具发送的标识查询请求后,将待监控组件的组件标识发送给主监控工具。或者,待监控组件在启动后,可以获取安装有主监控工具的监控设备的IP地址,并根据该IP地址与监控设备进行通信,主动将自身的组件标识发送给主监控设备。亦或,从监控工具可以周期性的检测本节点上是否有新的待监控组件启动,在检测到本节点上有新的待监控节点启动时,获取该新启动的待监控组件的组件标识,并根据监控设备的IP地址,将该组件标识发送给主监控工具。
S120、所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,所述从监控工具与所述待监控组件安装于所述集群的同一节点中。
在本实施例中,所述从监控工具具体可以理解为用于检测本节点上的待监控组件的运行状态的程序,其可以与主监控工具相对应的辅助工具,也可以为节点上已经安装的一个第三方工具,即在本实施例中,主监控工具不仅可以通过与自身对应的辅助工具检测待监控组件的运行状态,还可以与其他具有监控功能的第三方工具兼容,通过调用节点上已经安装的、具有监控功能的第三方工具检测待监控组件的运行状态。
示例性的,主监控工具可以在需要检测待监控组件的运行状态时,生成携带有本次需要检测其运行状态的待监控组件的组件标识的、用于指示从监控工具检测或周期性检测待监控组件的运行状态的状态检测指令,并将其发送给从监控工具;相应的,从监控工具根据状态检测指令中携带的组件标识确定所安装节点中需求检测其运行状态的待监控组件,检测该待监控组件的运行状态,即获取待监控组件的运行状态信息,并将其发送给主监控工具,由此,主监控工具根据从监控工具发送的运行状态信息即可确定待监控组件的运行状态。其中,所述从监控工具可以安装于集群的每个节点上;所述运行状态信息可以包括待监控组件的性能指标和/或待监控组件的状态信息,所述性能指标可以包括待监控组件所占用的CPU、内存和/或磁盘等,所述状态信息包括待监控组件的启动和关闭。
在本实施例的一个优选实施方式中,在所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态之后,还包括:所述主监控工具根据所述运行状态对所述待监控组件进行控制。具体的,主监控工具在确定待监控组件的运行状态之后,还可以进一步根据待监控组件的运行状态对待监控组件进行控制,如在待监控组件的运行状态为异常状态时,进行报警并关闭待监控组件;又如,判断待监控组件的各项性能指标是否在正常范围之内,并在确定其不在正常范围之内时,对其进行相应的控制,如在其对某一资源(如CPU、内存或磁盘)占用过多且该资源的利用率已经达到最大利用率阈值时,减少待监控组件对相应资源的占用或关闭不重要的待监控组件,或者,在某一待监控组件已处于关闭状态时,解除待监控组件对各上述各类资源的占用,等等,具体可以根据需要进行设置。
本发明实施例一提供的集群中组件的状态检测方法,主监控工具获取集群中待监控组件的组件标识,并控制从监控工具根据该组件标识检测待监控组件的运行状态。本实施例通过采用上述技术方案,通过与待监控组件安装于同一节点中的从监控工具检测待监控组件的运行状态,而无需再由待监控组件检测自身的运行状态,能够降低待监控组件的负担,提高待监控组件的运行速度,从而提高待监控组件的响应速度,减少用户的等待时间。
实施例二
图2为本发明实施例二提供的一种集群逐渐的状态检测方法的流程示意图。本实施例在上述实施例的基础上,将“主监控工具获取集群中待监控组件的组件标识”优化为:主监控工具向集群的中心组件发送标识查询请求;所述中心组件在接收到所述标识查询请求时,获取安装有所述中心组件的中心节点中存储的待监控组件的组件标识,并将所述组件标识发送给所述主监控工具,以使所述主监控工具接收所述组件标识。
进一步地,本实施例提供的集群中组件的状态检测方法还包括:集群中的待监控组件在启动后,获取本组件的组件标识,并将所述组件标识发送给中心组件进行存储。
进一步地,“所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态”可以优化为“所述主监控工具根据所述组件标识确定安装所述待监控组件的待监控节点的IP地址,并基于所述IP地址向所述待监控节点上安装的从监控工具发送状态检测指令,所述状态检测指令中携带有所述组件标识;所述从监控工具根据所述组件标识获取所述待监控组件的运行状态信息,并将所述运行状态信息发送给所述主监控工具,以使所述主监控工具确定所述待监控组件的运行状态”
相应的,如图2所示,本实施例提供的集群中组件的状态检测方法包括:
S210、集群中的待监控组件在启动后,获取本组件的组件标识,并将所述组件标识发送给中心组件进行存储。
在本实施例中,以待监控组件的组件标识为待监控组件所对应的操作系统所运行进程的进程ID为例,集群中的待监控组件在启动后,可以首先根据待监控组件所安装待监控节点中记录的各组件与各进程之间的对应关系,定位到待监控组件对应的进程,并获取该进程的进程ID,作为自身的组件标识;然后,根据待监控组件所安装待监控节点中记录的集群中安装有中心组件的中心节点的IP地址和/或中心组件的标识,与中心节点上的中心组件建立通信连接,并基于该通信连接将自身的组件标识发送给中心组件。从而,中心组件在接收到待监控组件发送的组件标识后,可以将其存储于中心节点中,以供主监控工具获取。
S220、主监控工具向集群的中心组件发送标识查询请求。
S230、所述中心组件在接收到所述标识查询请求时,获取安装有所述中心组件的中心节点中存储的待监控组件的组件标识,并将所述组件标识发送给所述主监控工具,以使所述主监控工具接收所述组件标识。
示例性的,安装有主监控工具的监控设备本地可以存储有集群中的中心节点的IP地址,主监控工具在需要检测待监控组件的运行状态时,生成标识查询请求,根据中心节点的IP地址与中心节点建立通信连接,并将所生成的标识查询请求发送给中心节点;相应的,中心组件在接收到主监控工具发送的标识查询请求后,可以获取中心节点中存储的各待监控组件的组件标识,生成携带有各待监控组件的组件标识的响应信息,并通过其与监控设备之间建立的通信连接将该响应信息发送给主监控工具;从而,主监控工具解析所接收到的响应信息,即可得到集群中的待监控组件的组件标识。其中,所述标识查询请求可用于获取集群中所有待监控组件的组件标识。
S240、所述主监控工具根据所述组件标识确定安装所述待监控组件的待监控节点的IP地址,并基于所述IP地址向所述待监控节点上安装的从监控工具发送状态检测指令,所述状态检测指令中携带有所述组件标识。
S250、所述从监控工具根据所述组件标识获取所述待监控组件的运行状态信息,并将所述运行状态信息发送给所述主监控工具,以使所述主监控工具确定所述待监控组件的运行状态。
示例性的,主监控工具根据待监控组件的组件标识获取安装有待监控组件的待监控节点的IP地址,根据待监控节点的IP地址与待监控节点建立通信连接,生成携带有待监控组件的组件标识的状态检测指令,并通过所建立的通信连接将该状态检测指令发送给待监控节点上安装的从监控工具;相应的,从监控工具在接收到主监控工具发送的状态检测指令后,解析所接收到的状态检测指令,得到待监控组件的组件标识,获取与该组件标识对应的待监控组件的运行状态信息,并通过所建立的通信连接将所获取的运行状态信息发送给主监控工具,从而,主监控工具根据从监控工具发送的运行状态信息确定待监控组件的运行状态。
其中,待监控组件的运行状态信息的获取方法可以根据需要选取,如从监控工具可以首先根据待监控组件的组件标识确定待监控组件在待监控节点的操作系统中所对应进程的进程ID,然后利用待监控节点操作系统的进程监测命令,如linux系统的ps命令,查询待监控组件所对应进程的进程信息,从而得到监控组件的运行状态信息。
以采用集群各节点中所安装的第三方工具作为从监控工具为例,请参考图3(图中仅给出了一个待监控节点上的待监控组件),本实施例所提供的集群中组件的状态检测方法的数据流转过程可以为:待监控组件启动时定位到操作系统对应的进程,将该进程的进程标识作为自身的组件标识发送给中心组件进行存储;主监控工具通过中心组件查询集群中的待监控组件的组件标识,即中心组件在主监控工具进行标识查询时,将中心节点中存储的待监控组件的组件标识发送给主监控工具;主监控工具在需要检测待监控组件的运行状态时,将待监控组件的组件标识发送给第三方工具;相应的,第三方工具在接收到主监控工具发送的组件标识后,获取与所接收到的组件标识对应的待监控组件的运行状态信息,并将其发送给主监控工具。
本发明实施例二提供的集群中组件的状态检测方法,集群中的待监控组件在启动后,获取自身的组件标识,并将其发送给中心组件进行存储;主监控工具向中心组件发送标识查询请求;中心组件在接收到主监控工具发送的标识查询请求时,将所存储的待监控组件的组件标识发送给主监控工具;主监控工具根据待监控组件的组件标识确定安装待监控组件的待监控节点的IP地址,并基于该IP地址向待监控节点上的从监控工具发送携带有待监控组件的组件标识的状态检测指令;待监控设备上的从监控工具根据状态检测指令中携带的组件标识获取待监控组件的运行状态信息,并将该运行状态信息发送给主监控工具。本实施例通过采用上述技术方案,由待监控组件在启动时将其自身的组件标识发送给中心节点,从而主监控工具无需用户输入待监控组件的运行方式和运行参数等信息即可实现对待监控组件的准确定位,能够降低集群中组件状态检测过程中所耗费的人力,进一步提高待监控组件的状态检测速度。
实施例三
本发明实施例三提供一种集群中组件的状态检测装置。该装置可以由软件和/或硬件实现,一般可集成于集群中组件的状态检测系统中,可通过执行集群中组件的状态检测方法检测集群中的组件的运行状态。图4为本发明实施例三提供的集群中组件的状态检测装置的结构框图,如图4所示,所述装置包括标识获取模块301和组件控制模块302,其中,
标识获取模块301,用于获取集群中待监控组件的组件标识;
组件控制模块302,用于控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,所述从监控工具与所述待监控组件安装于所述集群的同一节点中。
本发明实施例三提供的集群中组件的状态检测装置,通过标识获取模块获取集群中待监控组件的组件标识,并通过组件控制模块控制从监控工具根据该组件标识检测待监控组件的运行状态。本实施例通过采用上述技术方案,通过与待监控组件安装于同一节点中的从监控工具检测待监控组件的运行状态,而无需再由待监控组件检测自身的运行状态,能够降低待监控组件的负担,提高待监控组件的运行速度,从而提高待监控组件的响应速度,减少用户的等待时间。
在上述方案中,所述标识获取模块301可以包括:请求发送单元,用于向集群的中心组件发送标识查询请求;标识获取单元,用于在接收到所述标识查询请求时,获取安装有所述中心组件的中心节点中存储的待监控组件的组件标识,并将所述组件标识发送给主监控工具,以使所述主监控工具获取到所述组件标识。
进一步地,所述集群中组件的状态检测装置还可以包括:标识发送模块,用于在待监控组件启动后,获取本组件的组件标识,并将所述组件标识发送给中心组件进行存储。
在上述方案中,所述组件控制模块302可以包括:指令发送单元,用于根据所述组件标识确定安装所述待监控组件的待监控节点的IP地址,并基于所述IP地址向所述待监控节点上安装的从监控工具发送状态检测指令,所述状态检测指令中携带有所述组件标识;信息获取单元,用于根据所述组件标识获取所述待监控组件的运行状态信息,并将所述运行状态信息发送给主监控工具,以使所述主监控工具确定所述待监控组件的运行状态。
进一步地,所述集群中组件的状态检测装置还可以包括:组件控制模块,用于在所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态之后,根据所述运行状态对所述待监控组件进行控制。
本发明实施例三提供的集群中组件的状态检测装置可执行本发明任意实施例提供的集群中组件的状态检测方法,具备执行集群中组件的状态检测方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的集群中组件的状态检测方法。
实施例四
本发明实施例四提供一种集群中组件的状态检测系统。该系统可用于检测集群中的组件的运行状态。图5为本发明实施例四提供的集群中组件的状态检测系统的结构框图,如图5所示,所述系统包括监控设备1和多节点集群2,所述监控设备1上安装有主监控工具,所述多节点集群2包括至少一个待监控节点21,所述待监控节点21上安装有至少一个待监控组件,其中,
所述监控设备1与所述待监控节点21相连,用于获取所述待监控组件的组件标识,并控制所述待监控节点21基于所述组件标识检测所述待监控组件的运行状态。
优选的,所述多节点集群还可以包括中心节点22,所述中心节点22与所述监控设备1相连,用于在接收到所述监控设备1发送的标识查询请求时,获取本节点中存储的待监控组件的组件标识,并将所述组件标识发送给所述监控设备1,以使所述监控设备1获取到所述组件标识;相应的,所述监控设备1用于向集群的中心节点22发送标识查询请求。
优选的,所述待监控节点21还可以用于在本节点安装的待监控组件启动后,获取所述待监控组件的组件标识,并将所述组件标识发送给中心节点22进行存储。
优选的,所述监控设备1具体可用于根据所述组件标识确定安装所述待监控组件的待监控节点21的IP地址,并基于所述IP地址向所述待监控节点21上安装的从监控工具发送状态检测指令,所述状态检测指令中携带有所述组件标识;相应的,所述待监控节点21具体可用于根据所述组件标识获取所述待监控组件的运行状态信息,并将所述运行状态信息发送给所述监控设备1,以使所述监控设备1确定所述待监控组件的运行状态。
优选的,所述监控设备1还可以用于根据所述运行状态对所述待监控组件进行控制。
本发明实施例四提供的集群中组件的状态检测系统,通过与待监控组件安装于同一节点中的从监控工具检测待监控组件的运行状态,而无需再由待监控组件检测自身的运行状态,能够降低待监控组件的负担,提高待监控组件的运行速度,从而提高待监控组件的响应速度,减少用户的等待时间。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种集群中组件的状态检测方法,其特征在于,包括:
主监控工具获取集群中待监控组件的组件标识;
所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,所述从监控工具与所述待监控组件安装于所述集群的同一节点中。
2.根据权利要求1所述的方法,其特征在于,主监控工具获取集群中待监控组件的组件标识,包括:
主监控工具向集群的中心组件发送标识查询请求;
所述中心组件在接收到所述标识查询请求时,获取安装有所述中心组件的中心节点中存储的待监控组件的组件标识,并将所述组件标识发送给所述主监控工具,以使所述主监控工具获取到所述组件标识。
3.根据权利要求2所述的方法,其特征在于,还包括:
集群中的待监控组件在启动后,获取本组件的组件标识,并将所述组件标识发送给中心组件进行存储。
4.根据权利要求1所述的方法,其特征在于,所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,包括:
所述主监控工具根据所述组件标识确定安装所述待监控组件的待监控节点的IP地址,并基于所述IP地址向所述待监控节点上安装的从监控工具发送状态检测指令,所述状态检测指令中携带有所述组件标识;
所述从监控工具根据所述组件标识获取所述待监控组件的运行状态信息,并将所述运行状态信息发送给所述主监控工具,以使所述主监控工具确定所述待监控组件的运行状态。
5.根据权利要求1-4任一所述的方法,其特征在于,在所述主监控工具控制从监控工具基于所述组件标识检测所述待监控组件的运行状态之后,还包括:
所述主监控工具根据所述运行状态对所述待监控组件进行控制。
6.一种集群中组件的状态检测装置,其特征在于,包括:
标识获取模块,用于获取集群中待监控组件的组件标识;
组件控制模块,用于控制从监控工具基于所述组件标识检测所述待监控组件的运行状态,所述从监控工具与所述待监控组件安装于所述集群的同一节点中。
7.根据权利要求6所述的装置,其特征在于,所述标识获取模块包括:
请求发送单元,用于向集群的中心组件发送标识查询请求;
标识获取单元,用于在接收到所述标识查询请求时,获取安装有所述中心组件的中心节点中存储的待监控组件的组件标识,并将所述组件标识发送给主监控工具,以使所述主监控工具获取到所述组件标识。
8.根据权利要求7所述的装置,其特征在于,还包括:
标识发送模块,用于在待监控组件启动后,获取本组件的组件标识,并将所述组件标识发送给中心组件进行存储。
9.根据权利要求6所述的装置,其特征在于,所述组件控制模块包括:
指令发送单元,用于根据所述组件标识确定安装所述待监控组件的待监控节点的IP地址,并基于所述IP地址向所述待监控节点上安装的从监控工具发送状态检测指令,所述状态检测指令中携带有所述组件标识;
信息获取单元,用于根据所述组件标识获取所述待监控组件的运行状态信息,并将所述运行状态信息发送给主监控工具,以使所述主监控工具确定所述待监控组件的运行状态。
10.一种集群中组件的状态检测系统,其特征在于,包括监控设备和多节点集群,所述监控设备上安装有主监控工具,所述多节点集群包括至少一个待监控节点,所述待监控节点上安装有至少一个待监控组件,其中,
所述监控设备与所述待监控节点相连,用于获取所述待监控组件的组件标识,并控制所述待监控节点基于所述组件标识检测所述待监控组件的运行状态。
CN202010327466.8A 2020-04-23 2020-04-23 集群中组件的状态检测方法、装置和系统 Active CN111506480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010327466.8A CN111506480B (zh) 2020-04-23 2020-04-23 集群中组件的状态检测方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010327466.8A CN111506480B (zh) 2020-04-23 2020-04-23 集群中组件的状态检测方法、装置和系统

Publications (2)

Publication Number Publication Date
CN111506480A true CN111506480A (zh) 2020-08-07
CN111506480B CN111506480B (zh) 2024-03-08

Family

ID=71876352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010327466.8A Active CN111506480B (zh) 2020-04-23 2020-04-23 集群中组件的状态检测方法、装置和系统

Country Status (1)

Country Link
CN (1) CN111506480B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130067556A1 (en) * 2011-09-08 2013-03-14 Spencer Minear Application state sharing in a firewall cluster
CN103701661A (zh) * 2013-12-23 2014-04-02 浪潮(北京)电子信息产业有限公司 一种实现节点监控的方法及系统
CN106330523A (zh) * 2015-07-03 2017-01-11 中国移动通信集团广西有限公司 一种集群服务器容灾系统、方法和服务器节点
CN106506282A (zh) * 2016-11-30 2017-03-15 国云科技股份有限公司 一种提高云平台监控性能及规模的监控方法
CN107819640A (zh) * 2016-09-14 2018-03-20 北京百度网讯科技有限公司 用于机器人操作系统的监控方法和装置
CN108563550A (zh) * 2018-04-23 2018-09-21 上海达梦数据库有限公司 一种分布式系统的监控方法、装置、服务器和存储介质
CN109101397A (zh) * 2018-08-01 2018-12-28 武汉索雅信息技术有限公司 高性能集群监控方法、设备、装置及存储介质
CN109697153A (zh) * 2018-12-28 2019-04-30 浙江省公众信息产业有限公司 监控方法、监控系统及计算机可读存储介质
CN109787850A (zh) * 2017-11-10 2019-05-21 阿里巴巴集团控股有限公司 监控系统、监控方法及计算节点
CN110048888A (zh) * 2019-04-16 2019-07-23 深圳市致宸信息科技有限公司 一种基于zabbix监控告警的方法、服务器、设备及存储介质
CN110737566A (zh) * 2019-09-17 2020-01-31 平安科技(深圳)有限公司 主机性能监控方法及装置、电子设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130067556A1 (en) * 2011-09-08 2013-03-14 Spencer Minear Application state sharing in a firewall cluster
CN103701661A (zh) * 2013-12-23 2014-04-02 浪潮(北京)电子信息产业有限公司 一种实现节点监控的方法及系统
CN106330523A (zh) * 2015-07-03 2017-01-11 中国移动通信集团广西有限公司 一种集群服务器容灾系统、方法和服务器节点
CN107819640A (zh) * 2016-09-14 2018-03-20 北京百度网讯科技有限公司 用于机器人操作系统的监控方法和装置
CN106506282A (zh) * 2016-11-30 2017-03-15 国云科技股份有限公司 一种提高云平台监控性能及规模的监控方法
CN109787850A (zh) * 2017-11-10 2019-05-21 阿里巴巴集团控股有限公司 监控系统、监控方法及计算节点
CN108563550A (zh) * 2018-04-23 2018-09-21 上海达梦数据库有限公司 一种分布式系统的监控方法、装置、服务器和存储介质
CN109101397A (zh) * 2018-08-01 2018-12-28 武汉索雅信息技术有限公司 高性能集群监控方法、设备、装置及存储介质
CN109697153A (zh) * 2018-12-28 2019-04-30 浙江省公众信息产业有限公司 监控方法、监控系统及计算机可读存储介质
CN110048888A (zh) * 2019-04-16 2019-07-23 深圳市致宸信息科技有限公司 一种基于zabbix监控告警的方法、服务器、设备及存储介质
CN110737566A (zh) * 2019-09-17 2020-01-31 平安科技(深圳)有限公司 主机性能监控方法及装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
R.CURRY ET AL.: "job centric cluster monitoring", 《12TH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEM》, 24 July 2006 (2006-07-24), pages 1 - 10 *
刘杨;肖侬;沈立;: "Xen虚拟集群监控器的设计与实现", 武汉理工大学学报, no. 20, 30 October 2010 (2010-10-30), pages 190 - 194 *
熊齐;唐佳明;: "Linux集群实时监控系统的一种实现方法", 计算机系统应用, no. 09, 15 September 2013 (2013-09-15), pages 52 - 55 *

Also Published As

Publication number Publication date
CN111506480B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
CN108810100B (zh) 一种主节点的选举方法、装置及设备
CN108848170B (zh) 一种基于nagios监控的雾集群管理系统与方法
CN112769652B (zh) 一种节点服务监控方法、装置、设备及介质
CN113271541B (zh) 终端行为数据的获取方法、发送方法、装置及网络设备
CN111562889B (zh) 数据处理方法、装置、系统及存储介质
CN109714202A (zh) 一种客户端离线原因判别方法和集群式安全管理系统
CN109428740B (zh) 设备故障恢复的方法和装置
CN113746821B (zh) 智能设备控制方法、装置、存储介质及电子设备
CN113835844A (zh) 一种容器集群的管理方法、装置及云计算平台
CN114124655A (zh) 网络监控方法、系统、装置、计算机设备和存储介质
CN109782695B (zh) 一种用于制造设备的控制方法、装置和系统
KR101107359B1 (ko) 센서 노드의 리소스를 제공하는 시스템
CN111506480B (zh) 集群中组件的状态检测方法、装置和系统
CN111737028A (zh) Dubbo服务检测方法及装置
JP6958542B2 (ja) 情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム
CN111371593A (zh) 一种业务部署方法、装置、电子设备及存储介质
CN106533818B (zh) 基于nfv资源池的监控方法和通信方法、系统以及设备
CN111506422B (zh) 事件分析方法及系统
CN111385520B (zh) 一种视频监控设备的自动组网方法及装置
CN112788153A (zh) 一种物联网设备升级管理方法、装置、设备及存储介质
CN112187919A (zh) 一种存储节点管理方法及相关装置
CN111464357A (zh) 资源配置方法及装置
CN115865651B (zh) 一种数据采集方法、装置、电子设备及存储介质
CN111865639B (zh) 一种snmp服务设备信息收集方法、装置及电子设备
EP4280566A1 (en) Connecting device to a mesh network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant