CN115379019A - 一种服务调度方法、装置、设备及存储介质 - Google Patents
一种服务调度方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115379019A CN115379019A CN202211000224.3A CN202211000224A CN115379019A CN 115379019 A CN115379019 A CN 115379019A CN 202211000224 A CN202211000224 A CN 202211000224A CN 115379019 A CN115379019 A CN 115379019A
- Authority
- CN
- China
- Prior art keywords
- node
- resource
- sub
- nodes
- target node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
- H04L63/0435—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload wherein the sending and receiving network entities apply symmetric encryption, i.e. same key used for encryption and decryption
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种服务调度方法、装置、设备及存储介质,涉及计算机技术领域,包括:接收各节点发送的包含所述节点收集的自身的资源信息的trap消息;对trap消息中的资源信息进行汇总分析以判断所有节点的资源占用状态是否为占用过高状态;如果否,则确定出资源占用状态为占用过高状态的第一目标节点,并将第一目标节点内运行的服务调度至资源占用状态为非过高状态的第二目标节点上。本申请接收各节点发送的trap消息,也即,各节点以trap消息的方式上报资源信息,便于对分布式集群内的所有节点进行资源监控,将资源占用过高的第一目标节点内运行的服务调度至资源占用非过高的第二目标节点上,从而提升分布式集群的服务调度管理的智能化。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种服务调度方法、装置、设备及存储介质。
背景技术
当前,基于对系统可靠性、高并发等方面的需求,分布式集群的应用越来越普遍。在多节点的分布式集群中,各个节点的资源状态存在差异,当新请求到来时,选择哪个节点去执行,需要有专门的调度服务负责,这对任何集群都是不可或缺的。因此,如何调度服务成为一个越来越重要的课题。
要达到合理的调度服务,首先,需要对各个节点的资源使用情况,例如,需要对各节点的CPU(Central Processing Unit,中央处理器)、MEM(Memory,内存)、硬盘、带宽等资源进行监控,对资源进行监控是执行服务调度的基础,否则,如果节点的资源在占用过高的情况下还给该节点分配新的请求,就可能导致请求失败,甚至可能导致整个集群出现宕机;其次,要有合理的调度方法,保证每个新的请求都在资源最充裕的节点上执行,既保证了请求的快速响应,又做到了集群的负载均衡。然而,现有成熟的分布式集群架构中,均已集成了资源监控的元件,但是缺点也非常明显,首先所监控的内容更偏重于服务,而不是节点;其次扩展性不强,只能监控指定的固定指标,要做定制化监控几乎不可能。
发明内容
有鉴于此,本发明的目的在于提供一种服务调度方法、装置、设备及存储介质,能够提升分布式集群的服务调度管理的智能化。其具体方案如下:
第一方面,本申请公开了一种服务调度方法,包括:
接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息;
对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态;
如果否,则确定出所述资源占用状态为所述占用过高状态的第一目标节点,并将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上。
可选的,所述接收各节点发送的trap消息之前,还包括:
利用预设的加密算法对所述trap消息进行加密,得到加密后trap消息;
相应的,所述接收各节点发送的trap消息,包括:
接收各节点发送的所述加密后trap消息。
可选的,所述利用预设的加密算法对所述trap消息进行加密,得到加密后trap消息,包括:
利用预设的加密算法对所述trap消息对应的预设消息格式中的团体名和协议数据单元进行加密,得到加密后trap消息。
可选的,所述将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上之前,还包括:
根据各所述节点对应的各子资源指标的可用资源状况对各所述节点进行排序,得到各所述子资源指标对应的节点排序结果;
根据所述节点排序结果选取出预设排序位置的各所述子资源指标对应的第三目标节点;
判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点;
如果各所述子资源指标对应的所述第三目标节点中存在相同节点,则从各所述子资源指标对应的所述第三目标节点中确定出所述相同节点,并将所述相同节点确定为所述资源占用状态为非过高状态的第二目标节点。
可选的,所述判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点之后,还包括:
如果各所述子资源指标对应的所述第三目标节点中不存在所述相同节点,则对各所述节点对应的各所述子资源指标进行加权运算得到各所述节点对应的计算结果;
将数值最高的所述计算结果对应的节点确定为所述资源占用状态处于非过高状态的第二目标节点。
可选的,所述对各所述节点对应的各所述子资源指标进行加权运算得到各所述节点对应的计算结果,包括:
确定调度请求对应的请求类型,并确定出所述请求类型对各所述子资源指标的依赖程度;所述调度请求为将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上对应的请求;
基于所述依赖程度确定各所述节点的各所述子资源指标对应的加权值;
基于各所述子资源指标对应的节点总数和所述节点排序结果确定出各所述节点对应的各所述子资源指标的实际取值;
利用所述加权值对各所述子资源指标的所述实际取值进行加权运算得到各所述节点对应的计算结果。
可选的,所述对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态之后,还包括:
如果所有所述节点的所述资源占用状态为所述占用过高状态,则判定当前集群业务量过大,并产生提示对当前所述集群进行扩容的告警信息。
第二方面,本申请公开了一种服务调度装置,包括:
消息接收模块,用于接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息;
信息分析模块,用于对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态;
服务调度模块,用于当所有所述节点的资源占用状态非占用过高状态,则确定出所述资源占用状态为所述占用过高状态的第一目标节点,并将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的服务调度方法的步骤。
第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的服务调度方法的步骤。
可见,本申请提供了一种服务调度方法,包括:接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息;对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态;如果否,则确定出所述资源占用状态为所述占用过高状态的第一目标节点,并将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上。由此可知,本申请接收各节点发送的trap消息,也即,以trap消息的方式上报资源信息,更便于对分布式集群内的所有节点进行资源监控,进而判断所有节点的资源占用是否都过高,若存在部分第一目标节点资源占用过高,则将资源占用过高的第一目标节点内运行的服务调度至资源占用非过高的第二目标节点上,从而提升分布式集群的服务调度管理的智能化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种服务调度方法流程图;
图2为本申请公开的一种具体的分布式集群组网示意图;
图3为本申请公开的一种消息加密示意图;
图4为本申请公开的一种资源信息上报示意图;
图5为本申请公开的一种节点资源占用状况判断示意图;
图6为本申请公开的一种具体的服务调度方法流程图;
图7为本申请公开的一种资源拆分和节点排序示意图;
图8为本申请公开的一种子资源指标扩展示意图;
图9为本申请公开的一种具体的服务调度方法流程图;
图10为本申请公开的一种服务调度装置结构示意图;
图11为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
当前,现有技术中,现有成熟的分布式集群架构中,均已集成了资源监控的元件,但是缺点也非常明显,首先所监控的内容更偏重于服务,而不是节点;其次扩展性不强,只能监控指定的固定指标,要做定制化监控几乎不可能。为此,本申请提供了一种服务调度方案,提升分布式集群的服务调度管理的智能化。
本发明实施例公开了一种服务调度方法,参见图1所示,该方法包括:
步骤S11:接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息。
本实施例中,主节点接收其他节点发送的trap消息,该trap消息包含节点自身收集的资源信息。例如,如图2所示,在分布式集群中,除主节点之外的其他节点则作为客户端(即agent端),收集自身的资源信息后,并将该资源信息上报给主节点,主节点为集群服务所在的节点,并作为服务端(即server端),在接收其他节点上报的资源信息时,还会监控自身的资源信息并上报。
需要指出的是,SNMP(Simple Network Management Protocol,简单网络管理协议)经过多年发展,已成为业界公认的普遍使用的标准协议,在适配上没有问题,另外,trap方式以主动上报的方式,多用于上报告警,较适合针对于系统资源的上报,基于SNMP trap协议的在分布式集群内对所有节点进行资源监控的方法,扩展性强,且优化流程,降低带宽。
本实施例中,所述接收各节点发送的trap消息之前,也就是说,其他节点收集自身的资源信息生成相应trap消息之后,各其他节点都利用预设的加密算法对所述trap消息进行加密,得到加密后trap消息;然后再将加密后trap消息上报至主节点,也即主节点接收各节点发送的所述加密后trap消息。可以理解的是,SNMP trap V2采用明文的方式传递消息,安全隐患较大,因此,引入利用预设加密算法对trap消息进行加密的方法,在保证安全性的同时,还能够防止trap消息被伪造,即对团体名和PDU(Protocol Data Unit,协议数据单元)均加密。具体的,利用预设的加密算法对所述trap消息对应的预设消息格式中的团体名和协议数据单元进行加密,得到加密后trap消息。例如,如图3所示,利用AES(AdvancedEncryption Standard,高级加密标准)对称加密算法对团体名和PDU均加密,如果只对团体名加密,则可能导致消息被伪造,团体名被照搬,PDU随意修改,所以对团体名和PDU分别加密,保证安全性,但是需要提前为各个节点预置AES密钥,且妥善保管,防止被窃取。也就是说,对SNMP trap消息做一定的安全优化,能够提升消息的安全性。
步骤S12:对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态。
本实施例中,主节点接收到其他节点发送的trap消息之后,对所述trap消息中的所述资源信息进行汇总分析,然后判断所有所述节点的资源占用状态是否为占用过高状态,也就是说,server端对接收的trap消息进行解析,汇总所有agent信息并进行分析。例如,如图4所示,agent端的agent节点定时触发,agent端收集自身的资源信息,并向server端发送trap消息,该trap消息包含自身的资源信息,然后server端对接收的trap消息进行解析,汇总所有agent端收集到的trap信息并进行分析,也就是说,server端的主节点通过分析收集到trap消息,判断所有节点的资源占用是否都高,也即,所有所述节点的资源占用状态是否为占用过高状态。
步骤S13:如果否,则确定出所述资源占用状态为所述占用过高状态的第一目标节点,并将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上。
本实施例中,判断所有所述节点的资源占用状态是否为占用过高状态时,如果所有所述节点的资源占用状态非占用过高状态时,则确定出所述资源占用状态为所述占用过高状态的第一目标节点,并将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上,如果所有所述节点的所述资源占用状态为所述占用过高状态,则判定当前集群业务量过大,并产生提示对当前所述集群进行扩容的告警信息。例如,如图5所示,判断所有节点的资源是否占用过高,如果所有所述节点的资源占用都高,表明各节点的业务量过大,当前集群的整体资源不足,进而产生告警,提示所有节点的资源占用过高,并进行扩容,也就是说,增加节点数以降低各节点的资源占用;如果所有所述节点的资源占用并非都高,进而针对单个节点进行判断,判断单个节点是否资源占用过高,如果当前的单个节点为资源占用过高,则表明该单个节点的业务量过大,并产生提示当前的所述单个节点资源占用过高的告警信息,然后在分布式集群内进行资源调度,也即,将资源占用过高的节点内运行的服务调度至其他资源占用并不过高的节点上,以降低该节点的资源占用。
可见,本申请实施例中接收各节点发送的trap消息,也即,以trap消息的方式上报资源信息,更便于对分布式集群内的所有节点进行资源监控,进而判断所有节点的资源占用是否都过高,若存在部分第一目标节点资源占用过高,则将资源占用过高的第一目标节点内运行的服务调度至资源占用非过高的第二目标节点上,从而提升分布式集群的服务调度管理的智能化。
参见图6所示,本发明实施例公开了一种具体的服务调度方法,相较于上一实施例,本实施例对技术方案作了进一步的说明和优化。
步骤S21:接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息。
步骤S22:对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态。
步骤S23:如果否,则确定出所述资源占用状态为所述占用过高状态的第一目标节点。
步骤S24:根据各所述节点对应的各子资源指标的可用资源状况对各所述节点进行排序,得到各所述子资源指标对应的节点排序结果。
本实施例中,在所有所述节点的资源占用状态并非都为占用过高状态时,确定出资源占用状态处于占用过高状态的第一目标节点后,需要将这些第一目标节点内运行的服务调度的到资源占用状态为非占用过高状态的第二目标节点上,为此,需要确定出这些第二目标节点,首先,根据各所述节点对应的各子资源指标的可用资源状况对各所述节点进行排序,得到各所述子资源指标对应的节点排序结果。可以理解的是,将所有资源进行拆分,确定出各子资源指标,各所述节点对应的各子资源指标的可用资源状况可以根据trap中的资源信息进行分析确定,然后根据各节点的各子资源指标的可用资源状态对各所述节点进行排序,得到各所述子资源指标对应的节点排序结果。
步骤S25:根据所述节点排序结果选取出预设排序位置的各所述子资源指标对应的第三目标节点。
本实施例中,根据各节点的各子资源指标的可用资源状态对各所述节点进行排序之后,则根据节点排序结果选取出预设排序位置的各所述子资源指标对应的第三目标节点。可以理解的是,每个子资源指标下都对应一个节点排序结果,也就是说,在每个子资源指标下,根据节点对应于该子资源指标的可用资源状况进行排序,得到每个节点在该子资源指标下的排序结果,然后选取出各子资源指标中预设排序位置的一些节点,该节点就确定为第三目标节点。
步骤S26:判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点。
本实施例中,根据所述节点排序结果选取出预设排序位置的各所述子资源指标对应的第三目标节点之后,进而判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点。例如,对选取出的预设排序位置的各所述子资源对应的第三目标节点进行取交集运算以判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点。
步骤S27:如果各所述子资源指标对应的所述第三目标节点中存在相同节点,则从各所述子资源指标对应的所述第三目标节点中确定出所述相同节点,并将所述相同节点确定为所述资源占用状态为非过高状态的第二目标节点。
本实施例中,在对选取出的预设排序位置的各所述子资源对应的第三目标节点进行取交集运算时,如果能够取到交集,则表明各所述子资源指标对应的所述第三目标节点中存在相同节点,就将所述相同节点确定为所述资源占用状态为非过高状态的第二目标节点,所述第二目标节点的个数可以是一个或多个,所述第二目标节点即为当前分布式集群中用于接收资源占用过高的节点内运行内的服务的最优节点。
例如,如图7所示,将所有资源进行拆分,得到CPU、MEM、硬盘空间、带宽四个子资源指标然后根据trap消息中的资源信息,依据各所述节点的所述子资源指标对应的可用资源状态对各所述节点进行排序,然后从每个子资源指标对应的节点排序结果中选取排位前三的节点,子资源指标对应的预设排序位置为前三的节点即为各子资源指标对应的第三目标节点,然后各子资源指标之间的第三目标节点取交集,如果能取到交集,即各子资源指标之间的第三目标节点中存在相同节点,所述相同节点可作为接收新请求的最优解节点。如果有多个相同节点,则随机选取其中一个接收新请求即可。也就是说,本申请通过分治算法对节点所有资源进行拆分,在单个资源的情况下,获取最优解的节点。
需要指出的是,上述子资源指标也可以进行再扩展,如图8所示,通过新增OID(Object Identifier,对象标识符)的方式,即可任意扩展资源指标,其中,所述OID的实际取值,需按国际规则实际分配全球唯一值,例如,OID-CPU:获取CPU使用率,OID-MEM:获取内存使用率,OID-DISK:获取硬盘占用率,OID-BAND:获取带宽使用率。或者按照实际业务的需求,对资源指标类型进行扩展,也就是说,通过新增OID或者按照实际业务需求的方式便于增减子资源指标。并且上述各子资源指标对应的底层采集命令分别可以为:CPU对应的采集命令为top,MEM对应的采集命令为free,硬盘对应的采集命令为df,带宽对应的采集命令为iftop。
步骤S28:将所述第一目标节点内运行的服务调度至所述资源占用状态为所述非过高状态的所述第二目标节点上。
关于上述步骤S21至步骤S23以及步骤S28的具体内容可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本申请实施例中接收各节点发送的trap消息,也即,以trap消息的方式上报资源信息,更便于对分布式集群内的所有节点进行资源监控,进而判断所有节点的资源占用是否都过高,若存在部分第一目标节点资源占用过高,则将资源占用过高的第一目标节点内运行的服务调度至资源占用非过高的第二目标节点上,并且依据分治算法和加权计算,将资源情况进行分析处理,获取最优解的节点,从而提升分布式集群的服务调度管理的智能化,并提升功能的可扩展性,增减指标更便捷。
参见图9所示,本发明实施例公开了一种具体的服务调度方法,相较于上一实施例,本实施例对技术方案作了进一步的说明和优化。
步骤S31:接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息。
步骤S32:对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态。
步骤S33:如果否,则确定出所述资源占用状态为所述占用过高状态的第一目标节点。
步骤S34:根据各所述节点对应的各子资源指标的可用资源状况对各所述节点进行排序,得到各所述子资源指标对应的节点排序结果;。
步骤S35:根据所述节点排序结果选取出预设排序位置的各所述子资源指标对应的第三目标节点。
步骤S36:判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点。
步骤S37:如果各所述子资源指标对应的所述目标节点中不存在所述相同节点,则对各所述节点对应的各所述子资源指标进行加权运算得到各所述节点对应的计算结果。
本实施例中,判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点时,如果各所述子资源指标对应的所述目标节点中不存在所述相同节点,则对各所述节点对应的各所述子资源指标进行加权运算得到各所述节点对应的计算结果,具体的,确定调度请求对应的请求类型,并确定出所述请求类型对各所述子资源指标的依赖程度;所述调度请求为将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上对应的请求;基于所述依赖程度确定各所述节点的各所述子资源指标对应的加权值;基于各所述子资源指标对应的节点总数和所述节点排序结果确定出各所述节点对应的各所述子资源指标的实际取值;利用所述加权值对各所述子资源指标的所述实际取值进行加权运算得到各所述节点对应的计算结果。例如,当前存在将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上调度请求,然后判断该调用请求的请求类型,然后确定该请求类型对个所述子资源指标的依赖程度,基于该依赖程度确定出各所述节点的各所述子资源指标对应的加权值,例如,子资源指标CPU对应的加权值为Weightcpu、子资源指标MEM对应的加权值为Weightmem、子资源指标硬盘空间对应的加权值为Weightdis、子资源指标带宽对应的加权值为Weightbandwidth、其中,各子资源指标对应的加权值的总和为1,如:Weightcpu+Weightmem+Weightdisk+Weightbandwidth=100%。在计算当前节点对应的各所述子资源指标的实际取值时,假设当前节点的各子资源指标下对应的节点总数为N个,在子资源指标CPU的排名中,当前节点的排名第2,则当前节点针对CPU子资源指标的取值即为N-2,由此计算出每个节点对应的各所述子资源指标的实际取值,如,CPU的实际取值Valuecpu、MEM的实际取值Valuemem、硬盘空间的实际取值Valuedisk、带宽的实际取值Valuebandwidth,进而根据当前节点的各子资源指标的加权值和实际取值确定出当前节点加权后的取值为:Valuecpu*Weightcpu+Valuemem*Weightmem+Valuedisk*Weightdisk+Valuebandwidth*Weightbandwidth,根据这种方式计算出所有节点加权后的计算结果后,按照这个计算结果的数值对所有节点进行排序,将排序中数值最高的节点确定为最优解节点,即第二目标节点
步骤S38:将数值最高的所述计算结果对应的节点确定为所述资源占用状态处于非过高状态的第二目标节点。
本实施例中,在各所述子资源指标对应的所述目标节点中不存在所述相同节点,然后对各所述节点对应的各所述子资源指标进行加权运算得到各所述节点对应的计算结果时,将数值最高的所述计算结果对应的节点确定为所述资源占用状态处于非过高状态的第二目标节点。也就是说,按照这个计算结果的数值对所有节点进行排序,将排序中数值最高的节点确定为最优解节点,即所述资源占用状态处于非过高状态的第二目标节点。
步骤S39:将所述第一目标节点内运行的服务调度至所述资源占用状态为所述非过高状态的所述第二目标节点上。
关于上述步骤S31至步骤S36以及步骤S39的具体内容可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本申请实施例中接收各节点发送的trap消息,也即,以trap消息的方式上报资源信息,更便于对分布式集群内的所有节点进行资源监控,进而判断所有节点的资源占用是否都过高,若存在部分第一目标节点资源占用过高,则将资源占用过高的第一目标节点内运行的服务调度至资源占用非过高的第二目标节点上,并且依据分治算法和加权计算,将资源情况进行分析处理,获取最优解的节点,从而提升分布式集群的服务调度管理的智能化,并提升功能的可扩展性,增减指标更便捷。
相应的,本申请实施例还公开了一种服务调度装置,参见图10所示,该装置包括:
消息接收模块11,用于接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息;
信息分析模块12,用于对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态;
服务调度模块13,用于当所有所述节点的资源占用状态非占用过高状态,则确定出所述资源占用状态为所述占用过高状态的第一目标节点,并将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上。
由上可见,本申请实施例中接收各节点发送的trap消息,也即,以trap消息的方式上报资源信息,更便于对分布式集群内的所有节点进行资源监控,进而判断所有节点的资源占用是否都过高,若存在部分第一目标节点资源占用过高,则将资源占用过高的第一目标节点内运行的服务调度至资源占用非过高的第二目标节点上,从而提升分布式集群的服务调度管理的智能化。
在一些具体的实施例中,所述服务调度装置,具体可以包括:
消息加密模块,用于利用预设的加密算法对所述trap消息进行加密,得到加密后trap消息;
在一些具体的实施例中,所述消息接收模块11,具体可以包括:
消息接收单元,用于接收各节点发送的所述加密后trap消息。
在一些具体的实施例中,所述消息加密模块,具体可以包括:
消息加密单元,用于利用预设的加密算法对所述trap消息对应的预设消息格式中的团体名和协议数据单元进行加密,得到加密后trap消息。
在一些具体的实施例中,所述服务调度装置,具体可以包括:
节点排序模块,用于根据各所述节点对应的各子资源指标的可用资源状况对各所述节点进行排序,得到各所述子资源指标对应的节点排序结果;
目标节点选取模块,用于根据所述节点排序结果选取出预设排序位置的各所述子资源指标对应的第三目标节点;
判断模块,用于判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点;
相同节点确定模块,用于当各所述子资源指标对应的所述第三目标节点中存在相同节点时,则从各所述子资源指标对应的所述第三目标节点中确定出所述相同节点,并将所述相同节点确定为所述资源占用状态为非过高状态的第二目标节点。
在一些具体的实施例中,所述判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点之后,具体可以包括:
加权运算模块,用于当各所述子资源指标对应的所述目标节点中不存在相同节点时,则对各所述节点对应的各所述子资源指标进行加权运算得到各所述节点对应的计算结果;
目标节点确定模块,用于将数值最高的所述计算结果对应的节点确定为所述资源占用状态处于非过高状态的第二目标节点。
在一些具体的实施例中,所述加权运算模块,具体可以包括:
请求类型确定单元,用于确定调度请求对应的请求类型;
依赖程度确定单元,用于确定出所述请求类型对各所述子资源指标的依赖程度;所述调度请求为将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上对应的请求;
加权值确定单元,用于基于所述依赖程度确定各所述节点的各所述子资源指标对应的加权值;
实际取值确定单元,用于基于各所述子资源指标对应的节点总数和所述节点排序结果确定出各所述节点对应的各所述子资源指标的实际取值;
加权运算单元,用于利用所述加权值对各所述子资源指标的所述实际取值进行加权运算得到各所述节点对应的计算结果。
在一些具体的实施例中,所述服务调度装置,具体可以包括:
告警产生单元,用于当所有所述节点的所述资源占用状态为所述占用过高状态时,则判定当前集群业务量过大,并产生提示对当前所述集群进行扩容的告警信息。
进一步的,本申请实施例还提供了一种电子设备。图11是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图11为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的服务调度方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的服务调度方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行时,实现前述任一实施例公开的服务调度方法步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种服务调度方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种服务调度方法,其特征在于,包括:
接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息;
对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态;
如果否,则确定出所述资源占用状态为所述占用过高状态的第一目标节点,并将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上。
2.根据权利要求1所述的服务调度方法,其特征在于,所述接收各节点发送的trap消息之前,还包括:
利用预设的加密算法对所述trap消息进行加密,得到加密后trap消息;
相应的,所述接收各节点发送的trap消息,包括:
接收各节点发送的所述加密后trap消息。
3.根据权利要求2所述的服务调度方法,其特征在于,所述利用预设的加密算法对所述trap消息进行加密,得到加密后trap消息,包括:
利用预设的加密算法对所述trap消息对应的预设消息格式中的团体名和协议数据单元进行加密,得到加密后trap消息。
4.根据权利要求1所述的服务调度方法,其特征在于,所述将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上之前,还包括:
根据各所述节点对应的各子资源指标的可用资源状况对各所述节点进行排序,得到各所述子资源指标对应的节点排序结果;
根据所述节点排序结果选取出预设排序位置的各所述子资源指标对应的第三目标节点;
判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点;
如果各所述子资源指标对应的所述第三目标节点中存在相同节点,则从各所述子资源指标对应的所述第三目标节点中确定出所述相同节点,并将所述相同节点确定为所述资源占用状态为非过高状态的第二目标节点。
5.根据权利要求4所述的服务调度方法,其特征在于,所述判断各所述子资源指标对应的所述第三目标节点中是否存在相同节点之后,还包括:
如果各所述子资源指标对应的所述第三目标节点中不存在所述相同节点,则对各所述节点对应的各所述子资源指标进行加权运算得到各所述节点对应的计算结果;
将数值最高的所述计算结果对应的节点确定为所述资源占用状态处于非过高状态的第二目标节点。
6.根据权利要求5所述的服务调度方法,其特征在于,所述对各所述节点对应的各所述子资源指标进行加权运算得到各所述节点对应的计算结果,包括:
确定调度请求对应的请求类型,并确定出所述请求类型对各所述子资源指标的依赖程度;所述调度请求为将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上对应的请求;
基于所述依赖程度确定各所述节点的各所述子资源指标对应的加权值;
基于各所述子资源指标对应的节点总数和所述节点排序结果确定出各所述节点对应的各所述子资源指标的实际取值;
利用所述加权值对各所述子资源指标的所述实际取值进行加权运算得到各所述节点对应的计算结果。
7.根据权利要求1至6任一项所述的服务调度方法,其特征在于,所述对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态之后,还包括:
如果所有所述节点的所述资源占用状态为所述占用过高状态,则判定当前集群业务量过大,并产生提示对当前所述集群进行扩容的告警信息。
8.一种服务调度装置,其特征在于,包括:
消息接收模块,用于接收各节点发送的trap消息,其中,所述trap消息包含所述节点收集的自身的资源信息;
信息分析模块,用于对所述trap消息中的所述资源信息进行汇总分析以判断所有所述节点的资源占用状态是否为占用过高状态;
服务调度模块,用于当所有所述节点的资源占用状态非占用过高状态,则确定出所述资源占用状态为所述占用过高状态的第一目标节点,并将所述第一目标节点内运行的服务调度至所述资源占用状态为非过高状态的第二目标节点上。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的服务调度方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的服务调度方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211000224.3A CN115379019B (zh) | 2022-08-19 | 2022-08-19 | 一种服务调度方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211000224.3A CN115379019B (zh) | 2022-08-19 | 2022-08-19 | 一种服务调度方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115379019A true CN115379019A (zh) | 2022-11-22 |
CN115379019B CN115379019B (zh) | 2024-07-09 |
Family
ID=84066482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211000224.3A Active CN115379019B (zh) | 2022-08-19 | 2022-08-19 | 一种服务调度方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115379019B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117009091A (zh) * | 2023-10-07 | 2023-11-07 | 浪潮(山东)计算机科技有限公司 | 一种资源调整方法、装置、设备及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109167835A (zh) * | 2018-09-13 | 2019-01-08 | 重庆邮电大学 | 一种基于kubernetes的物理资源调度方法及系统 |
CN110213358A (zh) * | 2019-05-23 | 2019-09-06 | 深圳壹账通智能科技有限公司 | 集群资源调度的方法、节点、设备及存储介质 |
CN112232834A (zh) * | 2020-09-29 | 2021-01-15 | 中国银联股份有限公司 | 资源账户确定方法、装置、设备和介质 |
CN112469133A (zh) * | 2020-11-27 | 2021-03-09 | 中国联合网络通信集团有限公司 | 一种载波资源调度方法和装置 |
CN113382077A (zh) * | 2021-06-18 | 2021-09-10 | 广西电网有限责任公司 | 微服务调度方法、装置、计算机设备和存储介质 |
WO2022048357A1 (zh) * | 2020-09-03 | 2022-03-10 | 深圳壹账通智能科技有限公司 | 交易背书方法、装置及存储介质 |
US20220083375A1 (en) * | 2019-05-30 | 2022-03-17 | Huawei Technologies Co., Ltd. | Method and apparatus for scheduling task processing entity |
CN114281479A (zh) * | 2021-12-27 | 2022-04-05 | 深圳前海微众银行股份有限公司 | 一种容器管理方法及装置 |
-
2022
- 2022-08-19 CN CN202211000224.3A patent/CN115379019B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109167835A (zh) * | 2018-09-13 | 2019-01-08 | 重庆邮电大学 | 一种基于kubernetes的物理资源调度方法及系统 |
CN110213358A (zh) * | 2019-05-23 | 2019-09-06 | 深圳壹账通智能科技有限公司 | 集群资源调度的方法、节点、设备及存储介质 |
US20220083375A1 (en) * | 2019-05-30 | 2022-03-17 | Huawei Technologies Co., Ltd. | Method and apparatus for scheduling task processing entity |
WO2022048357A1 (zh) * | 2020-09-03 | 2022-03-10 | 深圳壹账通智能科技有限公司 | 交易背书方法、装置及存储介质 |
CN112232834A (zh) * | 2020-09-29 | 2021-01-15 | 中国银联股份有限公司 | 资源账户确定方法、装置、设备和介质 |
CN112469133A (zh) * | 2020-11-27 | 2021-03-09 | 中国联合网络通信集团有限公司 | 一种载波资源调度方法和装置 |
CN113382077A (zh) * | 2021-06-18 | 2021-09-10 | 广西电网有限责任公司 | 微服务调度方法、装置、计算机设备和存储介质 |
CN114281479A (zh) * | 2021-12-27 | 2022-04-05 | 深圳前海微众银行股份有限公司 | 一种容器管理方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117009091A (zh) * | 2023-10-07 | 2023-11-07 | 浪潮(山东)计算机科技有限公司 | 一种资源调整方法、装置、设备及可读存储介质 |
CN117009091B (zh) * | 2023-10-07 | 2023-12-19 | 浪潮(山东)计算机科技有限公司 | 一种资源调整方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115379019B (zh) | 2024-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9246777B2 (en) | Computer program and monitoring apparatus | |
AU740146B2 (en) | A telecommunications performance management system | |
CN108370341B (zh) | 资源配置方法、虚拟网络功能管理器和网元管理系统 | |
CN113709048A (zh) | 一种路由信息的发送、接收方法、网元及节点设备 | |
JP3812236B2 (ja) | イベント制御手段を備えたネットワーク管理システム | |
EP1519594A2 (en) | Method and apparatus for network element resource utilization tracking | |
CN109995669B (zh) | 分布式限流方法、装置、设备及可读存储介质 | |
CN101617501B (zh) | 对通信网络进行操作的方法、产品和系统 | |
CN111190794A (zh) | 一种运维监控管理系统 | |
WO2004102386A2 (en) | Autonomic failover in the context of distributed web services | |
CN109271243B (zh) | 一种集群任务管理系统 | |
CN111200526B (zh) | 网络设备的监控系统及方法 | |
CN113742066A (zh) | 一种用于服务器集群的负载均衡系统和方法 | |
CN111026606A (zh) | 基于hystrix熔断器监控的报警方法、装置及计算机设备 | |
US20010052010A1 (en) | Method for controlling trap generation of SNMP | |
CN112698952A (zh) | 计算资源统一管理方法、装置、计算机设备及存储介质 | |
CN113596150A (zh) | 消息推送方法、装置、计算机设备和存储介质 | |
CN106100868A (zh) | 一种项目运维管理装置、系统及方法 | |
CN115379019A (zh) | 一种服务调度方法、装置、设备及存储介质 | |
CN115796844A (zh) | 告警阈值的动态更新方法、终端设备及系统 | |
CN114900449B (zh) | 一种资源信息管理方法、系统及装置 | |
CN117715088B (zh) | 基于边缘计算的网络切片管理方法、装置、设备及介质 | |
KR20150049850A (ko) | 패턴정보를 이용한 리소스 변경 여부 결정 장치 및 방법과 이를 이용한 기록매체 | |
CN114817134B (zh) | 一种快照任务监控方法、装置、设备及介质 | |
CN115883639A (zh) | 一种web实时消息推送方法及装置、设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |