CN116048821B - 高利用率的ai服务器及其资源分配方法 - Google Patents
高利用率的ai服务器及其资源分配方法 Download PDFInfo
- Publication number
- CN116048821B CN116048821B CN202310344475.1A CN202310344475A CN116048821B CN 116048821 B CN116048821 B CN 116048821B CN 202310344475 A CN202310344475 A CN 202310344475A CN 116048821 B CN116048821 B CN 116048821B
- Authority
- CN
- China
- Prior art keywords
- server
- unit
- resource utilization
- servers
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明属于服务器技术领域,具体涉及高利用率的AI服务器及其资源分配方法。所述服务器包括:若干个可以彼此互联的单元服务器构成的服务器阵列和根据目标任务类型将从服务器阵列中获取单元服务器使用权限,并对获取到使用权限的单元服务器进行特定形态组合服务器组合单元。所述服务器通过单元服务器来构建服务器阵列,再创造性地根据目标任务的任务类型来获取特定数量的单元服务器进行特定形态组合,以使得执行当前任务时,能以更高效率进行,同时单元服务器也在运行时,在单元服务器组中构建均衡网络对资源利用率进行均衡,实现了AI服务器的高利用率。
Description
技术领域
本发明属于服务器技术领域,具体涉及高利用率的AI服务器及其资源分配方法。
背景技术
随着5G、物联网、人工智能技术的发展,视频监控系统的大力建设和普及。社会的“智慧”化建设逐步完善和丰富。当下“智慧”化建设主要应用在智慧城市、智慧小区、智慧工地、智慧旅游、智慧出行、智慧路灯、智慧停车场等等,渗透到各行各业。而智能视频分析在“智慧”化建设中发挥着巨大作用。利用现有的视频监控,加上AI视觉分析与识别技术,形成具有视频AI分析能力的应用。实现了人脸特征识别、人体行为分析、体温监测、人流密度监控、危险区域非法入侵、烟雾火灾报警、违规占道分析等功能,无论是在安防领域还是其他视频数据采集领域都起到了不可替代的作用。而视频AI分析功能的实现,需要高性能的服务设备、大量的软件和算法服务做支撑,频繁的数据记录存储和分析处理。导致资源消耗较大、使用成本较高,在行业里全面推广应用实行遇到困难。
一般来说为了解决服务器资源问题,需要从两个方面入手,一是提升服务器性能,二是提升服务器利用效率。前者由于需要对服务器整体的硬件设备进行提升和优化,导致成本相对较高。而后者,则只需要对现有服务器设备进行算法优化,则可以提提升服务器资源利用效率,降低服务器资源消耗,降低使用成本。
因此,研发一种高效率的AI服务器及其资源分配方法就显得尤为重要。专利申请号为CN202110916339.6A的专利文献公开了一种基于变频算例调节AI服务器资源动态分配方法,所述动态分配方法包括:数据采集服务步骤:采集不同来源的视频数据并转换为数据解析服务步骤能够解析的视频流数据;数据解析服务步骤:根据AI分析频率配置依次进行最新分析频率配置读取、最新分析频率配置解析、视频数据解析、视频图片抽帧、视频录制,生成AI分析单元数据后进行AI分析服务,并根据AI分析服务返回的结果数据进行变频分析服务。
其本质是基于AI变频分析的结果,从而实现按需供给,但由于该过程仅能针对视频流进行处理,且分析过程自身也需要消耗较多的系统资源,分配的准确率也较低。
发明内容
有鉴于此,本发明的主要目的在于提供高利用率的AI服务器及其资源分配方法,所述服务器通过单元服务器来构建服务器阵列,再创造性地根据目标任务的任务类型来获取特定数量的单元服务器进行特定形态组合,以使得执行当前任务时,能以更高效率进行,同时单元服务器也在运行时,在单元服务器组中构建均衡网络对资源利用率进行均衡,实现了AI服务器的高利用率。
为达到上述目的,本发明的技术方案是这样实现的:
高利用率的AI服务器,所述服务器包括:若干个可以彼此互联的单元服务器构成的服务器阵列和根据目标任务类型将从服务器阵列中获取单元服务器使用权限,并对获取到使用权限的单元服务器进行特定形态组合服务器组合单元。
进一步的,所述服务器阵列中的每个单元服务器具备一个服务器ID;每个单元服务器均包括一个模式分配器,当所述服务器组合单元根据目标任务类型从服务器阵列中获取单元服务器使用权限时,被获取了权限的单元服务器中的模式分配器将实时地根据目标任务类型,指定单元服务器的工作模式。
进一步的,所述每个单元服务器的每种工作模式均至少对应一种特定形态组合;单元服务器的特定形态组合的类别数大于或等于每个单元服务器的工作模式的类别数。
进一步的,所述服务器组合单元在对单元服务器进行特定形态组合时,根据目标任务类型,按照服务器ID的先后顺序,依次从服务器阵列中获取指定数量的单元服务器,然后根据目标任务类型,将获取到的单元服务器进行特定形态组合,得到单元服务器组合,单元服务器组合在运行过程中,每个单元服务器根据目标任务类型,执行对应的工作模式。
进一步的,所述每个单元服务器还包括一个均衡器;在单元服务器组合运行过程中,每个单元服务器的均衡器将组成一个均衡网络,对每个单元服务器的资源进行均衡。
一种用于高效率的AI服务器的资源分配方法,其特征在于,所述方法执行以下步骤:
步骤1:获取目标任务类型;
步骤2:基于目标任务类型从服务器阵列中获取特定数量的单元服务器;
步骤3:基于目标任务类型,将获取到的单元服务器进行特定形态组合,得到单元服务器组合;
步骤4:单元服务器组合执行目标任务,每个单元服务器根据目标任务类型,执行对应的工作模式;
步骤5:在执行目标任务过程中,对单元服务器组合中的每个单元服务器的资源进行均衡。
进一步的,所述步骤5中在执行目标任务过程中,对单元服务器组合中的每个单元服务器的资源进行均衡的方法包括:在每个单元服务器中设置均衡器,当单元服务器组合形成单元服务器组合时,每个单元服务器的均衡器与单元服务器组合内的其他单元服务器彼此互联,构成一个均衡网络,每个均衡器为均衡网络中的一个节点;在单元服务器组合执行目标任务的过程中,均衡网络对单元服务器组合中的资源利用进行动态调整,完成资源均衡。
进一步的,所述每个单元服务器的工作模式中包括的参数为:单元服务器的资源利用率上限、单元服务器的资源利用率下限,单元服务器的资源初始资源利用率和单元服务器的资源瞬时变化率。
进一步的,所述均衡网络对单元服务器组合中的资源利用进行动态调整,完成资源均衡的方法包括:均衡网络实时获取每个单元服务器在当前工作模式下的参数,并实时获取每个单元服务器实时的资源利用率,使用如下公式,计算资源利用权值:;其中,/>为单元服务器的资源利用率上限;/>为单元服务器的资源利用率下限;/>为单元服务器的资源初始资源利用率;/>为单元服务器实时的资源利用率;/>为单元服务器的资源瞬时变化率;/>为资源利用权值;/>,为每个单元服务器在当前特定形态组合下,相邻的单元服务器的数量;均衡网络根据实时计算出的资源利用权值,不断调整每个单元服务器的实时的资源利用率,使得资源利用权值不断增大,完成资源均衡。
进一步的,均衡网络根据实时计算出的资源利用权值,不断调整每个单元服务器的实时的资源利用率,使得资源利用权值不断增大,完成资源均衡的方法包括:将实时计算出的资源利用权值进行记录,并在二维坐标系下绘制资源利用权值的变化曲线,根据绘制的变化曲线,获取曲线在每个时刻下的斜率,当斜率为从正值变化为负值时对应的资源利用权值,为资源利用权值的最大值,保持该资源利用权值对应下的每个单元服务器的实时的资源利用率,完成资源均衡。
本发明的高利用率的AI服务器及其资源分配方法,具有如下有益效果:
1.效率更高:本发明的AI服务器通过单元服务器构建的服务器阵列来实现,与传统服务器不同,本发明的服务器阵列类似于一个矩阵,每个单元服务器是阵列中的一个元素,在执行目标任务时,从服务器阵列中按照顺序获取单元服务器,然后将单元服务器进行形态学整合,实现了将整个服务器资源化整为零,能够更加高效和碎片化利用服务器资源,同时形态学整合更能契合不同的目标任务类型,使得任务执行效率更高。
2.准确率更高:资源分配的准确率的影响因素时资源分配的精细化程度,若能够对资源分配更为精细化,则可以实现更为准确地效率分配,在本发明中,在每个单元服务器组内还有针对服务器资源的二次分配,使得每个单元服务器组都能以最高效率运行,进一步提升了准确率和效率。
附图说明
图1为本发明实施例提供的高利用率的AI服务器的资源分配方法的方法流程示意图;
图2为本发明实施例提供的高利用率的AI服务器及其资源分配方法的AI服务器的服务器阵列的结构示意图;
图3为本发明实施例提供的高利用率的AI服务器及其资源分配方法的一种单元服务器的特定形态组合;
图4为本发明实施例提供的高利用率的AI服务器及其资源分配方法的一种单元服务器的特定形态组合;
图5为本发明实施例提供的高利用率的AI服务器及其资源分配方法的一种单元服务器的特定形态组合;
图6为本发明实施例提供的高利用率的AI服务器及其资源分配方法的一种单元服务器的特定形态组合;
图7为本发明实施例提供的高利用率的AI服务器及其资源分配方法的一种单元服务器的特定形态组合。
具体实施方式
下面结合附图及本发明的实施例对本发明的方法作进一步详细的说明。
实施例1
参考图1、图2、图3、图4、图5、图6和图7,高利用率的AI服务器,所述服务器包括:若干个可以彼此互联的单元服务器构成的服务器阵列和根据目标任务类型将从服务器阵列中获取单元服务器使用权限,并对获取到使用权限的单元服务器进行特定形态组合服务器组合单元。
具体的,服务器阵列中每个单元服务器的功能可以是相同的,也可以是不同的。
在单元服务器的功能不同的情况下,能够执行更多类型的任务。但由于服务器功能不同,则需要根据目标任务类型,在进行单元服务器获取时,对每个单元服务器的类型进行判断,这样整个过程的复杂度会更大。
具体的,当服务器阵列中的单元服务器的种类有多种,如包括:图像服务器、视频服务器、文本服务器和语音服务器时;针对目标任务的任务类型,首先按照顺序获取单元服务器,再对获取的每个单元服务器的类型进行判断,若目标任务类型是图像任务,则将获取到的其他类型的服务器释放回服务器阵列中,仅获取图像服务器。
单元服务器是指能够独立运行的服务器单元,它们可以彼此互联,共同组成服务器阵列。单元服务器之间的互联可以通过高速网络互联,如以太网、InfiniBand等,以实现高速数据传输和通信。
针对不同的任务类型,服务器会从服务器阵列中选择合适的单元服务器进行使用,并将它们组合成特定形态的服务器组合单元。这种组合方式通常是基于任务类型和需要的资源配置进行的,以最大程度地利用服务器资源,并实现任务的高效完成。
在服务器组合单元中,单元服务器之间的通信和数据传输也需要进行高效的管理和调度。通常会采用分布式计算和并行处理技术,将任务分割成多个子任务,并由不同的单元服务器并行处理,最后将处理结果进行汇总,以提高计算效率和吞吐量。
除此之外,为了进一步提高服务器的利用率,还可以采用虚拟化技术,将物理服务器划分成多个虚拟服务器,以实现更加灵活和高效的资源管理和利用。
综上所述,高利用率的AI服务器通过多个单元服务器的组合和高效管理,实现了对服务器资源的最大化利用,从而提高了服务器的性能和吞吐量。
实施例2
在上一实施例的基础上,所述服务器阵列中的每个单元服务器具备一个服务器ID;每个单元服务器均包括一个模式分配器,当所述服务器组合单元根据目标任务类型从服务器阵列中获取单元服务器使用权限时,被获取了权限的单元服务器中的模式分配器将实时地根据目标任务类型,指定单元服务器的工作模式。
具体的,服务器ID标志了每个单元服务器在服务器中的顺序,在被获取时,按照顺序从服务器阵列中获取单元服务器。
每个单元服务器都具备一个服务器ID,这个ID通常是用来标识服务器的唯一性和身份,以便服务器阵列可以准确地识别和管理每个单元服务器。
此外,每个单元服务器还包括一个模式分配器,这个模式分配器的作用是根据目标任务类型,为单元服务器指定相应的工作模式。这个工作模式通常包括不同的硬件和软件配置,以满足不同任务的需求和要求。
当服务器组合单元从服务器阵列中获取单元服务器使用权限时,模式分配器会实时地根据目标任务类型,指定单元服务器的工作模式。这个工作模式通常包括CPU、GPU、内存等硬件配置和操作系统、编程语言等软件配置。模式分配器可以根据任务的需求和要求,自动选择和调整单元服务器的工作模式,以最大程度地满足任务的需求和要求,同时保证服务器资源的高效利用。
例如,在进行图像识别任务时,模式分配器可以为单元服务器指定使用GPU进行加速计算,以提高图像识别的速度和精度;而在进行数据分析任务时,模式分配器可以为单元服务器指定使用大内存进行存储和处理,以满足数据分析任务对内存的需求和要求。
实施例3
在上一实施例的基础上,所述每个单元服务器的每种工作模式均至少对应一种特定形态组合;单元服务器的特定形态组合的类别数大于或等于每个单元服务器的工作模式的类别数。
具体的,特定形态组合与目标任务类型相对应。在实践中,根据目标任务的类型,这些单元服务器的组合形态将显著影响执行每个任务的效率。如在执行对并行要求更高时,单元服务器对称并行,则更能提升任务执行效率。又如有的任务执行时,需要现对数据流进行处理,然后再并行处理,此时就需要先单一的单元服务器,然后将单元服务器并联来提升效率。
在所述高利用率的AI服务器中,每个单元服务器都可以支持多种不同的工作模式,这些工作模式通常是根据任务类型和需要的资源配置进行选择和配置的。而每种工作模式都至少对应一种特定形态组合,以便服务器组合单元可以根据任务类型和需要的资源配置,选择相应的特定形态组合,以实现对服务器资源的高效利用和管理。
例如,在进行深度学习任务时,一个单元服务器可以支持CPU、GPU、FPGA等不同的工作模式,每种工作模式都对应着不同的硬件和软件配置,以满足不同深度学习模型的计算需求。而每种工作模式都至少对应一种特定形态组合,如使用多个CPU和GPU协同计算,或者使用FPGA加速计算等。
需要注意的是,单元服务器的特定形态组合的类别数大于或等于每个单元服务器的工作模式的类别数。这是因为一个特定形态组合通常可以同时支持多种不同的工作模式,以满足不同任务的需求和要求。例如,一个特定形态组合可以同时支持CPU、GPU和FPGA等不同的工作模式,以便服务器组合单元可以根据任务类型和需要的资源配置,灵活地选择和调整工作模式,以最大程度地满足任务的需求和要求。
综上所述,每个单元服务器的每种工作模式都至少对应一种特定形态组合,而单元服务器的特定形态组合的类别数大于或等于每个单元服务器的工作模式的类别数。这种设计可以最大程度地利用服务器资源,实现高性能和高吞吐量的目的。
实施例4
在上一实施例的基础上,所述服务器组合单元在对单元服务器进行特定形态组合时,根据目标任务类型,按照服务器ID的先后顺序,依次从服务器阵列中获取指定数量的单元服务器,然后根据目标任务类型,将获取到的单元服务器进行特定形态组合,得到单元服务器组合,单元服务器组合在运行过程中,每个单元服务器根据目标任务类型,执行对应的工作模式。
具体的,目标任务类型的不同,将使用不同的工作模式。每个工作模式具备的参数,针对不同任务类型,将能提升任务的执行效率。
在所述高利用率的AI服务器中,服务器组合单元在对单元服务器进行特定形态组合时,通常会根据目标任务类型,按照服务器ID的先后顺序,依次从服务器阵列中获取指定数量的单元服务器。获取到的单元服务器会根据目标任务类型,进行特定形态的组合,以满足任务的需求和要求。
具体来说,服务器组合单元通常会先根据任务类型和需要的资源配置,计算出所需的单元服务器数量和每个单元服务器的工作模式,然后按照服务器ID的先后顺序,依次从服务器阵列中获取指定数量的单元服务器,以满足任务的需求和要求。获取到的单元服务器会根据目标任务类型,进行特定形态的组合,以实现对服务器资源的高效利用和管理。
例如,在进行图像识别任务时,服务器组合单元可以先计算出所需的单元服务器数量和每个单元服务器的工作模式,如使用多个GPU加速计算。然后按照服务器ID的先后顺序,依次从服务器阵列中获取指定数量的GPU服务器,进行特定形态的组合,以实现对GPU资源的最大化利用。
在单元服务器组合运行过程中,每个单元服务器都会根据目标任务类型,执行对应的工作模式,以实现任务的高效完成。单元服务器之间通常会通过高速网络互联,如以太网、InfiniBand等,以实现高速数据传输和通信,从而进一步提高服务器的性能和吞吐量。
实施例5
在上一实施例的基础上,所述每个单元服务器还包括一个均衡器;在单元服务器组合运行过程中,每个单元服务器的均衡器将组成一个均衡网络,对每个单元服务器的资源进行均衡。
在所述高利用率的AI服务器中,每个单元服务器还包括一个均衡器,这个均衡器的作用是在单元服务器组合运行过程中,对每个单元服务器的资源进行均衡,以实现更加高效的任务处理和资源利用。
具体来说,单元服务器组合中的每个单元服务器都可以执行不同的任务,而这些任务通常需要不同的计算资源,如CPU、GPU、内存等。而均衡器可以监测每个单元服务器的资源利用情况,并根据需要进行资源调度和均衡,以保证每个单元服务器的资源利用均衡和最大化。
在单元服务器组合运行过程中,每个单元服务器的均衡器将组成一个均衡网络,通过网络中的消息传递和协作,实现对每个单元服务器的资源进行均衡。例如,当某个单元服务器的CPU利用率过高时,均衡器可以通过网络消息向其他空闲的单元服务器请求CPU资源,并将请求到的资源分配给需要的任务进行处理,以实现CPU资源的均衡和最大化利用。
需要注意的是,均衡器需要考虑多个因素进行资源调度和均衡,如任务类型、资源需求、网络负载等,以实现对单元服务器资源的最优化调度和均衡。此外,在单元服务器组合中,均衡器还需要考虑数据的传输和通信效率,以实现高效的数据传输和通信,从而进一步提高服务器的性能和吞吐量。
实施例6
一种高效率的AI服务器的资源分配方法,其特征在于,所述方法执行以下步骤:
步骤1:获取目标任务类型;
步骤2:基于目标任务类型从服务器阵列中获取特定数量的单元服务器;
步骤3:基于目标任务类型,将获取到的单元服务器进行特定形态组合,得到单元服务器组合;
步骤4:单元服务器组合执行目标任务,每个单元服务器根据目标任务类型,执行对应的工作模式;
步骤5:在执行目标任务过程中,对单元服务器组合中的每个单元服务器的资源进行均衡。
具体的,本发明的AI服务器通过单元服务器构建的服务器阵列来实现,与传统服务器不同,本发明的服务器阵列类似于一个矩阵,每个单元服务器是阵列中的一个元素,在执行目标任务时,从服务器阵列中按照顺序获取单元服务器,然后将单元服务器进行形态学整合,实现了将整个服务器资源化整为零,能够更加高效和碎片化利用服务器资源,同时形态学整合更能契合不同的目标任务类型,使得任务执行效率更高。
实施例7
在上一实施例的基础上,所述步骤5中在执行目标任务过程中,对单元服务器组合中的每个单元服务器的资源进行均衡的方法包括:在每个单元服务器中设置均衡器,当单元服务器组合形成单元服务器组合时,每个单元服务器的均衡器与单元服务器组合内的其他单元服务器彼此互联,构成一个均衡网络,每个均衡器为均衡网络中的一个节点;在单元服务器组合执行目标任务的过程中,均衡网络对单元服务器组合中的资源利用进行动态调整,完成资源均衡。
所述步骤5中,在执行目标任务过程中,对单元服务器组合中的每个单元服务器的资源进行均衡的方法,通常包括以下两个关键步骤:
在每个单元服务器中设置均衡器,构成一个均衡网络。
在这一步骤中,为了实现对单元服务器组合中的每个单元服务器的资源进行均衡,每个单元服务器都会设置一个均衡器,当单元服务器组合形成单元服务器组合时,每个单元服务器的均衡器与单元服务器组合内的其他单元服务器彼此互联,构成一个均衡网络,每个均衡器为均衡网络中的一个节点。均衡器通常是一个软件组件,用于监测每个单元服务器的资源利用情况,并根据需要进行资源调度和均衡。
在单元服务器组合执行目标任务的过程中,均衡网络对单元服务器组合中的资源利用进行动态调整,完成资源均衡。
在这一步骤中,均衡网络会监测每个单元服务器的资源利用情况,并根据需要进行资源调度和均衡,以保证每个单元服务器的资源利用均衡和最大化。例如,当某个单元服务器的CPU利用率过高时,均衡器可以通过网络消息向其他空闲的单元服务器请求CPU资源,并将请求到的资源分配给需要的任务进行处理,以实现CPU资源的均衡和最大化利用。均衡网络通常会考虑多个因素进行资源调度和均衡,如任务类型、资源需求、网络负载等,以实现对单元服务器资源的最优化调度和均衡。
需要注意的是,均衡网络需要考虑数据的传输和通信效率,以实现高效的数据传输和通信,从而进一步提高服务器的性能和吞吐量。此外,均衡网络还需要考虑安全性和可靠性,以确保服务器的运行稳定和安全。
实施例8
在上一实施例的基础上,所述每个单元服务器的工作模式中包括的参数为:单元服务器的资源利用率上限、单元服务器的资源利用率下限,单元服务器的资源初始资源利用率和单元服务器的资源瞬时变化率。
具体的,资源分配的准确率的影响因素时资源分配的精细化程度,若能够对资源分配更为精细化,则可以实现更为准确地效率分配,在本发明中,在每个单元服务器组内还有针对服务器资源的二次分配,使得每个单元服务器组都能以最高效率运行,进一步提升了准确率和效率。
在所述高效率的AI服务器中,每个单元服务器的工作模式中包括的参数为单元服务器的资源利用率上限、单元服务器的资源利用率下限、单元服务器的资源初始资源利用率和单元服务器的资源瞬时变化率。这些参数用于控制和调整单元服务器的资源利用情况,以实现对单元服务器的最优化利用和管理。
具体来说,单元服务器的资源利用率上限和下限用于控制单元服务器的资源利用范围,以避免资源浪费和过度利用的情况。资源初始利用率则用于确定单元服务器的起始状态,而资源瞬时变化率则用于监测和调整单元服务器资源利用的变化情况,以实现对单元服务器的动态管理和调度。
同时,为了进一步提高资源分配的准确率和效率,本发明中采用了针对服务器资源的二次分配。具体来说,在每个单元服务器组内,还会进行一次资源分配和调度,以使得每个单元服务器组都能以最高效率运行。这种二次分配的过程通常会考虑多个因素,如任务类型、服务器资源需求、网络负载等,以实现对单元服务器资源的最优化利用和调度,从而进一步提高服务器的性能和吞吐量。
综上所述,所述高效率的AI服务器中,每个单元服务器的工作模式中包括单元服务器的资源利用率上限、单元服务器的资源利用率下限、单元服务器的资源初始资源利用率和单元服务器的资源瞬时变化率,用于控制和调整单元服务器的资源利用情况,以实现对单元服务器的最优化利用和管理。同时,采用针对服务器资源的二次分配,进一步提高了准确率和效率。
实施例9
在上一实施例的基础上,所述均衡网络对单元服务器组合中的资源利用进行动态调整,完成资源均衡的方法包括:均衡网络实时获取每个单元服务器在当前工作模式下的参数,并实时获取每个单元服务器实时的资源利用率,使用如下公式,计算资源利用权值:;其中,/>为单元服务器的资源利用率上限;/>为单元服务器的资源利用率下限;/>为单元服务器的资源初始资源利用率;/>为单元服务器实时的资源利用率;/>为单元服务器的资源瞬时变化率;/>为资源利用权值;/>,为每个单元服务器在当前特定形态组合下,相邻的单元服务器的数量;均衡网络根据实时计算出的资源利用权值,不断调整每个单元服务器的实时的资源利用率,使得资源利用权值不断增大,完成资源均衡。
实施例10
在上一实施例的基础上,均衡网络根据实时计算出的资源利用权值,不断调整每个单元服务器的实时的资源利用率,使得资源利用权值不断增大,完成资源均衡的方法包括:将实时计算出的资源利用权值进行记录,并在二维坐标系下绘制资源利用权值的变化曲线,根据绘制的变化曲线,获取曲线在每个时刻下的斜率,当斜率为从正值变化为负值时对应的资源利用权值,为资源利用权值的最大值,保持该资源利用权值对应下的每个单元服务器的实时的资源利用率,完成资源均衡。
在所述高效率的AI服务器中,均衡网络根据实时计算出的资源利用权值,不断调整每个单元服务器的实时的资源利用率,使得资源利用权值不断增大,完成资源均衡的方法采用了一种基于变化曲线斜率的自适应调节方法。具体地,均衡网络会将实时计算出的资源利用权值进行记录,并在二维坐标系下绘制资源利用权值的变化曲线。然后,根据绘制的变化曲线,获取曲线在每个时刻下的斜率,并找到斜率从正值变化为负值时对应的资源利用权值,将该权值设为资源利用权值的最大值。最后,保持该资源利用权值对应下的每个单元服务器的实时的资源利用率,以完成资源均衡。
具体地,当单元服务器组合中的资源利用不平衡时,均衡网络会不断调整每个单元服务器的实时资源利用率,以尽可能地使资源利用权值增大。在不同的时刻,资源利用权值的变化曲线会呈现不同的斜率,其中斜率较大的部分表示资源利用率的变化速度较快,斜率较小的部分表示资源利用率的变化速度较慢。因此,在资源利用权值变化曲线的斜率变化处,可以找到一个最优的资源利用权值,使得该权值下的资源利用率最为均衡和高效。具体来说,当斜率从正值变化为负值时,就意味着资源利用率的变化速度开始变缓,此时对应的资源利用权值就是最优的资源利用权值,可以保持该权值下的每个单元服务器的实时资源利用率,以完成资源均衡。
需要说明的是,上述实施例提供的系统,仅以上述各功能单元的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能单元来完成,即将本发明实施例中的单元或者步骤再分解或者组合,例如,上述实施例的单元可以合并为一个单元,也可以进一步拆分成多个子单元,以完成以上描述的全部或者单元功能。对于本发明实施例中涉及的单元、步骤的名称,仅仅是为了区分各个单元或者步骤,不视为对本发明的不当限定。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应能够意识到,结合本文中所公开的实施例描述的各示例的单元、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件单元、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“另一部分”等是配置用于区别类似的对象,而不是配置用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者单元/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者单元/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术标记作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述,仅为本发明的较佳实施例而已,并非配置用于限定本发明的保护范围。
Claims (8)
1.高利用率的AI服务器,其特征在于,所述服务器包括:若干个可以彼此互联的单元服务器构成的服务器阵列和根据目标任务类型将从服务器阵列中获取单元服务器使用权限,并对获取到使用权限的单元服务器进行特定形态组合服务器组合单元;所述每个单元服务器还包括一个均衡器;在单元服务器组合运行过程中,每个单元服务器的均衡器将组成一个均衡网络,对每个单元服务器的资源进行均衡;
2.如权利要求1所述高利用率的AI服务器,其特征在于,所述服务器阵列中的每个单元服务器具备一个服务器ID;每个单元服务器均包括一个模式分配器,当所述服务器组合单元根据目标任务类型从服务器阵列中获取单元服务器使用权限时,被获取了权限的单元服务器中的模式分配器将实时地根据目标任务类型,指定单元服务器的工作模式。
3.如权利要求2所述高利用率的AI服务器,其特征在于,所述每个单元服务器的每种工作模式均至少对应一种特定形态组合;单元服务器的特定形态组合的类别数大于或等于每个单元服务器的工作模式的类别数。
4.如权利要求3所述高利用率的AI服务器,其特征在于,所述服务器组合单元在对单元服务器进行特定形态组合时,根据目标任务类型,按照服务器ID的先后顺序,依次从服务器阵列中获取指定数量的单元服务器,然后根据目标任务类型,将获取到的单元服务器进行特定形态组合,得到单元服务器组合,单元服务器组合在运行过程中,每个单元服务器根据目标任务类型,执行对应的工作模式。
5.如权利要求1所述的高利用率的AI服务器,其特征在于,均衡网络根据实时计算出的资源利用权值,不断调整每个单元服务器的实时的资源利用率,使得资源利用权值不断增大,完成资源均衡的方法包括:将实时计算出的资源利用权值进行记录,并在二维坐标系下绘制资源利用权值的变化曲线,根据绘制的变化曲线,获取曲线在每个时刻下的斜率,当斜率为从正值变化为负值时对应的资源利用权值,为资源利用权值的最大值,保持该资源利用权值对应下的每个单元服务器的实时的资源利用率,完成资源均衡。
6.一种用于权利要求1至5之一所述高利用率的AI服务器的资源分配方法,其特征在于,所述方法执行以下步骤:
步骤1:获取目标任务类型;
步骤2:基于目标任务类型从服务器阵列中获取特定数量的单元服务器;
步骤3:基于目标任务类型,将获取到的单元服务器进行特定形态组合,得到单元服务器组合;
步骤4:单元服务器组合执行目标任务,每个单元服务器根据目标任务类型,执行对应的工作模式;
步骤5:在执行目标任务过程中,对单元服务器组合中的每个单元服务器的资源进行均衡。
7.如权利要求6所述的方法,其特征在于,所述步骤5中在执行目标任务过程中,对单元服务器组合中的每个单元服务器的资源进行均衡的方法包括:在每个单元服务器中设置均衡器,当单元服务器组合形成单元服务器组合时,每个单元服务器的均衡器与单元服务器组合内的其他单元服务器彼此互联,构成一个均衡网络,每个均衡器为均衡网络中的一个节点;在单元服务器组合执行目标任务的过程中,均衡网络对单元服务器组合中的资源利用进行动态调整,完成资源均衡。
8.如权利要求6所述的方法,其特征在于,所述每个单元服务器的工作模式中包括的参数为:单元服务器的资源利用率上限、单元服务器的资源利用率下限,单元服务器的资源初始资源利用率和单元服务器的资源瞬时变化率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310344475.1A CN116048821B (zh) | 2023-04-03 | 2023-04-03 | 高利用率的ai服务器及其资源分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310344475.1A CN116048821B (zh) | 2023-04-03 | 2023-04-03 | 高利用率的ai服务器及其资源分配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116048821A CN116048821A (zh) | 2023-05-02 |
CN116048821B true CN116048821B (zh) | 2023-06-16 |
Family
ID=86125909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310344475.1A Active CN116048821B (zh) | 2023-04-03 | 2023-04-03 | 高利用率的ai服务器及其资源分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116048821B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102088735A (zh) * | 2010-03-24 | 2011-06-08 | 电信科学技术研究院 | 子帧间的业务负荷均衡处理及小区间干扰处理方法及设备 |
CN112416516A (zh) * | 2020-11-20 | 2021-02-26 | 中国电子科技集团公司第二十八研究所 | 一种面向资源效用提升的云数据中心资源调度方法 |
CN113010576A (zh) * | 2021-03-19 | 2021-06-22 | 中国建设银行股份有限公司 | 云计算系统容量评估的方法、装置、设备和存储介质 |
CN113946436A (zh) * | 2021-07-29 | 2022-01-18 | 西北大学 | 一种基于负载均衡的资源预调度方法 |
CN115408152A (zh) * | 2022-08-23 | 2022-11-29 | 吉兴信(广东)信息技术有限公司 | 一种自适应资源匹配获取方法及系统 |
US11561815B1 (en) * | 2020-02-24 | 2023-01-24 | Amazon Technologies, Inc. | Power aware load placement |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3879471B2 (ja) * | 2001-10-10 | 2007-02-14 | 株式会社日立製作所 | 計算機資源割当方法 |
-
2023
- 2023-04-03 CN CN202310344475.1A patent/CN116048821B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102088735A (zh) * | 2010-03-24 | 2011-06-08 | 电信科学技术研究院 | 子帧间的业务负荷均衡处理及小区间干扰处理方法及设备 |
US11561815B1 (en) * | 2020-02-24 | 2023-01-24 | Amazon Technologies, Inc. | Power aware load placement |
CN112416516A (zh) * | 2020-11-20 | 2021-02-26 | 中国电子科技集团公司第二十八研究所 | 一种面向资源效用提升的云数据中心资源调度方法 |
CN113010576A (zh) * | 2021-03-19 | 2021-06-22 | 中国建设银行股份有限公司 | 云计算系统容量评估的方法、装置、设备和存储介质 |
CN113946436A (zh) * | 2021-07-29 | 2022-01-18 | 西北大学 | 一种基于负载均衡的资源预调度方法 |
CN115408152A (zh) * | 2022-08-23 | 2022-11-29 | 吉兴信(广东)信息技术有限公司 | 一种自适应资源匹配获取方法及系统 |
Non-Patent Citations (3)
Title |
---|
Cloud control with distributed rate limiting;Barath Raghavan 等;《ACM SIGCOMM Computer Communication Review》;第37卷(第4期);337-348 * |
Dynamic load balancing algorithm for balancing the workload among virtual machine in cloud computing;Mohit Kumar 等;《Procedia Computer Science》;第115卷;322-329 * |
基于深度强化学习的服务功能链映射算法;金明 等;《计算机应用研究》;第37卷(第11期);3456-3460,3466 * |
Also Published As
Publication number | Publication date |
---|---|
CN116048821A (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nabavinejad et al. | Coordinated batching and DVFS for DNN inference on GPU accelerators | |
CN110096349B (zh) | 一种基于集群节点负载状态预测的作业调度方法 | |
Liu et al. | Job scheduling model for cloud computing based on multi-objective genetic algorithm | |
Xu et al. | Cnn partitioning and offloading for vehicular edge networks in web3 | |
CN105550323B (zh) | 一种分布式数据库负载均衡预测方法和预测分析器 | |
CN112835698B (zh) | 一种基于异构集群的请求分类处理的动态负载均衡方法 | |
Nazir et al. | Cuckoo optimization algorithm based job scheduling using cloud and fog computing in smart grid | |
CN105260235A (zh) | 一种云平台中基于应用场景的资源调度方法及装置 | |
CN115718644A (zh) | 一种面向云数据中心的计算任务跨区迁移方法及系统 | |
CN105488134A (zh) | 大数据处理方法及大数据处理装置 | |
CN116467076A (zh) | 一种基于集群可用资源的多集群调度方法及系统 | |
CN116185645A (zh) | 基于神经网络的集群资源智能调度方法、系统及存储介质 | |
CN107301094A (zh) | 面向大规模动态事务查询的动态自适应数据模型 | |
CN116048821B (zh) | 高利用率的ai服务器及其资源分配方法 | |
CN103220363A (zh) | 基于云计算的分布式网络培训资源管理系统及调度方法 | |
CN118138590A (zh) | 一种数据中心负载均衡方法 | |
Senthilkumar et al. | Energy aware task scheduling using hybrid firefly-GA in big data | |
Al-Dulaimy et al. | Job submission in the cloud: energy aware approaches | |
CN116668442A (zh) | 一种意图驱动的网云资源高精度协同调度系统及方法 | |
CN111539863A (zh) | 一种基于多源任务线的智能城市运行的方法和系统 | |
CN107239341A (zh) | 一种资源折算方法、系统及虚拟机资源调度系统 | |
CN113806077A (zh) | 基于人工智能的数据中心服务器调控方法及装置 | |
US20150263958A1 (en) | Load balancing apparatus and method | |
CN116795546B (zh) | 面向信息物理生产系统的确定性网算容器设计与实现方法 | |
Bi et al. | Resource Load Prediction of Internet of Vehicles Mobile Cloud Computing. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |