CN114938372B - 一种基于联邦学习的微网群请求动态迁移调度方法及装置 - Google Patents
一种基于联邦学习的微网群请求动态迁移调度方法及装置 Download PDFInfo
- Publication number
- CN114938372B CN114938372B CN202210549821.5A CN202210549821A CN114938372B CN 114938372 B CN114938372 B CN 114938372B CN 202210549821 A CN202210549821 A CN 202210549821A CN 114938372 B CN114938372 B CN 114938372B
- Authority
- CN
- China
- Prior art keywords
- request
- micro
- local
- edge computing
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000005012 migration Effects 0.000 title claims abstract description 38
- 238000013508 migration Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000013210 evaluation model Methods 0.000 claims abstract description 36
- 230000005540 biological transmission Effects 0.000 claims abstract description 22
- 230000008901 benefit Effects 0.000 claims abstract description 17
- 230000002787 reinforcement Effects 0.000 claims abstract description 17
- 230000007774 longterm Effects 0.000 claims abstract description 14
- 238000013468 resource allocation Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 26
- 150000001875 compounds Chemical class 0.000 claims description 19
- 230000002776 aggregation Effects 0.000 claims description 16
- 238000004220 aggregation Methods 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 230000009471 action Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 230000005055 memory storage Effects 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 230000005577 local transmission Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0893—Assignment of logical groups to network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5041—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
- H04L41/5051—Service on demand, e.g. definition and deployment of services in real time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/20—Network architectures or network communication protocols for network security for managing network security; network security policies in general
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Mobile Radio Communication Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于联邦学习的微网群请求动态迁移调度方法及装置,包括:对包括微网群设备和边缘计算设备的微网群系统进行初始化;各个微网群设备利用深度强化学习方法并基于本地历史运行数据对本地学习模型进行训练,并将训练后的模型参数和本地训练次数发送边缘计算设备;边缘计算设备基于本地训练次数对接收到的模型参数进行聚合以更新请求评估模型,并将更新后的请求评估模型发送各微网群设备;微网群设备根据更新后的请求评估模型,在请求调度决策时以最大化长期效益期望为目标预测资源分配策略,资源分配策略包括请求迁移决策和资源单元数量决策。本发明可以在节省传输开销保证了数据隐私与安全的同时,也还确保了决策的准确高效。
Description
技术领域
本发明属于计算机网络技术领域,具体涉及一种基于联邦学习的微网群请求动态迁移调度方法及装置。
背景技术
作为单个微网的丰富扩展,微网群由地理位置毗邻的多个微网互相联结而成,它作为一个可以调度的自立的整体,可以实现离网与并网运行,成功解决单个微网存在的抗扰动能力差、工作能力有限等缺点。信息交互、功率传输广泛存在于微网群之间,各微网在不同运行状态下使得集群呈现多样的运行模式。在特点上,微网群能贯穿能源运营、供应、消费等不同环节,并且具备利益主体多元化的特点。面对微网集群复杂的环境,微网群运营主体需要通过部署大量的微网设备来协同控制协调各微网主体的利益。这些分布在微网集群中的各式异构微网设备在给通信网络带来巨大考验的同时,其对网络环境、数据安全隐私保护等也提出了新的挑战。为了应对这些新的挑战,边缘计算技术被引入其中。通过该技术,微网集群设备之间的通信得以更好地协调,并可以将某处微网中的部分请求动态迁移到微网群中的其他微网中。不过,在这样的模式下微网群依旧存在不少问题,如何更好地调度请求以达到对资源的合理利用,并且加强数据隐私安全方面的保护已经成为一个亟待解决的挑战。
在处理微网群请求调度资源分配问题时,使用凸优化、博弈论等方法存着诸如需要获取全局信息而造成的数据泄露,无法适应复杂高度变化的微网群环境,以及无法综合考虑系统长期利益来综合决策等问题。单纯使用深度强化学习虽然能解决上述不足,但是由于各微网群中微网设备算力不足,只能支撑轻量级的神经网络。当今,随着数据安全和隐私得到了更多人的重视,对数据隐私的保护已经成为一个迫切且重要的问题。传统的分布式训练虽然一定程度上缓和了微网群中微网设备的算力不足问题,但是其需要较为频繁地传输大量数据到其它设备,一方面会对网络环境的质量要求较高,产生大量的传输成本,一方面在训练时间上不尽人意,同时也会导致数据隐私的泄露等问题的发生。因此,如何在微网群中微网设备算力受限的基础上高效地利用数据,减少传输成本且同时保障数据隐私与安全是目前处理微网群请求调度资源分配问题的重要挑战。
发明内容
针对以上问题,本发明提出了一种基于联邦学习的微网群请求动态迁移调度方法及装置,通过在基于边缘计算的微群网场景中应用联邦学习的分布式训练方法指导微网群系统各个微网设备上的深度强化学习代理,实现在保护数据隐私的同时动态迁移调度微网群场景下的请求,解决了传统方法带来巨大的流量负载压力、较高的传输时延、数据隐私泄露等问题。为解决以上技术问题,本发明所采用的技术方案如下:
一种基于联邦学习的微网群请求动态迁移调度方法,包括如下步骤:
S1,对边缘计算支持下的微网群系统进行初始化,所述微网群系统包括微网群设备和边缘计算设备的微网群系统;
S2,各个微网群设备利用深度强化学习方法并基于本地历史运行数据对本地学习模型进行训练,并将训练后的本地学习模型参数和本地训练次数上传到边缘计算设备n′;
S3,边缘计算设备基于本地训练次数对接收到的本地学习模型参数进行聚合以更新请求评估模型,并将更新后的请求评估模型分发各微网群设备;
S4,微网群设备根据更新后的请求评估模型,在请求调度决策时以最大化长期效益期望为目标预测资源分配策略,所述资源分配策略包括请求迁移决策和资源单元数量决策;
S5,当微网群设备数量变化时,边缘计算设备n′对请求评估模型的模型参数进行更新。
所述步骤S2包括如下步骤:
S2.1,各微网群设备取出各自记忆存储单元中的本地历史运行数据;
所述本地历史运行数据的表达式为:
(s,a,r,s′);
式中,s表示当前环境下的状态观测值,包括边缘计算设备n′的请求处理队列的当前队列长度、边缘计算设备n′的资源序列中的剩余资源单元、当前请求所需的CPU频率、自身网络连接状态,a表示动作,也即请求迁移决策和资源单元数量决策,r表示执行动作a后的奖励,s′表示新环境下的状态观测值;
S2.2,使用均方差定义损失函数,损失函数的公式为:
L(w)=E[(R+γ·maxa′Q(s′,a′,w′)-Q(s,a,w))2];
式中,L(w)表示损失函数,R表示回报,也即奖励r的衰减累加,γ表示衰减系数,Q(s,a,w)表示训练所用的参数w的神经网络预测的Q值,maxa′Q(s′,a′,w′)表示神经网络参数更新为w′时的状态s的下一状态s′基于动作a′的最大Q值
S2.3,微网群设备利用DQN算法进行本地学习模型的训练,同时使用梯度下降法更新神经网络的参数w以获得最佳Q值;
S2.4,微网群设备将更新后的本地学习模型的参数以及本地训练的次数上传至边缘计算设备n′。
所述步骤S3包括如下步骤:
S3.1,边缘计算设备n′对每个微网群设备的本地训练次数分别进行统计;
S3.2,边缘计算设备n′根据统计后的本地训练次数对接收到的模型参数进行聚合;
式中,αt+1表示第t轮聚合后的请求评估模型,表示t轮时微网群设备m在当前t轮周期内训练的次数,Ht表示M个微网群设备的在当前t轮周期内训练次数的加和,表示第t轮训练后本地学习模型的参数,t表示训练的周期轮数,Pt表示第t轮聚合时随机抽取的微网群设备的集合;
S3.3,边缘计算设备n′将步骤S3.2聚合后得到的请求评估模型分发给各微网群设备。
在步骤S4中,所述最大化长期效益期望的表达式为:
所述网络状态Vi的表达式为:
i时间片下的直接效用g(Vi,Φ(Vi))的计算公式为:
式中,w1表示请求执行延迟di的权重,w2表示请求排队延迟ci的权重,w3表示请求丢弃数ηi的权重,w4表示占用边缘设备花销φi的权重;
所述请求执行延迟di的计算公式为:
式中,表示i时间片下本地执行请求的时间消耗,hi表示i时间片下的切换延迟,表示i时间片下请求从本地传输到对应的边缘计算设备的时间开销,v表示请求卸载到边缘计算设备执行时所产生的延迟,μi表示资源单元数量决策,xi表示请求迁移决策,表示边缘计算设备的集合。
式中,ri表示i时间片下的数据传输速率,α表示加载请求所需要传输的数据大小;
所述i时间片下的数据传输速率ri的计算公式为:
所述占用边缘设备花销φi的计算公式为:
式中,η表示时间片的持续时长,v表示连接切换延迟,π表示占用边缘计算设备单位时间的价格。
所述请求排队延迟ci的计算公式为:
所述请求丢弃数ηi的计算公式为:
一种基于联邦学习的微网群请求动态迁移调度装置,包括边缘计算设备和微网群设备,微网群设备上设有本地训练模块和策略生成模块,边缘计算设备上设有边缘聚合模块;
本地训练模块,用于接收边缘计算设备n′所发送的请求评估模型参数,基于深度强化学习方法结合本地历史运行数据进行本地学习模型的训练,并将训练后的本地学习模型参数和本地训练次数发送给边缘计算设备n′;
边缘聚合模块,用于接收本地学习模型参数和本地训练次数,根据各个微网群设备的本地训练次数对本地学习模型参数进行聚合以更新请求评估模型,并将更新后的请求评估模型发送到微网群设备;
策略生成模块,用于根据更新后的请求评估模型,并以最大化长期效益期望为目标生成请求迁移决策和资源单元数量决策。
本发明的有益效果:
在微网群的场景下用微网群设备的训练模型参数代替原始数据进行传输,边缘计算设备再进一步聚合模型参数,从而达到减轻单一设备上的训练压力并同时保障数据的隐私安全;结合深度强化学习与联邦训练实现的请求动态迁移调度策略,在大大节省传输开销保证了数据的隐私与安全的同时,也做到了微网群在决策上的准确高效。另外,本发明考虑了用户对算法优化目标的不同需求,提供了通过权重参数调整的接口来允许对不同的目标进行定制化设计,例如如果更注重请求运行的总延迟,则可以提升请求排队延迟和请求执行延迟的权重。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为微网群系统的架构示意图。
图2为不同请求处理策略的对比图。
图3为本发明的训练示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
边缘计算(Edge Computing):边缘计算一般是将边缘节点分布式地部署到各个区域,从而可就近为用户提供一系列如计算、存储、网络等方面的服务。凭借边缘节点在地理位置上的优势,可以大大缩短用户与服务设备之间因为网络通信产生的时延。又因为边缘节点可以在本地对用户的请求提供服务,这大大减轻了云端服务供给的压力,从而缓和了主干网的流量压力并且同时保障了数据隐私的安全。考虑到用户一侧的终端具有多元化的特点,类似于计算密集型等任务一般无法在其本身设备上执行,这时便可将这类型的任务交给资源比终端更为丰富的边缘节点来处理。且又由于边缘节点在地理位置上与其服务的终端用户较为靠近,其响应速度会比将任务交由云中心处理更为快速。通过边缘计算技术,可以达到在保证任务顺利完成的同时尽可能减少通信时延。
深度强化学习(Deep Reinforcement Learning):强化学习通过采取对多类不同动作的决策进行尝试,并结合具体动作带来的奖励情况来动态调整之后的决策。深度学习是一种通过构建神经网络来对数据信息进行表征的方式。深度强化学习通过将强化学习与深度学习的高维输入相融合成功解决了单一强化学习无法处理高维度数据问题,并保留了强化学习出色的决策能力和深度学习强大的感知能力,目前已经在计算机视觉、商业管理、自然语言处理、游戏等各个领域大放光彩。
联邦学习(Federated Learning):联邦学习通过对局部自治体模型、梯度信息进行加密与封装后整合训练并进一步学习,从而达到在保护数据隐私安全的同时进行全局优化。联邦学习也称共享学习,它在对训练模型进行汇聚的过程中无需获取各本地设备上的原始数据,而是将各个微网设备的训练模型在加密和封装处理以后进行参数上的交换,从而也起到数据隐私保护的效果。不同的微网群可以借助联邦学习的架构共享加密封装处理完的模型,并且进一步结合整个联邦学习中有效的数据信息来提升各微网训练模型的决策表现。
一种基于联邦学习的微网群请求动态迁移调度方法,如图3所示,包括如下步骤:
S1,对边缘计算支持下的微网群系统进行初始化,所述微网群系统包括微网群设备和边缘计算设备,包括如下步骤:
S1-1,构建包括微网群设备和边缘计算设备的微网群系统;
S1.2,对微网群设备的本地学习模型以及边缘计算设备n′的请求评估模型的聚合权重进行初始化。
如图1所示,所述微网群设备是由智能电网中的各智能体设备组成,微网群设备的集合采用表示,边缘计算设备的集合采用表示,且具体地,可以采用集合中计算能力最强的边缘计算设备也即边缘计算设备n′,实现请求评估模型的聚合更新。微网群设备生成的请求任务,以下简称请求,其采用(α,β)表示,α表示加载请求所需要传输的数据大小,β则表示处理请求所需要的CPU周期数,微网群系统中采用请求处理队列以先进先出暂存待处理的请求,当请求处理队列已满时,队列将无法保存新生成的请求,请求处理队列的最大长度采用表示,资源序列用于保存资源单元,资源序列的最大长度采用表示。本申请采用时间片的概念将时间划分为以i为索引的多个阶段,每个阶段的持续时长均为η秒。
如图2所示,对于微网群设备所产生的请求由两种处理方式:选择在该微网群设备本地执行,从而避免由传输数据带来的额外延迟;迁移到信道带宽为Z的边缘计算设备也即边缘节点上,借助其更为丰富资源和算力处理请求。微网群系统需要在i时间片进行决策,通过请求评估模型生成包括请求迁移决策和资源单元数量决策的资源分配策略,进而决定采用哪种处理方式处理请求。资源单元数量决策采用μi表示,当μi=0,请求将滞留在请求处理队列中,当μi>0,请求被正常执行,请求被正常执行时,微网群系统所分配的资源单元数量会对微网群系统传输数据的速率和CPU频率产生影响。所述请求迁移决策采用xi表示,其表达式如下:
S2,各个微网群设备从各自的记忆存储单元中取出本地历史运行数据,利用深度强化学习方法对本地学习模型进行训练,并将训练后的本地学习模型参数和本地训练次数上传到边缘计算设备n′,包括如下步骤:
S2.1,微网群设备取出记忆存储单元中的本地历史运行数据;
所述本地历史运行数据采用如下表示:
(s,a,r,s′);(2)
式中,s表示当前环境下的状态观测值,包括请求处理队列的当前队列长度、资源序列中的剩余资源单元、当前请求所需的CPU频率、自身网络连接状态,a表示动作,也即请求迁移决策和资源单元数量决策,r表示执行动作a后的奖励,s′表示新环境下的状态观测值。
S2.2,使用均方差定义训练所使用的损失函数;
L(w)=E[(R+γ·maxa′Q(s′,a′,w′)-Q(s,a,w))2];(4)
式中,L(w)表示损失函数,R表示回报,也即奖励r的衰减累加,γ表示衰减系数,maxa′Q(s′,a′,w′)表示神经网络更新后的参数为w′的神经网络状态s的下一状态s′下基于动作a′的最大Q值。
S2.3,微网群设备利用DQN算法进行本地学习模型的训练,并同步使用梯度下降法更新神经网络的参数w以获得最佳Q值;
模型训练的过程中DQN利用一个参数为w的神经网络作为Q值进行相似计算,对应的表达式为:
Q(s,a,w)≈Qπ(s,a);(3)
式中,Qπ(s,a)表示价值函数,为状态s下基于策略π采用动作a时的Q值,Q(s,a,w)表示由参数w的神经网络预测的Q值。
使用梯度下降法更新神经网络的参数w的公式为:
S2.4,微网群设备将更新后的本地学习模型的参数以及本地训练的次数上传至边缘计算设备n′。
S3,微网群设备基于本地训练次数对接收到的本地学习模型参数进行聚合更新请求评估模型,并将更新后的模型权重和更新后的请求评估模型分发到微网群设备上,包括如下步骤:
S3.1,边缘计算设备n′对每个微网群设备的本地训练次数分别进行统计;
S3.2,边缘计算设备n′根据统计后本地训练次数对接收到的模型参数进行聚合;
式中,αt+1表示第t轮聚合后的请求评估模型,表示t轮时微网群设备m在当前t轮周期内训练的次数,Ht表示M个微网群设备的在当前t轮周期内训练次数的加和,表示第t轮训练后本地学习模型的参数,t表示训练的周期轮数,Pt表示第t轮聚合时随机抽取的微网群设备的集合。
S3.3,边缘计算设备n′将步骤S3.2聚合后得到的请求评估模型分发给各微网群设备。
S4,微网群设备根据更新后的请求评估模型,在请求调度决策时以最大化长期效益期望为目标预测资源分配策略,所述资源分配策略包括请求迁移决策和资源单元数量决策;
所述最大化长期效益期望的表达式为:
所述网络状态Vi的表达式为:
在每个时间片下,当有请求被取出或生成时,请求处理队列会进行更新,更新后的请求处理队列的表达式为:
同样地,在每个时间片下,资源序列也会进行更新,更新后的资源序列的表达式为:
所述i时间片下微网群设备与边缘计算设备的连接关系si可表示为:
式中,xi-1表示i-1时间片下请求迁移的决策,si-1表示i-1时间片下微网群设备与边缘计算设备的连接关系。
所述i时间片下的直接效用由请求执行延迟di、请求丢弃数ηi、请求排队延迟ci和占用边缘设备花销φi几项指标共同决定,可以针对不同的目标进行定制化设计,例如:如果系统更注重请求运行的总延迟,则可以提升请求排队延迟ci和请求执行延迟di的权重,进而提高其在整个效用中的比例。作为对资源分配策略性能的评价,其表达式为:
式中,w1表示请求执行延迟di的权重,w2表示请求排队延迟ci的权重,w3表示请求丢弃数ηi的权重,w4表示占用边缘设备花销φi的权重。w1、w2、w3、w4为目标设备也即发出请求的设备对不同指标的需求偏好权重,取值由目标设备的设备类型以及所搭载的应用服务决定。
所述请求执行延迟di的计算公式为:
式中,di表示i时间片下请求的运行时延,表示i时间片下本地执行请求的时间消耗,hi表示i时间片下的切换延迟,表示i时间片下请求从本地传输到对应的边缘计算设备的时间开销,v表示请求卸载到边缘计算设备执行时所产生的延迟。
所述i时间片下的切换延迟hi的表达式为:
式中,δ表示连接切换延迟,si表示i时间片下微网群设备与边缘计算设备的连接关系。
式中,fi表示i时间片下微网群系统分配的CPU频率。
所述i时间片下微网群系统分配的CPU频率fi的计算公式为:
式中,τ为常数,取决于芯片结构,F表示微网群设备CPU芯片的最大频率。
式中,ri表示i时间片下的数据传输速率。
所述i时间片下的数据传输速率ri的计算公式为:
根据式(14)、式(15)、式(16)可得,最小传输时间满足:
由于边缘计算设备计算资源的有限性,对边缘计算设备不应过度使用,本申请进一步定义了占用边缘计算设备所需的花销来避免对边缘计算设备的过度使用,定义π∈R+作为占用边缘计算设备单位时间的价格,其中,R+表示正实数集合,占用边缘设备花销φi的计算公式为:
所述请求排队延迟ci的计算公式为:
由于当请求处理队列已满时,会使新产生的请求无法存入请求处理队列,从而导致请求丢失,请求丢弃数ηi的计算公式为:
所述资源分配策略的表达式为:
S5,当微网群设备数量变化时,边缘计算设备n′根据变化后的数量对请求评估模型的模型参数进行更新或分享,包括:
微网群系统中新加入微网群设备Iu时,当微网群设备Iu连接至边缘计算设备n′调度请求时,边缘设备会先将模型参数发送到微网群设备;
Wu=We;(26)
式中,Wu表示新加入的微网群设备Iu的模型参数,We表示边缘计算设备n′的请求评估模型的模型参数。
微网群设备Iu准备停机更新维护时,将其模型参数发送到边缘计算设备n′,边缘计算设备n′对请求评估模型的模型参数进行更新;
We=We·(1-pw)+Wu·pw;(27)
式中,pw表示边缘计算设备n′的请求评估模型的学习率,Wu表示准备停机更新维护的微网群设备Iu的模型参数。
本申请实施例还提供一种基于联邦学习的微网群请求动态迁移调度装置,包括边缘计算设备和微网群设备,微网群设备上设有本地训练模块和策略生成模块,边缘计算设备上设有边缘聚合模块;
本地训练模块,用于接收边缘计算设备n′所发送的请求评估模型参数,基于深度强化学习方法结合本地历史运行数据进行本地学习模型的训练,并将训练后的本地学习模型参数和本地训练次数发送给边缘计算设备n′;
边缘聚合模块,用于接收本地学习模型参数和本地训练次数,根据各个微网群设备的本地训练次数对本地学习模型参数进行聚合以更新请求评估模型,并将更新后的请求评估模型发送到微网群设备;
策略生成模块,用于根据更新后的请求评估模型,并以最大化长期效益期望为目标生成请求迁移决策和资源单元数量决策。
本申请实施例还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的基于联邦学习的微网群请求动态迁移调度方法。
本申请实施例还提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的基于联邦学习的微网群请求动态迁移调度方法。具体地,该存储介质可以为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述基于联邦学习的微网群请求动态迁移调度方法的实施例。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于联邦学习的微网群请求动态迁移调度方法,其特征在于,包括如下步骤:
S1,对边缘计算支持下的微网群系统进行初始化,所述微网群系统包括微网群设备和边缘计算设备;
S2,各个微网群设备利用深度强化学习方法并基于本地历史运行数据对本地学习模型进行训练,并将训练后的本地学习模型参数和本地训练次数上传到边缘计算设备n′;
S3,边缘计算设备n′基于本地训练次数对接收到的本地学习模型参数进行聚合更新请求评估模型,并将更新后的请求评估模型分发各微网群设备;
S4,微网群设备根据更新后的请求评估模型,在请求调度决策时以最大化长期效益期望为目标预测资源分配策略,所述资源分配策略包括请求迁移决策和资源单元数量决策;
S5,当微网群设备数量变化时,边缘计算设备n′对请求评估模型的模型参数进行更新。
2.根据权利要求1所述的基于联邦学习的微网群请求动态迁移调度方法,其特征在于,所述步骤S2包括如下步骤:
S2.1,各微网群设备取出各自记忆存储单元中的本地历史运行数据;
所述本地历史运行数据的表达式为:
(s,a,r,s′);
式中,s表示当前环境下的状态观测值,包括边缘计算设备n′的请求处理队列的当前队列长度、边缘计算设备n′的资源序列中的剩余资源单元、当前请求所需的CPU频率、自身网络连接状态,a表示动作,也即请求迁移决策和资源单元数量决策,r表示执行动作a后的奖励,s′表示新环境下的状态观测值;
S2.2,使用均方差定义损失函数,损失函数的公式为:
L(w)=E[(R+γ·maxa′Q(s′,a′,w′)-Q(s,a,w))2];
式中,L(w)表示损失函数,R表示回报,也即奖励r的衰减累加,γ表示衰减系数,Q(s,a,w)表示训练所用的参数w的神经网络预测的Q值,maxa′Q(s′,a′,w′)表示神经网络参数更新为w′时的状态s的下一状态s′基于动作a′的最大Q值;
S2.3,微网群设备利用DQN算法进行本地学习模型的训练,同时使用梯度下降法更新神经网络的参数w以获得最佳Q值;
S2.4,微网群设备将更新后的本地学习模型的参数以及本地训练的次数上传至边缘计算设备n′。
10.一种基于联邦学习的微网群请求动态迁移调度装置,其特征在于,包括边缘计算设备和微网群设备,微网群设备上设有本地训练模块和策略生成模块,边缘计算设备上设有边缘聚合模块;
本地训练模块,用于接收边缘计算设备n′所发送的请求评估模型参数,基于深度强化学习方法结合本地历史运行数据进行本地学习模型的训练,并将训练后的本地学习模型参数和本地训练次数发送给边缘计算设备n′;
边缘聚合模块,用于接收本地学习模型参数和本地训练次数,根据各个微网群设备的本地训练次数对本地学习模型参数进行聚合以更新请求评估模型,并将更新后的请求评估模型发送到微网群设备;
策略生成模块,用于根据更新后的请求评估模型,并以最大化长期效益期望为目标生成请求迁移决策和资源单元数量决策。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210549821.5A CN114938372B (zh) | 2022-05-20 | 2022-05-20 | 一种基于联邦学习的微网群请求动态迁移调度方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210549821.5A CN114938372B (zh) | 2022-05-20 | 2022-05-20 | 一种基于联邦学习的微网群请求动态迁移调度方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114938372A CN114938372A (zh) | 2022-08-23 |
CN114938372B true CN114938372B (zh) | 2023-04-18 |
Family
ID=82864640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210549821.5A Active CN114938372B (zh) | 2022-05-20 | 2022-05-20 | 一种基于联邦学习的微网群请求动态迁移调度方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114938372B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115828302B (zh) * | 2022-12-20 | 2023-07-07 | 华北电力大学 | 一种基于可信隐私计算的微网并网控制隐私保护方法 |
CN117251276B (zh) * | 2023-11-20 | 2024-02-09 | 清华大学 | 一种面向协作学习平台的灵活调度方法及装置 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111708640A (zh) * | 2020-06-23 | 2020-09-25 | 苏州联电能源发展有限公司 | 一种面向边缘计算的联邦学习方法和系统 |
CN112181666A (zh) * | 2020-10-26 | 2021-01-05 | 华侨大学 | 一种基于边缘智能的设备评估和联邦学习重要性聚合方法、系统、设备和可读存储介质 |
CN112614009A (zh) * | 2020-12-07 | 2021-04-06 | 国网四川省电力公司电力科学研究院 | 一种基于深度期望q-学习的电网能量管理方法及系统 |
CN112800461A (zh) * | 2021-01-28 | 2021-05-14 | 深圳供电局有限公司 | 一种基于联邦学习框架的电力计量系统网络入侵检测方法 |
WO2021121029A1 (zh) * | 2019-12-20 | 2021-06-24 | 深圳前海微众银行股份有限公司 | 训练模型的更新方法、系统、智能体、服务器及计算机可读存储介质 |
CN113139600A (zh) * | 2021-04-23 | 2021-07-20 | 广东安恒电力科技有限公司 | 基于联邦学习的智能电网设备异常检测方法和系统 |
CN113221470A (zh) * | 2021-06-10 | 2021-08-06 | 南方电网科学研究院有限责任公司 | 一种用于电网边缘计算系统的联邦学习方法及其相关装置 |
CN113326002A (zh) * | 2021-05-22 | 2021-08-31 | 清华大学 | 基于计算迁移的云边协同控制系统及迁移决策生成方法 |
CN113435472A (zh) * | 2021-05-24 | 2021-09-24 | 西安电子科技大学 | 车载算力网络用户需求预测方法、系统、设备、介质 |
CN113471982A (zh) * | 2021-07-22 | 2021-10-01 | 天津大学 | 云边协同与电网隐私保护的分布式电源就地电压控制方法 |
CN113505522A (zh) * | 2021-06-10 | 2021-10-15 | 南方电网科学研究院有限责任公司 | 一种智能电网台区业务计算管理方法、装置、终端及介质 |
CN113516250A (zh) * | 2021-07-13 | 2021-10-19 | 北京百度网讯科技有限公司 | 一种联邦学习方法、装置、设备以及存储介质 |
CN113887141A (zh) * | 2021-10-14 | 2022-01-04 | 中国科学院电工研究所 | 一种基于联邦学习的微电网群运行策略进化方法 |
CN113902021A (zh) * | 2021-10-13 | 2022-01-07 | 北京邮电大学 | 一种高能效的聚类联邦边缘学习策略生成方法和装置 |
CN113992676A (zh) * | 2021-10-27 | 2022-01-28 | 天津大学 | 端边云架构和完全信息下分层联邦学习的激励方法及系统 |
WO2022027776A1 (zh) * | 2020-08-03 | 2022-02-10 | 威胜信息技术股份有限公司 | 边缘计算网络任务调度与资源分配方法和边缘计算系统 |
CN114168328A (zh) * | 2021-12-06 | 2022-03-11 | 北京邮电大学 | 一种基于联邦学习的移动边缘节点计算任务调度方法及其系统 |
CN114219097A (zh) * | 2021-11-30 | 2022-03-22 | 华南理工大学 | 一种基于异构资源之上的联邦学习训练和预测方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11132608B2 (en) * | 2019-04-04 | 2021-09-28 | Cisco Technology, Inc. | Learning-based service migration in mobile edge computing |
-
2022
- 2022-05-20 CN CN202210549821.5A patent/CN114938372B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021121029A1 (zh) * | 2019-12-20 | 2021-06-24 | 深圳前海微众银行股份有限公司 | 训练模型的更新方法、系统、智能体、服务器及计算机可读存储介质 |
CN111708640A (zh) * | 2020-06-23 | 2020-09-25 | 苏州联电能源发展有限公司 | 一种面向边缘计算的联邦学习方法和系统 |
WO2022027776A1 (zh) * | 2020-08-03 | 2022-02-10 | 威胜信息技术股份有限公司 | 边缘计算网络任务调度与资源分配方法和边缘计算系统 |
CN112181666A (zh) * | 2020-10-26 | 2021-01-05 | 华侨大学 | 一种基于边缘智能的设备评估和联邦学习重要性聚合方法、系统、设备和可读存储介质 |
CN112614009A (zh) * | 2020-12-07 | 2021-04-06 | 国网四川省电力公司电力科学研究院 | 一种基于深度期望q-学习的电网能量管理方法及系统 |
CN112800461A (zh) * | 2021-01-28 | 2021-05-14 | 深圳供电局有限公司 | 一种基于联邦学习框架的电力计量系统网络入侵检测方法 |
CN113139600A (zh) * | 2021-04-23 | 2021-07-20 | 广东安恒电力科技有限公司 | 基于联邦学习的智能电网设备异常检测方法和系统 |
CN113326002A (zh) * | 2021-05-22 | 2021-08-31 | 清华大学 | 基于计算迁移的云边协同控制系统及迁移决策生成方法 |
CN113435472A (zh) * | 2021-05-24 | 2021-09-24 | 西安电子科技大学 | 车载算力网络用户需求预测方法、系统、设备、介质 |
CN113505522A (zh) * | 2021-06-10 | 2021-10-15 | 南方电网科学研究院有限责任公司 | 一种智能电网台区业务计算管理方法、装置、终端及介质 |
CN113221470A (zh) * | 2021-06-10 | 2021-08-06 | 南方电网科学研究院有限责任公司 | 一种用于电网边缘计算系统的联邦学习方法及其相关装置 |
CN113516250A (zh) * | 2021-07-13 | 2021-10-19 | 北京百度网讯科技有限公司 | 一种联邦学习方法、装置、设备以及存储介质 |
CN113471982A (zh) * | 2021-07-22 | 2021-10-01 | 天津大学 | 云边协同与电网隐私保护的分布式电源就地电压控制方法 |
CN113902021A (zh) * | 2021-10-13 | 2022-01-07 | 北京邮电大学 | 一种高能效的聚类联邦边缘学习策略生成方法和装置 |
CN113887141A (zh) * | 2021-10-14 | 2022-01-04 | 中国科学院电工研究所 | 一种基于联邦学习的微电网群运行策略进化方法 |
CN113992676A (zh) * | 2021-10-27 | 2022-01-28 | 天津大学 | 端边云架构和完全信息下分层联邦学习的激励方法及系统 |
CN114219097A (zh) * | 2021-11-30 | 2022-03-22 | 华南理工大学 | 一种基于异构资源之上的联邦学习训练和预测方法及系统 |
CN114168328A (zh) * | 2021-12-06 | 2022-03-11 | 北京邮电大学 | 一种基于联邦学习的移动边缘节点计算任务调度方法及其系统 |
Non-Patent Citations (3)
Title |
---|
Shaolei Zhai;Xin Jin;Ling Wei;Hongxuan Luo;Min Cao.Dynamic Federated Learning for GMEC With Time-Varying Wireless Link.《IEEE Access》.2021,第9卷第10400-10412页. * |
卢海峰;顾春华;罗飞;丁炜超;杨婷;郑帅;.基于深度强化学习的移动边缘计算任务卸载研究.计算机研究与发展.2020,第57卷(第07期),全文. * |
陈前斌;管令进;李子煜 ; 王兆 ;杨恒;唐伦;.基于深度强化学习的异构云无线接入网自适应无线资源分配算法.电子与信息学报.2020,第42卷(第06期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114938372A (zh) | 2022-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hussein et al. | Efficient task offloading for IoT-based applications in fog computing using ant colony optimization | |
Chen et al. | Dynamic task offloading for mobile edge computing with hybrid energy supply | |
CN110275758B (zh) | 一种虚拟网络功能智能迁移方法 | |
Huang et al. | Rlsk: A job scheduler for federated kubernetes clusters based on reinforcement learning | |
CN110096349A (zh) | 一种基于集群节点负载状态预测的作业调度方法 | |
Gao et al. | Computation offloading with instantaneous load billing for mobile edge computing | |
CN111722910B (zh) | 一种云作业调度及资源配置的方法 | |
CN104657221A (zh) | 一种云计算中基于任务分类的多队列错峰调度模型及方法 | |
CN104168318A (zh) | 一种资源服务系统及其资源分配方法 | |
CN110381541A (zh) | 一种基于强化学习的智能电网切片分配方法及装置 | |
CN114938372B (zh) | 一种基于联邦学习的微网群请求动态迁移调度方法及装置 | |
CN109885397A (zh) | 一种边缘计算环境中时延优化的负载任务迁移算法 | |
CN110717300A (zh) | 面向电力物联实时在线监测业务的边缘计算任务分配方法 | |
Dong et al. | Quantum particle swarm optimization for task offloading in mobile edge computing | |
Tian et al. | User preference-based hierarchical offloading for collaborative cloud-edge computing | |
CN115629865B (zh) | 一种基于边缘计算的深度学习推理任务调度方法 | |
Lyu et al. | Dynamic pricing scheme for edge computing services: A two-layer reinforcement learning approach | |
CN115086249B (zh) | 一种基于深度强化学习的云数据中心资源分配方法 | |
Asghar et al. | A survey on scheduling techniques in the edge cloud: Issues, challenges and future directions | |
CN114466023B (zh) | 面向大规模边缘计算系统的计算服务动态定价方法及系统 | |
Hao et al. | Energy allocation and task scheduling in edge devices based on forecast solar energy with meteorological information | |
CN113821346B (zh) | 基于深度强化学习的边缘计算中计算卸载与资源管理方法 | |
CN116302404B (zh) | 面向资源解耦合数据中心的服务器无感知计算调度方法 | |
Kumar et al. | Deadline-aware cost and energy efficient offloading in mobile edge computing | |
CN117608806A (zh) | 智能电网云边协同机制下计算任务雾-雾-云优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |