[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN114710792A - 基于强化学习的5g配网分布式保护装置的优化布置方法 - Google Patents

基于强化学习的5g配网分布式保护装置的优化布置方法 Download PDF

Info

Publication number
CN114710792A
CN114710792A CN202210330896.4A CN202210330896A CN114710792A CN 114710792 A CN114710792 A CN 114710792A CN 202210330896 A CN202210330896 A CN 202210330896A CN 114710792 A CN114710792 A CN 114710792A
Authority
CN
China
Prior art keywords
distribution network
training
round
protection
mth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210330896.4A
Other languages
English (en)
Other versions
CN114710792B (zh
Inventor
孙伟
王文浩
戴宇
于洋
王吉文
李端超
王同文
汪伟
俞斌
张骏
戴长春
李奇越
李帷韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
State Grid Anhui Electric Power Co Ltd
Original Assignee
Hefei University of Technology
State Grid Anhui Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology, State Grid Anhui Electric Power Co Ltd filed Critical Hefei University of Technology
Priority to CN202210330896.4A priority Critical patent/CN114710792B/zh
Publication of CN114710792A publication Critical patent/CN114710792A/zh
Application granted granted Critical
Publication of CN114710792B publication Critical patent/CN114710792B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/061Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Neurology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于强化学习的5G配网分布式保护装置的优化布置方法,包括:1、搭建5G配网保护系统环境;2、建立5G配网保护系统的强化学习模型,其中,强化学习模型由策略体和执行体组成;3、在5G配网保护系统环境下训练强化学习模型;4、采用最优的布置信息S*max对5G配网分布式保护装置进行布置。本发明以期能保证主站保护装置和配网分布式保护装置建立通信,并且找出最优的5G配网分布式保护系统的保护装置的配比,从而能确保配网可以安全高效的运行。

Description

基于强化学习的5G配网分布式保护装置的优化布置方法
技术领域
本发明属于配网保护领域,具体的说是一种基于强化学习的5G配网分布式保护装置的优化布置方法。
背景技术
配网具有电压等级多,网络结构复杂,设备类型多样,作业点多面广,安全环境相对较差等特点,安全风险因素相对较多,为了给各类用户提供电力能源,对配网的安全可靠运行提出更高的要求,因此需要布置保护装置来保护配网。然而配网数量多,分布广,同时受技术的影响,如何布置保护装置成为一个难题。目前大部分的配网保护装置的配置方案仍然沿用传统思路,无法保证在可靠性范围内布置最优的配网保护装置。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于强化学习的5G配网分布式保护装置的优化布置方法。以期在满足可靠性的前提下找出最优的5G配网分布式保护系统保护装置的布置,从而确保配网能安全高效的运行。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于强化学习的5G配网分布式保护装置的优化布置方法的特点在于,包括以下步骤:
步骤1、搭建5G配网保护系统环境;
令L=[l1,l2,...,li,...,ln]表示5G配网的n个节点是否布置保护装置,若li=0,表示第i个节点未布置保护装置,若li=1,表示第i个节点布置保护装置,且每个节点最多只能布置一个保护装置,i=1,2,...,n;
令D=[d1,d2,...,di,...,dn]表示5G配网的n个节点与5G基站的实际距离,di表示第i个节点与5G基站的实际距离,当li=0时,di=0;i=1,2,...,n;
令S=[L,D]表示5G配网保护系统的保护装置的布置信息;
初始化5G配网的n个节点均布置有保护装置,即{li=1,i=1,2,...,n};
步骤2、建立5G配网保护系统的强化学习模型,其中,强化学习模型由策略体和执行体组成:
所述策略体由两层神经元网络组成,所述策略体的输入层输入所述5G配网保护系统的保护装置的布置信息S,所述策略体的输出层输出所有动作a的概率π(A),其中,π(A)通过策略π(θ)和SoftMax函数得出,θ是神经元网络参数的集合;
所述执行体用于执行动作从而改变5G配网保护系统的保护装置的布置信息,所述执行体中的奖励模块计算奖励;
步骤3、在5G配网保护系统环境下训练强化学习模型;
步骤3.1、定义回合数为m,并初始化m=1;
步骤3.2、定义每回合训练的次数为t,并初始化t=1;
定义第m回合第t次训练保护系统保护装置的布置信息为
Figure BDA0003573059550000021
并初始化
Figure BDA0003573059550000022
步骤3.3、所述策略体的输入层输入所述布置信息
Figure BDA0003573059550000023
步骤3.4、所述策略体通过策略
Figure BDA0003573059550000024
和SoftMax函数输出所有动作a的概率
Figure BDA0003573059550000025
其中
Figure BDA0003573059550000026
是第m回合第t次训练策略,
Figure BDA0003573059550000027
是第m回合第t次训练神经网络参数的集合,
Figure BDA0003573059550000028
是第m回合第t次训练所有动作a的概率;
步骤3.5、在5G配网保护系统环境下,所述执行体根据策略体输出的所有动作a的概率
Figure BDA0003573059550000029
选择动作
Figure BDA00035730595500000210
所述执行体第m回合第t次训练下执行动作
Figure BDA00035730595500000211
从而改变第i个节点的m个邻接点上的保护装置的数量,即改变5G配网保护系统的保护装置的布置信息
Figure BDA00035730595500000212
并输出第m回合第t+1次训练时的布置信息
Figure BDA00035730595500000213
仅当li=0时,所述执行体为第i个节点的m个邻接点分别增加一个保护装置;li+1,i=1,2,...,n;
仅当li=1时,所述执行体为第i个节点的m个邻接点分别减少一个保护装置;li-1,n=1,2,...,n;
步骤3.6、判断式(1)是否成立,若成立,则执行步骤3.7,否则,返回执行步骤3.4:
Figure BDA00035730595500000214
式(1)中,s是保护系统的可靠性,pi是第i个节点上的保护装置出现故障的概率,sex是在5G配网正常运行时期望的可靠性;
步骤3.7、所述执行体的奖励模块通过式(2)-式(5)计算第m回合第t次训练下的奖励
Figure BDA0003573059550000031
Figure BDA0003573059550000032
Figure BDA0003573059550000033
Figure BDA0003573059550000034
Figure BDA0003573059550000035
式(2)-式(5)中,
Figure BDA0003573059550000036
是第m回合第t次训练下保护装置与5G基站的距离的奖励,
Figure BDA0003573059550000037
是第m回合第t次训练下保护装置数量的奖励,
Figure BDA0003573059550000038
是第m回合第t次训练下保护系统可靠性的奖励;
Figure BDA0003573059550000039
是第m回合第t次训练下保护装置数量的奖励;
步骤3.8、策略体通过式(6)和式(7)更新第m回合第t次训练下的参数
Figure BDA00035730595500000310
从而得到第m回合第t+1次训练下的参数
Figure BDA00035730595500000311
Figure BDA00035730595500000312
Figure BDA00035730595500000313
式(6)和式(7)中,α是学习率,
Figure BDA00035730595500000314
是参数
Figure BDA00035730595500000315
的偏导,
Figure BDA00035730595500000316
是在
Figure BDA00035730595500000317
下的值函数,
Figure BDA00035730595500000318
是在
Figure BDA00035730595500000319
下的策略,
Figure BDA00035730595500000320
是值函数
Figure BDA00035730595500000321
的期望;
步骤3.9、将t+1赋值给t后,判断t>C1是否成立,若成立,结束当前第m回合训练,得到当前第m回合下最优的布置信息
Figure BDA00035730595500000322
并将
Figure BDA00035730595500000323
存储在集合
Figure BDA00035730595500000324
中后,执行步骤3.10,否则,返回执行步骤3.3顺序执行;其中,C1是每回合最大迭代次数;
步骤3.10、将m+1赋值给m后,判断m>C2是否成立,若成立,则结束所有训练,从集合
Figure BDA00035730595500000325
中得到最优的布置信息S*max;否则,返回执行步骤3.2顺序执行,其中,C2是最大迭代回合数;
步骤4、采用最优的布置信息S*max对5G配网分布式保护装置进行布置。
与现有技术相比,本发明的有益效果在于:
1、本发明利用强化学习与环境不断交互不断学习的优势,并且考虑到配网数量多、分布广的特点,在5G配网保护系统环境下,多维的改变保护装置的数量和布置情况,通过强化学习的迭代学习,找到最优的保护装置的布置,从而实现了对配网的保护,确保了配网安全可靠运行;
2、本发明利用5G通信技术为配网保护业务提供了低延时、高可靠的信息通道,从而解决传统配网保护选择性较弱,故障定位不够精确,切除故障用时较长,配网线路无法实现故障切除后的自愈的问题。
附图说明
图1为本发明一种基于强化学习的5G配网分布式保护装置的优化布置方法的流程图;
图2为本发明5G配网保护系统环境图;
图3为本发明强化学习训练过程图。
具体实施方式
在本实施例中,如图1所示,一种基于强化学习的5G配网分布式保护装置的优化布置方法,其特征在于,包括以下步骤:
步骤1、如图2所示,搭建5G配网保护系统环境;
令L=[l1,l2,...,li,...,ln]表示5G配网的n个节点是否布置保护装置,若li=0,表示第i个节点未布置保护装置,若li=1,表示第i个节点布置保护装置,且每个节点最多只能布置一个保护装置,i=1,2,...,n;
令D=[d1,d2,...,di,...,dn]表示5G配网的n个节点与5G基站的实际距离,di表示第i个节点与5G基站的实际距离,当li=0时,di=0;i=1,2,...,n;
令S=[L,D]表示5G配网保护系统的保护装置的布置信息;
初始化5G配网的n个节点均布置有保护装置,即{li=1,i=1,2,...,n};
步骤2、建立5G配网保护系统的强化学习模型,其中,强化学习模型由策略体和执行体组成:
策略体由两层神经元网络组成,策略体的输入层输入5G配网保护系统的保护装置的布置信息S,策略体的输出层输出所有动作a的概率π(A),其中,π(A)通过策略π(θ)和SoftMax函数得出,θ是神经元网络参数的集合;
执行体用于执行动作从而改变5G配网保护系统的保护装置的布置信息,执行体中的奖励模块计算奖励;
步骤3、如图3所示,在5G配网保护系统环境下训练强化学习模型;
步骤3.1、定义回合数为m,并初始化m=1;
步骤3.2、定义每回合训练的次数为t,并初始化t=1;
定义第m回合第t次训练保护系统保护装置的布置信息为
Figure BDA0003573059550000051
并初始化
Figure BDA0003573059550000052
步骤3.3、策略体的输入层输入布置信息
Figure BDA0003573059550000053
步骤3.4、策略体通过策略
Figure BDA0003573059550000054
和SoftMax函数输出所有动作a的概率
Figure BDA0003573059550000055
其中
Figure BDA0003573059550000056
是第m回合第t次训练策略,
Figure BDA0003573059550000057
是第m回合第t次训练神经网络参数的集合,
Figure BDA0003573059550000058
是第m回合第t次训练所有动作a的概率;
步骤3.5、在5G配网保护系统环境下,执行体根据策略体输出的所有动作a的概率
Figure BDA0003573059550000059
选择动作
Figure BDA00035730595500000510
执行体第m回合第t次训练下执行动作
Figure BDA00035730595500000511
从而改变第i个节点的m个邻接点上的保护装置的数量,即改变5G配网保护系统的保护装置的布置信息
Figure BDA00035730595500000512
并输出第m回合第t+1次训练时的布置信息
Figure BDA00035730595500000513
仅当li=0时,执行体为第i个节点的m个邻接点分别增加一个保护装置;li+1,i=1,2,...,n;
仅当li=1时,执行体为第i个节点的m个邻接点分别减少一个保护装置;li-1,n=1,2,...,n;
简单的改变保护装置的数量,无法应对配网数量多、分布广的实际情况,考虑到复杂的配网的实际情况,每回合执行不同的动作,确保在满足配网可靠性的前提下提高保护效果;
步骤3.6、判断式(1)是否成立,若成立,则执行步骤3.7,否则,返回执行步骤3.4:
Figure BDA00035730595500000514
式(1)中,s是保护系统的可靠性,pi是第i个节点上的保护装置出现故障的概率,sex是在5G配网正常运行时期望的可靠性;
步骤3.7、执行体的奖励模块通过式(2)-式(5)计算第m回合第t次训练下的奖励
Figure BDA0003573059550000061
Figure BDA0003573059550000062
Figure BDA0003573059550000063
Figure BDA0003573059550000064
Figure BDA0003573059550000065
式(2)-式(5)中,
Figure BDA0003573059550000066
是第m回合第t次训练下保护装置与5G基站的距离的奖励,
Figure BDA0003573059550000067
是第m回合第t次训练下保护装置数量的奖励,
Figure BDA0003573059550000068
是第m回合第t次训练下保护系统可靠性的奖励;
Figure BDA0003573059550000069
是第m回合第t次训练下保护装置数量的奖励;保护装置与5G基站的距离会影响保护系统的可靠性;
步骤3.8、策略体通过式(6)和式(7)更新第m回合第t次训练下的参数
Figure BDA00035730595500000610
从而得到第m回合第t+1次训练下的参数
Figure BDA00035730595500000611
Figure BDA00035730595500000612
Figure BDA00035730595500000613
式(6)和式(7)中,α是学习率,
Figure BDA00035730595500000614
是参数
Figure BDA00035730595500000615
的偏导,
Figure BDA00035730595500000616
是在
Figure BDA00035730595500000617
下的值函数,
Figure BDA00035730595500000618
是在
Figure BDA00035730595500000619
下的策略,
Figure BDA00035730595500000620
是值函数
Figure BDA00035730595500000621
的期望;
步骤3.9、将t+1赋值给t后,判断t>C1是否成立,若成立,结束当前第m回合训练,得到当前第m回合下最优的布置信息
Figure BDA00035730595500000622
并将
Figure BDA00035730595500000623
存储在集合
Figure BDA00035730595500000624
中后,执行步骤3.10,否则,返回执行步骤3.3顺序执行;其中,C1是每回合最大迭代次数;
步骤3.10、将m+1赋值给m后,判断m>C2是否成立,若成立,则结束所有训练,从集合
Figure BDA0003573059550000071
中得到最优的布置信息S*max;否则,返回执行步骤3.2顺序执行,其中,C2是最大迭代回合数;
步骤4、采用最优的布置信息S*max对5G配网分布式保护装置进行布置。

Claims (1)

1.一种基于强化学习的5G配网分布式保护装置的优化布置方法,其特征在于,包括以下步骤:
步骤1、搭建5G配网保护系统环境;
令L=[l1,l2,...,li,...,ln]表示5G配网的n个节点是否布置保护装置,若li=0,表示第i个节点未布置保护装置,若li=1,表示第i个节点布置保护装置,且每个节点最多只能布置一个保护装置,i=1,2,...,n;
令D=[d1,d2,...,di,...,dn]表示5G配网的n个节点与5G基站的实际距离,di表示第i个节点与5G基站的实际距离,当li=0时,di=0;i=1,2,...,n;
令S=[L,D]表示5G配网保护系统的保护装置的布置信息;
初始化5G配网的n个节点均布置有保护装置,即{li=1,i=1,2,...,n};
步骤2、建立5G配网保护系统的强化学习模型,其中,强化学习模型由策略体和执行体组成:
所述策略体由两层神经元网络组成,所述策略体的输入层输入所述5G配网保护系统的保护装置的布置信息S,所述策略体的输出层输出所有动作a的概率π(A),其中,π(A)通过策略π(θ)和SoftMax函数得出,θ是神经元网络参数的集合;
所述执行体用于执行动作从而改变5G配网保护系统的保护装置的布置信息,所述执行体中的奖励模块计算奖励;
步骤3、在5G配网保护系统环境下训练强化学习模型;
步骤3.1、定义回合数为m,并初始化m=1;
步骤3.2、定义每回合训练的次数为t,并初始化t=1;
定义第m回合第t次训练保护系统保护装置的布置信息为
Figure FDA0003573059540000011
并初始化
Figure FDA0003573059540000012
步骤3.3、所述策略体的输入层输入所述布置信息
Figure FDA0003573059540000013
步骤3.4、所述策略体通过策略
Figure FDA0003573059540000014
和SoftMax函数输出所有动作a的概率
Figure FDA0003573059540000015
其中
Figure FDA0003573059540000018
是第m回合第t次训练策略,
Figure FDA0003573059540000016
是第m回合第t次训练神经网络参数的集合,
Figure FDA0003573059540000017
是第m回合第t次训练所有动作a的概率;
步骤3.5、在5G配网保护系统环境下,所述执行体根据策略体输出的所有动作a的概率
Figure FDA0003573059540000021
选择动作
Figure FDA0003573059540000022
所述执行体第m回合第t次训练下执行动作
Figure FDA0003573059540000023
从而改变第i个节点的m个邻接点上的保护装置的数量,即改变5G配网保护系统的保护装置的布置信息
Figure FDA0003573059540000024
并输出第m回合第t+1次训练时的布置信息
Figure FDA0003573059540000025
仅当li=0时,所述执行体为第i个节点的m个邻接点分别增加一个保护装置;li+1,i=1,2,...,n;
仅当li=1时,所述执行体为第i个节点的m个邻接点分别减少一个保护装置;li-1,n=1,2,...,n;
步骤3.6、判断式(1)是否成立,若成立,则执行步骤3.7,否则,返回执行步骤3.4:
Figure FDA0003573059540000026
式(1)中,s是保护系统的可靠性,pi是第i个节点上的保护装置出现故障的概率,sex是在5G配网正常运行时期望的可靠性;
步骤3.7、所述执行体的奖励模块通过式(2)-式(5)计算第m回合第t次训练下的奖励
Figure FDA0003573059540000027
Figure FDA0003573059540000028
Figure FDA0003573059540000029
Figure FDA00035730595400000210
Figure FDA00035730595400000211
式(2)-式(5)中,
Figure FDA00035730595400000212
是第m回合第t次训练下保护装置与5G基站的距离的奖励,
Figure FDA00035730595400000213
是第m回合第t次训练下保护装置数量的奖励,
Figure FDA00035730595400000214
是第m回合第t次训练下保护系统可靠性的奖励;
Figure FDA00035730595400000215
是第m回合第t次训练下保护装置数量的奖励;
步骤3.8、策略体通过式(6)和式(7)更新第m回合第t次训练下的参数
Figure FDA00035730595400000216
从而得到第m回合第t+1次训练下的参数
Figure FDA0003573059540000031
Figure FDA0003573059540000032
Figure FDA0003573059540000033
式(6)和式(7)中,α是学习率,
Figure FDA0003573059540000034
是参数
Figure FDA0003573059540000035
的偏导,
Figure FDA0003573059540000036
是在
Figure FDA0003573059540000037
下的值函数,
Figure FDA0003573059540000038
是在
Figure FDA0003573059540000039
下的策略,
Figure FDA00035730595400000310
是值函数
Figure FDA00035730595400000311
的期望;
步骤3.9、将t+1赋值给t后,判断t>C1是否成立,若成立,结束当前第m回合训练,得到当前第m回合下最优的布置信息
Figure FDA00035730595400000312
并将
Figure FDA00035730595400000313
存储在集合
Figure FDA00035730595400000315
中后,执行步骤3.10,否则,返回执行步骤3.3顺序执行;其中,C1是每回合最大迭代次数;
步骤3.10、将m+1赋值给m后,判断m>C2是否成立,若成立,则结束所有训练,从集合
Figure FDA00035730595400000314
中得到最优的布置信息S*max;否则,返回执行步骤3.2顺序执行,其中,C2是最大迭代回合数;
步骤4、采用最优的布置信息S*max对5G配网分布式保护装置进行布置。
CN202210330896.4A 2022-03-30 2022-03-30 基于强化学习的5g配网分布式保护装置的优化布置方法 Active CN114710792B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210330896.4A CN114710792B (zh) 2022-03-30 2022-03-30 基于强化学习的5g配网分布式保护装置的优化布置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210330896.4A CN114710792B (zh) 2022-03-30 2022-03-30 基于强化学习的5g配网分布式保护装置的优化布置方法

Publications (2)

Publication Number Publication Date
CN114710792A true CN114710792A (zh) 2022-07-05
CN114710792B CN114710792B (zh) 2024-09-06

Family

ID=82170813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210330896.4A Active CN114710792B (zh) 2022-03-30 2022-03-30 基于强化学习的5g配网分布式保护装置的优化布置方法

Country Status (1)

Country Link
CN (1) CN114710792B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116233895A (zh) * 2023-05-04 2023-06-06 合肥工业大学 基于强化学习的5g配网节点通信优化方法、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020113782A1 (zh) * 2018-12-05 2020-06-11 清华大学深圳研究生院 基于数据分布的联合深度学习方法
CN111884213A (zh) * 2020-07-27 2020-11-03 国网北京市电力公司 一种基于深度强化学习算法的配电网电压调节方法
CN111953510A (zh) * 2020-05-15 2020-11-17 中国电力科学研究院有限公司 一种基于强化学习的智能电网切片无线资源分配方法及系统
AU2020103373A4 (en) * 2020-11-11 2021-01-28 B. Arthi Machine learning based network intelligentization for automatically- configurable cellular communication systems
CN112421621A (zh) * 2020-11-10 2021-02-26 国网四川省电力公司阿坝供电公司 一种基于5g物联网的一体化智能配网运行监控云系统
WO2021068638A1 (zh) * 2019-10-12 2021-04-15 中国海洋大学 结合tamer框架和面部表情反馈的交互强化学习方法
WO2021089568A1 (en) * 2019-11-04 2021-05-14 Telefonaktiebolaget Lm Ericsson (Publ) Machine learning non-standalone air-interface
CN113225759A (zh) * 2021-05-28 2021-08-06 广东电网有限责任公司广州供电局 一种面向于5g智能电网的网络切片安全与决策管理方法
WO2021169218A1 (zh) * 2020-02-26 2021-09-02 平安科技(深圳)有限公司 数据推送方法、系统、电子装置及存储介质
CN113780622A (zh) * 2021-08-04 2021-12-10 华南理工大学 基于多智能体强化学习的多微网配电系统分布式调度方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020113782A1 (zh) * 2018-12-05 2020-06-11 清华大学深圳研究生院 基于数据分布的联合深度学习方法
WO2021068638A1 (zh) * 2019-10-12 2021-04-15 中国海洋大学 结合tamer框架和面部表情反馈的交互强化学习方法
WO2021089568A1 (en) * 2019-11-04 2021-05-14 Telefonaktiebolaget Lm Ericsson (Publ) Machine learning non-standalone air-interface
WO2021169218A1 (zh) * 2020-02-26 2021-09-02 平安科技(深圳)有限公司 数据推送方法、系统、电子装置及存储介质
CN111953510A (zh) * 2020-05-15 2020-11-17 中国电力科学研究院有限公司 一种基于强化学习的智能电网切片无线资源分配方法及系统
CN111884213A (zh) * 2020-07-27 2020-11-03 国网北京市电力公司 一种基于深度强化学习算法的配电网电压调节方法
CN112421621A (zh) * 2020-11-10 2021-02-26 国网四川省电力公司阿坝供电公司 一种基于5g物联网的一体化智能配网运行监控云系统
AU2020103373A4 (en) * 2020-11-11 2021-01-28 B. Arthi Machine learning based network intelligentization for automatically- configurable cellular communication systems
CN113225759A (zh) * 2021-05-28 2021-08-06 广东电网有限责任公司广州供电局 一种面向于5g智能电网的网络切片安全与决策管理方法
CN113780622A (zh) * 2021-08-04 2021-12-10 华南理工大学 基于多智能体强化学习的多微网配电系统分布式调度方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
QIYUE LI等: "Optimal Resource Allocation of 5G Machine-Type Communications for Situation Awareness in Active Distribution Networks", 《IEEE》, 4 October 2021 (2021-10-04) *
李敬航;林泽宏;张鑫;: "基于强化学习的配网参数优化方法", 价值工程, no. 21, 28 July 2020 (2020-07-28) *
荆荣丽;葛书荣;王鹏;宁玉文;: "基于强化学习的网络时延自动化控制数学建模研究", 自动化与仪器仪表, no. 03, 25 March 2020 (2020-03-25) *
陈思;吴秋新;龚钢军;孙跃;魏沛芳;刘韧;: "基于边云智能协同的配电网信息物理系统", 北京信息科技大学学报(自然科学版), no. 01, 15 February 2020 (2020-02-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116233895A (zh) * 2023-05-04 2023-06-06 合肥工业大学 基于强化学习的5g配网节点通信优化方法、设备及介质
CN116233895B (zh) * 2023-05-04 2023-07-18 合肥工业大学 基于强化学习的5g配网节点通信优化方法、设备及介质

Also Published As

Publication number Publication date
CN114710792B (zh) 2024-09-06

Similar Documents

Publication Publication Date Title
CN105226643B (zh) 安全约束下电力系统运行模拟模型快速生成与求解方法
CN112288326B (zh) 一种适用于输电系统韧性评估的故障场景集削减方法
CN104102956A (zh) 一种基于策略自适应差分进化的配电网络扩展规划方法
CN105429185A (zh) 一种具有鲁棒协同一致性的经济调度方法
CN114123178B (zh) 一种基于多智能体强化学习的智能电网分区网络重构方法
CN111160716A (zh) 基于潮流介数的大电网脆弱性评估方法
CN114666204A (zh) 一种基于因果强化学习的故障根因定位方法及系统
CN114710792A (zh) 基于强化学习的5g配网分布式保护装置的优化布置方法
CN105552895A (zh) 一种基于多层次启发式动态规划的电力系统动态等值法
CN112865170A (zh) 一种基于场景概率的考虑风电出力相关性的负荷恢复优化方法
CN111130053A (zh) 一种基于深度强化学习的配电网过流保护方法
CN111900720B (zh) 一种基于双层网页排序算法的输电网脆弱线路辨识方法
CN115660324B (zh) 基于图强化学习的电网多断面越限调控方法和系统
CN106991229B (zh) 一种针对复杂拓扑的风电场等值建模方法
CN111950765A (zh) 一种基于堆叠降噪自编码器的概率性暂态稳定预测方法
CN118017586A (zh) 基于鲸鱼优化算法的配电网一二次协同规划方法和系统
CN111105025A (zh) 基于数据驱动启发式优化的城市高压配电网阻塞管理方法
CN105629101B (zh) 一种基于蚁群算法的多功率模块并联系统的故障诊断方法
CN116401572A (zh) 一种基于cnn-lstm的输电线路故障诊断方法及系统
CN114583696A (zh) 基于bp神经网络和场景匹配的配电网无功优化方法及系统
CN114697200B (zh) 一种5g配网分布式保护系统的保护装置配比优化方法
Jin et al. Cyber-physical risk driven routing planning with deep reinforcement-learning in smart grid communication networks
CN115001978A (zh) 一种基于强化学习模型的云租户虚拟网络智能映射方法
CN114417710A (zh) 一种输电网的过载动态决策生成方法及相关装置
CN114219125A (zh) 一种高弹性城市电网多维智能分区方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant