CN112149873B - 一种基于深度学习的低压台区线损合理区间预测方法 - Google Patents
一种基于深度学习的低压台区线损合理区间预测方法 Download PDFInfo
- Publication number
- CN112149873B CN112149873B CN202010867853.0A CN202010867853A CN112149873B CN 112149873 B CN112149873 B CN 112149873B CN 202010867853 A CN202010867853 A CN 202010867853A CN 112149873 B CN112149873 B CN 112149873B
- Authority
- CN
- China
- Prior art keywords
- line loss
- model
- prediction
- factors
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013135 deep learning Methods 0.000 title claims abstract description 14
- 230000000694 effects Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000013136 deep learning model Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000010219 correlation analysis Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000013450 outlier detection Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000009467 reduction Effects 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 17
- 238000010276 construction Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000013209 evaluation strategy Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 101100295776 Drosophila melanogaster onecut gene Proteins 0.000 description 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical group [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于台区线损预测技术领域,具体涉及基于深度学习的低压台区线损合理区间预测方法,包括如下步骤:数据的收集;指标的构建;特征构建;特征因子选择;构建线损预测模型;模型预测效果展示。该方法通过精准的线损预测模型,提升精准降损能力,实现线损精益化管理;通过线损精准预测,提升线损精益化管理。
Description
技术领域
本发明属于台区线损预测技术领域,具体涉及基于深度学习的低压台区线损合理区间预测方法。
背景技术
低压配电台区线损产生的原因主要分为固定损失、管理原因和技术原因。其中固定损失包括变压器内绕组和铁芯产生的电阻损耗和励磁损耗;电力网输电的电缆线路产生的电阻损耗;电力传输网址中部署的电容、电抗类设备产生的电能损耗;电力网络中保护装置产生的电能损耗;介质产生的损耗、电网计量装置产生的损耗。管理原因主要指抄表问题和窃电管理工作不足等等。技术原因主要指营计数据不一致和户变关系不一致等问题。
随着国网公司线损精益化管理工作的深入开展,传统一刀切方式的线损合格率考核方式已不再满足线损精益化管理要求,供电企业需要迫切找到一种有效计算线损计算方法,动态预测各台区的合理线损值以及合理区间上界,对于超出合理区间上界台区及时预警。
台区线损计算以前的学者已经进行了大量的研究和验证,目前对电网线损率计算方法已经有很多,主要分为传统方法和基于机器学习的方法。其中传统方法主要包括台区损耗率法、电压损失率法、等值电阻法、潮流法等方法。机器学习方法主要有基于传统的可解释性强的线性回归方法,基于决策树的集成回归方法以及基于神经网络的不易解释的非线性回归方法、基于支持向量机的计算方法、基于神经网络和改进的自适应二次变异差分进化算法、基于改进K-means聚类和BP神经网络的计算方法、基于kmeans-LightGBM的短期低压配电网理论线损预测算法。
公告号CN109272176B的发明专利文献公开了一种利用K-means聚类算法对台区线损率预测计算方法,它包括:步骤1、选取有功供电量X1、无功供电量X2、供电线路总长度X3、供电半径X4和线路总电阻X5作为电气特征参数;步骤2、对电气特征参数的原始数据标准化处理;步骤3、通过电气特征参数来建立台区的性能指标函数PI(i),选取初始聚类中心点和聚类数目K;步骤4、利用改进的K-means聚类算法对台区线损率进行预测;该发明利用台区的电气特征参数建立的指标函数,作为聚类分析判断初始聚类中心的原则,提高了聚类结果的精确性,但是其不同初始值会导致不同的分类结果,当分类不准确时容易造成参数重构误差较大的缺陷。
发明内容
本发明的目的在于针对现有技术中存在的问题提供一种基于深度学习的低压台区线损合理区间预测方法,该方法通过精准的线损预测模型,提升精准降损能力,实现线损精益化管理;通过线损精准预测,提升线损精益化管理。
本发明的技术方案是:
一种基于深度学习的低压台区线损合理区间预测方法,包括如下步骤:
S1.数据的收集,包括采集、营销、PMS和GIS四个系统,涉及的数据包括配变侧数据和用户侧数据;
S2.指标的构建,从S1收集的数据选取线损影响因子;
S3.特征构建,通过对选取的影响因子与线损率的相关性分析,将负荷特性的平方、末端压降的绝对值作为模型的特征因子输入;
S4.特征因子选择,采用统计指标因子和两个构建的特征因子构建Lasso回归模型,最终根据Lasso回归变量筛选结果选择上网电量占比、供电半径、末端电量占比、台区功率因数、首末端压降绝对值、负载率、负荷特性平方和三相不平衡系数八个因子作为最终的特征因子;
S5.构建线损预测模型,采用LSTM构建线损预测模型;
S6.模型预测效果展示。
具体的,所述的步骤S1中,配变侧数据包括配变容量、电压、电流、功率和电量,用户侧数据包括有用户容量、日用电量及用户坐标。
具体的,所述的步骤S2中选取台区电源类指标、网架类指标、电量类指标、运行类指标和容量类指标五大类共二十四个台区线损影响因子。
具体的,所述的步骤S4中Lasso回归模型是将参数估计与变量选择同时进行一种正则化方法,其参数估计被定义如下:
式中,λ为非负正则参数,为惩罚项。
具体的,所述的步骤S4中采用Lasso回归模型对回归变量筛选的过程中包括对残差估计进行异常值剔除,包括如下步骤:
1)计算预测残差
2)计算残差的均值和标准差
mean_resid=mean(resid)
std_resid=std(resid)
3)计算z得分
4)异常值检测
|z_score|>3
对于样本数据中z得分大于3的线损率样本值进行剔除。
具体的,所述的步骤S4中还包括对选定的特征因子进行归一化处理,采用最小最大值归一化方法,将每一个特征因子都归一到[0.1,0.9]之间,假设有N个样本{x(n)}Nn=1,对于每一维特征x,归一化后的特征为
其中,min(x)和max(x)分别是特征因子x在所有样本上的最小值和最大值。
具体的,所述的步骤S5中构建线损预测模型采用LASSO算法选择出得八个特征因子作为LSTM模型的输入,通过循环迭代优化训练网络结构,包括如下步骤:
1)对八个特征因子进行归一化处理作为LSTM模型的输入,将实际线损率作为模型输出,并将数据分为训练集和测试集;
2)设置LSTM深度学习模型的基本参数,包括激活函数,深度神经网络的层数,模型梯度优化算法为ADAM;
3)根据训练数据训练模型优化模型参数,微调网络模型的基本参数,包括增加层数、更改激活函数,直至评估函数达到理想范围,最终确定模型网络参数128层,激活函数选择sigmod函数,Dropout层丢弃率为0.5;
4)最终利用训练好的模型,对新输入的特征因子预测相应的线损率以及合理区间上界。
具体的,所述LSTM模型的评估函数采用RMSLE,其公式如下:
其中yi为实际线损值,为线损预测值。
为了加强供电企业的日常管理工作,我国对低压配电网全面实施分台区管理,台区管理作为电网“四分管理”的重要组成部分,台区线损直接反映了某一地区的电网管理水平。但由于低压台区用户数目巨大、负荷多样、电网基层的管理水平以及网架建设机构的参差不齐、台账管理不完善、线路分布复杂多样,都增加了台区线损管理的复杂性。基于此现状实现台区线损率准确快速的计算成为亟待解决的问题。
对于传统线损计算方法存在的问题是:一是台区损耗率法、电压损失率法等简化算法,计算精度不高,无法满足台区精益化管理的要求;二是等值电阻法、潮流法等较准确算法,对台区拓扑网络、设备参数和运行数据要求高,由于配电网规模庞大,如果大规模开展台区实测,工作量非常大,因此难以掌握台区的线损总体情况;三是随着新能源的发展,台区380V光伏等电源接入已成为普遍现象,现有的线损计算方法已经不能满足台区的发展需要。
采用机器学习算法对于线损的计算或预测准确率都有了较大的提升,但是存在一定的局限性,基于支持向量机的计算方法,在数据量较大时模型训练效率较低,另外在特征维度空间较大时很难找到合适的核函数;采用k-means聚类和bp神经网络的计算方法和基于kmeans-LightGBM的计算法,由于聚类算法初始化中心是随机选定,不同初始值会导致不同的分类结果,当分类不准确时容易造成参数重构误差较大的缺陷。
本发明的有益效果是:1)采用lasso回归进行特征选择,优化模型输入,提高模型运行效率和模型的稳定性;2)针对线损预测构建深度学习模型,深度学习模型具有优秀的非线性函数逼近能力,并且能够挖掘特征因子与线损率之间深层次的特征规律,使得预测结果更加合理;3)采用RMSLE代替传统RMSE对模型进行评估,RMSLE评估策略是惩罚欠预测大于过预测,也就是欠预测比过预测的损失会更大的情况,有效解决线损率分布拖尾问题,使得模型预测结果更加合理精确;4)本发明根据预测线损与实际线损的残差估计预测线损合理区间上界。
使用本发明提供的方法使得营销线损管理覆盖用户最广,涉及设备最多,数据规模最大,通过精准的线损预测模型,提升精准降损能力,实现线损精益化管理;通过线损精准预测,提升线损精益化管理,每年为公司增加效益约上亿元。
附图说明
图1是线损率与负荷特性散点示意图。
图2是线损率与首末端压降散点示意图;
图3是LSTM结构示意图;
图4是台区线损率预测值与真实值对比。
具体实施方式
下面结合附图及具体实施方式对本发明的技术方案进行详细的描述。
实施例1
本实施例提供的一种基于深度学习的低压台区线损合理区间预测方法,包括如下步骤:
S1.数据的收集,包括采集、营销、PMS和GIS四个系统,涉及的数据包括配变侧数据和用户侧数据,配变侧数据包括配变容量、电压、电流、功率和电量,用户侧数据包括有用户容量、日用电量及用户坐标;
S2.指标的构建,从S1收集的数据选取线损影响因子,选取台区电源类指标、网架类指标、电量类指标、运行类指标和容量类指标五大类共二十四个台区线损影响因子;
S3.特征构建,通过对选取的影响因子与线损率的相关性分析,将负荷特性的平方、末端压降的绝对值作为模型的特征因子输入,通过24个影响因子与线损率的相关性分析可知,影响因子与线损率之间存在一定线性相关关系,如上网电量占比和功率因数与线损率整体上呈现负相关关系,而供电半径、末端电量占比、负载率和三相不平衡均与线损率整体上呈现正相关关系,也有部分影响因子存在非线性相关关系,如图1为线损率与负荷特性散点示意图和图2为线损率与首末端压降散点示意图,线损率与负荷特性的平方存在线性关系,而线损率与末端压降的绝对值呈现正向线性关系,因此将负荷特性的平方、末端压降的绝对值作为模型的特征输入;
S4.特征因子选择,采用统计的22个指标因子和两个构建的特征因子构建Lasso回归模型,最终根据Lasso回归变量筛选结果选择上网电量占比、供电半径、末端电量占比、台区功率因数、首末端压降绝对值、负载率、负荷特性平方和三相不平衡系数八个因子作为最终的特征因子,如果模型训练影响因子过多,将影响模型训练的效率和模型的稳定性。本发明采用Lasso进行特征因子的筛选,Lasso被广泛应用于参数估计和变量选择的方法之一,并且Lasso进行变量选择在确定的条件下被证明是一致的,Lasso是将参数估计与变量选择同时进行一种正则化方法,其参数估计被定义如下:
式中,λ为非负正则参数,为惩罚项;
S5.构建线损预测模型,采用LSTM构建线损预测模型;
S6.模型预测效果展示。
所述的步骤S2中二十四个台区线损特征指标因子分别为电源类指标:上网电量占比;容量类指标:配变容量、单相用户总容量、三相用户总容量、用户容量比、单相用户总容量百分比、三相用户总容量百分比;网架类指标:供电半径、网架结构、户均供电长度;电量类指标:日总供电量、单相用户日总用电量、三相用户日总用电量、单相用户总用电百分比、三相用户总用电百分比、末端用户电量百分比;运行类指标:功率因数、平均母线电压、首末端压降、平均负载率、最大负载率、负荷特性、三相不平衡、最大三相不平衡度。
异常值的存在会影响模型的稳定性,所以在所述的步骤S4中采用Lasso回归模型对回归变量筛选的过程中包括对残差估计进行异常值剔除,异常值剔除的过程包括如下步骤:
1)计算预测残差
2)计算残差的均值和标准差
mean_resid=mean(resid)
std_resid=std(resid)
3)计算z得分
4)异常值检测
|z_score|>3
对于样本数据中z得分大于3的线损率样本值进行剔除。
实施例2
一般而言,样本的原始特征中的每一维特征由于来源以及度量单位不同,其特征取值的分布范围往往差异很大。当我们计算不同样本之间的欧氏距离时,取值范围大的特征会起到主导作用。如供电半径和负载率量纲差异较大。这影响我们后面构建深度学习模型的收敛速度和模型的稳定性和准确性,因此需要对输入特征因子进行归一化。
本实施例与实施例1不同之处在于,在所述的步骤S4中需要对选定的特征因子进行归一化处理,本实施例采用最小最大值归一化方法,将每一个特征因子都归一到[0.1,0.9]之间,假设有N个样本{x(n)}Nn=1,对于每一维特征x,归一化后的特征为
其中,min(x)和max(x)分别是特征因子x在所有样本上的最小值和最大值。
实施例3
所述的步骤S5中构建线损预测模型采用LASSO算法选择出的八个特征因子作为LSTM模型的输入,通过循环迭代优化训练网络结构,包括如下步骤:
1)对八个特征因子进行归一化处理作为LSTM模型的输入,将实际线损率作为模型输出,并将数据分为训练集和测试集;
2)设置LSTM深度学习模型的基本参数,包括激活函数,深度神经网络的层数,模型梯度优化算法为ADAM;
3)根据训练数据训练模型优化模型参数,微调网络模型的基本参数,包括增加层数、更改激活函数,直至评估函数达到理想范围,最终确定模型网络参数128层,激活函数选择sigmod函数,Dropout层丢弃率为0.5;
4)最终利用训练好的模型,对新输入的特征因子预测相应的线损率以及合理区间上界。
LSTM是一种循环神经网络,LSTM层是SimpleRNN层的一种变体,该算法由Hochreiter和Schmidhuber在1997年开发,有效解决了SimpleRNN简单循环神经网络梯度消失的问题。它是通过增加了一种携带信息跨越多个时间步的方法实现来解决梯度消失的问题。
基本原理是,假设有一条传送带和一个时间序列,传送带运行方向和时间序列方向是平行的,时间序列中的信息可以在任何时间节点跳转至传送带,传送带则将该信息传送到更晚的时间节点,并在需要时信息也会原封不动地返到原来的时间节点。这就是LSTM的基本原理:它以这样的形式保存信息以便后面使用,从而防止较早的时间信息在处理过程中逐渐消失。其结构如图3所示,图中h(t)是短期状态;C(t)是长期状态;g(t)是主层输出层,其基本作用是分析当前输入x(t)和前一个短期状态h(t-1);f(2)控制哪些长期状态应该丢弃;i(t)控制g(t)哪些部分加入长期状态;o(t)控制哪些长期状态应该在这个时间迭代被读取和输出。
LSTM的计算公式如下:
i(t)=σ(Wxi T*X(t)+Whi T*h(t-1)+bi)
f(t)=σ(Wxf T*X(t)+Whf T*h(t-1)+bf)
o(t)=σ(Wxo T*X(t)+Who T*h(t-1)+bo)
g(t)=tanh(Wxg T*X(t)+Whg T*h(t-1)+bg)
其中,Wxi,Wfi,Wxo,Wxg是每一层连接到输入向量x(t);Whi,Whf,Who,Whg是每一层连接到前一个短期状态h(t-1)的权重矩阵;bi,bf,bo,bg是每一层的偏差系数。
实施例4
线损预测属于回归,而对于回归算法的通常采用MSE、RMSE、MAPE和R2等评估模型的性能,但由于采用实际线损率作为模型训练的目标变量,通过对实际线损率分布分析,实际线损率并非对称分布,存在一定拖尾效应,因此采用RMSE并非最优的选择,本实施例采用RMSLE作为所述LSTM模型的评估函数,其公式如下:
其中yi为实际线损值,为线损预测值。
由于实际线损率存在一定的拖尾效应,如果采用RMSE进行评估,其值会被异常大的值主导,这样即使很多小的值预测准确,当个别异常大的值预测不准时,RMSE就会很大。而RLMSE先取对数再求RMSE,可以有效解决该问题。
实施例5
随机抽取某市20个在台区,分析台区近20天实际线损率与预测线损率的关系,蓝色为实际线损率,黄色为预测线损率,从图4可以看出预测值大部分集中在实际线损率的中间位置,并且与实际线损率分布比较相似,说明模型预测效果较好。
根据预测线损与实际线损的残差估计预测区间上界,也即是训练模型的RMSE(均方根误差),并且按照3σ原则进行区间扩展,一倍δ为68.3%,1.5δ为93.32%,δ为95.4%,3δ为99.7%,本发明采用1.5δ进行扩展,其中δ=RMSE,RMSE计算公式如下
因此本发明的预测区间上界为
其中为合理区间上界,/>为线损预测值,RMSE通模型训练得到的均方根误差。
使用本发明提供的发明进行某台区线损预测模型,根据某市1万多台区,1个月数30多万条样本数据进行建模分析,从模型在现场验证情况看,模型准确率达到90%以上,很好的验证了该方法的可行性和有效性。
本发明提供的方法区别与其他机器学习方法,采用深度学习算法对台区线损进行预测,预测准确率得到显著提高;特征指标构建与特征选择的过程的设计新颖合理;3)采用Lasso回归模型对回归变量筛选的过程中包括对残差估计进行异常值剔除异常值,保证了模型的稳定性;4)模型评估采用RMSLE策略区别传统的评估策略,有效解决拖尾效应;5)区间上界采用1.5倍的RMSE进行扩展。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。
Claims (6)
1.一种基于深度学习的低压台区线损合理区间预测方法,其特征在于,
包括如下步骤:
S1.数据的收集,包括采集、营销、PMS和GIS四个系统,涉及的数据包括配变侧数据和用户侧数据;
S2.指标的构建,从S1收集的数据选取线损影响因子;
S3.特征构建,通过对选取的影响因子与线损率的相关性分析,将负荷特性的平方、末端压降的绝对值作为模型的特征因子输入;
S4.特征因子选择,采用统计指标因子和两个构建的特征因子构建Lasso回归模型,最终根据Lasso回归变量筛选结果选择上网电量占比、供电半径、末端电量占比、台区功率因数、首末端压降绝对值、负载率、负荷特性平方和三相不平衡系数八个因子作为最终的特征因子,采用Lasso回归模型对回归变量筛选的过程中包括对残差估计进行异常值剔除,包括如下步骤:
1)计算预测残差
2)计算残差的均值和标准差
mean_resid=mean(resid)
std_resid=std(resid)
3)计算z得分
4)异常值检测
z_score>3
对于样本数据中z得分大于3的线损率样本值进行剔除;
S5.构建线损预测模型,采用LSTM构建线损预测模型,所述的步骤S5中构建线损预测模型采用LASSO算法选择出得八个特征因子作为LSTM模型的输入,通过循环迭代优化训练网络结构,包括如下步骤:
1)对八个特征因子进行归一化处理作为LSTM模型的输入,将实际线损率作为模型输出,并将数据分为训练集和测试集;
2)设置LSTM深度学习模型的基本参数,包括激活函数,深度神经网络的层数,模型梯度优化算法为ADAM;
3)根据训练数据训练模型优化模型参数,微调网络模型的基本参数,包括增加层数、更改激活函数,直至评估函数达到理想范围,最终确定模型网络参数128层,激活函数选择sigmod函数,Dropout层丢弃率为0.5;
4)最终利用训练好的模型,对新输入的特征因子预测相应的线损率以及合理区间上界;
S6.模型预测效果展示。
2.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法,其特征在于,所述的步骤S1中,配变侧数据包括配变容量、电压、电流、功率和电量,用户侧数据包括有用户容量、日用电量及用户坐标。
3.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法,其特征在于,所述的步骤S2中选取台区电源类指标、网架类指标、电量类指标、运行类指标和容量类指标五大类共二十四个台区线损影响因子。
4.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法,其特征在于,所述的步骤S4中Lasso回归模型是将参数估计与变量选择同时进行一种正则化方法,其参数估计被定义如下:
式中,λ为非负正则参数,为惩罚项。
5.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法,其特征在于,所述的步骤S4中还包括对选定的特征因子进行归一化处理,采用最小最大值归一化方法,将每一个特征因子都归一到[0.1,0.9]之间,假设有N个样本{x(n)}Nn=1,对于每一维特征x,归一化后的特征为
其中,min(x)和max(x)分别是特征因子x在所有样本上的最小值和最大值。
6.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法,其特征在于,所述LSTM模型的评估函数采用RMSLE,其公式如下:
其中yi为实际线损值,为线损预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010867853.0A CN112149873B (zh) | 2020-08-25 | 2020-08-25 | 一种基于深度学习的低压台区线损合理区间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010867853.0A CN112149873B (zh) | 2020-08-25 | 2020-08-25 | 一种基于深度学习的低压台区线损合理区间预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112149873A CN112149873A (zh) | 2020-12-29 |
CN112149873B true CN112149873B (zh) | 2023-07-21 |
Family
ID=73887589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010867853.0A Active CN112149873B (zh) | 2020-08-25 | 2020-08-25 | 一种基于深度学习的低压台区线损合理区间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112149873B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112951350A (zh) * | 2021-02-02 | 2021-06-11 | 同济大学 | 一种基于行为信息的大学生心理状态评估方法 |
CN113095372A (zh) * | 2021-03-22 | 2021-07-09 | 国网江苏省电力有限公司营销服务中心 | 一种基于鲁棒神经网络的低压台区线损合理区间计算方法 |
CN113723844B (zh) * | 2021-09-06 | 2024-04-19 | 东南大学 | 一种基于集成学习的低压台区理论线损计算方法 |
CN114519514B (zh) * | 2022-01-27 | 2023-09-19 | 佰聆数据股份有限公司 | 一种低压台区合理线损值测算方法、系统及计算机设备 |
CN114609480B (zh) * | 2022-05-16 | 2022-08-16 | 国网四川省电力公司电力科学研究院 | 一种电网损耗异常数据检测方法、系统、终端及介质 |
CN115760484B (zh) * | 2022-12-07 | 2024-09-06 | 湖北华中电力科技开发有限责任公司 | 一种配电台区隐患辨识能力提升方法、装置、系统及存储介质 |
CN116930667A (zh) * | 2023-09-15 | 2023-10-24 | 广东电网有限责任公司 | 一种台区电网边缘测试方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069527A (zh) * | 2015-07-31 | 2015-11-18 | 国家电网公司 | 一种基于数据挖掘技术的台区合理线损预测方法 |
CN109272176A (zh) * | 2018-12-10 | 2019-01-25 | 贵州电网有限责任公司 | 利用K-means聚类算法对台区线损率预测计算方法 |
CN110309485A (zh) * | 2019-07-03 | 2019-10-08 | 贵州电网有限责任公司 | 一种基于台区数据特征分类的线损率标杆值计算方法 |
CN110490409A (zh) * | 2019-07-05 | 2019-11-22 | 国网江苏省电力有限公司电力科学研究院 | 一种基于dnn的低压台区线损率标杆值设定方法 |
CN110598854A (zh) * | 2019-09-20 | 2019-12-20 | 国网福建省电力有限公司 | 一种基于gru模型的台区线损率预测方法 |
-
2020
- 2020-08-25 CN CN202010867853.0A patent/CN112149873B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069527A (zh) * | 2015-07-31 | 2015-11-18 | 国家电网公司 | 一种基于数据挖掘技术的台区合理线损预测方法 |
CN109272176A (zh) * | 2018-12-10 | 2019-01-25 | 贵州电网有限责任公司 | 利用K-means聚类算法对台区线损率预测计算方法 |
CN110309485A (zh) * | 2019-07-03 | 2019-10-08 | 贵州电网有限责任公司 | 一种基于台区数据特征分类的线损率标杆值计算方法 |
CN110490409A (zh) * | 2019-07-05 | 2019-11-22 | 国网江苏省电力有限公司电力科学研究院 | 一种基于dnn的低压台区线损率标杆值设定方法 |
CN110598854A (zh) * | 2019-09-20 | 2019-12-20 | 国网福建省电力有限公司 | 一种基于gru模型的台区线损率预测方法 |
Non-Patent Citations (1)
Title |
---|
基于行业实用系数的台区线损率标杆值计算方法;吴科成;曲毅;陈义森;欧阳森;;广东电力(07);81-91 * |
Also Published As
Publication number | Publication date |
---|---|
CN112149873A (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112149873B (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN110991786B (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN104809658B (zh) | 一种低压配网台区线损的快速分析方法 | |
CN110097297A (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN108520357A (zh) | 一种线损异常原因的判别方法、装置及服务器 | |
CN110210681B (zh) | 一种基于距离的监测站点pm2.5值的预测方法 | |
CN110210723B (zh) | 一种基于层次分析法和孤立森林的窃电辨识方法 | |
CN114519514B (zh) | 一种低压台区合理线损值测算方法、系统及计算机设备 | |
CN110210606A (zh) | 一种基于bp神经网络的输电线路泄漏电流预测方法、系统及存储介质 | |
CN111242161A (zh) | 一种基于智能学习的非侵入式非居民用户负荷辨识方法 | |
CN109613440A (zh) | 电池的分级方法、装置、设备和存储介质 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN110866366A (zh) | 一种基于XGBoost算法的含PHEV光伏微网孤岛检测法 | |
CN113379116A (zh) | 基于聚类和卷积神经网络的台区线损预测方法 | |
CN116148753A (zh) | 一种智能电能表运行误差监测系统 | |
CN115293257A (zh) | 一种针对异常用电用户的检测方法及系统 | |
CN116307844A (zh) | 一种低压台区线损评估分析方法 | |
CN112288172A (zh) | 台区线损率的预测方法、装置 | |
CN113949079B (zh) | 基于深度学习的配电台区用户三相不平衡预测优化方法 | |
CN111027841A (zh) | 一种基于梯度提升决策树的低压台区线损计算方法 | |
CN114240041A (zh) | 配网台区精益化线损分析方法及系统 | |
CN112508254A (zh) | 变电站工程项目投资预测数据的确定方法 | |
CN111965442A (zh) | 一种数字孪生环境下的能源互联网故障诊断方法及装置 | |
CN116249186A (zh) | 无线网设备的数据处理方法、装置、存储介质及电子设备 | |
Liu et al. | Capacity Prediction Method of Lithium‐Ion Battery in Production Process Based on Improved Random Forest |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 2015, 2 / F, building 18, Laizhen Jiayuan, Haidian District, Beijing 100096 Applicant after: Beijing Hezhong Weiqi Technology Co.,Ltd. Address before: Room 2015, 2 / F, building 18, Laizhen Jiayuan, Haidian District, Beijing Applicant before: BEIJING HEZHONG WEIQI TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |