CN112149873B

CN112149873B - 一种基于深度学习的低压台区线损合理区间预测方法

Info

Publication number: CN112149873B
Application number: CN202010867853.0A
Authority: CN
Inventors: 井友鼎; 付勇; 滕铁军; 郝增才; 陈小燕; 张伟
Original assignee: Beijing Hezhong Weiqi Technology Co ltd
Current assignee: Beijing Hezhong Weiqi Technology Co ltd
Priority date: 2020-08-25
Filing date: 2020-08-25
Publication date: 2023-07-21
Anticipated expiration: 2040-08-25
Also published as: CN112149873A

Abstract

本发明属于台区线损预测技术领域，具体涉及基于深度学习的低压台区线损合理区间预测方法，包括如下步骤：数据的收集；指标的构建；特征构建；特征因子选择；构建线损预测模型；模型预测效果展示。该方法通过精准的线损预测模型，提升精准降损能力，实现线损精益化管理；通过线损精准预测，提升线损精益化管理。

Description

一种基于深度学习的低压台区线损合理区间预测方法

技术领域

本发明属于台区线损预测技术领域，具体涉及基于深度学习的低压台区线损合理区间预测方法。

背景技术

低压配电台区线损产生的原因主要分为固定损失、管理原因和技术原因。其中固定损失包括变压器内绕组和铁芯产生的电阻损耗和励磁损耗；电力网输电的电缆线路产生的电阻损耗；电力传输网址中部署的电容、电抗类设备产生的电能损耗；电力网络中保护装置产生的电能损耗；介质产生的损耗、电网计量装置产生的损耗。管理原因主要指抄表问题和窃电管理工作不足等等。技术原因主要指营计数据不一致和户变关系不一致等问题。

随着国网公司线损精益化管理工作的深入开展，传统一刀切方式的线损合格率考核方式已不再满足线损精益化管理要求，供电企业需要迫切找到一种有效计算线损计算方法，动态预测各台区的合理线损值以及合理区间上界，对于超出合理区间上界台区及时预警。

台区线损计算以前的学者已经进行了大量的研究和验证，目前对电网线损率计算方法已经有很多，主要分为传统方法和基于机器学习的方法。其中传统方法主要包括台区损耗率法、电压损失率法、等值电阻法、潮流法等方法。机器学习方法主要有基于传统的可解释性强的线性回归方法，基于决策树的集成回归方法以及基于神经网络的不易解释的非线性回归方法、基于支持向量机的计算方法、基于神经网络和改进的自适应二次变异差分进化算法、基于改进K-means聚类和BP神经网络的计算方法、基于kmeans-LightGBM的短期低压配电网理论线损预测算法。

公告号CN109272176B的发明专利文献公开了一种利用K-means聚类算法对台区线损率预测计算方法，它包括：步骤1、选取有功供电量X1、无功供电量X2、供电线路总长度X3、供电半径X4和线路总电阻X5作为电气特征参数；步骤2、对电气特征参数的原始数据标准化处理；步骤3、通过电气特征参数来建立台区的性能指标函数PI(i)，选取初始聚类中心点和聚类数目K；步骤4、利用改进的K-means聚类算法对台区线损率进行预测；该发明利用台区的电气特征参数建立的指标函数，作为聚类分析判断初始聚类中心的原则，提高了聚类结果的精确性,但是其不同初始值会导致不同的分类结果，当分类不准确时容易造成参数重构误差较大的缺陷。

发明内容

本发明的目的在于针对现有技术中存在的问题提供一种基于深度学习的低压台区线损合理区间预测方法，该方法通过精准的线损预测模型，提升精准降损能力，实现线损精益化管理；通过线损精准预测，提升线损精益化管理。

本发明的技术方案是：

一种基于深度学习的低压台区线损合理区间预测方法，包括如下步骤：

S1.数据的收集，包括采集、营销、PMS和GIS四个系统，涉及的数据包括配变侧数据和用户侧数据；

S2.指标的构建，从S1收集的数据选取线损影响因子；

S3.特征构建，通过对选取的影响因子与线损率的相关性分析，将负荷特性的平方、末端压降的绝对值作为模型的特征因子输入；

S4.特征因子选择，采用统计指标因子和两个构建的特征因子构建Lasso回归模型，最终根据Lasso回归变量筛选结果选择上网电量占比、供电半径、末端电量占比、台区功率因数、首末端压降绝对值、负载率、负荷特性平方和三相不平衡系数八个因子作为最终的特征因子；

S5.构建线损预测模型，采用LSTM构建线损预测模型；

S6.模型预测效果展示。

具体的，所述的步骤S1中，配变侧数据包括配变容量、电压、电流、功率和电量，用户侧数据包括有用户容量、日用电量及用户坐标。

具体的，所述的步骤S2中选取台区电源类指标、网架类指标、电量类指标、运行类指标和容量类指标五大类共二十四个台区线损影响因子。

具体的，所述的步骤S4中Lasso回归模型是将参数估计与变量选择同时进行一种正则化方法，其参数估计被定义如下：

式中，λ为非负正则参数，为惩罚项。

具体的，所述的步骤S4中采用Lasso回归模型对回归变量筛选的过程中包括对残差估计进行异常值剔除，包括如下步骤：

1)计算预测残差

2)计算残差的均值和标准差

mean_resid＝mean(resid)

std_resid＝std(resid)

3)计算z得分

4)异常值检测

|z_score|＞3

对于样本数据中z得分大于3的线损率样本值进行剔除。

具体的，所述的步骤S4中还包括对选定的特征因子进行归一化处理，采用最小最大值归一化方法，将每一个特征因子都归一到[0.1,0.9]之间，假设有N个样本{x(n)}Nn＝1，对于每一维特征x，归一化后的特征为

其中，min(x)和max(x)分别是特征因子x在所有样本上的最小值和最大值。

具体的，所述的步骤S5中构建线损预测模型采用LASSO算法选择出得八个特征因子作为LSTM模型的输入，通过循环迭代优化训练网络结构，包括如下步骤：

1)对八个特征因子进行归一化处理作为LSTM模型的输入，将实际线损率作为模型输出，并将数据分为训练集和测试集；

2)设置LSTM深度学习模型的基本参数，包括激活函数，深度神经网络的层数，模型梯度优化算法为ADAM；

3)根据训练数据训练模型优化模型参数，微调网络模型的基本参数，包括增加层数、更改激活函数，直至评估函数达到理想范围，最终确定模型网络参数128层，激活函数选择sigmod函数，Dropout层丢弃率为0.5；

4)最终利用训练好的模型，对新输入的特征因子预测相应的线损率以及合理区间上界。

具体的，所述LSTM模型的评估函数采用RMSLE，其公式如下：

其中y_i为实际线损值，为线损预测值。

为了加强供电企业的日常管理工作，我国对低压配电网全面实施分台区管理，台区管理作为电网“四分管理”的重要组成部分，台区线损直接反映了某一地区的电网管理水平。但由于低压台区用户数目巨大、负荷多样、电网基层的管理水平以及网架建设机构的参差不齐、台账管理不完善、线路分布复杂多样，都增加了台区线损管理的复杂性。基于此现状实现台区线损率准确快速的计算成为亟待解决的问题。

对于传统线损计算方法存在的问题是：一是台区损耗率法、电压损失率法等简化算法，计算精度不高，无法满足台区精益化管理的要求；二是等值电阻法、潮流法等较准确算法，对台区拓扑网络、设备参数和运行数据要求高，由于配电网规模庞大，如果大规模开展台区实测，工作量非常大，因此难以掌握台区的线损总体情况；三是随着新能源的发展，台区380V光伏等电源接入已成为普遍现象，现有的线损计算方法已经不能满足台区的发展需要。

采用机器学习算法对于线损的计算或预测准确率都有了较大的提升，但是存在一定的局限性，基于支持向量机的计算方法，在数据量较大时模型训练效率较低，另外在特征维度空间较大时很难找到合适的核函数；采用k-means聚类和bp神经网络的计算方法和基于kmeans-LightGBM的计算法，由于聚类算法初始化中心是随机选定，不同初始值会导致不同的分类结果，当分类不准确时容易造成参数重构误差较大的缺陷。

本发明的有益效果是：1)采用lasso回归进行特征选择，优化模型输入，提高模型运行效率和模型的稳定性；2)针对线损预测构建深度学习模型，深度学习模型具有优秀的非线性函数逼近能力，并且能够挖掘特征因子与线损率之间深层次的特征规律，使得预测结果更加合理；3)采用RMSLE代替传统RMSE对模型进行评估，RMSLE评估策略是惩罚欠预测大于过预测，也就是欠预测比过预测的损失会更大的情况，有效解决线损率分布拖尾问题，使得模型预测结果更加合理精确；4)本发明根据预测线损与实际线损的残差估计预测线损合理区间上界。

使用本发明提供的方法使得营销线损管理覆盖用户最广，涉及设备最多，数据规模最大，通过精准的线损预测模型，提升精准降损能力，实现线损精益化管理；通过线损精准预测，提升线损精益化管理，每年为公司增加效益约上亿元。

附图说明

图1是线损率与负荷特性散点示意图。

图2是线损率与首末端压降散点示意图；

图3是LSTM结构示意图；

图4是台区线损率预测值与真实值对比。

具体实施方式

下面结合附图及具体实施方式对本发明的技术方案进行详细的描述。

实施例1

本实施例提供的一种基于深度学习的低压台区线损合理区间预测方法，包括如下步骤：

S1.数据的收集，包括采集、营销、PMS和GIS四个系统，涉及的数据包括配变侧数据和用户侧数据，配变侧数据包括配变容量、电压、电流、功率和电量，用户侧数据包括有用户容量、日用电量及用户坐标；

S2.指标的构建，从S1收集的数据选取线损影响因子，选取台区电源类指标、网架类指标、电量类指标、运行类指标和容量类指标五大类共二十四个台区线损影响因子；

S3.特征构建，通过对选取的影响因子与线损率的相关性分析，将负荷特性的平方、末端压降的绝对值作为模型的特征因子输入，通过24个影响因子与线损率的相关性分析可知，影响因子与线损率之间存在一定线性相关关系，如上网电量占比和功率因数与线损率整体上呈现负相关关系，而供电半径、末端电量占比、负载率和三相不平衡均与线损率整体上呈现正相关关系，也有部分影响因子存在非线性相关关系，如图1为线损率与负荷特性散点示意图和图2为线损率与首末端压降散点示意图，线损率与负荷特性的平方存在线性关系，而线损率与末端压降的绝对值呈现正向线性关系，因此将负荷特性的平方、末端压降的绝对值作为模型的特征输入；

S4.特征因子选择，采用统计的22个指标因子和两个构建的特征因子构建Lasso回归模型，最终根据Lasso回归变量筛选结果选择上网电量占比、供电半径、末端电量占比、台区功率因数、首末端压降绝对值、负载率、负荷特性平方和三相不平衡系数八个因子作为最终的特征因子，如果模型训练影响因子过多，将影响模型训练的效率和模型的稳定性。本发明采用Lasso进行特征因子的筛选，Lasso被广泛应用于参数估计和变量选择的方法之一，并且Lasso进行变量选择在确定的条件下被证明是一致的，Lasso是将参数估计与变量选择同时进行一种正则化方法，其参数估计被定义如下：

式中，λ为非负正则参数，为惩罚项；

S5.构建线损预测模型，采用LSTM构建线损预测模型；

S6.模型预测效果展示。

所述的步骤S2中二十四个台区线损特征指标因子分别为电源类指标：上网电量占比；容量类指标：配变容量、单相用户总容量、三相用户总容量、用户容量比、单相用户总容量百分比、三相用户总容量百分比；网架类指标：供电半径、网架结构、户均供电长度；电量类指标：日总供电量、单相用户日总用电量、三相用户日总用电量、单相用户总用电百分比、三相用户总用电百分比、末端用户电量百分比；运行类指标：功率因数、平均母线电压、首末端压降、平均负载率、最大负载率、负荷特性、三相不平衡、最大三相不平衡度。

异常值的存在会影响模型的稳定性，所以在所述的步骤S4中采用Lasso回归模型对回归变量筛选的过程中包括对残差估计进行异常值剔除，异常值剔除的过程包括如下步骤：

1)计算预测残差

2)计算残差的均值和标准差

mean_resid＝mean(resid)

std_resid＝std(resid)

3)计算z得分

4)异常值检测

|z_score|＞3

对于样本数据中z得分大于3的线损率样本值进行剔除。

实施例2

一般而言，样本的原始特征中的每一维特征由于来源以及度量单位不同，其特征取值的分布范围往往差异很大。当我们计算不同样本之间的欧氏距离时，取值范围大的特征会起到主导作用。如供电半径和负载率量纲差异较大。这影响我们后面构建深度学习模型的收敛速度和模型的稳定性和准确性，因此需要对输入特征因子进行归一化。

本实施例与实施例1不同之处在于，在所述的步骤S4中需要对选定的特征因子进行归一化处理，本实施例采用最小最大值归一化方法，将每一个特征因子都归一到[0.1,0.9]之间，假设有N个样本{x(n)}Nn＝1，对于每一维特征x，归一化后的特征为

实施例3

所述的步骤S5中构建线损预测模型采用LASSO算法选择出的八个特征因子作为LSTM模型的输入，通过循环迭代优化训练网络结构，包括如下步骤：

LSTM是一种循环神经网络，LSTM层是SimpleRNN层的一种变体，该算法由Hochreiter和Schmidhuber在1997年开发，有效解决了SimpleRNN简单循环神经网络梯度消失的问题。它是通过增加了一种携带信息跨越多个时间步的方法实现来解决梯度消失的问题。

基本原理是，假设有一条传送带和一个时间序列，传送带运行方向和时间序列方向是平行的，时间序列中的信息可以在任何时间节点跳转至传送带，传送带则将该信息传送到更晚的时间节点，并在需要时信息也会原封不动地返到原来的时间节点。这就是LSTM的基本原理：它以这样的形式保存信息以便后面使用，从而防止较早的时间信息在处理过程中逐渐消失。其结构如图3所示，图中h(t)是短期状态；C(t)是长期状态；g(t)是主层输出层，其基本作用是分析当前输入x(t)和前一个短期状态h(t-1)；f(2)控制哪些长期状态应该丢弃；i(t)控制g(t)哪些部分加入长期状态；o(t)控制哪些长期状态应该在这个时间迭代被读取和输出。

LSTM的计算公式如下：

i_(t)＝σ(W_xi ^T*X_(t)+W_hi ^T*h_(t-1)+b_i)

f_(t)＝σ(W_xf ^T*X_(t)+W_hf ^T*h_(t-1)+b_f)

o_(t)＝σ(W_xo ^T*X_(t)+W_ho ^T*h_(t-1)+b_o)

g_(t)＝tanh(W_xg ^T*X_(t)+W_hg ^T*h_(t-1)+b_g)

其中，W_xi,W_fi,W_xo,W_xg是每一层连接到输入向量x_(t)；W_hi,W_hf,W_ho,W_hg是每一层连接到前一个短期状态h_(t-1)的权重矩阵；b_i,b_f,b_o,b_g是每一层的偏差系数。

实施例4

线损预测属于回归，而对于回归算法的通常采用MSE、RMSE、MAPE和R2等评估模型的性能，但由于采用实际线损率作为模型训练的目标变量，通过对实际线损率分布分析，实际线损率并非对称分布，存在一定拖尾效应，因此采用RMSE并非最优的选择，本实施例采用RMSLE作为所述LSTM模型的评估函数，其公式如下：

其中y_i为实际线损值，为线损预测值。

由于实际线损率存在一定的拖尾效应，如果采用RMSE进行评估，其值会被异常大的值主导，这样即使很多小的值预测准确，当个别异常大的值预测不准时，RMSE就会很大。而RLMSE先取对数再求RMSE，可以有效解决该问题。

实施例5

随机抽取某市20个在台区，分析台区近20天实际线损率与预测线损率的关系，蓝色为实际线损率，黄色为预测线损率，从图4可以看出预测值大部分集中在实际线损率的中间位置，并且与实际线损率分布比较相似，说明模型预测效果较好。

根据预测线损与实际线损的残差估计预测区间上界，也即是训练模型的RMSE(均方根误差)，并且按照3σ原则进行区间扩展，一倍δ为68.3％，1.5δ为93.32％，δ为95.4％,3δ为99.7％，本发明采用1.5δ进行扩展，其中δ＝RMSE，RMSE计算公式如下

因此本发明的预测区间上界为

其中为合理区间上界，/>为线损预测值，RMSE通模型训练得到的均方根误差。

使用本发明提供的发明进行某台区线损预测模型，根据某市1万多台区，1个月数30多万条样本数据进行建模分析，从模型在现场验证情况看，模型准确率达到90％以上，很好的验证了该方法的可行性和有效性。

本发明提供的方法区别与其他机器学习方法，采用深度学习算法对台区线损进行预测，预测准确率得到显著提高；特征指标构建与特征选择的过程的设计新颖合理；3)采用Lasso回归模型对回归变量筛选的过程中包括对残差估计进行异常值剔除异常值，保证了模型的稳定性；4)模型评估采用RMSLE策略区别传统的评估策略，有效解决拖尾效应；5)区间上界采用1.5倍的RMSE进行扩展。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制；尽管参照较佳实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换；而不脱离本发明技术方案的精神，其均应涵盖在本发明请求保护的技术方案范围当中。

Claims

1.一种基于深度学习的低压台区线损合理区间预测方法，其特征在于，

包括如下步骤：

S2.指标的构建，从S1收集的数据选取线损影响因子；

S4.特征因子选择，采用统计指标因子和两个构建的特征因子构建Lasso回归模型，最终根据Lasso回归变量筛选结果选择上网电量占比、供电半径、末端电量占比、台区功率因数、首末端压降绝对值、负载率、负荷特性平方和三相不平衡系数八个因子作为最终的特征因子，采用Lasso回归模型对回归变量筛选的过程中包括对残差估计进行异常值剔除，包括如下步骤：

1)计算预测残差

2)计算残差的均值和标准差

mean_resid＝mean(resid)

std_resid＝std(resid)

3)计算z得分

4)异常值检测

z_score＞3

对于样本数据中z得分大于3的线损率样本值进行剔除；

S5.构建线损预测模型，采用LSTM构建线损预测模型，所述的步骤S5中构建线损预测模型采用LASSO算法选择出得八个特征因子作为LSTM模型的输入，通过循环迭代优化训练网络结构，包括如下步骤：

4)最终利用训练好的模型，对新输入的特征因子预测相应的线损率以及合理区间上界；

S6.模型预测效果展示。

2.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法，其特征在于，所述的步骤S1中，配变侧数据包括配变容量、电压、电流、功率和电量，用户侧数据包括有用户容量、日用电量及用户坐标。

3.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法，其特征在于，所述的步骤S2中选取台区电源类指标、网架类指标、电量类指标、运行类指标和容量类指标五大类共二十四个台区线损影响因子。

4.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法，其特征在于，所述的步骤S4中Lasso回归模型是将参数估计与变量选择同时进行一种正则化方法，其参数估计被定义如下：

式中，λ为非负正则参数，为惩罚项。

5.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法，其特征在于，所述的步骤S4中还包括对选定的特征因子进行归一化处理，采用最小最大值归一化方法，将每一个特征因子都归一到[0.1,0.9]之间，假设有N个样本{x(n)}Nn＝1，对于每一维特征x，归一化后的特征为

6.根据权利要求1所述基于深度学习的低压台区线损合理区间预测方法，其特征在于，所述LSTM模型的评估函数采用RMSLE，其公式如下：

其中yi为实际线损值，为线损预测值。