CN116488151A

CN116488151A - 一种基于条件生成对抗网络的短期风电功率预测方法

Info

Publication number: CN116488151A
Application number: CN202310387839.4A
Authority: CN
Inventors: 陈汝斯; 刘海光; 杨旋; 李大虎; 蔡德福; 周悦; 周鲲鹏; 孙冠群; 王尔玺; 王文娜; 张良一
Original assignee: State Grid Corp of China SGCC; State Grid Hubei Electric Power Co Ltd; Electric Power Research Institute of State Grid Hubei Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Hubei Electric Power Co Ltd; Electric Power Research Institute of State Grid Hubei Electric Power Co Ltd
Priority date: 2023-04-07
Filing date: 2023-04-07
Publication date: 2023-07-25

Abstract

本发明涉及一种基于生成对抗网络的短期风电功率预测方法，包括：对短期气象尺度提取气象变量波动时序和历史风电功率时序生成特征矩阵作为条件数据，建立基于CNN‑LSTM‑CGAN改进型条件生成对抗网络的短期风电功率预测模型；将条件数据和随机噪声数据一同输入生成器，获取生成的预测数据；将生成的预测数据与条件数据一同输入判别器，与真实功率数据进行判别；引入特征损失函数，量度生成的预测数据与真实数据的特征值偏差，更新优化网络参数权重；若达到最大迭代次数，则迭代终止，输出网络参数；利用训练好的网络模型进行预测，获得最终风电功率预测结果。与现有技术相比，本发明具有提高预张良一测模型泛化性等优点。

Description

一种基于条件生成对抗网络的短期风电功率预测方法

技术领域

本发明涉及精准的短期风电功率预测技术领域，尤其是涉及一种基于条件生成对抗网络的短期风电功率预测方法。

背景技术

在构建以新能源为主体的新型电力系统发展趋势下，风电并网比例持续增长。由于风电功率具有较强的波动性和不确定性，给电网的规划、调度运行带来了巨大挑战。风电占比较低时，只需调整常规电源出力跟踪变化的负荷，就能较好地实现发电和用电之间的实时平衡，精准的短期风电功率预测技术可预测未来短时内风电波动时序，为电网制定合理的调度计划提供依据，减少弃风量，对于保障电网安全稳定运行，提高经济效益具有重要意义。

在风电场大规模并入电网后，需要由常规电源和风电共同满足负荷需求，在风电出力未知的情况下，常规电源需预留大量旋转备用容量来应对未知的风电波动和负荷需求，这极大地挤占了风电消纳空间，并对电力系统安全稳定运行带来影响。且由于风速和风向变化导致风电机组发电形成较大的随机性、波动性与非稳定性,给电网快速、有效、安全的调度增加了许多困难。如何充分学习非线性功率数据中隐含的深层关系，提高预测结果精度，制定合理的调度计划，协调解决电网调频是预测的主要难点。现有技术主要采用的方法有：基于BP神经网络的短期风电功率预测方法，BP神经网络能够以任意精度逼近任何非线性映射，学习和自适应未知信息，具有一定的容错性，但BP神经网络易陷入局部最小值，不能获得全局最优解；基于LSTM的超短期风电功率预测模型，LSTM模型能够兼顾数据时序性与非线性关系，通常情况下的预测结果准确率较为理想，但对于复杂度较高的数据样本难以挖掘其深层关系；传统生成对抗网络采用完全连接的神经网络作为生成器和判别器，只适用于比较简单的数据集，且GAN的学习过程过于自由，导致训练过程和学习结果都不稳定。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于条件生成对抗网络的短期风电功率预测方法，该方法通过条件生成对抗网络的博弈训练充分学习非线性功率数据中隐藏的深层关系，可进一步提高模型预测能力。

本发明的目的可以通过以下技术方案来实现：

一种基于条件生成对抗网络的短期风电功率预测方法，包括下列步骤：

1)选取风电场电站历史风电功率数据时序和历史气象数据时序，并对数据进行清洗；

2)利用随机森林法从步骤1)清洗后的数据中进行风电功率预测影响因素的筛选及重要程度判别，得到不同影响因素的权重，同时剔除掉对预测影响程度较低的因素，生成特征矩阵作为条件数据，建立并训练基于CNN-LSTM-CGAN改进型条件生成对抗网络的短期风电功率预测模型；

3)对CNN-LSTM-CGAN改进型条件生成对抗网络的权值进行初始化，设定最大迭代次数；

4)利用CNN构建生成器，将步骤2)得到的条件数据和随机噪声数据同时输入生成器中的四层一维CNN网络，生成在条件数据约束下的功率数据；

5)利用LSTM构建判别器，将步骤4)得到的功率数据，与真实数据和条件数据一同引入LSTM网络进行对抗训练，在条件数据约束下，经过全连接层得到接近真实功率数据分布的初步预测结果；

6)引入特征损失函数，基于步骤5)得到的初步预测结果，计算CNN-LSTM-CGAN改进型条件生成对抗网络的预测误差，优化参数权重；

7)对步骤6)的迭代次数进行判断，若达到步骤3)设定的最大迭代次数，则迭代终止，输出CNN-LSTM-CGAN改进型条件生成对抗网络的参数，否则，令当前迭代次数+1，执行步骤4)；

8)利用训练好的短期风电功率预测模型进行预测，最终得到风电功率预测结果。

进一步的，步骤2)中利用随机森林法计算10m、30m、70m不同高度风速和温度、气压、湿度气象数据对历史风电功率波动影响的重要程度，进行特征选择，获取特征矩阵作为条件数据，具体步骤为：

21)从原始训练数据集中，应用bootstrap方法有放回地随机抽取K个新的自助本集，并由此构建K棵分类回归树，每次未被抽到的本组成K个OOB；

22)每一棵树的每个节点处随机抽取m_ny个特征，作为随机的特征子集，计算该特征子集中每个特征蕴的信息量，在m_ny个特征中选择一个最具有分类能力的特征进行节点分裂；

23)以Gini指数评分VIM_j ^(Gini)，计算特征重要程度，Gini指数的计算公式为：

式中：K表示一共有K个类别；P_mk表示节点m中类别k所占的比例；

特征X_j在节点m的重要性，即节点m分支前后的Gini指数变化量计算公式为：

式中：GI_l、GI_r分别表示分支后两个新节点的Gini指数。

进一步的，步骤3)对CNN-LSTM-CGAN改进型条件生成对抗网络的权值进行初始化，具体步骤包括：

31)对卷积层进行高斯初始化，从均值为0，方差为1的高斯分布中采样，作为初始权值；

32)调用zero_state函数实现LSTM复合网络初始化。

进一步的，所述基于CNN-LSTM-CGAN改进型条件生成对抗网络的短期风电功率预测模型的目标函数为：

L_G＝-E_z,y(D(G(z|y)|y))

L_D＝-E_x,y(D(x|y))+E_z,y(D(G(z|y)|y))

min_Gmax_DL_CGAN＝E_x,y(lnD(x|y))

+E_z,y(ln(1-D(G(z|y)|y)))

式中：G表示生成器，D表示神经网络，L_G为生成器的损失函数，L_D为神经网络的损失函数，x为真实功率数据，y为条件数据，z为噪声数据，L_CGAN为CNN-LSTM-CGAN的损失函数，E_x,y(·)表示对x、y分布的期望值，E_z,y(·)表示对z、y分布的期望值；G(·)和D(·)分别为生成器和神经网络输出的数据。

进一步的，步骤6)中，还包括对特征损失函数进行改进，具体步骤为：

61)结合传统的损失函数L1和L2范数使生成器的生成结果更加接近真实数据分布，CNN-LSTM-CGAN使用L1范数作为损失函数得到的生成结果更加准确，重新定义的L1范数损失函数L为：

L_L1＝E_x,y,z(||x-G(z|y)||)

式中：x为真实功率数据，y为条件数据，z为噪声数据，E_x,y,z(·)表示对x、y、z分布的期望值，G(z|y)为生成的功率数据；

62)利用LSTM神经网络的隐藏层量度生成器生成的功率数据与真实数据之间的特征值偏差，进一步提高CNN-LSTM-CGAN预测超短期风电功率的准确率，特征损失函数L_per为：

L_per(G,x)＝E_x,y,z(λ_iP_i(G,x))

式中：P_i(G,x)为生成器生成的预测数据和真实功率数据在隐藏层h_i的平均偏差值，其中h_i为神经网络的第i层隐藏层；h_i(x)为h_i在隐藏层的真实功率数据值；h_i(G)为在隐藏层h_i由生成器生成的预测数据值；C_i、H_i和W_i分别为隐藏层h_i的通道数、高度和宽度值；λ_i为权重参数；

63)将L1范数损失函数L和特征损失函数L_per结合后，短期风电功率预测模型的总损失函数为：

L(G,D)＝min_Gmax_DL_CGAN+λ_L1L_L1+λ_perL_per(G,x)

式中：λ_L1和λ_per为损失函数的权重参数，利用损失函数计算初步预测值同真实值之间的差异值；

64)得到差异值后，模型反向传播去更新各个参数，来降低真实值与预测值之间的损失，使得模型生成的预测值往真实值靠拢，以达到学习目的；

65)整个CNN-LSTM-CGAN短期风电功率预测模型不断进行迭代优化，直至达到最大迭代次数，从而获得模型训练最优参数。

进一步的，所述短期风电功率预测模型训练过程中采用生成器与神经网络交替训练方式，神经网络更新一次后再更新生成器，利用Adam优化器对生成器和神经网络进行优化，并采用随机梯度下降算法，加快模型收敛。

本发明提供的一种基于条件生成对抗网络的短期风电功率预测方法，相较于现有技术至少包括如下有益效果：

一、本发明方法考虑历史功率数据和气象数据作为条件变量与噪声一同输入生成器，预测数据与真实数据输入神经网络，通过CNN-LSTM-CGAN博弈训练，引入特征损失函数，进一步提高短期风电功率的预测精度；

二、本发明提出随机森林法刻画影响因素同风电功率之间的关联性，引入卷积神经网络处理特征量较为复杂的非线性数据，采用步长卷积网络使网络在自主空间采样，4层CNN构建生成器模型，使模型训练易于达到平衡，生成数据与期望值差距小，模型收敛速度快。

附图说明

图1为本发明实施例基于条件生成对抗网络的短期风电功率预测方法的流程示意图；

图2为本发明实施例CGAN结构图；

图3为本发明实施例基于CGAN的短期风电功率预测模型；

图4为本发明实施例随机森林特征选取方法示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

本发明涉及一种基于条件生成对抗网络的短期风电功率预测方法，该方法考虑短期风电输出功率时序宏观波动特性，以突出短期风电功率时序变化特征，并建立了基于CNN-LSTM-CGAN短期风电功率预测模型。

本发明建立的基于改进CNN-LSTM-CGAN短期风电功率预测模型的主要原理为：

特征处理方面，由于风电功率数据呈现复杂非线性，且用于预测的输入特征，包括不同高度风速、温度、气象波动变量等是相对独立的特征时间序列，传统生成器仅适用于处理简单的数据集，学习自由，因此较难描述各项特征时序同风电功率数据之间的内在联系。且在实际训练中，当GAN处理特征量较为复杂的非线性数据时，不但模型训练很难达到平衡，而且还可能出现生成数据与期望值差距较大、模型的收敛速度慢等问题。针对上述问题，本发明首先采用随机森林算法进行风电功率影响因素筛选及重要程度判别。随机森林算法剔除了对风电功率影响较小的因素，还在一定程度上简化了模型，提高了预测速度和精度。利用卷积神经网络(CNN)来构造生成器，CNN不仅具有多隐藏特征提取的强大能力，而且能够共享卷积核，因此能够轻松处理高维数据的问题。

预测方法方面，短期风电功率预测方法主要包括物理方法、传统时间序列法、统计方法以及组合预测方法。其中，传统时间序列法因其只需有限的样本序列，就可以建立起相对能满足预测精度要求的模型而得到广泛应用，其中使用最多的模型主要包括三种类型：自回归模型(AR)、滑动平均模型(MA)和自回归滑动平均模型(ARMA)。该方法仅依靠序列本身所具有的时序性和自相关性为建模提供信息，忽略了风速、温度等气象因素对超短期风电功率预测的影响，预测精度不高。针对上述问题，本发明将风速、温度等气象因素作为条件数据，建立基于条件生成对抗网络的短期风电功率预测模型，约束模型生成的数据的分布，使生成器能够学习到满足对应条件下的样本概率分布映射关系。

基于上述原理，本发明实施例基于条件生成对抗网络的短期风电功率预测方法具体包括如下步骤内容(如图1所示)：

步骤一、首先，选取风电场电站历史风电功率数据时序和历史气象数据时序，对数据进行清洗；

其次，纠正历史数据集中可识别的错误(数据一致性优化、数据缺失等)，具体操作如下：

11)数据一致性优化：

利用3σ准则，即根据正态分配的离群点检测法实现异常点检测。先假定一个测量数值中只存在随机误差，然后对它经过统计处理得出的标准偏差值，按相应概率确定一个区间，凡是超出这个区间的偏差值就不构成随机误差而是粗大偏差，即判定为异常值，存在该偏差的数值进行剔除，3σ准则的原则为：

P(|x-μ|＞3σ)≤0.003 (1)

式中，(μ-σ，μ+σ)数值分布在中的概率为0.6826；(μ-2σ，μ+2σ)数值分布在中的概率为0.9545；(μ-3σ，μ+3σ)数值分布在中的概率为0.9973。

可以认为取值几乎完全集中于(μ-3σ，μ+3σ)区间内，在区间外的概率不足0.003。在正态分布中σ代表标准差,μ代表均值，本发明中对异常值进行如下针对性处理：

a、若明显发现是异常值但数量较小，直接进行剔除；

b、若算法对异常值不敏感，不处理；

c、利用平均值进行替代；

d、视为缺失值，按照处理缺失值的方法处理。

12)缺失值处理：

提取数据集中缺失值，依据缺失值所在属性的关键程度和缺失值的分布状况进行处理。具体方法如下：

a、缺失比例较少(<5％)，且序列属性并非与目标预测序列的强相关时(该序列与目标预测序列Pearson相关系数r满足：|r|＜0.8)，选用该序列中位数填充，person相关系数r表达式如下：

式中，x_i为风电功率相关影响因素，y_i为目标预测序列，即风电功率序列；

b、当缺失率高(>95％)且属性重要程度低时(该序列与目标预测序列Pearson相关系数r满足：|r|＜0.3)，直接删除该属性；

c、缺失值高，属性重要程度高时(该序列与目标预测序列Pearson相关系数r满足：0.8≤|r|＜1)，使用热平台插补法，即在非缺失数据时序中找到一个与缺失值所在样本相似的时序(匹配时序)，利用其中的观测值对缺失值进行插补。

13)标准化处理

考虑到数据分布区间跨度较大会影响深度学习模型在进行梯度下降求解时的下降速度，不利于模型收敛。此外多维数据之间存在的数量级差别易造成误差，因此对数据采用min-max归一化操作，使其映射至[0，1]区间内，归一化公式为：

式中：X_norm为归一化后的数据；X为当前数据；X_min为数据中最小值；X_max为数据中最大值。

步骤二、利用随机森林算法进行特征选择，首先将步骤一标准化后的影响因素数据构建特征向量，然后将特征向量作为随机森林法的输入，通过计算结果得到各影响因素的重要程度，选取最重要的影响因素作为条件数据，再建立基于CNN-LSTM-CGAN改进型条件生成对抗网络的短期风电功率预测模型(如图3所示)。具体操作如下：

21)基于进行预测时存在的特征较多，本实施例利用随机森林法(如图4所示)来筛选影响风电功率波动的主要因素，进行特征选择，其具体步骤如下：

A)依照收集到的影响因素数据序列，构建短期风电功率预测特征向量；

B)随机森林法进行特征选择，其具体步骤如下：

b1)从原始训数据集中，应用bootstrap方法有放回地随机抽取k个新的自助样本集，并由此构建k棵分类回归树，每次未被抽到的样本组成了k个OOB；

b2)每一棵树的每个节点处随机抽取m_y个特征，作为随机生成的特征子集，通过计算该特征子集中每个特征蕴含的信息量，在个特征中选择一个最具有分类能力的特征进行节点分裂，使得决策树具有更大的多样；

b3)以Gini指数评分计算特征重要程度，若特征X_j在决策树i中出现节点属于集合M，则X_j在第i棵树的重要性如下：

b4)令RF中共有n棵树，则总评分为：

b5)将所有计算的重要性评分做归一化处理如下：

C)得到特征向量重要程度矩阵。以ε＝1为判据，若VIM_j≥ε，则该影响因素归为输入数据类别，若VIM_j<ε，该影响因素可以忽略，将超过1的几个影响因素构成输入矩阵，作为条件数据。

22)基于CNN-LSTM-CGAN改进型条件生成对抗网络的短期风电功率预测模型的目标函数为：

L_G＝-E_z,y(D(G(z|y)|y)) (7)

L_D＝-E_x,y(D(x|y))+E_z,y(D(G(z|y)|y)) (8)

步骤三、对CNN-LSTM-CGAN改进型条件生成对抗网络的权值进行初始化，设定最大迭代次数K＝50，当前k₀＝1，具体内容为：

a)卷积层高斯初始化，从均值为0，方差为1的高斯分布中采样，作为初始权值；

b)调用zero_state函数(Tensorflow现有初始化函数)实现LSTM网络初始化；

步骤四、利用CNN构建生成器，将步骤二得到的特征矩阵和随机噪声数据输入生成器中的四层一维CNN网络，生成在条件数据约束下的功率数据(如图2所示)。

步骤五、利用LSTM构建判别器，将步骤四生成的功率数据、真实数据及条件数据一同引入LSTM网络进行对抗训练，得到在条件数据约束下，经过全连接层获得接近真实功率数据分布的初步预测结果，读取所得训练集、验证集的具体训练损失曲线、误差曲线，观察收敛过程中训练集、验证集损失曲线纵向间距，结合训练集、验证集绝对误差情况，直观评估网络预测结果收敛性能。以下为三种常见拟合状态代表的收敛情况：

a、当训练集损失曲线几乎无下降，此时为欠拟合状态，为不收敛状态；

b、当训练集损失曲线持续下降，验证集损失曲线到某一时刻不再下降，此时为过拟合状态，为收敛状态但非完美收敛；

c、当训练集、验证集损失曲线无明显间距时为完美拟合状态，且为完美收敛。

步骤六、引入特征损失函数，计算CNN-LSTM-CGAN改进型条件生成对抗网络的预测误差，优化参数权重。

进一步地，本发明对特征损失函数进行了优化，具体步骤为：

61)结合传统的损失函数(L1和L2范数)使生成器的生成结果更加接近真实数据分布，CNN-LSTM-CGAN使用L1范数作为损失函数得到的生成结果更加准确，重新定义的L1范数损失函数L为：

L_L1＝E_x,y,z(||x-G(z|y)||) (10)

式中：x为真实功率数据，y为条件数据，z为噪声数据，E_x,y,z(·)表示对x、y、z分布的期望值，G(z|y)为生成的功率数据。

L_per(G,x)＝E_x,y,z(λ_iP_i(G,x)) (11)

式中：P_i(G,x)为生成器生成的预测数据和真实功率数据在隐藏层h_i的平均偏差值，其中h_i为神经网络的第i层隐藏层；h_i(x)为h_i在隐藏层的真实功率数据值；h_i(G)为在隐藏层h_i由生成器生成的预测数据值；C_i、H_i和W_i分别为隐藏层h_i的通道数、高度和宽度值；λ_i为权重参数。

L(G,D)＝min_Gmax_DL_CGAN+λ_L1L_L1+λ_perL_per(G,x) (13)

步骤七、对步骤六的迭代次数进行判断，若达到最大迭代次数(k>K)，则迭代终止，输出CNN-LSTM-CGAN改进型条件生成对抗网络的参数，否则，令k＝k+1，执行步骤四；

步骤八、利用训练好的短期风电功率预测模型进行预测，得到最终风电功率预测结果。模型训练过程中采用生成器、神经网络交替训练方式进行，神经网络更新一次后优化生成器权值，利用Adam优化器对生成器和神经网络进行优化，并采用随机梯度下降算法，加快模型收敛。

本发明方法考虑历史输出功率与历史气象时序波动性特征，构建模型提取该波动性时间序列，充分挖掘非平稳波动序列之间隐藏的深层关系；提出的改进CNN-LSTM-CGAN混合网络预测模型，该模型综合考虑了不同高度风速、温度、湿度同风电功率数据之间的相关性以及短期风电功率时序内在特性，以充分提取历史特征序列相关内在信息，引入卷积神经网络CNN来构造生成器内部结构，LSTM构造判别器的内部结构，使生成器生成的功率数据与真实数据在条件数据的约束下进行博弈对抗训练，进一步对特征损失函数进行优化，反馈给生成器和判别器进行网络结构参数优化，有利于提高生成功率数据与真实功率数据的拟合度，进而达到较好的预测效果，并提高模型的泛化性。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的工作人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于条件生成对抗网络的短期风电功率预测方法，其特征在于，包括下列步骤：

2.根据权利要求1所述的基于条件生成对抗网络的短期风电功率预测方法，其特征在于，步骤2)中利用随机森林法计算10m、30m、70m不同高度风速和温度、气压、湿度气象数据对历史风电功率波动影响的重要程度，进行特征选择，获取特征矩阵作为条件数据，具体步骤为：

式中：GI_l、GI_r分别表示分支后两个新节点的Gini指数。

3.根据权利要求1所述的基于条件生成对抗网络的短期风电功率预测方法，其特征在于，步骤3)对CNN-LSTM-CGAN改进型条件生成对抗网络的权值进行初始化，具体步骤包括：

32)调用zero_state函数实现LSTM复合网络初始化。

4.根据权利要求1所述的基于条件生成对抗网络的短期风电功率预测方法，其特征在于，所述基于CNN-LSTM-CGAN改进型条件生成对抗网络的短期风电功率预测模型的目标函数为：

L_G＝-E_z,y(D(G(z|y)|y))

L_D＝-E_x,y(D(x|y))+E_z,y(D(G(z|y)|y))

min_G max_D L_CGAN＝E_x,y(lnD(x|y))+E_z,y(ln(1-D(G(z|y)|y)))

5.根据权利要求1所述的基于条件生成对抗网络的短期风电功率预测方法,其特征在于，步骤6)中，还包括对特征损失函数进行改进，具体步骤为：

L_L1＝E_x,y,z(||x-G(z|y)||)

L_per(G,x)＝E_x,y,z(λ_iP_i(G,x))

L(G,D)＝min_Gmax_DL_CGAN+λ_L1L_L1+λ_perL_per(G,x)

6.根据权利要求1所述的基于条件生成对抗网络的短期风电功率预测方法，其特征在于，所述短期风电功率预测模型训练过程中采用生成器与神经网络交替训练方式，神经网络更新一次后再更新生成器，利用Adam优化器对生成器和神经网络进行优化，并采用随机梯度下降算法，加快模型收敛。