CN114021992A - 一种面向大型风电机组实时出力性能的评估方法 - Google Patents
一种面向大型风电机组实时出力性能的评估方法 Download PDFInfo
- Publication number
- CN114021992A CN114021992A CN202111313388.7A CN202111313388A CN114021992A CN 114021992 A CN114021992 A CN 114021992A CN 202111313388 A CN202111313388 A CN 202111313388A CN 114021992 A CN114021992 A CN 114021992A
- Authority
- CN
- China
- Prior art keywords
- turbine generator
- real
- data
- time
- wind turbine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000013450 outlier detection Methods 0.000 claims abstract description 10
- 238000010801 machine learning Methods 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000013178 mathematical model Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000013480 data collection Methods 0.000 abstract 1
- 238000013527 convolutional neural network Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010248 power generation Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 239000003209 petroleum derivative Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Wind Motors (AREA)
Abstract
本发明公开了一种面向大型风电机组实时出力性能的评估方法。该方法基于风电机组正常运行状态下数据采集与监视控制系统记录数据集,设计利用滑窗技术的离群点检测方法,并设计带有时间信息提取的特征提取模型,选取XGBoost模型拟合风能利用系数与输入特征的等效数学模型,并统计训练集中超限程度,用于在线应用时出力性能的实时评估。在本发明的实时出力性能评估方法中,对每个数据点能够进行多次判断,并统计其离群程度进行离群点检测,从而获取更鲁棒、更灵活的检测结果;在特征提取中考虑变量时间依赖性,解决了机器学习XGBoost模型没有利用时间信息的问题,基于训练集超限程度作为在线实时评估依据,避免了人为主观因素的干扰,保证了评估的准确性。
Description
技术领域
本发明涉及一种面向大型风电机组实时出力性能的评估方法,基于风机正常运行状态数据集设计离群点检测方法,设计带有时间信息提取的自编码模型进行特征提取,从而拟合风能利用系数与输入特征之间等效数学模型,实时获取风能利用系数进行风机出力性能评估。
背景技术
随着社会的不断发展,高耗能的企业对于石油、天然气等不可再生能源的消耗日益增加,全世界已经出现了能源紧缺,以及消耗不可再生能源带来的环境污染问题,因此开发清洁的,可再生的能源成为解决能源问题的有效途径。风能作为一种可再生能源,储量丰富,清洁无污染,得到了迅速发展,在全球风力发电迅速发展的背景下,我国是全球风力发电增长速度最快的市场,我国的风机装机总容量已位于世界前列。但近几年风力发电市场的快速发展也导致了研发时期的准备不足,准备不足以及风机运行环境的复杂多变导致了风机故障率高,风机的运行维护费用居高不下。
风电机组最重要的特性为输出功率特性,即出力性能,对每台机组准确评估其出力性能,能够准确评估机组的当前运行状态,及时发现性能下降并找出性能降低的原因,避免出力性能持续下降,进而引起停机造成更大损失,对提高风电场的运营管理水平和经济效益有至关重要的意义。风电机组的出力性能通常由风能利用系数表征,风能利用系数反映了风电机组对风能的利用效率,是机组性能优劣的重要标志。结合数据挖掘技术,通过拟合风能利用系数与相关变量模型,实时获取风机正常运行状态下风能利用系数基准值,通过计算风能利用系数实际运行值与基准值的残差对风机出力性能实时评估便成为重中之重。
发明内容
本发明目的在于通过拟合风能利用系数与相关特征的等效数学模型,在线实时获取风能利用系数计算值与模型拟合值残差,从而对风电机组出力性能进行实时评估,提出一种面向大型风电机组实时出力性能的评估方法。该方法选取风电机组正常运行状态的数据集,设计基于每个数据点能够保证有多次判断的离群点检测方法,进行更鲁棒的离群点剔除,从而保证了输入数据的有效性,通过设计带有时间信息提取的自编码Autoencoderwith Temporal Information Extraction(AE-TIE)模型,在特征提取时加入历史时间信息,解决了机器学习XGBoost模型没有考虑时间依赖性的缺陷,保证了模型的精确性,通过统计训练集中超限程度进行在线应用时的判断基准,避免了孤立异常值引起的错误判断,保证了出力性能评估的准确性,具有理论意义与实用价值。
本发明的目的通过以下的技术方案实现:一种面向大型风电机组实时出力性能的评估方法,该方法包括以下步骤:
1)选取待进行实时出力性能评估的风电机组,获取该风电机组数据采集与监视控制(SCADA)系统中所记录的正常运行状态下的运行数据,运行参数包括风速v、空气密度ρ、转速ω、桨距角β、偏航角θ和有功功率P等,记为数据集X,x={v,ρ,ω,β,θ,P,...}T,并获取风电机组的结构参数,包括风轮半径R和功率转换效率η;
2)计算风能利用系数Cp,计算公式为并基于风能利用系数-风速数据集进行离群点剔除,首先进行风速区间划分,风速区间长度设置为Lv,所划分风速区间个数为之后设置风速滑窗长度Wv为k倍的风速区间长度,表示为Wv=k·Lv,滑窗自风机切入风速vcut-in移动至风机切出风速vcut-out,利用每个滑窗内的风能利用系数数值绘制箱型图,并基于箱型图结果进行离群点检测;
3)每个数据点能够在多个滑窗内进行检测,得到多个是否为离群点的检测结果,检测结果认定是离群点的次数与总检测次数比值作为该数据点的离群程度;
4)统计所有数据点的离群程度,并设置离群程度阈值h,h∈[0,1),离群程度大于h的数据点予以剔除,得到离群点剔除后的数据集X′;
5)设计带有时间信息提取的自编码Autoencoder with Temporal InformationExtraction (AE-TIE)模型进行特征提取;为输入时间信息,首先利用滑窗技术,设置滑窗长度W,滑窗内的数据表示为其中T为当前时刻,n为数据集中的变量个数,将X″输入至编码器中,编码器由LSTM单元构成,编码器输出为隐藏向量m为隐藏向量的维度,之后为进行隐藏向量中的短期时间信息提取,设计一层卷积神经网络CNN层,CNN层中有p个滤波器,每个滤波器的维度设置为从而能够对隐藏向量中不同时刻的时间信息进行提取,得到新的隐藏向量最后将新的隐藏向量h′输入至解码器中,解码器也由LSTM单元构成,得到重构的输入向量通过最小化重构误差进行模型训练;
6)将AE-TIE模型中新的隐藏向量h′作为输入特征,离群点剔除后的风能利用系数作为目标变量y,构造训练集[h′,y];
7)选取机器学习模型XGBoost作为变量估计模型拟合风能利用系数与隐藏向量h′之间的等效模型y=f(h′),训练完成后,获取训练集中风能利用系数实际值与模型估计值的残差序列,并设置残差阈值上下限,之后设置评估周期Tperiod,统计训练集中每个周期Tperiod时间内,残差值超过残差阈值上限或低于残差阈值下限的数据点的个数,并统计所有评估周期内超限数据点的最大个数cmax;
8)在线应用进行风电机组实时出力性能评估时,通过SCADA系统中运行数据,首先基于步骤5)设计的AE-TIE模型提取特征h′,之后通过训练完成的变量估计模型实时获取风能利用系数的模型估计值求取风能利用系数实时计算值Cp与变量估计模型输出值之间的残差每经过预先设置的时间周期Tperiod后,统计残差值超过残差阈值上限或低于残差阈值下限的数据点个数,当该周期内残差值超限的个数大于训练集中所有评估周期内超限数据点的最大个数cmax时,认定风电机组此时的出力性能出现异常。
进一步地,所述步骤2)中,基于每个滑窗的风能利用系数数值绘制箱型图时,首先求取上四分位数Q3以及下四分位数Q1,以及四分位距IQR=Q3-Q1,之后设置箱型图上边缘U=Q3+1.5IQR及下边缘L=Q1-1.5IQR,处于箱型图上下边缘之外的数据点认定为离群点。
进一步地,所述步骤3)中,在区间i∈[k,Nv-k+1]内的每个数据点进行k次检测,得到k个是否为离群点的检测结果,每个数据点的检测结果中为离群点的次数记为c1,c1∈[0,k],将比值作为该数据点的离群程度;在区间i∈[1,k-1]内的每个数据点进行i次检测,区间[Nv,Nv-k+2]内数据点检测次数与区间[1,k-1]对应相同,每个数据点的检测结果中为离群点的次数记为c2,c2∈[0,i],将比值作为该数据点的离群程度。
进一步地,所述步骤5)中,编码器部分将输入通过非线性映射得到隐藏向量h=d(W1X″+b1),其中f(·)为Sigmoid函数,与为编码器的权重矩阵和偏置向量,由训练得到;之后隐藏向量经CNN层得到新的隐藏向量作为解码器输入,解码器通过非线性映射得到重构向量表示为其中g(·)为Sigmoid函数,和为解码器的权重矩阵,为解码器的偏置向量,由训练得到;重构误差表示为其中s为训练集样本个数。
进一步地,所述步骤7)中,假设训练集残差序列服从t分布,取t分布99%分位数作为残差阈值上限,1%分位数作为残差阈值下限。
与现有技术相比,本发明具有以下创新优势及显著效果:
1)针对风电机组SCADA系统所记录数据,利用滑窗技术设计离群点检测方法,保证每个数据点均能进行多次检测,并基于多次检测结果,求取离群程度进行离群点判断,使离群点检测结果更具有鲁棒性与合理性;
2)针对机器学习模型XGBoost模型没有考虑变量时间依赖性的缺陷,设计带有时间信息提取的自编码Autoencoder with Temporal Information Extraction(AE-TIE)模型,在所提取特征中加入变量历史时间信息,从而使机器学习的输入中包含变量历史信息,提升了模型估计的准确性;
3)出力性能实时评估中,评估准则基于训练集中的超限程度,没有人为主观因素干扰,保证了出力性能评估的准确性;
4)通过拟合风能利用系数与输入特征的等效数学模型,实现风能利用系数的在线软测量,并可扩展到状态监测与故障预警方面的研究中,具有较强的扩展性。
附图说明
图1是本发明的风电机组实时出力性能评估方法流程图;
图2是本发明实施例中原始数据集风速-风能利用系数散点图;
图3是本发明实施例中基于所设计的离群点检测方法进行离群点剔除后的风速-风能利用系数散点图;
图4是本发明所设计的带有时间信息提取的自编码Autoencoder with TemporalInformation Extraction(AE-TIE)模型示意图;
图5是本发明实施例中风能利用系数实际计算值;
图6是本发明实施例中风能利用系数模型估计值。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
实施例
本实施例针对某风电场的某风力发电机组SCADA系统在2016至2017年采集到的数据进行风电机组实时出力性能的评估,其中风力发电机SCADA系统的数据采样间隔为5min,数据信息为期近20个月,时间范围为2016.01.01 00:00:00至2017.08.16 23:55:00,本发明方法实施步骤具体如下:
1)选取待进行实时出力性能评估的风电机组,获取该机组的数据采集与监视控制(SCADA)系统中所记录的正常运行状态下的运行数据,运行参数包括风速v、空气密度ρ、转速ω、桨距角β、偏航角θ和有功功率P等,记为数据集X,x={v,ρ,ω,β,θ,P,...}T,并获取风电机组的结构参数,包括风轮半径R以及功率转换效率η,在本实施例中功率转换效率η=0.9,风轮半径R=62m,采用标准空气密度ρ=1.225kg/m3,共计171072条数据;
2)计算风能利用系数Cp,计算公式为并基于风能利用系数-风速数据集进行离群点剔除,首先进行风速区间划分,风速区间长度设置为Lv,所划分风速区间个数为之后设置风速滑窗长度Wv为k倍的风速区间长度,表示为Wv=k·Lv,本实施例中取k=4,滑窗自风机切入风速vcut-in移动至风机切出风速vcut-out,利用每个滑窗内的风能利用系数数值绘制箱型图,求取上四分位数Q3以及下四分位数Q1,以及四分位距IQR=Q3-Q1,设置箱型图上边缘U=Q3+1.5IQR及下边缘L=Q1-1.5IQR,处于箱型图上下边缘之外的数据点认定为本次滑窗内的离群点;
3)每个数据点能够在多个滑窗内进行检测,在区间i∈[k,Nv-k+1]内的每个数据点进行k次检测,得到k个是否为离群点的检测结果,每个数据点的检测结果中为离群点的次数记为c1,c1∈[0,k],将比值作为该数据点的离群程度;在区间i∈[1,k-1]内的每个数据点进行i次检测,区间[Nv,Nv-k+2]内数据点检测次数与区间[1,k-1]对应相同,每个数据点的检测结果中为离群点的次数记为c2,c2∈[0,i],将比值作为该数据点的离群程度;
4)统计所有数据点的离群程度,并设置离群程度阈值h,h∈[0,1),离群程度大于h的数据点予以剔除,得到离群点剔除后的数据集X′,在本实施例中离群程度阈值设置为h=0.5,图2为原始数据集的风速-风能利用系数散点图,图3为离群点剔除后的风速-风能利用系数散点图;
5)设计带有时间信息提取的自编码Autoencoder with Temporal InformationExtraction (AE-TIE)模型进行特征提取,为输入时间信息,首先利用滑窗技术,设置滑窗长度W,滑窗内的数据表示为其中T为当前时刻,n为数据集中的变量个数,将X″输入至编码器中,编码器由LSTM单元构成,将输入通过非线性映射得到隐藏向量h=f(W1X″+b1),其中f(·)为Sigmoid函数,与为编码器的权重矩阵和偏置向量,由训练得到;之后为进行隐藏向量中的短期时间信息提取,设计一层卷积神经网络CNN层,CNN层中有p个滤波器,每个滤波器的维度设置为从而能够对隐藏向量中不同时刻的时间信息进行提取,得到新的隐藏向量最后将新的隐藏向量h′输入至解码器中,解码器也由LSTM单元构成,得到重构的输入向量,表示为其中g(·)为Sigmoid函数,和为解码器的权重矩阵,为解码器的偏置向量,由训练得到;通过最小化重构误差进行模型训练,重构误差表示为其中s为训练集样本个数,在本实施例中,选取2016年数据集,共105408条数据作为训练集进行模型训练,其余数据作为测试集,用于在线测试数据,图4为本发明所设计的带有时间信息提取的自编码AE-TIE模型示意图;
6)将AE-TIE模型中新的隐藏向量h′作为输入特征,离群点剔除后的风能利用系数作为目标变量y,构造训练数据集[h′,y];
7)选取机器学习模型XGBoost作为变量估计模型拟合风能利用系数与隐藏向量h′之间的等效模型y=f(h′),训练完成后,获取训练集中风能利用系数实际值与模型估计值的残差序列,并设置残差阈值上下限,假设训练集残差序列服从t分布,取t分布99%分位数作为残差阈值上限,1%分位数作为残差阈值下限,之后设置评估周期Tperiod,统计训练集中每个周期Tperiod时间内,残差值超过残差阈值上限或低于残差阈值下限的数据点的个数,并统计所有评估周期内超限数据点的最大个数cmax;在本实施例中评估周期为一天,图5为本发明实施例中训练集加测试集的风能利用系数实际计算值,图6为本发明实施例中训练集加测试集的风能利用系数模型估计值,训练集中的cmax=31;
8)在线应用进行风电机组实时出力性能评估时,通过SCADA系统中运行数据,首先基于本发明设计的AE-TIE模型提取特征h′,之后通过训练完成的变量估计模型实时获取风能利用系数的模型估计值求取风能利用系数实时计算值Cp与变量估计模型输出值之间的残差每经过预先设置的时间周期Tperiod后,统计残差值超过阈值上限或下限的数据点个数,当该周期内残差值超限的个数大于训练集中所有评估周期内超限数据点的最大个数cmax时,认定风电机组此时的出力性能出现异常,在测试集中超限数据点的最大个数为22,因此认为本机组出力性能正常。
本发明风电机组实时出力性能评估方法,主要包括风能利用系数离群点检测,带有时间信息提取的特征提取模型设计,选取机器学习模型XGBoost离线训练得到风能利用系数与输入特征的等效数学模型,训练集超限程度统计,以及在线应用进行出力性能实时评估等环节。图1为本发明的风电机组实时出力性能评估方法具体流程,图2为本发明实施例中原始数据集风速-风能利用系数散点图,图3为本发明实施例中基于所设计的离群点检测方法进行离群点剔除后的风速-风能利用系数散点图,图4为本发明所设计的带有时间信息提取的自编码Autoencoderwith Temporal Information Extraction(AE-TIE)模型示意图,图5为本发明实施例中风能利用系数实际计算值,图6为本发明实施例中风能利用系数模型估计值,该结果显示,本发明能够对风机出力性能进行实时评估,而且由于在特征提取中加入时间,从而保证了实时评估的准确性。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (5)
1.一种面向大型风电机组实时出力性能的评估方法,其特征在于,该方法包括以下步骤:
1)选取待进行实时出力性能评估的风电机组,获取该风电机组SCADA系统中所记录的正常运行状态下的运行数据,运行参数包括风速v、空气密度ρ、转速ω、桨距角β、偏航角θ和有功功率P等,记为数据集X,X={v,ρ,ω,β,θ,P,...}T,并获取风电机组的结构参数,包括风轮半径R和功率转换效率η;
2)计算风能利用系数Cp,计算公式为并基于风能利用系数-风速数据集进行离群点剔除,首先进行风速区间划分,风速区间长度设置为Lv,所划分风速区间个数为之后设置风速滑窗长度Wv为k倍的风速区间长度,表示为Wv=k·Lv,滑窗自风机切入风速vcut-in移动至风机切出风速vcut-out,利用每个滑窗内的风能利用系数数值绘制箱型图,并基于箱型图结果进行离群点检测;
3)每个数据点能够在多个滑窗内进行检测,得到多个是否为离群点的检测结果,检测结果认定是离群点的次数与总检测次数比值作为该数据点的离群程度;
4)统计所有数据点的离群程度,并设置离群程度阈值h,h∈[0,1),离群程度大于h的数据点予以剔除,得到离群点剔除后的数据集X′;
5)设计带有时间信息提取的自编码(AE-TIE)模型进行特征提取;为输入时间信息,首先利用滑窗技术,设置滑窗长度W,滑窗内的数据表示为其中T为当前时刻,n为数据集中的变量个数,将X″输入至编码器中,编码器由LSTM单元构成,编码器输出为隐藏向量m为隐藏向量的维度,之后为进行隐藏向量中的短期时间信息提取,设计一层卷积神经网络CNN层,CNN层中有p个滤波器,每个滤波器的维度设置为从而能够对隐藏向量中不同时刻的时间信息进行提取,得到新的隐藏向量最后将新的隐藏向量h′输入至解码器中,解码器也由LSTM单元构成,得到重构的输入向量通过最小化重构误差进行模型训练;
6)将AE-TIE模型中新的隐藏向量h′作为输入特征,离群点剔除后的风能利用系数作为目标变量y,构造训练集[h′,y];
7)选取机器学习模型XGBoost作为变量估计模型拟合风能利用系数与隐藏向量h′之间的等效模型y=f(h′),训练完成后,获取训练集中风能利用系数实际值与模型估计值的残差序列,并设置残差阈值上下限,之后设置评估周期Tperiod,统计训练集中每个周期Tperiod时间内,残差值超过残差阈值上限或低于残差阈值下限的数据点的个数,并统计所有评估周期内超限数据点的最大个数cmax;
2.根据权利要求1所述的一种面向大型风电机组实时出力性能的评估方法,其特征在于,所述步骤2)中,基于每个滑窗的风能利用系数数值绘制箱型图时,首先求取上四分位数Q3以及下四分位数Q1,以及四分位距IQR=Q3-Q1,之后设置箱型图上边缘U=Q3+1.5IQR及下边缘L=Q1-1.5IQR,处于箱型图上下边缘之外的数据点认定为离群点。
5.根据权利要求1所述的一种面向大型风电机组实时出力性能的评估方法,其特征在于,所述步骤7)中,假设训练集残差序列服从t分布,取t分布99%分位数作为残差阈值上限,1%分位数作为残差阈值下限。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111313388.7A CN114021992B (zh) | 2021-11-08 | 2021-11-08 | 一种面向大型风电机组实时出力性能的评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111313388.7A CN114021992B (zh) | 2021-11-08 | 2021-11-08 | 一种面向大型风电机组实时出力性能的评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114021992A true CN114021992A (zh) | 2022-02-08 |
CN114021992B CN114021992B (zh) | 2024-06-18 |
Family
ID=80062010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111313388.7A Active CN114021992B (zh) | 2021-11-08 | 2021-11-08 | 一种面向大型风电机组实时出力性能的评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114021992B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101498927A (zh) * | 2008-02-03 | 2009-08-05 | 北京能高自动化技术有限公司 | 风电场群中央综合监控系统 |
CN101701871A (zh) * | 2009-11-13 | 2010-05-05 | 中船重工(重庆)海装风电设备有限公司 | 一种风电机组整机测试方法及系统 |
US20200063710A1 (en) * | 2018-08-23 | 2020-02-27 | BluWave Inc. | System and methods for hyper short-term wind power prediction using real-time wind parameter measurements |
CN111079343A (zh) * | 2019-12-04 | 2020-04-28 | 浙江大学 | 一种基于宽度学习的风电机组有效风速估计方法 |
-
2021
- 2021-11-08 CN CN202111313388.7A patent/CN114021992B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101498927A (zh) * | 2008-02-03 | 2009-08-05 | 北京能高自动化技术有限公司 | 风电场群中央综合监控系统 |
CN101701871A (zh) * | 2009-11-13 | 2010-05-05 | 中船重工(重庆)海装风电设备有限公司 | 一种风电机组整机测试方法及系统 |
US20200063710A1 (en) * | 2018-08-23 | 2020-02-27 | BluWave Inc. | System and methods for hyper short-term wind power prediction using real-time wind parameter measurements |
CN111079343A (zh) * | 2019-12-04 | 2020-04-28 | 浙江大学 | 一种基于宽度学习的风电机组有效风速估计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114021992B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111539553B (zh) | 基于svr算法和偏峰度的风电机组发电机故障预警方法 | |
Li et al. | Short-term wind power prediction based on data mining technology and improved support vector machine method: A case study in Northwest China | |
CN107885959B (zh) | 一种基于置信等效功率曲线带的风电建模及性能评估方法 | |
CN110880789B (zh) | 一种风电、光伏联合发电系统经济调度方法 | |
CN111275367B (zh) | 一种区域综合能源系统能效状态评价方法 | |
CN106570790B (zh) | 一种计及风速数据分段特性的风电场出力数据修复方法 | |
CN110009135B (zh) | 一种基于宽度学习的风电功率预测方法 | |
CN111522808B (zh) | 一种风电机组异常运行数据处理方法 | |
CN114386718A (zh) | 一种结合粒子群神经网络的风电场输出功率短时预测算法 | |
CN107728059A (zh) | 一种变桨系统状态评估方法 | |
CN111814849A (zh) | 一种基于da-rnn的风电机组关键组件故障预警方法 | |
CN115034485A (zh) | 一种基于数据空间的风电功率区间预测方法及装置 | |
CN110991701A (zh) | 一种基于数据融合的风电场风机风速预测方法及系统 | |
CN111814848B (zh) | 一种风电机组温度故障的自适应预警策略设计方法 | |
CN104574221B (zh) | 一种基于损失电量特征参数的光伏电站运行状态辨识方法 | |
CN102539823A (zh) | 一种wtg风速分布的预测方法 | |
CN114357866A (zh) | 基于lstm-ae集成共享框架的风电机组异常数据检测及清洗方法 | |
CN114021992B (zh) | 一种面向大型风电机组实时出力性能的评估方法 | |
CN110273818B (zh) | 一种基于轴变换粗细度分类的风机叶片结冰故障监测方法 | |
CN112132344A (zh) | 一种基于相似日和frs-svm的短期风电功率预测方法 | |
CN111738556A (zh) | 一种基于机头微气候评估风机发电能力的方法 | |
Qiao et al. | Research on SCADA data preprocessing method of Wind Turbine | |
CN111178601A (zh) | 一种基于气象数据后处理的风电机组功率预测方法 | |
CN113554203B (zh) | 基于高维网格化和LightGBM的风电预测方法及装置 | |
CN114169681B (zh) | 一种考虑时空离群点检测的风电机组功率曲线数据预处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |