CN113554203B - 基于高维网格化和LightGBM的风电预测方法及装置 - Google Patents
基于高维网格化和LightGBM的风电预测方法及装置 Download PDFInfo
- Publication number
- CN113554203B CN113554203B CN202010332939.3A CN202010332939A CN113554203B CN 113554203 B CN113554203 B CN 113554203B CN 202010332939 A CN202010332939 A CN 202010332939A CN 113554203 B CN113554203 B CN 113554203B
- Authority
- CN
- China
- Prior art keywords
- power
- wind speed
- wind
- data
- grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000002159 abnormal effect Effects 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 10
- 238000010248 power generation Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 2
- 238000011161 development Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005684 electric field Effects 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Wind Motors (AREA)
- Control Of Eletrric Generators (AREA)
Abstract
本发明提供一种基于高维网格化和LightGBM的风电预测方法及装置,将风电机组或风电场中心坐标位置周围的W个网格点的气象要素数据提取出来,将各类气象要素线性插值处理成与功率数据相同时间分辨率的时间序列气象数据,形成多维气象预报数据;对实际功率数据进行基于密度分布的功率曲线的预处理,获得有效的实际功率数据;将有效的实际功率数据以及与其对应时间段的多维气象预报数据作为训练数据,调用LightGBM算法,建立预测模型,得到功率预测结果。本发明通过风电机组或风电场周围的气象信息,构建高维输入特征,利用lightGBM的强大学习能力,挖掘气象信息与风功率的关联信息,能更加准确地进行风功率预测。
Description
技术领域
本发明属于风电领域,特别是涉及到一种基于高维网格化和LightGBM的风电预测方法及装置。
背景技术
风力发电是一种具有很大发展潜力的新能源发电方式,清洁无污染,极具商业化发展前景,但是,由于风力发电具有明显的间歇性和波动性,并网后严重影响电网电能质量,同时,随着风电并网容量的逐年攀升,风力发电对电网的影响日益严重,为减少风电对电网的冲击,保护电网稳定运行,调度机构不得不在必要时对风电场采取限制并网的措施,造成风能消纳问题。提前对风电功率进行准确预测,可以缓解电力系统调峰压力,有效提高风电并网的能力。因此,风电功率预测对风风力发电的可持续发展起着重要的作用。
国内外对风电功率预测方法进行了大量研究,主流方法分为三类统计模型方法、物理模型方法、以及发展迅速的机器学习方法。传统上的统计模型方法旨在利用统计学的方法,通过获取历史风功率数据中与时间和空间相关的关联信息,建立映射关系,进行预测;常用到的统计学方法有时间序列法、回归拟合法、灰色预测法和卡尔曼滤波等。然而统计学模型在平稳时间序列的预测精度较高,对阵风突变情况的预测精度较低,且长期预测的准确性较低。物理模型方法的实质是必须依靠数值天气预报模式的准确率,根据NWP中的风速、风向、气温等气象变量作为输入,修正预报风电场风速,然后根据风电场的功率曲线来推算出风功率的预测值。机器学习方法的核心思想是通过计算机人工智能算法,对大量历史实际数据的训练与学习,捕捉输入的特征向量与输出数据中隐含的规律与逻辑关系,使得模型能做出准确的预测,如人工神经网络(Artificial Neural Network,ANN)、支持向量机(Support Vector Machine,SVM)等。但是,传统神经网络对长时间序列处理能力较弱,难以有较高的准确度。而支持向量回归算法虽然能够避免陷入局部最优解,但当处理大规模训练样本时会出现收敛速度慢、难以实施的问题。
发明内容
本发明提出一种基于高维网格化和LightGBM的风电预测方法及装置,针对风力发电波动性和随机性较强的特点,提供更准确的风功率预测。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于高维网格化和LightGBM的风电预测方法,包括:
S1、将风电机组或风电场中心坐标位置周围的W个网格点的气象要素数据提取出来,以每个气象要素的每个网格点作为一个特征量,所述气象要素包括风速、风向、温度、湿度和压强;
S2、将各类气象要素线性插值处理成与功率数据相同时间分辨率的时间序列气象数据,形成多维气象预报数据;其中,风向由x方向风速和y方向风速分别线性插值后计算得到;
S3、对风电机组或风电场的实际功率数据进行基于密度分布的功率曲线的预处理,获得有效的实际功率数据;将有效的实际功率数据以及与其对应时间段的多维气象预报数据作为训练数据,调用LightGBM算法,建立预测模型,得到功率预测结果。
进一步的,步骤S3中所述得到功率预测结果的具体步骤包括:
将获得的有效实际功率数据和对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立功率预测模型,得到功率预测结果。
进一步的,步骤S3中所述得到功率预测结果的具体步骤包括:
将获得的有效实际功率数据所对应的实际风速数据和其对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立风速预测模型;将风速预测模型的风速预测结果通过所述基于密度分布的功率曲线转换成功率值,得到功率预测结果。
优选的,步骤S3中所述基于密度分布的功率曲线的获取方法包括:
(1)采集风电机组或风电场实际历史运行风速、功率,进行初筛处理,去除恒定值和异常值;
(2)以风速为横坐标,功率为纵坐标,对风速进行等间隔划分,得到N个风速段,将功率进行等间隔划分,得到M个功率段,最终得到N*M个网格,以网格中心点坐标点代表该网格,即(Vi,Pj),其中,i=1,2,...,N;j=1,2,3,...,M;
(3)统计实际历史功率落在每个网格点的个数Num(i,j),得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为Median;
(4)当风速小于阈值时,对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;
(5)当风速大于阈值时,对于该区域内的每个风速段Vi所对应的各功率段Pi,从高风功率段开始,即j=M,M-1,...,1,寻找符合以下条件的网格点并记录下该网格点的中心坐标,并进入下一个风速段的寻找;1)Num(i,j)等于该功率段下的最大密度数 为Num(i,j)在i=1,2,...,N时的最大值;2)Num(i,j)大于密度数的中位数Median;
(6)根据步骤(4)和(5)获取到的坐标点,得到该风电机组的功率曲线。
更进一步的,步骤(6)中根据坐标点得到功率曲线的生成步骤还包括:
(601)获取到的一组坐标点(Vk,Pk),其中k=1,2,…,q;以风速Vk从小到大进行排序,将功率递减的坐标点去除,得到一组新的坐标(Vk,Pk),其中k=1,2,…,p;
(602)从0到30m/s,以0.1m/s为间隔构建风速序列,将(Vk,Pk)线性插值到新的风速序列上,得到功率曲线B;
(603)将功率曲线B中风速小于K米/秒的功率置为零,K为风机切入风速;
(604)将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到该风电机组的功率曲线。
本发明的另一方面,还提供了一种基于高维网格化和LightGBM的风电预测装置,包括:
提取单元,用于将风电机组或风电场中心坐标位置周围的W个网格点的气象要素数据提取出来,以每个气象要素的每个网格点作为一个特征量,所述气象要素包括风速、风向、温度、湿度和压强;
插值单元,用于将各类气象要素线性插值处理成与功率数据相同时间分辨率的时间序列气象数据,形成多维气象预报数据;其中,风向由x方向风速和y方向风速分别线性插值后计算得到;
预测单元,用于对风电机组或风电场的实际功率数据进行基于密度分布的功率曲线的预处理,获得有效的实际功率数据;将有效的实际功率数据以及与其对应时间段的多维气象预报数据作为训练数据,调用LightGBM算法,建立预测模型,得到功率预测结果。
进一步的,所述预测单元设有功率预测模型模块,用于将获得的有效实际功率数据和对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立功率预测模型,得到功率预测结果。
进一步的,所述预测单元设有风速预测模型模块,用于将获得的有效实际功率数据所对应的实际风速数据和其对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立风速预测模型;将风速预测模型的风速预测结果通过所述基于密度分布的功率曲线转换成功率值,得到功率预测结果。
优选的,所述预测单元设有功率曲线获取子单元,所述功率曲线获取子单元包括:
初筛模块,用于采集风电机组或风电场实际历史运行风速、功率后,进行初筛处理,去除恒定值和异常值;
网格划分模块,用于以风速为横坐标,功率为纵坐标,对风速进行等间隔划分,得到N个风速段,将功率进行等间隔划分,得到M个功率段,最终得到N*M个网格,以网格中心点坐标点代表该网格,即(Vi,Pj),其中,i=1,2,...,N;j=1,2,3,...,M;
密度统计模块,用于统计实际历史功率落在每个网格点的个数Num(i,j),得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为Median;
坐标获取模块,用于:当风速小于阈值时,对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;当风速大于阈值时,对于该区域内的每个风速段Vi所对应的各功率段Pj,从高风功率段开始,即j=M,M-1,...,1,寻找符合以下条件的网格点并记录下该网格点的中心坐标,并进入下一个风速段的寻找;1)Num(i,j)等于该功率段下的最大密度数为Num(i,j)在i=1,2,...,N时的最大值;2)Num(i,j)大于密度数的中位数Median;
功率曲线模块,用于根据坐标获取模块获取到的坐标点,得到该风电机组的功率曲线。
更进一步的,所述功率曲线模块还包括:
排序子模块,用于将坐标获取模块获取到的一组坐标点(Vk,Pk),其中k=1,2,…,q;以风速Vk从小到大进行排序,将功率递减的坐标点去除,得到一组新的坐标(Vk,Pk),其中k=1,2,…,p;
插值子模块,用于从0到30m/s,以0.1m/s为间隔构建风速序列,将(Vk,Pk)线性插值到新的风速序列上,得到功率曲线B;
置零子模块,用于将功率曲线B中风速小于K米/秒的功率置为零,K为风机切入风速;
曲线生成子模块,用于将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到功率曲线。
与现有技术相比,本发明具有如下的有益效果:
(1)本发明通过风电机组或风电场周围的气象信息,构建高维输入特征,利用lightGBM的强大学习能力,挖掘气象信息与风功率的关联信息,能更加准确地进行风功率预测。实践表明,单个LightGBM模型就已经可以取得比一般算法更好的结果;
(2)本发明在构建预测模型时使用了基于密度分布的功率曲线对实际功率数据进行预处理,受异常数据的影响非常小,准确度极高,保证功率模型训练输入的样本集中均为风电场有效数据;
(3)本发明所述方法也可以进行风速预测,由于用到高维气象信息,同样可以得到优越的效果,同时风速预测结果还可以应用到基于密度分布的功率曲线,得到功率预测结果;
(4)本发明中的LightGBM算法可更换成Catboost或xgboost算法,参数调优后基本可达到同样效果。
附图说明
图1为本发明实施例中功率曲线的采集实际数据的散点图;
图2为本发明实施例中功率曲线的基于密度分布选取的一组坐标点的示意图;
图3为本发明实施例的功率曲线示意图;
图4为本发明实施例的功率曲线偏差范围示意图;
图5为本发明实施例的实际功率数据预处理后的示意图;
图6为本发明实施例的功率预测对比图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
为使本发明专利的目的、特征更明显易懂,下面结合附图对本发明专利的具体实施方式作进一步的说明。需说明的是,附图均采用非常简化的形式且均使用非精准的比率,仅用以方便、明晰地辅助说明本发明专利实施例的目的。
本发明的设计思想在于数据基于密度分布的功率曲线的预处理以及使用LightGBM进行功率预测。
由于电场运行数据是从SCADA系统中采集,在产生和采集的过程中均会受到各种因素的影响,由此带来误差,如果这部分数据较多被引进功率模型中,会明显降低风电功率的预测精度。因此,在使用历史数据训练模型前,需要考虑一定误差范围的情况下,剔除限电、故障等明显的功率异常点。将风电场的实测风速和实测功率二维空间进行网格离散化,统计功率值落在各个网格内的个数,获得功率空间密度数分布,通过统计处理,得到风电场实测风速和实测功率的拟合曲线,根据风电场实测功率与拟合曲线转换的理论功率的比较,剔除异常、扩建和限电数据,保证功率模型训练输入的样本集中均为风电场有效数据。
本发明中的LightGBM模型,根据决策树原理,特征中具体数据的量纲不同不会影响模型效果,因此不需要进行特征的标准化处理,可以自动剪枝选择特征,与其他单一模型对比,具有强大的泛化能力和鲁棒性,非常适用于短期风电功率预测。
LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架,对于这类基于树的模型,最耗时的部分就是在进行特征选择结点分裂时,需要遍历所有可能的划分点,计算信息增益,从而找到最优的划分点。面对海量数据和特征维度很高的数据集时,LightGBM算法正是通过对模型训练时样本点的采样优化和选择分裂点时的特征维度的优化,在不牺牲精度的条件下,提高了训练速度。
本发明的具体步骤包括:
1、将获取到的实际历史运行数据进行初筛处理,去除恒定值和异常值;如果数据采集频率为15分钟,风电机组或风电场并网发电容量为C,则恒定值的判断阈值为24(该阈值根据经验得来,可以设定为大于3的整数,但也不宜过大,以免无法起到异常数据过滤作用);风速正常值的范围为[0,30],功率正常值的范围为[0,C];
2、以风速为横坐标,功率为纵坐标,从0到30米/秒对风速进行等间隔划分,得到N个风速段,从低风速段到高风速段进行编号1,2,...,N;将功率从0到C进行等间隔划分,得到M个功率段,从低功率段到高功率段进行编号1,2,3,...,M,最终得到N*M个网格,以网格中心点坐标点代表该网格,即(Vi,Pj),其中,i=1,2,...,N;j=1,2,3,...,M。通常,风速间隔为0.02米/秒,功率间隔为C/1500,上述的间隔是通过全国一百多个风电场实际数据测试经验得出的相对比较稳定的值;
3、统计实际历史功率落在每个网格点的个数Num(i,j),即可得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为Median;
4、当风速小于VO时,一般VO取值为9~11米/秒(风速VO的取值一般接近风机额定输出功率,风电场限电基本发生在高风速段,风速超过VO时,该时段的数据会受限电影响,所以处理方法不一样),对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;
5、当风速大于VO时,对于该区域内的每个风速段Vi所对应的各功率段Pj,从高风功率段开始,即j=M,M-1,...,1,直到寻找符合以下条件的网格点,一旦找到符合的网格点,立即停止当前的寻找,记录下该网格点的中心坐标,并进入下一个风速段的寻找;
所述条件为:1)Num(i,j)等于该功率段下的最大密度数为Num(i,j)在i=1,2,...,N时的最大值;2)Num(i,j)大于密度数的中位数Median;Median为步骤3中求得的值,是所有网格点的非零功率密度数的中位数;
上述条件1)起决定性作用;条件2)是针对特别情况做的限定,可以看成特殊处理,可以说绝大部分电场的情况都能够满足条件2);
6、通过4、5两个步骤,可以获取一组坐标点(Vk,Pk),其中k=1,2,…,q,对该组坐标点进行以下处理:1)以风速Vk从小到大进行排序,将功率递减的坐标点去除后,得到一组新的坐标(Vk,Pk),其中k=1,2,…,p,;2)从0到30m/s,以0.1m/s为间隔构建风速序列,将(Vk,Pk)线性插值到新的风速序列上,得到功率曲线B;3)将功率曲线B风速小于K米/秒的功率值为零(K为风机切入风速,一般取值范围为2~3.5m/s,该值跟风机机型有关);4)将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到该风电机组以实际运行数据为基础的功率曲线;
7、根据实际风速通过上述功率曲线可以插值得到一组理论发电功率Ptheroy,当实际功率与理论发电功率的偏差在一定范围内,则认为该实际功率值有效,可以作为模型输入值,如果超出该范围,则认为该实际功率值为异常。一般情况该偏差范围为[-k1*C,k2*C],其中,k1,k2的范围为(0,0.3];
8、获取网格化气象预报数据,该数据可以是全球气象模式预报数据,也可以是中尺度气象预报模型数据,根据风电机组或风电场中心坐标位置周围约50km范围内的W个网格点的气象数据提取出来,以每个气象要素的每个网格点作为一个特征量,一般气象要素为风速、风向、温度、湿度和压强,则气象源的特征量均为5*W个。
9、将各类气象要素线性插值处理成与功率数据相同时间分辨率的时间序列多维气象预报数据,其中,风向由x方向风速和y方向风速分别线性插值后计算得到;
10、通过第7步,将剔除异常数据后的实际功率和对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立功率预测模型,得到功率预测结果;
11、或者通过第7步,将剔除异常数据后的实际功率所对应的实际风速数据和其对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立风速预测模型,将风速预测模型的风速预测结果通过第6步中得到的功率曲线转换成功率值,即可得到功率预测结果。
上述步骤10和11中,LightGBM算法可更换成Catboost或xgboost算法。
依据上述步骤,以某风电场为例,该风电场装机容量为49.5MW,采用气象数据的空间分辨率为10km*10km,则该风电场周围50km范围内的气象格点数为10*10个,选取风速、风向、温度、湿度和压强五个气象要素,获取气象预报数据得到的特征量维度为500,设该组为B组,再获取该风电场的单站的5个气象要素作为测试对照组A组,分别将单站气象预报数据和高维气象预报数据输入lightGBM模型,建立功率预测模型,对2019年5月11日到2019年5月17日该风电场的出力进行预测,结果如下表以及图6所示,采用本专利提供的高维气象数据和lightGBM方法,平均精度可提高1.4%。
日期 | 精度-预测功率A | 精度-预测功率B |
2019-05-11 | 86.23% | 85.82% |
2019-05-12 | 78.11% | 81.49% |
2019-05-13 | 68.51% | 74.84% |
2019-05-14 | 89.61% | 88.82% |
2019-05-15 | 82.35% | 83.40% |
2019-05-16 | 81.06% | 82.89% |
2019-05-17 | 86.12% | 84.49% |
平均值 | 81.71% | 83.11% |
上述表格中风功率预测精度计算方法:
其中,ACC为每日的精度,n为当天测量样本的数量;Pri为实际功率;Ppi为预测功率;Cp为装机容量。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于高维网格化和LightGBM的风电预测方法,其特征在于,包括:
S1、将风电机组或风电场中心坐标位置周围的W个网格点的气象要素数据提取出来,以每个气象要素的每个网格点作为一个特征量,所述气象要素包括风速、风向、温度、湿度和压强;
S2、将各类气象要素线性插值处理成与剔除异常数据后的实际功率数据相同时间分辨率的时间序列气象数据,形成多维气象预报数据;其中,风向由x方向风速和y方向风速分别线性插值后计算得到;
S3、对风电机组或风电场的实际功率数据进行基于密度分布的功率曲线的预处理,获得有效的实际功率数据;将有效的实际功率数据以及与其对应时间段的多维气象预报数据作为训练数据,调用LightGBM算法,建立预测模型,得到功率预测结果;
步骤S3中所述基于密度分布的功率曲线的获取方法包括:
(1)采集风电机组或风电场实际历史运行风速、功率,进行初筛处理,去除恒定值和异常值;
(2)以风速为横坐标,功率为纵坐标,对风速进行等间隔划分,得到N个风速段,将功率进行等间隔划分,得到M个功率段,最终得到N*M个网格,以网格中心点坐标点代表该网格,即(Vi,Pj),其中,i=1,2,…,N;j=1,2,3,…,M;
(3)统计实际历史功率落在每个网格点的个数Num(i,j),得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为<Median;
(4)当风速小于阈值时,对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;
(5)当风速大于阈值时,对于该区域内的每个风速段Vi所对应的各功率段Pj,从高风功率段开始,即j=M,M-1,…,1,寻找符合以下条件的网格点并记录下该网格点的中心坐标,并进入下一个风速段的寻找;1)Num(i,j)等于该功率段下的最大密度数 为Num(i,j)在i=1,2,…,N时的最大值;2)Num(i,j)大于密度数的中位数Median;
(6)根据步骤(4)和(5)获取到的坐标点,得到该风电机组的功率曲线;
步骤(6)中根据坐标点得到功率曲线的生成步骤还包括:
(601)获取到的一组坐标点(Vk,Pk),其中k=1,2,…,q;以风速Vk从小到大进行排序,将功率递减的坐标点去除,得到一组新的坐标(Vk,Pk),其中k=1,2,…,p;
(602)从0到30m/s,以0.1m/s为间隔构建风速序列,将(Vk,Pk)线性插值到新的风速序列上,得到功率曲线B;
(603)将功率曲线B中风速小于K米/秒的功率置为零,K为风机切入风速;
(604)将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到该风电机组的功率曲线;
根据实际风速通过所述该风电机组的功率曲线插值得到一组理论发电功率,当实际功率与理论发电功率的偏差在偏差范围内,则认为该实际功率值有效;如果超出偏差范围,则认为该实际功率值为异常。
2.根据权利要求1所述的一种基于高维网格化和LightGBM的风电预测方法,其特征在于,步骤S3中所述得到功率预测结果的具体步骤包括:
将获得的有效实际功率数据和对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立功率预测模型,得到功率预测结果。
3.根据权利要求1所述的一种基于高维网格化和LightGBM的风电预测方法,其特征在于,步骤S3中所述得到功率预测结果的具体步骤包括:
将获得的有效实际功率数据所对应的实际风速数据和其对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立风速预测模型;将风速预测模型的风速预测结果通过所述基于密度分布的功率曲线转换成功率值,得到功率预测结果。
4.一种基于高维网格化和LightGBM的风电预测装置,其特征在于,包括:
提取单元,用于将风电机组或风电场中心坐标位置周围的W个网格点的气象要素数据提取出来,以每个气象要素的每个网格点作为一个特征量,所述气象要素包括风速、风向、温度、湿度和压强;
插值单元,用于将各类气象要素线性插值处理成与剔除异常数据后的实际功率数据相同时间分辨率的时间序列气象数据,形成多维气象预报数据;其中,风向由x方向风速和y方向风速分别线性插值后计算得到;
预测单元,用于对风电机组或风电场的实际功率数据进行基于密度分布的功率曲线的预处理,获得有效的实际功率数据;将有效的实际功率数据以及与其对应时间段的多维气象预报数据作为训练数据,调用LightGBM算法,建立预测模型,得到功率预测结果;
所述预测单元设有功率曲线获取子单元,所述功率曲线获取子单元包括:
初筛模块,用于采集风电机组或风电场实际历史运行风速、功率后,进行初筛处理,去除恒定值和异常值;
网格划分模块,用于以风速为横坐标,功率为纵坐标,对风速进行等间隔划分,得到N个风速段,将功率进行等间隔划分,得到M个功率段,最终得到N*M个网格,以网格中心点坐标点代表该网格,即(Vi,Pj),其中,i=1,2,…,N;j=1,2,3,…,M;
密度统计模块,用于统计实际历史功率落在每个网格点的个数Num(i,j),得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为Median;
坐标获取模块,用于:当风速小于阈值时,对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;当风速大于阈值时,对于该区域内的每个风速段Vi所对应的各功率段Pj,从高风功率段开始,即j=M,M-1,…,1,寻找符合以下条件的网格点并记录下该网格点的中心坐标,并进入下一个风速段的寻找;1)Num(i,j)等于该功率段下的最大密度数 为Num(i,j)在i=1,2,…,N时的最大值;2)Num(i,j)大于密度数的中位数Median;
功率曲线模块,用于根据坐标获取模块获取到的坐标点,得到该风电机组的功率曲线;
所述功率曲线模块还包括:
排序子模块,用于将坐标获取模块获取到的一组坐标点(Vk,Pk),其中k=1,2,…,q;以风速Vk从小到大进行排序,将功率递减的坐标点去除,得到一组新的坐标(Vk,Pk),其中k=1,2,…,p;
插值子模块,用于从0到30m/s,以0.1m/s为间隔构建风速序列,将(Vk,Pk)线性插值到新的风速序列上,得到功率曲线B;
置零子模块,用于将功率曲线B中风速小于K米/秒的功率置为零,K为风机切入风速;
曲线生成子模块,用于将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到功率曲线;
根据实际风速通过所述该风电机组的功率曲线插值得到一组理论发电功率,当实际功率与理论发电功率的偏差在偏差范围内,则认为该实际功率值有效;如果超出偏差范围,则认为该实际功率值为异常。
5.根据权利要求4所述的一种基于高维网格化和LightGBM的风电预测装置,其特征在于,所述预测单元设有功率预测模型模块,用于将获得的有效实际功率数据和对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立功率预测模型,得到功率预测结果。
6.根据权利要求4所述的一种基于高维网格化和LightGBM的风电预测装置,其特征在于,所述预测单元设有风速预测模型模块,用于将获得的有效实际功率数据所对应的实际风速数据和其对应时间段的多维气象预报数据作为训练数据,调用python库LightGBM算法,网格搜索自动进行参数寻优,建立风速预测模型;将风速预测模型的风速预测结果通过所述基于密度分布的功率曲线转换成功率值,得到功率预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010332939.3A CN113554203B (zh) | 2020-04-24 | 2020-04-24 | 基于高维网格化和LightGBM的风电预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010332939.3A CN113554203B (zh) | 2020-04-24 | 2020-04-24 | 基于高维网格化和LightGBM的风电预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113554203A CN113554203A (zh) | 2021-10-26 |
CN113554203B true CN113554203B (zh) | 2023-12-26 |
Family
ID=78101274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010332939.3A Active CN113554203B (zh) | 2020-04-24 | 2020-04-24 | 基于高维网格化和LightGBM的风电预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113554203B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115189356B (zh) * | 2022-09-13 | 2022-12-02 | 国能日新科技股份有限公司 | 基于大气环流稳定状态的风、光功率预测订正方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355512A (zh) * | 2016-08-26 | 2017-01-25 | 华北电力大学 | 一种基于概率密度极大值优化的风电机组功率曲线拟合方法 |
CN106548253A (zh) * | 2016-11-08 | 2017-03-29 | 中国地质大学(武汉) | 基于非参数核密度估计的风电功率预测的方法 |
CN107507097A (zh) * | 2017-07-03 | 2017-12-22 | 上海电力学院 | 一种风电功率短期预测方法 |
CN109242143A (zh) * | 2018-07-31 | 2019-01-18 | 中国电力科学研究院有限公司 | 一种神经网络风电功率预测方法及系统 |
CN110288136A (zh) * | 2019-06-11 | 2019-09-27 | 上海电力学院 | 风电功率多步预测模型建立方法 |
CN110705772A (zh) * | 2019-09-26 | 2020-01-17 | 国家电网公司华北分部 | 区域电网风力发电功率预测优化方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2764826T3 (es) * | 2012-08-07 | 2020-06-04 | Korea Inst Energy Res | Método para predecir la densidad de energía eólica |
-
2020
- 2020-04-24 CN CN202010332939.3A patent/CN113554203B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355512A (zh) * | 2016-08-26 | 2017-01-25 | 华北电力大学 | 一种基于概率密度极大值优化的风电机组功率曲线拟合方法 |
CN106548253A (zh) * | 2016-11-08 | 2017-03-29 | 中国地质大学(武汉) | 基于非参数核密度估计的风电功率预测的方法 |
CN107507097A (zh) * | 2017-07-03 | 2017-12-22 | 上海电力学院 | 一种风电功率短期预测方法 |
CN109242143A (zh) * | 2018-07-31 | 2019-01-18 | 中国电力科学研究院有限公司 | 一种神经网络风电功率预测方法及系统 |
CN110288136A (zh) * | 2019-06-11 | 2019-09-27 | 上海电力学院 | 风电功率多步预测模型建立方法 |
CN110705772A (zh) * | 2019-09-26 | 2020-01-17 | 国家电网公司华北分部 | 区域电网风力发电功率预测优化方法和装置 |
Non-Patent Citations (5)
Title |
---|
A model combining convolutional neural network and LightGBM algorithm for ultra-short-term wind power forecasting;Ju Y等;Ieee Access;第7卷;28309-28318 * |
A multi-step probability density prediction model based on gaussian approximation of quantiles for offshore wind power;Wanying Zhang等;RENEWABLE ENERGY;第202卷;992-1011 * |
Data-driven wind speed forecasting using deep feature extraction and LSTM;Wu YX等;IET RENEWABLE POWER GENERATION;第13卷(第12期);2062-2069 * |
基于EEMD和LS-SVM模型的风电功率短期预测方法;程启明;陈路;程尹曼;张强;高杰;;电力自动化设备(05);全文 * |
风电机组功率曲线建模方法对比研究;齐霞;安磊;张妍;李芬花;张浩;阎洁;韩爽;李莉;;可再生能源(04);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113554203A (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114004139B (zh) | 一种光伏发电功率预测方法 | |
CN110766200A (zh) | 一种基于K-means均值聚类的风电机组发电功率预测方法 | |
CN112580874A (zh) | 一种基于随机森林算法和tcn的短期风电功率预测方法 | |
CN113344288B (zh) | 梯级水电站群水位预测方法、装置及计算机可读存储介质 | |
CN114819374B (zh) | 区域新能源超短期功率预测方法及系统 | |
CN111260503A (zh) | 一种基于聚类中心优化的风电机组功率曲线离群点检测方法 | |
CN115829105A (zh) | 基于历史数据特征搜索的光伏功率预测方法 | |
CN114399081A (zh) | 一种基于天气分类的光伏发电功率预测方法 | |
CN115358606A (zh) | 一种平缓地形下在役风电场能效评估方法及系统 | |
CN110852492A (zh) | 一种基于马氏距离找相似的光伏功率超短期预测方法 | |
CN105046349B (zh) | 一种计及尾流效应的风电功率预测方法 | |
CN112651576A (zh) | 长期风电功率预测方法及装置 | |
CN113554203B (zh) | 基于高维网格化和LightGBM的风电预测方法及装置 | |
CN112633565A (zh) | 一种光伏功率集合区间预测方法 | |
CN113505909B (zh) | 一种面向短期风电功率趋势预测的误差补偿方法 | |
CN102539823A (zh) | 一种wtg风速分布的预测方法 | |
CN114298132A (zh) | 风电功率预测方法及装置、电子设备 | |
CN111178601B (zh) | 一种基于气象数据后处理的风电机组功率预测方法 | |
CN113610285A (zh) | 一种分散式风电的功率预测方法 | |
CN111460360B (zh) | 基于密度分布的功率曲线拟合数据预处理方法及装置 | |
CN117060407A (zh) | 一种基于相似日划分的风电集群功率预测方法及系统 | |
CN117893058A (zh) | 光伏场站性能综合评估的方法及系统 | |
CN114036845B (zh) | 一种风电场群模型构建方法 | |
CN115764861A (zh) | 一种基于机器学习的风光一体化功率预测方法 | |
CN115544895A (zh) | 光伏电站年出力保证率模型优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |