[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN114692729A - 基于深度学习的新能源场站不良数据辨识与修正方法 - Google Patents

基于深度学习的新能源场站不良数据辨识与修正方法 Download PDF

Info

Publication number
CN114692729A
CN114692729A CN202210230736.2A CN202210230736A CN114692729A CN 114692729 A CN114692729 A CN 114692729A CN 202210230736 A CN202210230736 A CN 202210230736A CN 114692729 A CN114692729 A CN 114692729A
Authority
CN
China
Prior art keywords
data
real
value
historical
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210230736.2A
Other languages
English (en)
Other versions
CN114692729B (zh
Inventor
陈文进
陈水耀
祁炜雯
张俊
朱峰
茹伟
范强
宋美雅
刘震
刘皓明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaoxing Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Shaoxing Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaoxing Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical Shaoxing Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority to CN202210230736.2A priority Critical patent/CN114692729B/zh
Publication of CN114692729A publication Critical patent/CN114692729A/zh
Application granted granted Critical
Publication of CN114692729B publication Critical patent/CN114692729B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提出了一种基于深度学习的新能源场站不良数据辨识与修正方法,包括:获取新能源场站中辨识对象的历史运行数据,在历史运行数据中标记出历史正常数据和历史不良数据;建立辨识模型,根据历史正常数据对辨识模型进行深度学习训练;建立修正模型,将历史不良数据输入修正模型和训练好的辨识模型中,结合辨识模型的输出对修正模型进行深度学习训练;获取辨识对象的实时运行数据,通过将实时运行数据输入训练好的辨识模型中,区分出实时运行数据中的实时正常数据和实时不良数据;将实时不良数据输入训练好的修正模型中,得到实时不良数据的修正值。本发明可显著提高不良数据辨识和修正效率,保障新能源电站的实时安全稳定运行。

Description

基于深度学习的新能源场站不良数据辨识与修正方法
技术领域
本发明属于能源数据管理领域,尤其涉及一种基于深度学习的新能源场站不良数据辨识与修正方法。
背景技术
随着新能源场站建设的不断深入和推进,新能源场站数据采集呈现海量化和高维化的趋势,与此同时不良数据的问题日益突出。新能源场站实时采集数据往往出现缺失、无效、重复和错误等不良数据,不良数据通常由两种原因造成:一是新能源的电力系统故障等,如数据采集系统中某一数据通道的暂时性中断,导致数据不真实;二是由于某些大工业负荷的突发性偶然波动以及突发性不良环境等的特殊事件,使得数据会发生不规律的振荡。不良数据的存在使新能源场站的状态估计结果失真,影响电力系统运行调度和稳定运行,甚至可能会引发未知的安全后果。
新能源场站的各类型数据量巨大,且数据之间的关系繁多,场站、机组、环境等数据之间互相耦合,各自内部数据间也存在耦合关系。而随着现代信息技术的不断发展,人工智能被应用到了各个领域当中,其中深度学习在新能源模式识别、分类和负荷预测场景中得到了广泛应用。深度学习对时间序列的时变规律特性适应能力强对历史信息有记忆和联想功能,而且能够对海量且耦合性数据不断学习。因此,可以利用深度学习辨识和修正新能源场站的不良数据,保证新能源场站安全稳定运行。
发明内容
为了解决现有技术中存在的缺点和不足,本发明提出了一种基于深度学习的新能源场站不良数据辨识与修正方法,包括:
S100:获取新能源场站中辨识对象的历史运行数据,在历史运行数据中标记出历史正常数据和历史不良数据;
S200:建立辨识模型,根据历史正常数据对辨识模型进行深度学习训练;
S300:建立修正模型,将历史不良数据输入修正模型和训练好的辨识模型中,结合辨识模型的输出对修正模型进行深度学习训练;
S400:获取辨识对象的实时运行数据,通过将实时运行数据输入训练好的辨识模型中,区分出实时运行数据中的实时正常数据和实时不良数据;
S500:将实时不良数据输入训练好的修正模型中,得到实时不良数据的修正值。
可选的,所述辨识对象包括风力发电参数、光伏发电参数以及新能源场站中机组的装机容量和有功功率;
其中,所述风力发电参数包括风速、温度、风向余弦值、湿度和压强;
所述光伏发电参数包括辐照强度、辐照时长和组件面积。
可选的,所述S200包括:
S210:将历史正常数据按照时序顺序分为训练数据和测试数据,初始化辨识模型的超参数;
S220:将训练数据输入辨识模型中进行训练,通过辨识模型计算辨识对象在测试数据对应时序下的预测值;
S230:计算辨识模型的收敛精度是否满足预设阈值,所述收敛精度的计算公式为:
Figure BDA0003540418140000021
其中,a为收敛精度,n为预测值的总数量,xfi为第i个测试数据,xi为第i个预测值;
S240:若收敛精度符合预设条件,则训练结束,否则,调整辨识模型的超参数,重复S220-S230直至收敛精度未超过预设条件。
可选的,所述方法还包括:在S200之前对历史运行数据进行预处理,包括:
识别历史运行数据中的缺失值,获取与缺失值属于同一类的历史运行数据,通过计算缺失值的同类均值得到缺失值的插补值,用所述插补值替代所述缺失值,所述插补值的计算公式为:
Figure BDA0003540418140000022
其中,ai为均值系数,当第i个输入的历史运行数据si缺失时为0,否则为1,m为同一类的历史运行数据的数据总量,
Figure BDA0003540418140000023
为插补值。
可选的,所述S300包括:
S310:初始化辨识模型的超参数;
S320:将历史不良数据输入训练好的辨识模型中,将辨识模型输出的对历史不良数据的预测值作为准确值;
S330:将历史不良数据输入修正模型中进行训练,通过修正模型分析历史不良数据的特征,根据分析结果输出对历史不良数据的修正值;
S340:分析修正值相对于准确值的误差程度以及误差分散程度,当分析结果符合预设条件时结束训练,否则,调整修正模型的超参数,重复S320-S330直至符合预设条件。
可选的,所述分析修正值相对于准确值的误差程度以及误差分散程度,包括:
通过计算修正值相对于准确值的平均绝对误差,分析所述误差程度;
通过计算修正值相对于准确值的均方根差,分析所述误差分散程度。
可选的,所述方法还包括:
在执行S500的同时,选取预设比例的正常数据输入修正模型中,计算修正模型的输出值与正常数据的平均绝对误差和均方根误差;
当平均绝对误差和均方根误差任一项不满足预设条件时,将执行S400时输入的实时运行数据作为训练数据,重新对辨识模型和修正模型进行训练。
可选的,所述辨识模型在输出层设有求解器,所述求解器为softmax函数。
可选的,所述求解器通过比较计算出的预测值与实际测量的实时运行数据的误差,输出实时不良数据的概率,根据所述概率输出识别出的实时不良数据以及实时不良数据所在的时序位置。
本发明提供的技术方案带来的有益效果是:
本发明结合深度学习建立并联合训练辨识模型和修正模型,利用得到的模型对新能源场站中采集的不良数据进行实时快速辨识和修正,可显著提高不良数据辨识和修正效率,支撑新能源电站的实时分析应用,保障新能源电站的实时安全稳定运行。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提出的一种基于深度学习的新能源场站不良数据辨识与修正方法的流程示意图;
图2为神经网络的神经元数量与收敛精度之间关联性的折线图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
如图1所示,本实施例提出了一种基于深度学习的新能源场站不良数据辨识与修正方法,包括:
S100:获取新能源场站中辨识对象的历史运行数据和实时运行数据,在历史运行数据中标记出历史正常数据和历史不良数据;
S200:建立辨识模型,根据历史正常数据对辨识模型进行深度学习训练;
S300:建立修正模型,将历史不良数据输入修正模型和训练好的辨识模型中,结合辨识模型的输出对修正模型进行深度学习训练;
S400:通过将实时运行数据输入训练好的辨识模型中,区分出实时运行数据中的实时正常数据和实时不良数据;
S500:将实时不良数据输入训练好的修正模型中,得到实时不良数据的修正值。
本实施例利用深度神经网络算法对新能源发电场站采集到的历史数据进行学习和训练,得到满足精度要求的深度神经网络辨识模型;下一步向辨识模型输入实时采集到的数据,得到深度神经网络的预测值,把预测值作为准确值,并设定偏差阈值,通过将真实采集到的数据与准确值进行比较,若其超出阈值范围,则视为不良数据,最终实时辨识出采集到的不良数据。通过上述过程,利用深度学习对时间序列的时变规律特性适应能力强对历史信息有记忆和联想功能,而且能够对海量且耦合性数据不断学习,进而实现对不良数据进行实时快速辨识和修正,可显著提高不良数据辨识和修正效率,支撑新能源电站的实时分析应用,保障新能源电站的实时安全稳定运行。
在本实施例中,所述辨识对象包括风力发电参数、光伏发电参数以及新能源场站中机组的装机容量和有功功率;其中,所述风力发电参数包括风速、温度、风向余弦值、湿度和压强;所述光伏发电参数包括辐照强度、辐照时长和组件面积。
在本实施例中,历史运行数据和实时运行数据均通过SCADA系统采集获取,具体的,SCADA系统15分钟进行一次数据采集。因为采集到的数据可能因SCADA系统存在不可控的随机故障,会有一些明显的数据错误,会影响到后续训练模型精度,所以本实施例在S200之前对历史运行数据和实时运行数据进行预处理,包括:
识别历史运行数据中的缺失值,获取与缺失值属于同一类的历史运行数据,通过计算缺失值的同类均值得到缺失值的插补值,用所述插补值替代所述缺失值,所述插补值的计算公式为:
Figure BDA0003540418140000061
其中,
Figure BDA0003540418140000062
为插补值,ai为均值系数,当第i个输入的历史运行数据或实时运行数据si缺失时为0,否则为1,m为同一类的历史运行数据或实时运行数据的数据总量。
本实施例经过数据预处理,得到样本数据集为35040个,该数据集时间跨度为1年。按照时间的连贯特性截取了最后的1000个样本数据作为实时辨识数据集,剩余的样本数据集作为历史运行数据用于构建与训练辨识模型和修正模型,并预先根据经验在历史运行数据中标记出历史正常数据和历史不良数据。
首先对辨识模型训练,所述S200包括:
S210:将历史正常数据按照时序顺序分为训练数据和测试数据,初始化辨识模型的超参数;
S220:将训练数据输入辨识模型中进行训练,通过辨识模型计算辨识对象在测试数据对应时序下的预测值;
S230:计算辨识模型的收敛精度是否满足预设阈值,所述收敛精度的计算公式为:
Figure BDA0003540418140000063
其中,a为收敛精度,n为预测值的总数量,xfi为第i个测试数据,xi为第i个预测值;
S240:若收敛精度符合预设条件,则训练结束,否则,调整辨识模型的超参数,重复S220-S230直至收敛精度未超过预设条件。
在本实施例中,首先设置辨识模型的超参数,包括初始网络结构、网络阈值以及权值等参数。不良数据的辨识问题本质上是个分类问题,所以辨识模型的输出层设有求解器并采用softmax函数,激活函数采用sigmoid函数。所述求解器通过比较计算出的预测值与实际测量的实时运行数据的误差,输出实时不良数据的概率,根据所述概率输出识别出的实时不良数据以及实时不良数据所在的时序位置。
具体的,辨识模型在训练过程中,通过训练数据对辨识对象在后续时序的运行数据进行预测,这里的后续时序与测试数据对应的时序一致,再根据预测值与测试数据之间的误差判断辨识模型的辨识精度在后续执行S400时,辨识模型根据对前一段时序的实时运行数据对后一段时序进行预测,并将预测的结果与后一段时序的实时运行数据,即辨识对象在后一段时序的实测值进行比较。辨识模型通过输出层的求解器设置上下浮动的阈值,将输出的准确值与对应的实测值根据阈值Δe计算进行判断,若其超出阈值范围,则视为不良数据。所述阈值Δe为:
Figure BDA0003540418140000071
xmax为最大的实测值,xmin为最小的实测值。
由于本实施例所使用的样本数量较大,考虑到精度与处理速度,采用双隐含层足以满足要求。如图2为神经元数目分别使用5、10、15、20、25、30对应的不良数据辨识的收敛精度的关联性的折线图,横坐标为神经元数目,纵坐标为对应的收敛精度,为方便比较,每层的神经元数目相同。训练过程中发现随着神经元数目的增大,仿真时间几乎成倍增加,辨识模型精度逐步增加,在辨识模型隐含层节点数分别为20个和20个之后,辨识结果则提升不够明显了,这是因为而深度模型则一直递增并趋于稳定,这说明辨识模型的性能随着隐含层的增加是逐渐优化的。根据综合考虑模型时间和性能的关系,本文选取辨识模型的隐含层节点数为20个,最终得到的不良数据结果如表1所示。由表1可见,各类型的数据的模型精度达到97%以上,说明采用辨识模型进行不同类型不良数据辨识的准确性较高,收敛性较好。
表1
Figure BDA0003540418140000072
Figure BDA0003540418140000081
完成辨识模型的训练后,再训练修正模型,本实施例中修正模型为BP神经网络,采用trainbr算法,该算法比基本梯度算法泛函能力更好,收敛速度更快,更适用于相互耦合的数据集。
具体的,所述S300包括:
S310:初始化辨识模型的超参数,即确定神经网络结构、网络阈值和权值;
S320:将历史不良数据经归一化处理后,输入训练好的辨识模型中,将辨识模型输出的对历史不良数据的预测值作为准确值,具体的,历史不良数据在Matlab中用mapminmax函数进行数据归一化处理;
S330:将历史不良数据输入修正模型进行,通过修正模型分析历史不良数据的特征,根据分析结果输出对历史不良数据的修正值;
S340:分析修正值相对于准确值的误差程度以及误差分散程度,当分析结果符合预设条件时结束训练,否则,调整修正模型的超参数,即调整神经网络结构、网络阈值和权值,重复S320-S330直至符合预设条件。
在本实施例中,首先设置辨识模型的超参数,包括初始网络结构、网络阈值以及权值等参数。对于神经网络隐含层节点数和隐含层个数的选择,如果隐含层结点数过少,网络不能具有必要的学习能力和信息处理能力,反之,若过多,不仅会使网络越复杂,处理速度越慢,而且会使网络在学习过程中更易陷入局部极小点。因此本实施例考虑到辨识模型的输出是多个时,采用2层以上的隐含层对不良数据辨识和修改效果更好,每层节点的个数以及其他参数则在训练中得出。
所述分析修正值相对于准确值的误差程度以及误差分散程度,包括:
通过计算修正值相对于准确值的平均绝对误差(MAE),分析所述误差程度,具体计算公式为:
Figure BDA0003540418140000082
yi为第i个修正值,yti为第i个准确值,l为修正值的总个数。
通过计算修正值相对于准确值的均方根差(RMSE),分析所述误差分散程度,具体计算公式为:
Figure BDA0003540418140000091
具体的,修正模型在训练过程中,修正值相对于准确值的误差程度以及误差分散程度如表2所示,修正评价指标RMSE和MAE的值都非常小,相对于实际值较为接近,说明本方法针对新能源场站各个类型的不良数据都具有良好的修正效果,均满足预设条件,因此修正模型训练完毕。
表2
数据类型 RMSE MAE
有功功率 0.47706 0.07211
风速 0.51107 0.05084
风向余弦值 0.17631 0.13896
温度 0.08850 0.00889
压强 0.35447 0.05220
湿度 0.41174 0.03381
为了应对新能源场站运行情况的随机变化,本实施例还包括:在执行S500的同时,选取预设比例的正常数据输入修正模型中,计算修正模型的输出值与正常数据的平均绝对误差和均方根误差;当平均绝对误差和均方根误差任一项不满足预设条件时,将执行S400时输入的实时运行数据作为训练数据,重新对辨识模型和修正模型进行训练。通过上述过程及时调整辨识模型和修正模型的超参数,以满足辨识模型和修正模型的精度优化。
本实施例中实时正常数据不变化、对实时不良数据修正的同时,将一部分实时正常数据也输入训练好的修正模型进行了修正,对修正的相关误差指标进行统计后得到修正的相关误差指标对比,若修正评价指标RMSE和MAE均满足预设条件,则说明当前模型精度满足要求,辨识模型和修正模型的超参数暂不需要调整。
上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中的先后顺序。
以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,包括:
S100:获取新能源场站中辨识对象的历史运行数据和实时运行数据,在历史运行数据中标记出历史正常数据和历史不良数据;
S200:建立辨识模型,根据历史正常数据对辨识模型进行深度学习训练;
S300:建立修正模型,将历史不良数据输入修正模型和训练好的辨识模型中,结合辨识模型的输出对修正模型进行深度学习训练;
S400:通过将实时运行数据输入训练好的辨识模型中,区分出实时运行数据中的实时正常数据和实时不良数据;
S500:将实时不良数据输入训练好的修正模型中,得到实时不良数据的修正值。
2.根据权利要求1所述的一种基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,所述辨识对象包括风力发电参数、光伏发电参数以及新能源场站中机组的装机容量和有功功率;
其中,所述风力发电参数包括风速、温度、风向余弦值、湿度和压强;
所述光伏发电参数包括辐照强度、辐照时长和组件面积。
3.根据权利要求1所述的一种基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,所述方法还包括:在S200之前对历史运行数据和实时运行数据进行预处理,包括:
识别历史运行数据中的缺失值,获取与缺失值属于同一类的历史运行数据,通过计算缺失值的同类均值得到缺失值的插补值,用所述插补值替代所述缺失值,所述插补值的计算公式为:
Figure FDA0003540418130000011
其中,
Figure FDA0003540418130000012
为插补值,ai为均值系数,当第i个输入的历史运行数据或实时运行数据si缺失时为0,否则为1,m为同一类的历史运行数据或实时运行数据的数据总量。
4.根据权利要求1所述的一种基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,所述S200包括:
S210:将历史正常数据按照时序顺序分为训练数据和测试数据,初始化辨识模型的超参数;
S220:将训练数据输入辨识模型中进行训练,通过辨识模型计算辨识对象在测试数据对应时序下的预测值;
S230:计算辨识模型的收敛精度是否满足预设阈值,所述收敛精度的计算公式为:
Figure FDA0003540418130000021
其中,a为收敛精度,n为预测值的总数量,xfi为第i个测试数据,xi为第i个预测值;
S240:若收敛精度符合预设条件,则训练结束,否则,调整辨识模型的超参数,重复S220-S230直至收敛精度未超过预设条件。
5.根据权利要求1所述的一种基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,所述S300包括:
S310:初始化辨识模型的超参数;
S320:将历史不良数据经归一化处理后,输入训练好的辨识模型中,将辨识模型输出的对历史不良数据的预测值作为准确值;
S330:将历史不良数据输入修正模型中进行训练,通过修正模型分析历史不良数据的特征,根据分析结果输出对历史不良数据的修正值;
S340:分析修正值相对于准确值的误差程度以及误差分散程度,当分析结果符合预设条件时结束训练,否则,调整修正模型的超参数,重复S320-S330直至符合预设条件。
6.根据权利要求5所述的一种基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,所述分析修正值相对于准确值的误差程度以及误差分散程度,包括:
通过计算修正值相对于准确值的平均绝对误差,分析所述误差程度;
通过计算修正值相对于准确值的均方根差,分析所述误差分散程度。
7.根据权利要求1所述的一种基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,所述方法还包括:
在执行S500的同时,选取预设比例的正常数据输入修正模型中,计算修正模型的输出值与正常数据的平均绝对误差和均方根误差;
当平均绝对误差和均方根误差任一项不满足预设条件时,将执行S400时输入的实时运行数据作为训练数据,重新对辨识模型和修正模型进行训练。
8.根据权利要求1所述的一种基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,所述辨识模型在输出层设有求解器,所述求解器为softmax函数。
9.根据权利要求8所述的一种基于深度学习的新能源场站不良数据辨识与修正方法,其特征在于,所述求解器通过比较计算出的预测值与实际测量的实时运行数据的误差,输出实时不良数据的概率,根据所述概率输出识别出的实时不良数据以及实时不良数据所在的时序位置。
CN202210230736.2A 2022-03-10 2022-03-10 基于深度学习的新能源场站不良数据辨识与修正方法 Active CN114692729B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210230736.2A CN114692729B (zh) 2022-03-10 2022-03-10 基于深度学习的新能源场站不良数据辨识与修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210230736.2A CN114692729B (zh) 2022-03-10 2022-03-10 基于深度学习的新能源场站不良数据辨识与修正方法

Publications (2)

Publication Number Publication Date
CN114692729A true CN114692729A (zh) 2022-07-01
CN114692729B CN114692729B (zh) 2025-04-04

Family

ID=82137416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210230736.2A Active CN114692729B (zh) 2022-03-10 2022-03-10 基于深度学习的新能源场站不良数据辨识与修正方法

Country Status (1)

Country Link
CN (1) CN114692729B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115481916A (zh) * 2022-09-27 2022-12-16 呼伦贝尔安泰热电有限责任公司海拉尔热电厂 一种高寒地区集中供热中供暖面积热指标辨识方法与系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491404A (zh) * 2018-01-22 2018-09-04 国电南瑞科技股份有限公司 一种基于bp神经网络的状态估计不良数据辨识方法
CN110601174A (zh) * 2019-07-06 2019-12-20 天津大学 一种基于深度学习的负荷建模与在线修正方法
CN112733417A (zh) * 2020-11-16 2021-04-30 南京邮电大学 一种基于模型优化的异常负荷数据检测与修正方法和系统
US20210133376A1 (en) * 2019-11-04 2021-05-06 Global Energy Interconnection Research Institute Co. Ltd Systems and methods of parameter calibration for dynamic models of electric power systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491404A (zh) * 2018-01-22 2018-09-04 国电南瑞科技股份有限公司 一种基于bp神经网络的状态估计不良数据辨识方法
CN110601174A (zh) * 2019-07-06 2019-12-20 天津大学 一种基于深度学习的负荷建模与在线修正方法
US20210133376A1 (en) * 2019-11-04 2021-05-06 Global Energy Interconnection Research Institute Co. Ltd Systems and methods of parameter calibration for dynamic models of electric power systems
CN112733417A (zh) * 2020-11-16 2021-04-30 南京邮电大学 一种基于模型优化的异常负荷数据检测与修正方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘辉舟;周开乐;胡小建;: "基于模糊负荷聚类的不良负荷数据辨识与修正", 中国电力, no. 10, 5 October 2013 (2013-10-05) *
祁乐;唐健;陈新和;江平: "新能源实时错误数据辨识与修正深度学习模型", 电网与清洁能源, vol. 36, no. 011, 31 December 2020 (2020-12-31), pages 19 - 28 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115481916A (zh) * 2022-09-27 2022-12-16 呼伦贝尔安泰热电有限责任公司海拉尔热电厂 一种高寒地区集中供热中供暖面积热指标辨识方法与系统
CN115481916B (zh) * 2022-09-27 2023-09-19 呼伦贝尔安泰热电有限责任公司海拉尔热电厂 一种高寒地区集中供热中供暖面积热指标辨识方法与系统

Also Published As

Publication number Publication date
CN114692729B (zh) 2025-04-04

Similar Documents

Publication Publication Date Title
CN108491404B (zh) 一种基于bp神经网络的状态估计不良数据辨识方法
CN104751229B (zh) 一种改进bp神经网络估值的缺失数据轴承故障诊断方法
CN111900731B (zh) 一种基于pmu的电力系统状态估计性能评价方法
CN106529719B (zh) 基于粒子群优化算法风速融合的风电功率预测的方法
CN112505549A (zh) 基于孤立森林算法的新能源汽车电池异常检测方法
CN110533070A (zh) 一种小样本下基于迁移原形网络的机械故障智能诊断方法
CN111191855B (zh) 一种基于管网多元水质时序数据的水质异常事件识别预警方法
CN104766175A (zh) 一种基于时间序列分析的电力系统异常数据辨识与修正方法
CN106709816A (zh) 基于非参数回归分析的电力负荷异常数据识别与修正方法
CN112329339B (zh) 一种风电场短期风速预测方法
CN110737975A (zh) 基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法
CN116226679A (zh) 考虑多机组运行状态相似性的风电机组齿轮箱异常检测方法
CN114814707A (zh) 一种智能电表应力误差分析方法、设备、终端及可读介质
CN113608968A (zh) 一种基于密度距离综合决策的电力调度监控数据异常检测方法
CN114692729A (zh) 基于深度学习的新能源场站不良数据辨识与修正方法
CN118962455A (zh) 一种电池分析方法
CN113377750A (zh) 水文数据清洗方法及系统
CN110414734B (zh) 一种计及风资源利用率预测评估的方法
CN102890718B (zh) 基于有监督显式流形学习算法的电子鼻数据挖掘方法
CN114565186A (zh) 一种基于广义回归神经网络的预测风速校正方法和系统
CN107808209A (zh) 基于加权kNN距离的风电场异常数据辨识方法
CN115713162A (zh) 一种分布式低碳能源站健康状态预警预测方法
CN118171136B (zh) 基于rf-c-som聚类算法的水质监测布点优化方法
CN114200245A (zh) 一种配电网的线损异常识别模型的构建方法
CN109946096B (zh) 基于模型空间的高速列车风管故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant