CN114881154A - 一种基于pca和深度森林的天然气场站故障检测方法及系统 - Google Patents
一种基于pca和深度森林的天然气场站故障检测方法及系统 Download PDFInfo
- Publication number
- CN114881154A CN114881154A CN202210520353.9A CN202210520353A CN114881154A CN 114881154 A CN114881154 A CN 114881154A CN 202210520353 A CN202210520353 A CN 202210520353A CN 114881154 A CN114881154 A CN 114881154A
- Authority
- CN
- China
- Prior art keywords
- natural gas
- gas station
- data
- pca
- deep forest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于PCA和深度森林的天然气场站故障检测方法及系统,包括:获取待检测天然气场站的数据;对待检测天然气场站的数据进行降维处理;将经降维处理后待检测天然气场站的数据输入到训练后的深度森林模型进行分类及检测,以判断天然气场站是否发生故障,该方法及系统具有计算复杂性低、检测时间短以及检测准确性较高的特点。
Description
技术领域
本发明属于数据分析领域,涉及一种基于PCA和深度森林的天然气场站故障检测方法及系统。
背景技术
天然气作为一种清洁、高效能源,不仅具有比煤炭、石油更低的温室气体、二氧化硫和颗粒物排放量,而且能够有效弥补风能和太阳能不易存储、供应不稳定的缺陷。世界各国纷纷发展低碳经济、能源利用清洁化、减少大气排放。在全球能源消费结构转型的大背景下,天然气备受世界各国的青睐和重视,天然气替代高碳高污染煤炭的大趋势不可逆转,天然气将在全球经济发展和能源消费结构中扮演更加重要的角色。近年来,天然气工业逐渐向着大型化、智能化及复杂化发展。在此前提下,实际天然气生产和储运中的过程运行也更加复杂,发生故障的可能性及对应破坏性也随之增大。由于天然气输配场站各个生产设备之间的耦合性,单一设备内的微小故障可能被放大并传播到其他生产单元内,进而影响整个厂级过程的正常运行,造成不可预计的设备损耗,环境污染甚至相关人员的伤亡。因此,天然气储运企业高度重视储运生产安全、运行成本和过程能耗,对于天然气储运过程的精确建模、控制和优化提出了更高要求。在此前提下,实际天然气生产和储运中的过程运行也更加复杂,发生故障的可能性及对应破坏性也随之增大,故障检测系统的研发工作势在必行。
系统中的故障(fault)可以理解为系统至少一个特性或是参数出现较大的偏差,超出了可接受的范围。为了满足动态控制系统可靠性、安全性和有效性等性能指标,近年来故障检测和诊断技术得到了长足发展。尤其是近年来以故障检测、故障辨识、故障模式识别、故障决策和容错控制为主要研究内容的故障诊断技术已经成为工程监控和复杂系统自动化研究的重要领域。
故障检测主要判断设备或系统是否发生了故障和指明发生故障的时间。目前故障检测技术分为三类,基于过程模型、基于知识模型和基于数据的模型。基于过程模型的方法的展现形式要以数学结构和参数,通常是动态的过程模型。于连续时间的线性过程,模型可以是差分方程或z-传递函数,相应的离散时间(采样后)模型有脉冲响应、脉冲响应(加权函数)的微分方程。对于故障检测,一般的微分方程或差分方程是主要适用的。基于过程模型方法包括状态估计、参数估计和等价空间等。基于知识的诊断推理的主要方法是在知识的层次上,以知识处理技术为基础,实现辩证逻辑与数理逻辑的集成,符号处理与数值处理的统一,推理过程与算法过程的统一。采用的方法有:专家系统方法、图搜索、模糊推理方法、模式识别方法、定性观测器、定性仿真和神经元网络方法等。实际工业过程往往受大量空间上具有相关性的变化信号交互作用因此引起基于多变量统计技术故障诊断方法的研究从而产生了数据驱动(data-driven)方法。随着机器学习和智能制造技术的飞速发展,数据驱动的故障检测方法成为近年来的研究热点。基于数据驱动的方法包括多元统计分析、信号处理、机器学习和深度学习等,然而现有技术中往往由于数据量较大而造成计算较为复杂,检测的时间较长,同时检测的准确性较差。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供了一种基于PCA和深度森林的天然气场站故障检测方法及系统,该方法及系统具有计算复杂性低、检测时间短以及检测准确性较高的特点。
为达到上述目的,本发明采用如下技术方案:
本发明所述基于PCA和深度森林的天然气场站故障检测方法包括:
获取待检测天然气场站的数据;
对待检测天然气场站的数据进行降维处理;
将经降维处理后待检测天然气场站的数据输入到训练后的深度森林模型进行分类及检测,以判断天然气场站是否发生故障。
基于PCA对待检测天然气场站的数据进行降维处理。
基于PCA对待检测天然气场站的数据进行降维处理的具体过程为:
11)将原始数据按列组成n行m列矩阵X;
12)将矩阵X的每一行进行零均值化;
13)求取矩阵X的协方差矩阵C;
14)求取协方差矩阵C的特征值及对应的特征向量;
15)将求取得到的特征向量按照对应特征值的大小,从上到下按行排列成矩阵,再取前k行组成矩阵P;
16)计算降维到k维后的数据Y。
降维到k维后的数据Y=PX。
所述深度森林模型中的分类器选择随机森林分类器、XGBoost分类器、极端随机树分类器及逻辑回归分类器的组合,通过实验进行确定。
还包括:
获取天然气场站的历史数据;
基于PCA对天然气场站的历史数据进行降维处理;
利用降维处理后的天然气场站的历史数据对深度森林模型进行训练,得训练后的深度森林模型。
本发明所述的基于PCA和深度森林的天然气场站故障检测系统包括:
数据导入模块,用于获取待检测天然气场站的数据;
故障检测模块,用于对待检测天然气场站的数据进行降维处理,将经降维处理后待检测天然气场站的数据输入到训练后的深度森林模型进行分类及检测,以判断天然气场站是否发生故障。
本发明所述进一步的改进在于:
本发明具有以下有益效果:
本发明所述的基于PCA和深度森林的天然气场站故障检测方法及系统在具体操作时,先对待检测天然气场站的数据进行降维处理,以降低分析数据的复杂性,再将其作为后续深度森林模型的输入,以提升检测的准确率,减少检测时间。
进一步,所述深度森林模型中的分类器选择随机森林分类器、XGBoost分类器、极端随机树分类器及逻辑回归分类器的组合,再通过实验进行确定,经过实验验证,可以提升故障检测的准确率、召回率及F1值,显著提升性能。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为天然气场站故障检测流程图;
图2为多粒度扫描图;
图3为级联森林图;
图4为深度森林不同分类器组合实验结果对比图;
图5为天然气场站故障检测系统图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合附图对本发明做进一步详细描述:
实施例一
参考图1至图4,本发明所述的基于PCA和深度森林的天然气场站故障检测方法包括:首先使用PCA进行天然气场站数据的待选特征选择,将数据进行降维处理,以降低变量多带来的分析问题的复杂性,减少后续数据分类的负担。然后将处理后的数据导入深度森林模型中进行试验,以选出最佳的分类器组合。
本发明所述基于PCA和深度森林的天然气场站故障检测方法包括以下步骤:
1)基于PCA对天然气场站数据进行降维处理,设有m条n维天然气场站数据,具体过程为:
11)将原始数据按列组成n行m列矩阵X;
12)将矩阵X的每一行进行零均值化;
14)求取协方差矩阵C的特征值及对应的特征向量;
15)将求取得到的特征向量按照对应特征值的大小,从上到下按行排列成矩阵,再取前k行组成矩阵P;
16)计算降维到k维后的数据Y=PX。
2)经降维处理后的数据输入到深度森林模型进行分类及检测,具体过程为:
21)对降维处理后的特征向量进行故障标签标记,得若干包括故障标签的特征向量;
22)将所有包括故障标签的特征向量分为训练集及测试集;
23)对训练集及测试集使用多粒度扫描,得训练集及测试集的类概率表征向量样本集;
24)将经过多粒度扫描后的特征向量输入加权级联森林中,后续各级均采用上一级的输出与原始概率特征向量拼接后作为本级输入;
25)使用随机森林分类器、XGBoost分类器、极端随机树分类器及逻辑回归分类器的不同组合作为级联森林的分类器,并进行实验,选择分类效果最好的分类器组合,作为深度森林模型最终的分类器,如图4所示;
26)逐层训练后,对最后一层级联森林产生的所有类向量通过逻辑回归产生最终类向量,取最大值得到原始输入特征向量的最终分类,即最终的检测结果。
27)输出分类检测结果。
本系统主要的功能为:首先是简单的用户添加、删除及信息编辑功能。然后是场站运行状态的结果展现,并提供便捷的添加线路功能,方便后期增加故障检测的范围。最后,当出现故障情况,能够及时预警,预警位置及预警展示需显眼、突出,并提供查看故障具体情况的功能。方便工作人员及时发现故障、合理、快速处理故障。
基于上述需求,本系统的架构设计,主要包括三部分,分别为视图层、应用层和数据层,如图5所示。1、数据层负责的是存储和管理本系统中需要的各种数据,主要是负责与数据库进行交互。其中,数据库分为用户数据库及天然气数据库,用户数据库主要包括注册用户的姓名及工号等;天然气数据库主要包括天然气场站各支路数据等。2)应用层负责接受用户的指令并将指令发送给对应的后端。包含用户管理和故障检测模型两部分:用户管理模块用于处理用户的相关操作,比如增加用户、删除用户等;故障检测模块主要用于对输入的数据进行训练及分类,最终输出相应的检测结果。3)视图层用于展示用户可以直接看到以及使用的部分,主要供操作人员与系统之间进行交互。操作人员通过相应的接口向系统发出指令,而后端返回数据并通过可视化的方式展现。
本系统包括数据导入模块、数据维护模块、故障检测模块及结果展示模块。用于天然气场站数据的导入;用户信息的管理,包括用户的增删改查;天然气数据下载到本地;场站各支路的运行状态查看和新支路的添加;故障出现后的及时报警和具体故障情况的查看等。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (8)
1.一种基于PCA和深度森林的天然气场站故障检测方法,其特征在于,包括:
获取待检测天然气场站的数据;
对待检测天然气场站的数据进行降维处理;
将经降维处理后待检测天然气场站的数据输入到训练后的深度森林模型进行分类及检测,以判断天然气场站是否发生故障。
2.根据权利要求1所述的基于PCA和深度森林的天然气场站故障检测方法,其特征在于,基于PCA对待检测天然气场站的数据进行降维处理。
3.根据权利要求2所述的基于PCA和深度森林的天然气场站故障检测方法,其特征在于,基于PCA对待检测天然气场站的数据进行降维处理的具体过程为:
11)将原始数据按列组成n行m列矩阵X;
12)将矩阵X的每一行进行零均值化;
13)求取矩阵X的协方差矩阵C;
14)求取协方差矩阵C的特征值及对应的特征向量;
15)将求取得到的特征向量按照对应特征值的大小,从上到下按行排列成矩阵,再取前k行组成矩阵P;
16)通过计算,得到降维到k维后的数据Y。
5.根据权利要求3所述的基于PCA和深度森林的天然气场站故障检测方法,其特征在于,降维到k维后的数据Y=PX。
6.根据权利要求1所述的基于PCA和深度森林的天然气场站故障检测方法,其特征在于,所述深度森林模型中的分类器选择随机森林分类器、XGBoost分类器、极端随机树分类器及逻辑回归分类器的组合,通过实验进行确定。
7.根据权利要求1所述的基于PCA和深度森林的天然气场站故障检测方法,其特征在于,还包括:
获取天然气场站的历史数据;
基于PCA对天然气场站的历史数据进行降维处理;
利用降维处理后的天然气场站的历史数据对深度森林模型进行训练,得训练后的深度森林模型。
8.一种基于PCA和深度森林的天然气场站故障检测系统,其特征在于,包括:
数据导入模块,用于获取待检测天然气场站的数据;
故障检测模块,用于对待检测天然气场站的数据进行降维处理,将经降维处理后待检测天然气场站的数据输入到训练后的深度森林模型进行分类及检测,以判断天然气场站是否发生故障。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210520353.9A CN114881154A (zh) | 2022-05-13 | 2022-05-13 | 一种基于pca和深度森林的天然气场站故障检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210520353.9A CN114881154A (zh) | 2022-05-13 | 2022-05-13 | 一种基于pca和深度森林的天然气场站故障检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114881154A true CN114881154A (zh) | 2022-08-09 |
Family
ID=82675326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210520353.9A Pending CN114881154A (zh) | 2022-05-13 | 2022-05-13 | 一种基于pca和深度森林的天然气场站故障检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114881154A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116300666A (zh) * | 2023-05-24 | 2023-06-23 | 科大智能物联技术股份有限公司 | 基于XGBoost优化的电厂锅炉运行控制方法 |
-
2022
- 2022-05-13 CN CN202210520353.9A patent/CN114881154A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116300666A (zh) * | 2023-05-24 | 2023-06-23 | 科大智能物联技术股份有限公司 | 基于XGBoost优化的电厂锅炉运行控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113723632B (zh) | 一种基于知识图谱的工业设备故障诊断方法 | |
Lade et al. | Manufacturing analytics and industrial internet of things | |
CN106067094A (zh) | 一种动态评估方法及系统 | |
CN108985467A (zh) | 基于人工智能的二次设备精益化管控方法 | |
CN113849542A (zh) | 基于人工智能的区域温室气体排放清单核算系统与方法 | |
CN116522088B (zh) | 一种基于机器学习的核动力装置运行数据分析方法与系统 | |
CN106054858A (zh) | 基于决策树分类和故障码分类的车辆远程诊断与备件检索的方法 | |
CN116771576A (zh) | 水电机组故障综合诊断方法 | |
Tripathy et al. | Explaining Anomalies in Industrial Multivariate Time-series Data with the help of eXplainable AI | |
CN113627784A (zh) | 一种基于工业互联网的企业资产管理智能决策系统 | |
CN113268370B (zh) | 一种根因告警分析方法、系统、设备及存储介质 | |
CN116700193A (zh) | 工厂车间智能化监控管理系统及其方法 | |
CN117668774A (zh) | 计量设备性能监测系统 | |
Cerquitelli et al. | Enhancing manufacturing intelligence through an unsupervised data-driven methodology for cyclic industrial processes | |
CN115587295A (zh) | 一种基于机器自学习的供应链策略智能生成方法和系统 | |
CN114881154A (zh) | 一种基于pca和深度森林的天然气场站故障检测方法及系统 | |
CN115952914A (zh) | 一种基于大数据的电力计量运维工作判别规划方法 | |
US11829111B2 (en) | Intellectual quality management method, electronic device and computer readable storage medium | |
CN113593605A (zh) | 一种基于深度神经网络的工业音频故障监测系统和方法 | |
Agatić et al. | Advanced Data Analytics in Logistics Demand Forecasting | |
Merkt | Predictive models for maintenance optimization: an analytical literature survey of industrial maintenance strategies | |
CN115239153A (zh) | 一种用于化工园区事故的应急指挥决策方法、系统及介质 | |
Sergin et al. | Image-based novel fault detection with deep learning classifiers using hierarchical labels | |
Moehrle | Generic self-learning decision support system for large-scale disasters. | |
CN112651773A (zh) | 行业竞争力分析方法、装置、设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |