CN114021463B - 一种汽油精制过程中的路径优化模型 - Google Patents
一种汽油精制过程中的路径优化模型 Download PDFInfo
- Publication number
- CN114021463B CN114021463B CN202111319967.2A CN202111319967A CN114021463B CN 114021463 B CN114021463 B CN 114021463B CN 202111319967 A CN202111319967 A CN 202111319967A CN 114021463 B CN114021463 B CN 114021463B
- Authority
- CN
- China
- Prior art keywords
- variable
- model
- sample
- octane number
- optimization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000008569 process Effects 0.000 title claims abstract description 21
- 238000007670 refining Methods 0.000 title claims abstract description 19
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 claims abstract description 81
- 238000006477 desulfuration reaction Methods 0.000 claims abstract description 12
- 230000023556 desulfurization Effects 0.000 claims abstract description 12
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 claims description 33
- 229910052717 sulfur Inorganic materials 0.000 claims description 33
- 239000011593 sulfur Substances 0.000 claims description 33
- 238000013528 artificial neural network Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 21
- 230000009467 reduction Effects 0.000 claims description 11
- 239000003463 adsorbent Substances 0.000 claims description 8
- 238000003066 decision tree Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000004523 catalytic cracking Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 230000003197 catalytic effect Effects 0.000 claims description 2
- 239000000463 material Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 12
- 238000007418 data mining Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 239000000284 extract Substances 0.000 abstract 1
- 238000012549 training Methods 0.000 description 29
- 238000012360 testing method Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000010998 test method Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 2
- 229910052794 bromium Inorganic materials 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- KWKAKUADMBZCLK-UHFFFAOYSA-N methyl heptene Natural products CCCCCCC=C KWKAKUADMBZCLK-UHFFFAOYSA-N 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开一种汽油精制过程中的路径优化模型,通过数据挖掘技术提取影响辛烷值损失的关键变量,进而建立辛烷值损失预测模型,基于该模型对每个样本的操作条件进行优化。力求在保证汽油产品进一步脱硫效果的前提下,尽量降低汽油辛烷值损失,实现汽油产品的清洁化。
Description
技术领域
本发明涉及炼油领域,具体涉及一种汽油精制过程中的路径优化模型。
背景技术
汽车行驶工况(Driving Cycle)又称车辆测试循环,是描述汽车行驶的速度-时间曲线。行驶工况作为车辆能耗/排放测试方法和限值标准的基础,体现汽车道路行驶的运动学特征,是汽车行业的一项重要的、共性基础技术,也是汽车各项性能指标标定优化时的主要基准。本世纪初,我国直接采用新欧洲标准行驶循环(NEDC)行驶工况对汽车产品能耗/排放的认证。近年来,随着汽车保有量的快速增长,我国道路交通状况发生很大变化,政府、企业和民众日渐发现以NEDC工况为基准所优化标定的汽车,实际油耗与法规认证结果偏差越来越大。欧洲在多年的实践中也发现NEDC工况的诸多不足,转而采用世界轻型车测试循环(WLTC),但该工况怠速时间比和平均速度这两个最主要的工况特征,与我国实际汽车行驶工况的差异更大。另一方面,我国地域辽广,各个城市的发展程度、气候条件及交通状况的不同,使得各个城市的汽车行驶工况特征存在明显的不同。为了更好地理解建立汽车行驶工况曲线的重要性,深入研究作为车辆开发、评价的基础的依据,制定反映我国实际道路行驶状况的测试工况,显得越来越重要。
发明内容
针对上述现有技术存在的问题,由于汽车行驶数据的采集设备直接记录的原始采集数据往往会包含一些不良数据,因此,需设计合理的方法对原始不良数据进行预处理,从而完成运动学片段的提取根据上述经预处理后的数据,利用主成分分析和聚类分析法,生成一条能体现参与数据采集汽车行驶特征的汽车行驶工况曲线,并与原始数据进行比较,归纳检验结果。
为了实现上述目的,本发明采用的技术方案是:一种汽油精制过程中的路径优化模型,以辛烷值损失为目标函数,产品硫含量要求以及操作变量变化范围作为约束条件,建立两阶段优化模型;具体包括如下步骤:
步骤一、预处理:
采集催化裂化汽油精制装置中的运行数据,对原始数据和样本数据进行预处理;
步骤二、主要变量优化:
通过GBDT梯度下降回归树筛选出预测模型的主要变量;
步骤三、建立模型:
通过BP神经网络分别建立主要操作变量优化的两阶段优化模型;两阶段优化模型:第一阶段为辛烷值损失优化模型,第二阶段为操作变量优化模型。
进一步的,所述步骤1中预处理:基于石化企业中催化裂化汽油精制装置中采集数据样本,依据数据预处理的方法,对数据库中的数据样本及操作变量进行数据清洗,得到包含操作变量的样本数据,主要对原始数据、样本数据进行了剔除异常值、标准化的预处理。
进一步的,所述步骤二中GBDT由三部分组成:DT决策树、GB学习策略和Shinkage,由多棵树决策组成,所有树的结果累加起来就是最终结果;GBDT的含义是用GB的策略训练出DT模型;模型的结果是一组回归分类树组合;GBDT的思想是不断拟合残差,使残差不断减少,模型最后输出一个样本在各个树中输出的残差总和;
GBDT能够自动刻画多组特征间的交互作用,对于非线性变量之间的学习也具有较高的精确度,该模型提供了每个特征(变量)的重要度,自变量的重要度越高,其对预测变量的解释性越好,通常变量的重要度作为特征选择的决策参考;特征E的全局重要度通过特征其在单棵树中的重要度的平均值来衡量:
式中:M是树的数量;特征E在单棵树中的重要度如下:
进一步的,所述步骤2:GBDT模型中,选取辛烷值损失为预测变量,分别为原料性质、待生吸附剂性质、再生吸附剂性质以及另外包含操作变量的样本数据作为自变量,建立辛烷值损失的预测模型,经过GBDT模型筛选少量的操作变量作为后续问题的主要变量。
进一步的,所述第一阶段为辛烷值损失优化模型,即求解辛烷值损失最小时,各操作变量所需达到的最优值;具体形式如下:
min fRON损失值(j)=BPRON(xA,xi,j)
(1)
式中:i为操作变量,j为样本,xi,j本阶段的优化变量,即第j个样本的第i个操作变量,fRON损失值(j)为本阶段的优化目标,即第j个样本的辛烷值损失目标,Defi为第i个操作变量的下界,Infi为第i个操作变量的上界,xA为非操作变量,Smax为硫含量标准上限,BPRON(xA,xi,j)为辛烷值损失神经网络预测函数,BPS(xA,xi,j)为脱硫值神经网络预测函数,通过上述模型可以求得第j个样本的辛烷值损失最优结果,记为同时得到第j个样本的辛烷值对应的操作变量最优解,记为从而为后续操作变量的逐步优化调整提供了基础。
进一步的,所述第二阶段为操作变量优化模型,即操作变量通过一定的调整步数达到其最优取值;具体形式如下:
式中:n为本阶段的优化变量,即第j个样本的第i个操作变量需要调整的步数;f△(i,j)为本阶段的优化目标,即第j个样本的i个操作变量的调整量;为第j个样本的第i个操作变量的原始数据值,△i为第i个操作变量的可调步长,Nij为第j个样本的第i个操作变量所需调整的次数。
本发明的有益效果是:本发明揭示了一种汽油精制过程中的路径优化模型,
(1)利用GBDT模型筛选出主要操作变量,通过降维方法进行预测,不仅计算效率较高,且能保证主要操作变量的预测精度;
(2)通过BP神经网络模型预测辛烷值,误差率均在1%以下,R2为0.94629,可以发现:三层神经网络能够以任意精度逼近非线性连续函数,这使得其特别适用于内部机制复杂的问题,即BP神经网络具有较强的非线性映射能力;
(3)建立了包含两个阶段的主要变量操作方案优化模型,并通过算例分析给出了具体优化结果和操作变量优化方案,验证了主要结论:在汽油产品含硫量达标的前提下,可以有效降低辛烷值损失,同时确保实际工艺改进的可操作性;
(4)相对于辛烷值损失预测,有待进一步提高产品含硫量的预测精度。
附图说明
图1为2-3-2BP神经网络结构图;
图2为试集辛烷值预测结果对比图;
图3为测试集辛烷值预测结果对比图;
图4为测试集辛烷值训练阶段参数变化图;
图5为辛烷值各参数回归直线相关系数图;
图6为测试集硫含量预测结果对比图;
图7为测试集硫含量网络性能图;
图8测试集硫含量训练阶段参数变化图;
图9脱硫值各参数回归直线相关系数图;
图10为汽油辛烷值和含硫量调整变化曲线图;
图11硫含量调整变化曲线图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图及实施例,对本发明进行进一步详细说明。但是应该理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限制本发明的范围。
1、目的
本文从数据挖掘和运筹优化等多角度探究汽油清洁化的工艺改进路径:通过数据挖掘技术提取影响辛烷值损失的关键变量,进而建立辛烷值损失预测模型,基于该模型对每个样本的操作条件进行优化。力求在保证汽油产品进一步脱硫效果的前提下,尽量降低汽油辛烷值损失,实现汽油产品的清洁化。
2、模型建立
汽油清洁化需要保证汽油产品硫含量满足一定的标准情况下,尽量使汽油产品的辛烷值损失降幅达到最大。工业装置为了平稳生产,优化后的主要操作变量往往只能逐步调整到位。本文以辛烷值损失为目标函数,产品硫含量要求以及操作变量变化范围作为约束条件,建立两阶段优化模型。从而在满足各约束条件的情况下,力求实现辛烷值损失达到最小。其中,第一阶段为辛烷值损失优化模型,即求解辛烷值损失最小时,各操作变量所需达到的最优值;第二阶段为操作变量优化模型,即操作变量通过一定的调整步数达到其最优取值。
第一阶段辛烷值损失优化模型的具体形式如下:
min fRON损失值(j)=BPRON(xA,xi,j)
(1)
式中:i为操作变量,j为样本。xi,j本阶段的优化变量,即第j个样本的第i个操作变量。fRON损失值(j)为本阶段的优化目标,即第j个样本的辛烷值损失目标。Defi为第i个操作变量的下界,Infi为第i个操作变量的上界。xA为非操作变量,Smax为硫含量标准上限,BPRON(xA,xi,j)为辛烷值损失神经网络预测函数,BPS(xA,xi,j)为脱硫值神经网络预测函数。通过上述模型可以求得第j个样本的辛烷值损失最优结果,记为同时得到第j个样本的辛烷值对应的操作变量最优解,记为从而为后续操作变量的逐步优化调整提供了基础。
第二阶段为操作变量优化模型,其具体形式如下:
式中:n为本阶段的优化变量,即第j个样本的第i个操作变量需要调整的步数。f△(i,j)为本阶段的优化目标,即第j个样本的i个操作变量的调整量。为第j个样本的第i个操作变量的原始数据值,△i为第i个操作变量的可调步长,Nij为第j个样本的第i个操作变量所需调整的次数。
3模型实现
3.1
为了实现上述两阶段优化模型,需要通过调整相应的操作变量来达到优化目的。一般的催化裂化汽油精致过程中,变量数量往往超过样本数量,直接使用全部变量进行建模会导致模型中变量饱和,因此需采用降维方法从操作变量中筛选出建模主要变量。通常实现降维的主要方法有主成分分析法,但由于炼油工艺过程的复杂性及设备的多样性,操作变量之间具有高度非线性和相互强耦联的关系,通过线性回归方法无法准确识别变量之间的交互作用且不利于模型实现,且非线性回归的函数表达式不易发掘。鉴于GBDT(梯度下降回归树)具有学习速度快、预测精度高、模型适应性强等特点,通常用于非线性变量之间的预测,本文利用GBDT初步建立辛烷值损失的预测模型,通过计算对预测变量的重要度筛选出建模的主要变量,供后续问题研究使用。
GBDT由三部分组成:DT(Regression Decistion Tree)决策树、GB(GradientBoosting)学习策略和Shinkage(衰减),由多棵树决策组成,所有树的结果累加起来就是最终结果。GBDT的含义是用GB的策略训练出DT模型。模型的结果是一组回归分类树组合(CARTTree Ensemble)。GBDT的思想是不断拟合残差,使残差不断减少,模型最后输出一个样本在各个树中输出的残差总和。
GBDT能够自动刻画多组特征间的交互作用,对于非线性变量之间的学习也具有较高的精确度,该模型提供了每个特征(变量)的重要度,自变量的重要度越高,其对预测变量的解释性越好,通常变量的重要度作为特征选择的决策参考。特征E的全局重要度通过特征其在单棵树中的重要度的平均值来衡量:
式中:M是树的数量。特征E在单棵树中的重要度如下:
3.2BP神经网络预测模型
通过梯度下降回归树可以筛选出模型所需要的主要操作变量,但为了实现模型优化,还需辛烷值预测函数和脱硫值预测函数。尽管GBDT具有预测精度高的特点,其本质是具有多棵回归树集成的随机森林模型,该模型的预测值是由有限离散值构成,函数图像呈现出“锯齿”状,从工艺操作的实际背景来看,锯齿状的函数特征不利于识别操作变量微小调整对辛烷值损失降低的影响。反向传播网络(Back-Propagation Network,简称BP神经网络)无论在网络理论还是在性能方面都比较成熟,其突出优点就是具有很强的非线性映射能力和柔性的网络结构。网络的中间层数、各层的神经元个数可根据具体情况任意设定,并且随着结构的差异其性能也有所不同。
从结构上看,BP神经网络是一种典型的多层前向型神经网络,具有一个输入层。数个隐含层(可以是一层,也可以是多层)和一个输出层。层与层之间采用全连接的方式,同一层的神经元之间不存在相互连接。理论上已有证明:具有一个隐含层的三层网络可以逼近任意非线性函数。神经网络结构以2-3-2BP网络模型为例,结构如图1所示。
3.3预测检验拟合优度R2系数检验法
为了衡量优化模型的预测效果,需要对优化模型的训练和测试的表现进行量化评估。因此,需要引入统计学中的决定系数R2来量化模型的表现。决定系数R2(coefficient ofdetermination)也称为拟合优度。决定系数反应了因变量的波动有多少比例可以由自变量的波动所描述,即表征因变量的变异中有多少百分比可由自变量来解释。拟合优度系数检验法中的R2越大,代表拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比越高。
一般来说,R2在0到1的闭区间上取值,但在实验中,有时会遇到R2为无穷大的情况,这时我们可以用R2的计算公式:
式中:SSR为回归平方和,SSE为残差平方和,SST为总离差平方和。三者存在下列关系:
SST=SSR+SSE (8)
SST、SSR、SSE的计算公式分别为:
4算例分析
4.1主要变量筛选结果
某石化企业在运营过程中积累了大量历史数据。其汽油产品辛烷值损失平均为1.37个单位,而同类装置的最小损失值只有0.6个单位,故有较大的优化空间。基于该石化企业催化裂化汽油精制装置中采集的325个数据样本,依据数据预处理的方法,对数据库中325个样本及354个操作变量进行数据清洗,得到包含349个操作变量的306个样本数据。进一步在GBDT模型中,选取辛烷值损失为预测变量,7个原料性质、2个待生吸附剂性质、2个再生吸附剂性质以及另外349个的操作变量作为自变量,按照上述方法建立辛烷值损失的预测模型,共得到360个变量的重要度。将每个变量按照特征重要度的大小进行排序,并依次将特征重要度进行累加,得到累计重要度,相关结果如表1所示。
表1变量重要度
注:操作变量名称已作简化,如:S-ZORB.PC_1001A.PV表示为PC_1001A.PV
在表1中,操作变量PC_1001A.PV具有最高的重要度,为0.0987。当累计重要度达到0.9时,预测模型含有30个变量(包括操作变量和非操作变量),由于篇幅限制非操作变量溴值(重要度0.015)和产品辛烷值(重要度0.01)等未在表中展示。当累计重要度达到0.9时,对应的30个变量具有一定代表性,可以使辛烷值损失预测模型具有较高的精度。其中,产品辛烷值也具有较高的重要度,但该变量是工艺生产中的产出变量,无法事先对该变量进行监测并调整,故本文不考虑将其作为主要建模变量之一。溴值也是在汽油生产过程中无法调控的变量,本文也将其剔除出主变量。经过筛选,本文最终选取剩余的28个操作变量作为后续问题的主要变量。
4.2辛烷值损失预测及检验
4.2.1辛烷值损失预测结果
根据3.2节中的BP神经网络算法,创建3层BP网络,并对模型涉及的7个原料性质、2个待生吸附剂性质、2个再生吸附剂性质、2个产品性质和通过GBDT回归算法降维后得到的操作变量做预测。首先,根据降维后的原始数据产生训练集和测试集。其次,提取其中80%的样本数据作为训练集,20%的样本数据作为测试集。接着,设置网络训练参数,其中隐层第一层和第二层节点数分别为6和3,输出维数为1,两层传输函数均为tansig,输出层传输函数为trainlm。最后设置训练次数为1000次,训练目标为1e-8,经过117次训练,建立了辛烷值损失模型。最终得到的辛烷值真实值、预测值以及预测误差如表2所示,由于文章篇幅有限,仅展示部分数据。
表2辛烷值预测效果对比
从表2中发现:辛烷值的误差率均在1%以下,说明利用神经网络的方法建立的模型可以较好的预测出辛烷值。为给出进一步检验,本文将进一步验证模型的合理性。
4.2.2辛烷值损失结果验证
根据2.3节中R2系数的计算方法,结合regress函数可以获得R2的值为0.94629,即辛烷值回归模型的拟合优度较优,说明辛烷值的波动有94.63%能被自变量的波动所描述,即辛烷值的变异中有5.37%可由其他非主要因素来解释。
辛烷值预测结果和真实值对比如图2所示,其中红色部分为预测值,蓝色部分为真实值。从图1中,我们可以很直观的看出蓝色线条和红色线条的重合率很高,红色的点和蓝色的点覆盖率很高。因此,该神经网络模型预测的拟合效果比较理想。
图3反映的是训练过程中的梯度、Mu阻尼因子和泛化能力参数的变化,从中可以发现本次训练的网络性能较好,并且有一定的上升趋势,说明节点数选取恰当。
图4为网络训练的误差曲线,反映了网络训练的训练效果,其中第5次训练时均方误差达到最小随即训练终止。
图5为测试集以及样本总量和总体数据集的相关系数图,散点在回归直线附近十分密集,说明拟合数据与真实数据之间相关性很强,即模型拟合精度高、拟合效果较好。
4.3脱硫值预测及检验
4.3.1脱硫值预测结果
为满足实际问题中产品硫含量尽量低的条件,需要抽象出硫含量变化的曲线函数。与辛烷值预测类似,根据3.2节中BP神经网络算法,调试出3层BP网络,运用Matlab软件编程对模型求解。首先,根据降维后的原始数据产生训练集和测试集。其次,提取其中80%的样本作为训练集,20%的样本作为测试集。接着,设置网络训练参数,其中隐层第一层和第二层节点数分别为6、3,输出维数为1,两层传输函数分别为tansig和purelin,输出层传输函数为trainlm。最后设置训练次数为1000次,训练目标为1e-8,经过11次训练,得到最终的硫含量预测模型。
硫含量预测值和原本数值如表3硫含量预测效果对比所示,由于文章篇幅有限,仅展示部分样本。
表3硫含量预测效果对比
从表3中发现,用神经网络的方法建立的模型可以较好的预测出硫含量值,同时本文将进一步验证模型的合理性。
4.3.2脱硫值结果验证
与辛烷值验证方法类似,同样采取拟合优度值对模型进行验证。通过计算得到R2的值为0.649,即硫含量值回归模型的拟合优度较好,说明硫含量值的波动有近64.9%能被自变量的波动所描述,即脱硫值的变异值有35.1%可由其他非主要因素来解释。
硫含量值预测结果和真实值对比如图6所示,其中红色部分为预测值,蓝色部分为真实值。从图6中我们可以很看出该神经网络模型预测的硫含量值结果拟合较优,效果较为理想。
图7反映的是训练过程中的梯度、Mu阻尼因子和泛化能力参数的变化。从图7中可以看出本次训练的网络性能较好,并且有一定的上升趋势,说明节点数选取恰当。
图8为网络训练的误差曲线,反映了网络训练的训练效果,其中第8次训练时均方误差达到最小随即训练终止。
观察验证集、测试集以及样本总量和总体数据集的相关系数图可知,散点在回归直线附近十分密集,如图9所示。表明拟合数据与真实数据之间存在很大的相关性,即模型的拟合精度高、拟合效果较优。
4.4操作目标及操作变量优化
4.4.1第一阶段操作方案优化结果
本文利用上述两阶段优化模型以及非线性单目标算法进行求解,硫含量欧六和国六标准均为不大于10μg/g,但为了给企业装置操作留有空间,进一步实现脱硫效果。本文设置产品硫含量标准Smax为5μg/g,得到各个样本的最优操作方案。由于篇幅限制,本文仅列出辛烷值损失降幅及最优操作变量的部分结果。
经过本文主要变量操作方案优化模型的优化,总计295个样本辛烷值损失降幅可达30%以上,其中共计11个样本辛烷值损失降幅在0%到30%之间,共计68个样本辛烷值损失降幅在30%到99.9%之间,共计227个样本辛烷值损失降幅接近100%。样本辛烷值损失降幅及最优操作变量如表4所示:
表4样本优化展示
从表4中可以发现,各样本的操作变量的最优值均有不同且各主要操作变量每次允许调整幅度值△i也不同,因此需单独对每个样本进行二阶段优化,不同样本有着不同的优化方案。
4.4.2第二阶段操作变量优化方案
第一阶段优化求解的结果为306行28列的矩阵,即求解的结果包含了每一个样本的每一个主要操作变量xi的最优取值,共8568个解,第二步优化需要对这第一阶段优化中的8568个解对应的原始变量值进行逐步调整,且每个变量的调整幅度△i不一样,需要分变量进行调整。若max Ni,j为第j个样本的第i个变量所需调整的最大次数,则第二阶段优化求解的结果为306*28*max Ni,j的空间。
若对每一个样本进行第二阶段优化,计算量过大。为了验证本文建立的主要操作变量方案优化模型的可行性,并对主要操作变量的调节进行可视化展示,本文以1号样本为例,给出了主要变量优化调整方案部分展示(表5)。从表5中发现1号样本共需要调整71次,因为第5个主要变量需要调整的次数相对于其他变量而言,调整次数最多。其中,如第1、2、3等24个变量仅需一次调整就能达到最优值(j为1),第5个变量需调整71次才能达到最优值依次类推。
表5:133号样本操作变量优化方案
4.4.3汽油辛烷值和硫含量的变化轨迹
为方便模型的可视化展示,本文根据3.4.2中的主要操作变量优化调整方案对1号样本,运用Matlab调用3.2.1节中BP神经网络预测模型中的BPRON(xA,xi,j)函数求出每一次调整的汽油辛烷值和硫含量的值,绘制出变化轨迹图。图10为汽油辛烷值调整变化曲线,从调整的过程中,可以看出汽油辛烷值和主要操作变量呈现出非线性关系,在前30步调整过程中辛烷值变化明显,第30步以后辛烷值水平趋于稳定。因此,我们在实际操作过程中,考虑到实际操作成本,调整至第30步即可。
图11为硫含量调整变化曲线:硫含量经过71步调整仍然满足产品硫含量不大于5μg/g的要求。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种汽油精制过程中的路径优化模型,其特征在于:以辛烷值损失为目标函数,产品硫含量要求以及操作变量变化范围作为约束条件,建立两阶段优化模型;具体包括如下步骤:
步骤一、预处理:
采集催化裂化汽油精制装置中的运行数据,对原始数据和样本数据进行预处理;
步骤二、主要变量优化:
通过GBDT梯度下降回归树筛选出预测模型的主要变量;
GBDT由三部分组成:DT决策树、GB学习策略和Shinkage,由多棵树决策组成,所有树的结果累加起来就是最终结果;GBDT的含义是用GB的策略训练出DT模型;模型的结果是一组回归分类树组合;GBDT的思想是不断拟合残差,使残差不断减少,模型最后输出一个样本在各个树中输出的残差总和;
GBDT能够自动刻画多组特征间的交互作用,该模型提供了每个特征即变量的重要度,自变量的重要度越高,其对预测变量的解释性越好,变量的重要度作为特征选择的决策参考;特征E的全局重要度通过特征其在单棵树中的重要度的平均值来衡量:
式中:M是树的数量;特征E在单棵树中的重要度如下:
步骤三、建立模型:
通过BP神经网络分别建立主要操作变量优化的两阶段优化模型;两阶段优化模型:第一阶段为辛烷值损失优化模型,第二阶段为操作变量优化模型。
2.根据权利要求1所述的一种汽油精制过程中的路径优化模型,其特征在于:所述步骤1中预处理:基于石化企业中催化裂化汽油精制装置中采集数据样本,依据数据预处理的方法,对数据库中的数据样本及操作变量进行数据清洗,得到包含操作变量的样本数据;主要对原始数据、样本数据进行了剔除异常值、标准化的预处理。
3.根据权利要求1所述的一种汽油精制过程中的路径优化模型,其特征在于:在GBDT模型中,选取辛烷值损失为预测变量,分别为原料性质、待生吸附剂性质、再生吸附剂性质以及另外包含操作变量的样本数据作为自变量,建立辛烷值损失的预测模型,经过GBDT模型筛选少量的操作变量作为后续问题的主要变量。
4.根据权利要求1所述的一种汽油精制过程中的路径优化模型,其特征在于:所述第一阶段为辛烷值损失优化模型,即求解辛烷值损失最小时,各操作变量所需达到的最优值;具体形式如下:
min fRON损失值(j)=BPRON(xA,xi,j) (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111319967.2A CN114021463B (zh) | 2021-11-09 | 2021-11-09 | 一种汽油精制过程中的路径优化模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111319967.2A CN114021463B (zh) | 2021-11-09 | 2021-11-09 | 一种汽油精制过程中的路径优化模型 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114021463A CN114021463A (zh) | 2022-02-08 |
CN114021463B true CN114021463B (zh) | 2023-04-07 |
Family
ID=80062828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111319967.2A Active CN114021463B (zh) | 2021-11-09 | 2021-11-09 | 一种汽油精制过程中的路径优化模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114021463B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408187A (zh) * | 2021-05-15 | 2021-09-17 | 西安石油大学 | 基于随机森林的降低汽油辛烷值损失的优化方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021097217A1 (en) * | 2019-11-14 | 2021-05-20 | The Board Of Trustees Of The University Of Illinois | Precursor chemistry for quantum dot synthesis enabling temperature-independent modulation of reactivity |
CN112464554A (zh) * | 2020-11-03 | 2021-03-09 | 桂林理工大学 | 一种汽油精制设备的操作参数优化方法 |
CN112489733B (zh) * | 2020-12-14 | 2023-04-18 | 郑州轻工业大学 | 基于粒子群算法和神经网络的辛烷值损失预测方法 |
CN113362913A (zh) * | 2021-05-27 | 2021-09-07 | 南通大学 | 一种基于随机森林回归的汽油辛烷值损失预测及优化方法 |
-
2021
- 2021-11-09 CN CN202111319967.2A patent/CN114021463B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408187A (zh) * | 2021-05-15 | 2021-09-17 | 西安石油大学 | 基于随机森林的降低汽油辛烷值损失的优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114021463A (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109814513B (zh) | 一种基于数据模型的催化裂化装置优化方法 | |
CN109840362B (zh) | 一种基于多目标优化的集成即时学习工业过程软测量建模方法 | |
CN106991145B (zh) | 一种监测数据的方法及装置 | |
CN107045788B (zh) | 交通路况预测方法及装置 | |
CN112489733B (zh) | 基于粒子群算法和神经网络的辛烷值损失预测方法 | |
CN111191906A (zh) | 一种大中型企业技术标准体系化实施效益评价方法 | |
CN110490438B (zh) | 一种工业流水线车间数字孪生能力的简化策略推荐方法 | |
CN111145546B (zh) | 一种城市全域交通态势分析方法 | |
CN110486017B (zh) | 一种基于露天矿区路径的无人驾驶车辆能耗节能方法 | |
CN107480698A (zh) | 基于多个监测指标的质量控制方法 | |
CN112687349A (zh) | 一种降低辛烷值损失模型的构建方法 | |
CN108764473A (zh) | 一种基于相关分析的bp神经网络用水量预测方法 | |
CN109614669B (zh) | 网级桥梁结构性能评估预测方法 | |
CN117171546A (zh) | 一种结合污染扩散指数的城市空气质量预测方法 | |
CN103577676A (zh) | 污水处理工艺综合评价的灰色加权法 | |
CN113496314B (zh) | 一种神经网络模型预测道路交通流量的方法 | |
CN110807577A (zh) | 污染排放预测方法及装置 | |
CN112801388A (zh) | 一种基于非线性时间序列算法的电力负荷预测方法及系统 | |
CN111091295A (zh) | 一种城市区域边界控制系统 | |
CN114021463B (zh) | 一种汽油精制过程中的路径优化模型 | |
Mataei et al. | Pavement maintenance and rehabilitation optimization based on cloud decision tree | |
CN114548494A (zh) | 一种可视化造价数据预测智能分析系统 | |
CN109829115B (zh) | 搜索引擎关键词优化方法 | |
CN112231352A (zh) | 一种多路阀失效数据管理及失效模式自动诊断系统 | |
CN115115102B (zh) | 一种基于bp神经网络和条件生成对抗网络的汽油辛烷值损失预测及优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |