分销赏收藏举报申诉 / 14

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于BP神经网络和多元线性回归的辛烷值预测.pdf

基于BP神经网络和多元线性回归的辛烷值预测.pdf

上传人：自信****多点

文档编号：632430

上传时间：2024-01-18

格式：PDF

页数：14

大小：7.64MB

《基于BP神经网络和多元线性回归的辛烷值预测.pdf》由会员分享，可在线阅读，更多相关《基于BP神经网络和多元线性回归的辛烷值预测.pdf（14页珍藏版）》请在咨信网上搜索。

1、D0I:10.13878/ki.jnuist.20220426002许美贤郑琰周若兰1张如意！基于BP神经网络和多元线性回归的辛烷值预测摘要为降低硫、烯烃含量及辛烷值损失，保证汽油清洁化生产，基于SZorb装置运行积累的数据，首先利用Lasso算法初步筛选建模变量，并基于BP神经网络计算指标因子贡献度，进一步筛选出15个主要变量用于建立辛烷值损失预测模型；其次对比分析4种模型，得出BP神经网络预测精度更优，更适合作为辛烷值损失预测模型，并经过10 折交叉验证得到均方误差（MSE）均值为0.0 2 7 19 3，R均值为0.90 48 7,验证了该模型的可靠性；最后在控制油品硫质量分数不大于5g

2、/g的前提下，结合多元线性回归对主要变量进行优化调控.结果表明，需同时改变多个变量才能使辛烷值损失降幅大于30%，多元线性回归模型预测精度较好，能按照一定比例对主要变量进行正反向调控.本文还可视化展示了优化过程中辛烷值和硫含量的变化轨迹.关键词BP神经网络；多元线性回归;Lasso算法；辛烷值损失预测；优化调控中图分类号TP183;TP273文献标志码A收稿日期2 0 2 2-0 4-2 6资助项目国家自然科学基金（7 17 0 10 99,7 1501090)；江苏省高等学校自然科学研究项目(17KJB580008)作者简介许美贤，女，硕士生，主要从事复杂工业过程建模、数据挖掘、人工智能算法

3、的研究，xumeixian3210 郑琰（通信作者），女，博士，副教授，主要从事复杂工业过程建模、机器学习的研究，yzheng_x 1南京林业大学汽车与交通工程学院,南京，2100370引言汽车的普及使用增加了人们交通出行的便捷性，但也随之加重了环境受污染的程度.现如今日益严峻的健康和环境问题促使各国都在重新考虑汽油中各种化合物的质量标准，清洁措施的重中之重就是降低汽油中的硫、烯烃含量.在催化裂化为核心的重油轻质化工艺进行脱硫和降烯烃过程中，普遍会降低汽油辛烷值.辛烷值（RON）是反映交通工具所使用燃料（汽油）燃烧性能的最重要指标.一般来说，提高汽油中辛烷值的占比，将会有效提高其抵抗震爆的性能

4、，而抗爆性能的高低是体现汽油燃烧性能的主要指标.而炼油生产过程中辛烷值的损失将导致油品经济效益的骤然下跌，每增加1个单位的精制汽油辛烷值损失，每吨汽油销售价格将降低150 元.例如在一个每年生产10 0 万t精制汽油的SZorb装置中，如果能够使辛烷值损失降低0.3个单位，销售经济效益将提升450 0 万元.因此，降低催化裂化汽油精制脱硫装置中辛烷值的损失具有重要的理论价值和现实意义.在现有的研究文献中，针对汽油精制过程中辛烷值的研究可总结为三种：一是讨论使用汽油物理特性测试数据通过线性建模分析来快速测定汽油辛烷值.丁怡曼等 1 利用红外光谱法结合偏最小二乘法构建PLS模型来对113个样品进行

5、汽油辛烷值的预测;Kardamakis等 2 利用近红外光谱法收集了2 49个汽油数据样本,构建辛烷值和苯含量分析的定量预测模型,同时对比分析了C_PLS法和D_PLS法的模型求解效果.二是针对汽油各种组成成分或者原子团对辛烷值贡献进行定性和定量分析,并构建其关系之间的拟合模型.黄水望等 3 利用气相色谱法和偏最小二乘法构建汽油详细组分和辛烷值之间关系的数学模型,模型测定结果与实际偏差范围在0 1.1个单位之间,预测性能和精度较好.Ghosh等 4 利用气相色谱技术测定不同型号汽油的辛烷值，构建烃类贡献度大小不同的多元线性回归模型，明确烃类组成对汽油生产调和辛烷值的影响.但不管是根据汽油物理特

6、性数据还是各组成成分或原子团进行预测分析，都不可避免地要使用到相关实验测试设备，而且仪器的运转和维护需要耗费较高的费用，实验测试效率较低.三是利用主成分分析、相关分析、偏最小二乘法、逐步线性回归等方法研究汽油的其他理化质量指标和抗爆性能指标辛烷值之间的关系，得出相关关系式来测定不同汽油的辛烷值.熊春华等 5 以乙醇汽油和车用汽油为研究对象,分析其抗爆性能指标与其许美贤，等.基于BP神经网络和多元线性回归的辛烷值预测.380XU Meixian,et al.Octane number prediction based on BP neural network and muliple linear

7、 regression.他理化指标的关联，采用逐步线性回归和相关分析数据采集时间的频次不同，分别是每3min1次和每来建立方程关系式，研究表明各理化指标产生的影6min1次.采集到的原始实验数据样本一共有32 5响均不相同，需遵循相关规律来配合实际生产。个，每个数据样本中都有36 7 个特征变量，包括7 个截至目前，利用各种理论测量方法来进行化工原料性质、2 个待生吸附剂性质、2 个再生吸附剂性过程建模预测汽油辛烷值的相关研究工作取得了一质、2 个产品性质等不可操作变量以及另外354个操定的进展，但这些传统研究方式一般都是简单的数作变量.为了使数据处理和分析更加系统化，可以按据关联或机理建模,

8、所构建模型中涉及的操作变量时间戳将其进行降序排列，并结合数据挖掘技术应数量相对较少,相关变量分析存在明显缺陷，使得辛用到化工过程建模中，得到隐藏在这些数据之后的烷值的预测分析结果与实际相比存在较大的误差，更多更重要的信息.而现阶段催化裂化精制汽油所需的生产设备多种多1.2数据清洗样,加工技术及工艺过程非常复杂，各操作变量之间1)删除全部为空值的位点.遍历全部数据样本，具有严重非线性和影响因素相互强耦联的特点,若筛选出共有19个操作变量数据全部为空值，故删除继续采用以往的研究方式将出现过程优化响应时效上述位点.性较差、变量优化成效一般的情况.2)对样本数据节点进行过滤，删除2 个由于残因此，本文

9、考虑到现有化工过程监测和控制硬缺数据过半而无法补充完整的变量位点.件设备技术的发展，将利用采集到的中国石化公司3)对于样本中其余值为零的数据,使用控制前多年来催化裂化生产精制汽油保留下来的大量历史后2 h的数据平均值替代.数据，结合数据挖掘技术发现隐藏在深层的重要信4)根据汽油精制工艺要求及操作经验可以得出息.同时，因为神经网络技术强大的函数映射能力和操作变量的最大最小取值范围，对于7 个超出此范高度非线性描述能力等优点，它已经被广泛应用于围的变量数据进行剔除.化工过程非线性系统建模领域.本文在利用Lasso算5）运用拉依达准则（3准则）判断数据是否存法初步筛选变量后，选择利用BP神经网络计算

10、指标在粗大误差，剔除此类误差数据.利用MATLAB计算因子贡献度，得出主要变量用于构建汽油辛烷值损误差并比较发现样本原始数据中不存在异常值，无失预测模型.经过模型效果分析对比决定使用BP神需剔除.经网络模型来预测辛烷值,并把BP神经网络和多元6)由于研究需以辛烷值作为目标数据，而辛烷线性回归模型相结合来对主要变量进行优化调控，值的测量比较麻烦，一周仅2 次，样本较少，无法与对优化调整过程中辛烷值和硫含量变化进行可视化操作数据样本相匹配，且测量结果存在滞后，故最终展示，以提升汽油品质为企业的炼油生产过程提供样本数据取为辛烷值测量时间前2 h的数据平均值。可靠的理论操作借鉴.计算完成数据预处理后，

11、替换原始收集到的样本数据.1数据收集和清洗2二步法筛选建模的主要变量1.1数据来源本文采集到的实验数据来自于中国石化上海高桥石油化工有限公司催化裂化汽油精制脱硫装置运行多年保留下来的历史数据 5-7 .关于汽油精制生产工作，该公司建立了2 个规模可观的数据库,即PHD和LIMS实验数据库.有关实验建模的原料、产品和催化剂等性质数据均可以每周2 次的频率从这2 个实时数据库中采集得到.为了确保实验和分析等方面的有效性与准确率，本文将数据采集时间跨度范围扩充到3年，即从LIMS数据库中获取2 0 17-0 4一2019-09和2 0 19-10 2 0 2 0-0 5这2 个时间段的生产信息.而操

12、作变量数据可从PHD数据库中获取,2 次2.1基于Lasso的变量初步筛选模型为了更有效地对工程技术应用效果进行分析，需要根据实际催化裂化汽油精制过程所得到的32 5个样本数据，先对36 7 个变量进行降维，剔除一些次要的对辛烷值损失影响不大的标量，筛选出一定数量的主要变量，以便后续能精准有效地建立辛烷值的损失预测模型.Lasso线性模型在变量选择方面的精度比逐步回归法和岭回归法等能更精确、更全面地筛选出主要影响变量，其最大优点在于可以直接将不重要变量的系数直接压缩为0,而不保留所有变量 6-10 .因此,采用 Lasso 对 36 7 个影响变量进行初步南京信息工经大学学报（自然科学版）,2

13、 0 2 3,15(4);37 9-392Journal of Nanjing University of Information Science&Technology(Natural Science Edition),2023,15(4):379-392筛选,通过比较解释变量与被解释变量之间相关性的大小，删除不重要变量并保留主要变量，降低影响变量之间的多重共线性，使其相互独立，从而提高解的空间稳定性并进一步使得模型的泛化能力增强.2.1.1Lasso线性回归模型的建立运用Lasso方法初步筛选变量的步骤如下：1）特征标准化.观察36 7 个变量发现其量纲并不一致,为了避免量纲对研究结果的影响

14、,需要利用极差标准化法对数据进行标准化处理.2）建立Lasso线性回归模型.由于研究样本中有36 7 个自变量和1个因变量,可根据线性回归模型建立以下关系式：y=+ix+2x2+.+367x367+8，(1)式中，为常数项,12，,36 7 为回归系数,8 为随机扰动项.该模型中未知参数的Lasso 估计的定义为N=arg min(Z(y-o-Zan),i=1s.t.2I,It,其中，t0为调和参数.3）选择最佳的调整参数.对于控制回归系数压缩量的问题，在估计时可以通过调和参数t来实现，经过若干步骤之后可得不同t值下的所有Lasso估计值.在研究中，可选择10 折交叉验证法对参数进行调整从而选

15、择出最佳的调整参数.4）筛选出重要变量.对36 7 个变量进行Lasso回归之后,得出一定数量回归系数不为0 的变量，即为第1步所要筛选出的重要变量,其余回归系数为0的变量就会在Lasso线性回归模型中删除掉,被删除掉的可能是导致变量之间存在多重共线性的不重要变量.2.1.2Lasso模型初步筛选变量的结果分析运用Stata软件对辛烷值损失的36 7 个影响因素进行初步筛选，通过lassopack 命令实现Lasso 回归,并使用10 折交叉验证方法对模型的参数进行调整以达到最佳的状态.根据运行结果可以发现当Lamda=1.3733498时，模型的均方预测误差（M SPE）值达到最小,如图1所

16、示.根据Lasso所估计出的变量系数是否非零来筛选变量,其中系数非零的影响变量被保留下来作为主要变量，且它们之间的多重共线性已经得到一定的削减.经降维筛选过后的主要变量如表1所示,按照从左到右对辛烷值损失影响程度大小进行排列.381LambdaMSPE1251.424412229.088563208.736964190.193355173.297096157.901867143.8742981131.09295112.3999678522.1867613531.9924955541.8154877551.6542047561.507249871.3733498581.2513452591.14

17、01792601.038888861.9465967762.8625037363.78588127图1MSPE最小状态时的参数情况Fig.1 Parameter values at minimum MSPE(2)2.2基于BP神经网络-指标因子贡献度排名的变量筛选优化2.2.1BP神经网络-指标因子贡献度模型的建立采用Lasso线性回归模型对36 7 个变量进行初步筛选后得出n个主要影响因素，而这些因素对辛烷值损失影响程度的大小可以通过权重大小来决定.因此，需要进一步优化辛烷值损失的有效变量操作方案.鉴于BP神经网络模型可以通过数据逼近任意线性连续的函数,这一特点与原料性质、待生吸附剂性质、再

18、生吸附剂性质、产品性质、操作变量对辛烷值损失影响方式的特点相吻合.所以选择BP神经网络模型进行n个主要变量的计算，并将其指标数值作为神经网络的输入层，将损失的辛烷值作为输出层.此外，输入层主要变量对输出层辛烷值损失的影响,是由输入层对隐含层的影响和隐含层对输出层的影响这2 个部分组成的，如图2 所示.因此，输入层n个主要影响变量指标对输出层辛烷值损失的影响权重需综合上述2 个部分来进一步计算得出,过程如下：1）假设各输人变量对各隐含层变量都有一定程度的影响，这些影响的程度可通过输入层作用到隐含层的权重反映.权重计算公式为4o=22mIw;I,st.dev.1.0018209.14663224.

19、98105973.1462742.96137086.14518185.94563175.14467782.9328856.14412105.92201369.14320764.91127308.14233825.89979808.14139183.00784573.00079824.0076979.00080449.0075959.0008114.00752102.00081828.00747841.00083389.00747775.00085149.00747272.00086563*.00749993.00088241.00755229.00089527.00760887.0009037

20、4.00769639.00091357.00782185.00092305.00794792.00092751(3)许美贤，等.基于BP神经网络和多元线性回归的辛烷值预测.382XU Meixian,et al.Octane number prediction based on BP neural network and multiple linear regression.表1经降维筛选过后的主要变量Table 1 Main variables after dimension reduction screening序号变量名称a2原料辛烧值a94再生器顶底差压a301F-101辐射室出口压力

21、al原料硫含量a359加氢裂化轻石脑油进装置流量a40干气出装置流量a163D-109吸附剂料位al1待生吸附剂硫含量a141D-203底部液位a179D-102温度a35精制汽油出装置硫含量a54净化风进装置流量a91再生冷氮气流量a225非净化风干燥后露点温度a120产品汽油出装置流量a101S-ZORB.PT_1501.PVa208稳定塔顶回流流量a45氮气进装置流量a81D104液面a49循环水出装置流量a327S_ZORB AT-0003a187A-201出口总管温度a87D121顶去放火炬流量a12再生吸附剂焦炭含量a265ME-105过滤器压差a17还原器流化氢气流量a165D-

22、109上部温度a272K-103B排气温度a190EH101 出口a307EH-103人口流量a231闭锁料斗氧含量a=ao式中：。表示每个输人层主要变量对隐含层的影响权重之和;；表示输人层n个主要变量指标对隐含层中各个变量的权重,其中i和i分别表示输人层和n隐含层的节点；Z1w|表示单个输入层节点对隐含层中所有变量的影响大小之和，i取整数.2）计算隐含层对输出层辛烷值损失的影响程度.由于输出层仅有辛烷值损失一个指标，所以隐含层对输出层的影响权重等价于隐含层中各个变量与序号a9a162a184a345a53a334a238a22a5a185a16a349a192a302a161a43a29a2

23、30a297a70a145a8a346a236a195a150a222a255a326a97输出层节点的权重之比,其计算公式为m(4)bo=Zbk,bllbo式中：b为隐含层对输出层影响权重的比例,k和l分别表示隐含层和输出层的节点；1bl为隐含层中单个变量对输出层的权重；b表示隐含层全部变量对输出层权重之和,k取整数.3）计算输入层中n个具体主要影响变量指标对输出层的影响权重，计算公式为变量名称产品辛烧值D-109压力稳定塔底出口温度D-201含硫污水排量非净化风进装置压力S_ZORB AT-0010R-102床层吸附剂料位密度反应过滤器压差原料芳烃含量C-201#37层塔盘温度还原器压力E

24、-101壳程人口总管温度再生器顶部/再生器接收器差压F-101出口总管压力D-110底部燃料气进装置压力稳定塔下部温度闭锁料斗液位3.0步骤FIC2432.SP加热炉进口温度D-124 液位产品硫含量D-201含硫污水液位闭锁料斗H2过滤器出口气流量再生器接收器顶部/再生器接收器部差压D-109吸附剂料位火炬罐D-206液位9.0 步骤PIC2401B.OPS_ZORB AT-0002再生烟气氧含量m(5)(6)南京信息工经大学学报（自然科学版),2 0 2 3,15(4):37 9-392Journal of Nanjing University of Information Science

25、&Technology(Natural Science Edition),2023,15(4):379-392S;=ajbu,式中，S，为输入层中单个的具体主要影响变量对输出层的影响权重，4）计算输入层中每个指标对输出层影响大小之比例，计算公式为P。=ZS,S;P;=P。式中，P。表示所有输入层各个指标权重之和,P，为输人层各个具体主要影响变量指标对输出层辛烷值损失影响的占比.经过对BP神经网络模型的不断调整,最终设置n个输入层、1个隐含层，将隐含层节点数设为10、输出层为1,此设置方式可以使得误差达到最低，如图2 所示.HiddenInputn图2 BP神经网络-指标因子贡献度计算模型结构F

26、ig.2 Index factor contribution degree calculationbased on BP neural network2.2.2BP神经网络-指标因子贡献度排名结果分析基于BP神经网络的指标因子贡献度计算模型，0.060.058.972.374383(7)得出基于Lasso方法初步筛选的6 1个有用变量对辛烷值损失的影响贡献度.根据贡献度的大小确定最终留下的主要变量，并用于分析辛烷值损失.而选择的个数可以参考确定独立筛选法 SIS中的方法，选取n/logn个,其中n为6 1.结合实际情况计算选取15个最主要影响变量，它们对辛烷值损失贡献度(8)排序如图3所示，图

27、3中序号对应的影响变量名称参见表1.图3中CD表示影响变量对辛烷值损失贡(9)献度大小.其中,原料辛烷值(a2)和产品辛烷值（a9）2个变量对辛烷值损失的影响贡献度最大，遥遥领先于其他变量，而辛烷值损失值就是由这2 个值计算得出的 12 1.由此可见,基于BP神经网络的指标因子贡献度计算模型来反映变量对辛烷值损失的影响贡献程度，符合工程的实际应用，具有一定的科学性.3基于BP神经网络的辛烷值损失预测模型OutputOutput1013.1构建辛烷值损失预测模型利用筛选得出的15个主要变量进行建模预测辛烷值损失，考虑使用多元线性回归、灰色预测、随机森林回归、BP神经网络4种常见建模方法，计算不同

28、方法的均方误差（MSE）与决定系数（R），对比不同方法的模型精度，进而选择误差最小的模型作为辛烷值损失预测模型。1）多元线性回归的拟合过程通常利用最小二乘法来逼近，一般假设变量间存在线性关系，如式（10）所示.回归分析时，需要计算回归系数bk，使得0.045263.9870.040.0227176240.0226086820.0222059790.020817.4140.020.0206223390.019810570.019.545.6280.019.5321210.0191332330.018866.3790.0187460670.0187315580.018296290a2Fig.3 T

29、he 15 most important influencing variables ranked by contribution to octane number lossa9a94a162a301a184图315个最主要影响变量对辛烷值损失贡献度排序al变量a345a359a53a40a3344a163a238a11许美贤，等.基于BP神经网络和多元线性回归的辛烷值预测.384XU Meixian,et al.Octane number prediction based on BP neural network and muliple linear regression.计算的因变量与原始

30、数据间的误差最小.BP神经网络4种方法建立辛烷值预测模型，使用y=b,+bix+b2x2+.+bi+8,Matlab软件进行求解从而找出预测精度最优的模k=1,n,t=1,.,m.(10)2）G M(1,N)模型与GM(1,1)模型类似,区别在于输入变量个数为N个.基于筛选得到的15个主要影响变量,则N为15,输出变量1个，因此适用于GM(1,N)预测模型.首先对特征数据序列X(）和相关因素序列x，,x 进行计算,生成一次累加序列X),i=1,2,N,再对该序列中两两邻近数取平均生成值序列Z(），然后根据上述序列建立灰色微分方程：x(h)+az(k)=Zb,x(h).3）随机森林回归是一个用C

31、ART算法构建的没有剪枝的分类决策树的集合，输出采用单棵树输出结果的均值.根据每棵决策树的权重;（x,o,）（t=1,2，,k）取每棵决策树观测值的均值作为最终的结果.4）BP神经网络具有较好的非线性映射能力，RON损失预测中影响因素众多,尽管通过Lasso 回归及贡献度排序筛选了一部分变量，但剩余15个主要变量间的关系依旧不明确,对RON损失的影响也不清晰,利用该方法的非线性映射可以较好地拟合绝大多数变量与辛烷值损失的关系.此外，神经网络的鲁棒性较佳、容错能力强，变量数据的部分缺失或者异常并不会导致模型产生误差 13.利用BP神经网络映射15个主要变量与辛烷值损失的关系，通过对32 5个样本

32、训练的拟合预测判断模型精度，进而决定该算法是否可以用于辛烷值损失预测.利用Matlab自带工具箱nftool对数据进行处理,把降维得出的15个主要变量作为输入层变量，输出层即为辛烷值损失.设置隐含层个数为10，训练算法选用最小二乘优化算法（Levenberg-Mar-quardt).BP神经网络结构如图4所示.HiddenOutputInput15Fig.4Prediction of octane number loss by BP neural network3.2模型求解与比较分析利用多元线性回归、灰色预测、随机森林回归、型.通过多次测试设置、调试好各个模型参数后，对样本进行模型训练，计算

33、均方误差（MSE）以及决定系数(R):MSE-2(G-)nR?=1台N通过上述模型预测的RON损失检验结果如表2(11)所示,BP神经网络预测模型的MSE最小,决定系数i=2R最接近于1,模型精度要优于其他3个模型，故采用BP神经网络模型预测辛烷值损失.表2 各模型预测精度结果对比Table 2(Comparison of prediction accuracy方法MSE多元线性回归0.000 26灰色预测0.000 33随机森林回归0.015.90BP神经网络0.000 183.3BP神经网络辛烷值预测模型验证分析通过对比4种预测模型后，选用BP神经网络模型作为辛烷值损失预测模型，并将对此使

34、用10 折交叉验证的方法来判断结果的可靠性.即随机抽取10份样本，把其中1份样本作为测试集，其余9 份作为训练集，如此循环10 次，使得每份样本都能作为一次测试集.对随机建立的10 个训练集来计算10 个模型，对测试集分别得到10 个均方误差（MSE）、决定系数（R）,再求出10 个模型的MSE均值以及R均值.从表3的10 折交叉验证结果可知，MSE均值为0.027193（接近0）R均值为0.90 48 7（接近1），故认为BP神经网络的预测精度较高，符合预期.但上Output述10 份样本的模型训练精度低于用全部32 5个样1本进行训练所得模型，因样本数较少，模型训练时不101图4BP神经网

35、络预测辛烷值损失的结构(12)(13)R20.995 100.993 870.807 000.996 40可控因素较多，故10 个训练模型仅用于验证BP神经网络预测方法的适用性，而不用于最终的辛烷值损失预测模型.本文的辛烷值损失预测模型将原始样本中的70%数据序列（2 2 7 个样本）用于模型训练，15%的数据序列（49个样本）用于模型验证，剩余15%的数据南京信息工经大学学报（自然科学版）,2 0 2 3,15(4):37 9-392Jounal of Nanjing University of Information Science&Technology(Natural Science E

36、dition),2023,15(4):379-392序列（49个样本）作为模型测试集.基于BP神经网训练集180验证集络的辛烷值损失预测模型误差结果如图5所示.160140120表310 折交叉验证结果100Table 3Ten-fold cross-validation results样本序号MSE10.019 99720.020 18630.011 07740.014 30150.053 54160.031 68270.034 50480.028 98790.038581100.019 070平均值0.027 19310110010-1F10-310-4F10-5L0根据BP神经网络建模过

37、程可知，该模型在第8次迭代时达到最优精度，此时验证集的MSE为0.001182，训练集和测试集的误差都较小.图6 是对385测试集0误差8060R2400.888 612000.927 950.909 100.867 320.873 170.880 660.869 130.915.260.947.570.969.900.904 87一训练集一验证集二测试集.理想结果101224图5MSE结果Fig.5MSE resultsL68S001662L0042526191误差=(实际值-输出值)/(ug/g)图6 误差直方图Fig.6Error histogram每个样本实际值与模型预测输出值误差建立

38、的直方图，图中误差集中在0 附近，有7 6.3%的样本误差位于-0.0 1和0.0 1之间.除142 号样本外，其余样本误差绝对值均小于0.1，所有样本误差平均值为-0.00100944.模型训练结果如表4所示，训练集、验证集、测试集的MSE都足够小，接近于0,且R都大于0.99,接近于1,故认为该预测模型可用于汽油辛烷值损失预测工程中.表4BP神经网络模型测试精度Table 4 Test accuracy of BP neural network model数据集R214J68送代次数80160080990:0-样本个数训练集227验证集49测试集49图7 是各数据集的输出值与辛烷值损失实际

39、数据的比较，可以发现模型输出值能较好地拟合原始数据，同样可验证利用BP神经网络模型在15个主要输出变量基础上预测辛烷值损失的精度较高.98600-MSE7.0210-51.8210-36.0110-40100-6000L1000.999 3060.993 5750.993 975St00数据1.5拟谷Y=T1.00.50.5a.训练集:R=0.999 31数据1.5拟谷Y-T1.00.51.01.5实际值数据1.5数据Y-T1.00.51.0实际值b.验证集:R=0.99358图7 预测结果拟合Fig.7Fitting of prediction results数据1.5数据Y=T1.00.5

40、1.50.5c.测试集:R=0.993981.0实际值1.50.5d.全部:R=0.997 121.0实际值1.5许美贤，等.基于BP神经网络和多元线性回归的辛烷值预测.386XU Meixian,et al.Octane number prediction based on BP neural network and muliple linear regression.4主要变量操作方案的优化图9 是对10 份样本分别控制9 个操作变量的根据已建立的辛烷值损失预测模型，并分析了取值：再生器顶底差压、F-101辐射室出口压力、稳定S Zorb装置产品的历史脱硫数据,计算得知所有油塔底出口温度、

41、D-201含硫污水排量、加氢裂化轻石品的硫质量分数平均值是4.7 5g/g.为保证汽油产脑油进装置流量、干气出装置流量、S_ZORB AT-品脱硫效果，欧VI和国VI标准中汽油产品硫质量0010、D-10 9吸附剂料位、R-102床层吸附剂料位密分数不得大于10 g/g,但为了给企业装置操作留有度等.基于前文模型预测出的辛烷值损失变化曲线，空间 14,要求在实际生产中产品硫质量分数不大于由于D-109压力、非净化风进装置压力2 个变量取5g/g.在此前提下,利用已知数据样本对主要变量值范围较小，调整幅度值相对较大，导致循环次数过进行优化，从而使辛烷值损失降幅达到理想状态.少,因此未在图中表示.

42、分析图9发现，单一控制稳首先探索单一变量的改变对基于BP神经网络定塔底出口温度升高，辛烷值（RON）损失预测值明建立的辛烷值预测模型的影响.使用控制变量法使显下降,且温度低于12 0 左右时，下降幅度较大，其他变量保持不变，只改变单一变量取值，进而预测此后温度继续升高对RON损失的影响较小.除了该辛烷值的损失.在此基础上，为使辛烷值损失降幅达变量外,单一控制其他变量并不能对RON损失预测到30%，利用上文所构建的多元线性回归模型对需值产生明显影响，或影响不稳定,如改变D-201含硫要调控的操作变量进行处理.在优化处理过程中原污水排量时，4个样本的损失值无明显变化，3个样料性质、待生吸附剂性质、

43、再生吸附剂性质保持不本损失值明显上升，一个样本损失值小幅度波动，还变,因此主要调节15个主要影响变量中的11个操有2 个样本损失值呈下降趋势.作变量，通过添加调节系数进行变量调控.最后提出基于以上分析，研究认为仅仅改变单一变量取具体的优化操作条件，使辛烷值损失降到最低。值并不能影响RON损失值，更不能达到辛烷值损失4.1基于BP神经网络的主要变量优化调控模型降幅大于30%的生产要求,所以需要考虑同时改变使用控制变量法探究单一变量对BP神经网络多个变量，优化操作条件，从而达到尽量降低辛烷值建立辛烷值预测模型的影响.首先筛选出硫质量分损失的目的.由于神经网络算法属于“黑箱方法”,在数不大于5g/g

44、的样本共2 6 8 个，再随机抽取10 个研究时只能得出输入输出变量，无法了解内部结构，样本进行优化.预测模型的主要变量共15个，其中若利用该算法同时对多个变量进行优化较为复杂.操作变量11个,其取值范围以及调整幅度值如表5而多元线性回归模型的预测精度仅次于BP神经网所示，使用Matlab建立循环语句，保持其他变量不络，且算法简单、易操作，更适合同时对多个变量进变,将单一变量由取值范围的最低值以调整幅度值行优化，故将利用该模型预测辛烷值损失并优化主为间隔变化至取值范围的最大值.利用前文建立的要操作变量.BP神经网络模型预测辛烷值损失，具体过程如图8表511个操作变量的取值范围及取值间隔（)Ta

45、ble 5 Value ranges and v a l u e o f 11 o p e r a t i n g v a r i a b l e s序号a94a162a301a184a345a359a53a40a334a163a238所示.操作变量再生器顶底差压/kPaD-109压力/kPaF-101辐射室出口压力/kPa稳定塔底出口温度/D-201含硫污水排量/(t/h）加氢裂化轻石脑油进装置流量/（m/h）非净化风进装置压力/MPa干气出装置流量/（m/h）S_ZORB AT-0010D-109吸附剂料位/mmR-102床层吸附剂料位密度/（g/mL）取值范围20 450.1 0.15-

46、0.5 (0)1001500420012.0000.55 0.7043015000.5 2.0-0.05 (70)4010050.050.11101000.05500.1510南京信息工统大学学报（自然科学版）,2 0 2 3,15(4)：37 9-392Journal of Nanjing University of Information Science&Technology(Natural Science Edition),2023,15(4):379-392325个样本硫质量分数5g/g268个样本随机抽样1110个样本否图8 控制变量法流程Fig.8Flow chart of con

47、trol variate approach1.73874.2基于多元线性回归的主要变量优化调控模型取值下限a多元线性回归模型体现的是多个解释变量和被开始解释变量之间的关系问题,利用筛选得出的15个最取值间隔4主要影响变量和1个因变量，建立以下关系式：y=+2x2+gxg+g4x94+162162+i=1,j=0取值上限6x(i)=a(i)+j4否j#i+1a(i)+j4b(0)是=i+1i11是结束301X301+184X184+jX+345345+359359+53X53+4040+334334+163*163+238238+11X11,式中：为常数项;2,g，,为回归系数.此外选择拟合优度

48、检验法对该模型进行计算验证.拟合优度的含义是样本具体观察数值在回归线附近聚集的紧密程度.一般选用R判断多元线性回归拟合优度.而拟合优度是在分解总离差平方的基础上测算出来的.其中总离差平方和计算公式为SST=SSE+SSR,其中,SSE为残差平方和,SSR为回归平方和,SST为总离差平方.计算公式如下：Z(y:-y),nSST=1.71.654(14)(15)(16)1.71.11.01.02530再生器顶底差压/kPa1.791.11.035404511.72F-101辐射室出口压力/kPa3451011.7111稳定塔底出口温度/1211311411.01.01060110160210 26

49、0310360410D-201含硫污水排量/(t/h)1.71.00.60.8 1.01.21.41.61.82.0S_ZORB AT-0010一样本1样本2样本3样本4样本5样本6样本7样本8样本9样本10图9控制单一变量的预测结果Fig.9 Predictive results of single variable controlling1.11.01223455677899012480680干气出装置流量/m/h)加氢裂化轻石脑油进装置流量/m/h)1.71.6.5.41.21.11.05 10 15 202530 35 40 455055 60 6570D-109吸附剂料位/mm880

50、1 080.12801.71.61.51.11.050R-102床层吸附剂料位密度/g/mL)148060708090100对样本进行模型训练，然后利用所得模型预测辛烷许美贤，等.基于BP神经网络和多元线性回归的辛烷值预测.388XU Meixian,et al.Octane number prediction based on BP neural network and muliple linear regression.通过多次测试设置并调试好各个模型参数后，SSE=Z(y;-y.),(17)nSSR=(3:-y),其中，是样本观察值均值，是估计值.决定系数R?便是通过回归平方和占总离差平

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 BP 神经网络多元线性回归辛烷值预测

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。