基于BP神经网络和多元线性回归的辛烷值预测.pdf
《基于BP神经网络和多元线性回归的辛烷值预测.pdf》由会员分享,可在线阅读,更多相关《基于BP神经网络和多元线性回归的辛烷值预测.pdf(14页珍藏版)》请在咨信网上搜索。
1、D0I:10.13878/ki.jnuist.20220426002许美贤郑琰周若兰1张如意!基于BP神经网络和多元线性回归的辛烷值预测摘要为降低硫、烯烃含量及辛烷值损失,保证汽油清洁化生产,基于SZorb装置运行积累的数据,首先利用Lasso算法初步筛选建模变量,并基于BP神经网络计算指标因子贡献度,进一步筛选出15个主要变量用于建立辛烷值损失预测模型;其次对比分析4种模型,得出BP神经网络预测精度更优,更适合作为辛烷值损失预测模型,并经过10 折交叉验证得到均方误差(MSE)均值为0.0 2 7 19 3,R均值为0.90 48 7,验证了该模型的可靠性;最后在控制油品硫质量分数不大于5g
2、/g的前提下,结合多元线性回归对主要变量进行优化调控.结果表明,需同时改变多个变量才能使辛烷值损失降幅大于30%,多元线性回归模型预测精度较好,能按照一定比例对主要变量进行正反向调控.本文还可视化展示了优化过程中辛烷值和硫含量的变化轨迹.关键词BP神经网络;多元线性回归;Lasso算法;辛烷值损失预测;优化调控中图分类号TP183;TP273文献标志码A收稿日期2 0 2 2-0 4-2 6资助项目国家自然科学基金(7 17 0 10 99,7 1501090);江苏省高等学校自然科学研究项目(17KJB580008)作者简介许美贤,女,硕士生,主要从事复杂工业过程建模、数据挖掘、人工智能算法
3、的研究,xumeixian3210 郑琰(通信作者),女,博士,副教授,主要从事复杂工业过程建模、机器学习的研究,yzheng_x 1南京林业大学汽车与交通工程学院,南京,2100370引言汽车的普及使用增加了人们交通出行的便捷性,但也随之加重了环境受污染的程度.现如今日益严峻的健康和环境问题促使各国都在重新考虑汽油中各种化合物的质量标准,清洁措施的重中之重就是降低汽油中的硫、烯烃含量.在催化裂化为核心的重油轻质化工艺进行脱硫和降烯烃过程中,普遍会降低汽油辛烷值.辛烷值(RON)是反映交通工具所使用燃料(汽油)燃烧性能的最重要指标.一般来说,提高汽油中辛烷值的占比,将会有效提高其抵抗震爆的性能
4、,而抗爆性能的高低是体现汽油燃烧性能的主要指标.而炼油生产过程中辛烷值的损失将导致油品经济效益的骤然下跌,每增加1个单位的精制汽油辛烷值损失,每吨汽油销售价格将降低150 元.例如在一个每年生产10 0 万t精制汽油的SZorb装置中,如果能够使辛烷值损失降低0.3个单位,销售经济效益将提升450 0 万元.因此,降低催化裂化汽油精制脱硫装置中辛烷值的损失具有重要的理论价值和现实意义.在现有的研究文献中,针对汽油精制过程中辛烷值的研究可总结为三种:一是讨论使用汽油物理特性测试数据通过线性建模分析来快速测定汽油辛烷值.丁怡曼等 1 利用红外光谱法结合偏最小二乘法构建PLS模型来对113个样品进行
5、汽油辛烷值的预测;Kardamakis等 2 利用近红外光谱法收集了2 49个汽油数据样本,构建辛烷值和苯含量分析的定量预测模型,同时对比分析了C_PLS法和D_PLS法的模型求解效果.二是针对汽油各种组成成分或者原子团对辛烷值贡献进行定性和定量分析,并构建其关系之间的拟合模型.黄水望等 3 利用气相色谱法和偏最小二乘法构建汽油详细组分和辛烷值之间关系的数学模型,模型测定结果与实际偏差范围在0 1.1个单位之间,预测性能和精度较好.Ghosh等 4 利用气相色谱技术测定不同型号汽油的辛烷值,构建烃类贡献度大小不同的多元线性回归模型,明确烃类组成对汽油生产调和辛烷值的影响.但不管是根据汽油物理特
6、性数据还是各组成成分或原子团进行预测分析,都不可避免地要使用到相关实验测试设备,而且仪器的运转和维护需要耗费较高的费用,实验测试效率较低.三是利用主成分分析、相关分析、偏最小二乘法、逐步线性回归等方法研究汽油的其他理化质量指标和抗爆性能指标辛烷值之间的关系,得出相关关系式来测定不同汽油的辛烷值.熊春华等 5 以乙醇汽油和车用汽油为研究对象,分析其抗爆性能指标与其许美贤,等.基于BP神经网络和多元线性回归的辛烷值预测.380XU Meixian,et al.Octane number prediction based on BP neural network and muliple linear
7、 regression.他理化指标的关联,采用逐步线性回归和相关分析数据采集时间的频次不同,分别是每3min1次和每来建立方程关系式,研究表明各理化指标产生的影6min1次.采集到的原始实验数据样本一共有32 5响均不相同,需遵循相关规律来配合实际生产。个,每个数据样本中都有36 7 个特征变量,包括7 个截至目前,利用各种理论测量方法来进行化工原料性质、2 个待生吸附剂性质、2 个再生吸附剂性过程建模预测汽油辛烷值的相关研究工作取得了一质、2 个产品性质等不可操作变量以及另外354个操定的进展,但这些传统研究方式一般都是简单的数作变量.为了使数据处理和分析更加系统化,可以按据关联或机理建模,
8、所构建模型中涉及的操作变量时间戳将其进行降序排列,并结合数据挖掘技术应数量相对较少,相关变量分析存在明显缺陷,使得辛用到化工过程建模中,得到隐藏在这些数据之后的烷值的预测分析结果与实际相比存在较大的误差,更多更重要的信息.而现阶段催化裂化精制汽油所需的生产设备多种多1.2数据清洗样,加工技术及工艺过程非常复杂,各操作变量之间1)删除全部为空值的位点.遍历全部数据样本,具有严重非线性和影响因素相互强耦联的特点,若筛选出共有19个操作变量数据全部为空值,故删除继续采用以往的研究方式将出现过程优化响应时效上述位点.性较差、变量优化成效一般的情况.2)对样本数据节点进行过滤,删除2 个由于残因此,本文
9、考虑到现有化工过程监测和控制硬缺数据过半而无法补充完整的变量位点.件设备技术的发展,将利用采集到的中国石化公司3)对于样本中其余值为零的数据,使用控制前多年来催化裂化生产精制汽油保留下来的大量历史后2 h的数据平均值替代.数据,结合数据挖掘技术发现隐藏在深层的重要信4)根据汽油精制工艺要求及操作经验可以得出息.同时,因为神经网络技术强大的函数映射能力和操作变量的最大最小取值范围,对于7 个超出此范高度非线性描述能力等优点,它已经被广泛应用于围的变量数据进行剔除.化工过程非线性系统建模领域.本文在利用Lasso算5)运用拉依达准则(3准则)判断数据是否存法初步筛选变量后,选择利用BP神经网络计算
10、指标在粗大误差,剔除此类误差数据.利用MATLAB计算因子贡献度,得出主要变量用于构建汽油辛烷值损误差并比较发现样本原始数据中不存在异常值,无失预测模型.经过模型效果分析对比决定使用BP神需剔除.经网络模型来预测辛烷值,并把BP神经网络和多元6)由于研究需以辛烷值作为目标数据,而辛烷线性回归模型相结合来对主要变量进行优化调控,值的测量比较麻烦,一周仅2 次,样本较少,无法与对优化调整过程中辛烷值和硫含量变化进行可视化操作数据样本相匹配,且测量结果存在滞后,故最终展示,以提升汽油品质为企业的炼油生产过程提供样本数据取为辛烷值测量时间前2 h的数据平均值。可靠的理论操作借鉴.计算完成数据预处理后,
11、替换原始收集到的样本数据.1数据收集和清洗2二步法筛选建模的主要变量1.1数据来源本文采集到的实验数据来自于中国石化上海高桥石油化工有限公司催化裂化汽油精制脱硫装置运行多年保留下来的历史数据 5-7 .关于汽油精制生产工作,该公司建立了2 个规模可观的数据库,即PHD和LIMS实验数据库.有关实验建模的原料、产品和催化剂等性质数据均可以每周2 次的频率从这2 个实时数据库中采集得到.为了确保实验和分析等方面的有效性与准确率,本文将数据采集时间跨度范围扩充到3年,即从LIMS数据库中获取2 0 17-0 4一2019-09和2 0 19-10 2 0 2 0-0 5这2 个时间段的生产信息.而操
12、作变量数据可从PHD数据库中获取,2 次2.1基于Lasso的变量初步筛选模型为了更有效地对工程技术应用效果进行分析,需要根据实际催化裂化汽油精制过程所得到的32 5个样本数据,先对36 7 个变量进行降维,剔除一些次要的对辛烷值损失影响不大的标量,筛选出一定数量的主要变量,以便后续能精准有效地建立辛烷值的损失预测模型.Lasso线性模型在变量选择方面的精度比逐步回归法和岭回归法等能更精确、更全面地筛选出主要影响变量,其最大优点在于可以直接将不重要变量的系数直接压缩为0,而不保留所有变量 6-10 .因此,采用 Lasso 对 36 7 个影响变量进行初步南京信息工经大学学报(自然科学版),2
13、 0 2 3,15(4);37 9-392Journal of Nanjing University of Information Science&Technology(Natural Science Edition),2023,15(4):379-392筛选,通过比较解释变量与被解释变量之间相关性的大小,删除不重要变量并保留主要变量,降低影响变量之间的多重共线性,使其相互独立,从而提高解的空间稳定性并进一步使得模型的泛化能力增强.2.1.1Lasso线性回归模型的建立运用Lasso方法初步筛选变量的步骤如下:1)特征标准化.观察36 7 个变量发现其量纲并不一致,为了避免量纲对研究结果的影响
14、,需要利用极差标准化法对数据进行标准化处理.2)建立Lasso线性回归模型.由于研究样本中有36 7 个自变量和1个因变量,可根据线性回归模型建立以下关系式:y=+ix+2x2+.+367x367+8,(1)式中,为常数项,12,,36 7 为回归系数,8 为随机扰动项.该模型中未知参数的Lasso 估计的定义为N=arg min(Z(y-o-Zan),i=1s.t.2I,It,其中,t0为调和参数.3)选择最佳的调整参数.对于控制回归系数压缩量的问题,在估计时可以通过调和参数t来实现,经过若干步骤之后可得不同t值下的所有Lasso估计值.在研究中,可选择10 折交叉验证法对参数进行调整从而选
15、择出最佳的调整参数.4)筛选出重要变量.对36 7 个变量进行Lasso回归之后,得出一定数量回归系数不为0 的变量,即为第1步所要筛选出的重要变量,其余回归系数为0的变量就会在Lasso线性回归模型中删除掉,被删除掉的可能是导致变量之间存在多重共线性的不重要变量.2.1.2Lasso模型初步筛选变量的结果分析运用Stata软件对辛烷值损失的36 7 个影响因素进行初步筛选,通过lassopack 命令实现Lasso 回归,并使用10 折交叉验证方法对模型的参数进行调整以达到最佳的状态.根据运行结果可以发现当Lamda=1.3733498时,模型的均方预测误差(M SPE)值达到最小,如图1所
16、示.根据Lasso所估计出的变量系数是否非零来筛选变量,其中系数非零的影响变量被保留下来作为主要变量,且它们之间的多重共线性已经得到一定的削减.经降维筛选过后的主要变量如表1所示,按照从左到右对辛烷值损失影响程度大小进行排列.381LambdaMSPE1251.424412229.088563208.736964190.193355173.297096157.901867143.8742981131.09295112.3999678522.1867613531.9924955541.8154877551.6542047561.507249871.3733498581.2513452591.14
17、01792601.038888861.9465967762.8625037363.78588127图1MSPE最小状态时的参数情况Fig.1 Parameter values at minimum MSPE(2)2.2基于BP神经网络-指标因子贡献度排名的变量筛选优化2.2.1BP神经网络-指标因子贡献度模型的建立采用Lasso线性回归模型对36 7 个变量进行初步筛选后得出n个主要影响因素,而这些因素对辛烷值损失影响程度的大小可以通过权重大小来决定.因此,需要进一步优化辛烷值损失的有效变量操作方案.鉴于BP神经网络模型可以通过数据逼近任意线性连续的函数,这一特点与原料性质、待生吸附剂性质、再
18、生吸附剂性质、产品性质、操作变量对辛烷值损失影响方式的特点相吻合.所以选择BP神经网络模型进行n个主要变量的计算,并将其指标数值作为神经网络的输入层,将损失的辛烷值作为输出层.此外,输入层主要变量对输出层辛烷值损失的影响,是由输入层对隐含层的影响和隐含层对输出层的影响这2 个部分组成的,如图2 所示.因此,输入层n个主要影响变量指标对输出层辛烷值损失的影响权重需综合上述2 个部分来进一步计算得出,过程如下:1)假设各输人变量对各隐含层变量都有一定程度的影响,这些影响的程度可通过输入层作用到隐含层的权重反映.权重计算公式为4o=22mIw;I,st.dev.1.0018209.14663224.
19、98105973.1462742.96137086.14518185.94563175.14467782.9328856.14412105.92201369.14320764.91127308.14233825.89979808.14139183.00784573.00079824.0076979.00080449.0075959.0008114.00752102.00081828.00747841.00083389.00747775.00085149.00747272.00086563*.00749993.00088241.00755229.00089527.00760887.0009037
20、4.00769639.00091357.00782185.00092305.00794792.00092751(3)许美贤,等.基于BP神经网络和多元线性回归的辛烷值预测.382XU Meixian,et al.Octane number prediction based on BP neural network and multiple linear regression.表1经降维筛选过后的主要变量Table 1 Main variables after dimension reduction screening序号变量名称a2原料辛烧值a94再生器顶底差压a301F-101辐射室出口压力
21、al原料硫含量a359加氢裂化轻石脑油进装置流量a40干气出装置流量a163D-109吸附剂料位al1待生吸附剂硫含量a141D-203底部液位a179D-102温度a35精制汽油出装置硫含量a54净化风进装置流量a91再生冷氮气流量a225非净化风干燥后露点温度a120产品汽油出装置流量a101S-ZORB.PT_1501.PVa208稳定塔顶回流流量a45氮气进装置流量a81D104液面a49循环水出装置流量a327S_ZORB AT-0003a187A-201出口总管温度a87D121顶去放火炬流量a12再生吸附剂焦炭含量a265ME-105过滤器压差a17还原器流化氢气流量a165D-
22、109上部温度a272K-103B排气温度a190EH101 出口a307EH-103人口流量a231闭锁料斗氧含量a=ao式中:。表示每个输人层主要变量对隐含层的影响权重之和;;表示输人层n个主要变量指标对隐含层中各个变量的权重,其中i和i分别表示输人层和n隐含层的节点;Z1w|表示单个输入层节点对隐含层中所有变量的影响大小之和,i取整数.2)计算隐含层对输出层辛烷值损失的影响程度.由于输出层仅有辛烷值损失一个指标,所以隐含层对输出层的影响权重等价于隐含层中各个变量与序号a9a162a184a345a53a334a238a22a5a185a16a349a192a302a161a43a29a2
23、30a297a70a145a8a346a236a195a150a222a255a326a97输出层节点的权重之比,其计算公式为m(4)bo=Zbk,bllbo式中:b为隐含层对输出层影响权重的比例,k和l分别表示隐含层和输出层的节点;1bl为隐含层中单个变量对输出层的权重;b表示隐含层全部变量对输出层权重之和,k取整数.3)计算输入层中n个具体主要影响变量指标对输出层的影响权重,计算公式为变量名称产品辛烧值D-109压力稳定塔底出口温度D-201含硫污水排量非净化风进装置压力S_ZORB AT-0010R-102床层吸附剂料位密度反应过滤器压差原料芳烃含量C-201#37层塔盘温度还原器压力E
24、-101壳程人口总管温度再生器顶部/再生器接收器差压F-101出口总管压力D-110底部燃料气进装置压力稳定塔下部温度闭锁料斗液位3.0步骤FIC2432.SP加热炉进口温度D-124 液位产品硫含量D-201含硫污水液位闭锁料斗H2过滤器出口气流量再生器接收器顶部/再生器接收器部差压D-109吸附剂料位火炬罐D-206液位9.0 步骤PIC2401B.OPS_ZORB AT-0002再生烟气氧含量m(5)(6)南京信息工经大学学报(自然科学版),2 0 2 3,15(4):37 9-392Journal of Nanjing University of Information Science
25、&Technology(Natural Science Edition),2023,15(4):379-392S;=ajbu,式中,S,为输入层中单个的具体主要影响变量对输出层的影响权重,4)计算输入层中每个指标对输出层影响大小之比例,计算公式为P。=ZS,S;P;=P。式中,P。表示所有输入层各个指标权重之和,P,为输人层各个具体主要影响变量指标对输出层辛烷值损失影响的占比.经过对BP神经网络模型的不断调整,最终设置n个输入层、1个隐含层,将隐含层节点数设为10、输出层为1,此设置方式可以使得误差达到最低,如图2 所示.HiddenInputn图2 BP神经网络-指标因子贡献度计算模型结构F
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 BP 神经网络 多元 线性 回归 辛烷值 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。