毕业论文(设计)数据挖掘技术在化工过程优化及构效关系中的应用研究.pdf
《毕业论文(设计)数据挖掘技术在化工过程优化及构效关系中的应用研究.pdf》由会员分享,可在线阅读,更多相关《毕业论文(设计)数据挖掘技术在化工过程优化及构效关系中的应用研究.pdf(106页珍藏版)》请在咨信网上搜索。
1、上海大学_硕士学位论文_数据挖掘技术在化工过程优化及构效关系中的应用研究_申请学位级别:硕士_专业:物理化学硕士论文:数据挖掘技术在化工过程优化及构效关系中的应用研究2005年1月摘要数据挖掘是指综合运用多种算法,从大量数据中发现事先未知的信息和知识 的计算机数据处理过程。作为一门多学科的交叉技术,数据挖掘已成为数据库系 统和机器学习领域的重点研究课题,因其应用前景广阔而受到学术界和工业界的 广泛关注。本文将数据挖掘技术应用于若干化工过程优化和化合物构效关系研 究,主要的研究内容和研究成果如下:1.针对复杂工业过程优化中普遍存在的多因子、高噪声、非线性、非高斯分布 和非均匀分布的难题,开发了适
2、用于复杂工业生产过程优化的软件DMOS(DataMi ni ng Opti mi zati on System)0 DMOS 软件综合运用 了模式识别、支持 向量机、人工神经网络、遗传算法、线性和非线性回归等多种数据挖掘技术,可应用于化工、炼油等工业生产过程的建模、优化与故障诊断。2.从技术或经济角度看,化工过程优化是提高企业竞争力和经济效益的必要手 段。本文将数据挖掘技术用于柴油加氢改质装置、丙烯晴反应装置及氨合成 装置的生产系统优化,分别找出了影响装置目标变量的主要工艺参数,建立 了目标变量与有关工艺参数间的定性、定量模型。优化结果为:(a)较高的 原料负荷(0.69左右)和适宜的炉出口温
3、度(333C左右)有利于提高柴油加 氢改质装置的柴油收率;柴油收率定性模型的分类正确率为100%;柴油收率 定量模型拟合与预报的平均相对误差分别为0.27%和0.22%。(b)较高的氨比(1.18左右)和较低的中段温度(43CTC左右)有利于提高丙烯脂反应装置的 丙烯储收率;丙烯月青收率定性模型的分类正确率为100%;丙烯睛收率定量模 型拟合与预报的平均相对误差分别为0.75%和0.83%。(c)较高的新鲜气流量(3O5OONm3/h左右)与合成塔一次进气压力(30.7MPa左右)有利于降低氨 耗;氨耗定性模型分类正确率为100%;氨耗定量模型拟合与预报的平均相对 误差分别为1.17%和1.1
4、5%。3.化合物的性质/活性是化学的基本研究内容之一。本文将数据挖掘的新算法-支持向量机(SVM)算法用于若干化合物的构效关系研究。将支持向量分类(SVC)算法用于5-HT3受体拮抗剂的活性类别预测,所建SVC模型对26个 5-HT3受体拮抗剂的活性类别留一法预报正确率为80.77%,明显优于人工神 经网络(ANN)方法(57.69%)、KNN 法(61.54%)和 Fi sher 法(65.39%)。将支持向量回归(SVR)算法分别用于烷基苯热物性和多环芳煌物性的定量预 测。47个烷基苯化合物正常沸点、沸点汽化热、临界温度、临界压力和临界 体积的SVR留一法预测的均方根误差(RMSE)值分别
5、为2.108,0.758,5,523,0.075,4.692,优于 ANN 算法(分另U为 5.063,1.046,9.704,0.114,9.452)和 PLS 算法(分别为2.436,0.817,7.163,0.075,5.914);对若干多环芳燃化合物沸点、硕士论文I数据挖掘技术在化工过程优化及构效关系中的应用研究2005年1月正辛醇/水分配系数、色谱保留指数的SVR留一法预测的RMSE值分别为 6.42,0.17,0.24,优于 ANN 算法(分别为 10.67,0.20,0.25)、MLR 算法(分别 为 7.44,0.18,0.25)和 PLS 算法(分别为 7.53,0.17,0
6、.24)关键词:数据挖掘,模式识别,支持向量分类,支持向量回归,化工过程优化,构效关系硕士论文:数据挖掘技术在化工过程优化及构效关系中的应用研究2005年1月AbstractData mi ni ng(DM),a multi-di sci pli nary research area,i s a technology to fi nd the unknown,hi dden and i nteresti ng knowledge from the massi ve data.It has been recogni zed as a key research topi c i n databas
7、e and machi ne learni ng.It has also aroused wi de i nterest of sci enti fi c or i ndustri al ci rcle fbr i ts large potenti al appli cati on.Thi s thesi s focuses on the appli cati on research of data mi ni ng i n chemi cal process opti mi zati on and structure-acti vi ty/property relati onshi p(SA
8、R/SPR)of compounds.The work and contri buti ons are li sted as followi ng:1.Based on the multi vari ate data processi ng methods fbr compli cated i ndustri al process systems i ncludi ng the chemi cal,petrochemi cal i ndustri es,the software of i ndustri al opti mi zati on named DMOS(Data Mi ni ng O
9、pti mi zati on System)has been developed.The methods used i n DMOS i nclude pattern recogni ti on,support vector machi ne,arti fi ci al neural network,geneti c algori thm,li near or nonli near regressi on methods.The DMOS software can be used i n modeli ng,opti mi zati on,and fault di agnosi s of co
10、mplex chemi cal processes.2.Chemi cal process opti mi zati on i s an i ndi spensable means to i ncrease competi ti on power and economi c profi t of chemi cal enterpri ses from techni cal and economi c vi ewpoi nts.In thi s work,some chemi cal process opti mi zati ons based on data mi ni ng(i ncludi
11、 ng the di esel oi l hydrofi ni ng uni t,the acryloni tri le reactor uni t,and the syntheti c ammoni a uni t)are studi ed.The mai n techni cal parameters affecti ng objecti ve functi on are found.The quali tati ve and quanti tati ve models correlated between objecti ve functi on and some techni cal
12、parameters are summari zed.The opti mal results are showed as followi ng:(a)The hi gher raw materi al capaci ty(about 0.69)and the appropri ate temperature(about 333 C)of the heat furnace entrance benefi t to enhance the di esel oi l yi eld.The coi rect rate of classi fi cati on of the di esel oi l
13、yi eld by usi ng quali tati ve model i s 100%.The mean relati ve errors(MRE)of the di esel oi l yi eld calculated by trai ned and predi cted models are 0.27%and 0.22%,respecti vely,(b)The hi gher ammoni a proporti on(about 1.18)and the lower temperature(about 430*C)of reactor are propi ti ous to i n
14、crease the acryloni tri le yi eld.The correct rate of classi fi cati on of the acryloni tri le yi eld by employi ng quali tati ve model i s 100%.The mean relati ve errors(MRE)of the acryloni tri le yi eld gai ned by trai ned and predi cted models are 0.75%and 0.83%,respecti vely,(c)The hi gher flow
15、of the fresh syntheti c gas(about 30500Nm3/h)ni硕士论文:数据挖掘技术在化工过程优化及构效关系中的应用研究2005年1月and the hi gher pressure of the fi rst entrance of ammoni a synthesi s tower(about 30.7MPa)profi t to decrease the ammoni a consumpti on.The correct rate of classi fi cati on of the ammoni a consumpti on by usi ng qua
16、li tati ve model i s 100%.The mean relati ve errors(MRE)of ammoni a consumpti on obtai ned by trai ned and predi cted models are 1.17%and 1.15%,respecti vely.3.The study of structure-acti vi ty/property relati onshi p(SAR/SPR)i s one of the chemi cal topi cs.In thi s thesi s,support vector machi ne(
17、SVM),a new algori thm of machi ne learni ng,i s appli ed to SAR/SPR analysi s of compounds.In the present work,support vector classi fi cati on(SVC)algori thm i s used to bui ld structure-acti vi ty relati onshi p(SAR)model of the 5-hydroxytryptami ne type 3(5-HT3)receptor antagoni sts wi th 26 comp
18、ounds.The results show that the accuracy of predi cti on of SVC model(80.77%)i s better than those of back propagati on arti fi ci al neural network(BP ANN)(57.69%),K-nearest nei ghbor(KNN)(61.54%)and Fi sher methods(65.39%).Support vector regressi on(SVR)i ntegrated wi th topologi cal i ndi ces i s
19、 appli ed to the predi cti on of fi ve physi cochemi cal properti es of alkyl benzenes i ncludi ng the nonnal boi li ng poi nt(bp),enthalpy of vapori zati on at the boi li ng poi nt(Hvb),cri ti cal temperature(7c),cri ti cal pressure(Pc),and cri ti cal volume(%).The results show that the root mean s
20、quared errors(RMSE)of SVR predi cti on model for bp,Hvb,Tc,Pc,and Vc(2.108,0.758,5.523,0.075,4.692,respecti vely)of alkyl benzenes are lower than those of BP ANN(5.063,1.046,9,704,0.114,9.452,respecti vely)and parti al least squares(PLS)(2.436,0.817,7.163,0.075,5.914,respecti vely)methods.QSPR of po
21、lycycli c aromati c hydrocarbons(PAHs)wi th 51 compounds i s analyzed by SVR algori thm.Three physi cochemi cal properti es related to thei r envi ronmental i mpact are studi ed:boi li ng poi nt(bp),octanol-water parti ti on coeffi ci ent(logKon),and retenti on ti me i ndex(RI)fbr reversed-phase li
22、qui d chromatography analysi s.The results show that RMSE for bp,logKow,and RI(6.42,0.17,0.24,respecti vely)of PAHs obtai ned by SVR predi cted model are lower than those of BP ANN(10.67,0.20,0.25,respecti vely),multi ple li near regressi on(MLR)(7.44,0.18,0.25,respecti vely),and PLS(7.53,0.17,0.24,
23、respecti vely)methods.Keywords:data mi ni ng,pattern recogni ti on,support vector regressi on(SVR),support vector classi fi cati on(SVC),chemi cal process opti mi zati on,structure-acti vi ty/property relati onshi p(SAR/SPR)IV原创性声明本人声明:所呈交的论文是本人在导师指导下进行的研究工作。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表 或撰写过的研究成果。
24、参与同一工作的其他同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。本论文使用授权说明本人完全了解上海大学有关保留、使用学位论文的规定,即:学 校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可 以公布论文的全部或部分内容。(保密的论文在解密后应遵守此规定)硕士论文:数据挖掘技术在化工过程优化及构效关系中的应用研究2005年1月第一章绪论化学、化工是一门以实践为主的学科,其理论的发展往往落后于实践。认识 物质、改造物质、创造新物质和认识反应、控制反应过程和创造新反应是化学、化工研究的主体。到2000年4月底,在CAS登录的化学物质约2400万种,如 此众多的化合物所
25、包含的化学知识(信息)量远超过其它学科,而且这些信息往 往是通过实践获得的。在长期的化学、化工实践中,积累了海量的化学、化工信 息,这类信息散布在浩如烟海的各类化学、化工文献中,虽然这些化学信息为人 们探索自然界的奥秘提供了基础,但由于数据量的迅猛增加却造成了使用上的困 难,常规手段已无法满足化学、化工专家的需要,因此众多的化学、化工数据库 应运而生。近年来,人们在利用数据库对化学、化工问题进行研究时,逐渐认识 到海量数据的处理十分困难,而且不充分,更具价值的规律性信息和知识还隐藏 在数据内部。如何从化学、化工数据中发现更多、更有价值的化学、化工规律正 逐步成为化学、化工专家关注的焦点,正如徐
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 设计 数据 挖掘 技术 化工 过程 优化 关系 中的 应用 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。