基于机器学习的污染土壤修复变量分类与评价_郭琳.pdf
《基于机器学习的污染土壤修复变量分类与评价_郭琳.pdf》由会员分享,可在线阅读,更多相关《基于机器学习的污染土壤修复变量分类与评价_郭琳.pdf(6页珍藏版)》请在咨信网上搜索。
1、0引言污染土壤修复研究具有保障耕地安全、修复生态环境和土地资源再利用等方面的重要意义,是当前技术研究和应用的热点。通常,检验一种修复方法的优劣主要看是否达到土壤环境质量、肥力质量和健康质量等目标参数1,内容涉及污染物降低程度、生态功能恢复程度和农产品安全性等方面。但是对于尾矿库、垃圾填埋场等污染程度高、修复难度大的复杂污染场地2,不仅需要成熟的技术,还要考虑修复周期、成本投入和资源综合利用等因素。传统的土壤修复效率评估采用权重法,累计每个变量指标所收稿日期:2020-12-08基金项目:国家自然科学基金项目(41471188);陕西省自然基金项目(2019SF-246).作者简介:郭琳(198
2、0-),男,陕西柞水人,硕士,副教授,主要从事环境保护与智能检测研究.通讯作者:曹书苗(1984-),女,陕西柞水人,博士,工程师,主要从事水土污染修复技术研究,E-mail:.基于机器学习的污染土壤修复变量分类与评价郭琳1,2,曹书苗2,柯希彪1,刘俊1,汤引生1,李军富3(1.商洛学院 电子信息与电气工程学院,陕西商洛726000;2.西安建筑科技大学 陕西省环境工程重点实验室,陕西西安710055;3.商洛学院 化学工程与现代材料学院,陕西商洛726000)摘要:为缩短重金属污染土壤修复周期,研究电动+植物强化修复法机理与规律,建立分类评价指标体系,融合随机森林算法和灰色关联法建立RF-
3、GRA模型,进行变量分类和修复效率评价。指标中电压梯度(0.093)的权重值最高,其次是电流大小、电极材料、土壤湿度、富集植物种类和通电时间等。6个样本的模型评价效率高于实验效率,实验环境A1 A3的相对误差分别为3.35%,4.12%和6.54%,B1 B3分别为11.19%,9.48%和8.66%;A1(Cd)和A2(Cu)的修复效果优于B1(Cd)和B2(Cu),A3(Zn)低于B3(Zn);RF-GRA的测试结果优于RF-Random。为土壤修复质量评价奠定了基础。关键词:土壤重金属;电动强化修复;随机森林;RF-GRA;变量分类中图分类号:X5文献标志码:A文章编号:1674-482
4、9(2021)02-0001-06Classification and Evaluation of Contaminated Soil Remediation VariablesBased on Machine LearningGUOLin1,2,CAOShu-miao2,KEXi-biao1,LIUJun1,TANGYin-sheng1,LIJun-fu3(1.Electronic Information and Electrical Engineering College,Shangluo University,Shangluo 726000,China;2.Key Laboratory
5、of Environmental Engineering of Shaanxi Province,Xian University of Architecture and Technology,Xian 726000,China;3.College of Chemical engineering and modern Materials,Shangluo 726000,China)Abstract:To reduce the remediation cycle of soil contaminated by heavy meta,the mechanism and law of Electrok
6、ineticPhyto reinforcement remediation contaminated soil was studied.The classification and evaluation index system and RF-GRAmodel integrating random forest and grey correlation method were established to classify variables and evaluate remediationefficiency.The highest weight value in index is the
7、voltage gradient(0.093),which is followed successively by current value,electrode material,soil humidity,hyperaccumulators type,and power on time.The weight values of the other variables arelower than the average.The evaluating efficiency of the model is higher than that of experiment for 6 samples.
8、The relativeerrors of experiment environment A1 A3 are 3.35%,4.12%and 6.54%and B1 B3 are 11.19%,9.48%and 8.66%respectively;the remediation effect of A1(Cd)and A2(Cu)are better than B1(Cd)and B2(Cu),while A3(Zn)is lower than B3(Zn).RF-GRA model is better than RF-Random,which lays a foundation for the
9、 evaluation of soil remediation schemes.Key words:Heavy metal in soil;Electrokinetic reinforcement remediation;Random forest;RF-GRA;Variableclassification第34卷第2期2021年4月环 境 科 技Environmental Science and TechnologyVol34No.2Apr2021DOI:10.19824/32-1786/x.2021.0016环境科技2021年4月占百分比,再结合土壤重金属消解率计算修复效率。但固定的变量指
10、标及权重无法适应动态修复过程,容易导致结果出现较大误差。随着人工智能技术的发展应用,研究者开始关注效率高、成本低的智能精细修复技术,利用算法或者模型来完成修复变量特征的表征3,再通过规则构造评价权重集,最后用匹配模型实现结果评价和分析。郑燊燊等4模拟电动修复Cd污染土壤,利用不同位置下pH值与Cd浓度关系为基础,首次建立DBLM模型预测修复效果;金晶炜等5提出以生菜砷吸收量等为指标,利用灰色关联和聚类分析法定量聚类评价修复贡献值;郝安峰等6在PLC控制的工控机上安装修复软件,模拟测控污染土壤修复过程,实时确定土壤物理参数和控制参数;王兵等7采用层次分析与优劣解距离法建立评价体系,解决指标权重和
11、排序问题,并实施了室内试验校核;马科峰等8和魏树和等9几乎同时总结了电动-植物修复重金属污染土壤的最新研究数据,为定量评价奠定了基础。以上研究是基于实验室盆栽富集植物,开展强化修复重金属污染土壤,解决单一或主要因素下电动修复与富集植物吸收的自适应问题,而通用型的定量评价与主动干预方法有待继续研究。本文提出一种融合策略,利用随机森林算法中的集成学习策略和灰色关联度法中相似行为映射结果的客观科学性,充分发挥快速主动干预优势,建立土壤修复变量分类评价模型,并通过重金属污染土壤修复测试加以验证。1修复变量分类方法1.1分类与评价整体流程尾矿库或矿场矿渣主要包含金属氧化物的残渣态和结合态,土壤在修复过程
12、中由于电流密度增大、土壤湿度下降,使得渗流作用减弱、金属离子迁移困难10,所以需要采用综合的强化修复技术提高重金属去除效率。在研究“电动法+植物萃取”修复法机理的基础上,对快速智能修复中固有或潜在的影响因素进行分析,从而制定出变量分类与评价指标体系和应用模型,其流程见图1。由图1可以看出,先采集修复样本数据,对数据进行预处理,通过评价指标体系得到文本变量特征;训练样本由软件变量抽样后送到随机森林RF分类器,通过决策树进行性能评估得到分类结果和评价错误率;同时,把分类结果送到GRA灰色关联算法模块中计算分类评价结果。图1分类与评价流程1.2修复变量的分类评价指标体系提出的修复变量分类评价指标体系
13、是建立在电动修复重金属污染土壤的基础上,进行定量评价土壤修复质量。此方法既考虑了农田土壤的一般性,也考虑了污染场地的特殊性,兼顾土壤复耕标准和二次开发利用的社会、经济价值。比如使用闭库之后的重金属尾矿库,综合修复治理难度和费用很大,但具有生态环保、安全监控和资源再利用等方面的重大意义,需要研究者系统考虑修复方案。重金属尾矿库的污染体存量大、坝体结构复杂,适用于原位修复和治理,其中添加试剂法易造成下游水体二次污染,而“电动法+植物萃取”技术在尾矿库土壤修复及资源再利用等方面具有显著优势。本文以尾矿库土壤修复为例,通过对尾矿库实地调研和重金属成分检测,分析污染物的组成和迁移规律,同时研究了库区富集
14、植物的优势度和转运系数,设计影响土壤修复质量的变量评价指标体系见表1。由表1可以看出,修复变量包括土壤因素变量群、电极因素变量群、电场因素变量群和辅助因素变量群4类一级指标,以及它们所属的20个二级变量指标。通过分析污染土壤自身影响变量,土壤因素包括土壤原始pH值、动态pH值、湿度、温度、紧实度、电导率和重金属质量浓度等变量;电极因素包括电极布置方式、材料、间距和正负极交替周期等变量;电场因素包括通电时间、电场强度、电流大小、交流/直流交替周期等变量;辅助因素包括添加剂的种类、浓度、富集植物种类等变量。修复样本数据预处理评价体系抽样分类结果性能评估GRA算法RF分类器变量特征评价结果22第34
15、卷第2期1.3变量特征度的提取土壤修复变量分类评价指标体系建立之后,用于过滤提取修复样本变量,机器系统一般用特征来识别或区分变量,这里采用向量空间模型VSM11定义的)S1,x1;S2,x2;Sj,xj)来描述特征,其中Sj为特征项,xj为特征项对应的等级赋值,用以描述变量特征项的变化程度。为提高特征度获取精度,研究利用Doc2Vec方法12(一种随机文本获得固定长度特征的无监督算法工具,具备计数、平均、加权、百分率、最大值及最小值等功能),对变量特征项进行预处理,获得特征度的编码和等级赋值。实验样本数据较多时,为获得更好区分效果,可利用类似短时傅里叶分析工具13,再次处理变量特征,通过公式(
16、1)得到j变量处第i个节点的特征度方均根值Xj,i(S),xj,n为变量j处的第n个等级赋值;N为j变量全部赋值个数。2修复变量分类评价模型2.1随机森林分类算法随机森林算法是一种基于集成学习Bagging的算法,建立包含多个决策树的随机分类器,准确度高、处理能力强,适合于分类和变数评估等问题14-15。原始Original-RF森林算法,是一种基于Boosting算法的依赖串行生成序列化方法,首先初始训练得到基学习器,然后调整样本训练下一个基训练器,如此重复达到基训练器预期数目,最后将所有基训练器加权结合得到分类结果;随机抽样Random-RF森林算法是基于Bagging算法的改进版,产生相
17、对独立和差异化的基训练器集合,通过Bootstrap自助采样,随机森林分类算法示意见图2。由图2可以看出,引入决策树结构,从根节点开始将数据样本根据特征进行分类,每个类别决策树通过Bootstrap抽样产生一个训练集,重复随机抽取m次的M个样本数据。决策树数量根据所选取的变量数目及组合确定,随后在生长过程中以指数最小原则选出符合评价指变量群土壤因素变量群电极因素变量群电场因素变量群辅助因素变量群编号S1S2S3S4S5S6S7S8S9S10S11S12S13S14S15S16S17S18S19S20变量土壤原始pH值土壤动态pH值土壤湿度(相对)土壤温度土壤紧实度土壤电导率重金属质量浓度电极布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 污染 土壤 修复 变量 分类 评价 郭琳
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。