基于机器学习的场地重金属单因子指数预测_李心治.pdf
《基于机器学习的场地重金属单因子指数预测_李心治.pdf》由会员分享,可在线阅读,更多相关《基于机器学习的场地重金属单因子指数预测_李心治.pdf(4页珍藏版)》请在咨信网上搜索。
1、摘要:为有效利用污染场地环境大数据,优化污染场地的调查与风险评估流程,依据污染行业专家知识建立指标集作为输入值,结合单因子指数污染评价方法,分别应用 XGBoost,LightGBM 两种机器学习模型对场地重金属单因子指数进行预测。模型训练和测试结果表明,两种模型均具有较好的预测效果,但整体上 LightGBM 略优于 XGBoost。构建的场地重金属单因子指数预测模型可在无需钻孔采样分析的情况下,对场地内地块的重金属污染等级进行预判,为场地调查修复提供决策信息。关键词:重金属污染;单因子指数法;机器学习Abstract:In order to make effective use of th
2、e environmental big data of the contaminated site and optimize theinvestigation and risk assessment process of the contaminated site,the index set is established according to thepollution industry expert knowledge as the input value.Combined with the single factor index pollution assessmentmethod,XG
3、Boost and LightGBM machine learning models are respectively applied to predict the single factor index ofheavy metals at the site.Model training and test results show that both models have good prediction effects,butLightGBM is slightly better than XGBoost on the whole.The single factor index predic
4、tion model of heavy metals in thesite can predict the pollution level of heavy metals in the site without the need of borehole sampling analysis,andprovide decision-making information for site investigation and restoration.Key words:heavy metal pollution;single factor index method;machine learning中图
5、分类号:X825文献标识码:A文章编号:16741021(2023)020035-041引言随着科学技术的日益进步,工业生产所带来的土壤重金属污染问题也逐渐严重。目前,精准获得场地污染状态的唯一有效方法是钻孔取样分析,但这种方法存在很多不足,如成本高、周期长等。同时,污染场地在调查、修复、评估的全流程中会产生大量的记录数据,若能有效地利用这些数据,在无需钻孔取样的情况下对场地重金属的污染等级进行预测,对优化污染场地的风险评估决策流程具有重要意义。目前,关于土壤的重金属污染问题,在污染评价方面较为常用的方法有单因子指数法、地累积指数法、内梅罗指数法和生态风险指数法等1-3。此外,随着机器学习的快
6、速发展及其独特优势,多种机器学习方法如随机森林、支持向量机等,已经逐渐应用于土壤特性预测、土壤重金属含量预测等方面4-6。本文以国内 8 个重金属污染场地为研究区,结合单因子指数污染评价方法,通过 2 种机器学习算法对场地重金属单因子指数进行预测,初步判断场地各地块的污染等级,以期在一定程度上为重金属污染场地的调查与风险评估提供决策信息。2材料与方法21试验区域试验区域共选择 8 个重点行业污染场地,这些收稿日期:2022-09-14;修订日期:2023-01-10。作者简介:李心治,男,1997 年生,硕士研究生,主要从事地理信息系统与大数据可视化分析研究。*通讯作者:张健钦,男,1977
7、年生,教授,主要研究方向为城市大数据可视化、智能交通、智慧应急等,E-mail:。基金项目:国家重点研发计划项目(2019YFC1804903);国家自然科学基金(41771413);北京市自然科学基金(8202013)。基于机器学习的场地重金属单因子指数预测李心治1,2张健钦1,2胡昊3姜会忠1,2李星辰1,2陆楠3(1.北京建筑大学测绘与城市空间信息学院,北京 102616;2.自然资源部城市空间信息重点实验室,北京 102616;3.生态环境部信息中心,北京 100029)*35场地在其主要产品的生产工艺流程以及存放过程中均涉及重金属污染问题,8 个场地总占地面积约5042 万 m2。具
8、体信息见表 1。表 1试验场地信息万 m222数据来源与处理221土壤采样数据根据 HJ 2512014 场地环境调查技术导则、HJ 2542014 污染场地土壤修复技术导则 等相关导则和指南要求,以及潜在污染区域的识别情况,按照系统布点及功能分区方式,结合专业判断的原则对场地进行布点采样7。8 个污染场地共布设土壤采样点位 1 024 个,共采集土壤样品 3 849 个(包括平行样品和质量控制样品)。经实验室分析后,以DB11/T8112011 场地土壤环境风险评价筛选值为筛选标准,从每个场地选取超标率最大的重金属污染物为该场地的特征污染物。各场地的采样情况及特征污染物信息见表2。表 2各试
9、验场地采样详情222物探数据物探数据的获取采用高密度电阻率法,它以岩、土导电性的差异为基础,研究人工施加稳定电流场的作用下地中传导电流分布规律,以探测各岩土层的空间分布等情况,满足目的要求。223其他数据主要包括与企业相关负责人沟通协调,收集场地历史、生产工艺、地勘报告和环境影响评价报告等相关资料;根据收集的资料和人员访谈初步判断疑似污染区域并进行现场走访和踏勘,获取到照片、视频、遥感影像等信息。224网格地块划分利用 ArcMap102 软件,结合污染场地的遥感影像,并根据各场地的面积以及采样点分布等情况,将8 个污染场地共划分为 315 个网格地块,保证每个地块都包含至少 1 个土壤采样点
10、。23研究方法231相关算法介绍2311XGBoostXGBoost(eXtreme Gradient Boosting)是 基 于Boosting 框架的一个算法工具包(包括工程实现),在并行计算效率、缺失值处理、预测性能上都非常强大8。XGBoost 和其他梯度提升算法的主要区别是,XGBoost 使用了一种新的正则化技术,控制过拟合现象的产生。因此,在模型调整期间,XGBoost 会更快、更健壮9。XGBoost 能够精确地找到数据分隔点。首先,对所有特征按数值进行预排序。其次,在每次的样本分割时,用 O(data)的代价找到每个特征的最优分割点。最后,找到最后的特征以及分割点,将数据分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 场地 重金属 因子 指数 预测 李心治
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。