基于3种地理加权回归方法的...壤pH空间预测制图对比研究_陈宣强.pdf
《基于3种地理加权回归方法的...壤pH空间预测制图对比研究_陈宣强.pdf》由会员分享,可在线阅读,更多相关《基于3种地理加权回归方法的...壤pH空间预测制图对比研究_陈宣强.pdf(11页珍藏版)》请在咨信网上搜索。
1、陈宣强,赵明松,卢宏亮,等.基于 3 种地理加权回归方法的安徽省土壤 pH 空间预测制图对比研究 J.地理科学,2023,43(1):173-183.Chen Xuanqiang,Zhao Ming-song,Lu Hongliang et al.Comparison and analysis of spatial prediction and spatial variability of soil pH in Anhui Province based on three kinds of geographicallyweighted regression.Scientia Geographic
2、a Sinica,2023,43(1):173-183.doi:10.13249/ki.sgs.2023.01.018基于 3 种地理加权回归方法的安徽省土壤 pH 空间预测制图对比研究陈宣强1,2,3,赵明松1,2,3,卢宏亮1,徐少杰1,邱士其1,胡克宏1(1.安徽理工大学空间信息与测绘工程学院,安徽 淮南 232001;2.矿山采动灾害空天地协同监测与预警安徽省教育厅重点实验室,安徽 淮南 232001;3.矿区环境与灾害协同监测煤炭行业工程研究中心,安徽 淮南 232001)摘要摘要:基于安徽省 140 个采样点的土壤 pH 数据,综合考虑土壤、地形、气候、生物等因子对土壤 pH 的影
3、响,采用地理加权回归(Geographically Weighted Regression,GWR)、主成分地理加权回归(Principal Component Geographic-ally Weighted Regression,PCA-GWR)和混合地理加权回归(Mixed Geographically Weighted Regression,M-GWR)3 种模型对安徽省土壤 pH 空间分布进行建模预测,揭示环境因子对土壤 pH 的影响在空间上的差异,最后以多元线性回归模型(Multiple Linear Regression,MLR)为基准比较 3 种 GWR 模型的精度。研究表明:
4、安徽省土壤pH 具有空间异质性,且集聚特征明显。3 种 GWR 模型中 M-GWR 模型略优,GWR、PCA-GWR 和 M-GWR 的建模集调整后决定系数(Radj2)分别为 0.59、0.62 和 0.63;对比 MLR 模型,3 种 GWR 模型的 Radj2分别提升了 23%、31%和 35%。M-GWR 生成的预测图在空间上过渡平滑,建模效果稳定,其预测结果表明安徽省淮河以北地区多为碱性土壤,长江以南多为中性或酸性土壤,符合“南酸北碱”特征。GWR 及其改进模型可以有效地预测土壤 pH属性,反映环境因子在不同空间位置上对土壤 pH 的影响程度,而 M-GWR 兼具变量作用的全局性和和
5、局部性,进而提升了模型解释能力,为大区域数字土壤制图提供了重要的参考方法。关键词关键词:土壤 pH;地理加权回归;数字土壤制图;安徽省中图分类号中图分类号:S159.9文献标识码文献标识码:A文章编号文章编号:1000-0690(2023)01-0173-11 土壤是成土因素综合作用的产物1-2。Jenny 等1对土壤与成土因素之间的关系进行研究,将土壤描述为气候、生物、地形、母质和时间的函数;McBrat-ney 等2在此基础上将土壤本身和空间位置加入到函数模型中。不同空间位置成土因素的差异使得土壤具有高度的空间异质性。pH 是土壤重要的基本性质,它与土壤的肥力水平、微生物与动物群的活动和腐
6、殖质的形成息息相关,并直接影响土壤养分存在的形态和有效性3-4。相关研究表明,19802010 年中国主要农作物产区的土壤 pH 值下降了约 0.5 个单位5,加上城市化导致的耕地面积减少,严重影响到粮食生产。随着氮肥使用量的增加,现代农业本身加速了土壤 pH 的下降6。预测土壤pH 的空间分布对于土地的合理规划利用、养分管理和精准施肥都有重要意义7-8。传统的土壤制图耗时费力,而且很难提供足够充分且完整的信息9。数字土壤制图是基于土壤景观模型为基础,以空间分析和数学方法为技术手段的制图方法10。目前应用的较广的数字制图方法主要有两种,第一种方法是基于土壤景观环境的关系建立模型,如线性回归、模
7、糊聚类、神经网络、支持向量机、随机森林和贝叶斯概率11-15。第二种方 收稿日期收稿日期:2021-09-11;修订日期修订日期:2022-01-20基金项目基金项目:国家自然科学基金项目(41501226)、安徽省自然科学基金项目(2208085MD88)、安徽省高校自然科学研究项目(KJ2015A034)、安徽理工大学人才引进项目(ZY020)资助。Foundation:National Natural Science Foundation of China(41501226),AnhuiNatural Science Foundation(2208085MD88),Natural Sci
8、ence Research Project of Universities in Anhui Province(KJ2015A034),Talent Intro-duction Project of Anhui University of Science and Technology(ZY020).作者简介作者简介:陈宣强(1997),男,江西赣州人,硕士研究生,主要从事数字土壤制图研究。E-mail:通讯作者通讯作者:赵明松。E-mail: 第 43 卷第 1 期地理科学Vol.43 No.12023 年 01 月Scientia Geographica SinicaJan.,2023法同时
9、考虑环境要素和空间位置的作用,如回归克里格、协同克里格插值法和地理加权回归(Geo-graphically Weighted Regression,GWR)16-20。在土壤发育过程中影响土壤的环境因子具有空间非平稳性,其大小随着空间位置的变化而变化,在大区域中这种关系更为明显21-23。Liu 等23在对中国东部典型农业区土壤养分研究表明:在小尺度(12 km)上有机碳和全氮主要受土地利用的控制,地形是决定总磷变化的主要因素,而在大尺度(84km)上有机碳、总氮和总磷的空间变异主要归因于母质。传统的线性模型难以处理它们间的复杂关系。GWR 由英国地理学家 Fotheringham 等24提出
10、,模型中自变量的回归系数随空间位置而变化,能够直观地探测不同空间位置上各环境因子对某种因子的影响程度,对于空间数据具有较强的局部分析能力。该方法可以有效探测空间数据的空间非平稳性。GWR 模型在研究土壤属性空间变异上取得了很好的效果18-20。赵明松等18认为在使用 GWR 进行省域尺度土壤制图时,建模样点数量对建模精度影响不大,样点数较少时也能保证一定精度。为了提升 GWR 的适用性与可靠性,很多学者做出了各种改进,如主成分地理加权回归(Principal Compon-ent Geographically Weighted Regression,PCA-GWR)、混合地理加权回归(Mixe
11、d GeographicallyWeighted Regression,M-GWR)和基于岭回归的GWR,并取得了较好的效果25-30。大数据时代的数据体量激增,GWR 等技术都面临着计算效率瓶颈问题,在建模前对原始数据进行主成分分析可以实现数据降维,提高计算效率,还可以有效避免多重共线性问题。王景雷等25采用 PCA-GWR 进行华北地区冬小麦作物需水量空间分布的估算,结果显示该方法优于 MLR 与克里金插值法。GWR 假设自变量和因变量的关系在空间上总是变化的,实际上自变量对因变量的作用可能是固定的,有些则是变化的。与仅考虑局部或全局关系的预测方法相比,M-GWR 方法可以根据环境变量的变
12、化采用自适应系数来提高预测精度。陈科屹等30利用 GWR 与多种扩展模型(主要为 M-GWR)对天然次生林碳储量空间分布进行预测,结果表明 M-GWR 稳定性更好,能够在 GWR 模型基础上进一步降低残差的空间自相关性。本研究以安徽省土壤 pH 为预测目标,利用GWR、PCA-GWR 和 M-GWR 进行空间建模与制图,并对比 3 种 GWR 建模精度差异和适用性,同时探究土壤 pH 影响因子的空间非平稳性,研究结果可为大区域数字土壤制图提供参考。1 材料与方法1.1研究区概况研究区概况安徽省(11454E11937E,2941 N3438N)地处中国东部,跨长江、淮河中下游,总面积为14.0
13、1104 km2,其中耕地面积 5.89104 km2,约占总面积的 42%。安徽省位于亚热带向温带过渡带,年均气温 1416,年降水量 8001 800 mm。安徽省按地形地貌从南到北划分成 5 个地理区域(图 1),依次为皖南丘陵山地区、皖西丘陵山地区、沿江平原、江淮丘陵地区和淮河中游平原31。除皖西和皖南山地丘陵地区外,其余地区海拔一般不超 100 m。皖南丘陵山地区主要土壤类型为黄壤、红壤、紫色土;江淮丘陵与皖西丘陵山地区为水稻土、黄棕壤、黄褐土;沿江平原为水稻土和灰潮土;淮河中游平原为潮土和砂姜黑土。农田主要分布在淮河中游平原、江淮丘陵地区和沿江平原;林地和草地主要位于皖西和皖南丘陵
14、山地区的大别山32。1.2数据来源数据来源选取土壤 pH 作为土壤制图的目标变量,地形、淮河中游平原区江淮丘陵区沿江平原区皖西山地丘陵区样点划分验证集训练集海拔/m高:1752低:83地理分区边界050100 kmN皖南山地丘陵区沿江平原区图 1 安徽省海拔与样点划分Fig.1 Altitude and sample distributionin Anhui Province174地理科学43 卷 气候、生物因子作为环境协同变量。土壤数据来源于中国土系志安徽卷31中的 140 个省级典型土壤剖面,采样时间为 20102011 年,样点采集按照地形母质土地利用等景观要素组合,同时样点尽量布设在第
15、二次土壤普查时期的典型土壤剖面附近。本研究选取表层(020 cm)土壤 pH 作为数字土壤制图对象。地形数据 SRTM 数字高程模型(Digital Eleva-tion Model,DEM)来 源 于 地 理 数 据 空 间 云(http:/),空间分辨率为 90 m。基于 DEM,利用 SAGA 提取坡向(Aspect)、坡度(Slope)、高 程(Elevation)、平 面 曲 率(Plancurvature,Plan)、平面曲率(Profile curvature,Pro-file)、径流强度指数(Slope Index,SPI)、汇聚指数(Convergence index,CI)
16、、多尺度山谷平坦指数(Multi-resolution Valley Bottom Flatness,MrVBF)、多尺度山脊平坦指数(Multi-scale Ridge Top Flat-ness,MrRTF)、地形湿度指数(Topographic Wet-ness Index,TWI)及地形位置指数(Topographic Po-sition Index,TPI),TWI 是区域地形对径流流向和蓄积影响的物理指标。MrVBF 是一种湿度指数,它通过对 DEM 进行渐进平滑和粗化,同时降低坡度阈值来识别多分辨率下的平坦和低地形进而识别谷底。MrRTF 与 MrVBF 类似,它通过识别高平坦区
17、域来识别山脊33。年均温(Mean Annual Temperature,MAT)和年均降水量(Mean Annual Precipitation,MAP)来源于中国农业科学院农业资源与农业区划研究所中国生态环境背景层面建造项目提供的栅格数据,空间分辨率为 1 km,由 19801999 年的逐月平均值计算生成。对全国气象数据进行裁剪和投影转换,提取各剖面点对应的气候数据。归一化植被指数(NDVI)和增强植被指数(EVI)数据采用 MODIS 陆地产品 16 d 合成植被指数(MOD13Q1),为 2010 年 6 月的一期数据,空间分辨率为 250 m。所有环境变量重采样为 1 km 空间分
18、辨率,土壤属性预测结果的空间分辨率为 1 km。1.3研究方法研究方法 1.3.1 土壤与环境因子数据处理数据处理分析流程如下:首先根据土壤 pH值进行分段后进行随机抽取相同数量的样本,将140 个样点的土壤数据按照 31 比例分割为建模集(108 个)和验证集(32 个);分析 15 个环境因子与土壤 pH 之间的相关性,选取通过显著性检验的环境因子。为避免环境变量存在多重共线性问题,对所选的环境因子进行了容差和方差膨胀因子(VIF)检验,利用通过检验的环境因子参与 GWR与 M-GWR 模型及其对应 MLR 模型的建模,并将通过检验的环境因子进行主成分提取后进行 PCA-GWR 模型及其对
19、应 MLR 模型的建模。1.3.2 地理加权回归MLR 假定自变量对因变量的作用在全局上是同质的,其回归系数在空间上保持恒定,忽视了空间位置对作用程度的影响,GWR 是典型的局部回归模型,相当于在每个点上进行了一次独立的线性回归,其公式如下:Yi=0(ui,vi)+ki=1k(ui,vi)Xik+i(1)式中,(ui,vi)为第 i 个样点的空间坐标;Yi和 Xik为因变量 Y 和自变量集 Xk在空间位置处的实测值,k为自变量个数;0(ui,vi)为空间位置(ui,vi)处的常数项;k(ui,vi)为连续函数 k(u,v)在 i 点处的值;i为随机误差项。空间权函数 k(ui,vi)选择自适应
20、 bi-square 函数,用来确定回归点的回归系数;改进的赤池信息量 准 则(corrected Akaike information criterion,AICc)作为选择标准确定最优带宽;利用黄金分割搜索方法以 0.618 为步长不断缩小初始设置的带宽搜索范围,直到带宽范围差值小于设置的迭代精度为止,取其平均值作为最优带宽34。利用 SPSS17.0 实现数据的相关性分析,将通过显著性检验的 8 个环境因子在 GWR4.0 上实现3 种 GWR 和 MLR 的建模。1.3.3 主成分地理加权回归PCA-GWR 利用主成分分析后的得到的多个主成分进行 GWR 建模。主成分分析将多个环境变量
21、以尽可能少的信息损失为原则进行综合,化为少数几个不相关的主成分,从而达到数据降维、简化数据结构的目的,同时解决多元线性回归中的多重共线性问题35。利用 SPSS17.0 实现数据的主成分分析,对上述所选 8 个环境因子进行主成分分析得到 4 个主成分(累计贡献率达 85%以上)实现数据降维,将主成分分析的结果进行 GWR 和 MLR 建模。1 期陈宣强等:基于 3 种地理加权回归方法的安徽省土壤 pH 空间预测制图对比研究175 1.3.4 混合地理加权回归M-GWR 将地理变异性较强的自变量作为局部变量,其余作为全局变量,其公式如下:Yi=0(ui,vi)+ki=1k(ui,vi)Xik+l
22、i=1lzil+i(2)l式中,zil是具有固定回归系数 的自变量,即全局变量(l 为全局变量个数),与传统回归模型的系数一样在全局范围保持不变。与 GWR 认为局域范围的规律作用要胜过整体区域的规律作用不同,M-GWR 认为部分自变量对因变量的作用程度在整体区域内保持恒定,应将其作为全局变量,而剩余自变量对因变量的作用程度随着空间位置的变化而变化,则将其作为局部变量。M-GWR 通过 Back-Fit-ing 方法自动选择局部影响不显著的变量,并将其作为全局项,增加了整体模型的可靠性36。利用相关性分析后得到的 8 个环境因子进行M-GWR 建模。1.4制图精度评价制图精度评价3 种 GWR
23、 的模型精度评价选用以下 4 个指标:Lin 协调相关系数(Lins Concordance CorrelationCoefficient,CCC)、平均绝对误差(MAE)、均方根误差(RMSE)以及调整后决定系数(Radj2)。CCC 是比较同一变量 2 个测量值之间一致性的方法;MAE是所有单个观测值与算术平均值的偏差的绝对值的平均;RMSE 用来衡量观测值同真实值之间的偏差;R2反映因变量的全部变异能通过回归关系被自变量解释的比例,但有时候模型中添加了一些无关变量也会小幅度提升 R2值,这种提升实际是无意义的,Radj2可以对无关变量做出惩罚,使其更接近真实情况。CCC=2op(OP)2
24、+2o+2p(3)MAE=1nni=1|OiPi|(4)RMSE=1nni=1(OiPi)20.5(5)R2adj=1(n1)ni=1(PiOi)2(n p1)ni=1(OiO)2(6)OPop式中,n 为样点总数,p 为自变量数,Oi和 Pi为验证样点的实际值和预测值;和 分别为实际值与预测值的均值;和分别为实际值和预测值的标准差。2 结果与分析2.1安徽省土安徽省土壤壤 pH 分布特征分布特征样本土壤 pH 范围为 4.588.67,平均值为 6.37,变异系数为 18.19%,属于中等变异(表 1),总样本峰度0.90,偏度 0.51。皖南山地丘陵区土壤 pH 多为酸性或中性,沿江平原区
25、与皖西山地丘陵区有部分呈酸性或中性,其余地区多为碱性(图 2),安徽省土壤 pH 分布大致呈“南酸北碱”的格局。测试集和验证集总体数据分布相似,测试集样点空间分布相对较均匀(图 1)。对建模集的 108 个样点土壤 pH 进行空间自相关检验,其全局 Morans I 为 0.76(P 值 0.00),表明样点土壤 pH 存在极显著的全局自相关性。通过土壤 pH 的局部空间自相关聚类分析可知,研究区中有 33 个样点存在显著局部空间聚类。其中“高高”聚集点共 23 个(土壤 pH 值较高且空间差异较小的样点聚集分布)主要分布于淮河中游平原区,“低低”聚集点共 10 个(土壤 pH 值较低且空间差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 种地 加权 回归 方法 pH 空间 预测 制图 对比 研究 陈宣强
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。