基于机器学习的沟谷地貌识别模型对比——以黄土高原典型流域为例.pdf
《基于机器学习的沟谷地貌识别模型对比——以黄土高原典型流域为例.pdf》由会员分享,可在线阅读,更多相关《基于机器学习的沟谷地貌识别模型对比——以黄土高原典型流域为例.pdf(9页珍藏版)》请在咨信网上搜索。
1、第3 7卷第4期2 0 2 3年8月水土保持学报J o u r n a l o fS o i l a n dW a t e rC o n s e r v a t i o nV o l.3 7N o.4A u g.,2 0 2 3 收稿日期:2 0 2 2-1 1-1 7 资助项目:国家自然科学基金项目(4 1 9 0 7 0 4 8);中央高校基本科研费专项(3 0 0 1 0 2 2 6 0 2 0 6)第一作者:范天程(1 9 9 7),男,硕士研究生,主要从事地貌遥感研究。E-m a i l:2 0 2 0 2 2 6 0 0 8c h d.e d u.c n 通信作者:赵建林(1 9
2、8 8),男,副教授,硕士生导师,主要从事土壤侵蚀与区域生态评价研究。E-m a i l:j i a n l i n.z h a o c h d.e d u.c n基于机器学习的沟谷地貌识别模型对比 以黄土高原典型流域为例范天程,汪珍亮,李云飞,贾云飞,袁 可,赵建林(长安大学地质工程与测绘学院,西安7 1 0 0 5 4)摘要:探索沟谷地貌空间分布与环境控制特征之间的联系并构建沟谷地貌准确提取模型,对大尺度范围沟谷提取具有重要意义。基于人工提取黄土高原典型流域沟谷地貌样本,结合不同时期的L a n d s a t 8O L I影像数据和D EM数据,建立随机森林模型确定黄土高原沟谷地貌提取最
3、佳影像时期和最佳组合特征,基于最优模型参数,对比其与支持向量机和人工神经网络沟谷提取模型效果,验证模型泛化能力。结果表明:(1)黄土高原沟谷提取的最佳影像时期为1 2月,最佳组合特征集为R e d、B l u e、H、S W I R 1、P N T、C o a s t a l、G L CM 4和N I R;(2)3种方法提取测试区域的沟谷空间分布一致,从定性和定量角度进行比较,随机森林模型提取效果最好,验证样区平均总体精度为8 0.4 8%,相较于支持向量机模型和人工神经网络模型分别提高4.0 0和8.6 3个百分比;(3)测试区域中,沟谷地貌面积约占总面积的5 6.9 1%,且呈现西北至东南
4、方向逐渐集中的特点。研究表明随机森林模型在黄土高原地区高精度沟谷地貌识别研究中综合表现最佳,可大范围推广。关键词:沟谷分布;机器学习;遥感影像;地形特征;黄土高原中图分类号:P 2 0 8 文献标识码:A 文章编号:1 0 0 9-2 2 4 2(2 0 2 3)0 4-0 2 0 5-0 9D O I:1 0.1 3 8 7 0/j.c n k i.s t b c x b.2 0 2 3.0 4.0 2 6C o m p a r i n g t h eP e r f o r m a n c eo fM a c h i n eL e a r n i n gM o d e l s f o r I
5、 d e n t i f y i n gG u l l yL a n d f o r m s-AC a s eS t u d yo faT y p i c a lW a t e r s h e do nt h eC h i n e s eL o e s sP l a t e a uF ANT i a n c h e n g,WANGZ h e n l i a n g,L IY u n f e i,J I AY u n f e i,YUANK e,Z HAOJ i a n l i n(C o l l e g eo fG e o l o g i c a lE n g i n e e r i n g
6、a n dG e o m a n t i c s,C h a n ga nU n i v e r s i t y,X ia n7 1 0 0 5 4)A b s t r a c t:E x p l o r i n gt h er e l a t i o n s h i pb e t w e e ns p a t i a ld i s t r i b u t i o na n de n v i r o n m e n t a lc o n t r o lc h a r a c t e r so fg u l l y l a n d f o r m s a n db u i l d i n ga
7、c c u r a t e e x t r a c t i o nm o d e l a r eo f g r e a t s i g n i f i c a n c e f o r g u l l y l a n d f o r m s e x t r a c t i o ni nl a r g es c a l e.B a s e do nt h ea r t i f i c i a l e x t r a c t i o no f g u l l y l a n d f o r ms a m p l e s c o m b i n gw i t hL a n d s a t 8O L I
8、 i m a g ed a t aw i t hd i f f e r e n tp e r i o d so f a n dD EMd a t ao f a t y p i c a lw a t e r s h e do nt h eC h i n e s e l o e s sp l a t e a u,t h e r a n d o mf o r e s tm o d e lw a s e s t a b l i s h e d t od e t e r m i n e t h eb e s t p e r i o d f o rg u l l y l a n d f o r m s e
9、 x t r a c t i o na n d t h eb e s t c o m b i n a t i o no fg u l l y i n g f e a t u r e s.T h e n,c o m b i n e dw i t h t h e o p t i m a lm o d e l p a r a m e t e r s,r e s u l t s o f r a n d o mf o r e s tw e r e c o m p a r e dw i t hs u p p o r t v e c t o rm a c h i n ea n da r t i f i c
10、i a ln e u r a ln e t w o r km o d e l t ov a l i d a t et h em o d e lg e n e r a l i z a t i o na b i l i t y.O u rr e s u l t ss h o w e d t h a t:(1)T h eb e s t i m a g ep e r i o d f o rg u l l ye x t r a c t i o nw a s i nD e c e m b e r,a n d t h eb e s t c o m b i n a t i o n f e a t u r e
11、s e tw a sR e d,B l u e,e l e v a t i o n(H),S W I R 1,p o s i t i v ea n dn e g a t i v et e r r a i n(P NT),C o a s t a l,t e x t u r e(G L CM 4)a n dN I R;(2)T h ed i s t r i b u t i o no f g u l l y l a n d f o r m s i nt h e t e s t i n ga r e ae x t r a c t e db y t h r e em e t h o d sh a dc
12、o n s i s t e n t l ys p a t i a l p a t t e r n.B a s e do nq u a l i t a t i v e l ya n dq u a n t i t a t i v e l ym o d e l l i n gp e r f o r m a n c e,t h er a n d o mf o r e s tm o d e lp r e s e n t e dt h eb e s t e x t r a c t i n gp e r f o r m a n c e,w i t ht h ea v e r a g eo v e r a l
13、 l a c c u r a c yo f8 0.4 8%,w h i c hw a sh i g h e rb y4.0 0p e r c e n t a g ea n d8.6 3p e r c e n t a g ec o m p a r e dw i t ht h es u p p o r tv e c t o rm a c h i n em o d e la n dt h ea r t i f i c i a ln e u r a ln e t w o r km o d e l,r e s p e c t i v e l y;(3)T h eg u l l yl a n d f o
14、r m sa c c o u n t e df o r5 6.9 1%o ft h et o t a lt e s t i n ga r e aa n dt h ed i s t r i b u t i o no fg u l l i e s i nt e s t i n ga r e aw a sg r a d u a l l yc o n c e n t r a t e df r o mn o r t h w e s tt os o u t h e a s t.T h er e s u l t ss h o wt h a tt h er a n d o mf o r e s tm o d
15、e lh a st h eb e s tc o m p r e h e n s i v ep e r f o r m a n c ei nt h es t u d yo fh i g h-p r e c i s i o ng u l l y l a n d f o r m s i d e n t i f i c a t i o no nt h eC h i n e s eL o e s sP l a t e a u,a n dc a nb ew i d e l ye x t e n d e d.K e y w o r d s:g u l l yd i s t r i b u t i o n;m
16、 a c h i n el e a r n i n g;r e m o t es e n s i n gi m a g e;t o p o g r a p h i c a lc h a r a c t e r s;C h i n e s eL o e s sP l a t e a u 黄土高原是世界上侵蚀最为严重的区域之一,强烈侵蚀过程造就了黄土高原“千沟万壑”的地貌特征,在所有侵蚀过程中,发生于沟谷地貌的沟蚀过程是该区域泥沙的主要来源。已有研究1表明,黄土高原地区当沟谷密度大于3 0%,小流域泥沙贡献超过7 5%。在世界范围内,沟谷侵蚀作为一种常见的自然现象,特别是在干旱半干旱地区,是导致土
17、地严重退化的主要原因之一,造成土壤质量下降、农业生产力降低和水生生物量减少等不利影响2。准确高效地获取黄土高原地区沟谷地貌空间分布对当地水土保持、泥沙控制、环境保护以及流域管理等领域具有重要意义。针对黄土高原地貌识别,国内学者开展了系列研究。其中,宏观上可将黄土高原地貌分为坡面和沟谷区域,基于尺度大小沟谷区可细分为细沟、浅沟、切沟、冲沟、坳沟和河沟等地貌类型。关于黄土高原侵蚀沟提取,早期研究主要基于单一高分辨率的D EM数据(5m及以上),采用多向阴影法3、地形开度和差值图像阈值分割法4等方法进行地貌的提取和分割。后来基于高分影像数据的提取方法逐渐普及,但因其存在严重的“同物异谱,同谱异物”现
18、象5,多数学者在侵蚀沟提取研究中同时加入了地形因子,常用方法有流向检测法6、定向边缘检测法7等。虽然这些研究能够获得分辨率较高的侵蚀沟地貌,但对高分辨率地形数据依赖程度高,因此相关试验多数为小尺度区域(0为径向核参数。除此之外,惩罚系数(C)为对误差的宽容度,C值过大导致模型出现过拟合,过小则出现欠拟合,合适的C值对预测结果影响较大2 4。本文将参数g a mm a和惩罚系数(C)取值设置为2-1 021 0,以2倍为间隔依次取值,采用网格搜索结合5折交叉验证方法确定最优参数2 1。模型预测结果是对高维空间中每个样本到分类超平面的距离进行S i g m o i d压缩,得到每个像元被预测为沟谷
19、的概率。1.3.3 人工神经网络 人工神经网络(a r t i f i c i a ln e u-r a ln e t w o r k,ANN)是模仿大脑神经网络结构和功能而建立的一种数学模型,只要参数选取合适并且数据训练足够多,就能很好地拟合非线性问题。其网络结构包括网络层数以及输入、输出和隐藏层个数,可以表示为2 5:ym=f(wm lxl+bm)(2)式中:xl和ym分别为输入因子和输出因子;wm l、bm和f分别为权重因子、偏差项和激活函数。已有研究2 6证明,1个3层神经网络模型(隐藏层只含1个全连接层),可以逼近任意非线性函数。对于模型参数的选取,输入层神经元个数为最优特征的个数,
20、输出层施加L o g i s t i c函数得到像元被预测为沟谷像元的概率,隐藏层的最优神经元个数采用试错法确定,其取值范围依据经验公式(3)确定,取5 0次平均值作为最后的评价精度确定最优参数。m=l+n+a(3)式中:m为模型隐藏层神经元个数;l为模型输入层神经元个数;n为输出层神经元个数;a为11 0的常数。1.4 区域特征1.4.1 特征初选 本文基于D E M数据和L a n d s a t8O L I影像数据获取训练区域和测试区域特征,包括光谱702第4期 范天程等:基于机器学习的沟谷地貌识别模型对比以黄土高原典型流域为例特征、植被特征、地形特征和纹理特征共2 6个特征,光谱特征为
21、L a n d s a t 8O L I影像预处理输出的前7个波段,同时基于波段运算得到4个植被指数(表1)。地形特征是沟谷提取研究中的重要特征。高程、坡度等都特征对区域植被和降水量造成影响,进一步影响沟谷空间分布。因此,本文选取高程(H)、坡度(S)作为研究沟谷分布的特征。除此之外,还基于D E M数据获取正负地形(p o s i t i v eo rn e g a t i v e t e r r a i n s,P N T)、汇流累积量(f l o wa c c u m u l a t i o na r e a,F AA)和距离河流距离(dr)3个特征,其中正负地形(P NT)反映的是地貌
22、相对于周围地貌的相对高低情况,由于沟谷地貌下切明显,与周边坡面地貌具有较明显的高低落差,因此该指标适合于沟谷提取的研究。纹理信息可以在一定程度上提高分类精度,参照侯蒙京等2 7的方法,本文利用灰度共生矩阵(g r e yl e v e l c o-o c c u r r e n c em a t r i x,G L CM)计算每个波段的8种纹理特征(均值M e a n、方差V a r i a n c e、同质度H o m o g e n e i t y、对比度C o n t r a s t、非相似性D i s s i m i-l a r i t y、熵E n t r o p y、角二阶矩A S
23、 M和相关性C o r r e l a-t i o n)得 到5 6个 纹 理 特 征,利 用 主 成 分 分 析 降 维(P C A),选取前1 0个主成分(G L CM 1-G L CM 1 0)作为本文研究的纹理特征。各特征信息描述见表1。表1 分类特征特征类型特征名称名称缩写计算方法或描述光谱特征波段依次为C o a s t a l(海岸波段)、B l u e(蓝波段)、G r e e n(绿波段)、R e d(红波段)、N I R(近红外波段)、S W I R 1(短波红外1)和SW I R 2(短波红外2)植被特征归一化植被指数N D V IN I R-R e dN I R+R e
24、 d增强植被指数E V I2.5*(R e d-G r e e nR e d+6*G r e e n-7.5*C o a s t a l+1)差值植被指数D V IR e d-G r e e n比值植被指数R V IR e dG r e e n地形特征高程H与D EM数据一致坡度S基于D EM数据获取正负地形P N T由D EM中每个栅格像元值和其55栅格范围内像元均值的差值计算获得汇流累积量F AA基于D 8单流向算法确定距离河流距离dr由F AA3 0 0生成区域河网,计算得到每个像元至河网的欧氏距离纹理特征灰度共生矩阵G L CMG L CM 1-G L CM 1 01.4.2 特征筛选
25、 相关研究1表明,沟谷分布与植被特征存在密切关系。因此为探讨沟谷和遥感影像月份之间的关系,本研究以基于11 2月每个月份的L a n d s a t 8O L I影像数据和D EM数据获取的特征作为1 2组 特 征 集。本 文 所 选3种 方 法(R F、S VM、ANN)中仅R F算法具备特征筛选的能力2 0,因此采用R F算法确定沟谷提取的最优月份遥感影像和特征子集,具体过程为:(1)以单月份为例,将1.1节获取的样本数据集按照73比例随机划分为训练集和测试集,基于训练集和2 6个特征建立随机森林模型,依据平均准确率减少(m e a nd e c r e a s ea c c u r a
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 沟谷 地貌 识别 模型 对比 黄土高原 典型 流域
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。