基于GEE云平台和数据融合的地表覆盖产品制作方法.pdf
《基于GEE云平台和数据融合的地表覆盖产品制作方法.pdf》由会员分享,可在线阅读,更多相关《基于GEE云平台和数据融合的地表覆盖产品制作方法.pdf(7页珍藏版)》请在咨信网上搜索。
1、第54卷第8 期2023年8 月农业报机械doi:10.6041/j.issn.1000-1298.2023.08.020基于GEE云平台和数据融合的地表覆盖产品制作方法王宇林中云赵胜楠郭灵辉李亚龙任礼鹏(河南理工大学测绘与国土信息工程学院,焦作4540 0 0)摘要:地表覆盖产品是地理国情监测、生态系统评估、国土空间规划等活动的重要基础数据。GEE、PI E、微软行星云等遥感计算云平台具备丰富的数据源和强大算力。利用CEE云平台融合多套公开产品制作训练样本,可以显著降低产品更新的成本和周期,具有重要研究价值。本文以准河流域为例,将欧洲航天局(ESA)和美国环境系统研究所(ESRI)存储在GE
2、E平台上的2 0 2 0 年分辨率10 m地表覆盖产品作为训练样本数据源,选用Sentinel-1雷达和Sentinel-2多光谱影像构建特征空间,利用随机森林分类方法制作分辨率10 m的地表覆盖产品。为验证方法效果,进行了2 组对比实验。实验1随机抽取1116 个公开产品类别一致的样点作为训练样本,并通过目视解译方式验证本文产品与多套公开产品的精度。结果显示,本文产品总体精度为8 0.35%,相较于公开产品的总体精度提升2.898.94个百分点,局部刻画也更加精细;在Sentinel-2基础上加人雷达影像,总体精度提高3.52 个百分点,雷达影像辅助效果明显。实验2 设置8 组不同数量的训练
3、样本,并分别以人工判读、ESA、ESR I、D W、G l o b e La n d 30 为参考数据源,研究不同训练样本量和不同参考数据源对分类产品总体精度的影响。结果显示,随着训练样本不断增加,基于5种不同参考数据源的总体精度的提升幅度逐渐减小并趋于相对稳定。研究结果表明,借助CEE平台上的公开地表覆盖产品和海量遥感影像,可以快速提取高质量的训练样本,获得更高质量的分辨率10 m地表覆盖产品,该方法具有重要的实践推广价值。关键词:地表覆盖产品;Sentinel数据;GEE;数据融合;训练样本量中图分类号:TP751文献标识码:A文章编号:10 0 0-12 9 8(2 0 2 3)0 8-
4、0 2 11-0 7OSID:Production Method of Land Cover Data Based on GEE CloudPlatform and Data FusionWANG YuLIN ZhongyunZHAO Shengnan1(GUO LinghuiiLI YalongREN Lipeng(School of Surveying and Land Information Engineering,Henan Polytechnic University,Jiaozuo 454000,China)Abstract:Land cover data are importan
5、t basic data for activities such as geographic monitoring ofnational condition,ecosystem assessment,and land spatial planning.Remote sensing computing cloudplatforms such as GEE,PIE,and Microsoft Planetary Cloud have rich data sources and powerfulcomputing power.Using the GEE cloud platform to integ
6、rate multiple sets of public products to producetraining samples can significantly reduce the cost and cycle of product updates,which has importantresearch value.The Huaihe River Basin was taken as a research area.The 2020 10 m resolution landcover data stored on the GEE plaform by European Space Ag
7、ency(ESA)a n d En v i r o n me n t a l Sy s t e msResearch Institute(ESRI)were used as training sample data sources.Sentinel-1 radar and Sentinel-2multispectral images were selected to construct the feature space,and random forest classification methodwas used to generate a 10 m resolution land cove
8、r data.To validate the effectiveness of the method,twosets of comparative experiments were conducted.In experiment 1,totally 1 116 randomly selected samplepoints with consistent categories from ESA and ESRI products were used as training samples,and theaccuracy of the product and multiple sets of pu
9、blic products were verified through visual interpretation.The results showed an overall accuracy of 80.35%for the product,with an improvement of 2.89 8.94收稿日期:2 0 2 3-0 5-2 22修回日期:2 0 2 3-0 6-17基金项目:国家自然科学基金重点项目(U22A20620)、国家自然科学基金面上项目(419 7 12 7 4)、河南省科技攻关计划项目(2 12 10 2 310 0 2 8)和河南理工大学博士基金项目(B202
10、1-16)作者简介:王宇(19 9 0 一),男,讲师,博士,主要从事遥感云计算研究,E-mail:w a n g y u c h n w h u.e d u.c n通信作者:郭灵辉(19 8 3一),男,副教授,博士,主要从事气候变化与生态效应研究,E-mail:g u o l i n g h u i h p u.e d u.c n农2122023年机业报学械percentage points compared with the overall accuracy of the public products.It also provided a moredetailed depiction
11、of partial characteristics.By incorporating radar imagery with Sentinel-2,the overallaccuracy was improved by 3.52 percentage points,indicating the clear benefits of radar imagery as anauxiliary data source.Experiment 2 set up eight sets of training samples with different numbers,and usedmanual inte
12、rpretation,ESA,ESRI,DW,and GlobeLand30 as reference data sources to study the impactof different training sample sizes and reference data sources on the overall accuracy of classificationproducts.The results showed that as the training sample size was increased,the improvement in overallaccuracy bas
13、ed on the five different reference data sources gradually was decreased and reached arelatively stable level.The research results indicated that by utilizing public land cover data and massiveremote sensing images on the GEE platform,high-quality training samples can be quickly extracted toproduce h
14、igher quality 10 m resolution land cover data.The method had significant practical andpromotional value.Key words:land cover data;Sentinel data;GEE;data fusion;training sample size0引言地表覆盖(Land cover,LC)是地理国情监测)生态系统评估2 、国土空间规划3-4 等研究的重要基础数据。随着LC产品的增多以及影像获取能力的提高,人们对高质量LC产品的需求越来越大。训练样本的获取是遥感分类的重要环节,目视判
15、读精度高,但费时费力且依赖判读人员的专业素养。目前公开的LC产品数量和质量不断提高,为训练样本提供了重要数据源。以GEE、PIE、微软行星云为代表的遥感云平台的出现,极大简化了卫星影像的获取和预处理,云平台的海量数据和强大算力为LC制作及更新提供了有力支撑(5-7 。已有遥感分类研究主要集中在分类器和特征空间方面的改进8-1。也有研究通过现有LC产品的集成达到同样目的,集成方式多采用多数投票原则、决策树规则12 、积分原则13、半经验生成方法14等,少量的研究集成过程会借助卫星影像。以往遥感分类多基于多光谱影像,属于被动遥感,而雷达影像具有全天候观测、反映地物后向散射能力以及主动发射电磁波等特
16、点,在遥感领域被广泛应用115-17 。已有研究表明,融合光学、雷达影像对分类精度提升显著18-2 1。基于以上考量,本文综合运用LC产品集成、云计算平台以及主被动遥感的优势,提出一种基于遥感云平台和数据融合的10 m级LC制作方法。以准河流域为例,基于GEE平台将现有的2 套2 0 2 0 年的分辨率10 m产品(ESA和ESRI)进行集成处理得到训练样本,以2 0 2 0 年的Sentinel-1雷达影像和Sentinel-2多光谱影像为数据源,将光谱波段、光谱指数、极化波段和地形特征作为分类特征空间,制作新的LC产品。精度验证时分别采用目视判读和基于现有产品作为参考数据的方式进行评估。为
17、论证该方法的有效性,进行多组对比实验,分别验证不同影像数据源、不同训练样本量、不同验证样本数据源对分类精度的影响1数据源与数据预处理1.1研究区概况淮河流域涉及鄂、豫、皖、苏、鲁5省,位于黄河流域和长江流域之间,流域总面积约2.7 10 km,是中国人口最密集的地区之一2 。淮河流域是中国重要的粮食生产基地,其地形以平原为主,山地和丘陵地区分散在流域西部、西南部和东北部2 3(图1)。11230E1140E11530E1170E11830E1200E12130ENN,0.96N.0.96N,0Eot浙泽市施市开封市连云港市浦丘市许丹市徐州市招州吉门市健北宿迁市淮安市盐城市毛州市鲜埠市州市胜马店
18、市阜卓阳市淮南神州市扬州市通市信市大安市口市域DEM/m1750N,0.00080160-32N.O.0km11230E1140E11530E1170E11830E1200E图1淮河流域概况Fig.1Overviewof HuaiheRiver Basin随着经济快速发展和城镇化的需要,流域内资源被高强度开发,生态系统承受着巨大压力,耕地质量下降和退化等生态问题变得更加严峻,严重阻碍流域的可持续发展2 41。从人口、经济、生态3个角度考量,均有必要监测该地区的土地利用变化。1.2卫星数据源及预处理Sentinel-1包含 Sentinel-1A和 Sentinel-1B2颗卫星,搭载C波段合成
19、孔径雷达,分别于2 0 14年4月3日和2 0 16 年4月2 5日发射,重访周期为6 d,213王宇等:基于CEE云云平台和数据融合的地表覆盖产品制作方法第8 期可提供单极化和双极化数据2 5。本文采用GEE平台2 0 2 0 年的Sentinel1A 在宽幅模式(IW)下的VV和VH数据。该数据已经过多视处理、地形校正,只需在GEE平台利用Lee滤波算法消除斑点噪声。Sentinel-2卫星包含Sentinel-2A和Sentinel-2B2颗卫星,分别于2 0 15年6 月和2 0 17 年3月发射,重访周期为5 10 d。该卫星拥有可见光、近红外和短波红外在内的13个多光谱波段,其中4
20、个波段的空间分辨率为10 m,6 个波段的空间分辨率为20m,3个波段的空间分辨率为6 0 ml26。本文选取Sentinel-2的蓝、绿、红、近红外和2 个短波红外共6个波段。CEE在处理不同空间分辨率波段时默认进行最邻近重采样2 7 。GEE 所提供的 Sentinel-2数据已经过大气校正等预处理,只需进行去云操作。2研究方法2.1训练样本制作根据影像质量及准河流域地类状况,设置水体、林地、建筑用地、草地、耕地和裸地6 个类别。本文选取4种广泛使用的公开地表覆盖产品,用于训练样本制作和精度评估(表1)。表1不同产品的主要参数Tab.1Main parameters of differen
21、t products产品研究机构数据源空间分辨率/m第三方验证精度/%ESAWorldCover欧洲航天局Sentinel-1/Sentinel-21065(全球尺度)2 8 ESRILandcover美国环境系统研究所公司Sentinel-21075(全球尺度)2 8 Dynamic WorldGoogleEarth团队与世界资源研究所Sentinel-21072(全球尺度)2 8 77.15(中国30 个典型GlobeLand30国家基础地理信息中心Landsat TM/ETM+、H J-130城市区域)2 9 为便于展示,ESAWorldCover、ESR I La n d c o v
22、e r和DynamicWorld地表覆盖产品分别简称为ESA、ESRI和DW。首先通过GEE平台在研究区内布置随机点,对于类别一致性较低或研究区内覆盖度少的地类(如裸地和草地)适当增加随机布设的数量,以减弱各类地物样本不平衡分布对实验造成的影响。然后调用ESA、ESR I 地表覆盖数据集,依据两者产品的地物类型编码和类型含义,将类别转换成设置的6 类。分别提取ESA和ESRI的类别值后,挑选出两者类别一致的共1116 个样本点作为训练样本。2.2特征构建用于遥感分类的特征包括但不限于光谱、极化、指数、纹理、地形和时序特征等,本文选择VV和VH2种极化方式下的后向散射特征作为Sentinel-1
23、的分类特征。为提高分类精度,除了选择Sentinel2常用的光谱特征,还选取了对植被、建筑、水体等地物敏感的光谱指数,包括归一化植被指数(NDVI)、增强植被指数(EVI)、归一化水指数(NDWI),同时加人对建筑物敏感的IBI指数30 ,它由3个波段专题指数(土壤调节植被指数(SAVI)、归一化建筑指数(NDBI)以及改进归一化水体指数(MNDWI)计算得到,很大程度上提高了建筑用地提取精度。同时在GEE平台调用DEM数据,提取高程、坡度信息作为地形特征,加人到特征集合。2.3随机森林分类器随机森林(Randomforest,RF)是一种融合了随机子空间方法与Bagging集成学习思想的机器
24、学习算法31-32 。在训练设定数量的决策树时随机选取分类特征与训练样本,每棵决策树均互相独立,训练样本中未被抽取的样本作为测试样本验证模型的训练精度;模型训练完成后进行遥感分类,模型基于投票原则将多棵决策树的多个预测结果转换为票数最高的类别。这种方式使得模型获得了较高的精度和泛化性能。决策树数量作为RF的重要参数,并不是数量越多分类效果越好,数量过多容易出现过拟合现象,即模型在测试样本上精度很高,但在验证样本精度反而较差,模型泛化能力降低。因此在设置随机森林模型参数时需要综合考虑基于测试样本的分类精度和模型复杂程度。相比其他机器学习算法,RF模型训练时间少,鲁棒性较高,广泛应用于地表覆盖产品
25、制作33-343结果与分析3.1分类产品与公开产品的精度对比首先通过GEE平台融合ESA、ESR I 产品得到1116个类别一致的训练样本,然后对GEE平台存储的2 0 2 0 年所有Sentinel-1雷达影像进行热噪声消除处理,对Sentinel-2光学影像进行云掩膜,通过中值合成方法获得一期主、被动遥感数据,基于该数据构建特征空间;调用GEE平台内置的随机森林算法对输入的训练样本和分类特征进行训练;最后将训练好的RF模型应用于研究区整体,得到2 0 2 0年淮河流域地表覆盖数据(图2)。DWFSRTlaheTand3nS1+S2(木文产品)高洁影像农2142023年机业报学械林地草地耕地
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 GEE 平台 数据 融合 地表 覆盖 产品 制作方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。