基于Sentinel-2卫星遥感影像的巢湖及南淝河叶绿素a浓度反演.pdf
《基于Sentinel-2卫星遥感影像的巢湖及南淝河叶绿素a浓度反演.pdf》由会员分享,可在线阅读,更多相关《基于Sentinel-2卫星遥感影像的巢湖及南淝河叶绿素a浓度反演.pdf(9页珍藏版)》请在咨信网上搜索。
1、DOI:10.15928/j.1674-3075.202109170328收稿日期:2021-09-17修回日期:2023-02-14基金项目:国家自然科学基金(43971311);安徽省科技重大专项(201903a07020014)。作者简介:孙世举,1997年生,男,硕士研究生,研究方向为环境生态与资源管理。E-mail:通信作者:杨辉,1987年生,男,博士研究生,研究方向为深度学习遥感信息提取。E-mail:基于Sentinel-2卫星遥感影像的巢湖及南淝河叶绿素a浓度反演孙世举1,徐 浩2,吴艳兰1,3,4,吴鹏海1,3,杨 辉5(1.安徽大学资源与环境工程学院,安徽 合肥 2306
2、01;2.北京空间飞行器总体设计部,北京 100094;3.安徽省地理信息智能技术工程研究中心,安徽 合肥 230601;4.信息材料与智能感知安徽省实验室,安徽 合肥 230601;5.安徽大学物质科学与信息技术研究院,安徽 合肥 230601)摘要:叶绿素a是反映水生态环境污染状况的重要指标,定量反演叶绿素a浓度有助于及时监测水体营养状态变化,对富营养化水体治理具有重要意义。以巢湖及南淝河支流下游为研究区域,利用Sentinel-2卫星遥感数据源,构建其叶绿素a浓度反演模型,探究叶绿素a浓度的时空变化规律。结果显示,构建的深度神经网络(DNN)模型反演精度较高(R2=0.96,MRE=31
3、.62%,RMSE=24.4 g/L)。通过分析减少训练样本量对DNN模型精度的影响,发现训练样本较少时,模型仍具有较高的精度;根据其精度的敏感模型训练样本个数,将训练集按组等分,模型呈现较好的稳定性并具有一定的适用性。分析表明,研究区叶绿素a浓度在时间上呈现夏秋季上升、春冬季下降的规律,在空间上呈现湖区西高东低、局部近岸区分布较高的特点。关键词:叶绿素a;卫星遥感;浓度反演;巢湖;南淝河中图分类号:X835文献标志码:A文章编号:1674-3075(2023)04-0058-09近年来,淡水湖泊富营养化造成的藻类水华暴发问题日趋严重(钱瑞等,2022)。叶绿素a作为湖泊藻类中含量最多的色素,
4、可直观反映出湖泊营养状态,是湖泊水质监测的重要指标之一(高玉蓉等,2012)。水色遥感技术是通过分析遥感反射率与水色要素(如CODMn、Chl-a、Tss等)之间的关系,从而计算研究区域水色参数浓度(马荣华等,2009)。就水体藻类群落而言,其叶绿素a浓度会随着季节与水环境等因素的变化呈现出较大差异,但目前叶绿素a浓度反演模型在不同季节及不同水环境的适用性仍有待探讨(王波等,2022)。在数据源方面,常规叶绿素a遥感反演数据源主要包括Landsat-5及Landsat-8系列卫星(Yong et al,2018;Mamun et al,2021)、Sentinel系列卫星(Jiang etal
5、,2017)、高分一号系列卫星(徐鹏飞等,2020)、环境一号系列卫星(徐逸等,2019)、MODIS系列卫星(马荣华等,2009)、MERIS 影像数据(Mishra et al,2011)、Hyperion影像数据(杜聪等,2009)、SeaWiFs系列卫星(Hu et al,2011)及无人机高光谱影像数据(黄宇等,2020)。尽管上述数据源都可以针对区域叶绿素a浓度进行反演,但其时间及空间分辨率存在较大差异。相比之下,Sentinel-2系列卫星除拥有良好的空间分辨率外,还具有5日一次的重放周期,并且其在红光范围拥有3个波段数据,是探究水体叶绿素a反演的理想数据源(王行行等,2020;
6、Silveira et al,2020)。在遥感反演方面,传统经验方法是通过建立遥感数据与地面监测水质参数值之间的统计关系外推水质参数,缺少生物光学理论依据,对浑浊水体估算精度较差(安如等,2013;Zhang et al,2017)。半经验方法是将已知的水质参数光谱特征与统计模型相结合,选择最佳波段或波段组合作为相关变量估算水质参数值,而半分析方法主要以生物光学模型为基础,提高模型的反演能力(毕顺等,2018)。机器学习算法的引入,为遥感水质反演更深一步的研究提供了参考方向(Motoaki et al,2001;Naeini&Prindle,2018;David et al,2020)。但雨
7、生等(2020)利用BP神经网络对平寨水库叶绿素a浓度进行了估算,其BP神经网络模型精度较高,但仍存在需添加采样点个水 生 态 学 杂 志Journal of HydroecologyVol.44,No.5第 44 卷第 5 期2023年9月Sep.20232023 年第 5 期数及模型局限性的问题;Jia等(2020)采用多种机器学习共同构建研究区叶绿素a浓度反演模型,采用叠加回归法,避免了单一模型的不足,证明了基于聚类方法的可行性,但其预测数据与真实值存在一定差距,模型性能仍需进一步提升。Cao等(2020)研究表明,基于高宽波段数据反演湖泊中叶绿素a浓度的机器学习方法,为进一步提高模型反
8、演能力提供了更高的参考价值。巢湖是中国五大淡水湖之一,目前有关其叶绿素a浓度反演研究存在实地采样数据时间单一、数据量较少、构建模型精度不够高、不具备较强普适性等问题(荀尚培等,2011;陶慜等,2015;刘文雅等,2019;罗婕纯一等,2021),故针对巢湖需要更多的跨季或跨年实测数据以及更加精准、高效的算法模型对叶绿素a浓度进行反演。本文以巢湖及南淝河支流下游段为研究区域,基于5次不同时期的遥感影像数据和地面准同步实测叶绿素a浓度数据,尝试采用深度神经网络(DNN)学习算法,构建叶绿素a浓度反演模型;通过减少训练样本,探究其对模型精度的影响以及模型的稳定性和适用性,得到适合其反演的最佳模型,
9、以期为巢湖流域水环境营养状态的智能化动态监测提供科学依据。1 材料与方法1.1 研究区及数据1.1.1 区域概况 巢湖流域位于安徽省中部,处于长江和淮河两大水系中间,属于长江下游左岸水系(图1)。巢湖湖区(30.4231.72N,117.28117.86E)位于合肥市城区以南15 km。南淝河水系位于巢湖西端北部,流域面积1 700 km2,源头位于肥西县将军岭等丘陵地带,长70km,其主要支流有店埠河、四里河等。2020-11-132020-08-022019-12-272020-11-022020-06-25(a)南淝河(b)巢湖图1 巢湖及南淝河研究区域采样点Fig.1 Schemati
10、c diagram of the study area andlocation of sampling sites1.1.2 野外数据采集 野外采样信息如表1所示。分别于2018年8月2号、2019年12月27号、2020年6月25号、2020年11月2号以及2020年11月13号分5次对研究区水体进行采样,共采集有效点138个(图1),选择天气晴朗、湖面平静时采样,2018年7月31号及2020年6月25号两景影像在巢湖西部有云层遮挡,其余天气均无云。表1 野外实测数据及对应的遥感影像数据Tab.1 Field measurement data and correspondingdata f
11、rom remote sensing images采样时间2018-08-022019-12-272020-06-252020-11-022020-11-13样点数/个2528222340叶绿素a/gL-1最大值619.7598.991165.60168.0564.98最小值16.247.4411.699.4011.88均值118.1532.7658.0233.4719.66标准差173.5720.41261.7542.158.38采用分光光度法对水体叶绿素a浓度进行测量(Pyo et al,2017)。将一定量样品用滤膜过滤截留藻类,研磨破碎藻类细胞,用丙酮溶液提取叶绿素,离心分离后分别用于
12、750、664、647、630 nm波长处测定提取液吸光度,根据以下公式计算水中叶绿素a浓度:P1=11.85(A664-A750)-1.54(A647-A750)-0.08(A630-A750)Chl-a=P1V1/V式中:P1为试样中叶绿素a浓度,A630、A647、A664、A750分别为试样在630、647、664、750 nm波长的吸光值度,Chl-a为样品中叶绿素a浓度,V1为试样定容体积,V为取样体积。1.1.3遥感数据及预处理针对采样时间跨度较大及南淝河下游河道较窄问题,选择Sentinel-2系列卫星作为本研究影像数据,该卫星遥感影像数据通过欧空局官网下载(https:/sc
13、ihub.copernicu.eu/),是多光谱成像卫星,携带1枚多光谱成像仪(MSI),由同时运作的2A和2B卫星组成,使其重访周期缩短至5 d,具有较高的时间分辨率。其多光谱成像仪覆盖了13个谱段(4432 190 nm),4个可见光谱段和1个近红外谱段的空间分辨率达到了10 m,6个红光边缘谱段和短波红外谱段的空间分辨率达到了20 m,同时满足了高空间分辨率卫星影像的需求(刁瑞翔等,2021)。本文所选取的Sentinel-2A卫星遥感影像共 24 景,均保证天气条件较好、云层覆盖率小。将已下载的遥感影像使用SNAP软件的邻近像元法进行重采样至10 m,遥感影像的预处理通过ACO孙世举等
14、,基于Sentinel-2卫星遥感影像的巢湖及南淝河叶绿素a浓度反演592023 年 9 月水 生 态 学 杂 志第 44 卷第 5 期相关性Pearson correlation单波段或波段组合Single band or combined of bands-0.8B1图2 单波段或波段组合与叶绿素a浓度的相关性Fig.2 Correlation between chlorophyll-a concentration and single band and combined bands-0.6-0.4-0.200.20.40.60.81.0B2B3B4B5B6B7B8B8AB11B12B1+
15、B2B2+B7B3+B4B4+B6B5+B8B6-B2B7-B4B8-B1B4-B1B5-B3B3-B2B8A-B3B8A+B4B8A-B4B8/B3B2/B1B4/B2B6/B2B3/B2B5/B2B7/B2B8/B4B4/B1B6/B4B8/B6B8A/B4B8A/B2LITE 软件包进行(http:/odnature.naturalsciences.be/remsem/acolite/)。ACOLITE软件包中嵌入了暗光谱拟合算法进行大气校正,并得出Rrs(水像元的遥感反射率)的算法(Li et al,2019)。为尽量消减邻近效应对本研究的影响,采用掩膜处理方法对离岸2个像元以内的区域
16、加以裁剪,但不参与后续反演建模(毕顺等,2018)。1.2 敏感波段分析目前的水质参数反演一般选择Chl-a浓度敏感性较强的波段用于模型构建(DallOlmo,2006)。本研究的敏感因子采用代表性的单波段和双波段组合(孙昊和周林飞,2019;孙宏亮,2020),提取预处理之后影像各采样点的波段信息并加以组合,与实测叶绿素a浓度进行Pearson相关性分析,结果如图2。采用 B8A/B4、B6/B4、B8/B4、B7/B2、B8A/B2 以及B6/B2共计6个Pearson相关性系数高于0.85的波段组合,作为DNN模型及其他机器学习模型的输入。1.3 DNN网络模型神经网络是计算机科学领域中
17、人工智能的一个分支。从生物学角度来说,人工神经网络(Artificialneural network,ANN)是模拟人类大脑中神经网络的激活和信息传递模式,深度神经网络(Deepneural networks,DNN)是由ANN发展变化而来(Hinton&Salakhutdinov,2006)。本文以DNN为主体构建深度学习网络模型,将波段组合数据与实测数据合并后导入网络,最后输出到样本标记空间,实现模型的最终分类;该网络能分析波段数据与叶绿素a实测数据的特征关系,有效提升输入数据的复杂度,提高模型非线性拟合能力,进一步提升网络性能。将结果与预测值进行相对误差分析,作为反演叶绿素a浓度精度的评
18、价标准(逄淑娜等,2019)。从总样本中随机选取80%的采样点(110个)作为训练,剩余20%的采样点(28个)作为测试,提取出采样点的光谱反射率,采用相关性系数高于0.85的6种波段组合,结合实测水质数据作为模型的训练样本。由于网络层数过少不能很好地捕捉数据特征,因此本文通过增加隐藏层数来容纳更多的神经元,通过对每一层的输出增加一个激活函数来解决复杂的非线性问题,提高模型的特征提取能力。本文基于Keras框架经过大量实验并结合具体数据量,搭建4层结构的深度神经网络,如图3所示。其中隐藏层的节点数分别为256、128和32,输出层的节点数为1,图中Xtrain为DNN网络的输入,Xtrain=
19、x1,x2,x3,xn即n纬的列向量。网络通过在输入层对数据进行标准化处理,数据输入进行层间权重参量与阈值参量的计算既(wn,bn),通过Xtrain及Ytrain计算wn、bn。在本文的DNN网络中,每个隐藏层从前一层获得输入数据,经隐藏层提取特征,并利用Relu激活函数实现非线性表达,逐层依次迭代,确定学习率设置为0.001,损失函数使用mse,优化器使用adam,迭代次数设置为50次,最后导入回归评价指标,实现模型的训练。图3 深度神经网络结构Fig.3 DNN network structure diagram in this study602023 年第 5 期1.4 模型评价指标本
20、文利用模型相关性系数(Coefficient of determination,R2)、平均相对误差(Mean relative error,MRE)和均方根误差(Root mean square error,RMSE)对水质参数反演模型进行精度评价。R2是判断回归模型拟合程度高低最常用的指标,其表达公式如下:R2=i=1n()Ri-R2i=1n()Ri-R2MRE是相对误差的平均值,其表达公式如下:MRE=1ni=1n|Ri-RiRi 100%RMSE用于衡量预测值和实测值之间的偏差,其表达公式如下:RMSE=i=1n()Ri-Ri2n式中:n为数据的总个数,Ri为反演模型估测的叶绿素值,R
21、i为实测的叶绿素值,R为实测叶绿素平均值。2 结果与分析2.1 DNN模型精度使用20%的测试数据用于进行模型精度评价,以验证模型的精度。本次研究采用深度神经网络(DNN)方法建立叶绿素a反演模型的预测值与实测值对比结果见图4。实测值Measured value预测值Predicted value0.80.60.40.200.10.20.30.40.50.60.70.8R2=0.96MRE=31.62%RMRE=24.40g/L预测值实测值图4 深度神经网络叶绿素a反演模型Fig.3 Deep neural network model analysis2.2 方法对比为了验证DNN模型的有效性
22、,分别采用支持向量机(SVM)、随机森林(Random forest regressor)、梯度提升(Gradient boosting regressor)、极端随机树(Extra trees regressor)、XGBoost(eXtreme Gradientboosting)、K 近邻(K Neighbros regressor)、AdaBoost回归(AdaBoost regressor)、Bagging回归(Bagging regressor)共8种机器学习算法,构建巢湖及南淝河下游叶绿素a浓度反演模型,并进行上述模型对比与分析。机器学习模型的构建选取与DNN模型相同的波段组合输入
23、,采用8种机器学习方法建立叶绿素a反演模型的预测值与实测值对比,每个模型在反复进行参数调整测试后,结果如图5所示。通过多种不同机器学习模型发现,利用DNN及机器学习算法所构建的模型均拥有较好的性能,而DNN方法所构建的模型,具有最高的模型相关性系数、最低的平均相对误差及均方根误差。综上,DNN算法应为最优算法。为避免模型存在偶然性的问题,针对DNN模型及各种机器学习模型进行稳定性分析。2.3 训练样本量对模型精度影响样本量过少会影响深度学习效果(马岽奡等,2021;王子儒和李振民,2021)。为了验证DNN模型的稳定性,在保证测试集不变的情况下,分析样本个数对模型精度的影响,以训练集中的每5个
24、数据为1个单位,每次减少1个单位,并同时采用上述8种机器学习模型进行共同实验,结果如图6所示。随着训练集个数的不断减少,9种模型的R2均呈现持续下降趋势,其中DNN模型下降幅度最小,R2始终要高于其他机器学习模型。训练集数在11030个时,DNN模型R2保持在0.90以上;训练集数在25个时,R2下降至0.88;样本数为15个时,R2为0.81。故DNN模型整体精度较高,具有良好的稳定性。2.4 模型适用性基于2.3中训练样本量对模型精度的影响分析,分别采用30、25、15个采样点进行训练时,模型精度下降较大(约8%),确定影响其精度的敏感模型训练样本个数并进行实验。在保证测试集不变的情况下,
25、将训练集按30个/组、25个/组、15个/组分别分为3组、4组、6组,如图7所示;且测试点随机覆盖研究区,结果如表2所示。每 30 个采样点为一组进行模型构建,R2均值(0.8893)与每25个为一组的R2均值(0.8762)相差不大。每15个采样点为一组的R2均值(0.7993)相较前2组的下降幅度较大,但仍有较高的精度。故该模型可根据自身实际情况,为今后开展巢湖叶绿素a浓度采样时,所需人工采样点个数的把控及巢湖叶绿素a浓度的宏观观测提供参考依据。孙世举等,基于Sentinel-2卫星遥感影像的巢湖及南淝河叶绿素a浓度反演612023 年 9 月水 生 态 学 杂 志第 44 卷第 5 期预
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Sentinel 卫星 遥感 影像 巢湖 南淝河 叶绿素 浓度 反演
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。