基于Stacking集成学习的猕猴桃叶片叶绿素含量估算.pdf
《基于Stacking集成学习的猕猴桃叶片叶绿素含量估算.pdf》由会员分享,可在线阅读,更多相关《基于Stacking集成学习的猕猴桃叶片叶绿素含量估算.pdf(10页珍藏版)》请在咨信网上搜索。
1、叶绿素含量能有效表征植物光合作用强度是反映植物生长状况的重要参量之一 以秦岭北麓壮果期猕猴桃叶片为研究对象分别测定其叶绿素含量和光谱反射率通过分析 范围内高光谱参数与叶绿素含量的相关性筛选出估测模型的输入特征选择随机森林、极限梯度提升树、近邻、算法和岭回归作为基模型线性回归作为元模型建立基于 集成学习的猕猴桃叶片叶绿素含量估算模型并通过网格搜索和交叉验证提高模型泛化能力将 模型与多个单一模型进行比较 结果表明:()不同叶绿素含量的猕猴桃叶片高光谱反射率变化趋势基本一致在 范围内呈现“一峰两谷一平台”的特点()各高光谱参数与猕猴桃叶片叶绿素含量相关性较好优化光谱指数和传统光谱指数中与叶绿素含量相
2、关性最高的分别是比值光谱指数(.)和红边位置(.)()与多个单一模型相比 集成模型的估算精度最高(.)同时其相对预测偏差(.)明显高于其他模型具有极好的预测能力本研究为快速、无损、精确地获取猕猴桃叶片叶绿素含量提供了新思路关键词:猕猴桃叶绿素含量高光谱 集成学习中图分类号:.文献标志码:(.):.:()“”.().(.)(.)()收稿日期:修回日期:基金项目:国家 计划项目()作者简介:符欣彤()女陕西宝鸡人硕士研究生研究方向为土地资源与空间信息技术:.通信作者:常庆瑞()男陕西子洲人教授博士生导师主要从事土地资源与空间信息技术研究:.(.).(.).:中国是全球主要的猕猴桃栽培和出口国之一
3、秦岭北麓和渭河河谷平原是我国猕猴桃优势产区猕猴桃产业为当地经济发展做出巨大贡献 叶绿素作为植物光合作用的必要物质其含量与植物营养和健康状态高度相关是监测植物生长状况的重要指标 因此快速获取猕猴桃叶片叶绿素含量()对及时调整和优化猕猴桃栽培管理具有重要意义近年来高光谱技术以其快速、有效、无损监测的优势在植物叶绿素含量估测方面得到广泛应用 目前国内外学者对植物叶绿素含量的高光谱估算研究主要集中在两个方面:一方面是以原始光谱及各种变换光谱筛选的特征波段作为自变量建立估测模型 如 等利用不同氮营养条件下的高光谱特征波段建立了高性能绿茶叶绿素含量估算模型 等建立了基于一阶微分光谱特征波段的烟草 估算模型
4、郭松等研究了不同变换光谱的特征波段与玉米叶绿素含量之间的相关关系 另一方面是利用光谱指数进行叶绿素含量估算 何桂芳等发现利用比值植被指数建立的模型精度最高可以实现石楠 的准确估算 等发现红边叶绿素吸收指数/三角植被指数对小麦叶绿素含量的反演性能最好彭晓伟等通过分析不同植被指数与叶绿素含量的相关性构建了谷子叶绿素含量估测模型 可见基于高光谱反射率信息的作物叶绿素含量估算研究已较为成熟但研究对象主要集中在小麦、玉米、水稻、棉花等大田作物针对经济树木尤其是猕猴桃树的研究相对较少 同时大多数研究都是基于单一模型很难全面反映叶绿素含量的变化特点容易出现估测精度不高、泛化性能不佳等问题 神经网络和决策树等
5、传统机器学习模型拟合精度与参数设置密切相关往往训练集效果较好但测试集表现欠佳 集成学习策略通过将多个弱学习器集成强学习器来提高模型的准确性和鲁棒性在柑橘叶片氮含量估算、夏玉米覆盖度估测、苜蓿产量估算等研究中表现较好本研究以秦岭北麓国家杨凌农业高新技术产业示范区猕猴桃为对象通过分析猕猴桃叶片叶绿素含量()与各高光谱参数间的相关性筛选模型的输入特征集成随机森林、极限梯度提升树等 种学习器构建基于 集成学习的猕猴桃 估算模型并与其他单一模型进行对比以验证模型有效性旨在实现对猕猴桃 的准确估算进而为猕猴桃生长信息的快速获取和果园精细化管理提供技术支持 材料与方法.研究区概况和样本采集试验区位于陕西省杨
6、凌农业高新技术产业示范区五泉镇蒋家寨村()地处秦岭北麓渭河河谷平原 该地区地形平坦土壤肥沃海拔高度 属于暖温带半湿润大陆性季风气候 年平均温度.年均降水量.年均日照时数 .具有夏热多雨、冬寒干燥、春暖多风等明显的大陆性季风气候特征适宜猕猴桃种植采样时间为 年 月 日此时正值猕猴桃壮果期 在试验区选取栽植年限超过 的健康无病害猕猴桃园 个果树品种均为徐香 每个猕猴桃园选取 株健康果树作为样点每个样点分别采集不同方位、不同长势的 片健康叶片个样点共 片 叶片采集后迅速用密封袋封装放置在保鲜箱内运回实验室进行光谱反射率与叶绿素含量测定.项目测定.叶片高光谱反射率测定猕猴桃叶片高光谱反射率采用便携式非
7、成像地物光谱仪 (公司美国)测定光谱探测范围为 其中 、光谱分辨率分别为.、.和.为保证试验的科学性和数据的可靠性光谱测定前进行多次白板校正直到校正结果稳定并用纸巾将叶片擦拭干净不附着泥土、灰尘等杂质 按照编号依次将叶片平整置于叶片夹上从叶柄至叶尖分段选择 个部位各测量 次(避开叶脉)每个叶片均可获得 条高光谱反射率曲线每 干旱地区农业研究 第 卷个样本 个叶片共获得 条高光谱反射率数据取其平均值作为该样点叶片的最终高光谱数据.叶绿素含量测定采用分光光度计法测定光合色素含量将光谱采集后的叶片洗净避开叶脉选取中间部分剪成碎条每个样本.加入浓度乙醇置于暗处浸提 至叶片发白过滤 定容 用分光光度计分
8、别测定、波长的吸光度再依据公式计算叶绿素含量().研究方法.光谱数据处理叶片色素对光谱反射率的影响主要集中在可见光范围所以本研究以 范围的高光谱反射率数据为基础进行猕猴桃 估算 首先利用光谱仪自带软件对高光谱数 据 重 采 样 到 然 后 利 用 滤 波 法()对重采样后的高光谱数据进行平滑处理 滤波与其他光谱平滑方法相比能更有效地保留光谱的变化信息最后对平滑后的光谱进行一阶导数变换得到猕猴桃叶片一阶导数光谱.光谱参数选取 为削弱环境因素的影响常采用特征波段、三边参数和植被指数等光谱参数描述作物的光谱响应特征 首先分析猕猴桃叶片原始光谱反射率与 之间的相关性选取相关关系满足显著性检验(.)的敏
9、感区域作为输入量 作为响应量以 最小为原则通过编程实现连续投影算法()从敏感区域中筛选出特征波段 是一种新兴的降维方法实现光谱大幅度降维的同时能够保证特征波段之间共线性最小近年来其在作物高光谱信息的研究中应用广泛不同波段光谱反射率以加、减、乘、除等运算构建的光谱指数具有降低背景噪声干扰、突出植物生长特征的优点 本研究主要从两个方面选取光谱指数一是在前人研究基础上选取了与 相关性较好的传统光谱指数二是利用 软件构建了一阶导数光谱敏感区域内任意两波段组合的 类优化光谱指数即比值()、差值()、归一化()光谱指数并计算这 类优化光谱指数与猕猴桃 间的相关系数()根据 最大原则筛选基于各波段组合的优化
10、光谱指数进行研究 本研究所选择的 类传统光谱指数和构建的 类优化光谱指数见表 表 光谱指数及其计算公式或定义 类型光谱指数 计算公式或定义 优化光谱指数 比值光谱指数/差值光谱指数 归一化光谱指数()/()传统光谱指数 归一化叶绿素指数()/()改进叶绿素吸收反射率指数().()(/)绿色归一化光谱指数()/()修正三角光谱指数.().()修正归一化光谱指数()/()土壤调节指数.()/(.)红边位置 内一阶导数光谱最大值所对应的波长位置 红边面积 内一阶导数光谱所包围的面积 红边振幅 内一阶导数光谱最大值 红边最小振幅 内一阶导数光谱最小值 红边对称度 左侧面积占整个红边面积的比例 第 期
11、符欣彤等:基于 集成学习的猕猴桃叶片叶绿素含量估算.集成学习模型构建 是一种通过元模型将多个基模型进行组合的集成算法本质是一种并行结构的多层学习系统其学习框架有初级学习器和次级学习器两级在训练阶段次级学习器由初级学习器产生 集成学习对模型的鲁棒性和泛化能力有显著提高由于 模型最终效果受到基模型的影响因此基模型应有较好的学习能力且各基模型间相互独立本研究选择随机森林()、极限梯度提升树()、近邻()、算 法()和岭回归()为基模型以线性回归()为元模型构建猕猴桃 估算模型 是通过集成学习的思路将多棵树集成的一种算法基本单元是决策树具有高度并行化和泛化能力强的优势 是 算法的一种实现方式适用于回归
12、和分类优点是支持自定义损失函数从而减小训练过程中目标值和真实值之间的偏差 算法的基本思想是找出一个样本的 个最近邻居通过计算其属性的平均值得到估算结果该算法有成熟的理论和广泛的应用相比于其他 算法 增加了梯度单边采样()和互斥特征绑定()可以在小样本情况下获得高精度预测结果 常用于处理多重共线性问题是对普通最小二乘法的深化通过改变正则化项系数来控制减少特征变量系数的程度从而避免过拟合基于 集成学习的猕猴桃 估算模型构建过程如图 所示具体步骤如下:()将猕猴桃叶片高光谱特征数据集划分为原始训练集 和测试集 按照五折交叉验证将训练集样本随机分为 个子集(、)图 集成学习算法构建.干旱地区农业研究
13、第 卷()选择一种基模型进行训练利用、中样本建立模型对 和 中样本进行预测得到 的预测值 和 的预测值()利用、中样本建立模型对 和 中样本进行预测得到 的预测值 和 的预测值 以此类推得到训练集样本 的预测结果(由、合并得到)测试集 的预测结果(由、取均值得到)()选择其他基模型重复步骤()、()分别得到 的预测结果、和 的预测结果、()将第一层得到的结果合并获得新的训练集 和新的测试集 将 和 作为元模型的输入特征进行第二层模型的训练最终得到猕猴桃 的估测结果实现对基模型学习能力的综合本研究数据处理及建模在 、和 .中完成为缓解小样本的过拟合问题采用网格搜索和 折交叉验证训练模型模型网格搜
14、索结果见表.评价指标分别采用决定系数()、均方根误差()、平均绝对误差()和相对预测偏差()共 个指标对预测模型进行评价越接近 和 越小说明模型拟合程度越优模型越准确 能衡量模型估算值和实际值之间的偏差程度当.时认为模型不具备预测能力当.时模型只能对样本进行粗略估计当.时模型预测结果较好当.时模型预测结果很好当.时模型具有极好的预测能力 ()式中 为训练集或测试集样本的数量和 分别为第 个样本的估算值和实际值 为标准偏差 结果与分析.猕猴桃 统计分析及光谱响应.猕猴桃 特征 采用分层抽样将 年猕猴桃壮果期 个样本按照 划分为训练集 个样本和测试集 个样本 猕猴桃 全部、训练和测试样本的基本统计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Stacking 集成 学习 猕猴桃 叶片 叶绿素 含量 估算
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。