基于多元经验模态分解的可见_近红外光谱识别木材研究.pdf
《基于多元经验模态分解的可见_近红外光谱识别木材研究.pdf》由会员分享,可在线阅读,更多相关《基于多元经验模态分解的可见_近红外光谱识别木材研究.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 39 卷 第 4 期2023 年 7 月森 林 工 程FOREST ENGINEERINGVol.39 No.4Jul.,2023doi:10.3969/j.issn.1006-8023.2023.04.012基于多元经验模态分解的可见/近红外光谱识别木材研究付立岩,冯国红,刘旭铭(东北林业大学 机电工程学院,哈尔滨 150040)摘 要:基于可见/近红外光谱技术探究一种快速、准确的木材识别方法。以 8 种进口木材为研究对象,运用多元经验模态分解(MEMD)和最大互信息系数(MIC)的方法对采集的光谱数据进行分解、筛选和重构,进而利用连续投影法(SPA)进行特征波段提取,再结合 XGBoo
2、st 分类器进行分类识别。为进一步验证该方法的可行性,将提出的木材识别方法分别与经验模态分解(EMD)算法和传统的支持向量机(SVM)、K 近邻分类算法(KNN)、BP 神经网络(Back Propagation Neuron NetWok)分类器进行对比分析。结果表明,MEMD 方法对可见/近红外光谱去噪效果优于 EMD 去噪方法;MEMD-SPA-XGBoost 相比 MEMD-SPA-SVM 的识别准确率为90%、MEMD-SPA-KNN 的88%、MEMD-SPA-BP 的89.2%,平均识别准确率达到了96.5%。可见,该方法在木材识别方法中具有很好的应用前景。关键词:可见/近红外光
3、谱;木材识别;多元经验模态分解;连续投影法;XGBoost中图分类号:S781.1 文献标识码:A 文章编号:1006-8023(2023)04-0101-09Wood Recognition by Visible/Near Infrared Spectroscopy Based on Multivariate Empirical Mode DecompositionFU Liyan,FENG Guohong,LIU Xuming(College of Mechanical and Electrical Engineering,Northeast Forestry University,Har
4、bin 150040,China)Abstract:A fast and accurate wood identification method based on visible/near infrared spectroscopy was explored.Taking 8 kinds of imported wood as the research object,multivariate empirical mode decomposition(MEMD)and maximum mutual information coefficient(MIC)were used to decompos
5、e,screen and reconstruct the collected spectral data,and then the continuous projection method(SPA)was used to extract the feature bands,and combined with XGBoost classifier for classification and recognition.In order to further verify the feasibility of the proposed method,the wood recognition meth
6、od was compared with empirical mode decomposition(EMD)algorithm,traditional support vector machine(SVM),K-nearest neighbor classification algorithm(KNN)and BP Neural network(Back Propagation Neural Network)classifier.The results showed that MEMD method was better than EMD method for visi-ble/near in
7、frared spectrum denoising.Compared with 90%of MEMD-SPA-SVM,88%of MEMD-SPA-KNN and 89.2%of MEMD-SPA-BP,the average recognition accuracy of MEMD-SPA-XGBoost reached 96.5%.It can be seen that this method has a good ap-plication prospect in wood identification method.Keywords:Visible/near-infrared spect
8、rum;wood identification;multivariate empirical mode decomposition;continuous projec-tion method;XGBoost收稿日期:2022-11-27基金项目:中央高校基本科研业务费专项资金项目(2572020BL01);黑龙江省自然科学基金资助项目(LH2020C050)第一作者简介:付立岩,硕士研究生。研究方向为木材种类识别研究。E-mail:1139967801 通信作者:冯国红,博士,副教授。研究方向为木材种类识别。E-mail:fgh_1980 引文格式:付立岩,冯国红,刘旭铭.基于多元经验模态分解
9、的可见/近红外光谱识别木材研究J.森林工程,2022,39(4):101-109.FU L Y,FENG G H,LIU X M.Wood recognition by visible/near infrared spectroscopy based on multivariate empirical mode decompositionJ.Forest Engineering,2023,39(4):101-109.0 引言近几年国家为保护森林资源,全面禁伐,导致我国木材产量难以满足市场需求,需从国外大量进口木材1。然而进口木材种类繁多,难以辨别,以次充好的事情屡见不鲜,如何高效、准确地识别进
10、口木材变得十分有意义。传统木材识别主要依靠专家观察、DNA 法和计算机图像法等2-4。但这些方法常常需要对样本进行切片等操作,普适性不高且周期长,易造成浪费,甚至降低珍贵进口木材的价值。光谱法是一种无损检测方法,具有高效、便捷和无污染等优点5,近几年,已成为木材识别领域的研究热点。汪紫阳等6基于可见/近红外光谱对生长在东北地区的多种木材进行了有效识别。明曼曼等7运用近红外光谱技术结合优化后的 BP 神经网络对木材进行了识别,识别效果最高可达到95.33%。在应用光谱法进行木材识别研究中,由于光谱数据采集的过程中存在很多不可控因素,往往森 林 工 程第 39 卷会产生影响识别结果的无用信息,因此
11、需采用一定的预处理方法进行降噪。目前常采用的光谱预处理方法主要有导数处理、多元散射校正8等,多元经验模态分解(MEMD)针对信号去噪具有良好的效果,在生物医学、故障诊断等领域得到了非常广泛的应用9-10,但在木材识别领域未见相关报道。同时,应用光谱法识别木材时,目前多采用支持向量机(SVM)、BP 神经网络(Back Propagation Neuron NetWok)等11-14传统算法研究分类问题,这些算法在处理多分类问题中易过拟合,陷入局部最优,通常还需要结合其他方法弥补自身缺点。XGBoost(Extreme Gradient Boosting)是一种梯度提升算法,在机器学习领域有着广
12、泛的应用,在处理大规模数据集时速度快、效果好,相比传统模型鲁棒性更强,一般不需要精细调整便能取得很好的结果。本研究基于 MEMD 和 XGBoost 对木材识别进行了研究。以 8 种进口木材为研究对象,应用可见/近红外光谱建立进口木材识别模型。首先运用MEMD 和最大互信息系数(MIC)的方法对采集的光谱数据进行分解、筛选和重构,进而利用连续投影法(SPA)进行特征波段提取,再结合 XGBoost 分类器对进口木材进行识别,以期为可见/近红外进口木材识别方法提供新的参考。1 实验与方法1.1 仪器设备和数据采集仪器设备:美国 ASD 公司的 LabSpec 5000 光谱仪,采用Indico
13、Pro Version 3.1 软件采集波长为3502 500 nm 的可见/近红外光谱数据。数据采集:本次试验选择大果紫檀(Pterocarpus macrocarpus Kurz)、檀香紫檀(Pterocarpus santalinus L.f)、血檀(Pterocarpus tinctorius Welw)、巴里黄檀(Dalbergia bariensis Pierre)、破布木(Cordia dichoto-ma Forst.)、中美洲黄檀(Dalbergia granadillo Pitti-er)、刺猬紫檀(Pterocarpus erinaceus Poir)和红檀香(Myrox
14、ylon balsamu)共 8 种进口木材作为实验对象,每种木材样本大小为 6 cm4 cm2 cm 的木块,每一类木材制作 5 个样本,分别用数字 15 进行标号,共计 40 个样本块。把每个木块横向 2 等分,纵向 5 等分,取等分线交点为采样点,这样一个木块取10 组实验数据,8 种木材共采集 400 组实验数据。1.2 多元经验模态分解MEMD 是在经验模态分解(EMD)基础上作了进一步扩展的方法15。其原理是将原始数据映射到不同方向向量上,形成实值投影数据的多元包络,通过计算多元包络的均值来获取原始信号的局域均值,具体方法如下。1)在(n-1)维的球面上利用 Hammersley
15、序列采样法均匀采样,得到 K 组方向向量。2)设输入信号(v(t)Tt=1=v1(t),v2(t),vn(t),时刻为 t,通道数为 n,信号长度为 T,xk=(xk1,xk2,xkn)是对应在(n-1)维球面中方向角 k=k1,k2,kn-1 的方向向量集。3)计算(v(t)Tt=1在 K 组方向向量 xk上的映射集 pk(t)Kk=1,其中投影集为 p,方向角为 k,时刻为 t,量测组数为 K。4)求得映射集 pk(t)Kk=1极值对应的时间点tki,其中时间点为 t,极值点序号为 i,方向角为 k。5)对tki,v(tki)进行多元样条插值,获取包络曲线 ek(t)Kk=1。6)计算整组
16、方向向量包络曲线的均值 m(t),见式(1),其中 K 表示量测方向向量组数,ek(t)为第 k 个包络线值。m(t)=1kKk=1ek(t)。(1)7)按照 d(t)=v(t)-m(t)获得信号剩余量d(t),如果 d(t)上包络和下包络的均值近似等于零或者满足特定准则,则判定其是一个本征模态函数,否则返回第二步重新计算。采用多元经验模态分解对输入信号 v(t)进行分解,得到 M 个不同频率的 IMF(IMF 为复杂数据分解的本征模态函数,代表着原始数据的局部特征,一般由高频到低频依次排列),见式(2)v(t)=Mm=1Cm-(t)+r-(t)。(2)式中:Cm-(t)为第 m 个 IMF;
17、r-(t)为分解残差。1.3 最大互信息系数法最大互信息系数(MIC)是一种度量数据之间关联程度的方法,相比常用的互信息(MI)方法,具有更高的精准度和鲁棒性。假设随机变量 X、Y,则其MIC 的主要计算步骤如下。1)给定 a、b,对 X、Y 构成的散点图进行 a 列 b行网格划分,计算出最大互信息值。2)把最大互信息值进行归一化处理,转变到(0,1)之间。3)选择不同尺度下互信息的值作为 MIC(公式201第 4 期付立岩,等:基于多元经验模态分解的可见/近红外光谱识别木材研究中用 MIC)的结果,见式(3)MIC(x;y)=maxab 1num_boost_round迭代次数101num_
18、class类别数目822.4.2 分类结果本研究将 8 种进口木材分别用数字进行标识:0代表巴里黄檀,1 代表大果紫檀,2 代表红檀香,3 代表中美洲黄檀,4 代表刺猬紫檀,5 代表破布木,6 代表檀香紫檀,7 代表血檀,模型最终以 07 作为输出结果。根据表 5 设置 XGBoost 的相关参数,将本文的400 份样本,按照 9 1 的比例随机产生训练集和测试集,在模型训练优化后,对测试集进行 10 次随机分类测试,结果见表 6。由表 6 可以看出,10 次测试的平均识别准确率为 96.50%,最高可达到 100%。同时,绘制每次测试得到的混淆矩阵,部分结果见表 7。由表 7 可以看出,对角
19、线上的数值代表分类正确的个数,除第 2 类测试样本出现 1 个分类错误,其余测试样本类别均能被正确识别,分类效果好。表 6 分类结果Tab.6 Classification results测试次数Number of tests识别准确率(%)Recognition accuracy197.5295.03100.0495.0595.0695.0797.5895.0997.51097.5平均Average96.5表 7 混淆矩阵Tab.7 Confusion matrix预测Forecasting012345670300000001060000002007001003000700004000050
20、005000003006000000607000000022.5 对比分析2.5.1 与经验模态分解方法的对比EMD 和 MEMD 其基本原理存在一定的相似性,MEMD 是以 EMD 为基础扩展而来21-23,为了验证 MEMD 方法相比 EMD 的优越性。本节研究过程同 2.2、2.3、2.4,采用 EMD 对光谱数据进行预处理,同时为了进一步验证 MIC 筛选阈值设定的大小对分类结果的影响,由表 2 可以看出,高频部分的前4 个 IMF 求得的 MIC 结果主要集中在 0.20.3,为此设定筛选阈值为 0.3 与本文选择的 0.5 进行对比分析,最终结果见表 8。由表 8 可以看出,采用
21、EMD预处理的分类模型准确率最高为 87.5%,而采用MEMD 方法的分类准确率最低可达到 92.5%。除此之外 MIC 筛选阈值设定为 0.5 得到的结果要比0.3 好很多,最高可以达到 96.5%分类准确率。因701森 林 工 程第 39 卷此可以证实 MEMD 相较 EMD 而言更优,同时,当筛选阈值设定为 0.5 时,MEMD-SPA-XGBoost 的分类效果最佳。表 8 EMD、MEMD 在不同阈值系数下分类准确率对比Tab.8 The classification accuracy comparison of EMD and MEMD under different thresh
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多元 经验 分解 可见 红外 光谱 识别 木材 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。