基于BS-ResNeXt-50的密云地区野生动物图像识别.pdf
《基于BS-ResNeXt-50的密云地区野生动物图像识别.pdf》由会员分享,可在线阅读,更多相关《基于BS-ResNeXt-50的密云地区野生动物图像识别.pdf(11页珍藏版)》请在咨信网上搜索。
1、doi:10.11707/j.1001-7488.LYKX20220378基于 BS-ResNeXt-50 的密云地区野生动物图像识别齐建东1,2马鐘添1张德怀3田赟4(1.北京林业大学信息学院北京 100083;2.国家林业和草原局林业智能信息处理工程技术研究中心北京 100083;3.北京雾灵山保护区管理处北京 101506;4.北京林业大学水土保持学院北京 10083)摘要:【目的】以卷积神经网络为基础,对现有的网络结构进行改进,实现对红外相机拍摄的野生动物图像进行种类自动识别。【方法】构建从北京市密云区的北京市级雾灵山自然保护区 20142015 年期间采集到的 8 类 2 172 张
2、野生动物图像数据集,并使用随机增强策略从 14 个增强方案中随机选择增强方式,为图像数据添加噪声。使用 SENet 及BlurPool 构建了基于 ResNeXt-50 的改进网络:增强特征提取的 SE-ResNeXt-50、维持平移不变性的 BP-ResNeXt-50、结合二者的 BS-ResNeXt-50,并在自建数据集上测试了不同固定学习率、分段学习率及余弦退火学习率对 BS-ResNeXt-50 网络准确率的影响。使用 VGG16、ResNeXt-50、EfficientNet-B0、InceptionV3、DenseNet-121、BS-ResNeXt-50 网络在 CCT 公开野生
3、动物数据集中常见的 16 个类别图像上进行训练,并对单一物种的识别准确率进行比较。【结果】SE-ResNeXt-50 和 BP-ResNeXt-50 准确率分别达到了 75.16%0.14%和 73.74%0.13%。融合 SENet 以及 BlurPool 的改进方案 BS-ResNeXt-50 在自建数据集上测试的准确率达到 78.04%0.11%,为最优改进方案。使用余弦退火学习率后,BS-ResNeXt-50 的准确率提升至 81.54%,比固定学习率提升了 3.5%;分段学习率准确率达到 79.3%,与余弦退火学习率相差 2.24%。在 CCT 数据集中 BS-ResNeXt-50
4、的识别准确率可达 95.07%,比 ResNeXt-50 准确率高出 1.95%,同时也高于 VGG16 的85.5%、EfficientNet-B0 的 90.23%、InceptionV3 的 91.38%以及 DenseNet-121 的 93.3%准确率,并在各单一类别的预测准确率也均高于上述模型。单一类别的识别中除数量最少的类别外,BS-ResNeXt-50 在其他类别识别准确率均高于 90%,最高类别准确率达到 98.6%。【结论】改进后的 BS-ResNeXt-50 模型相比 ResNeXt-50 可以更准确地完成对野生动物图像的识别任务,在不同的野生动物图像数据集上也具有较好的
5、泛化能力。关键词:野生动物图像;物种识别;深度学习;卷积神经网络中图分类号:TP391.4文献标识码:A文章编号:10017488(2023)08011211Wildlife Image Recognition in Miyun District Based on BS-ResNeXt-50Qi Jiandong1,2Ma Zhongtian1Zhang Dehuai3Tian Yun4(1.College of Information,Beijing Forestry UniversityBeijing 100083;2.Engineering Research Center for For
6、estry-Oriented Intelligent Information Processingof National Forestry and Grassland AdministrationBeijing 100083;3.Management Office of Wulingshan Mountain Nature ReserveBeijing 101506;4.School of Soil and Water Conservation,Beijing Forestry UniversityBeijing 100083)Abstract:【Objective】In the wild e
7、nvironment,the background of wildlife images captured by camera traps is complex,which poses a challenge for identifying wild animals in images with a large number of images and a wide variety of wildlifespecies.Based on convolutional neural network,this research aims to improve the existing structu
8、re and so as to implement theautomatic recognition for wildlife images.【Method】In this study,2 712 wildlife images of 8 categories were taken from WulingMountain Beijing Nature Reserve,Miyun Districts,Beijing.The Auto Augment policy was randomly selected from 14augmentation policies to add noise to
9、the images.SENet and BlurPool were used to construct an improved network based onResNeXt-50:SE-ResNeXt-50 for enhancement feature extraction,BP-ResNeXt-50 for Shift-invariance maintenance,and BS-ResNeXt-50 for both.The influences of fixed learning rate,segmented learning rate,and cosine annealing le
10、arning rate on theaccuracy of the BS ResNeXt-50 network were tested on the self-built dataset.VGG16,ResNeXt-50,EfficientNet-B0,InceptionV3,DenseNet-121,and BS-ResNeXt-50 were used to train on 16 common categories of images in CCT public wildlife dataset,and therecognition accuracy of single species
11、was compared.e influences of fixed learning rate,segmented learning rate,and cosineannealing learning rate on the accuracy of the BS ResNeXt-50 network were tested on the self-built dataset.VGG16,ResNeXt-50,收稿日期:20220531;修回日期:20221021。基金项目:国家重点研发计划项目“典型人工林生态系统对全球变化适应机制”(2020YFA0608100)。第 59 卷 第 8 期林
12、业科学 Vol.59,No.82 0 2 3 年 8 月SCIENTIA SILVAE SINICAEAug.,2 0 2 3EfficientNet-B0,InceptionV3,DenseNet-121,and BS-ResNeXt-50 were used to train on 16 common categories of images in CCTpublic wildlife dataset,and the recognition accuracy of single species was compared.eXt-50 is used to test influence of
13、 differentlearning rate include fixed and CosineAnnealing learning rate on collected dataset.VGG16,ResNeXt-50,EfficientNet-B0,InceptionV3,DenseNet-121,BS-ResNeXt-50 were used for training on CCT dataset,and the recognition accuracy of single specieswas compared.on ResNeXt-50:SE-ResNeXt-50 for enhanc
14、ement feature extraction,BP-ResNeXt-50 for Shift-invariancemaintenance,and BS-ResNeXt-50 for both.The influences of fixed learning rate,segmented learning rate,and cosine annealinglearning rate on the accuracy of the BS ResNeXt-50 network were tested on the self-built dataset.VGG16,ResNeXt-50,Effici
15、entNet-B0,InceptionV3,DenseNet-121,and BS-ResNeXt-50 were used to train on 16 common categories of images in CCTpublic wildlife dataset,and the recognition accuracy of single species was compared.eXt-50 is used to test influence of differentlearning rate include fixed and CosineAnnealing learning ra
16、te on collected dataset.VGG16,ResNeXt-50,EfficientNet-B0,InceptionV3,DenseNet-121,BS-ResNeXt-50 were used for training on CCT dataset,and the recognition accuracy of single specieswas compared.【Result】The accuracy of SE-ResNeXt-50 and BP-ResNeXt-50 reached 75.16%0.14%and 73.74%0.13%,respectively.The
17、 enhanced scheme BS-ResNeXt-50,which integrated SENet and BlurPool,achieved an accuracy of78.04%0.11%when tested on a self built dataset,which was the best improved scheme.When the cosine annealing learning rateis used,the accuracy of BS-ResNeXt-50 was improved to 81.54%,which was 3.5%higher than th
18、at with the constant learning rate.The step decay learning rate achieved 79.3%accuracy,which was 2.24%less than the cosine annealing learning rate.Theclassification accuracy of BS-ResNeXt-50 was able to reach 95.07%,which was 1.95%higher than that of ResNeXt-50 on CCTdataset.At the same time,it was
19、also 85.5%higher than that of VGG16,91.38%higher than that of EfficientNet-B0,91.38%higher than that of InceptionV3 and 93.3%higher than that of DenseNet-121.The prediction accuracy of each single category wasalso higher than that of the above model.In the recognition of a single category,except for
20、 the least one category,the accuracy ofBS-ResNeXt-50 was 90%higher than that in other categories,and the highest category accuracy was 98.6%.【Conclusion】TheBS-ResNeXt-50 can more accurately complete the recognition task,and also has good generalization ability on different datasets.Key words:wildlif
21、e images;species recognition;deep learning;convolutional neural network 近年来,在气候变化、人为活动干扰等压力下,一些自然保护地面临生物多样性下降、栖息地丧失等严重威胁(束祖飞等,2021)。物种多样性是生物多样性的关键,野生动物物种减少,生物多样锐减,最终危害的是人类的幸福和健康(于莉莉,2017)。因此,野生动物保护工作越来越受到关注,调查、追踪野生动物生活习性是生物多样性保护的重要部分之一。野外环境条件复杂、天气多变,仅靠人工采集野生动物的图像较为困难,目前较常用的收集野生动物活动图像的方式是野外布设红外相机,对出现
22、的野生动物自动抓拍。这种方式的优点是可在不影响野生动物活动的前提下对野生动物个体及种群信息进行收集、分析。在实际工作场景中,一方面,红外相机拍摄的照片中有大量不包含野生动物的废片,单纯依靠人工从大量相片中挑选包含野生动物的相片,费时费力;另一方面,在包含动物的照片中,经常出现动物特别靠近相机或只拍摄到动物身体一部分、动物被周围环境遮挡、光照变化、一张照片里出现多个动物等情况(Gomezet al.,2017,Norouzzadeh et al.,2018),给图像的识别和分类造成了很大干扰。传统的图像识别问题主要使用 k 近邻、支持向量机、最大似然法等方式。这些方式都依靠人工进行特征提取,提取
23、出的特征通常只针对特定数据集有效,识别准确率有限,在实际应用中表现欠佳(张毓等,2021)。近年来,随着计算能力及数据量的提升,以卷积神经网络为代表的深度学习算法在图像分类、图像识别、语义分割等细分领域中取得了较大进展。具有代 表 性 的有 AlexNet(Krizhevsky et al.,2012)、VGG(Simonyan et al.,2014)、GoogLeNet(Szegedy et al.,2015)、ResNet(He et al.,2016)、DenseNet(Huang et al.,2017)、EfficientNet(Tan et al.,2019)等。在专门针对野 生
24、 动 物 图 像 识 别 的 研 究 中,Gomez 等(2017)对Snapshot Serengeti 数据集中的 26 种常见动物图像制作成了 4 个不同的数据集,测试了 AlexNet、VGGNet、GoogLeNet 以及不同层数的 ResNet 网络,并在最坏情况下达到了 35.4%的准确率,最好情况下达到了 88.9%的准确率。刘文定等(2018)提出了全局局部的双通道 VGG16 卷积,将数据集中的动物图像利用目标检测模型裁剪出来,将全局和局部图像同时传入到网络中最后再对预测结果取均值,结果表明和VGG16 相比,5 种动物的预测准确率平均高了 20%。Timm 等(2018)
25、第 8 期齐建东等:基于 BS-ResNeXt-50 的密云地区野生动物图像识别113 利用 ImageNet 和 iNaturalist 数 据 集 对 InceptionV3(Szegedy et al.,2016)模型进行预训练,在 2 000 张野生动物图像上进行迁移学习,2 个训练集训练出的预训练模型最终都达到了 75%的准确率。Willi 等(2019)使用 Snapshot Serengeti 数据集作为预训练数据集在ResNet-18 上进行训练,使模型在单一类别的准确率最高达到了 92.7%。Xie 等(2019)使用 SENet 进行增强特征提取,并与 ResNet 的残差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 BS ResNeXt 50 密云 地区 野生动物 图像 识别
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。