分销赏收藏举报申诉 / 11

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于BS-ResNeXt-50的密云地区野生动物图像识别.pdf

基于BS-ResNeXt-50的密云地区野生动物图像识别.pdf

上传人：自信****多点

文档编号：2012826

上传时间：2024-05-13

格式：PDF

页数：11

大小：6.25MB

《基于BS-ResNeXt-50的密云地区野生动物图像识别.pdf》由会员分享，可在线阅读，更多相关《基于BS-ResNeXt-50的密云地区野生动物图像识别.pdf（11页珍藏版）》请在咨信网上搜索。

1、doi：10.11707/j.1001-7488.LYKX20220378基于 BS-ResNeXt-50 的密云地区野生动物图像识别齐建东1,2马鐘添1张德怀3田赟4（1.北京林业大学信息学院北京 100083；2.国家林业和草原局林业智能信息处理工程技术研究中心北京 100083；3.北京雾灵山保护区管理处北京 101506；4.北京林业大学水土保持学院北京 10083）摘要：【目的】以卷积神经网络为基础，对现有的网络结构进行改进，实现对红外相机拍摄的野生动物图像进行种类自动识别。【方法】构建从北京市密云区的北京市级雾灵山自然保护区 20142015 年期间采集到的 8 类 2 172 张

2、野生动物图像数据集，并使用随机增强策略从 14 个增强方案中随机选择增强方式，为图像数据添加噪声。使用 SENet 及BlurPool 构建了基于 ResNeXt-50 的改进网络：增强特征提取的 SE-ResNeXt-50、维持平移不变性的 BP-ResNeXt-50、结合二者的 BS-ResNeXt-50，并在自建数据集上测试了不同固定学习率、分段学习率及余弦退火学习率对 BS-ResNeXt-50 网络准确率的影响。使用 VGG16、ResNeXt-50、EfficientNet-B0、InceptionV3、DenseNet-121、BS-ResNeXt-50 网络在 CCT 公开野生

3、动物数据集中常见的 16 个类别图像上进行训练，并对单一物种的识别准确率进行比较。【结果】SE-ResNeXt-50 和 BP-ResNeXt-50 准确率分别达到了 75.16%0.14%和 73.74%0.13%。融合 SENet 以及 BlurPool 的改进方案 BS-ResNeXt-50 在自建数据集上测试的准确率达到 78.04%0.11%，为最优改进方案。使用余弦退火学习率后，BS-ResNeXt-50 的准确率提升至 81.54%，比固定学习率提升了 3.5%；分段学习率准确率达到 79.3%，与余弦退火学习率相差 2.24%。在 CCT 数据集中 BS-ResNeXt-50

4、的识别准确率可达 95.07%，比 ResNeXt-50 准确率高出 1.95%，同时也高于 VGG16 的85.5%、EfficientNet-B0 的 90.23%、InceptionV3 的 91.38%以及 DenseNet-121 的 93.3%准确率，并在各单一类别的预测准确率也均高于上述模型。单一类别的识别中除数量最少的类别外，BS-ResNeXt-50 在其他类别识别准确率均高于 90%，最高类别准确率达到 98.6%。【结论】改进后的 BS-ResNeXt-50 模型相比 ResNeXt-50 可以更准确地完成对野生动物图像的识别任务，在不同的野生动物图像数据集上也具有较好的

5、泛化能力。关键词：野生动物图像；物种识别；深度学习；卷积神经网络中图分类号：TP391.4文献标识码：A文章编号：10017488(2023)08011211Wildlife Image Recognition in Miyun District Based on BS-ResNeXt-50Qi Jiandong1,2Ma Zhongtian1Zhang Dehuai3Tian Yun4（1.College of Information,Beijing Forestry UniversityBeijing 100083；2.Engineering Research Center for For

6、estry-Oriented Intelligent Information Processingof National Forestry and Grassland AdministrationBeijing 100083；3.Management Office of Wulingshan Mountain Nature ReserveBeijing 101506；4.School of Soil and Water Conservation,Beijing Forestry UniversityBeijing 100083）Abstract：【Objective】In the wild e

7、nvironment,the background of wildlife images captured by camera traps is complex,which poses a challenge for identifying wild animals in images with a large number of images and a wide variety of wildlifespecies.Based on convolutional neural network,this research aims to improve the existing structu

8、re and so as to implement theautomatic recognition for wildlife images.【Method】In this study,2 712 wildlife images of 8 categories were taken from WulingMountain Beijing Nature Reserve,Miyun Districts,Beijing.The Auto Augment policy was randomly selected from 14augmentation policies to add noise to

9、the images.SENet and BlurPool were used to construct an improved network based onResNeXt-50:SE-ResNeXt-50 for enhancement feature extraction,BP-ResNeXt-50 for Shift-invariance maintenance,and BS-ResNeXt-50 for both.The influences of fixed learning rate,segmented learning rate,and cosine annealing le

10、arning rate on theaccuracy of the BS ResNeXt-50 network were tested on the self-built dataset.VGG16,ResNeXt-50,EfficientNet-B0,InceptionV3,DenseNet-121,and BS-ResNeXt-50 were used to train on 16 common categories of images in CCT public wildlife dataset,and therecognition accuracy of single species

11、was compared.e influences of fixed learning rate,segmented learning rate,and cosineannealing learning rate on the accuracy of the BS ResNeXt-50 network were tested on the self-built dataset.VGG16,ResNeXt-50,收稿日期：20220531；修回日期：20221021。基金项目：国家重点研发计划项目“典型人工林生态系统对全球变化适应机制”（2020YFA0608100）。第 59 卷第 8 期林

12、业科学 Vol.59，No.82 0 2 3 年 8 月SCIENTIA SILVAE SINICAEAug.，2 0 2 3EfficientNet-B0,InceptionV3,DenseNet-121,and BS-ResNeXt-50 were used to train on 16 common categories of images in CCTpublic wildlife dataset,and the recognition accuracy of single species was compared.eXt-50 is used to test influence of

13、 differentlearning rate include fixed and CosineAnnealing learning rate on collected dataset.VGG16,ResNeXt-50,EfficientNet-B0,InceptionV3,DenseNet-121,BS-ResNeXt-50 were used for training on CCT dataset,and the recognition accuracy of single specieswas compared.on ResNeXt-50:SE-ResNeXt-50 for enhanc

14、ement feature extraction,BP-ResNeXt-50 for Shift-invariancemaintenance,and BS-ResNeXt-50 for both.The influences of fixed learning rate,segmented learning rate,and cosine annealinglearning rate on the accuracy of the BS ResNeXt-50 network were tested on the self-built dataset.VGG16,ResNeXt-50,Effici

15、entNet-B0,InceptionV3,DenseNet-121,and BS-ResNeXt-50 were used to train on 16 common categories of images in CCTpublic wildlife dataset,and the recognition accuracy of single species was compared.eXt-50 is used to test influence of differentlearning rate include fixed and CosineAnnealing learning ra

16、te on collected dataset.VGG16,ResNeXt-50,EfficientNet-B0,InceptionV3,DenseNet-121,BS-ResNeXt-50 were used for training on CCT dataset,and the recognition accuracy of single specieswas compared.【Result】The accuracy of SE-ResNeXt-50 and BP-ResNeXt-50 reached 75.16%0.14%and 73.74%0.13%,respectively.The

17、 enhanced scheme BS-ResNeXt-50,which integrated SENet and BlurPool,achieved an accuracy of78.04%0.11%when tested on a self built dataset,which was the best improved scheme.When the cosine annealing learning rateis used,the accuracy of BS-ResNeXt-50 was improved to 81.54%,which was 3.5%higher than th

18、at with the constant learning rate.The step decay learning rate achieved 79.3%accuracy,which was 2.24%less than the cosine annealing learning rate.Theclassification accuracy of BS-ResNeXt-50 was able to reach 95.07%,which was 1.95%higher than that of ResNeXt-50 on CCTdataset.At the same time,it was

19、also 85.5%higher than that of VGG16,91.38%higher than that of EfficientNet-B0,91.38%higher than that of InceptionV3 and 93.3%higher than that of DenseNet-121.The prediction accuracy of each single category wasalso higher than that of the above model.In the recognition of a single category,except for

20、 the least one category,the accuracy ofBS-ResNeXt-50 was 90%higher than that in other categories,and the highest category accuracy was 98.6%.【Conclusion】TheBS-ResNeXt-50 can more accurately complete the recognition task,and also has good generalization ability on different datasets.Key words：wildlif

21、e images；species recognition；deep learning；convolutional neural network 近年来，在气候变化、人为活动干扰等压力下，一些自然保护地面临生物多样性下降、栖息地丧失等严重威胁（束祖飞等，2021）。物种多样性是生物多样性的关键，野生动物物种减少，生物多样锐减，最终危害的是人类的幸福和健康（于莉莉，2017）。因此，野生动物保护工作越来越受到关注，调查、追踪野生动物生活习性是生物多样性保护的重要部分之一。野外环境条件复杂、天气多变，仅靠人工采集野生动物的图像较为困难，目前较常用的收集野生动物活动图像的方式是野外布设红外相机，对出现

22、的野生动物自动抓拍。这种方式的优点是可在不影响野生动物活动的前提下对野生动物个体及种群信息进行收集、分析。在实际工作场景中，一方面，红外相机拍摄的照片中有大量不包含野生动物的废片，单纯依靠人工从大量相片中挑选包含野生动物的相片，费时费力；另一方面，在包含动物的照片中，经常出现动物特别靠近相机或只拍摄到动物身体一部分、动物被周围环境遮挡、光照变化、一张照片里出现多个动物等情况（Gomezet al.，2017，Norouzzadeh et al.，2018），给图像的识别和分类造成了很大干扰。传统的图像识别问题主要使用 k 近邻、支持向量机、最大似然法等方式。这些方式都依靠人工进行特征提取，提取

23、出的特征通常只针对特定数据集有效，识别准确率有限，在实际应用中表现欠佳（张毓等，2021）。近年来，随着计算能力及数据量的提升，以卷积神经网络为代表的深度学习算法在图像分类、图像识别、语义分割等细分领域中取得了较大进展。具有代表性的有 AlexNet（Krizhevsky et al.，2012）、VGG（Simonyan et al.，2014）、GoogLeNet（Szegedy et al.，2015）、ResNet（He et al.，2016）、DenseNet（Huang et al.，2017）、EfficientNet（Tan et al.，2019）等。在专门针对野生

24、动物图像识别的研究中，Gomez 等（2017）对Snapshot Serengeti 数据集中的 26 种常见动物图像制作成了 4 个不同的数据集，测试了 AlexNet、VGGNet、GoogLeNet 以及不同层数的 ResNet 网络，并在最坏情况下达到了 35.4%的准确率，最好情况下达到了 88.9%的准确率。刘文定等（2018）提出了全局局部的双通道 VGG16 卷积，将数据集中的动物图像利用目标检测模型裁剪出来，将全局和局部图像同时传入到网络中最后再对预测结果取均值，结果表明和VGG16 相比，5 种动物的预测准确率平均高了 20%。Timm 等（2018）

25、第 8 期齐建东等：基于 BS-ResNeXt-50 的密云地区野生动物图像识别113 利用 ImageNet 和 iNaturalist 数据集对 InceptionV3（Szegedy et al.，2016）模型进行预训练，在 2 000 张野生动物图像上进行迁移学习，2 个训练集训练出的预训练模型最终都达到了 75%的准确率。Willi 等（2019）使用 Snapshot Serengeti 数据集作为预训练数据集在ResNet-18 上进行训练，使模型在单一类别的准确率最高达到了 92.7%。Xie 等（2019）使用 SENet 进行增强特征提取，并与 ResNet 的残差

26、模块进行拼接构造出了 SE-ResNet，在 Snapshot Serengeti 数据集上 SE-ResNet-101 比 ResNet-101 平均准确率提升了 6.4%。王柯力等（2018）针对传统的水产动物识别问题中识别方式复杂、准确率低等问题，使用 VGG16、InceptionV3、ResNet-50 网络进行迁移学习后冻结前几个卷积层参数，单独对后几层进行微调，并测试不同可训练参数对模型的影响，使得 3 个模型对水产品图像的最高分类准确率达到 97.4%。杨国国等（2017）结合 GrabCut 算法对图像中的昆虫进行定位和分割，将 AlexNet 进行

27、优化，并利用优化后的 AlexNet 结合显著性分析对 23 种茶园的主要害虫进行识别，其比原始的 AlexNet 识别准确率提高了至少 3.2%。Guo 等（2019）构建出一种改进的 Faster-RCNN（Ren et al.，2015）网络 VCRPCN，使用 RPN 中动物图像和背景图像提取图像中动物位置的区域候选，将动物图像与分类子网中的区域候选相结合来识别区域的类别。不仅解决了由于动物出现所造成的背景变化，还识别了图像中潜在的动物区域并提取局部特征进行分类。何嘉（2019）应用了 CycleGAN 技术将红外相机夜间拍摄的黑白野生动物图像进行上色处理，使模型对夜间野

28、生动物图像单一类别的识别准确率最高提升 16%。邱志斌等（2021）建立了一种多卷积融合的神经网络。利用迁移学习对 AlexNet、ResNet、VGG16、InceptionV3共 4 个模型进行训练，再将分类的结果按不同权重系数进行加权，对 88 种鸟类的识别准确率达到 91.21%。既有研究中已做了大量工作，但仍存在一些问题：其一，深度学习识别动物图像需要大量的标记图像，小规模数据集训练的模型准确率不高。其二，公开的野生动物数据集大多都来自国外，数据集中包含的动物种类与国内常见动物存在差异，训练出的模型无法很好地反映出对国内特定地区野生动物图像的识别效果。基于上述问题，本研究采集并构建了

29、北京市密云区的北京市级雾灵山自然保护区的野生动物图像数据作为模型训练、测试数据集，使模型辅助密云地区的国家级和北京市级野生动物保护及物种多样性的研究。建立一种基于 ResNeXt（Xie et al.，2017）的改进模型，通过修改残差模块，结合 BlurPool（Zhang,2019）减少因动物出现在不同位置引发平移不变性丢失造成的误判，再引入注意力机制 SENet（Hu et al.，2018）进一步提升模型对动物的特征提取能力，增强模型的分类准确率，改进模型可以对野生动物图像进行高效、准确、快速的识别。1数据源 1.1自建数据集数据是由布设在北京市密云区的北京市级雾灵山自然保护区的 30

30、个红外相机于 20142015 年拍摄的，在相关专家协助下，分为狍（Capreolus）、鸟、山羊（Capra）、松鼠（Sciurus）、猪獾（Arctonyx）、兔（Lepus）、豹猫（Prionailurus）、野猪（Sus）共 8 个类别，图像分辨率均为 2 5601 920。拍摄到的野生动物图像中有国家二级保护动物豹猫，北京市一级保护鸟类红嘴蓝鹊（Urocissa erythrorhyncha）等。图 1 为红外相机拍摄到的各类别野生动物图片，图 2 为使用的红外相机型号松鼠Squirrel野猪Boar山羊Goat鸟Bird豹猫Leopard cat兔Rabbit猪獾Hog bad

31、ger狍Roe deer图 1各类别野生动物图像Fig.1Wildlife images of each category114林业科学59 卷为猎科 Ltl-6511，图 3 为红外相机的布设位置。由于数据集中各类别图像的数量差距较大，对数据集进行类别平衡调整。对于数量多的类别进行随机抽样，抽取出部分数据；数量少的类别使用平移、旋转、翻转、随机噪声、随机擦除的方式将图像数量扩充 5 倍，调整后的数据集有 2 172 张野生动物图像，表 1 为自建数据集各类别动物图像的分布状况。1.2CCT 数据集CCT（Caltech Camera Traps）数据集由布设在美国西南部的 140 个红外相

32、机拍摄，数据集中图像分为 21 个类别。选取其中常见的 14 个类别，所选类别有 110 843张图像，其中部分类别与自建数据集有重合，可用于检验模型的泛化能力。表 2 为 CCT 数据集中各类动物图像分布，其中啮齿类动物图像中不含松鼠。2模型与训练策略 2.1ResNeXt 网络ResNeXt 是以 ResNet 为基础的改进网络，其特点是将分组卷积引入 ResNet 中，在做卷积操作时将卷积分为 n 个组，每一组都与输入的特征图做卷积，最后再将卷积的结果进行拼接。ResNeXt 的一个基本模块如图 4 所示，对于输入的特征图将卷积核分为 32 个组，每一组将输入进 11 的卷积将特征图降至

33、 4 通道，之后使用 33 卷积进行处理，最后用 11 卷积将每一组特征图的通道数升至 256，再对每个组的结果进行拼接，得到的结果与残差连接进行相加。1 号机位Camera No.12 号机位Camera No.23 号机位Camera No.324 号机位Camera No.2425 号机位Camera No.258 号机位Camera No.84 号机位Camera No.45 号机位Camera No.522 号机位Camera No.2210 号机位Camera No.1011 号机位Camera No.1112 号机位Camera No.1213 号机位Camera No.1314

34、号机位Camera No.1427 号机位Camera No.2715 号机位Camera No.1516 号机位Camera No.1617 号机位Camera No.1730 号机位Camera No.3023 号机位Camera No.2329 号机位Camera No.2928 号机位Camera No.2821 号机位Camera No.2120 号机位Camera No.2019 号机位Camera No.1918 号机位Camera No.1826 号机位Camera No.267 号机位Camera No.76 号机位 Camera No.69 号机位 Camera No.9

35、水泉沟村Shuiquangou village大坡Dapo图 3红外相机布设位置Fig.3The location of camera traps 2.2BlurPool在神经网络架构中，若输入的图像出现了平移，在最大池化下采样和步长大于 1 的卷积之后也会得到一个和之前差别很大的输出，在很大程度上影响了模型判别的准确性。在野生动物图像中，动物会出现在图像中的不同位置，这种偏移给模型的判别增加困难。为了度量图像偏移的程度，引入了平移不变性（shift-invariance）的概念（Zhang,2019），即输入平移之后仍等于输入，其定义如下：表 1调整后的自建数据集各物种类别数量Tab.1Nu

36、mber of species in the adjusted self-built dataset物种Species图像数量Image number狍 Roe Deer500鸟 Bird500山羊 Goat332松鼠 Squirrel215猪獾 Hog Badger190兔 Rabbit155豹猫 Leopard Cat145野猪 Boar135 图 2ltl-6511 红外相机Fig.2ltl-6511 camera trap第 8 期齐建东等：基于 BS-ResNeXt-50 的密云地区野生动物图像识别115 F(X)=Shifth,wF(X)(h,w)。（1）对于步长为 2 的最大池化

37、（maxpooling）操作，将其分解为首先进行步长为 1 的取最大值（max）操作，再进行步长为 2 的下采样（subsampling）操作。对拆分后的最大池化操作，中间增加了一层步长为 1 的抗锯齿操作（antialiasing）。如图 5 所示，抗锯齿操作和下采样操作在一起被称为 BlurPool。在步长为 2 的卷积中同样可以使用 BluePool 操作来维持平移不变性，就是将卷积（s=2）到激活函数的操作变为卷积（s=1）到激活函数，再将结果送入BluePool 中。2.3SENetSENet 是一个能够获取到更多空间融合信息的结构。普通的卷积操作获取到的特征是融合了感受野内的空间和

38、通道信息的，而 SENet 通过构建通道间的依赖关系，使其能够获取到野生动物图像中不同通道的信息。图 6 是 SENet 的模型结构。XHCWXHCWUHCWFtrFsq()Fex(,W)Fscale(,)图 6SENet 结构Fig.6Structure of SENet SENet 由 Squeeze 过程和 Excitation 过程组成。Squeeze 过程的主要目的是获取全局特征，将输入的特征图进行全局平均池化，对每个通道进行压缩。Excitation 过程使用了 2 个全连接层以及 ReLU和 Sigmoid 激活函数获取到每个通道上的特征权值。最后将得到的通道上的权重与

39、输入的特征矩阵对应的通道进行相乘。2.4BS-ResNeXt 网络设计在拍摄到的野生动物图片中经常会出现同一动物在图片中不同位置的情况（图 7），但网络对这种移动较为敏感，会破坏卷积的平移不变性。将图像向下平移一个像素，卷积结果有 30%的可能性发生变化，导致模型鲁棒性不强（Azulay et al.，2018）。基于上文提到的结构，构建出一种改进的 ResNeXt 网络，增强对野生动物图像的识别。通过在 ResNeXt 的参残差模块中加入 BlurPool 层来维持卷积的平移不变性，可以增加模型对移动中的动物的识别准确率，减少误判，加强模型的鲁棒性。之后在残差模块中嵌入 SENet加强模型对

40、各个通道的特征提取，模型可以更充分的学习到动物特征，使模型识别准确率继续提升。图 8 是 BS-ResNeXt 的残差模块结构图。输入特征图首先经过分组卷积进行特征提取，输入 BlurPool层进行抗锯齿操作，维持卷积的平移不变性，之后进行 Squeeze 过程也就是全局平均池化操作，再经过 2个全连接层即 Excitation 操作，将输入特征图与每个通道的激活值相乘使模型完成了对各个通道的权重的学习，最后再将残差连接与 SENet 的输出相加。根据上述分析，本研究改进的网络整体结构如表 2CCT 数据集各物种类别数量Tab.2Set of species selected from CC

41、T dataset物种 Species图像数量 Image number负鼠 Opossum16 479郊狼 Coyote16 306兔 Rabbit12 315鹿 Deer12 191浣熊 Raccoon10 888鸟 Bird9 501山猫 Bobcat7 597猫 Cat5 163松鼠 Squirrel4 430啮齿动物（不含松鼠）Rodent(Squirrel exclusion)4 273奶牛 Cow3 626狗 Dog3 608狐狸 Fox2 574臭鼬 Skunk1 892 256,11,44,33,44,11,256256,11,44,33,44,11,256256,11,44

42、,33,44,11,256+32个分支+32 branches图 4ResNeXt 模块结构Fig.4Structure of ResNeXt block Maxpooling(s=2)Max(s=1)。Antialiasing(s=1)。Subsampling(s=2)图 5抗锯齿下采样层Fig.5Antialiasing subsampling layer116林业科学59 卷图 9。在每个残差结构中，首先利用 BlurPool 对照片中不同位置上的野生动物进行学习，再加入 SENet 增强网络对动野生物的特征提取能力，改进后的 BS-ResNeXt-50 可以提取到更丰富的动物特征。B

43、lurPoolConvSENet3BlurPoolConvSENet4BlurPoolConvSENet6BlurPoolConvSENet377,Conv,6411,Conv,25611,Conv,51211,Conv,1 02411,Conv,2 04811,Conv,6433,Conv,6411,Conv,25611,Conv,25633,Conv,25611,Conv,51211,Conv,51233,Conv,51211,Conv,1 02411,Conv,1 02433,Conv,1 02411,Conv,2 048BlurPool动物图像Animal imagesAverageP

44、oolSoftmax图 9BS-ResNeXt-50 整体结构Fig.9Structure of BS-ResNeXt-50 2.5训练策略 2.5.1余弦退火衰减训练模型时不同的学习率会影响模型收敛速度和识别准确率，不合适的学习率有一定概率使模型陷入局部最优解，动态调整学习率可使模型跳出局部最优解。余弦退火学习率（Loshchilovet al.，2016）采用热重启的方式，在学习率衰减到最小值后会突然增加再继续衰减，让模型跳出局部最优解。余弦退火学习率公式如下：t=imin+12(imaximin)1+cos(TcurTi)。（2）式中，max和max是学习率的范围，i 表示第几次重启，T

45、cur是当自上一次重后前迭代的 epoch 次数，Ti是第 i次时的 epoch 次数。2.5.2随机增强策略数据增强在提升模型的鲁棒性上很有帮助，本文使用随机增强（rand augment）（Cubuk et al.，2020）策略进行数据增强。如图 10 所示，随机增强使用了恒等变换（identity）、自动对比度（autoContrast)、平衡（equalize)、旋转（rotate)、曝光（solarize)、颜色（color)、色彩分离（posterize）、对比度（contrast）、亮度（brightness）、锐化（sharpness）、X 方向错切（shearX）、

46、Y 方向错切（shearY）、X 方向平移（translateX）、Y 方向平移（translateY）共 14 种变换，训练时随机选择其中的 N 种方式对图像进行变换。3结果与分析 3.1试验环境及数据处理本研究的试验环境为：E5-2678 处理器、32GB 内存、RTX2080super 显卡、Ubuntu20.04 系统、Python3.8环境，PyTorch1.8.1 框架。试验所使用的 CCT 数据集和自建数据集均使用91 分割训练集和验证集。使用随机增强策略对数据集进行增强。训练时使用 Adam 优化器进行优化，图 7一个动物出现在图像不同位置Fig.7An anima

47、l appears in different positions of image 256,11,4256,11,4256,11,4256,11,4256,11,4256,11,44,33,44,33,44,33,4+BlurPoolGlobal poolingFCReLUFCSigmoid+ScaleInput32 个分支32 branches图 8BS-ResNeXt 残差模块结构Fig.8Structure of BS-ResNeXt block第 8 期齐建东等：基于 BS-ResNeXt-50 的密云地区野生动物图像识别117 批量大小为 32。3.2不同模型改进方案的研究试验选择

48、ResNeXt-50 作为基础网络，设计 3 种改进方案。第一种方案在原有的网络中加入 SENet，改进为 SE-ResNeXt-50，增强模型特征提取能力。方案二将 ResNeXt-50 中的最大池化层以及步长大于 1 的卷积层使用 BlurPool 改进为 BP-ResNeXt-50，维持卷积的平移不变性。方案三同时加入 SENet 和 BlurPool，替换残差模块，构建出 BS-ResNeXt50。试验中 4 个模型使用的数据集为自建数据集，使用 10 折交叉验证方式，选择其中 3 组数据进行试验，迭代次数为 50，学习率为 0.000 2。在 3 次试验过程中，ResNeXt-50

49、网络的准确率达71.91%0.15%，方案一 SE-ResNeXt-50 及方案二 BP-ResNeXt50 的准确率分别为 75.16%0.14%和 73.74%0.13%，方案三中联合使用 BlurPool 和 SENet 的 BS-ResNeXt-50 使准确率达 78.04%0.11%。此外 3 组试验结果偏差不大，说明数据集划分较为合理。表 3 为其中一次试验结果，从表中可知，SE-NeXt-50 对于每个类别动物的识别准确率均有提升，但对于体型较大的野生动物识别准确率的提升更高，说明 SE-NeXt-50 的增强特征提取对于体型较大的野生动物的效果更好。BP-ResNeXt-50

50、对于猪獾、鸟、狍、山羊类别的识别准确率提升超过 2%。上述类别中，同种动物出现在相同场景的不同位置上的样本较多，BP-ResNeXt-50 更擅长此类样本的学习。BS-ResNeXt-50不但对于狍、山羊等体型较大动物的识别准确率有所增加，对于鸟、猪獾等中小类别的动物识别准确率也有明显提升。表 3不同改进方案对自建数据集各物种识别结果Tab.3Results of different enhancement schemes in self-built dataset物种Species模型准确率Model accuracy（%）ResNeXt-50SE-ResNeXt-50BP-ResNeXt-

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 BS ResNeXt 50 密云地区野生动物图像识别

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。