松树株数识别的YOLOv5轻量化算法研究.pdf
《松树株数识别的YOLOv5轻量化算法研究.pdf》由会员分享,可在线阅读,更多相关《松树株数识别的YOLOv5轻量化算法研究.pdf(8页珍藏版)》请在咨信网上搜索。
1、随着 5G 技术的发展,其高带宽、低时延和高密度接入特点,促使云计算模式向“云-管-端”模式改变,边缘计算作为终端关键技术对人工智能算法在算力有限的终端上的部署成为关键。以苗圃验收环节中松树株数识别的视频检索算法为例,提出一种适用于人工智能算法在终端部署的轻量级苗圃松树苗检测计数算法。算法通过在 YOLOv5 网络的基础上引入MobileNet v3 特征提取机制来实现网络的轻量化,将压缩激励网络(Squeeze-and-Excitation Networks,SENet)中的轻量级注意模块集成作为 bneck 基本块,提高网络对于特征通道的敏感程度,增强网络的特征提取能力;在 IoU(Int
2、ersection over Union,IoU)基础上进一步考虑目标框和预测框的向量角度,使用 SIoU 损失函数作为预测函数,重新定义相关损失函数,从而使苗圃树苗预测框更加接近真实框。研究结果表明,改进后的模型参数量明显减少,改进后的网络模型大小与对比试验中的方法相比,模型在准确率(Precision)降低 3.26%、平均精确率均值(Mean Average Precision,mAP)降低 1.03%的情况下,帧率(Frame Per Second,FPS)提升了 21.48%,达到 71.43 帧/s,计算量较原 YOLOv5s 减少了 148.44%。证明该算法具有高效性和轻量性,
3、为边缘计算终端人工智能算法移植提供算法原型。关键词:YOLOv5;识别;MobileNet;松树树苗;轻量化中图分类号:S771.1 文献标识码:A 文章编号:1006-8023(2023)04-0126-08Research on YOLOv5 Lightweight Algorithm for Pine Tree Strain IdentificationXIAO Weiying1,WANG Jian1,LI Wenshun2(1.College of Computer and Control Engineering,Northeast Forestry University,Harbin
4、 150040,China;2.College of Information and Electrical Engineering,Heilongjiang Bayi Agricultural University,Daqing 163319,China)Abstract:With the development of 5G technology,its high bandwidth,low latency and high density access features have led to a change in the cloud computing model to acloud-m
5、anagement-end model,and edge computing as a key terminal technology has become critical to the deployment of AI algorithms on terminals with limited computing power.Taking the video retrieval algorithm for pine tree plant identification in nursery acceptance as an example,a lightweight algorithm for
6、 pine sapling detection and counting in nurseries suitable for terminal deployment of AI algorithms in proposed.The algorithm achieves network lightweighting by introducing the MobileNet v3 feature extraction mechanism on the basis of the YOLOv5 network,integrating the lightweight attention module i
7、n Squeeze-and-Excitation Networks(SENet)as a bneck basic block to improve the networks sensitivity to feature channels and enhance the networks feature extraction capability.The vector angles of the target and prediction frames are further considered on the IoU basis.The SIoU loss function is used a
8、s the prediction function and the associated loss function is redefined,thus making the nurs-ery sapling prediction frame closer to the real frame.The results of the study show that the number of parameters of the improved model is significantly reduced,and the size of the improved network model is
9、compared with the method in the comparison experiment,the model has a 21.48%improvement in frame rate(FPS)to reach to 71.43 frames per second with a 3.26%reduction in accuracy(Pre-cision)and a 1.03%reduction in mean average precision(mAP),and the computational effort is reduced from the original YOL
10、Ov5s reduced 148.44%,proving that the algorithm is highly efficient and lightweight,providing an algorithm prototype for the porting of arti-ficial intelligence algorithms to edge computing terminals.Keywords:YOLOv5;recognition;MobileNet;pine saplings;lightweight收稿日期:2022-10-21基金项目:黑龙江省自然科学基金面上项目(F2
11、01028)第一作者简介:肖维颖,硕士研究生。研究方向为通信与信号系统。E-mail:1246346691 通信作者:王健,博士,副教授。研究方向为物联网、边缘计算、嵌入式开发。E-mail:引文格式:肖维颖,王健,李文顺.松树株数识别的 YOLOv5 轻量化算法研究J.森林工程,2023,39(4):126-133.XIAO W Y,WANG J,LI W S.Research on YOLOv5 lightweight algorithm for pine tree strain identificationJ.Forest Engi-neering,2023,39(4):126-133.
12、第 4 期肖维颖,等:松树株数识别的 YOLOv5 轻量化算法研究0 引言 林业资源是生态环境重要的组成部分之一,生态环境保护离不开林业资源的支持1,研究林业育苗技术对提高我国林业发展水平具有重要意义。传统的苗圃株数识别方法多以人工抽样估计为主,依赖于苗圃管理者对苗圃植株进行识别与统计计数,准确率低时效性差,且耗费大量的人力和物力。深度学习网络能够自动提取特征,从树苗的 RGB 图像中获取树苗的颜色、纹理和形状特征,训练出专属模型,实现对树苗目标的检测,此方法相较于人工识别更高效准确。近年来,随着具有高带宽、低时延和高密度接入的 5G 技术的发展,传统集中式云计算架构已经不能满足云计算需求,边
13、缘计算通过分布式的终端进行计算,解决了现有场景下云计算服务器算力不足的问题。同时,我国林业正在向“数字林业、智慧林业”方向转型2,由于我国森林资源丰富,其“数字化、智慧化”过程中对数据存储及计算算力的要求非常高,采取云计算架构不仅会增加林业企业和政府负担,还会增加管理难度,本研究从边缘计算终端人工智能算法移植的角度出发,以轻量级改进为目标进行研究。针对研究的松树苗圃环境复杂、枝叶遮挡、植株重叠、光照变化因素、实时性要求高、边缘计算终端存储空间小和算力不足的问题,摒弃了通过训练区域生成网络(Region Proposal Network,RPN)和检测目标在网络中的坐标信息3完成的 Fast R
14、-CNN4、Libra R-CNN5和 Cascade R-CNN6等体量大、复杂度高的双阶段目标检测算法,使用体量较小的单阶段目标检测算法 YOLO7-9系列、SSD10和 FCOS11等中的 YOLOv5 算法作为基本算法,该算法由 Redmon 等12 提出,具有体积小、精度高的优点。虽然 YOLOv5 具有体积小、精度高的特点,但将其直接部署到边缘计算终端时,仍存在检测速度较慢、计算量较大的问题,会造成误检、漏检等问题,无法满足任务实时性需求。研究以苗圃验收中松树株树自动识别为例,在保证检测精度变化不大的情况下,研究适合于边缘计算终端部署的算法,为人工智能及边缘计算技术在“数字林业、智
15、慧林业”上的应用提供算法基础。1 YOLOv5 目标检测模型随着 5G 通信技术发展传输带宽可以到 1 GB,基于视频或图像检索的人工智能技术的数据量和计算量非常大,集中式的云计算模式达不到对图像数据的实时性处理需求,边缘计算通过海量终端可以减少云端计算和存储压力,但由于边缘计算终端设备价格低、存储小且算力不足,传统部署到云端的目标检测算法不适合终端部署。相较于对设备性能的要求很高、对单幅图像的推理时间过长的双阶段目标检测算法,YOLOv5 作为代表性的单阶段目标检测算法之一,计算复杂度较低、检测速度较快且拥有较好的实时性能,能初步满足实际应用时将其搭载到小型嵌入式设备的要求。本研究将对 YO
16、LOv5 进行改进,得到适合于CPU 工作频率小于等于 1.8 GHz、GPU 工作频率小于等于400 MHz、成本在2 000 元以内的边缘计算终端的轻量级人工智能算法。1.1 YOLOv5 原理YOLOv5s 是 YOLOv5 算法系列中最小的版本,其大小仅为 15.9 MB。YOLOv5s 的主要结构由 4 部分组成:输入、主干网、颈部网络层和头部检测终端,如图 1 所示。输入端为图像预处理部分,包括 Mosaic 数据增强、自适应锚框计算、自适应图片缩放。Mosaic 数据增强是将 4 张图片随机组合,为达到丰富图片背景的效果;自适应图片缩放即对不同长宽的原始图像尽量少地添加黑边,使图
17、像为统一尺寸。主干网络为特征提取部分,包括 Focus 模块、CSP 模块和 SPP 池化金字塔结构。Focus 模块的作用是通过减少参数计算来加快训练速度;CSP 模块主要作用是进行局部跨层融合,利用不同层的特征信息获得更丰富的特征图。颈部网络层为特征融合部分,包括特征金字塔网络(Feature Pyramid Network,FPN)13与路径聚合网络(Path Aggregation Network,PANet)。该组合结构提升了模型的特征融合能力,能获得更多的上下文信息,减少信息丢失。头部检测终端为目标检测结果输出,采用 GIoU_Loss 作为 Boundingbox 的损失函数,并
18、通过非极大值抑制(Non Maximum Suppression,NMS)来筛选目标框。721森 林 工 程第 39 卷Focus CBSCBSCBSCBSCBSCSP1_1CSP1_3CSP1_3CSP2_1CSP2_1CBSUpsampleUpsampleConcatConcatConcatConcatCBSCBSCSP2_1CSP2_1CSP2_1ConvConvConvCBSCBSSPPCBSCBSCBSCBSCBSCBSCBSCBSCBSCBSCBSConvBNSiLuAddConcatConcatSliceSliceSliceSliceFOCUSConcatConcatMaxpoo
19、lMaxpoolMaxpoolCSP2_XCSP1_XResunitYOLOv5?structureResunitSPP图 1 YOLOv5 结构图Fig.1 Structure of YOLOv51.2 改进的 YOLOv5 算法边缘计算终端由于采取分布式的“云-管-端”架构,可通过边缘计算平台对边缘计算终端的计算结果进行数据融合,所以在保证识别准确率、召回率和平均精度变化不大的情况下,提高帧率和计算量是研究重点。传统 YOLOv5 网络模型虽然检测具有一定的实时性,但为符合边缘计算终端实时性需求,其帧率和计算量还有待提升。针对此问题,本研究对 YOLOv5 网络进行改进。1.2.1 主干网
20、络的轻量化 传统 YOLOv5 的 CSPDarkNet5314有 104 层卷积网络,使用大量的卷积操作,运算时会占用大量的运算资源,在边缘终端设备上运行速度会很慢,导致实时性变差,因此需对特征提取网络进行改进。改进模型使用 MobileNet v315轻量化网络代替CSPDarkNet53 进行图片特征提取,如图 2 所示。图 2 MobileNet v3 网络结构图Fig.2 MobileNet v3 network architecture MobileNet 是一种适用于移动端的轻量级神经网络。MobileNet v3 结合 MobileNet v1 的深度可分离卷积,保留 Mobi
21、leNet v216中具有线性瓶颈层的逆残差结构 MobileNet v2 的线性瓶颈层(Bottle-neck)和反转残差模块以及通过 Shift 操作和逐点卷积降低空间卷积。在深层网络激活函数使用 h-swish 代替 ReLU6,增强量化过程,降低运算量,提高模型性能。改进主干网络后,与 CSPDarkNet53 相比,MobileNet v3 网络深度更低,在识别准确度降低13.9%情况下,帧率(Frame Per Second,FPS)提升了32.8%,达到 78.1 帧/s,计算量较原 YOLOv5s 减少了 152.4%。1.2.2 注意力机制的添加网络结构的轻量化改进能够大幅降
22、低模型的参数量和计算量,但与此同时带来了平均精确度的下降,因此,需要对模型进一步优化以提高模型平均精确度。自然环境下的松树苗圃植株顶尖常出现重叠和枝叶遮挡的问题,造成模型检测平均精确度的下降,采用将位置信息与通道信息相结合的坐标注意力机制施加于网络的关键位置中,增加模型对树尖特征的敏感程度。对于任务中较难识别的重叠、遮挡目标分配高权重加以关注,对于不感兴趣的自然背景分配低权重加以抑制,提高自然环境下松树苗植株的识别精度。本研究将 CA 注意力机制(Coor-dinate attention,CA)17融合到主干特征提取网络最后一层。CA 注意力机制是基于坐标信息嵌入(Coordi-821第 4
23、 期肖维颖,等:松树株数识别的 YOLOv5 轻量化算法研究nate Information Embedding,CIE)和坐标注意力生成(Coordinate Attention Generation,CAG)2 个步骤来编码通道关系和长距离关系,具体结构如图 3 所示。为解决 Channel Attention 全局池化编码难以保留重要的空间信息问题,研究将全局池化改造成 2 个一维向量的编码操作,对于形状为 CWH 输入特征图 X,使用池化核(H,1)和(1,W)来编码水平方向和垂直方向特征,即第 c 维特征的输出为zhc(h)=1WWi=0 xc(h,i)。(1)zwc(w)=1HHj
24、=0 xc(j,w)。(2)式中:H 和 W 分别为特征图的高度和宽度;xc(h,i)和 xc(j,w)分别代表特征图水平方向和竖直方向的特征;zhc(h)表示高度为 h 的第 c 个通道的输出;zwc(w)表示宽度为 w 的第 c 个通道的输出。式(1)和式(2)从不同的方向集成特征,输出一对方向可知的特征图。对比全局池化的压缩方式,这样能够允许注意力机制(Attention Block,AB)捕捉单方向上的长距离关系,同时保留另一个方向上的空间信息,帮助网络更准确地定位目标。为了更好地利用上述的坐标信息,采用配套的CAG 操作,主要基于 3 点准则进行设计:1)足够简单和轻量;2)能完全利
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 松树 识别 YOLOv5 量化 算法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。