基于YOLOv5改进的轻量化目标检测.pdf
《基于YOLOv5改进的轻量化目标检测.pdf》由会员分享,可在线阅读,更多相关《基于YOLOv5改进的轻量化目标检测.pdf(11页珍藏版)》请在咨信网上搜索。
1、基于 YOLOv5 改进的轻量化目标检测管嘉程1,2,任红卫2,周宋佳21(吉林化工学院信息与控制工程学院,吉林132022)2(广东石油化工学院自动化学院,茂名525000)通信作者:任红卫,E-mail:摘要:针对移动端目标检测算法需要模型参数量与计算量更少、推理速度更快和检测效果更好以及目标检测算法对于小目标误检、漏检及特征提取能力不足等问题,提出一种基于 YOLOv5 改进的轻量化目标检测算法.该算法使用轻量级网络 MobileNetV2 作为目标检测算法的骨干网络降低模型的参数量与计算量,通过使用深度可分离卷积结合大卷积核的思想降低网络的计算量与参数量,并提升了小目标的检测精度.使用
2、 GhostConv 来替换部分普通卷积,进一步降低参数量与计算量.本文算法在 VOC 竞赛数据集,COCO 竞赛数据集两份数据集上均进行了多次对比实验,结果表明本文算法相比于其他模型参数量更小、计算量更小、推理速度更快以及检测精度更高.关键词:轻量化;深度学习;特征金字塔网络(FPN);YOLOv5;大核卷积引用格式:管嘉程,任红卫,周宋佳.基于 YOLOv5 改进的轻量化目标检测.计算机系统应用,2023,32(9):132142.http:/www.c-s- Lightweight Target Detection Based on YOLOv5GUANJia-Cheng1,2,RENH
3、ong-Wei2,ZHOUSong-Jia21(CollegeofInformationandControlEngineering,JilinInstituteofChemicalTechnology,Jilin132022,China)2(SchoolofAutomation,GuangdongUniversityofPetrochemicalTechnology,Maoming525000,China)Abstract:Mobiletargetdetectionalgorithmsrequirefewermodelparameters,lesscomputation,fasterreaso
4、ningspeed,andbetterdetectioneffects.Thetargetdetectionalgorithmsarepronetofalsedetectionofsmalltargetsandmissingdetectionandhaveinsufficientabilityforfeatureextraction.Tothisend,thisstudyproposesalightweightsmalltargetdetectionalgorithmbasedonYOLOv5.Inthisalgorithm,thelightweightnetworkMobileNetV2is
5、usedasthebackbonenetworkofthetargetdetectionalgorithmtoreducethenumberofparametersandcalculationamountofthemodel.Thedeepseparableconvolutioncombinedwithalargeconvolutionkernelisappliedtodeclinethenumberofparametersandcalculationamount,andimprovethedetectionaccuracyofsmalltargets.GhostConvisadoptedto
6、replacepartofcommonconvolutiontofurtherdecreasethenumberofparametersandcomputationamount.MultiplecomparisonexperimentsarecarriedoutonVOCcompetitiondatasetsandCOCOcompetitiondatasets.Theresultsshowthatcomparedwithothermodels,theproposedalgorithmhasfewerparameters,lesscomputation,fasterreasoningspeed,
7、andhigherdetectionaccuracy.Key words:lightweight;deeplearning;featurepyramidnetwork(FPN);YOLOv5;largekernelconvolution计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(9):132142doi:10.15888/ki.csa.009292http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041基金项目:广东省基础与应用基础研究基金(202
8、3A1515010168,2019A1515010830);广东省普通高校重点专项(2022ZDZX1018);茂名市科技计划(2022S043);广东石油化工学院博士启动项目(2019BS001)收稿时间:2023-03-30;修改时间:2023-05-11;采用时间:2023-06-06;csa 在线出版时间:2023-08-29CNKI 网络首发时间:2023-08-30132软件技术算法SoftwareTechniqueAlgorithm随着人工智能和深度学习思想的普及,毫无疑问,目标检测作为 CV 领域核心问题.无论是在理论还是应用都进展飞速,并广泛应用到了社会生活的各个方面,诸如智
9、能交通1、医疗辅助2,3、人像识别4、工业自动化5、运动识别6等.通过结合图像处理和深度学习等理论,在图像中随机定位特定区域,通过定位找出输入图像中目标物体的位置信息并确定目标框大小,利用分类判断目标物体的类别.且毫无疑问,做好目标检测是实现目标跟踪,场景理解,事件检测等进阶视觉任务的首要任务.现阶段目标检测的对象,主要分为静态图像和动态视频.视频目标检测以图像检测的理论为基石,利用循环神经网络提取时序信息,最后实现目标检测任务.文献 7 总结罗列了近几年提出的诸多应用于静态图片的图像识别算法.文献 8 总结罗列了这几年来的应用于视频文件的图像识别算法.按目标检测算法的检测原理分类,主要有两类
10、:(1)两阶段检测器,诸如 SPPNET、R-CNN9及其改进版1012.(2)一阶段检测器,主要是 SSD13、YOLO 系列14及其改进15,16.两阶段精度稍高但速度略慢.两阶段检测器的第 1 阶段先找出可能包含目标物体的建议框,第 2 阶段对建议框进行分类,进行预测;一阶段检测器无须寻找建议框阶段,直接确定物体的类别概率和位置坐标值,经过单次检测即可直接得到最终的检测结果,模型小、速度快、更具实用性.近几年来,因为 YOLOv5 既能满足实时性要求,且能保持较高的检测精度,使得其被广泛应用于各个领域.且基于不同的操作环境和检测任务,还可以选用不同模型大小的 YOLOv5.其中 YOLO
11、v5s 更因为其低计算量与高性能,成为轻量化的理想候选者.伴随着日益增长的移动端部署需求以及检测场景的多样性,轻量化深度神经网络的要求迫在眉睫.各种优秀的卷积网络的理论,诸如 VGG17、ResNet18、DSC 卷积19等,都被融合到轻量化的网络中,用来更有效的提取目标特征以及提升网络效率.MobileNetV120结合深度可分离卷积的思想,通过超参数使模型快速调节以适应特定的工作环境.将其模型与时下主流的模型对比,在模型大小和速度上,MobileNet 都展现出了极强优越性.MobileNetV221在MobileNetV1 的基础上,融合 ResNet 的思想,提出倒残差的架构,并使用一
12、个线性的激活函数避免特征损失.进一步降低模型大小,且提升了准确率.GhostNet22发表于 CVPR2020 上的新颖的端侧神经网络,通过组合少量卷积核与更廉价的线性变化操作代替常规卷积方式,有效地改善了特征提取效率.最近,清华大学、旷视科技等机构的研究者在 CVPR2022上提出了超大卷积核架构 RepLKNet23,利用少量大卷积核换取更大的感受野,弥补了深层小卷积核模型有效感受野局限的缺陷.文献 2427 对 YOLOv5 模型做了改进,一定程度上,实现了轻量化,却均没有用 COCO、PASCALVOC 等一般数据集验证其性能.文献 28 在 YOLOv5上做了轻量化改进,并用 PAS
13、CALVOC 进行性能验证,虽然降低了参数量,计算量.但是很大程度上,牺牲了准确度和速度.提高检测精度的代价是:现代最先进的网络需要高计算资源,超出了许多移动和嵌入式网络应用程序的能力.为了解决 YOLOv5s 难以兼顾模型轻量化与模型检测精度以及对边界框的回归粗糙的问题.本文对YOLOv5s 进行改进,提出 YOLO-MLK(youonlylookonce-mobilelargekernel)目标检测算法用于移动端设备的目标检测任务,主要贡献如下.(1)轻量级网络骨干.使用参数量和计算量更小、移动端目标检测速度更快的 MobileNetV2 为基本架构,替代原本 YOLOv5 的网络骨干,降
14、低网络的计算量,提升模型的运算效率.(2)提出融合深度可分离大卷积的特征图金字塔模块 LKL-PAN.通过拆分空间维度和通道维度的相关性,减少卷积计算所需的参数个数,提升卷积核参数的使用效率.使用大卷积高效直观地增加感受野,避免小卷积核的低效堆叠,减少采样过程带来的特征损失,进一步提升检测速度和检测精度.(3)优化激活函数.引入 SIoU 激活函数,增加检测框尺度的损失,从而提升特征提取能力,使得预测框更为精准,进一步有提升网络的检测精度.1相关工作 1.1 YOLOv5YOLOv5 是 YOLO 系列的经典算法.按照其模型大小递增可分为 s、m、l、x 这 4 种,所有模型均由输入端、Bac
15、kbone、Neck、Head 构成.在输入端部分,首先对图片进行预处理,在网络训练阶段使用 Mosaic2023年第32卷第9期http:/www.c-s-计 算 机 系 统 应 用SoftwareTechniqueAlgorithm软件技术算法133技术进行数据增强、自适应锚框计算以及自适应图片缩放:在 Backbone 部分,YOLOv5 使用了改进的 CSP-Darknet 结构、Focus 下采样结构作为基准网络,搭配SPP 空间金字塔池化层更有效地提取特征信息;Neck部分同样用到了 SPP 模块以及特征金字塔 FPN+PAN模块,实现细节与 Backbone 部分稍有不同,进一步
16、提升提取特征的多样性及鲁棒性.Head 用于完成目标检测结果的输出.不同算法,Head 端的分支个数不同,一般都有一个分类分支以及一个回归分支.YOLOv5 的基本架构如图 1 所示.CSPDarknetinputs(640,640,3)Focus(320,320,12)Conv2D-BN-SiLU(320,320,64)Conv2D-BN-SiLUConv2D-BN-SiLUConcat+CspLayerDownSampleDownSampleConcat+CspLayerConcat+CspLayerConcat+CspLayerConv2DConv2DConv2D-BN-SiLU(160
17、,160,128)CspLayer(160,160,128)CspLayer(80,80,256)CspLayer(40,40,256)CspLayer(20,20,1 024)Conv2D-BN-SiLU(80,80,256)Conv2D-BN-SiLU(40,40,256)Conv2D-BN-SiLU(20,20,1 024)SPPBottleneck(20,20,1 024)SPPBottleneck无处理5913YOLOHeadYOLOHeadYOLOHeadUpSampling2DUpSampling2D图 1YOLOv5 算法架构Conv2D模块是复合卷积模块,由卷积、BN 层和激
18、活函数组成,是 YOLOv5 的最基础模块.BN 层的目的是对数据做归一化处理,防止训练网络的过程中出现梯度消失或爆炸.Focus 模块,首先将得到的图片进行切片操作.将RGB 三通道上的值每隔一个像素取下,切分成 4 张特征图,相当于将高、宽信息压缩到通道空间,使得输入通道扩充为原先的 4 倍.减少信息丢失的同时,提升了网络的效率.CspLayer 模块,也常被称为 C3 模块.特征图经过该模块会进入两个分支,在一个分支中经过标准卷积层以及堆叠的 Bottleneck 模块;另一分支中只经过一个标准卷积层,最后将分别得到的特征图进行拼接.该模块主要用于对残差特征进行学习.SPP模块为空间金字
19、塔池化模块,能够转换任意大小的特征图成为大小固定的特征向量.当特征图经过 SPP模块时,首先经过卷积层减少通道数,接着经过 3 个分支,使用 3 个不同大小的卷积核进行池化下采样,最后按通道数将池化结果与原本的特征图拼接.通道数较原来稍有扩大,但有效地提升了感受野.1.2 深度可分离卷积深度可分离卷积是改进标准卷积计算的算法,其结构由逐通道卷积(depthwiseconvolution)和逐点卷积(pointwiseconvolution)组成.逐通道卷积中,每个通道的特征图都会通过一个卷积核进行卷积运算.如图 2 前段部分所示,此过程后,得到的特征图的通道数与输入时的通道数一致.图 2深度可
20、分离卷积计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第9期134软件技术算法SoftwareTechniqueAlgorithm逐点卷积与常规卷积的运算相似,可以对特征图进行升维和降维操作,其卷积核的尺寸为11.逐点卷积会将逐通道卷积取得的特征图在不同通道上进行加权组合,生成最终的特征图.深度可分离卷积通过转换空间维度和通道维度的信息,提升卷积网络的效率,降低卷积计算的参数量.在检测任务中,深度可分离卷积可以帮助模型有效降低计算量,提高检测性能.1.3 Ghost 卷积Ghost 卷积的核心思想是将一般卷积拆分.如图 3所示,Ghost 卷积从少量非线性的卷积获取的
21、特征上,再使用线性卷积操作,生成 Ghost 特征图.接着将两段卷积得到特征图叠加,得到更多通道数的特征图.借此消除冗余特征,轻量化模型计算.whc输入恒等映射输出本征特征图Ghost 特征图12n.图 3幽灵卷积2改进的 YOLOv5 算法 2.1 网络整体结构本文对 YOLOv5 算法进行了改进,改进后的 YOLO-MLK 模型网络结构如图 4 所示,算法架构如表 1 所示.首先,使用轻量级网络 MobileNetV2 替代原本的骨干网络.接着提出一种新的融合深度可分离大卷积的特征图金字塔网络 LKL-PAN.最后,替换了网络的损失函数,使用 SIoU 作为网络的损失函数.FocusCon
22、vConvConvConvSliceSliceSliceSliceConvConvConvConvConvConvConvConvAddSPPBottleneck(True)Bottleneck(False)Bottleneck(False)FocusConv BN SiLUConvConvConcatConcatConcatConcatConcatConcatConcatConcatConvConvUpsampleUpsampleUpsampleConvSPPC3-1 trueC3-1 FalseC3-1 FalseC3-1 FalseC3-1 FalseC3-1 FalseC3-1 Fal
23、seC3-1FalseC3-1FalseC3-1FalseGhostConvGhostConvDSConvDSConvDetectMaxPoolMaxPoolMaxPoolC3-n图 4YOLO-MLK 模型架构表 1 中,MobileNetV2-1 为 MobileNetV2 的 13 层,MobileNetV2-2 的 4 和 5 层,MobileNetV2-3 为 Mobile-NetV2 的 69 层,Upsample 为上采样,Concat 为数据拼接,SPPF 为快速空间金字塔池化模块,C3 为 YOLOv5中的 C3 模块,DSConv 为深度可分离卷积,GhostConv为幽灵
24、卷积.2.2 轻量化骨干网络骨干网络是目标检测任务的基本特征提取器,优质的骨干网络能够提取丰富的特征,降低目标检测任务的复杂性,提高目标检测网络的性能.YOLOv5 的骨干网络为 CSPDarknet53,相比与 YOLOv4 的骨干网络具有参数量更小,检测速度更快,特征提取效率更高的优点.但是 CSPDarknet53 并不能很好地适应移动端设备,参数量、计算量和特征提取仍有提升的空间.受目标检测网络模型轻量化的思想启发,本文选取MobileNetV2 替代 YOLOv5 中的 CSPDarknet 作为目标检测网络的骨干网络,降低模型的计算量和计算量,提高模型的特征提取效率,模块组成如表
25、2 所示.其中,Input 表示输入的特征图大小,Operator 表示执行相应的操作,t 表示瓶颈层内部升维的倍数,c 表示输出特征的维数,n 表示该瓶颈层重复的次数,s 表示瓶颈层第 1 个卷积操作的步幅,Conv2D 表示标准卷积2023年第32卷第9期http:/www.c-s-计 算 机 系 统 应 用SoftwareTechniqueAlgorithm软件技术算法135模块,Bottle-neck 表示瓶颈层模块,avgpool表示平均池化操作.表 1YOLO-MLK 算法的架构层数From参数量模块名称1155488MobileNetV2-121487040MobileNetV2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 YOLOv5 改进 量化 目标 检测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。