高性能YOLOv5:面向嵌入式平台高性能目标检测算法研究.pdf
《高性能YOLOv5:面向嵌入式平台高性能目标检测算法研究.pdf》由会员分享,可在线阅读,更多相关《高性能YOLOv5:面向嵌入式平台高性能目标检测算法研究.pdf(11页珍藏版)》请在咨信网上搜索。
1、高性能YOLOv5:面向嵌入式平台高性能目标检测算法研究刘乔寿赵志源*王均成皮胜文(重庆邮电大学通信与信息工程学院重庆400065)(先进网络与智能互联技术重庆市高校重点实验室重庆400065)(泛在感知与互联重庆市重点实验室重庆400065)摘要:针对目前深度学习单阶段检测算法综合性能不平衡以及在嵌入式设备难以部署等问题,该文提出一种面向嵌入式平台的高性能目标检测算法。基于只看1次5代(YOLOv5)网络,改进算法首先在主干网络部分采用设计的空间颈块代替原有的焦点模块,结合改进的混洗网络2代替换原有的跨级局部暗网络,减小空间金字塔池化(SPP)的内核尺寸,实现了主干网络的轻量化。其次,颈部采
2、用了基于路径聚合网络(PAN)设计的增强型路径聚合网络(EPAN),增加了P6大目标输出层,提高了网络的特征提取能力。然后,检测头部分采用以自适应空间特征融合(ASFF)为基础设计的自适应空洞空间特征融合(A-ASFF)来替代原有的检测头,解决了物体尺度变化问题,在少量增加额外开销情况下大幅提升检测精度。最后,函数部分采用高效交并比(EIoU)代替完整交并比(CIoU)损失函数,采用S型加权线性单元(SiLU)代替HardSwish激活函数,提升了模型的综合性能。实验结果表明,与YOLOv5-S相比,该文提出的同版本算法在mAP.5,mAP.5:.95上分别提高了4.6%和6.3%,参数量降低
3、了43.5%,计算复杂度降低了12.0%,在JetsonNano平台上使用原模型和TensorRT加速模型进行速度评估,分别减少了8.1%和9.8%的推理延迟。该文所提算法的综合指标超越了众多优秀的目标检测网络,对嵌入式平台更为友好,具有实际应用意义。关键词:目标检测;YOLOv5;混洗网络2代;自适应空间特征融合;嵌入式设备;TensorRT加速中图分类号:TN911.73文献标识码:A文章编号:1009-5896(2023)06-2205-11DOI:10.11999/JEIT220413High Performance YOLOv5:Research on High Performanc
4、e TargetDetection Algorithm for Embedded PlatformLIUQiaoshouZHAOZhiyuanWANGJunchengPIShengwen(School of Communication and Information Engineering,Chongqing University of Posts andTelecommunications,Chongqing 400065,China)(Advanced Network and Intelligent Connection Technology Key Laboratory of Chong
5、qing EducationCommission of China,Chongqing 400065,China)(Chongqing Key Laboratory of Ubiquitous Sensing and Networking,Chongqing 400065,China)Abstract:Consideringtheproblemsofimbalancedcomprehensiveperformanceofthecurrentdeeplearningsingle-stagedetectionalgorithmsanddifficultdeploymentinembeddeddev
6、ices,oneHigh-Performanceobjectdetectionalgorithmforembeddedplatformsisproposedinthispaper.BasedontheYouOnlyLookOncev5(YOLOv5)network,inthebackbonenetworkpartoftheimprovedalgorithmfirstly,theoriginalfocusmoduleandoriginalCrossStagePartialDarknetarereplacedbyadesignedspacestemblockandanimprovedShuffle
7、Netv2,respectively.ThekernelsizeofSpacePyramidPooling(SPP)isreducedtolightenthebackbonenetwork.Secondly,intheneck,anEnhancedPathAggregationNetwork(EPAN)basedonPathAggregationNetwork(PAN)designisadopted,aP6largetargetoutputlayerisadded,andthefeatureextractionabilityofthenetworkisimproved.Andthen,inth
8、ehead,anAdaptive-AtrousSpatialFeatureFusion(A-ASFF)basedonAdaptiveSpatialFeatureFusion(ASFF)isusedtoreplacetheoriginaldetectionhead,theobjectscalechangeproblemissolved,andthedetectionaccuracyisgreatlyimprovedwithasmallamountofadditional收稿日期:2022-04-07;改回日期:2022-07-07;网络出版:2022-07-08*通信作者:赵志源第45卷第6期电
9、子与信息学报Vol.45No.62023年6月JournalofElectronics&InformationTechnologyJun.2023overhead.Finally,inthefunctionsection,aCompleteIntersectionoverUnion(CIoU)lossfunctionisreplacedbytheEfficientIntersectionoverUnion(EIoU),aHardSwishactivationfunctionisreplacedbyaSigmoidweightedLinearUnit(SiLU),andmodelsynthesi
10、sabilityhasbeenimproved.TheexperimentalresultsshowthatcomparedtoYOLOv5-S,themAP.5andmAP.5:95ofthesameversionofthealgorithmproposedinthispaperareincreasedby4.6%and6.3%whilethenumberofparametersandthecomputationalcomplexityarereducedby43.5%and12.0%,respectively.UsingtheoriginalmodelandtheTensorRTaccel
11、eratedmodelforspeedevaluationontheJetsonNanoplatform,theinferencelatencyisreducedby8.1%and9.8%,respectively.Thecomprehensiveindicatorsofmanyexcellentobjectdetectionnetworksandtheirfriendlinesstoembeddedplatformsaresurpassedbythealgorithmproposedinthispaperandthepracticalmeaningisgenerated.Key words:
12、Objectdetection;YOLOv5;ShuffleNetv2;AdaptiveSpatialFeatureFusion(ASFF);Embeddeddevice;TensorRTacceleration1 引言在过去10年中,目标检测技术已广泛运用在智能视频监控、交通场景检测等领域1。此技术通过卷积神经网络获取特征,提升检测性能。当前主流基于卷积神经网络的目标检测算法可划分为两类:一类是以区域卷积网络(Region-basedConvolu-tionalNeuralNetwork,RCNN)2为主流的双阶段目标检测算法,其精度高但速度慢,是一种先产生候选框,再检测的算法;另一类是以单
13、镜头多框检测器(SingleShotmultiboxDetector,SSD)3和只看1次网络(YouOnlyLookOnce,YOLO)4为代表的单阶段目标检测算法,其速度快但精度低,是一种生成候选框过程一体化的实现,因此该算法更适合高实时性的目标检测任务。在过去6年中,YOLO算法已升级到第5个版本,形成目标检测系列。Redmon等人4首次提出YOLO目标检测框架,将整张图片作为网络输入,在输出层上直接对框的位置和类别预测,将目标检测视为回归问题。Redmon等人5继续提出YOLOv2,对预测准确率、速度、识别对象3方面进行了改进。Redmon等人6进一步提出YOLOv3,融合特征金字塔网
14、络结构来实现多尺度检测。YOLOv47作者通过组合大量前人所提技术并适当创新,实现性能最优平衡。而最近的YOLOv58与YOLOv4性能相似并共享相同设计,其代码全由PyTorch框架编写,更关注可访问性和开发环境使用。此外,YOLOv5比YOLOv4模型更小,训练和推理速度更快。YOLO系列虽然优秀,但其参数量较大且计算复杂度较高需要更强的图像处理器来部署。近年来,随着边缘计算、智能终端的发展,在嵌入式设备上部署人工智能模型受到广泛关注。特别地,JetsonNano因具有便携式、低功耗等特点被广泛应用在安防、交通等场景9,10,而且通过TensorRT还可以在保证检测精度的情况下实现推理加速
15、11。为了提升精度,往往需要使用更复杂的网络模型,但受嵌入式设备内存少且计算能力不足等限制,往往需要更轻量级的目标检测框架,以满足实时处理的需求。针对此类限制,研究者推出一系列YOLO的Tiny版本,如YOLOv2-Tiny,YOLOv3-Tiny,YOLOv4-Tiny12等,而YOLOv5则通过调整尺度比例来解决模型轻量化问题。其次许多研究者提出轻量级神经网络,如混洗网络2代(ShuffleNetv2)13通过内存访问成本和平台特点避免大量冗余计算,纳米网络(NanoDet)14系列通过集成多种轻量级方法同时兼顾速度、精度和体积。此外,文献9基于YOLOv4-Tiny实现对车辆的实时检测,
16、并部署到JetsonNano中,文献10通过YOLOv5实现交通标志识别,并结合JetsonNano实现智能小车设计。在嵌入式设备上,上述目标检测算法存在网络结构复杂、综合性能不平衡或嵌入式设备部署困难等问题。针对这些问题,以JetsonNano为例,本文提出一种面向嵌入式平台的高性能目标检测算法,命名为高性能-只看1次5代网络(HighPerformance-YouOnlyLookOncev5,HP-YOLOv5)。首先,该算法在主干网部分设计了空间颈块(spacestem)代替原焦点(focus)模块,使用改进的ShuffleNetv2代替原跨级局部暗网(CrossStagePartial
17、Darknet,CSPDarknet),并减少了空间金字塔池化(SpatialPyramidPooling,SPP)的内核尺寸,使主干网络架构更轻量化。其次,在颈部以路径聚合网络(PathAggregationNetwork,PAN)为基础设计了增强型路径聚合网络(EnhancedPathAggregationNetwork,EPAN),并增加了P6大目标输出层,提升检测性能。然后,在检测头使用改进的自适应空间特征融合(AdaptiveSpaceFeatureFusion,ASFF)15模块。最后本文通过修改了边框损失函数和激活函数以提升模型的综合能力。经实验验证,2206电子与信息学报第45
18、卷本文算法超越众多优秀的目标检测网络,实现了准确率和速度的最佳平衡,对嵌入式设备部署更加友好,具有实际应用意义。2 方法2.1 YOLOv5算法YOLOv5有4种不同的配置,包括S,M,L和X系列,检测性能和网络深度均由浅入深,以满足不同场景的检测需求。此网络架构如图1所示。一般情况下,YOLOv5模型包括输入、主干网、颈部和检测头4部分。网络输入部分通过马赛克数据增强等方式对图像预处理。预处理后图片通过Focus结构进行切片操作,然后通过多个卷积模块、CSP模块和SPP模块生成新特征图。颈部使用PAN实现特征融合。在头部生成边界框并预测目标的分类。2.2 YOLOv5算法改进针对嵌入式设备资
19、源有限的特点,直接部署YOLOv5网络架构会消耗大量设备资源。若使用小尺度的YOLOv5网络,其精度和速度难以有效平衡。为了解决此问题,本文对YOLOv5原始网络架构进行了6处关键修改:(1)提出了SpaceStem代替原始的Focus模块;(2)结合改进的ShuffleNetv2对CSPDarknet进行替换;(3)改变了SPP模块并且使用了更小的内核;(4)基于PAN,设计了新的EPAN来代替PAN;(5)添加了P6输出块,1个步长为64的大目标检测层;(6)融合改进的ASFF模块来增强检测头性能。2.2.1 主干网络轻量化2.2.1.1 Stem架构设计Focus模块虽然可以加速模型训练
20、,减少模型图1YOLOv5整体架构图第6期刘乔寿等:高性能YOLOv5:面向嵌入式平台高性能目标检测算法研究2207参数和计算复杂度。但本文对此模块进行了剔除,主要有两个原因:(1)切片操作有助于加强特征间联系,但需要在深层卷积下才有效,这也会加大训练难度;(2)频繁的切片操作对于嵌入式平台并不友好以及网络量化操作并不支持Focus模块。为了解决以上问题,本文设计了类似文献16的Stem模块来代替Focus模块,命名为SpaceStem模块,具体结构如图2所示。首先将输入图片通过33卷积来调整通道数,然后通过两部分进行处理,一部分通过一个卷积核为22、步长为2的最大池化层;另一部分通过一个普通
21、卷积将通道数调整为以前的1/2,再通过一个卷积核为13和卷积核为31、步长为2的空间可分离卷积进行特征提取,并将两部分进行合并,再通过通道混合融合通道间信息,最后通过11卷积对通道数进行调整。使用SpaceStem模块,计算复杂度会略微增加,但会大幅提升模型的表示能力。2.2.1.2 IS Block模块设计虽然CSPDarknet有强大的特征提取能力,但其网络参数和计算复杂度会消耗嵌入式设备大量计算资源。针对此问题,本文结合改进的Shuffle-Netv2对原主干进行修改,以减少计算资源。ShuffleNetv2是一种针对移动设备而设计的轻量级网络,以计算浮点运算量(FLoating-poi
22、ntOperationsPersecond,FLOPs)为指导和4种网络设计理念为准则,并结合深度可分离卷积、通道划分(ChannelSplit)和通道混合(ChannelShuffle)等操作提升网络计算效率,减少模型的计算复杂度和参数量,从而降低内存占用率。对于ShuffleNetv2中空间下采样的ShuffleBlock,每个分支均采用步长为2的深度可分离卷积,以实现下采样操作,随后通过11卷积来调整通道数,最后合并在一起并进行ChannelShuffle操作,使得通道数翻倍,具体结构如图3(a)所示。而Shuffle-Netv2中基础的ShuffleBlock,通过ChannelSpl
23、it划分通道,一部分通过11卷积减少通道数,采用深度卷积进行处理,随后通过11卷积调整通道数,另一部分无处理,直接将两部分进行合并,最后通过ChannelShuffle来加强通道间的信息融合,具体结构如图3(b)所示。图2SpaceStem架构图图3ShuffleBlock和ISBlock的模块对比图2208电子与信息学报第45卷由于直接将CSPBlock替换成ShuffleBlock会损失大量精度,因此本文还需要对ShuffleBlock进行合理改进,改进后的ShuffleBlock叫做增强型混合网络(ImprovedShuffleBlock,ISBlock),整体结构如图3(c)和图3(d
24、)所示。具体地,ChannelShuffle虽然提供了信道的信息交换,但会导致融合特性的丢失。为了解决此问题,本文在步长为2时增加了33的普通卷积和11的点卷积来整合不同信道信息。幽灵网络(GhostNet)17作者提出一种轻量化的Ghost模块,可通过少量参数来产生更多有效特征,从而提升网络性能。因此本文在步长为1的模块中引入Ghost模块,来减小计算复杂度。虽然深度可分离卷积会让整个网络变得更轻量化,但是这会极大减少模型的准确度,而对于推理速度提升略低。因此,本文将ISBlock中的深度可分离卷积全部改为普通卷积,以获得更好的性能,推理速度的损失位于可接受的范围。由于在卷积前或后使用11的
25、卷积,其作用通常为融合通道间信息和降维升维,所以本文认为左分支上使用两个11卷积是多余的。因此删除了卷积后的11卷积,进一步降低了参数量和计算复杂度,提升了推理速度。2.2.1.3 小内核SPP送入颈部之前,主干网最后部分的输出特征图可通过SPP模块增加感受野,从而分离出最重要的特征,但是过大的池化卷积核会使得网络推理时延增大。针对此问题,本文通过将原SPP内核大小(1313,99,55)修改为(99,55,33),较小的内核能够在维持性能的情况下减少推理时延。此外本文将主干网最大输出通道数降低为512,在降低计算复杂度的情况下能有效降低推理时延。2.2.2 特征融合性能增强2.2.2.1 E
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 性能 YOLOv5 面向 嵌入式 平台 目标 检测 算法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。