基于YOLOv4的车辆与行人检测网络设计_谭光兴.pdf
《基于YOLOv4的车辆与行人检测网络设计_谭光兴.pdf》由会员分享,可在线阅读,更多相关《基于YOLOv4的车辆与行人检测网络设计_谭光兴.pdf(6页珍藏版)》请在咨信网上搜索。
1、基金项目:国家自然科学基金项目(61563005)收稿日期:2021-06-02 修回日期:2021-06-10 第 40 卷 第 4 期计 算 机 仿 真2023 年 4 月 文章编号:1006-9348(2023)04-0128-06基于 YOLOv4 的车辆与行人检测网络设计谭光兴,岑满伟,苏荣键(广西科技大学电气与信息工程学院,广西 柳州 545616)摘要:针对 YOLOv4 网络模型参数量大,难以在资源有限的设备平台上运行的问题,提出一种对 YOLOv4 轻量化的车辆和行人检测网络。以 MobileNetV1 为主干网络,将 PANet 和 YOLO Head 结构中的标准卷积替换
2、成深度可分离卷积,减少模型参数量;同时利用跨深度卷积结合不同膨胀率的空洞卷积构建特征增强模块,改善不同预测层对车辆和行人尺度变化的适应能力,提高网络的检测精度。实验结果表明,上述网络模型大小为 45.28MB,检测速度为 44FPS,相比 YOLOv4 模型大小减少 81.44%,检测速度提升 91.30%,在 PASCAL VOC2007 测试集上,检测精度达到 86.32%,相比 MobileNetV1-YOLOv4 原网络提高 1.29%的精确度,能够满足实时高效的检测要求。关键词:深度学习;目标检测;特征增强;轻量化中图分类号:TP183 文献标识码:BDesign of Vehicl
3、e and Pedestrian Detection NetworkBased on YOLOv4TAN Guang-xing,CEN Man-wei,SU Rong-jian(School of Electrical and Information Engineering,Guangxi University of Scienceand Technology,Liuzhou Guangxi 545616,China)ABSTRACT:Aiming at the problem that the number of YOLOv4 network model parameters is larg
4、e and is difficultto run on device platforms with limited resources,a lightweight vehicle and pedestrian detection network for YOLOv4is proposed.Using MobileNetV1 as the backbone network,the standard convolution in the PANet and YOLO Headstructure is replaced with a deep separable convolution to red
5、uce the amount of model parameters;at the same time,the cross-depth convolution combined with the atrous convolution with different dilation rates is used to construct afeature enhancement module,improving the adaptability of different prediction layers to the scale changes of vehiclesand pedestrian
6、s and increasing the detection accuracy of the network.The experimental results show that the size ofthe network model is 45.28MB,which is 81.44%smaller than that of the YOLOv4 model;its detection speed is44FPS,an increase of 91.30%compared to the YOLOv4 model.On the PASCAL VOC2007 dataset,the detec
7、tionaccuracy reaches 86.32%,an increase of 1.29%compared to the original MobileNetV1-YOLOv4,which meets therequirements of real-time and efficient detection.KEYWORDS:Deep learning;Object detection;Feature enhancement;Lightweight1 引言随着机器视觉和人工智能的不断发展,自动驾驶技术已成为当今汽车发展的研究热点,其中前方道路的障碍物检测技术是自动驾驶汽车所面临的挑战。车辆
8、和行人是汽车正常行驶时前方常见的障碍物,实现对车辆和行人的准确且实时检测已成为目标检测技术领域的研究热点1。考虑到设备平台资源有限,目标检测系统不宜占用较大内存,要求检测系统轻量、实时且精准。如今,基于深度学习的目标检测算法不断发展,已经成为对车辆和行人检测主流的方法,主要分为 two-stage 和 one-stage 两种目标检测网络。two-stage 目标检测网络主要是基于侯选区域的检测算法,Girshick 等2最早提出 R-CNN网络,先产生侯选区域,再对侯选区域进行分类和回归。之后提出 Fast-RCNN3,使用感兴趣区域池化结构对候选区域821进行尺度同一化以及引入多任务损失函
9、数,提升网络性能。Girshick 等4基于区域侯选网络结构,再次提出 Faster-RCNN 网络。He 等5提出 Mask-RCNN 算法,通过引入 Mask分支和 RoIAlign 结构,取得较好地检测能力。虽然 two-stage目标检测网络精度高,但检测速度相对较慢,实时性较差。one-stage 目标检测网络是基于回归思想,采用端到端的检测方法,直接产生目标物的位置坐标和类别概率。Redmon等6提出 YOLOv1 算法,将整张图像送入网络训练,在输出层完成对目标物的分类和定位,检测速度得到提升。Liu等7提出 SSD 算法,引入先验框进行回归,并结合多尺度特征来提高目标物的检测能
10、力。Redmon 等8提出 YOLOv2 算法,使用 K-Means 聚类出先验框进行检测。随后再次提出YOLOv39,采用 Darknet-53 作为主干网络,采用特征金字塔结构,融合多尺度特征进行检测。Bochkovskiy 等10提出YOLOv4 算法,该网络汇集目前主流的优化技巧以及复杂的网络结构,能够精准地检测目标物,在 YOLO 系列算法中较为先进的。但是 YOLOv4 网络参数量和模型体积庞大,占用较大内存,难以在运算能力较弱的嵌入式设备实时地检测目标物。在设备计算资源有限的情况下,目标检测网络需要综合考虑检测精度和检测速度两者问题。针对 YOLOv4 的不足之处,本文对其算法进
11、行轻量化,用 MobileNetV1 轻量化网络替换主干网络,进一步将网络中的标准卷积替换为深度可分离卷积,减少模型参数量;为弥补精度损失的降低,构建与各预测层特点相适应的特征增强模块,借助跨深度卷积和空洞卷积结构来改善各预测层对车辆和行人尺度变化的适应能力。改进后的 MobileNetV1-YOLOv4 网络模型具有参数量少、体积小、速度快的优点,在精度上有一定地提升,提高了对小目标的检测能力。2 网络模型分析2.1 YOLOv4 网络结构YOLOv410网络结构可以看成四个模块组成:特征提取模块、空间金字塔池化模块、路径聚合网络模块以及预测模块。相比 YOLOv3 的 Darknet53
12、主干网络,YOLOv4 融入交叉阶段部分连接(Cross State Partial,CSP)11,设计出 CSP-Darknet53 特征提取结构,增强网络学习能力,也降低计算复杂度。加入空间金字塔池化模块(Spatial Pyramid Pooling,SPP)12,融合局部和全局特征,增大网络感受野;为改善深层网络丢失浅层网络信息的问题,引入路径聚合网络(PathAggregation Network,PANet)13;预测模块结构上没有变化,依旧采用 Yolo Head1、Yolo Head2、Yolo Head3 检测头对不同尺度进行预测,得出最后的类别、置信度和预测边框信息。以输入
13、尺寸为 416416,目标类别数为 20 的 YOLOv4 网络结构如图 1 所示。在损失函数方面,YOLOv4 使用 CIOU 作为目标边界框回归损失函数,避免出现预测框和真实框没有重叠部分而无图 1 YOLOv4 网络结构法优化 IOU 损失的问题。CIOU 综合考虑预测框和真实框的重叠面积、中心点距离以及长宽比,优化预测框回归精度和速度,损失函数如式(1)所示LCIOU=1-IOU+2(b,bgt)c2+(1)其中=(1-IOU)+(2)=42arctanwgthgt-arctanwh|2(3)式中的 p2(b,bgt)表示为预测框的中心点 b 与真实框的中心点 bgt的欧氏距离,c 表
14、示为包围真实框和预测框的最小外接矩形的对角线距离。是用来协调比例参数,是用来衡量长宽比一致性的参数,wgt、hgt表示真实框的宽高,w、h 表示预测框的宽高。2.2 MobileNet 网络结构MobileNet14是考虑专门将网络模型使用在嵌入式设备或者移动设备上,所提出的一种轻量化的网络模型,其核心思想是采用深度可分离卷积结构。相比标准卷积,深度可分离卷积结构主要分为深度卷积(Depthwise Convolution)结构和点卷积(Pointwise Convolution)结构。深度卷积(DW)对输入特征的每个通道分别用卷积核进行卷积,大幅度地减少卷积计算量;点卷积(PW)通过 11
15、卷积核整合深度卷积后的特征图信息,使每张的输出特征图信息都能包含每张输入特征图信息。标准卷积和深度可分离卷积的结构对比如图 2所示。921图 2 标准卷积和深度可分离卷积的结构图 2 中 DK和 1 为卷积核的尺寸大小,M 和 N 分别为网络的输入通道数和输出通道数,通过图 2 的结构对比,能够计算出标准卷积的参数量为 DKDKMN,深度可分离卷积的参数量为 DKDK1M+11MN。由此可知深度可分离卷积和标准卷积的参数量之比为:DK DK 1 M+1 1 M NDK DK M N=1N+1D2K(4)标准卷积的参数量大约是深度可分离卷积的 D2K倍,使用深度可分离卷积能够在跨通道整合特征信息
16、的同时,降低了网络参数量,提高模型推理速度。MobileNetV1 网络模型是基于深度可分离卷积结构搭建而成,其网络结构如表 1所示。表 1 MobileNetV1 网络结构Type/StrideFilter ShapeInput SizeConv/s2333322242243Conv dw/s13332 dw11211232Conv/s111326411211232Conv dw/s23364 dw11211264Conv/s11164128565664Conv dw/s133128 dw5656128Conv/s1111281285656128Conv dw/s233128 dw56561
17、28Conv/s1111282562828128Conv dw/s133256 dw28 28256Conv/s1112562562828256Conv dw/s233256 dw2828256Conv/s11125651214142565Conv dw/s133512 dw14145125Conv/s1115125121414512Conv dw/s233512 dw1414512Conv/s111512102477512Conv dw/s1331024 dw771024Type/StrideFilter ShapeInput SizeConv/s11110241024771024Avg P
18、ool/s1Pool 77771024FC/s110241000111024Softmax/s1Classifier1110243 改进的 MobileNetV1-YOLOv4 算法设计3.1 模型轻量化设计针对 YOLOv4 网络参数量过多、模型体积庞大,占用较大内存的问题,本文提出基于 MobileNetV1-YOLOv4 的车辆和行人检测网络,采用深度可分离卷积思想对模型进行轻量化。本文首先采用 MobileNetV1 来作为 YOLOv4 的主干网络,初步模型记为 MobileNetV1-YOLOv4a,之后再进行深度网络轻量化,即将 PANet 和 Yolo Head 结构中的 33
19、 标准卷积替 换 成 为 深 度 可 分 离 卷 积,模 型 记 为 MobileNetV1-YOLOv4。将 YOLOv4 和两种轻量化模型进行参数比较,统一输入尺寸为 4164163,在本文中检测对象具体为为 Car、Bus、Motorbike、Bicycle、Person,所以类别数为 5,对比结果如表 2 所示。表 2 模型参数对比网络模型参数量/Million模型大小/MBYOLOv463.95243.99MobilenetV1-YOLOv4a40.54154.68MobilenetV1-YOLOv412.2846.88 由表 2 可知,YOLOv4 模型在参数量和模型体积方面都十分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 YOLOv4 车辆 行人 检测 网络 设计 谭光兴
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。