基于YOLO的多类别多目标检测算法改进_马帅.pdf
《基于YOLO的多类别多目标检测算法改进_马帅.pdf》由会员分享,可在线阅读,更多相关《基于YOLO的多类别多目标检测算法改进_马帅.pdf(4页珍藏版)》请在咨信网上搜索。
1、68|电子制作 2023 年 6月软件开发0 引言智能车辆的技术可分为四个层面:环境感知、行为决策、路径规划和运动控制,环境感知是获取外部信息的唯一渠道。随着计算机硬件资源和卷积算法的不断突破,基于CNN(卷积神经网络)的目标检测算法也得到质的提升,并且在精度和性能方面取得了显著成果1。基于 CNN 的目标检测算法目前主要分为 Two-Stages(二阶段)和 One-Stage(一阶段)两种2,两阶段目标检测算法主要有R-CNN、SPP-Net、Fast R-CNN 系列和 Mask R-CNN 等;单阶段目标检测算法主要有 SDD 算法和 YOLO 系列算法。智能驾驶感知应达到实时识别的要
2、求,所以只能采用一阶段算法。智能驾驶环境感知现如今分为两个派别:多传感器信息数据融合和视觉感知,基于视觉的环境感知成本相对来说要低得多。本文的自动驾驶目标检测仍选用 YOLO V3 作为视觉感知算法基础框架,针对 YOLO V3 检测器识别精度不高,且检测速度和模型大小均有一定的提升空间的问题,提出了一些可行方案。1 YOLO V3 网络结构YOLO V3 的检测过程细分可以分两步:首先确定检测目标的位置,再对被检测目标进行分类。网络接收到图像数据先将其宽高尺寸变为 416416,经过一系列的卷积操作、残差结构及上采样处理,最后输出目标物体位置、类别以及置信度。不同于 YOLO V2 的检测策
3、略,YOLO V3 具有三个不同尺度上的检测,而YOLO V2只有一个检测头(Detection Head),不同的尺度特征包含丰富的语义信息。YOLO V3网络结构图如图 1 所示。当输入尺寸为 416416 时,32 倍/16 倍/8 倍下采样后三个检测头的大小分别为 1313、2626 和 5252。YOLO V3仍使用K-Means聚类法生成Anchor Box(先验框)。简单来说,Anchor Boxes 就是对预测的对象范围进行约束,对于每一个网格都生设置 3 个 Anchor Boxes,由于在三个不同尺度 Feature Map 上做预测,所以一个位置共有 9 个Anchor
4、Boxes。该算法的缺点是对于小而密集目标检测效果不佳,且检测速度和模型大小均有进一步的优化空间。基于 YOLO 的多类别多目标检测算法改进马帅1,田国富1,张文鹏1,周淑文2(1.沈阳工业大学,辽宁沈阳,110027;2.东北大学,辽宁沈阳,110167)摘要:针对智能驾驶感知算法检测效果不佳、模型过大等问题,在YOLO V3算法上进行改进,首先选取了一种更加高效且更符合实际需求的激活函数GELU激活函数,构建的DBG模块不仅在负区间对数值处理更加得当,且在一定程度上抑制过拟合倾向;考虑到目标语义信息和位置信息分布不均对检测效果的影响,提出双塔结构将两种信息进一步融合,并在中路增加DBG模块
5、对融合后的信息强化提取,进一步提升目标的识别率;本着精度不变的条件下模型越小越好的原则对模型进行层级剪枝优化,提高了智能驾驶感知算法的检测速度且降低了模型大小。实验首先通过K-Means聚类算法生成先验框,最后在BDD100K数据集上进行测试,实验结果相比YOLO v3算法,Bus检测精度提升了5%,Bike和Rider检测精度提升了3%;改进前后mAP提高了2.375%;且FPS提升7%;模型大小由240882KB减少到234134KB,具有更好的实用性。关键词:智能驾驶;信息融合;DBG模块;YOLO;K-Means图 1 YOLO V3 网络结构图DOI:10.16589/11-3571
6、/|69软件开发2 YOLO V3-S 网络结构 2.1 GELU 激活函数神经网络中包含丰富的非线性因素,如:SMU、Relu、Maxout 和 SLU 等激活函数,激活函数可以加强网络的非线性能力。在 YOLO V3 网络中采用的 Leaky Relu 激活函数避免了死亡 Relu 问题,因为即使在负区间也有一定的数值允许较小的梯度传递,缺点是无法避免梯度爆炸问题且对负值处理不当,在微分时左右两部分都是线性的。如果想要网络模型具有很好的泛化能力,可用的方法有扩大数据集、设置更大的 Batch Size、采用数据增强手段和随机失活(Dropout),增加数据集容量增加了成本,更大的 Batc
7、h Size 对硬件提出了更高的挑战,所以数据增强和随机失活变成了常用的去拟合手段。随机失活遍历网络中的每层节点通过预先设定的概率保证每层节点的成活性,来减轻神经网络的过拟合。GELU 作为一种符合预期的随机正则变化方式的高性能激活函数,在 Relu 的基础上加入了统计的特性,即增加了网络的非线性能力又抑制了网络的过拟合倾向,如图 2 所示函数曲线。图 2 GELU 和 Leaky ReLU 激活函数 图 3 DBG 模块YOLO V3 网络模型中包含很多的 DBL 模块,鉴于上述所述的 Leaky Relu 的缺点和 GELU 激活函数的优点,构建DBG 模块替换原网络中的 DBL 模块,如
8、图 3 所示。2.2 定位信息和语义信息融合顶层语义信息虽然丰富,但网络层数越多会导致位置信息变得更加模糊,这就造成了顶层特征的目标类别预测可能会很准确,但目标的位置预测信息可能会很差;如果选择一个浅层网络作为目标检测的卷积神经网络,目标的位置预测信息可能很准确,但是目标类别预测可能会差很多。YOLO V3 中的 FPN 结构融合了底层的位置信息和顶层的语义信息,扩大了底层的感受野,使得底层位置获得了更多的上下文信息,提高了目标检测算法的性能表现。一方面 FPN 增加了算法的检测能力。另一方面由于经历连续的上采样操作(Up Sample),使得上采样后的特征信息形成了一定程度的损坏,为了恢复每
9、一个候选区域和特征层之间的信息和路径,参考PANet 网络结构,增加下采样操作(Down Sample)构成双塔结构,与相邻特征图进行信息融合。为了防止连续下采样操作对图像数据位置信息以及语义信息造成损失,在26*26*45 支路增加一次卷积操作做进一步的特征提取。2.3 模型简化网络轻量化的方法有很多种,主要包括采用轻量化主干网络、知识蒸馏和模型剪枝。随着对算法的性能要求越来越高,虽然Alexnet网络很大程度上地提升了算法的检测精度,但是也增大了计算量和模型大小,目前工业界除了对检测精度有要求,对于检测速度和模型大小也有很大的要求,想要算法走出实验室,必须要综合考虑上述问题作为自动驾驶视觉
10、感知的目标检测算法除了要满足精度上的要求外,对网络模型大小以及检测速度也有一定的要求,车载平台系统内存有限,优秀的目标检测算法在保证精度的同时占用越小的内存越好。模型剪枝是通过一定手段删除网络中的冗余参数,从而起到降低网络模型大小,提高检测速度的目的。模型剪枝按照剪枝粒度可分为细粒度剪枝、向量剪枝、核剪枝和滤波器剪枝。前三种在网络的推理过程中每个卷积层的输出通道数不会发生改变,属于非结构化剪枝;滤波器剪枝会影响网络中卷积层的输出通道数,属于结构化剪枝。在图像经过主干网络特征提取后几乎都会经过 DBL*5 的卷积操作,这种运行成本是巨大的,虽然进一步加强了网络的特征提取能力,但是也使得网络变得更
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 YOLO 类别 多目标 检测 算法 改进 马帅
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。