基于深度学习的轻量化目标检测方法研究.pdf
《基于深度学习的轻量化目标检测方法研究.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的轻量化目标检测方法研究.pdf(3页珍藏版)》请在咨信网上搜索。
1、鄢国家重点研发计划资助渊2020YFB1600704冤目标检测被广泛应用于自动驾驶尧机器人视觉尧智能交通尧工业质量检测等在内的许多计算机视觉任务中遥 目标检测在计算机视觉中是一项经典的挑战袁 旨在识别图片或视频中的物体类别和物体位置遥现有的目标检测算法可分为两类院基于锚框的和无锚框的遥基于锚框的一般可分为单阶段检测和两阶段检测遥通常基于锚框的两阶段目标检测咱1暂首先从图像中生成包含目标的区域袁然后在从区域中生成最终的边界框遥两阶段目标检测的检测精度更高袁 但计算量较大难以在嵌入式设备上实现实时检测遥 单阶段目标检测咱2暂在速度和精度之间有较好的平衡袁因此在实践中有广泛的应用袁其中 SSD咱2暂
2、在检测小目标对象时更友好袁但精度上没有竞争力袁YOLO 系列算法咱3暂在速度和精度方面都表现良好袁但是依然存在以下的问题院淤针对不同的数据集需要手动重新设计锚框的大小曰于生成的锚框大部分都是无用的袁导致了正负样本不均衡的问题遥 无锚框目标检测旨在消除锚框袁这是对目标检测的一个显著的改进遥 无锚框的目标检测解决了基于锚框检测的一些问题袁降低了内存开销袁提供了更精确的边界框计算袁提高了准确率遥在轻量化目标检测领域袁 人们致力于实现更精确尧更高效的目标检测遥 YOLObile咱4暂利用模型裁剪和推理加速的方法袁实现了在移动设备上的实时目标检测袁在模型复杂度上有了改进袁但对于精度没有很好兼顾遥 Nan
3、oDet咱5暂则采用了分组卷积代替标准卷积的方法袁使用了 ShffleNetv2咱6暂作为骨干网络使模型更轻袁并使用 ATSS咱7暂和 GFL 来提高精度袁 最终计算量显著下降袁 但精度损失严重遥 YOLOX鄄Nano是目前 YOLOx咱8暂系列中最轻的型号袁是无锚框目标检测算法的一种袁 解决了 YOLO 系列算法的锚框均衡问题遥 因此袁本文在通用目标检测网络算法框架的基础下袁提出一种改进的轻量化目标检测算法袁主要改进点如下院1冤结合深度卷积和线性变换袁提出了一种减少冗余特征图的 G-Module 结构袁并利用一维卷积提出了一种不降维的高效跨通道交互模块袁 同时将标准卷积替换为深度可分离卷积和
4、分组卷积袁实现了轻量化的主干网络模型遥2冤重新设计 CSP-PAN 结构袁对输入到颈部的所有分支的通道数进行 11 卷积统一化袁显著提高了特征提取能力袁降低了网络参数袁 同时将 33 的深度可分离卷积替换为 55 的深度可分离卷积袁扩大了感受野遥1网络结构在本节中袁 主要介绍了本文设计的轻量化主干网络和颈部与头部模块的增强策略遥 整体网络结构如图 1 所示院基于深度学习的轻量化目标检测方法研究鄢田青李迁迁张正渊北方工业大学信息学院袁 北京 100144冤谢莎婷渊北京市地铁运营有限公司袁北京 100044冤Research on Lightweight Target Detection Meth
5、od Based on Deep Learning摘要院针对目前常用的目标检测算法模型体积大尧计算复杂度高尧难以部署到嵌入式设备等问题袁基于通用目标检测算法的思想提出了一种全新的轻量化目标检测模型遥 首先袁利用深度可分离卷积和分组卷积重新设计了主干网络曰其次袁提出高效跨通道交互模块袁对每个通道进行加权运算袁以获得更多的关键特征曰最后袁改进了颈部的轻量化结构袁提高了网络的特征提取能力遥在 COCO 数据上袁0.99M 参数量的模型的 mAP 达到了 30.6%袁证明了该方法在准确率和效率之间实现了更好的平衡袁为目标检测轻量化研究提供了参考遥关键词院深度学习曰轻量化曰目标检测Abstract:Ai
6、ming at the problems of large volume,high computational complexity and difficult deployment to embeddeddevices,this paper proposes a new lightweight target detection model based on the idea of general target detection algo鄄rithm.Firstly,the backbone network is redesigned using deep separable convolu
7、tion and packet convolution.Secondly,anefficient cross-channel interaction module is proposed,and each channel is weighted to obtain more key features.Thelightweight structure of the neck is improved and the feature extraction capability of the network is enhanced.In terms ofCOCO data,mAP of the mod
8、el with 0.99M parameter number in this paper reaches 30.6%,which proves that the proposedmethodachieves abetterbalance betweenaccuracyandefficiency,andprovidesa referencefortheresearchonlightweight target detection.Keywords:deep learning,lightweight,object detection图 1整体网络结构基于深度学习的轻量化目标检测方法研究108叶工业控
9、制计算机曳圆园圆3 年第 猿6 卷第 8 期1.1 主干网络1.1.1 G-Module 模块随着卷积核数量的增加袁 生成的特征矩阵的通道数也会增加袁FLOPs 也会显著地增加遥 因此袁为了减少计算量袁必须减少卷积核的数量遥 本文结合深度卷积和线性变换提出了 G-Mod鄄ule 模块袁在不影响精度的同时降低了模型计算量遥 具体结构如图 2 所示院图 2G-Module 模块G-Module 可以分为两个部分袁其中第一部分是卷积运算袁在这里使用少量的卷积核以减少计算量遥其中输入特征矩阵 X 为c伊澡伊憎袁卷积运算 F 的大小为 噪伊噪袁卷积核的个数为 m 个袁故第一部分的总体参数计算量 匀伊宰伊
10、皂伊c伊k伊k=H伊W伊ns伊c伊k伊k遥第二部分是线性变换袁它使用一系列的深度卷积在 m 个特征映射上做变换渊n=m伊泽冤袁其中每个卷积核的大小是 d伊d袁输出特征矩阵 Y=n伊H伊W袁 故第二部分总体参数计算量为 匀伊宰伊皂伊d伊d伊渊泽原员冤=H伊W伊ns伊d伊d伊渊s-1冤遥当使用标准卷积的完成上述操作袁在输入特征矩阵为 c伊h伊w袁输出特征矩阵为 Y=n伊H伊W 的情况下袁标准卷积的参数计算量为 匀伊宰伊c伊k伊k伊n遥R=H伊W伊c伊k伊k伊nH伊W伊c伊k伊k伊ns+H伊W伊ns伊d伊d伊渊s-1冤=c伊k伊kc伊k伊k伊1s+d伊d伊s-1s=s伊cs+c-1抑s渊1冤R 为标
11、准卷积的参数计算量与本文提出的 G-Module 参数计算量之比遥 由此可知袁 标准卷积的参数计算量为本文提出的G-Module 参数计算量的 s 倍遥 因此袁G-Module 在获得相同的特征映射时袁 既保留冗余特征的同时又显著降低了模型的复杂度袁这对后续的模型部署有很大的影响遥1.1.2 高效跨通道交互模块 ECI-Module本文提出的高效跨通道交互模块放弃了降维操作袁 有效地捕获了跨通道之间的交互袁具体结构如图 3 所示院图 3高效跨通道交互模块本文使用的高效跨通道交互模块 ECI-Module 利用全局池化来聚合特征图的空间特征袁 然后通过 k 次一维卷积操作来生成通道权重袁并通过通
12、道维度映射自适应调整 K 值遥该模块的目的是捕获跨通道之间的交互袁其中关键的是确定交互覆盖率遥由此类推袁相互作用的覆盖率应与通道维数 C 成正比袁可以表达成公式渊2冤院C=渊运冤渊2冤由于映射未知袁一般来说袁最简单的线性函数可以表示为C=k伊赠垣b遥 但从上述分析可知袁K 与 C 呈非线性比例关系袁通道C 一般为 2 的指数次幂遥 所以袁可以将线性函数 C 转化为非线性函数的指数形式袁如公式渊3冤所示院C=渊K冤=2k伊y-b渊3冤因此袁在给定通道数 C 的情况下袁则 K 的值可以通过公式渊4冤求解院K=渊C冤=logC2y+byodd渊4冤公式渊4冤中 odd 指的是最接近公式渊4冤的奇数遥
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 量化 目标 检测 方法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。