![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于YOLO-MCA的X光图像检测算法.pdf
《基于YOLO-MCA的X光图像检测算法.pdf》由会员分享,可在线阅读,更多相关《基于YOLO-MCA的X光图像检测算法.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 年 月南昌工程学院学报 收稿日期:基金项目:国家自然科学基金资助项目()作者简介:李永健(),男,硕士生,通信作者:朱华生(),男,教授,硕士生导师,文章编号:()基于 的 光图像检测算法李永健,朱华生,何明智,唐树银,孙占鑫(南昌工程学院 信息工程学院,江西 南昌 )摘要:算法直接用于 光图像检测时存在提取特征不明显问题,特别是违禁物与安全物存在折叠交叉时,容易导致漏检、多检现象。为此本文提出一种 算法,该算法在 基础上,增加了一个多卷积融合坐标注意力机制分支模块,该模块通过多支路连通的方式增大感受野,注重位置信息提取,增强提取有效特征能力,可改善物体折叠交叉导致的漏检、多检
2、问题。在 数据集上的实验结果表明,所提出的 算法的 达到 ,比原模型算法的精度更高;达到 ,满足实时检测需求。关键词:光图像检测;坐标注意力机制;多支路;感受野中图分类号:文献标志码:,(,):,:,;,:;目前的安检系统大多采用人工 光安检设备进行安检,这样的安检方式过分依赖安检人员的经验与集中度,且 光安检机输出图像显示时间短,输出图像内物体通常相互重叠遮掩,容易产生误判。利用深度学习中的目标检测或目标跟踪 等方法作为辅佐检测能更有效地降低误检率。近年来,目标检测算法也逐渐应用于 光检测当中,基于深度学习的 光检测算法可以分为基于 的两阶段算法和基于回归的一阶段算法。一阶段算法将检测问题转
3、化成回归问题,减少参数量的同时保证精度,代表算法有 和 。目前,学者们将研究重心放在一阶段算法当中。张友康 等在 算法的基础上,通过非对称卷积多视野的神经网络提供局部与全局之间的上下文特征信息,改善了背景干扰问题,在多种不同检测难度的自制数据集中平均精度分别达到 、。郭瑞鸿 等同样对 算法进行改进,使用 作为主干网络,以反卷积上采样、跳跃连接的方式进行多尺度特征融合,增强浅层特征图的表征能力,在自制数据集中平均精度达到 。郭守向 等基于 算法,结合复合骨干网络,引入特征增强模块,增强特征的非线性表达能力,有效提升小目标的检测效果,在 数据集中平均精度达到 。穆思奇等 在 算法的基础上设计一种空
4、洞密集卷积模块和加入注意力模块,在 数据集中平均精度达到 。吴海滨 等同样在 基础上加入空洞空间金字塔池化模块,增大网络感受野,有效降低了 光安检图像中危险违禁品的误检率,在 数据集中平均精度达到 。虽然以上网络的改进带来了精度的提升,但是考虑到硬件要求,以上改进网络均没有保证模型检测的实时性。年 团队发布了 ,其性能与 相当,但推理速度更快,且模型框架更便于工程部署。作为一种检测精确、速度快的检测算法,在大型开源数据集中中有优异的表现,但针对 光检测任务中存在许多较小物体折叠交叉现象,缺少共享空间位置信息编码,容易存在漏检、多检问题。本文提出了一个多卷积融合坐标注意力机制分支模块,构建一个新
5、的 (嵌入 模块,)目标检测模型,满足对于重叠遮挡的 光图像的精准检测、定位和实时性要求。算法实现 算法总体结构本文构建的 模型算法流程由训练模块、检测模块两部分构成。如图 所示。图 算法流程模型训练将训练数据集通过网络结构进行训练,实现权重更新,获得最佳网络权重数据,通过检测模块保留置信度最高的预测框作为检测结果。训练模块训练数据集经过整体网络结构 ,通过损失函数,优化器对模型学习能力进行调整,反向迭代,更新网络参数,最终达到最优效果。结构针对 光违禁物检测速度、精度、设备成本要求,本文提出的 模型是以 轻量化模型为基准模型进行改进,并针对原模型 对物体之间存在相互折叠交叉导致识别效果不佳问
6、题,本文提出的 模块能通过多支路的信息互通,并加入坐标注意力模块实现在同一个空间上捕获更多信息依赖关系,提高整体网络的特征提取能力,解决了原模型对于本文所使用的 光数据集特征提取能力不足的问题,从而改善重叠遮挡的违禁物检测效果。本文设计的 模型如图 所示,由三部分构成,分别是主干网络()、颈部网络()、检测网络()。图 网络结构图 网络由 ()、()、(改进空间金字塔池化层,)模块构成。为 个 最大池化层,通过级联方式实现最大池化层之间相互计算,增大感受野。目标特征分别有类别特征和位置特征两大类,类别特征代表目标所属类别,位置特征代表目标位置信息。其中,位置信息在低层特征显著,类别特征在高层特
7、征显著,颈部网络借鉴特征金字塔网络(,)和路径聚合网络(,)通过上采样(模块)进行高低层信息融合;同时,添加 模块,能实现空间位第 期李永健,等:基于 的 光图像检测算法置信息编码的共享,进一步实现高、低层信息特征的融合,提高网络的特征提取能力。网络结构针对 光 下 物 品 遮 挡 严 重 问 题,以 及 原 模型缺乏共享空间位置信息编码,对于折叠遮挡目标特征提取能力不足,本文提出一个多卷积融合坐标注意力机制分支的 模块,如图 所示。用 模块代替颈部网络第 层卷积,通过多次卷积和连接,有效地提高了整体网络的特征提取能力,其模型如下式所示:(,),()式中,为输入特征;为第 支路输出特征;为第
8、支路输出特征;为第 支路输出特征。图 模块结构图针对 光处理后背景信息单一问题,如何有效抑制梯度消失,解决重叠物体目标特征不明显问题成为关键。在原 网络结构中,颈部网络第层为 卷积层,其主要目的是降低通道维度。因为输入图像尺寸设为 ,从主干网络出来后的特征图仅为 ,颈部网络第 层直接对通道进行降维处理会造成整体权重信息的丢失。针对信息丢失问题,本文提出增强特征提取的三卷积支路互通网络代替原卷积层网络,实现减少主要信息的丢失情况。三卷积支路互通网络结构如图 所示,信息从输入端进来,同一时间输入到 条分支当中,再借鉴 网络思想,将第 支路 的卷积得到的信息共享到第 支路 的卷积层中,第 支路形成两
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 YOLO MCA 图像 检测 算法
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。