基于YOLO-MCA的X光图像检测算法.pdf

上传人：自信****多点

文档编号：634272

上传时间：2024-01-19

格式：PDF

页数：6

大小：1.64MB

《基于YOLO-MCA的X光图像检测算法.pdf》由会员分享，可在线阅读，更多相关《基于YOLO-MCA的X光图像检测算法.pdf（6页珍藏版）》请在咨信网上搜索。

1、第卷第期年月南昌工程学院学报收稿日期：基金项目：国家自然科学基金资助项目（）作者简介：李永健（），男，硕士生，通信作者：朱华生（），男，教授，硕士生导师，文章编号：（）基于的光图像检测算法李永健，朱华生，何明智，唐树银，孙占鑫（南昌工程学院信息工程学院，江西南昌）摘要：算法直接用于光图像检测时存在提取特征不明显问题，特别是违禁物与安全物存在折叠交叉时，容易导致漏检、多检现象。为此本文提出一种算法，该算法在基础上，增加了一个多卷积融合坐标注意力机制分支模块，该模块通过多支路连通的方式增大感受野，注重位置信息提取，增强提取有效特征能力，可改善物体折叠交叉导致的漏检、多检

2、问题。在数据集上的实验结果表明，所提出的算法的达到，比原模型算法的精度更高；达到，满足实时检测需求。关键词：光图像检测；坐标注意力机制；多支路；感受野中图分类号：文献标志码：，（，）：，：，；，：；目前的安检系统大多采用人工光安检设备进行安检，这样的安检方式过分依赖安检人员的经验与集中度，且光安检机输出图像显示时间短，输出图像内物体通常相互重叠遮掩，容易产生误判。利用深度学习中的目标检测或目标跟踪等方法作为辅佐检测能更有效地降低误检率。近年来，目标检测算法也逐渐应用于光检测当中，基于深度学习的光检测算法可以分为基于的两阶段算法和基于回归的一阶段算法。一阶段算法将检测问题转

3、化成回归问题，减少参数量的同时保证精度，代表算法有和。目前，学者们将研究重心放在一阶段算法当中。张友康等在算法的基础上，通过非对称卷积多视野的神经网络提供局部与全局之间的上下文特征信息，改善了背景干扰问题，在多种不同检测难度的自制数据集中平均精度分别达到、。郭瑞鸿等同样对算法进行改进，使用作为主干网络，以反卷积上采样、跳跃连接的方式进行多尺度特征融合，增强浅层特征图的表征能力，在自制数据集中平均精度达到。郭守向等基于算法，结合复合骨干网络，引入特征增强模块，增强特征的非线性表达能力，有效提升小目标的检测效果，在数据集中平均精度达到。穆思奇等在算法的基础上设计一种空

4、洞密集卷积模块和加入注意力模块，在数据集中平均精度达到。吴海滨等同样在基础上加入空洞空间金字塔池化模块，增大网络感受野，有效降低了光安检图像中危险违禁品的误检率，在数据集中平均精度达到。虽然以上网络的改进带来了精度的提升，但是考虑到硬件要求，以上改进网络均没有保证模型检测的实时性。年团队发布了，其性能与相当，但推理速度更快，且模型框架更便于工程部署。作为一种检测精确、速度快的检测算法，在大型开源数据集中中有优异的表现，但针对光检测任务中存在许多较小物体折叠交叉现象，缺少共享空间位置信息编码，容易存在漏检、多检问题。本文提出了一个多卷积融合坐标注意力机制分支模块，构建一个新

5、的（嵌入模块，）目标检测模型，满足对于重叠遮挡的光图像的精准检测、定位和实时性要求。算法实现算法总体结构本文构建的模型算法流程由训练模块、检测模块两部分构成。如图所示。图算法流程模型训练将训练数据集通过网络结构进行训练，实现权重更新，获得最佳网络权重数据，通过检测模块保留置信度最高的预测框作为检测结果。训练模块训练数据集经过整体网络结构，通过损失函数，优化器对模型学习能力进行调整，反向迭代，更新网络参数，最终达到最优效果。结构针对光违禁物检测速度、精度、设备成本要求，本文提出的模型是以轻量化模型为基准模型进行改进，并针对原模型对物体之间存在相互折叠交叉导致识别效果不佳问

6、题，本文提出的模块能通过多支路的信息互通，并加入坐标注意力模块实现在同一个空间上捕获更多信息依赖关系，提高整体网络的特征提取能力，解决了原模型对于本文所使用的光数据集特征提取能力不足的问题，从而改善重叠遮挡的违禁物检测效果。本文设计的模型如图所示，由三部分构成，分别是主干网络（）、颈部网络（）、检测网络（）。图网络结构图网络由（）、（）、（改进空间金字塔池化层，）模块构成。为个最大池化层，通过级联方式实现最大池化层之间相互计算，增大感受野。目标特征分别有类别特征和位置特征两大类，类别特征代表目标所属类别，位置特征代表目标位置信息。其中，位置信息在低层特征显著，类别特征在高层特

7、征显著，颈部网络借鉴特征金字塔网络（，）和路径聚合网络（，）通过上采样（模块）进行高低层信息融合；同时，添加模块，能实现空间位第期李永健，等：基于的光图像检测算法置信息编码的共享，进一步实现高、低层信息特征的融合，提高网络的特征提取能力。网络结构针对光下物品遮挡严重问题，以及原模型缺乏共享空间位置信息编码，对于折叠遮挡目标特征提取能力不足，本文提出一个多卷积融合坐标注意力机制分支的模块，如图所示。用模块代替颈部网络第层卷积，通过多次卷积和连接，有效地提高了整体网络的特征提取能力，其模型如下式所示：（，），（）式中，为输入特征；为第支路输出特征；为第

8、支路输出特征；为第支路输出特征。图模块结构图针对光处理后背景信息单一问题，如何有效抑制梯度消失，解决重叠物体目标特征不明显问题成为关键。在原网络结构中，颈部网络第层为卷积层，其主要目的是降低通道维度。因为输入图像尺寸设为，从主干网络出来后的特征图仅为，颈部网络第层直接对通道进行降维处理会造成整体权重信息的丢失。针对信息丢失问题，本文提出增强特征提取的三卷积支路互通网络代替原卷积层网络，实现减少主要信息的丢失情况。三卷积支路互通网络结构如图所示，信息从输入端进来，同一时间输入到条分支当中，再借鉴网络思想，将第支路的卷积得到的信息共享到第支路的卷积层中，第支路形成两

9、个的卷积网络，等价于个的卷积层网络，且参数量减少，这样第支路卷积信息不仅包含第支路卷积信息，且在第支路信息的基础上能更好地提取特征。同样，第支路通过连接的方式将信息共享到第支路的卷积中，第支路卷积形成个的卷积，等价于一个的卷积，增大其感受野；加入（）层能进一步控制梯度爆炸，防止梯度消失和防止过拟合问题。卷积模型计算如下式所示：，（）其中表示输入通道数；表示输出通道数；为卷积核大小。网络结构本文还在改进的基础上添加了坐标注意力模块（，），构成网络结构。网络结构图如图所示，坐标注意力模块是一种将位置信息嵌入信道的方法，与注意力模块不同，利用全局自适应池化层在通道

10、域上捕获全局信息，随后压缩并加权到特征通道上，忽略了对信道之间的信息编码；也与注意力机制不同，利用一个最大池化层和一个平均池化层对通道域信息整合，最后通过空间域，对信息整合和加权，忽略了信息远程依赖关系。而坐标注意力机制的基本流程是将信道分解为两个一维特征编码信息，分别沿着两个空间聚合特征，两方向聚合特征信息是为了能在同一个空间上捕获到更多信息依赖关系，同时在另一个空间方向上保持精确的位置信息。最终，输入的特征图信息会通过一对不同的空间方向信息进行编码，共享获取的信息。图注意力模块结构图模型表达式如下：，()，（，()()），（）()()()()，（）其中为非线性激活函数，、分别为输

11、入图像高、宽、通道数，为模块和一个一维卷积结合体，为函数。是轻量化的注意力模块，对计算开销造成微小影响，所以在条支路的卷积后都添加了注南昌工程学院学报年意力机制，保证条支路位置信息共享。通过实验发现，如图的级联结构方式组成的模块特征提取效果最佳。原因是经过第支路模块后，获取的空间方向信息更多，连接第支路时能共享权值信息，在第支路的空间方向信息基础上进行特征提取，以此类推，可以减少原本基础三支路的信息丢失。检测模块将训练好的目标任务权重作为检测所使用的权重，由于检测中会生成多个预测框，需要保留置信度最高的预测框。非极大值抑制（，）模块作为检测关键模块，抑制非最大的置信分数

12、，只保留局部的极大值。如图所示，图（）为未经过处理获取多个预测框，图（）为经过处理，最终保留一个最贴近真实框的预测框作为最终的检测结果。图检测实验与分析实验数据数据集是光违禁物的新型数据集。本次实验选取了中数据集的张图片（物体的锚框重叠）构建数据集，一共有类违禁物，分别是、，、。按照的比例随机划分为训练集和验证集。训练集和验证集的数量分别为和。实验环境本文实验的设备为，运行内存，显卡为，操作系统为，位。实验框架为，。实验分析客观评价网络训练模型阶段，输入网络尺寸均为，迭代批量设置大小为，衰减系数为，初始学习率为，使用的优化器为，动量

13、设为。训练损失由置信度损失（）、分类概率损失（）及边框回归损失（，其采用损失函数）构成。、的训练损失如图所示，横坐标为训练次数，纵坐标为训练总损失值，其表达式如下式所示：（）图模型的训练损失图从训练损失中可以得出的损失值比原模型的损失值低，说明本文嵌入的模块对信息特征提取性能优于原模型。目标检测的常用评价标准是（）。本文采用的是评价标准，交并比（）阈值为，步长为的，其是衡量不同阈值下的综合表现，以此更加准确、综合地评判网络的好坏。越高，说明模型高精度边界回归能力越强，检测框与真实框拟合更精准，代表结果更可信。此外，本文还采用每秒处理的图片数量（）作为模型检测速度的

14、评价指标，采用张图片作为检测图片，计算得出平均每一张图片所使第期李永健，等：基于的光图像检测算法用的实际检测时间（前向传播时间、模型推理时间、时间之和），定义如下：（）实验分别引入了、种轻量化注意力模型。与原模型对比，种注意力机制替换的位置一致，如表所示。对比组实验结果，可以发现种注意力机制的计算量（）大致相同，作为种注意力机制中参数量（）最低的模块，其指标最高，且指标不低于和。表不同注意力机制实验数据表中列出本次实验数据集中包含的类违禁物对应的及本次实验的平均精度。从表中可以看出本文提出的模型指标优于原模型，各类基本优于原模型，且在本次实验环

15、境中能达到，足够满足检测的实时性。表改进模型与原模型的数据对比针对一阶段算法进行对比，实验使用不同版本的算法进行比较，输入训练网络尺寸均为，和算法模型参数量和计算量较大，且不及；和虽然在速度和模型大小都优于本实验模型，但指标远不及本实验模型（表）。表各网络对比实验数据主观评价在获取模型检测结果时，置信度阈值、交并比等参数设置均保持一致，分别为和。模型检测先进行一轮筛选，将预测分数低于置信度阈值的预测框去除（大幅度减少框的数量，减少后续计算），并取出预测分数最高的预测框，计算其与第一轮筛选后预测框的重合程度，重合程度大于则剔除。检测的视觉效果如图所示，其中，一个

16、预测框的标签包括预测物体名称和预测分数。通过观察、模型两组检测结果对比图（均有重叠物体的光图像），发现在第组检测图像中，对比同一种违禁物，本文模型检测的预测分数皆高于原模型检测的预测分数；第组检测图像对比，检测图中有个真实违禁物，本文模型检测图像的预测框与真实框个数相同，而原模型出现多检情况；第组检测图像对比，检测图中同样有个真实违禁物，本文模型检测图像的预测框与真实框个数相同，而原模型出现漏检情况。综上所述，本文提出的模型比原模型的预测分数高，且改善了多检、漏检问题。结论针对光违禁物品的目标检测，在模型基础上增加了模块，通过多支路共享空间位置信息编码，增强对光处理图的特

17、征提取能力，改善多个物体折叠交叉所带来的多检、漏检问题。在的数据集中验证表明，嵌入模块后比的提升。本文仅对数据集中的个类别违禁物品进行检测识别，但安检违禁物品远不止类，在未来工作中，还需要完善数据库，进一步优化目标检测速度和精度，同时针对光数据集，对其锚框进行研究，并结合实际应用，开发完整的界面系统，实现算法部署。南昌工程学院学报年图与检测结果对比图参考文献：王军，尹鹏，章利民，等基于孪生神经网络的目标跟踪算法综述南昌工程学院学报，（）：，：，：，：，：张友康，苏志刚，张海刚，等光安检图像多尺度违禁品检测信号处理，（）：郭瑞鸿，张莉，杨莹，等基于改进的光图像管制刀具检测与识别激光与光电子学进展，（）：郭守向，张良：基于单阶段网络的光图像违禁品检测激光与光电子学进展，（）：穆思奇，林进健，汪海泉，等基于改进的射线图像违禁品检测算法兵工学报，（）：吴海滨，魏喜盈，刘美红，等结合空洞卷积和迁移学习改进的光安检危险品检测中国光学，（）：，（）：，：，：，：，：，：（）：，：，：，（）：第期李永健，等：基于的光图像检测算法

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 YOLO MCA 图像检测算法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。