改进YOLOX-S的红外舰船目标检测算法.pdf
《改进YOLOX-S的红外舰船目标检测算法.pdf》由会员分享,可在线阅读,更多相关《改进YOLOX-S的红外舰船目标检测算法.pdf(7页珍藏版)》请在咨信网上搜索。
1、文章编号:1002-2082(2023)05-1054-07改进 YOLOX-S 的红外舰船目标检测算法娄树理1,王岩1,郭建勤2,公维锋3(1.烟台大学物理与电子信息学院,山东烟台264005;2.山东电子职业技术学院电子与通信工程系,山东济南250200;3.高效能服务器和存储技术国家重点实验室,山东济南250101)摘摘 要:要:红外舰船目标检测与识别技术是反舰导弹红外成像制导的关键,对于武器装备制导性能具有重大意义。针对在复杂环境下红外舰船目标检测的精度和速度问题,提出了改进 YOLOX-S的红外舰船目标检测算法。首先引入深度可分离卷积(depthwiseseparableconvol
2、ution)代替 FPN(featurepyramidnetwork)及 YOLOHead 残差结构中的传统卷积,降低模型的参数量;其次引入 ECANet通道注意力机制,提高网络的注意力,降低舰船目标的虚检率和漏检率;最后使用 CIoU 损失函数,进一步提高网络的检测准确率。实验表明,改进后算法的检测平均精度(AP)达到 98%,检测速度为 56 帧/s,对比改进前 YOLOX-S 算法,检测速度与平均精度分别提升 6 帧/s 和 3%,且模型更加轻量化。实验结果充分证明本文提出的算法能够有效完成红外舰船目标检测任务。关键词:关键词:红外舰船;目标检测;注意力机制;损失函数中图分类号:TN21
3、9;TP391文献标志码:ADOI:10.5768/JAO202344.0502006Infrared ship target detection algorithm based on improved YOLOX-SLOUShuli1,WANGYan1,GUOJianqin2,GONGWeifeng3(1.SchoolofPhysicsandElectronicInformation,YantaiUniversity,Yantai264005,China;2.DepartmentofElectronicsandCommunicationEngineering,ShandongCollegeo
4、fElectronicTechnology,Jinan250200,China;3.StateKeyLaboratoryofHigh-endServerandStorageTechnology,Jinan250101,China)Abstract:Infraredshiptargetdetectionandrecognitiontechnologyisthekeytechnologyofinfraredimagingguidance for anti-ship missile,which is of great significance to the guidance performance
5、of weaponequipment.Fortheaccuracyandspeedincomplexenvironment,aninfraredshiptargetdetectionalgorithmbasedonYOLOX-Swasproposed.Firstly,thedepthwiseseparableconvolution(DSC)wasintroducedtoreplacethetraditionalconvolutioninthefeaturepyramidnetwork(FPN)andYOLOHeadresidualstructures,which could reduce th
6、e amount of parameters of the model.Secondly,the ECANet channel attentionmechanismwasintroducedtoimprovetheattentionofnetwork,whichcouldreducethefalsedetectionrateandmisseddetectionrateofshiptargets.Finally,theCIoUlossfunctionwasusedtofurtherimprovethedetectionaccuracyofthenetwork.Theexperimentalres
7、ultsshowthattheaverageprecision(AP)oftheoptimizedalgorithm reaches 98%and the detection speed is 56 frame/s.Compared with the previous YOLOX-Salgorithm,thedetectionspeedandtheaverageprecisionareimprovedby6frame/sand3%,respectively,andthemodelismorelightweight.Theexperimentalresultsfullyprovethatthep
8、roposedalgorithmcaneffectivelycompletetheinfraredshiptargetdetectiontask.Key words:infraredship;targetdetection;attentionmechanism;lossfunction引言在现代海战中,能否快速准确地识别出舰船目标并引导精确制导武器对其摧毁,是削弱敌方战斗力量的关键。红外成像制导具有制导精度高、抗干扰能力强、隐蔽性好等优点,在各种精确制导体系中占据着重要的地位1。由于红外舰船图像收稿日期:2022-09-21;修回日期:2022-12-12基金项目:山东省自然科学基金(ZR20
9、19LZH016)作者简介:娄树理(1976),男,博士,副教授,主要从事光电信息处理、机器视觉研究。E-mail:通信作者:王岩(1998),男,硕士研究生,主要从事图像处理研究。E-mail:第44卷第5期应用光学Vol.44No.52023年9月JournalofAppliedOpticsSep.2023受海杂波、雨雪等干扰影响严重,且目标和背景复杂多样,如何快速准确地检测识别出舰船目标,是红外成像制导武器的技术难题和关键问题,一直是国内外研究的热点。传统的目标检测算法性能大多依赖于人工设计的特征和分类器2,且人工设置的特征适应性较差,难以很好地检测复杂场景下的舰船目标。随着深度学习的发
10、展,许多基于深度学习的目标检测算法相继涌现,这类算法通过神经网络提取目标特征,无需人工设计特征,提高了目标检测的精度与效率。基于深度学习的目标检测算法分为两类:一类是双阶段目标检测算法,如 R-CNN(region-based convolutional neural networks)3和 Faster R-CNN(fasterregion-basedconvolutionalneuralnetwor-ks)4等算法。顾佼佼5等人在 FasterR-CNN 算法中将特征图进行拼接形成多尺度特征,提高特征图语义信息;AVOLAD6等人在 FasterR-CNN 算法中引入多流(MS)架构,在每
11、个流上施加不同的核大小来模拟多尺度图像分析。这类算法精度高,但检测速度较慢,难以达到实时检测的效果。另一类是单阶段目标检测算法,如 SSD(singleshotmultiboxdetection)7和YOLO(youonlylookonce)8-11系列等算法。CHOIHT12等人在 SSD 算法中引入了由注意流和特征映射级联流组成的增强特征映射块(EMB);陈耀祖13等人在 YOLOv4 的算法中使用模糊 ISODATA 动态聚类算法对先验框数目进行优化;MUKHIDDINOVM14等人采用 h-swish激活函数来减少 YOLOv4 的运行时间。这类目标检测算法为端到端的目标检测,相比于双
12、阶段目标检测算法,其检测速度更快,但检测精度略低。针对如何在复杂环境中快速准确检测出红外舰船目标的技术难题,本文提出了一种改进后的YOLOX-S 红外舰船目标检测算法,将深度可分离卷积代替 FPN 及 YOLOHead 残差结构中的传统卷积,提高网络的运行与检测速度;引入 ECANet(effici-entchannelattentionnetwork)通道注意力机制,提高对舰船目标的识别能力,降低舰船目标的虚检率与漏检率;引用 CIoU(complete-IoU)损失函数,使目标框回归更加稳定,提高网络对舰船目标的检测精度。1 改进的 YOLOX-S 算法模型1.1 YOLOX-S 算法改进
13、YOLOX15算法是旷视科技研究院在 2021 年提出的新型单阶段目标检测算法,相较之前的YOLO 系列算法,YOLOX 算法的改进主要包括数据增强、无锚点和预测分支解耦,不仅在平均精度(mAP)上超越了 YOLOv3、YOLOv4 和 YOLOv5,在检测速度上也极具竞争力。YOLOX 系列主要包括 YOLOX-S、YOLOX-M、YOLOX-L 和 YOLOX-X,其中 YOLOX-S 参数量最少,方便部署且具有代表性。YOLOX-S 的网络结构模型如图 1 所示,首先对输入图像进行 Mosaic 数据增强,其次经过Backbone 部分进行浅层特征提取,输出的 3 个特Neck-FPNI
14、nputFocusConv2D_BN_SiLUConv2D_BN_SiLUCSPLayerConv2D_BN_SiLUCSPLayerConv2D_BN_SiLUCSPLayerConv2D_BN_SiLUSPPBottleneckCSPLayerConv2DConcat+CSPLayerUpsampleConv2DUpsampleConcat+CSPLayerConcat+CSPLayerConcat+CSPLayerCSPDarkentConv2D_BN_SiLU5913Conv2D_BN_SILUConv2D_BN_SiLUConv2D_BN_SiLUConv2D_BN_SiLUConv
15、2D_BN_SiLUClsClsObjSPPDownsample(BaseConv)Downsample(BaseConv)YOLOHeadYOLOHeadYOLOHeadYOLOHeadNonConv2D_BN_SiLU图 1 YOLOX-S 网络结构模型Fig.1 YOLOX-S network structure model应用光学2023,44(5)娄树理,等:改进 YOLOX-S 的红外舰船目标检测算法1055征层传入加强特征提取网络进行深度特征提取,最后将得到的 3 个有效特征层分别传入 DecoupledHead 进行目标边界框预测。为提高网络检测速度与精度,本文对 YOLOX-
16、S 算法进行了改进,改进后的网络结构图如图 2 所示,首先通过主干网络 CSPDarknet(crossstagepar-tialdarknet)对图像进行特征提取;将提取出的特征图作为输入,利用 ECANet通道注意力机制,过滤冗余信息,加强模型重要信息提出能力;将增强后的特征图传入改进后的 Neck-FPN 中,进一步增强特征图的语义信息;最后将特征图分别传入改进后的 DecoupledHead 中进行目标框预测。InputFocusConv2D_BN_SiLUConv2D_BN_SiLUCSPLayerConv2D_BN_SiLUCSPLayerConv2D_BN_SiLUCSPLaye
17、rConv2D_BN_SiLUSPPBottleneckCSPLayerConv2DConcat+CSPLayerUpsampleConv2DUpsampleConcat+CSPLayerConcat+CSPLayerConcat+CSPLayerCSPDarkentNeck-FPNConv2D_BN_SiLUDWConvDWConvDWConvDWConvClsClsObjYoloHeadDownsample(DWConv)Downsample(DWConv)ECANetECANetECANetBaseConv(33)BaseConv(11)DWConvBaseConvConv2dBNSiL
18、UYOLOHeadYOLOHeadYOLOHead图 2 改进的 YOLOX-S 网络结构模型Fig.2 Improved YOLOX-S network structure model1.2 深度可分离卷积由于海战场环境瞬息万变,算法的检测速度尤为重要。YOLOX-S 网络中的残差结构均使用传统卷积16,传统卷积的参数量及计算量过大,严重影响算法的检测速度。为了提高算法的检测速度,使其更容易快速实现,本文引入深度可分离卷积,降低模型的参数量,提高算法的检测速度。为保证模型检测的准确率,将深度可分离卷积用于FPN(featurepyramidnetworks)中下采样部分及 YO-LOHead
19、 残差结构中,主干部分残差结构及 CSP-Layer 部分保持不变。传统卷积先将各个通道输入的特征图与相应卷积核进行卷积相乘,最后累加得到输出特征,主要结构如图 3 所示。LHQPCC图 3 传统卷积结构Fig.3 Traditional convolution structure图 3 中 L 和 Q 分别为输入和输出图像的大小,H 为卷积核大小,C 和 P 分别为输入和输出的通道数。传统卷积(SC)的参数量 W 为WSC=H2CP(1)计算量 O 为OSC=H2CPQ2(2)深度可分离卷积17则是将提取特征和结合特征分为 33 的深度卷积和 11 的逐点卷积两部分,首先对每一个输入通道进行
20、一个深度卷积核操作,然后利用 11 的卷积将深度卷积输出结果结合到特征中组合为新的特征,其结构图如图 4 所示。111 LHQPCC图 4 深度可分离卷积结构Fig.4 Depthwise separable convolution structure深度可分离卷积(DSC)的参数量 W 为WDSC=H2C+CP(3)计算量 O 为1056应用光学第44卷第5期ODSC=H2CQ2+CPQ2(4)两种卷积参数量与计算量比为FW=WDSCWSC=1P+1H2(5)FO=ODSCOSC=1P+1H2(6)1.3 ECANet 通道注意力机制红外舰船图像主要反映舰船目标与海天背景的辐射能量差异,由于
21、岛屿等物体辐射能量和海天背景也有较大差异,实际检测时岛屿等物体会对目标检测形成干扰,并且实际红外图像中噪声影响严重,这些因素严重影响红外舰船目标的检测精度。为了增强网络的抗干扰能力,降低网络对舰船目标的虚检率与漏检率,本文在 YOLOX-S 主干网络后引入 ECANet 通道注意力机制18,抑制岛屿等物体干扰信息的影响,提高网络对舰船目标的检测精度。在 ECANet 通道注意力机制过程中,首先对输入的特征图进行全局平均池化,其次利用 1D 卷积进行特征提取,经过 Sigmoid 激活函数获得每一个特征点的权值,最后与输入的特征图相乘,得到新的特征图。ECANet 通道注意力机制结构如图 5 所
22、示。WHCGAPCHW11C11Ck=(C)图 5 ECANet 通道注意力机制Fig.5 ECANet channel attention mechanism图 5 中,H、W、C 分别为输入特征图的高度、宽度、通道数,GAP(globalaveragepooling)为全局平均池化,k 表示卷积核大小。为 Sigmoid 非线性激活函数,具体表达式为19=f(z)=11+ez(7)式中 z 表示神经网络上一层节点的输出。k 的表达式为18k=(C)=?log2(C)+b?odd(8)式中:取 2,b 取 1;|t|odd表示距离 t 最近的奇数。1.4 损失函数在 YOLOX-S 算法中,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 改进 YOLOX 红外 舰船 目标 检测 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。