改进YOLOv5的合成孔径雷达图像舰船目标检测方法.pdf
《改进YOLOv5的合成孔径雷达图像舰船目标检测方法.pdf》由会员分享,可在线阅读,更多相关《改进YOLOv5的合成孔径雷达图像舰船目标检测方法.pdf(11页珍藏版)》请在咨信网上搜索。
1、第45卷第12 期2023年12 月文章编号:10 0 1-50 6 X(2023)12-3743-11改进YOLOv5的合成孔径雷达图像舰船目标检测方法系统工程与电子技术Systems Engineering and ElectronicsVol.45No.12December 2023网址:www.sys-贺翥祯1,2,李敏1*,苟瑶,杨爱涛1(1.火箭军工程大学作战保障学院,陕西西安7 10 0 2 5;2.国防科技大学信息与通信学院,湖北武汉430 0 10)摘要:针对合成孔径雷达图像目标检测易受噪声和背景干扰影响,以及多尺度条件下检测性能下降的问题,在兼顾网络规模和检测精度的基础上,
2、提出了一种改进的合成孔径雷达舰船目标检测算法。使用坐标注意力机制,在确保轻量化的同时抑制了噪声与干扰,以提高网络的特征提取能力;融入加权双向特征金字塔结构以实现多尺度特征融合,设计了一种新的预测框损失函数以改善检测精度,同时加快算法收敛,从而实现了对合成孔径雷达图像舰船目标的快速准确识别。实验验证表明,所提算法在合成孔径雷达舰船检测数据集(synthetic apertureradarshipdetectiondataset,SSD D)上的平均精度均值达到96.7%,相比于YOLOv5s提高1.9%,训练时收敛速度更快,且保持了网络轻量化的特点,在实际应用中具有良好前景。关键词:合成孔径雷达
3、;目标检测;YOLOv5;注意力机制;多尺度融合中图分类号:TP391Ship target detection method for synthetic aperture radar images(1.Combat Support College,Rocket Force University of Engineering,Xian 710025,China;2.College of Information and Communication,National University of De fense Technology,Wuhan 430010,China)Abstract:Aimi
4、ng at the problem that target detection in synthetic aperture radar(SAR)images is easilyaffected by noise and background interference,and the performance of ship target detection is degraded undermulti-scale conditions,an improved YOLOv5 algorithm is proposed on the basis of considering the network
5、scaleand detection accuracy.In this algorithm,coordinate attention mechanism is used to suppress noise andinterference to improve the feature extraction ability of the network while ensuring its lightweight advantage.The bi-directional feature pyramid is integrated to achieve multi-scale feature fus
6、ion.A new prediction box lossfunction is designed to improve the detection accuracy and accelerate the convergence of the algorithm.Thus,the ship target can be recognized quickly and accurately in SAR images.Experimental verification shows thatthe mean average presicion(mAP)of the proposed algorithm
7、 on SSDD dataset reaches 96.7%,which is 1.9%higher than that of YOLOv5s.The convergence speed is faster during training,and the network is lightweight,which has a good prospect in practical application.Keywords:synthetic aperture radar;target detection;YOLOv5;attention mechanism;multi-scale fusion0引
8、 言海洋权益涉及国家的根本利益,为维护军事和领海安全,对舰船目标进行有效的检测识别尤为重要。合成孔径雷达(syntheticapertureradar,SA R)具有受复杂天气因素收稿日期:2 0 2 2-10-2 8;修回日期:2 0 2 3-0 2-0 8;网络优先出版日期:2 0 2 3-0 3-2 2。网络优先出版地址:https:/ 2 0 0 6 2 40)资助课题*通讯作者引用格式:贺葛祯,李敏,苟瑶,等。改进YOLOv5的合成孔径雷达图像舰船目标检测方法JI系统工程与电子技术,2 0 2 3,45(12):3743-3753.Reference format:HE Z Z,LI
9、 M,GOU Y,et al.Ship target detection method for synthetic aperture radar images based on improvedYOLOv5JJ.Systems Engineering and Electronics,2023,45(12):3743-3753.文献标志码:Abased on improved YOLOv5HE Zhuzhen?,LI Min.*,GOU Yao,YANG AitaoD01:10.12305/j.issn.1001-506X.2023.12.04影响小,在日间或夜间环境均可工作的特点1,十分符合舰
10、船目标监测所需的环境适应性和适时性的要求,因此得到了广泛使用。受制于硬件算力制约,早期SAR图像的舰船目标检测技术主要依赖于预先定义的分布和人工设计特征,例如双Xn(8080256):3744:参数恒虚警率算法等2-1。这些传统的舰船目标检测算法大多针对特定场景,主要对海杂波进行建模与仿真以及恒虚警目标的检测,但其算法鲁棒性较低,泛化性差。近年来,随着硬件性能的不断提升,卷积神经网络(con-volutional neural network,C NN)的迅速崛起使得基于深度学习的目标检测算法受到了广泛关注,这类算法在实现特征自行提取方面具备极大优势,可以摆脱对人工设计特征和建模的依赖,达到较
11、好的识别精度和泛化性能。在发展过程中,CNN根据处理流程又可分为两类。第一类是以区域CNN(region CNN,R-CNN)5、Fa s t R-CNNt 6、Fa s t e r R-CNN7 等为代表的二阶段算法,此类算法的检测准确率较高,但由于需要先提取候选区域,其网络结构较大,执行速率较慢。第二类是以单次多框检测器(singleshot multi-boxdetecfor,SSD)8 和 YOLO(You Only Look Once)系列9-12 1 等为代表的一阶段算法,其主要思路是将分类和目标的定位均看作回归问题,执行一次处理。与二阶段算法相比,其检测不需要生成候选区域,大大提
12、高了算法效率,但其检测精度略低。针对上述两类算法的缺点,学者们不断进行着改进优化。如赵江洪等13和顾俊俊等14使用不同的网络替代视觉几何组(visual geometrygroup,VG G)作为其主干网络,并调整锚框的尺寸和个数。马啸等151增加了判别模块以及类别预测分支和语义分割分支。这些基于二阶段算法的改进虽然在一定程度上减小了主干网络的结构,提高了检测精度均值,但保留了区域推荐模块,网络结构仍比一阶段算法复杂。唐崇武等16 1通过微调分类网络、增加训练尺度、聚类目标边框维度等方法优化了YOLOv3检测算法。胡欣等17 基于YOLOv5增加了多分支注意力机制。钱坤等18 1改进了YOLO
13、v5网络的激活函数和网络特征融合结构。以上改进不同程度地提高了一阶段算法的检测精度,但在原算法上增加了较高的计算量。因此,使用深度 CNN进行SAR图像舰船目标检测面临的一个重要问题,就是兼顾网络规模和目标检测精度。就当前的改进算法性能而言,一阶段算法更具优势,在尽量维持原有计算量的情况下进一步改进一阶段算法的检测精度,具有重要的研究价值和意义。预处理CBLCBLXn(6406403)1CBLBottleneckC3Cony:卷积层Convolutional layer;SPPF:快速空间金字塔池化Spatial pyramidpooling-fast。系统工程与电子技术另外,SAR的斑点噪声
14、影响是目标检测呕需解决的一个重要问题。由于独特的成像技术,SAR图像存在很多斑点噪声,这些噪声会影响目标检测精度。处于港口沿岸的舰船图像,成像时的斑点噪声和检测时遇到的干扰目标(如小岛、陆地和海杂波)混杂在一起,将产生较多虚警。除此以外,当前检测算法对于SAR的舰船目标存在多尺度情况下泛化性弱的问题。SAR的舰船图像由于存在多分辨率成像模式以及不同的船舶尺寸等情况,导致输入图像目标尺寸差异性大,这样的多尺度输人会使算法性能不稳定。尤其是当小目标映射到最终特征图时,用于位置细化和分类的信息很少,会降低检测性能。本文从上述问题出发,提出了一种基于坐标注意力(c o o r d in a t e a
15、 t t e n t io n,C A)机制及多尺度融合的目标检测算法。算法以YOLOv5新的版本(V6.1版)为基础,进行了深度优化:一是结合CA改进主干网络,侧重目标坐标重要度信息以提高模型特征提取能力,抑制了噪声和干扰的影响;二是改进了原网络的特征融合结构,添加了具有跳跃连接的加权双向特征金字塔网络(bi-directionalfeaturepyramidnetwork,Bi FPN)进行多尺度融合,提高多尺度下的泛化能力;三是设计了一种新的预测框损失函数一一快速有效的交并比(rapid and efficient intersection over union,REI O U),以加快
16、预测框收敛的速度和准确性。改进后网络的权重文件仅增加了0.4M,确保了网络的轻量化。最后,将模型在SAR舰船检测数据集(ship detection dataset,SSD D)上进行了实验验证,其平均精度均值(mean average precision,mAP)相比原算法提高了1.9%。1YOLOv5网络结构1.1YOLOv5的网络结构YOLOv5的网络结构主要包括主干段、颈部段和头部段3部分。实现过程中,为增加预测的准确性和模型泛化能力,在数据进人预测网络前,对YOLOv5进行了一系列的图像增广和自适应锚框计算等预处理操作,其网络具体结构如图1所示。主干段颈部段CBL3CBLXnXnCo
17、nvBNSiLUAddCBLBottleneckCBLBN:批归一化Batchnormalization;图1YOLOv5(V6.1版)的模型结构Fig.1 Model structure of YOLOv5(version6.1)第45卷头部段CBLSPPFCBDUpSampleXnConcatCBLUpSampleConcatCBLConcatC3nCBLConcatCBL(4040512)Concat(20201024)SiLU:Si g mo i d 加权线性单元Sigmoidweighted linearunit;第12 期1.2新版本重要改动YOLOv5的V6.1版本在主干段部分,
18、采用了新的CSPDarknet53网络结构对图像的特征进行提取。与早期版本有所区别,V6.1版本去掉了之前的Focus聚焦结构,并将此前的BottleneckCSP部分更新为C3,C 3的具体结构如图1左下角所示。主干段就是以一系列的C3将各尺度的特征图分成两部分进行前向计算,一路经过颈部段处理,另一路与第一路直接进行特征融合。这样做的优势是减少了梯度的重复计算,在保证速度和准确率的同时,减少了网络参数和运算量。最后,将提取的特征图直接输人改进的快速空间金字塔池化(spatialpyramidpooling-fast,SPPF),对网络不同尺度的特征进行融合。在颈部段部分,YOLOv5使用了路
19、径聚合网络(pathaggregation network,PANet)19 进行了特征融合,PANet是在特征金字塔网络(feature pyramid network,FPN)2 0)基础上增加的一条自底向上的信息流通路,缩短了信息传输路径,旨在使准确的底层定位信息能够增强到整个特征提取网络,其总体结构如图2 所示。在头部段部分,YOLOv5的V6.1版本采用了完全交并比(complete intersection over union,CIO U)损失2 1 替代了早期版本中的广义交并比(generalized intersection overunion,G IO U)2 2 损失,作
20、为预测框损失函数。CIOU考虑了中心点距离和宽高比两个参数。相比GIOU而言,其算法收敛速度更快。颈部段CBL1CBLC3xnCBLC3xnCBLC3xnCBLC3xnCASPPF贺翥祯等:改进YOLOv5的合成孔径雷达图像舰船目标检测方法P之一图2 PANet结构Fig.2PANet structure2基于注意力机制及多尺度融合的YOLOv5改进网络2.1算法框架算法框架如图3所示,其中红色部分为本文的改进部分。输入图像具有灵活的尺寸,经图像预处理统一调整为640X640大小,之后经过一系列CBL模块和C3模块的卷积处理得到深层特征,再将特征图经CA模块为其各特征点重新赋予权重后输入快速空
21、间金字塔池化SPPF模块。这一过程主要是从特征图中抽取横纵坐标因子,做批归一化(batchnormalization,BN)后得到坐标权重,增大了卷积核的局部感受野。随后,图像特征在移除了单输人结点,增加了跳跃连接的BiFPN网络后,进行多尺度融合,最后在头部段将3个尺度下的预测信息进行处理,以得到置信度损失、类别损失和预测框损失,其中的预测框损失使用了设计的REIOU损失。主干段头部段C3xnConvCBLBiFPNAdd2UpSampleCBLC3xnBiFPNAdd2UpSampleCBL3745V5(8080256):BiFPNAddC3xnCBLBiFPNadd2C3xnConvCo
22、nv(20201024)(4040512)BiFPNLAd2BiFPN中的二输入融合模块Fig.3Model structure of the improved algorithm2.2CA机制CA机制的思想是令网络在提取某类物体特征时对于位置或通道的关注有明显的侧重,以此提高算法性能。但1/2AddSiLUConv图3改进后的算法模型结构其会造成计算量的增加,这对于训练时间和算力成本的控制以及移动端部署极为不利。相比其他注意力机制,CA23计算开销小,并且在坐标和坐标方向上对位置进行池BiFPNLadd3BiFPN中的三输入融合模块1/3AddSiLUConv3746:化和BN,以图像中目标
23、坐标灰度值分布特点对原特征图中的每一处赋予坐标权重,可以有效抑制 SAR图像中的噪声和干扰影响,因此引入CA机制对网络进行改进。CA模块的具体实现结构如图4所示。X轴方向平均池化Y轴方向平均池化连接卷积重新赋权图4CA模块的结构Fig.4Structure of CAmodule其具体工作流程如下:对于输人尺寸为CXHXW的特征图,分别进行水平方向和垂直方向的平均池化得到大小为CX1XW和CXHX1的两组张量,其公式为(h)=1WOiKW1.2.(j.)1&(w)=H.OiH式中:z(h)为第 C个通道第 h行的平均池化结果;z(w)为第C个通道第w列的平均池化结果。将得到的和两个张量放在同一
24、维度上聚合,再通过一个11的卷积改变输出的通道数,通道数具体由衰减因子进行调控,公式如下:f=C(2,z)Ok1x1(3)式中:C()表示连接操作;?表示卷积运算。经过BN层和 Sigmoid的非线性变换后,重新按水平和垂直方向分割成大小为H和W的两部分f和f,并同时恢复原通道数的大小,再将f和f经过Sigmoid函数得到输出g和g,公式如下:gh=Sigmoid(F,(f)g=Sigmoid(Fw(f)g”和g表示坐标水平和垂直方向的重要程度,以其为CA,对原特征图进行权重赋值,得到CA的最终输出公式如下:ye(i,j)=a.(i,j)XgXguCA即通过赋予特征图各通道的各坐标权重,从而有
25、效关注空间坐标位置信息。本文在改进过程中进行了两种方案的尝试,两方案分别如图5(a)和图5(b)所示。一是直接改进所有C3模块,使之系统工程与电子技术在提取特征时就已侧重空间坐标位置信息;二是将该注意力机制嵌人到主干段中的SPPF模块之前,对总特征图进行CA机制处理,以提取感兴趣的目标区域特征。经实验比较,发现后者性能更好,因此最终选择了方案2。CBLCAC3CBLCAC3XnCBLCBLCACBLConcatBN修正线性单元卷积卷积SigmoidSigmoid2a.(h,i)第45卷CBLCBLC3XnCBLCAC3XnCBLCAC3XnCBLCAC3XnCBLSPPF(a)方案1主干网络(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 改进 YOLOv5 合成孔径雷达 图像 舰船 目标 检测 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。