分销赏收藏举报申诉 / 11

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 改进YOLOv5的合成孔径雷达图像舰船目标检测方法.pdf

改进YOLOv5的合成孔径雷达图像舰船目标检测方法.pdf

上传人：自信****多点

文档编号：1450951

上传时间：2024-04-27

格式：PDF

页数：11

大小：5.59MB

《改进YOLOv5的合成孔径雷达图像舰船目标检测方法.pdf》由会员分享，可在线阅读，更多相关《改进YOLOv5的合成孔径雷达图像舰船目标检测方法.pdf（11页珍藏版）》请在咨信网上搜索。

1、第45卷第12 期2023年12 月文章编号：10 0 1-50 6 X(2023)12-3743-11改进YOLOv5的合成孔径雷达图像舰船目标检测方法系统工程与电子技术Systems Engineering and ElectronicsVol.45No.12December 2023网址：www.sys-贺翥祯1，2，李敏1*，苟瑶，杨爱涛1（1.火箭军工程大学作战保障学院，陕西西安7 10 0 2 5；2.国防科技大学信息与通信学院，湖北武汉430 0 10）摘要：针对合成孔径雷达图像目标检测易受噪声和背景干扰影响，以及多尺度条件下检测性能下降的问题，在兼顾网络规模和检测精度的基础上，

2、提出了一种改进的合成孔径雷达舰船目标检测算法。使用坐标注意力机制，在确保轻量化的同时抑制了噪声与干扰，以提高网络的特征提取能力；融入加权双向特征金字塔结构以实现多尺度特征融合，设计了一种新的预测框损失函数以改善检测精度，同时加快算法收敛，从而实现了对合成孔径雷达图像舰船目标的快速准确识别。实验验证表明，所提算法在合成孔径雷达舰船检测数据集（synthetic apertureradarshipdetectiondataset，SSD D)上的平均精度均值达到96.7%，相比于YOLOv5s提高1.9%，训练时收敛速度更快，且保持了网络轻量化的特点，在实际应用中具有良好前景。关键词：合成孔径雷达

3、；目标检测；YOLOv5；注意力机制；多尺度融合中图分类号：TP391Ship target detection method for synthetic aperture radar images(1.Combat Support College,Rocket Force University of Engineering,Xian 710025,China;2.College of Information and Communication,National University of De fense Technology,Wuhan 430010,China)Abstract:Aimi

4、ng at the problem that target detection in synthetic aperture radar(SAR)images is easilyaffected by noise and background interference,and the performance of ship target detection is degraded undermulti-scale conditions,an improved YOLOv5 algorithm is proposed on the basis of considering the network

5、scaleand detection accuracy.In this algorithm,coordinate attention mechanism is used to suppress noise andinterference to improve the feature extraction ability of the network while ensuring its lightweight advantage.The bi-directional feature pyramid is integrated to achieve multi-scale feature fus

6、ion.A new prediction box lossfunction is designed to improve the detection accuracy and accelerate the convergence of the algorithm.Thus,the ship target can be recognized quickly and accurately in SAR images.Experimental verification shows thatthe mean average presicion(mAP)of the proposed algorithm

7、 on SSDD dataset reaches 96.7%,which is 1.9%higher than that of YOLOv5s.The convergence speed is faster during training,and the network is lightweight,which has a good prospect in practical application.Keywords:synthetic aperture radar;target detection;YOLOv5;attention mechanism;multi-scale fusion0引

8、言海洋权益涉及国家的根本利益，为维护军事和领海安全，对舰船目标进行有效的检测识别尤为重要。合成孔径雷达（syntheticapertureradar，SA R）具有受复杂天气因素收稿日期：2 0 2 2-10-2 8；修回日期：2 0 2 3-0 2-0 8；网络优先出版日期：2 0 2 3-0 3-2 2。网络优先出版地址：https:/ 2 0 0 6 2 40)资助课题*通讯作者引用格式：贺葛祯，李敏，苟瑶，等。改进YOLOv5的合成孔径雷达图像舰船目标检测方法JI系统工程与电子技术，2 0 2 3，45（12)：3743-3753.Reference format:HE Z Z,LI

9、 M,GOU Y,et al.Ship target detection method for synthetic aperture radar images based on improvedYOLOv5JJ.Systems Engineering and Electronics,2023,45(12):3743-3753.文献标志码：Abased on improved YOLOv5HE Zhuzhen?,LI Min.*,GOU Yao,YANG AitaoD01:10.12305/j.issn.1001-506X.2023.12.04影响小，在日间或夜间环境均可工作的特点1，十分符合舰

10、船目标监测所需的环境适应性和适时性的要求，因此得到了广泛使用。受制于硬件算力制约，早期SAR图像的舰船目标检测技术主要依赖于预先定义的分布和人工设计特征，例如双Xn(8080256):3744:参数恒虚警率算法等2-1。这些传统的舰船目标检测算法大多针对特定场景，主要对海杂波进行建模与仿真以及恒虚警目标的检测，但其算法鲁棒性较低，泛化性差。近年来,随着硬件性能的不断提升，卷积神经网络（con-volutional neural network，C NN)的迅速崛起使得基于深度学习的目标检测算法受到了广泛关注，这类算法在实现特征自行提取方面具备极大优势，可以摆脱对人工设计特征和建模的依赖，达到较

11、好的识别精度和泛化性能。在发展过程中，CNN根据处理流程又可分为两类。第一类是以区域CNN(region CNN,R-CNN)5、Fa s t R-CNNt 6、Fa s t e r R-CNN7 等为代表的二阶段算法，此类算法的检测准确率较高，但由于需要先提取候选区域，其网络结构较大，执行速率较慢。第二类是以单次多框检测器（singleshot multi-boxdetecfor，SSD)8 和 YOLO(You Only Look Once)系列9-12 1 等为代表的一阶段算法，其主要思路是将分类和目标的定位均看作回归问题，执行一次处理。与二阶段算法相比，其检测不需要生成候选区域，大大提

12、高了算法效率，但其检测精度略低。针对上述两类算法的缺点，学者们不断进行着改进优化。如赵江洪等13和顾俊俊等14使用不同的网络替代视觉几何组（visual geometrygroup，VG G)作为其主干网络，并调整锚框的尺寸和个数。马啸等151增加了判别模块以及类别预测分支和语义分割分支。这些基于二阶段算法的改进虽然在一定程度上减小了主干网络的结构，提高了检测精度均值，但保留了区域推荐模块，网络结构仍比一阶段算法复杂。唐崇武等16 1通过微调分类网络、增加训练尺度、聚类目标边框维度等方法优化了YOLOv3检测算法。胡欣等17 基于YOLOv5增加了多分支注意力机制。钱坤等18 1改进了YOLO

13、v5网络的激活函数和网络特征融合结构。以上改进不同程度地提高了一阶段算法的检测精度，但在原算法上增加了较高的计算量。因此，使用深度 CNN进行SAR图像舰船目标检测面临的一个重要问题，就是兼顾网络规模和目标检测精度。就当前的改进算法性能而言，一阶段算法更具优势，在尽量维持原有计算量的情况下进一步改进一阶段算法的检测精度，具有重要的研究价值和意义。预处理CBLCBLXn(6406403)1CBLBottleneckC3Cony：卷积层Convolutional layer;SPPF：快速空间金字塔池化Spatial pyramidpooling-fast。系统工程与电子技术另外，SAR的斑点噪声

14、影响是目标检测呕需解决的一个重要问题。由于独特的成像技术,SAR图像存在很多斑点噪声，这些噪声会影响目标检测精度。处于港口沿岸的舰船图像，成像时的斑点噪声和检测时遇到的干扰目标（如小岛、陆地和海杂波）混杂在一起，将产生较多虚警。除此以外，当前检测算法对于SAR的舰船目标存在多尺度情况下泛化性弱的问题。SAR的舰船图像由于存在多分辨率成像模式以及不同的船舶尺寸等情况，导致输入图像目标尺寸差异性大，这样的多尺度输人会使算法性能不稳定。尤其是当小目标映射到最终特征图时，用于位置细化和分类的信息很少，会降低检测性能。本文从上述问题出发，提出了一种基于坐标注意力（c o o r d in a t e a

15、 t t e n t io n，C A）机制及多尺度融合的目标检测算法。算法以YOLOv5新的版本（V6.1版）为基础，进行了深度优化：一是结合CA改进主干网络，侧重目标坐标重要度信息以提高模型特征提取能力，抑制了噪声和干扰的影响；二是改进了原网络的特征融合结构，添加了具有跳跃连接的加权双向特征金字塔网络（bi-directionalfeaturepyramidnetwork，Bi FPN)进行多尺度融合，提高多尺度下的泛化能力；三是设计了一种新的预测框损失函数一一快速有效的交并比(rapid and efficient intersection over union，REI O U),以加快

16、预测框收敛的速度和准确性。改进后网络的权重文件仅增加了0.4M,确保了网络的轻量化。最后，将模型在SAR舰船检测数据集（ship detection dataset，SSD D）上进行了实验验证，其平均精度均值（mean average precision，mAP)相比原算法提高了1.9%。1YOLOv5网络结构1.1YOLOv5的网络结构YOLOv5的网络结构主要包括主干段、颈部段和头部段3部分。实现过程中，为增加预测的准确性和模型泛化能力,在数据进人预测网络前，对YOLOv5进行了一系列的图像增广和自适应锚框计算等预处理操作，其网络具体结构如图1所示。主干段颈部段CBL3CBLXnXnCo

17、nvBNSiLUAddCBLBottleneckCBLBN：批归一化Batchnormalization;图1YOLOv5（V6.1版）的模型结构Fig.1 Model structure of YOLOv5(version6.1)第45卷头部段CBLSPPFCBDUpSampleXnConcatCBLUpSampleConcatCBLConcatC3nCBLConcatCBL(4040512)Concat(20201024)SiLU：Si g mo i d 加权线性单元Sigmoidweighted linearunit;第12 期1.2新版本重要改动YOLOv5的V6.1版本在主干段部分，

18、采用了新的CSPDarknet53网络结构对图像的特征进行提取。与早期版本有所区别，V6.1版本去掉了之前的Focus聚焦结构，并将此前的BottleneckCSP部分更新为C3，C 3的具体结构如图1左下角所示。主干段就是以一系列的C3将各尺度的特征图分成两部分进行前向计算，一路经过颈部段处理，另一路与第一路直接进行特征融合。这样做的优势是减少了梯度的重复计算，在保证速度和准确率的同时，减少了网络参数和运算量。最后，将提取的特征图直接输人改进的快速空间金字塔池化（spatialpyramidpooling-fast，SPPF），对网络不同尺度的特征进行融合。在颈部段部分，YOLOv5使用了路

19、径聚合网络（pathaggregation network,PANet)19 进行了特征融合,PANet是在特征金字塔网络(feature pyramid network，FPN)2 0)基础上增加的一条自底向上的信息流通路，缩短了信息传输路径，旨在使准确的底层定位信息能够增强到整个特征提取网络，其总体结构如图2 所示。在头部段部分，YOLOv5的V6.1版本采用了完全交并比(complete intersection over union，CIO U)损失2 1 替代了早期版本中的广义交并比（generalized intersection overunion，G IO U)2 2 损失，作

20、为预测框损失函数。CIOU考虑了中心点距离和宽高比两个参数。相比GIOU而言，其算法收敛速度更快。颈部段CBL1CBLC3xnCBLC3xnCBLC3xnCBLC3xnCASPPF贺翥祯等：改进YOLOv5的合成孔径雷达图像舰船目标检测方法P之一图2 PANet结构Fig.2PANet structure2基于注意力机制及多尺度融合的YOLOv5改进网络2.1算法框架算法框架如图3所示，其中红色部分为本文的改进部分。输入图像具有灵活的尺寸，经图像预处理统一调整为640X640大小，之后经过一系列CBL模块和C3模块的卷积处理得到深层特征，再将特征图经CA模块为其各特征点重新赋予权重后输入快速空

21、间金字塔池化SPPF模块。这一过程主要是从特征图中抽取横纵坐标因子，做批归一化（batchnormalization，BN)后得到坐标权重，增大了卷积核的局部感受野。随后，图像特征在移除了单输人结点，增加了跳跃连接的BiFPN网络后，进行多尺度融合，最后在头部段将3个尺度下的预测信息进行处理，以得到置信度损失、类别损失和预测框损失，其中的预测框损失使用了设计的REIOU损失。主干段头部段C3xnConvCBLBiFPNAdd2UpSampleCBLC3xnBiFPNAdd2UpSampleCBL3745V5(8080256):BiFPNAddC3xnCBLBiFPNadd2C3xnConvCo

22、nv(20201024)(4040512)BiFPNLAd2BiFPN中的二输入融合模块Fig.3Model structure of the improved algorithm2.2CA机制CA机制的思想是令网络在提取某类物体特征时对于位置或通道的关注有明显的侧重，以此提高算法性能。但1/2AddSiLUConv图3改进后的算法模型结构其会造成计算量的增加，这对于训练时间和算力成本的控制以及移动端部署极为不利。相比其他注意力机制，CA23计算开销小,并且在坐标和坐标方向上对位置进行池BiFPNLadd3BiFPN中的三输入融合模块1/3AddSiLUConv3746：化和BN,以图像中目标

23、坐标灰度值分布特点对原特征图中的每一处赋予坐标权重,可以有效抑制 SAR图像中的噪声和干扰影响，因此引入CA机制对网络进行改进。CA模块的具体实现结构如图4所示。X轴方向平均池化Y轴方向平均池化连接卷积重新赋权图4CA模块的结构Fig.4Structure of CAmodule其具体工作流程如下：对于输人尺寸为CXHXW的特征图，分别进行水平方向和垂直方向的平均池化得到大小为CX1XW和CXHX1的两组张量，其公式为(h)=1WOiKW1.2.（j.)1&(w)=H.OiH式中:z(h)为第 C个通道第 h行的平均池化结果;z（w)为第C个通道第w列的平均池化结果。将得到的和两个张量放在同一

24、维度上聚合，再通过一个11的卷积改变输出的通道数，通道数具体由衰减因子进行调控，公式如下：f=C(2,z)Ok1x1(3)式中：C(）表示连接操作；?表示卷积运算。经过BN层和 Sigmoid的非线性变换后，重新按水平和垂直方向分割成大小为H和W的两部分f和f,并同时恢复原通道数的大小，再将f和f经过Sigmoid函数得到输出g和g，公式如下：gh=Sigmoid(F,(f)g=Sigmoid(Fw(f)g”和g表示坐标水平和垂直方向的重要程度，以其为CA,对原特征图进行权重赋值，得到CA的最终输出公式如下：ye(i,j)=a.(i,j)XgXguCA即通过赋予特征图各通道的各坐标权重，从而有

25、效关注空间坐标位置信息。本文在改进过程中进行了两种方案的尝试,两方案分别如图5(a)和图5(b)所示。一是直接改进所有C3模块，使之系统工程与电子技术在提取特征时就已侧重空间坐标位置信息；二是将该注意力机制嵌人到主干段中的SPPF模块之前，对总特征图进行CA机制处理，以提取感兴趣的目标区域特征。经实验比较，发现后者性能更好，因此最终选择了方案2。CBLCAC3CBLCAC3XnCBLCBLCACBLConcatBN修正线性单元卷积卷积SigmoidSigmoid2a.(h,i)第45卷CBLCBLC3XnCBLCAC3XnCBLCAC3XnCBLCAC3XnCBLSPPF(a)方案1主干网络(

26、a)Backbone network of scheme 1图5两种改进方案的主干网络示意图Fig.5Backbone network schematic diagram of the twoimproved schemes2.3加权双向特征金字塔多尺度特征融合YOLOv5中的主干段部分经过了多个C3模块组的处理，且每经过一个C3模块组，特征图的尺寸大小便会缩小为原来的50%,这主要是为了提取更高维的语义信息，但在获取更高维特征的同时，会损失掉部分底层细节特征，因(1)此YOLOv5在颈部段部分使用了PANet的基本结构，促进不同尺度特征信息的融合，以弥补此缺陷。PANet是基于（2)FPN的

27、改进,它在FPN自顶向下的融合路径之后又添加了一条自底向上的路径，利用准确的低层定位信号增强整个特征层次，从而缩短了低层与顶层特征之间的信息路径。将FPN中融合后的第n个特征层记为P,，可以看到，PANet结构仍然为较简单的双向融合，存在部分节点信息允余、原始节点信息未直接参与输出特征融合等问题。基于此，本文采用了EfficientDet241网络中的BiFPN结构对网络特征融合部分进行了改进，具体结构如图6 所示。考虑到BiFPN的改进较为复杂，为进行区分，文献2 4将改进前的第n个特征层记为Pn，将改进后的第n个特征层记为Pou。(4)(5)(6)C3XnCBLC3nCBLC3XnCASP

28、PF(b)方案2 主干网络(b)Backbone network of scheme 2重复区块P,PP.OP.OP.OP.OPAN图6 PAN和BiFPN的网络结构Fig.6Network structure of PAN and BiFPNoutDoulPoutpoutBiFPN第12 期BiFPN在PANet上的改进可总结为3个方面：一是减少了部分节点，BiFPN在融合处删除了单输人节点，因为这样的节点相较于前一节点没有额外信息，去掉节点后可减少余计算；二是增加了不相邻节点间的跳跃链接，使输出层不但能够得到自下而上已经参与特征融合的信息，还保留了原始节点未经融合的信息；三是BiFPN在特

29、征融合后，可继续堆叠，做进一步融合，以改善效果。考虑到算法网络结构复杂度和改进后的计算量等实际情况，本文设计的BiFPN融合层数为3,堆叠数为1,结合原主干段网络实际结构，添加了一次跳跃连接，并改变了原层次的连接关系，具体连接关系如图7 所示。PSPPFPiC3PC31图7 改进后的特征融合网络Fig.7Improved feature fusion network对照图7,以P6为例,罗列出输人输出关系式如下：Pd=Conv(Pi+Resize(Pio)(7)Pout=Conv(Pin+Pd+Resize(Pou)式中：Conv为卷积操作，由C3模块执行;Resize通常为上采样或下采样操作

30、，以匹配各特征图大小。在本算法中，左侧两黑色虚线框中的upsample执行上采样，而右侧两黑色虚线框中的CBL执行下采样。2.4损失函数YOLOv5算法V6.1版本的预测框损失函数采用了CIOU损失，但在预测框回归过程中，一旦 CIOU与真实框的宽高纵横比相同，预测框的宽和高无法同时增加或者减小，以致不能继续优化。为解决此问题，本文在参考EIOUL251的基础上，设计了一种新的损失函数REIOU作为预测框损失函数，在CIOU基础上将预测框和真实框的纵横比直接拆分为单独预测长和宽，并结合其梯度下降趋势对损失函数进行了改进。原始的EIOU示意图如图8 所示，其损失值如下：Lelou=1-EIOU=

31、1ou-0(b)_g(w.m)_g(h.h)C式中：C为覆盖预测框与真实框的最小外接框的对角线长度;C和Ch分别为其宽度和高度;p(b,b）为预测框与真实框中心点的距离;p（w,w ）和p(h，h）分别为其横向差值和纵向差值，具体如下：贺翥祯等：改进YOLOv5的合成孔径雷达图像舰船目标检测方法heCwP图8 EIOU示意图Fig.8EIOU schematic diagramConcatC3CBLCBLPdUpSampla6ConcatC3CBLUpSampleConcat3747p(w,w)=|w-w/(9)p(h,h)=|h-h|(10)p(b,lbm)hCC式（8)实际包含了IOU损失

32、、中心点距离损失和预测Pa框与真实框的纵横比损失3方面内容。将此3项内容整合C3后,影响最终损失值的所有变量即为式中的 EIOU。EI O UConcatCBLBiFPNCPC3(8)C的值越接近于1，则预测框损失越小。为确保预测框损失能够更快收敛，设计REIOU损失如下：1LREIOUX(-1+2(1-EIOU)In2式(11)中的LREIOu与原始LEIOu均随EIOU值的增大而减小，下限均为O。但两者相比，LREIOu曲线梯度较LEIOu更大，收敛更快。且梯度随EIOU值增大而逐渐降低。当EIOU的值趋向于1时LREIOu梯度趋近于一1,因此具有自适应调节的良好性能。两者曲线比对如图9

33、所示。4.54.03.53.02.52.01.51.00.50-1.0图 9 REIOU与 EIOU对比图Fig.9Comparison of REIOU and EIOU3实验结果与分析3.1原始架构与实验环境本文算法以YOLOv5s为原始架构进行改进。YOLOv5系列共分为五种网络架构，区别仅在于网络规模和参数量的差异。通过调节深度因子和宽度因子，改变主干段部分中的C3模块个数及其内部卷积核个数，最终形成不同的网络深度和网络宽度。其参数对比如表1所示，对比项目包括深度因子、宽度因子、总参数量、网络层数和浮点运算数(floating point operations,FLOPs)。(11)-

34、0.50EIOU:REIOU-loss;:EIOU-losS。0.51.03748:表1YOLOv5系列各网络结构规模Table 1Each network structure scale of YOLOv5 series网络架构深度因子宽度因子总参数量网络层数FLOPsYOLOv5n0.33YOLOv5s0.33YOLOv5m0.67YOLOv511YOLOv5x1.33事实上，本文的改进适用于YOLOv5系列所有的网络架构，但综合考虑到网络规模、训练时长以及识别率等因素，最终选择了较为轻量的YOLOv5s进行改进实现。实验的软硬件环境搭建如表2 所示。表2 实验的软硬件环境Table 2H

35、ardware and software of the experiment软硬件操作系统中央处理单元图形处理单元显存大小/GB内存大小/G加速环境深度学习框架Python版本3.2数据集与训练策略实验使用的数据集为公开的SSDD数据集2 6，该数据集共有116 0 张SAR图像，包含2 456 个舰船目标，具有多种极化模式、多种分辨率，包括了海面及沿岸等多种舰船场景，能有效验证模型的鲁棒性。本文实验将SSDD数据集按照7:2:1的比例随机划分为训练集、验证集、测试集。实验在数据集上从头开始训练权重，使用随机梯度下降（stochasticgradientdescent，SG D)优化器对网络参

36、数进行选代更新，动量参数设为0.9 37，批次大小设为32，训练周期为10 0 个轮次，训练时使用了warm-up方法对学习率的调整进行预热。其中,设置初始学习率lro为0.0 1,在前3个轮次进行warm-up使学习率迭代更新直至0.1,之后使用余弦退火算法再次更新学习率，最终使学习率下降至0.0 0 1。3.3评价指标本实验对改进算法的评价从目标检测性能、运算处理速度和模型大小3个方面展开。目标检测性能以mAP为主要指标进行评价。mAP是以召回率R和查准率P为横、纵坐标形成的曲线与两坐标轴构筑的面积大小，其作为衡量模型整体性能的最终评价指标，具体表示为mAP=P(R)dR0TPR=TP+F

37、NTPP一TP+FP系统工程与电子技术式中：TP表示目标正确检测的个数;FN表示目标漏检的个数；FP为错检的目标个数。上述评价指标的确定与IOU检测阈值紧密相关，本实0.2517652700.570223260.7520871.3181461382941.2586217814配置Ubuntu20.04IntelXeonsilver4210RNvidia TITANRTX2416Cuda 10.2Pytorch1.12.0Python 3.7.131第45卷2704.527016.536949468109.1567205.7(12)验设置IOU检测阈值为0.5，即当检测框与真实框的重叠区域超过5

38、0%时，判定检测框预测位置正确。运算处理速度以每秒处理顿数（frameper second，FPS)和FLOPs为指标进行评价。这两个指标能够分别表明模型的动态实时检测能力以及模型所需的算力负载。模型大小以参数量和模型权值文件大小为指标进行评判，这两个指标能够表明模型的轻量化程度，并为移动端移植的可行性提供参考。3.4结果与分析3.4.1消融实验本文算法从特征提取、特征融合和损失函数3方面对YOLOv5s进行了改进，为评估此3项改进对SAR舰船目标检测的优化程度，设计了单项及多项组合的消融实验，实验结果如表3所示。表3各改进算法的性能比较Table 3 Performance of each

39、improved method算法CAYOLOv5s一改进算法1改进算法2改进算法3改进算法4改进算法5改进算法6本文算法其中,第一行为原YOLOv5算法，最后一行为本文提出的改进算法，中间几行为消融实验的对比算法，表格内“”表示使用了当前模块，“二”表示未使用当前模块。从改进算法1改进算法3可以看出，就单个模块对算法检测效果的改善而言，CA机制和BiFPN、REI O U 相比带来的性能改善相对较低，但通过改进算法4可以看出，CA一旦与BiFPN相结合,对算法检测能力的改善则会有明显提升，这是因为BiFPN存在跳跃连接，在此基础上进行特征融合，可充分利用CA侧重感受目标空间位置的优势，而原算

40、法的特征融合没有跳跃连接，因此CA带来的优势并未被有效利用至后续的检测过程中。在改进算法3、改进算法5、改进算法6 中，可以看到采用REIOU作为损失函数，也能较好改善算法的平均精度均值，这是因为REIOU解决了原算法中预测框的长宽比在达到真实框长宽比的情况下无法同时增大或缩小的问题，使预测框损失得到有效改善。对比本文算法可知，综合3方面的改进可最大限度地提高原算法的目标检测性能,在 SSDD数据集上使 mAP从原来的9 4.8%提升至9 6.7%，性能改善了1.9%。3.4.2性能曲线本文算法与原YOLOv5s在迭代过程中mAP值以及loss曲线的对比情况如图10 和图11所示。BiFPNR

41、EIOU一一一一一一一mAP94.895.095.595.396.395.996.196.7FPS143139127156128128139127第12 期1.00.90.80.70.6dyu0.50.40.30.20.1102030405060708090100轮次:YOLOv5s;:改进YOLOv5s。图10 算法改进前后mAP值曲线Fig.1o mAP curve before and after algorithm improvement0.0350.0300.0250.0200.0150.0100.0050102030405060708090100轮次:YOLOv5s;:改进YOLO

42、v5s。图11算法改进前后的loss曲线Fig.ll Loss curve before and after algorithm improvement图10 展示了本文算法与原YOLOv5s算法的mAP值曲线。由图10 可以看到，本文算法mAP值收敛更快，在约20个轮次时即可达到90%左右，而原YOLOv5s算法需要50个轮次后方能达到同样水平。这是由于本文引人的CA机制给予侧重的坐标位置特征更大的权重，使得算法在迭代时更具方向性，收敛更快，结合BiFPN结构可更有效地提取特征并进行融合，故本文算法收敛过程较原算法更为平稳，最终收敛值更高。图11展示了算法改进前后的loss曲线，其中红色代表

43、改进算法loss曲线，蓝色代表原算法loss曲线。由图11可知，改进算法的loss值下降更快，最终收敛值更低。这是因为REIOU对预测框的损失进行了重新定义，将预测框损失由预测框和真实框的长宽比改为了直接预测目标框长度和宽度两个因子，并优化了下降的梯度，使收敛性能得到有效改善。3.4.3检测效果为直观展现本文算法的检测效果，从测试集的检测结果中选取了四张具有代表性的典型场景检测结果，如图12所示。其中，图12(a）、图12(b)展示了在远海小目标时的舰船检测结果。图12(c）、图12(d)展示了舰船人港时复杂背景情况下的舰船检测结果。贺翥祯等：改进YOLOv5的合成孔径雷达图像舰船目标检测方法

44、ship.0.89Ehip.0.87ship.0.79ship0.79sship.Q.701(c)入港分布较离散的目标(c)Scattered targets docked in the port (d)Dense targets docked in the port图12 实验结果示例Fig.12Examples of experimental results从图12 可以看出，算法对于离港的舰船在无港口、岛屿等干扰的情况下，检测效果良好，无论是对少数目标或是多个离散分布的目标都能实现准确的识别。对于舰船人港时具有复杂背景影响的情况，改进算法也具有良好的检测效果，尤其是在图12（d)中，算法

45、对于复杂背景下，不同尺寸大小且分布密集的舰船目标均可实现准确定位和识别，漏警率和虚警率低。3.4.4算法比较为验证算法的有效性和先进性，将本文算法与其他常用目标检测算法在SSDD数据集上进行了横向对比实验，结果如表4所示。表4SSDD数据集上各检测算法对比Table 4Accuracy of the detection algorithm on SSDD dataset检测算法mAPFPSFLOPs/GPara/MWeights/MFaster-RCNN83.716.7ResNet+FPNRetinaNetSSDYOLOv3YOLOv5s本文算法96.7对于平均检测精度而言，各算法的mAP值均

46、可达到83%以上。对比两阶段算法中主干段采用ResNet5027+FPN结构的 Faster-RCNN,本文算法的mAP提升了13%，性能改善明显，对比单阶段的RetinaNetL28和SSD算法，本文算法的mAP也分别有4.7%、10.6%的提升，具有更加优秀的检测能力，同时也优于同系列的YOLOv3和YOLOv5s算法。在运算速度和计算量上，本文算法FPS达到了12 7，与除YOLOv5s的其他算法相比提高了37 倍。FLOPs的大小为16.6 G，远小于Faster-RCNN、Re t in a Ne t、YO LO v 33种算法。与SSD算法相比，虽然总计算量略高，但由于算法结构具有

47、较高并行度，改进算法实际处理速率达到了SSD的3倍，具有明显优势。与原算法YOLOv5s相比，由于增加了CA机制,改进算法总的计算量略有增加，运算速度亦有3749ship.0.85ship.0.70ship.0.86ship0.92Ship 0.7.ship0iship.0.84ship0.84(a)少量目标(b)大量离散目标(a)Small number of targets(b)Large number of scattered targetsphip.0.85S134.592.1 23.486.041.096.136.994.8143127ship.o.8tship.O.75ship.0

48、.52ship.0.87ship.U.o9(d)入港分布较密集的目标41.4330.312753.115.013.1155.361.516.57.016.67.2257.1105.1123.613.714.13750所下降，然而12 7 FPS的速率已经可以满足当前大多数的工程实际需求。在可接受的下降范围内，新算法换来了检测性能的明显提升。至于参数量和权重文件大小，本文算法的参数量仅为7.2M,权重文件大小为14.1MB,约为 SSD算法的1/2,Faster-RCNN的1/7,RetinaNet的1/8,YOLOv3的1/9,显著优于其他算法。与原YOLOv5s算法相比,本文算法参数量和权重

49、文件仅增加了0.2 M和0.4MB,仍然保持了轻量化，便于在移动端上部署和执行。3.5与其他改进算法的对比在确定本文算法的过程中，进行了两种CA嵌入方案的对比实验，其具体实现见第2.2 节，实验结果如表5所示。其中，方案1和方案2 为第2.2 节所述的方案1与方案2。两种方案均采用了REIOU和BiFPN。表5两种CA嵌入方案性能对比Table 5Performance comparison of two CA placement schemes嵌入方案Para/M方案196.4方案2（本文方案）96.7Table 6Comparison of performance parameters b

50、etween YOLOv5s and the improved algorithm检测算法SEYOLOv5s一改进算法1改进算法2改进算法3改进算法4改进算法5改进算法6改进算法7改进算法8一本文算法一实验结果表明，以上9 种改进算法均能提高检测算法的性能。就mAP值而言，在损失函数相同的情况下，CA机制相对 SE、C BA M 能够为原算法带来更多提升，在 SIOU、EIOU和REIOU下分别提高1.2%、1.7%和1.9%。就参数量而言,CA带来的增长也是3种注意力机制中最少的。故而在三者中选择CA机制为宜。在注意力机制确定的情况下，采用REIOU作为预测框损失相较SIOU而言，FPS值基

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 改进 YOLOv5 合成孔径雷达图像舰船目标检测方法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。