基于改进YOLOv5s的遥感目标检测.pdf
《基于改进YOLOv5s的遥感目标检测.pdf》由会员分享,可在线阅读,更多相关《基于改进YOLOv5s的遥感目标检测.pdf(7页珍藏版)》请在咨信网上搜索。
1、计算机测量与控制 ()C o m p u t e r M e a s u r e m e n t&C o n t r o l 测试与故障诊断 收稿日期:;修回日期:.基金项目:江苏省自然科学基金资助项目(B K );江苏省政策引导类计划项目(S Z S Q ).作者简介:王悦炜(),男,河北邯郸人,硕士研究生,主要从事目标检测、图像处理方向的研究.焦良葆(),男,安徽安庆人,硕士,教授,硕士研究生导师,主要从事图像信号处理、视觉信息理解方面的研究.引用格式:王悦炜,焦良葆,高阳基于改进Y O L O v s的遥感目标检测J计算机测量与控制,():文章编号:()D O I:/j c n k i
2、/t p 中图分类号:T P 文献标识码:A基于改进Y O L O v s的遥感目标检测王悦炜,焦良葆,高阳(南京工程学院 人工智能产业技术研究院,南京 ;江苏省智能感知技术与装备工程研究中心,南京 )摘要:优化遥感目标检测对于军事民生方面都有着重要意义;由于遥感数据中成像模糊、目标较小、检测对象数量多,导致检测精度不高,现提出一种新网络:新网络在Y O L O v s原网络的基础上使用M i s h激活函数代替S i L U激活函数;为解决遥感图像中小目标的问题,采用了对小目标、低分辨率友好的S P D C o n v模块;考虑到使用耦合检测头会存在回归、分类两个任务之间的冲突问题,采用Y
3、O L O X中解耦的检测头,提高了模型查准率;实验结果表明,相比于原始Y O L O v s,新网络在mA P平均精度均值方面提升了,查全率(r e c a l l)提升了 ,检测速度F P S提升了 ;改进后的网络模型相对于原始模型具有明显优越性,识别效果提升明显.关键词:深度学习;遥感;激活函数;小目标;解耦检测头R e m o t eS e n s i n gT a r g e tD e t e c t i o nB a s e do nI m p r o v e dY O L O v sWANGY u e w e i,J I AOL i a n g b a o,GAOY a n g(
4、A I I n d u s t r i a lT e c h n o l o g yR e s e a r c hI n s t i t u t e,N a n j i n gI n s t i t u t eo fT e c h n o l o g y,N a n j i n g ,C h i n a;J i a n g s uI n t e l l i g e n tP e r c e p t i o nT e c h n o l o g ya n dE q u i p m e n tE n g i n e e r i n gR e s e a r c hC e n t e r,N a n
5、 j i n g ,C h i n a)A b s t r a c t:O p t i m i z i n gr e m o t e s e n s i n g t a r g e t d e t e c t i o n i so f g r e a t s i g n i f i c a n c e t om i l i t a r ya n dp e o p l e s l i v e l i h o o d D u e t o t h eb l u r r e di m a g e,s m a l l t a r g e t a n d l a r g en u m b e ro fd
6、e t e c t e do b j e c t s i nt h er e m o t es e n s i n gd a t a,t h ed e t e c t i o na c c u r a c yi sn o th i g h An e wn e t w o r k i sp r o p o s e d:t h en e wn e t w o r ku s e st h eM i s ha c t i v a t i o nf u n c t i o nt or e p l a c et h eS i L U(S i g m a i dw e i g h t e dl i n e
7、ru n i t)a c t i v a t i o nf u n c t i o no nt h eb a s i so f t h eo r i g i n a lY O L O v s(y o uo n l y l o o ko n c ev s)n e t w o r k;I no r d e r t os o l v e t h ep r o b l e mo f s m a l l t a r g e t s i nr e m o t es e n s i n g i m a g e s,S P D C o n v(S p a c e t o d e p t h C o n v)m
8、 o d u l ew h i c h i s f r i e n d l y t os m a l l t a r g e t s a n d l o wr e s o l u t i o n i s a d o p t e d;C o n s i d e r i n gt h ec o n f l i c tb e t w e e nr e g r e s s i o na n dc l a s s i f i c a t i o nt a s k sw h e nu s i n gc o u p l i n gd e t e c t o rh e a d s,t h ed e c o u
9、 p l e dd e t e c t o rh e a d s i nY O L O X(y o uo n l y l o o ko n c eX)a r eu s e d t o i m p r o v e t h em o d e l p r e c i s i o n T h e e x p e r i m e n t a l r e s u l t s s h o wt h a t c o m p a r e dw i t h t h eo r i g i n a lY O L O v s,t h en e wn e t w o r kh a si m p r o v e dt h
10、ea v e r a g ea c c u r a c yo fmA P(m e a na v e r a g ep r e c i s i o n)b y,t h er e c a l lr a t eb y a n dt h ed e t e c t i o ns p e e db y T h e i m p r o v e dn e t w o r km o d e lh a so b v i o u sa d v a n t a g e so v e rt h eo r i g i n a lm o d e l,a n dt h er e c o g n i t i o ne f f
11、e c t i ss i g n i f i c a n t l y i m p r o v e d K e y w o r d s:d e e p l e a r n i n g;r e m o t es e n s i n g;a c t i v a t i o nf u n c t i o n;s m a l l g o a l s;d e c o u p l i n gd e t e c t o r引言军事民生方面的遥感目标检测具有越来越重要的意义.遥感目标检测要求从复杂的遥感图像中找到感兴趣的目标,并精确地标注目标的位置和名称.同时,由于遥感图像的拍摄角度特殊,很大一部分遥感图像是从
12、高空俯视的角度进行拍摄的,造成一幅遥感图像中常会包含很多无用信息,这大大增加了检测遥感目标的难度.这就需要高精度和对遥感目标检测有针对性的优化方法,但是遥感目标的检测除了拍摄角度问题,还存在着其他一些难题:由于小目标覆盖面积小、像素面积占比少、特征表达不充分、拍摄距离较远、图像覆盖范围较大而导致的目标形态畸变等特点,使得基于遥感图像的小目标检测面临更大挑战.随着机器学习的快速发展,深度学习越来越多地应用在目标识别方面,图像目标识别技术也越来越先进.当前,目标检测的主流方法大致分为两种:以R C NN、F a s tR C NN、F a s t e rR C NN网络为代表的两阶段目标检测以及以
13、YO L O、S S D为代表的单阶段目标检测.由于两阶段目标检测在进行图像识别时需要先选出候选区域,再对选出的候选区域进行调整分类,这就使得双阶段比单阶段的检测精度高,但同时检测速度(F P S)大打折扣,并且随着单阶段检测算法YO L O的不断更新,单阶段目标检测已经能在保证较高检测速度的同时,兼顾良好的检测精度.在单阶段目标检测中,检测模型存在因目标重叠带来的漏检、模型计算量大导致检测速度较慢、损失函数G I OU投稿网址:w w wj s j c l y k z c o m第期王悦炜,等:基于改进Y O L O v s的遥感目标检测 _L O S S本身缺陷导致特殊情况下无法判断预测框
14、的位置状态,从而影响检测精度等问题.为解决上述存在的问题,张云佐等人使用D I o U NM S,以及在空洞空间金字塔池化A S P P基础上设置不同膨胀系数以获得不同的感受野,得到了更好的信息增强检测效果,提出了A S P P模块,减少了传统NM S非极大值抑制对目标的漏检问题,提高了精度.成倩提出了对y o l o v 检测端的优化,对于舰船等小目标来说,专门负责大目标的检测头并不能充分发挥作用,甚至会对于小目标的检测产生一定的干扰,所以将负责大目标的检测头进行移除,减少了不必要的计算量,在原网络基础上增加了检测速度.张宏群将y o l o v s(y o uo n l yl o o ko
15、 n c ev s)中使用的G I OU_L O S S损失函数更换为C I OU_L O S S,避免了当预测框在真实框内的时候G I OU_L O S S损失函数无法判断预测框的位置状态,进而提升了检测的精度.随着YO L O模型算法的不断更新,对于遥感目标的检测不应单单局限于舰船、车辆等单一的目标.为了有效地对多种遥感目标进行检测,本文通过对D O T A数据集中的游泳池、客机、直升机、战斗机、运输机、网球场共种待检测目标进行学习并检测,对y o l o v s网络模型的激活函数、小目标检测能力、任务检测头三方面进行优化.图Y O L O v s M S Y的网络结构图Y O L O v
16、 s M S Y网络及改进策略 Y O L O v s M S Y网络结构基于YO L O v 版本改进之后的YO L O v s M S Y结构如图所示.对Y O L O v 来说共有个不同的版本,根据 模 型 的 深 度 和 宽 度 不 同,分 别 是:Y O L O v l、YO L O v m、Y O L O v n、YO L O v s、YO L O v x.在 这种Y O L O v 模型中,YO L O v s模型相对于网络最小,速度最快.对于Y O L O v s M S Y网络来说,结构分为个部分,分别是:输入端、骨干网络B a c k b o n e、颈部网络N e c k
17、、预测网络P r e d i c t i o n.首先,YO L O v s M S Y网络中的C B S模块更换为C BM模块,二者的区别在于在卷积C o n v以及B N之后的激活函数不同,网络的激活函数由S i L u(S i g m o i dw e i g h t e d l i n e ru n i t)函数更换为梯度图像更加平滑的M i s h函数,比原网络更加方便让大量遥感图像信息深入流动,提升了检测性能、模型泛化能力.其次,该网络将空间金字塔由S P P改进为S P P F,比S P P速度快上很多.在S P P F中,数据首先经过C BM模块,然后依次递减的经过个M a x
18、 P o o l最大池化层,最后将个支路通过c o n c a t叠加,最后再通过一个C BM模块.在骨干网络B a c k b o n e中取消了原本的F o c u s层,取 而代 之 的 是 一个 卷 积.同 时对 于C S P _X以及C S P _X进行了更新:C S P _X中的一个分支首先经过C BM模块然后通过残差网络,另外一个分支仅通过一个C BM模块,然后两个分支进行c o n c a t叠加,最后再经过一个C BM模块,C S P _X中的参数X指的是残差网络R e s u n i t的数量.C S P _X的两个分支中一个分支通过C BM模块,另外一个模块首先经过C B
19、M模块再经过 X个C BM模块,然后两个分支同样经过c o n c a t叠加,最后再通过一个C BM模块.对于输入端来说,Y O L O v s M S Y同样使用了M o s a i c(马赛克)数据增强、自适应锚框计算、自适应图片缩放.M o s a i c数据增强:通过随机缩投稿网址:w w wj s j c l y k z c o m计算机测量与控制第 卷 放、随机裁剪、随机排布的方式来拼接张图片,丰富了数据集,做到同时计算张图片数据,减少了G P U;自适应锚框计算:在设定了初始的预测框尺寸之后,与真实框的尺寸进行对比,再反向更新网络参数;自适应图片缩放:自动计算输入图像最适合的缩
20、放比例,减少由图像填充带来的黑边干扰.在颈部网络N e c k方面,依旧采用了自上而下的F P N结构和自底向上的P AN结构,P AN结构首先是在y o l o v 中提出的,在之前的y o l o v 中只使用F P N结构.F P NP AN这种结构保证了在通过F P N将高层特征逐渐向底层传达强语义特征的同时,使用P AN将底层特征自下而上传达强定位特征.最后,通过预测网络P r e d i c t i o n中进行对指定对象的识别预测.M i s h激活函数为提升对复杂遥感目标的检测性能,在网络中加入激活函数:激活函数是神经网络的核心单元,给C NN网络加入了非线性特性,大大提升了C
21、 NN网络的学习能力.在Y O L O v 之前的版本中,激活函数使用的是带泄露修正线性单元函数,即L e a k yR e l u激活函数,该函数表达式如式()所示,函数形状如图所示,通常 ,该函数在大于的定义域上为yx直线,梯度为;在小于的定义域上为非零数值.但是该激活函数存在着一些问题:L e a k y R e l u激活函数在定义域大于、小于两个区间上都是线性分布的,而采用线性的激活函数就会影响模型对于一些非线性数据的表达能力;另外,因为L e a k y R e l u函数没有上界,如果网络单元输出过大,或者网络是循环结构的,就会导致梯度累积超过计算机的数值上限,造成“梯度爆炸”现
22、象,由于遥感目标数据量大的特点,这种情况极容易发生.为改善上述情况,本文使用M i s h激活函数,M i s h表达式如式()所示,函数形状如图所示:L e a k yR e l um a x(x,x)()M i s hxel n(ex)e l n(ex)el n(ex)e l n(ex)()图L e a k y R e l u激活函数形状以及梯度在YO L O v 网络当中,激活函数由L e a k y R e l u函数更换为S i L U函数,该函数可在负数域对数据进行拟合.此处改进的M i s h激活函数与S i L U函数相似,S i L U函数表达式如式()所示,函数形状如图所示
23、,但是M i s h函数对外有着更好的表现效果,下面以M i s h函数进行说明:图M i s h激活函数形状以及梯度首先,M i s h函数非饱和,避免了因为饱和而导致的梯度消失现象;存在下界,在负半轴有着较小的权重,即在负半轴M i s h的输出无限趋近于但又不等于,保留了少量的负信息,防止了有些激活函数在定义域小于的范围内函数输出为,导致一些“网络单元”始终不被激活,这种情况也被称为“神经元坏死”现象;函数自身具有正则化效果,对应的梯度图像更加平滑,这样就更加容易地对其进行优化.同时随着网络逐渐加深,信息可以更深入地流动,提升了对遥感目标检测的泛化能力.图S i L U激活函数形状以及梯
24、度S i L Uxex()使用S P D C o n v模块现在的YO L O v 模型归根到底使用的是C NN卷积神经网络,所以YO L O v 会因为C NN卷积神经网络本身的不足而存在一些弊端.卷积神经网络在对大目标以及高分辨率图像的识别已经较为成功,但是早期的遥感图像存在较多小尺寸、低分辨率的目标,这是因为遥感的定义就是一切无接触的远距离探测,导致遥感图像存在背景复杂、目标方向任意和目标尺寸小等问题.在待检测的遥感目标图像中,小目标与大目标常常一起出现.而C NN在图像分辨率较低或物体较小时,检测性能迅速下降的原因是:C NN网络使用的是卷积步长层(s t r i d e dc o n
25、 v o l u t i o n)或卷积步长层池化层.这导致在每一次进行“卷积步长”操作之后,会伴随着一些细微的信息丢失,造成学习特征不足,在进行多次操作之后甚至会使得遥感图像中一些较小的待检测学习目标的特征消失,网络无法正常高效地对遥感目标进行学习,这也就是C NN网络对小尺寸、低分辨率遥感目标检测性能下降的原因.在参考文献 中,作者提出了一种新构建的模块,投稿网址:w w wj s j c l y k z c o m第期王悦炜,等:基于改进Y O L O v s的遥感目标检测 称为S P D C o n v,这是由一个空间到深度(S P D)层与一个无步长卷积层组成.S P D层对输入的遥
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 YOLOv5s 遥感 目标 检测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。