基于深度学习的视频SAR动目标检测与跟踪算法_邱磊.pdf
《基于深度学习的视频SAR动目标检测与跟踪算法_邱磊.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的视频SAR动目标检测与跟踪算法_邱磊.pdf(10页珍藏版)》请在咨信网上搜索。
1、第 卷,第 期自 然 资 源 遥 感,年 月 ,:引用格式:邱磊,张学志,郝大为 基于深度学习的视频 动目标检测与跟踪算法 自然资源遥感,():(,():)基于深度学习的视频 动目标检测与跟踪算法邱 磊,张学志,郝大为(海军工程大学兵器工程学院,武汉;陆军工程大学军械士官学校雷达系,武汉)摘要:视频合成孔径雷达(,)技术被广泛应用于军事侦查、地质勘探和灾害预测等领域。由于 视频存在很多的相干斑()噪声以及镜面反射、叠掩效应等干扰因素,运动目标容易与背景或其他目标混淆在一起。针对上述问题,文章提出了一种有效的视频 目标检测与跟踪算法。首先,提取视频 的多个特征用于构造多通道特征图;然后,使用改进
2、的轻量 网络对更深层的特征进行提取,从而在兼顾算法效率的同时提升 目标检测的准确度;最后,采用基于目标检测框的轨迹关联策略对视频 中同一目标进行关联。实验表明,本研究提出的方法针对 阴影目标检测与跟踪任务取得了较好的效果。关键词:视频;特征增强;目标检测;深度学习;特征金字塔;多目标跟踪中图法分类号:文献标志码:文章编号:()收稿日期:;修订日期:第一作者:邱 磊(),男,硕士,讲师,研究方向为雷达工程、火力指挥与控制工程。:。引言遥感目标跟踪在军事、环境、资源、气象和农业等多个领域有广泛应用。视频合成孔径雷达(,)通过向地面发射电磁波信号获取地表物体的反射信息,从而对动目标进行连续成像。相较
3、于传统的可见光影像和其他遥感影像,视频 受光照和气候条件影响较小,特别适合雨、雪、雾和夜间的任务作业。同时,视频 还具备一定的穿透效果,在有云层和植被遮挡的情况下仍然能对目标进行成像。因此,通过分析 视频,对地面运动目标进行检测跟踪,比一般光学遥感数据有更广泛的适用场景。在 目标检测方面,林旭等提出了一种基于自适应背景杂波模型的恒虚警率(,)宽幅 图像舰船检测算法。通过背景窗口的多尺度统计方差判断目标所处的杂波环境,自适应选择对应的背景杂波分布模型;等提出了一种结合目标语义特征的恒定虚警法,在检测高分辨率 图像目标时具有更低的虚警率;利用扩展分形(,)特征检测 图像中的车辆目标,该特征不仅对目
4、标背景的对比度敏感,同时也对目标尺寸敏感;刘冬等利用指数小波分形特征检测 图像目标,该方法对目标对比度和尺寸敏感,且考虑了目标边缘特征与区域内部平滑性特征。近年来,随着深度学习的发展,基于卷积神经网络(,)的 图像目标检测方法受到了广泛关注。,和 等目标检测网络被广泛应用于对 图像的检测。等提出了结合上下文的检测方法检测 图像舰船目标,利用目标周围的背景信息提高检测结果的可靠性,减少了虚警;等使用最大稳定极值区域(,)准则进一步约束目标区域的判定;等用 (一种旋转边界框)取代传统矩形框标记目标,使得标记选框可以适应不同的目标朝向;张椰等将目标检测任务转化为像素分类问题,利用全卷积神经网络(,)
5、对图像进行像素级的分类,有效避免了背景杂波的干扰,降低了虚警率。在视频 目标跟踪方面,等研究了目标的阴影对视频 序列中低雷达散射截面(,)目标跟踪的积极影响;等提出了一种基于 的阴影检测器来提取阴影信息作为定位运动目标的线索;等和 等利用核化相 关 滤 波 器(,)和自 然 资 源 遥 感 年 跟踪器对第一帧目标初始化后的阴影进行定位;等采用尺度不变特征变换(,)和随机样本一致性(,)配准算法来补偿每帧背景的变化,并采用了一种称为最大化 熵的阈值分割算法,利用三帧差分法对背景差分进行阴影检测;等 提出了一种基于图像统计和多目标卡尔曼滤波的 目标跟踪方法;等采用改进的基于密度的聚类算法对每一帧检
6、测结果进行过滤,并利用设计的双向长短期记忆(,)网络抑制检测中的缺失报警;等提出了一种基于时空信息和基于显著性的检测机制来对抗干扰和背景杂波。近年来,国内对该问题的研究也越来越多。何志华等利用视频 帧图像空间域和时间域信息,经过数据配准和相干斑滤波预处理、采用基于改进差分的动目标阴影检测处理和多目标跟踪处理技术,在保证检测率的前提下尽量降低虚警率,实现了视频 动目标检测与跟踪;刘雨洁等融合航迹起始算法与舰船图像特征差异进行长时间间隔序贯图像间的目标匹配,根据速度和加速度设置约束波门,对舰船目标的不同特征设置不同的权值计算目标间的差异,利用差异最小原则筛选航迹,实现目标跟踪;胡瑶提出了基于改进的
7、无锚点多目标跟踪框架,引入了注意力机制、修改了损失函数并进行了网络结构的优化,进而提升了跟踪效果。然而,现有工作对于 图像自身特征的挖掘尚不充分,目标跟踪受到信号强度、障碍遮挡和运动模糊等因素影响较大。这启发本文设计更好的特征表达网络和轨迹关联算法。针对上述问题,本文提出了基于深度学习的目标检测与跟踪方法。首先,提取出目标的显著特征用于视频 动目标检测。由于视频 成像机制与可见光成像不同,视频 具有其特有的属性。为此,本文分析了视频 的统计分布特征、极化散射特征、纹理特征和几何特征等多种特征。通过实验发现,增强图像对比度、纹理均值特征、开运算特征、闭运算特征,作为模型的先验输入,能够提升检测效
8、果。其次,设计了更适合于视频 检测的多尺度特征金字塔和特征融合策略,使不同尺度特征之间的融合更加高效便捷。本文提出使用轻量级 网络对 图像进行检测,并进一步采用 网络对当前帧上未检测到的目标进行预测。通过分析不同帧下所有锚点框之间的距离关系,为不同目标设置不同的轨迹信息进行轨迹关联,该轨迹优化策略显著提升了视频 目标的跟踪效果。多通道特征图目标检测方法在本小节中,详细介绍了提出的目标检测方法。首先,用多通道特征图构建特征集,对图像进行特征增强;其次,在深度特征提取阶段,介绍了改进后的多尺度特征金字塔;接下来,基于上述特征,介绍了采用的轻量 目标检测模块;然后,分别介绍了 种目标轨迹关联方法,即
9、基于目标框的轨迹关联和基于 的轨迹关联。多通道特征图特征增强在对目标进行提取之前,进行特征集构建。特征集中的特征从 个方面来考虑:一方面是去除图像噪声;另一方面增强目标与周围地物的差异。对于 视频 数据的单帧图像,在选取合适的去噪滤波后,进行特征计算。本研究选用 滤波去除噪声,窗口为 ,在去除噪声后,选取 个影像特征和滤波后影像作为特征集。这 个特征分别是:开运算、闭运算、对比度增强、纹理均值特征。其中,对比度增强采用直方图均衡化方法,纹理均值特征使用基于灰度共生矩阵(,)的纹理特征。特征集构建的流程如图 所示。图 特征分析流程 改进型多尺度特征金字塔该阶段以自底向上()的多层级语义特征图为输
10、入,利用上采样和横向连接的方式构建自顶向下()的多尺度特征金字塔,为多尺度阴影目标检测提供有力基础,目标检测总体结构如图 所示。图 中 表示网络卷积层得到的特征图,表示特征金字塔中的特征图。第 期邱 磊,等:基于深度学习的视频 动目标检测与跟踪算法图 多尺度特征金字塔网络模型结构 )自底向上。该过程由 主干网络前馈计算而来,其每个阶段最后一层的输出构成金字塔的多个层级,层级间以 为缩放比例。)自上向下。由于视频 中有相当部分的阴影目标尺度较小,且有一定尺度差异,因而对 网络的尺度适应性也提出更高要求。考虑到在经典特征金字塔网络结构中,小尺度目标的识别主要依赖于金字塔低层中空间分辨率较高的特征图
11、层,因此本文选择在经典特征金字塔网络的基础上,以多尺度特征融合的形式将高维特征图中的语义信息注入至低级特征图中,从而进一步提升网络对小尺度阴影目标的检测能力。多尺度特征融合结构如图 所示。图 多尺度特征融合的结构 具体而言,多尺度特征融合处理中 和 的特征可通过式()更新,即()(),()式中:和 分别为卷积网络和特征空间金字塔的层号索引;为对应 的融合特征映射;()为卷积运算;为卷积核大小,()为最邻近上采样;为特征连接操作。本文采用 卷积对 进行降维,并采用 卷积消除上采样带来的混叠效应。此外,考虑到视频 中的阴影目标尺度多元,除了大量小尺度目标外,还存在大尺度目标,因此,本文在 高维特征
12、图的基础上通过取步长为 进行下采样得到 特征图,以在后续目标检测过程中为不同尺度目标提供特定的特征图。为了进一步确保模型效率,令金字塔具体层数与检测目标尺寸相对应。基于轻量 的目标检测以多尺度特征金字塔为输入,将在各个尺度特征图上以一定步长逐像素生成多种锚点框,该框的生成过程与区域候选网络(,)类似,并针对每个锚点框完成 分类和框回归任务。)锚点框生成。该过程与 生成锚点框过程类似。为防止不同尺度目标框之间存在重叠现象且保证效率,为不同尺度特征图依次分配单一的锚点框面积超参数,以促使各特征图能在尺度上具有专一性。对于每个锚点框,若与真实标记框交并比大于 被视为正样本,小于 被视为负样本,)的锚
13、点框则被丢弃,以使模型回归更加准确的锚点框。)分类和框回归。该过程用于预测 个锚点框和类在每个空间位置存在目标的概率及与真实地表之间的偏移量。具体而言,使用若干 的卷积层对多尺度特征金字塔的逐像素同时进行 的类别预测及 的分类回归,个任务参数相互独立。在本研究中 取,分类回归中的 代表中心点横纵坐标和锚点框宽高的偏移量。在训练阶段,本研究采用多任务损失函数,包含检测框回归损失和目标检测损失,以使网络达到端到端的学习,提高分类性能,定义为:(,)(,)(,),()自 然 资 源 遥 感 年(,),()(,)(),()式中:为损失函数;和 分别为目标类别和包围框的个数;为每次小批量()中的第 个锚
14、点框;为前景和后景的对数损失,为每一个锚点框属于目标的预测概率,时代表对应样本为正样本,时代表对应样本为负样本。为目标锚点框的回归损失;为对每个样本的预测目标锚点框的坐标参数;为样本对应的真是锚点框的坐标参数;为 范数形式的平滑项损失,定义如 。由式()可以看出,当 时,对应样本为正样本时回归框损失才有意义,时,对应样本为负样本时则没有回归框损失。基于目标检测框的轨迹关联以目标检测框为输入,最初通过计算上一帧与当前帧所有目标检测框的交并比来判定轨迹关联信息。然而,研究发现仅通过交并比来判定时,会出现轨迹关联不稳定、轨迹编号迅速变化的现象。通过对轨迹关联进行优化能够有效抑制轨迹信息的快速变化。轨
15、迹关联模块如图 所示。图 轨迹关联模块 轨迹信息初始化:将每帧中所有正确检测框和误报检测框的中心坐标表示为(,),和,其中 和 表示每帧的像素大小。通过测量上一帧与当前帧每个检测框的交并比判定是否为同一轨迹,对同一轨迹的目标设置相同的轨迹关联信息,作为时序上的关联。存储目标从起始帧到当前帧的轨迹信息,包括轨迹的编号、起始帧、持续帧数和锚点框尺寸。每检测一帧,则通过计算交并比来判定上下 帧距离相近的检测框是否为同一目标轨迹,若当前帧检测到的与上一帧某一目标检测框交并比大于一定阈值,则判定为同一轨迹,赋予相同轨迹信息。若交并比小于一定阈值,判定为不同目标轨迹,赋予不同轨迹信息。当 目标比较集中时,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 视频 SAR 目标 检测 跟踪 算法 邱磊
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。