基于双分支头部解耦和注意力机制的灾害环境人体检测.pdf
《基于双分支头部解耦和注意力机制的灾害环境人体检测.pdf》由会员分享,可在线阅读,更多相关《基于双分支头部解耦和注意力机制的灾害环境人体检测.pdf(10页珍藏版)》请在咨信网上搜索。
1、第 卷第 期 年 月西安科技大学学报 郝帅,杨晨禄,赵秋林,等 基于双分支头部解耦和注意力机制的灾害环境人体检测 西安科技大学学报,():,():收稿日期:基金项目:国家自然科学基金项目();中国博士后科学基金项目();陕西省科技计划项目(,)通信作者:郝帅,男,河北任丘人,副教授,硕士生导师,:基于双分支头部解耦和注意力机制的灾害环境人体检测郝帅,杨晨禄,赵秋林,马旭,孙曦子,王海莹,孙浩博,吴瑛琦(西安科技大学 电气与控制工程学院,陕西 西安 )摘要:灾害环境中,利用计算机视觉可以有效协助消防员进行救援,缩短搜救时间。针对受灾人体目标受多尺度、部分遮挡以及环境干扰导致传统算法难以准确检测的
2、问题,提出一种基于双分支头部解耦和注意力模型的灾害环境人体检测网络。首先,为解决灾害环境下小尺度人体目标造成的漏检问题,在 框架下,构造浅层检测层以增强网络对小目标识别能力;其次,针对灾害环境中人体目标易淹没在复杂背景中进而导致目标特征无法有效表达的问题,通过融合轻量化注意力模块以增强人体目标的显著度,并在特征的原始输入和输出节点间添加连接以提高网络多尺度特征融合能力;最后,为了减少人体检测网络中分类和回归任务的差异性对检测性能造成的影响,构建双分支头部解耦检测器分别用于人体目标的识别和定位。为验证所提算法的优势,在多种灾害救援场景下进行测试验证,并与 种经典算法进行比较。相较于对比算法,所提
3、算法精度最高,平均精度和召回率分别可达 和 ,不仅能够准确检测出人体目标,而且具有良好的实时性和鲁棒性。关键词:深度学习;人体检测;多尺度检测;注意力机制;解耦检测器中图分类号:文献标志码:文章编号:():开放科学(资源服务)标识码():,(,):,:;引言人体检测作为目标检测领域的一个重要研究方向分支,在智能监控 、道路交通 、紧急救援 等领域被广泛应用。自然灾害环境中,如地震、山地滑坡、洪水等,利用计算机视觉对受灾人员进行快速、准确定位是应急救援的重要辅助手段。然而,自然灾害的巨大破坏性往往使救援现场处于一个危险而又复杂的场景中,进而导致受灾人员肢体可能被部分掩埋,给救援的准确性和时效性造
4、成一定影响。因此,面向复杂灾害环境下,探索一种快速、准确的人体检测方法可以协助救援人员迅速完成对受灾人员的搜救,对于智能化应急救援的实现具有重要意义。目前,人体检测算法主要分为 大类:传统机器学习和深度学习 。传统机器学习主要是利用滑窗技术实现人工特征提取,并结合分类器实现人体目标检测,代表算法有 、等。李闯等通过构造相交检测窗口对 特征进行了优化,并结合基于子单元插值法来提高人体目标检测精度 。戴植毅等使用 检测算法对人体检测,通过利用快速傅里叶变换和 直方图降维对算法进行优化,从而在保证检测精度的同时提高人体目标检测速度 。杨鸽等提出一种基于 与 颜色空间的人体检测与跟踪算法,在 空间通过
5、背景减除法实现人体目标检测,并在 空间对阴影进行去除从而消除因光照和人体形变等因素造成的干扰 。传统算法虽然能够在一定条件下有效检测人体,但人工设计的特征提取器在复杂的调参过程下,往往存在实时性欠缺、鲁棒性差等问题,且只满足特定场景下的检测要求,从而导致其泛化能力有限。近年来,基于深度学习的检测算法已经成为目标检测领域中的一种主流方法,其通过从海量数据中自动学习、提取目标有用信息,从而实现目标的准确检测。基于深度学习的目标检测算法通过卷积神经网络可以有效完成特征提取、分类和回归,从而实现端到端的学习。深度学习算法可以分为一阶段检测算法和二阶段检测算法。其中二阶段算法包括 ,等。贺艺斌等在 算法
6、框架下通过融合 网络来提高对多尺度人体特征的提取能力,但其对于光线昏暗的场所检测效果欠佳 。陶祝等在 网络基础上利用空间金字塔池化层替换原有池化层,并通过试验证明该方法可以较好地解决大场景下人体部分遮挡问题 。虽然二阶段检测算法计算精度高但其检测速度较慢,难以满足复杂灾害环境下的实时检测需求。一阶段检测算法只需提取一次特征即可实现目标检测,能够极大提高检测速度,其中 ,系列 算法表现较为出色。李国进等为了增强卷积网络提取特征能力,在 网络中增加 结构对人体进行检测,并通过试验证明所提出的方法相比于原始网络具有更高的检测精度 。西 安科技大学学报 年第 卷第 期郝帅,等:基于双分支头部解耦和注意
7、力机制的灾害环境人体检测 系列算法能够保证检测精度的同时较好地兼顾算法的实时性 。李岩等在 的基础上采用一种基于归一化层 系数的模型剪枝方法,该方法能够在保证人体目标检测精度的同时提高模型的检测速度 。李挺等利用 网络对人体目标进行检测,将原网络中 替换为 以减少参数量,并在网络中引入 以连接减少浅层信息的丢失,最后加入 注意力模块增强人体目标特征的表达能力 ,该方法能够准确检测人体目标的同时,具有良好的实时性。邹有成等在 框架下将激活函数替换为 激活函数来简化网络体系结构,从而提高重叠人体目标的检测精度 。尽管 目标检测算法具有模型体积小、检测精度高、速度快等优点,但是利用其进行灾害环境下的
8、人体目标检测时,仍然存在以下 个问题:)基于 的主干特征提取网络由于采用大量的卷积运算易造成部分小尺度目标特征在进行卷积提取特征时信息丢失,进而导致灾害环境下人体小目标检测精度受限;)受复杂环境干扰,人体目标可能受到部分遮挡造成目标特征无法准确表达,进而导致网络检测精度低;)人体在复杂场景中易被遮挡,进而造成检测网络获取的人体信息较少,最终导致预测框定位不准确。针对上述问题,在 的框架下提出一种基于双分支头部解耦检测器和注意力机制的多尺度人体检测网络。主要贡献和创新点如下:)为解决受灾人体目标受多尺度影响及小目标特征提取困难的问题,将原有的三尺度特征层拓展为了四尺度特征层,并将同一特征原始输入
9、和输出节点间建立连接以增强网络多尺度特征融合能力;)为解决受灾人体目标特征易淹没于复杂背景中而导致检测网络精度下降问题,在 模块后引入注意力模块以增强复杂灾害环境下人体特征显著性,同时抑制复杂背景干扰;)为精准定位目标位置,构建双分支头部解耦检测器分别用于人体识别和定位,以使预测框坐标更加精准;)为了进一步提高密集人体目标检测精度,在网络中引入 优化网络参数,提升检测框定位精度。算法理论 模型网络主要由输入层()、主干层()、颈部层()和输出层()个部分组成,其结构如图 所示。?图 网络结构 :将输入图像缩放到 ,再经过自适应缩放、数据增强,最后送入主干提取网络中,并计算不同训练集中的最佳锚框
10、值。:主干网络主要由 、以 等组成,由 次卷积的 模块组成,模块采用通道分离的思想,将输入特征图分为个部分,分别进行不同的处理。其中,一部分通过一个卷积层进行降维处理,另一部分则直接进行卷积操作,最后再将个部分的结果进行拼接。这种方式既能够增加网络的感受野和特征表示能力,又能够降低计算量和参数数量,从而提高模型的性能和效率。模块通过使用多个小尺寸池化核来取代 模块中的单个大尺寸池化核,指定一个卷积核,每次池化后的输出成为下一个池化的输入,从而提高网络运行速度。:使用 和 相结合的方式从而加强网络的特征融合能力。:主体部分使用 个 检测器对网络进行检测。构建检测网络所提出的基于双分支头部解耦检测
11、器和注意力机制的多尺度灾害环境下人体检测网络框架如图 所示。所搭建网络框架主要实现步骤如下。:选取灾害救援现场图像和图片数据制作数据集,其中 张作为训练样本,其余 张作为测试样本。:标注训练数据集并设置训练初始参数进行训练。:训练过程中构建颈部网络,扩充特征检测尺度,在融合注意力机制同时将同一特征原始输入和输出节点间添加连接,以增强网络对小目标特征提取能力和多尺度特征融合能力。:在输出层构建双分支头部解耦检测器分别用于人体识别和定位,使预测框坐标更加精准。:为了提升检测框定位精度,引入 优化网络参数。:训练结束得到预训练权重文件。:将预训练权重文件在测试数据集上进行预测验证。颈部网络重构灾害环
12、境中,受灾人员可能被废墟掩埋或被洪水淹没造成人体目标存在多尺度问题,从而造成传统人体目标检测算法难以有效检测。针对上述问题,在原 的 部分添加浅层特征网络作为检测层以增强检测网络对小目标人体识别能力;同时,在特征金字塔结构中添加连接,提高网络多尺度特征融合能力;最后,嵌入轻量注意模型(,)以抑制复杂背景干扰。小目标检测层在 的网络中使用深度神经网络来提取目标的特征表示,原始图片的输入尺寸为 ,颈部网络通过对原图片的多次采样操作,分别生成新特征图尺度,大小为 、。但在实际灾害环境中,受灾人员的随机分布会造成人体目标存在多尺度问题,尤其是一些尺寸较小的人体目标,经过多次下采样其大部分特征信息会消失
13、,从而影响最终检测效果。针对上述问题,在原 网络基础上新增一层 的检测层,将原有的特征融合部分改为四尺度特征融合,进而能够捕捉更多小尺寸的人体目标信息。?图 改进的 网络结构 特征金字塔重构 采用 和 相结合的方式来提取特征,如图 ()所示。但 结构无法提取网络中的原始特征信息,会导致训练学习出现偏差,西 安科技大学学报 年第 卷?第 期郝帅,等:基于双分支头部解耦和注意力机制的灾害环境人体检测影响检测准确度。针对此问题,重构原有的 结构,在 结构的结点增加来自主干特征提取网络中原始特征层的输入,如图红色箭头线条所示。在训练过程中获得原始特征信息,避免训练学习过程偏离预期,从而提高模型的准确性
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 分支 头部 注意力 机制 灾害 环境 人体 检测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。