基于深度学习的目标检测算法综述.pdf
《基于深度学习的目标检测算法综述.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的目标检测算法综述.pdf(4页珍藏版)》请在咨信网上搜索。
1、SCIENCE&TECHNOLOGY INFORMATION科技资讯 2023 NO.16 学 术 综 述科技资讯SCIENCE&TECHNOLOGY INFORMATION基于深度学习的目标检测算法综述姚文清 李盛*王元阳(西京学院 陕西西安 710123)摘要:目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和类别。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,使目标检测成为计算机视觉领域中最具有挑战性的问题之一。该文综述了深度学习在目标检测方面有代表性算法的进展与展望。针对基于候选窗口(Region Proposal)的 Two-Stage 检
2、测框架和基于回归的 One-Stage 检测框架,分别对有代表性的检测算法进行重点介绍,做出对比与总结;最后讨论目标检测领域存在的困难与挑战,并对未来目标检测方向的发展趋势进行展望。关键词:目标检测 计算机视觉 深度学习 检测框架中图分类号:TP391.41;TP18文献标识码:A 文章编号:1672-3791(2023)16-0185-04A Review of the Object Detection Algorithm Based on Deep LearningYAO Wenqing LI Sheng*WANG Yuanyang(Xijing University,Xian,Shaan
3、xi Province,710123 China)Abstract:The task of object detection is to find out all the targets(objects)of interest in the image,and determine their location and category.Due to the different appearances,shapes and postures of various objects and the interference of lighting,occlusion and other factor
4、s during imaging,object detection becomes one of the most challenging problems in the field of computer vision.This paper reviews the progress and prospect of the representative algorithms of deep learning in object detection,introduces representative detection algorithms in detail for the Two-Stage
5、 detection framework based on the Region Proposal and the One-Stage detection framework based on regression,and compares and summarizes them.Finally,it discusses the difficulties and challenges in the field of target detection,and looks forward to the development trend of the future target detection
6、 direction.Key Words:Object detection;Computer vision;Deep learning;Detection framework目标检测是数字图像处理和计算机视觉的一个研究热门方向,广泛应用于智能交通1、工业缺陷检测2、无人辅助驾驶3、航空航天4、智慧农业5等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的DOI:10.16661/ki.1672-3791.2301-5042-4304基金项目:国家自然科学基金项目“女性语音产生机制差异的空气动力学建模对比研究”(项目编号:11974289)。作者简介:姚文清(1997),男,硕士在读,研究
7、方向为深度学习、目标检测。王元阳(1998),男,硕士在读,研究方向为深度学习、目标检测。通信作者:李盛(1972),男,博士,教授,研究方向为机器视觉、深度学习与生命信息,E-mail:。185SCIENCE&TECHNOLOGY INFORMATION科技资讯学 术 综 述 2023 NO.16 SCIENCE&TECHNOLOGY INFORMATION科技资讯现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识别领域的一个基础性的算法,对后续的人脸识别6、姿态估计7、目标跟踪8、图像分
8、割9等任务起着至关重要的作用。由于深度学习的广泛运用,目标检测算法得到了较为快速的发展,本文广泛调研国内外目标检测方法,主要介绍基于深度学习的两种目标检测算法思路,分别为基于侯选窗口的Two-Stage 目标检测算法和基于回归的One-Stage目标检测算法。1 基于候选窗口的Two-Stage检测算法1.1 R-CNN2014年,RSHICK R等人提出R-CNN10,这是继承传统目标检测思想的R-CNN系列的第一代算法,将目标检测作为一个分类问题来处理,先抽取一系列目标的候选区域,再对候选区域进行分类。具体如图1所示。1.2 FastR-CNN2015年,GIRSHICK R提出了Fast
9、 R-CNN11检测器,进一步融合了R-CNN和SPP-Net。在相同的网络配置下,Fast R-CNN可以让我们同时训练检测器和边界框回归器。Fast R-CNN在VOC07数据集上将mAP从58.5%(R-CNN)提升至70.0%,检测速度超过R-CNN的200倍。具体如图2所示。1.3 FasterR-CNN2015年,REN S等人提出了Faster R-CNN12检测模型,FasterR-CNN是第一个端到端深度学习的检测算法,也是第一个接近实时的目标检测器。FasterR-CNN的主要贡献是引入了区域提案网络(RPN)从而允许几乎所有的cost-free的区域提案。从R-CNN到F
10、asterR-CNN,提案检测、特征提取、边界框回归等目标检测系统中的图2 FastR-CNN 网络结构图1 R-CNN 网络结构186SCIENCE&TECHNOLOGY INFORMATION科技资讯 2023 NO.16 学 术 综 述科技资讯SCIENCE&TECHNOLOGY INFORMATION大部分独立区块已经逐步整合为统一的端到端学习框架。2 基于回归的One-Stage检测算法2.1 YOLO2016年,REDMON J等人提出了一种单阶段算法 YOLO13目标检测器。YOLO算法基于GoogleNet网络架构思想,其核心思想是将目标检测转化为一个回归问题,利用整张图像作为
11、网络的输入,只需通过一个卷积神经网络,就能获得待测目标边界框的位置和所属类别。2.2 YOLOv22017年,REDMON J等人在YOLOv1的基础上做了很多改进,提出了YOLOV214。重点解决YOLOV1在召回率、定位精准度等方面存在的不足之处。与 YOLOV1是利用全连接层直接预测边界框坐标相比,YOLOV2 借鉴了 FasterR-CNN 的理念,引入了 Anchor机制。使用K-means聚类的方法在训练集中聚类中计算出更好的Anchor框,使算法的召回率大大提高。同时将浅层特征与深层特征相结合,结合图像细粒度特征,对探测小尺寸目标有所帮助。并提出DarkNet-19骨干网络进行更
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 目标 检测 算法 综述
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。