基于EfficientNet-YOLOv3的多氧压表识别方法.pdf
《基于EfficientNet-YOLOv3的多氧压表识别方法.pdf》由会员分享,可在线阅读,更多相关《基于EfficientNet-YOLOv3的多氧压表识别方法.pdf(6页珍藏版)》请在咨信网上搜索。
1、第45卷 第08期 2023-08【43】收稿日期:2021-11-16作者简介:杨立洁(1980-),女,河北保定人,副教授,博士,研究方向为智能制造与控制。通信作者:王桂梅(1962-),女,河北邯郸人,教授,硕士,研究方向为机械电子工程。基于EfficientNet-YOLOv3的多氧压表识别方法Identification method of multi-oxygen pressure meter based on EfficientNet-YOLOv3杨立洁,冯俊豪,王桂梅*YANG Li-jie,FENG Jun-hao,WANG Gui-mei*(河北工程大学 机械与装备工程学院
2、,邯郸 056000)摘 要:为了提高氧压表的检测效率,同时完成多块氧压表的识别,利用改进后的YOLOv3目标检测算法对工业上的氧压表进行检测。首先将原YOLOv3特征提取网络调换为EfficientNet网络,提高算法的特征提取能力;其次通过制作的加强型数据集,实现仪表的特征增强;最后,利用K-means算法对数据集进行聚类,得到合适的Anchor box,提高仪表定位精度。实验结果表明,改进后的YOLOv3算法可同时完成3块氧压表的识别,且识别精度高,降低了氧压表的漏检率,并且在平均精度上达到了96.73mAP,相比于未改进的YOLOv3算法提高了7.5%,检测速度为54.2FPS,比其他
3、目标检测算法具有更好的检测性能。关键词:氧压表;YOLOv3;EfficientNet;K-means;加强型数据集中图分类号:TP391 文献标志码:A 文章编号:1009-0134(2023)08-0043-060 引言作为一种工业上的的精密仪器,氧压表能够及准确地显示氧气瓶以及氧压机等相关设备中的压力,使工作人员及时了解设备的工作情况,从而使工业生产能够正常运行。为了保证氧压表的准确性,需要在其使用前进行检定,但按照目前的检定水平,一般都是人工检定,工人的工作量大,劳动强度高,且检测效率低下。因此利用改进的YOLOv31模型来提高氧压表的检测精度和速度,从而满足实际工作场景。对于指针式仪
4、表的检测问题,众多学者对其进行了研究。传统方法中通过Hough变换方法2来识别仪表,但其精度不高容易出现漏检问题并且鲁棒性不高。随着计算机技术的提高和深度学习算法的发展,各种目标检测算法如雨后春笋般出现,但常用的算法主要有两种,一种是两步目标检测算法,这类算法是通过生成候选框再进行预测两个步骤进行检测,如R-CNN3系列算法,这些算法的优点是检测精度高,但实时性低。另一种是单步目标检测算法,这类算法无需生成候选框而是直接提取目标特征进行检测,如SSD4和YOLO5系列算法。此类算法优点是检测速度快,但检测精度不够。李娜等6人通过FPN和Faster R-CNN的RPN结合来识别定位仪表,提高了
5、仪表的检测精度;孙顺远等7人将SSD的骨干网络改为ResNet50,并引入FPN,提高小目标的检测能力;李慧慧等8人通过使用MobileNetV2实现对仪表的定位,提高了圆形仪表的检测精度。上述针对仪表的各种检测算法,主要是实现一张图片检测了一个仪表,无法同时满足高精度和快速度的需求,文本提出了一种改进YOLOv3算法,在保证检测速度的前提下,提高氧压表的检测精度。将原YOLOv3特征提取网络替换为EfficientNet网络,并对自制的增强型数据集进行K-means聚类得到9个新的先验框9,最后进行训练、预测。实验结果显示,与原YOLOv3算法相比,改进的YOLOv3算法,对于多个氧压表的检
6、测具有较高的检测精度和速度,能够满足实际工业需要。1 YOLOv3目标检测算法图1 YOLOv3网络结构近年来,YOLO系列算法在不断的更新改进,其中,【44】第45卷 第08期 2023-08YOLOv3目标检测算法经常应用于图像和视频的检测,检测速度快,时效性高。如图1所示,其主要由3个部分组成:主干提取特征网络(Darknet-53),特征金字塔网络10(Feature Pyramid Network,简称FPN)以及解码预测部分(分为大、中,小三种尺寸检测)。YOLOv3在YOLOv211的基础上利用ResNet(Residual Network)中残差模块12的思想构建了Darkne
7、t-53网络,Darknet-53主要由5个残差块组成,其中Conv表示的是一种特殊的卷积结构,在卷积层后加入了对输入图片进行标准化处理的归一化层和激活函数Leaky Relu,“Conv5”表示有5个这种卷积层。Residual Block(残差块)中的“1”表示该残差块包含一个残差单元,这些残差块能够保证网络在训练时正常收敛不发生发散现象。将第三、四、五个残差块输出的特征层输入到FPN中,使浅层特征与通过上采样(UpSamping)方式得到更深层的特征进行合并(Concatenate),得到三种尺度(1313、2626、5252)的特征层,并且每种特征层上生成3个先验框,共9个,再对目标进
8、行大、中、小三种尺寸的检测。最后,利用损失函数对模型预测的结果进行评定,YOLOv3中的损失函数由三部分组成:边界框损失(Lossloc)、置信度损失(Lossconf)、分类损失(Losscla)。总损失函数表示如式(1)式(4):conflocclaLOSSLOSSLOSSLOSS=+(1)()()2222loc002200()()SBobjjjcoordijiiiiijSBobjjjjjcoordijiiiiijLOSSIxxyyIwwhh=+(2)22200200 ln()(1)ln(1)ln()(1)ln(1)SBobjjjjjconfijiiiiijSBnoobjjjjjnoobj
9、ijiiiiijLOSSICCCCICCCC=+(3)220 ln()(1)ln(1)Sobjjjjjclaijiiiiic calssesLOSSIPPPP=+(4)式中各类符号的代表含义如表1所示。表1 各类符号含义符号含义xi、yi、wji、hji预测框坐标信息Cji预测框置信度Pji预测框类别概率真实框坐标信息真实框置信度真实框类别概率目标落入网格i的第j个先验框内目标未落入网格i的第j个先验框内虽然YOLOv3算法对比之前YOLO系列算法有了很大提升,但是其Darknet-53网络模型较大,复杂程度较高,且训练速度较慢,因此,使用轻量级EfficientNet网络能够加快模型收敛并保
10、证检测精度。另一方面,本文要检测的氧压表数量多,原YOLOv3中的Anchor box信息具有一定的局限性,需要在含有多个氧压表的数据集中利用K-means算法重新聚类得到新的Anchor box,提高仪表的定位精度。2 改进后的YOLOv3算法2.1 EfficientNetEfficientNet是在2019年由Tan等13人提出的新型网络模型。其综合了经典神经网络的三种特点,通过调节输入图片的分辨率、网络宽度和深度,减少模型的参数量,增强了模型的特征提取能力,提高了模型的学习效率。EfficientNet借鉴了Mobilenetv3的思想,采用了多个MBConv模块,其网络结构如图2所示
11、。MBConv是由深度可分离卷积14、BN(Batch Normalization,即批归一化)、Swish激活函数、Dropout连接层和SE(Squeeze-and-Excitation)注意力模块15组成,类似于倒瓶颈结构。其中,“Conv11”为逐点卷积,“Depwise Conv33/55”为逐通道卷积,由这两部分构成深度可分离卷积。将逐通道卷积产生的特征图利用逐点卷积进行融合,通过批归一化操作和Swish函数激活后,再利用SE注意力模块进行分析、组合,最后经过11卷积降维处理后,得到输出特征层。2021年10月8日星期五标题InputConv11Depwise Conv33/55S
12、EConv 11DropoutBN+SwishBN+SwishBN+Dropout图2 MBConv网络结构第45卷 第08期 2023-08【45】2.2 基于EfficientNet的YOLOv3算法由于在相同图片尺寸下,EfficientNet-B2的mAP平均精度均值最大,检测精度更高。因此,本文将EfficientNet-B2网络作为YOLOv3的特征提取网络,同时需要将其网络尾部的全连接层、平均池化层和dropout层去掉,如图3所示。由于特征提取网络发生改变,相应的特征图通道数也要改变,但输入图片的分辨率保持不变。将该网络中第三、五、七个MBConv模块输出的特征层输入到FPN中
13、进行特征融合,得到小、中、大三种不同尺度的检测层。图3 EfficientNet-YOLOv3网络结构2.3 Anchor Box 尺寸计算图4 预测框和Anchor box示意图YOLOv3算法利用K-means聚类算法计算得到anchor。K-means算法中的K表示有K个簇的聚类,means表示取每一个聚类数值的均值作为此簇的中心(或者质心)。K-means聚类算法先通过随机确定K个目标作为相应簇中的簇中心,然后计算每个目标与这K个簇中心的距离,将其归类到与其距离最近的簇中心的簇中,重复迭代直到全部对象归类完成。为了能更有效地选取预测框,在YOLOv3中,Anchor作为初始候选框存在于
14、不同尺度的网络层来预测目标边界框坐标。预测框和先验框的关系如图4所示,首先将需要检测的图片划分为ZZ个网格,各个网格的宽和高分别为Cx和Cy,使用偏移量tx、ty、tw、th来预测出预测框的bx、by、bw、bh、Pw和Ph表示先验框的宽高,如式(5)式(8)所示:()xxxbtc=+(5)()yyybtc=+(6)wtwwbp e=(7)hthhbp e=(8)其中为激活函数Sigmoid,利用此函数可以保证tx、ty的数值变化在0,1内,防止预测框的中心坐标移动到网格外。然后利用置信度阈值的设定和非极大值抑制算法删去效果差的预测框,获得效果最好的预测框。在加强型数据集上利用K-means聚
15、类得到的Anchor box的宽和高分别为(75,97)、(85,64)、(86,68)、(88,66)、(89,70)、(90,76)、(93,73)、(97,79)、(103,83)。三种尺度的Anchor box的分配表如表2所示。表2 Anchor box 尺寸分配检测尺度Anchor box尺寸1313(93,73)(97,79)(103,83)2626(88,66)(89,70)(90,76)5252(75,97)(85,64)(86,68)3 实验分析3.1 数据集制作本文的数据集与其他数据集相比,不同点在于一张图片要存在多个氧压表,即一种类型多个目标,如图5所示。通过实地拍摄以
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 EfficientNet YOLOv3 多氧压表 识别 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。