基于EfficientNet-YOLOv3的多氧压表识别方法.pdf

上传人：自信****多点

文档编号：2085112

上传时间：2024-05-15

格式：PDF

页数：6

大小：2.89MB

《基于EfficientNet-YOLOv3的多氧压表识别方法.pdf》由会员分享，可在线阅读，更多相关《基于EfficientNet-YOLOv3的多氧压表识别方法.pdf（6页珍藏版）》请在咨信网上搜索。

1、第45卷第08期 2023-08【43】收稿日期：2021-11-16作者简介：杨立洁（1980-），女，河北保定人，副教授，博士，研究方向为智能制造与控制。通信作者：王桂梅（1962-），女，河北邯郸人，教授，硕士，研究方向为机械电子工程。基于EfficientNet-YOLOv3的多氧压表识别方法Identification method of multi-oxygen pressure meter based on EfficientNet-YOLOv3杨立洁，冯俊豪，王桂梅*YANG Li-jie，FENG Jun-hao，WANG Gui-mei*（河北工程大学机械与装备工程学院

2、，邯郸 056000）摘要：为了提高氧压表的检测效率，同时完成多块氧压表的识别，利用改进后的YOLOv3目标检测算法对工业上的氧压表进行检测。首先将原YOLOv3特征提取网络调换为EfficientNet网络，提高算法的特征提取能力；其次通过制作的加强型数据集，实现仪表的特征增强；最后，利用K-means算法对数据集进行聚类，得到合适的Anchor box，提高仪表定位精度。实验结果表明，改进后的YOLOv3算法可同时完成3块氧压表的识别，且识别精度高，降低了氧压表的漏检率，并且在平均精度上达到了96.73mAP，相比于未改进的YOLOv3算法提高了7.5%,检测速度为54.2FPS，比其他

3、目标检测算法具有更好的检测性能。关键词：氧压表；YOLOv3；EfficientNet；K-means；加强型数据集中图分类号：TP391 文献标志码：A 文章编号：1009-0134(2023)08-0043-060 引言作为一种工业上的的精密仪器，氧压表能够及准确地显示氧气瓶以及氧压机等相关设备中的压力，使工作人员及时了解设备的工作情况，从而使工业生产能够正常运行。为了保证氧压表的准确性，需要在其使用前进行检定，但按照目前的检定水平，一般都是人工检定，工人的工作量大，劳动强度高，且检测效率低下。因此利用改进的YOLOv31模型来提高氧压表的检测精度和速度，从而满足实际工作场景。对于指针式仪

4、表的检测问题，众多学者对其进行了研究。传统方法中通过Hough变换方法2来识别仪表，但其精度不高容易出现漏检问题并且鲁棒性不高。随着计算机技术的提高和深度学习算法的发展，各种目标检测算法如雨后春笋般出现，但常用的算法主要有两种，一种是两步目标检测算法，这类算法是通过生成候选框再进行预测两个步骤进行检测，如R-CNN3系列算法，这些算法的优点是检测精度高，但实时性低。另一种是单步目标检测算法，这类算法无需生成候选框而是直接提取目标特征进行检测，如SSD4和YOLO5系列算法。此类算法优点是检测速度快，但检测精度不够。李娜等6人通过FPN和Faster R-CNN的RPN结合来识别定位仪表，提高了

5、仪表的检测精度；孙顺远等7人将SSD的骨干网络改为ResNet50，并引入FPN，提高小目标的检测能力；李慧慧等8人通过使用MobileNetV2实现对仪表的定位，提高了圆形仪表的检测精度。上述针对仪表的各种检测算法，主要是实现一张图片检测了一个仪表，无法同时满足高精度和快速度的需求，文本提出了一种改进YOLOv3算法，在保证检测速度的前提下，提高氧压表的检测精度。将原YOLOv3特征提取网络替换为EfficientNet网络，并对自制的增强型数据集进行K-means聚类得到9个新的先验框9，最后进行训练、预测。实验结果显示，与原YOLOv3算法相比，改进的YOLOv3算法，对于多个氧压表的检

6、测具有较高的检测精度和速度，能够满足实际工业需要。1 YOLOv3目标检测算法图1 YOLOv3网络结构近年来，YOLO系列算法在不断的更新改进，其中，【44】第45卷第08期 2023-08YOLOv3目标检测算法经常应用于图像和视频的检测，检测速度快，时效性高。如图1所示，其主要由3个部分组成：主干提取特征网络（Darknet-53），特征金字塔网络10（Feature Pyramid Network，简称FPN）以及解码预测部分（分为大、中，小三种尺寸检测）。YOLOv3在YOLOv211的基础上利用ResNet（Residual Network）中残差模块12的思想构建了Darkne

7、t-53网络，Darknet-53主要由5个残差块组成，其中Conv表示的是一种特殊的卷积结构，在卷积层后加入了对输入图片进行标准化处理的归一化层和激活函数Leaky Relu，“Conv5”表示有5个这种卷积层。Residual Block（残差块）中的“1”表示该残差块包含一个残差单元，这些残差块能够保证网络在训练时正常收敛不发生发散现象。将第三、四、五个残差块输出的特征层输入到FPN中，使浅层特征与通过上采样（UpSamping）方式得到更深层的特征进行合并（Concatenate)，得到三种尺度（1313、2626、5252）的特征层，并且每种特征层上生成3个先验框，共9个，再对目标进

8、行大、中、小三种尺寸的检测。最后，利用损失函数对模型预测的结果进行评定，YOLOv3中的损失函数由三部分组成：边界框损失（Lossloc）、置信度损失（Lossconf）、分类损失（Losscla）。总损失函数表示如式(1)式(4)：conflocclaLOSSLOSSLOSSLOSS=+(1)()()2222loc002200()()SBobjjjcoordijiiiiijSBobjjjjjcoordijiiiiijLOSSIxxyyIwwhh=+(2)22200200 ln()(1)ln(1)ln()(1)ln(1)SBobjjjjjconfijiiiiijSBnoobjjjjjnoobj

9、ijiiiiijLOSSICCCCICCCC=+(3)220 ln()(1)ln(1)Sobjjjjjclaijiiiiic calssesLOSSIPPPP=+(4)式中各类符号的代表含义如表1所示。表1 各类符号含义符号含义xi、yi、wji、hji预测框坐标信息Cji预测框置信度Pji预测框类别概率真实框坐标信息真实框置信度真实框类别概率目标落入网格i的第j个先验框内目标未落入网格i的第j个先验框内虽然YOLOv3算法对比之前YOLO系列算法有了很大提升，但是其Darknet-53网络模型较大，复杂程度较高，且训练速度较慢，因此，使用轻量级EfficientNet网络能够加快模型收敛并保

10、证检测精度。另一方面，本文要检测的氧压表数量多，原YOLOv3中的Anchor box信息具有一定的局限性，需要在含有多个氧压表的数据集中利用K-means算法重新聚类得到新的Anchor box，提高仪表的定位精度。2 改进后的YOLOv3算法2.1 EfficientNetEfficientNet是在2019年由Tan等13人提出的新型网络模型。其综合了经典神经网络的三种特点，通过调节输入图片的分辨率、网络宽度和深度，减少模型的参数量，增强了模型的特征提取能力，提高了模型的学习效率。EfficientNet借鉴了Mobilenetv3的思想，采用了多个MBConv模块，其网络结构如图2所示

11、。MBConv是由深度可分离卷积14、BN（Batch Normalization，即批归一化）、Swish激活函数、Dropout连接层和SE（Squeeze-and-Excitation）注意力模块15组成，类似于倒瓶颈结构。其中，“Conv11”为逐点卷积，“Depwise Conv33/55”为逐通道卷积，由这两部分构成深度可分离卷积。将逐通道卷积产生的特征图利用逐点卷积进行融合，通过批归一化操作和Swish函数激活后，再利用SE注意力模块进行分析、组合，最后经过11卷积降维处理后，得到输出特征层。2021年10月8日星期五标题InputConv11Depwise Conv33/55S

12、EConv 11DropoutBN+SwishBN+SwishBN+Dropout图2 MBConv网络结构第45卷第08期 2023-08【45】2.2 基于EfficientNet的YOLOv3算法由于在相同图片尺寸下，EfficientNet-B2的mAP平均精度均值最大，检测精度更高。因此，本文将EfficientNet-B2网络作为YOLOv3的特征提取网络，同时需要将其网络尾部的全连接层、平均池化层和dropout层去掉，如图3所示。由于特征提取网络发生改变，相应的特征图通道数也要改变，但输入图片的分辨率保持不变。将该网络中第三、五、七个MBConv模块输出的特征层输入到FPN中

13、进行特征融合，得到小、中、大三种不同尺度的检测层。图3 EfficientNet-YOLOv3网络结构2.3 Anchor Box 尺寸计算图4 预测框和Anchor box示意图YOLOv3算法利用K-means聚类算法计算得到anchor。K-means算法中的K表示有K个簇的聚类，means表示取每一个聚类数值的均值作为此簇的中心（或者质心）。K-means聚类算法先通过随机确定K个目标作为相应簇中的簇中心，然后计算每个目标与这K个簇中心的距离，将其归类到与其距离最近的簇中心的簇中，重复迭代直到全部对象归类完成。为了能更有效地选取预测框，在YOLOv3中，Anchor作为初始候选框存在于

14、不同尺度的网络层来预测目标边界框坐标。预测框和先验框的关系如图4所示，首先将需要检测的图片划分为ZZ个网格，各个网格的宽和高分别为Cx和Cy，使用偏移量tx、ty、tw、th来预测出预测框的bx、by、bw、bh、Pw和Ph表示先验框的宽高，如式(5)式(8)所示：()xxxbtc=+(5)()yyybtc=+(6)wtwwbp e=(7)hthhbp e=(8)其中为激活函数Sigmoid，利用此函数可以保证tx、ty的数值变化在0,1内，防止预测框的中心坐标移动到网格外。然后利用置信度阈值的设定和非极大值抑制算法删去效果差的预测框，获得效果最好的预测框。在加强型数据集上利用K-means聚

15、类得到的Anchor box的宽和高分别为（75，97）、（85,64）、（86,68）、（88,66）、（89,70）、（90,76）、（93,73）、（97,79）、（103,83）。三种尺度的Anchor box的分配表如表2所示。表2 Anchor box 尺寸分配检测尺度Anchor box尺寸1313（93,73）（97,79）（103,83）2626（88,66）（89,70）（90,76）5252（75，97）（85,64）（86,68）3 实验分析3.1 数据集制作本文的数据集与其他数据集相比，不同点在于一张图片要存在多个氧压表，即一种类型多个目标，如图5所示。通过实地拍摄以

16、及数据增强方法将数据集扩充至2000张，制作成VOC格式并用标记软件LabelImg对图片中的氧压表进行人工标注，标注信息为1个类别：oxygen_pressure_meter（氧压表）。图5 多氧压表图片【46】第45卷第08期 2023-083.2 实验环境与模型训练系统应用的配置如表3所示。表3 系统配置名称系统型号Windows10CPUIntel(R)Core(TM)i5-10400F运行内存16GB显卡型号NVIDIA GeForce RTX 2070S学习框架Pytorch编译器Pycharm 训练模型时，选择1800张作为训练集，200张作为测试集，学习率为0.0001，Ba

17、tch size=8，同时设置冻结迭代次数50次来加快训练速度，进行100次迭代。经过反复的模型训练，模型的损失值为3.4。为了评估本文算法的性能，如式(9)式(12)和表4所示：PrecisionPPPTTF=+(9)RecallPPNTTF=+(10)()ni oAP imAPn=(11)10()dAPP RR=(12)表4 性能指标符号含义AP平均精度mAP平均精度均值FPS每秒检测图片的帧数P准确率R召回率TP被正确预测的正样本数量FP被预测为正样本但实际上是负样本的数量FN预测为负样本但实际上不是负样本的数量n检测类别数量 Recall召回率Precision准确率 3.3 结果分析

18、为了证实本文算法的可行性，需要把涉及到的改进点与原算法进行一一对比分析。首先将只改变特征提取网络为EfficientNet的YOLOv3算法与原YOLOv3算法进行对比，如图6(a)、图6(b)和表5所示。(a)YOLOv3算法P-R曲线(b)加入Efiicientnet的YOLOv3算法P-R曲线图6 改进前后YOLOv3算法P-R曲线表5 两种算法的对比算法mAP/%FPS/s原YOLOv389.2349.5加入EfficientNet后95.7646.8 其中，曲线与横纵坐标围成的面积为氧压表的检测精度，只改进特征提取网络的YOLOv3算法与原算法相比mAP提高了6.53%，并且两者的F

19、PS相差不大，改进后的YOLOv3能满足工业的时效性要求。只利用新得到的Anchor box进行预测，得到的结果再与原YOLOv3算法进行对比，结果如图7和表6所示。图7 更换anchor box后YOLOv3算法P-R曲线第45卷第08期 2023-08【47】表6 两种算法的对比算法mAP/%FPS/s原YOLOv389.2349.5更换anchor box后92.9747.9 在平均精度均值上，更换先验框后的算法相比于原算法提高了3.74%，FPS为47.9，也能够满足工业中的时效性要求。最后同时将改进的两种方法同时应用到YOLOv3算法中，并将原YOLOv3、SSD、Centerne

20、t、Faster R-CNN与改进后YOLOv3在光线阴暗和光照充足两种不同情况下的氧压表图片进行了测试，其中，氧压表的标注oxygen pressure meter简写成O-P meter。其效果对比如图8图12所示。图8 YOLOv3检测效果图9 SSD检测效果图10 Centernet检测效果图11 Faster R-CNN检测效果图12 改进后YOLOv3检测效果如图8和图10所示，原YOLOv3算法Centernet算法对小体积氧压表的检测能力不足，出现了漏检情况，甚至原YOLOv3算法出现了对体积较大氧压表的漏检；如图9所示，SSD算法的预测置信度与前两者相比略有提升，但是该算法也

21、出现了对小体积氧压表的漏检情况，甚至出现了误检情况；如图11和图12所示，Faster R-CNN算法和改进后YOLOV3算法的预测置信度是最高的，但是Faster R-NN算法有部分预测置信度无法达到1，对小体积氧压表的预测框大小不一，并出现了漏检情况，而改进后YOLOv3算法能够将两种体积的氧压表全部测出且预测置信度全为1。改进后YOLOv3的P-R曲线如图13所示。图13 改进后的YOLOv3算法五种算法的性能对比如表7所示。表7 五种算法对比算法mAP/%FPSTime/s原YOLOv389.2349.50.02SSD86.2560.70.07Centernet93.7312.90.7

22、0Faster R-CNN95.2655.40.01改进后YOLOv396.7354.20.02 从表7可以看出，改进后YOLOv3算法拥有最高的检测精度，mAP值达到了96.73%，是这几种算法中最高的，与原YOLOv3算法相比mAP提高了7.5%。虽然SSD算法的FPS最高，但是其mAP较低。Centernet网络虽然检测精度高，但是其检测速度慢且帧率太低，时效性不足。Faster R-CNN整体性能较好，但在检测精度上略逊与改进后YOLOv3算法，并【48】第45卷第08期 2023-08且在实际预测中，也出现了漏检情况。综上所述，与其余算法对比，改进后YOLOv3算法提高了对小体积氧

23、压表的检测能力，实际检测性能也最好。4 结语针对传统目标检测算法在检测仪时检测精度低，鲁棒性差的问题。本文在原YOLOv3算法的基础上进行了改进，首先将原YOLOv3特征提取网络调换为EfficientNet网络，提高模型的特征提取能力，然后通过一图多目标的方式，制作加强型数据集，增强多氧压表特征，最后利用K-means聚类算法对数据集进行先验框的选取，提高了仪表定位精度。最后将改进的YOLOv3算法和和原YOLOv3算法在加强型数据集上进行实验分析。结果显示，改进后的YOLOv3算法可以有效的降低氧压表的漏检率，平均精度达到了96.73%,比原YOLOv3算法提高了7.5%，检测速度为54.

24、2FPS,比其他目标检测算法具有更好的检测性能。参考文献：1 Redmon J,Farhadi A.YOLOV3:An incremental improvementC/Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2018:1-6.2 王延华,李腾,张沛.结合HSV与局部Hough变换的指针式仪表识别算法J.电子设计工程.2017(2).3 Girshick R,Donahue J,Darrell T,et al.Rich feature hierarchies for accura

25、te object detection and segmentationC/Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014:580-587.4 Liu W,Anguelov D,Erhan D,et al.SSD:Single shot multibox detectorC/Proceedings of the 2016 European Conference on Computer Vision,2016:21-37.5 Redmon J,Divvale S,Girshick

26、 R et al.You only look once:Unified,real-time object detectionC/Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2016:779-788.6 李娜,姜志,王军.基于Faster R-CNN的仪表识别方法J.液晶与显示,2020,35(12):1291-1298.7 孙顺远,杨挺.基于深度学习的仪表目标检测算法J.仪表技术与传感器,2021(6):104-108.8 李慧慧,闫坤,张李轩.基于MobileNetV2的圆形指针式

27、仪表识别系统J.计算机应用,2021,41(4):1214-1220.9 袁小平,马绪起,刘赛.改进YOLOv3的行人车辆目标检测算法J.科学技术与工程,2021,21(8):3192-3198.10 Lin T Y,Dollar P,Girshick R,et al,Feature pyramid networks for object detectionC/Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Honolulu:IEEE,2017:936-944.11

28、Redmon J,Farhadi A.YOLO9000:Better,faster,strongerC/Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2017:6517-6525.12He K,Zhang X,Ren S,et al.Deep residual learning for image recognitionC/Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition

29、(CVPR).Las Vegas:IEEE,2016:770-778.13Tan M,Le Q V.EfficientNet:Rethinking model scaling for convolutional neural networksJ.arXiv preprint arXiv:1905.11946,2019.14陈庆港,杜彦辉,韩奕.基于深度可分离卷积的物联网设备识别模型J.信息网络安全,2021,21(9):67-73.15Hu J,Shen L,Sun G.Squeeze-and-excitation networksC/IEEE/CVF Conference on Comput

30、er Vision and Pattern Recognition,Salt Lake City,UT,2018:7132-7141.3 苏秀苹,董家盈,乔延华,等.基于Abaqus的磁保持继电器中弹片反力特性研究J.系统仿真学报.2018,30(4):1528-1534.4 薄凯,周学,翟国富,等.智能电表用磁保持继电器短路电流条件下触头斥开机理仿真研究J.中国电机工程学报.2018,38(17):5238-5245.5 肖斌,刘雷,谢林炜,等.基于工艺特性的电磁吸力仿真分析研究J.电子器件.2020,43(6):1238-1243.6 卢玉凤,洪涛,刘钢海,等.多通道磁保持继电器机械寿命试

31、验控制系统设计J.仪表技术与传感器.2014(3):52-54.7 张高廷,曹云东,刘炜.簧片式继电器固有振动特性研究J.电工技术学报.2020,35(2):292-299.8 谢永明,王珍,曾仕途.智能电能表继电器短路电流承载能力试验中的安培力影响分析J.电测与仪表.2016,53(15A):83-87.9 车赛,迟长春,左少林,等.电动汽车充电桩用磁保持继电器动态特性优化J.汽车技术.2019(12):34-37.10熊德智,陈向群,杨杰,等.电能表用磁保持继电器可靠性试验方法研究J.电测与仪表.2016,53(20):122-128.11梁慧敏,朱旭晴,李东晖等.磁保持继电器静态吸反力特性测试装置J.电器与能效管理技术,2021(2):60-64.12鲍光海,王金鹏,王毅龙.磁保持继电器多物理场耦合模型设计与触头弹跳影响因素分析J.电工技术学报,2023,38(3):828-840.13郑育鑫,范兴明,张鑫,等.磁保持继电器电磁驱动力建模分析及其优化设计J.计算机仿真,2022,39(5):283-287.14倪正清.一种双线圈磁保持继电器自动检测系统的研制J.电工电气,2021(10):54-58.15车赛,迟长春,左少林,等.旋转式磁保持继电器动态特性优化研究J.上海电机学院学报,2019,22(2):63-67.【上接第42页】

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 EfficientNet YOLOv3 多氧压表识别方法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。