分销赏收藏举报申诉 / 14

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于E-YOLOX的实时金属表面缺陷检测算法.pdf

基于E-YOLOX的实时金属表面缺陷检测算法.pdf

上传人：自信****多点

文档编号：634583

上传时间：2024-01-19

格式：PDF

页数：14

大小：29.76MB

《基于E-YOLOX的实时金属表面缺陷检测算法.pdf》由会员分享，可在线阅读，更多相关《基于E-YOLOX的实时金属表面缺陷检测算法.pdf（14页珍藏版）》请在咨信网上搜索。

1、2023 年 8 月图学学报 August2023第 44 卷第4期 JOURNAL OF GRAPHICS Vol.44No.4 收稿日期：2022-12-30；定稿日期：2023-03-27 Received：30 December，2022；Finalized：27 March，2023 基金项目：国家自然科学基金项目(61861016)；江西省科技支撑计划重点项目(20161BBE50081)Foundation items：National Natural Science Foundation of China(61861016);The Key Project of Ji

2、angxi Science and Technology Support Plan(20161BBE50081)第一作者：曹义亲(1964)，男，教授，硕士。主要研究方向为图像处理与模式识别。E-mail： First author：CAO Yi-qin(1964),professor,master.His main research interests cover digital image processing and pattern recognition.E-mail：基于 E-YOLOX 的实时金属表面缺陷检测算法曹义亲1，周一纬1，徐露2(1.华东交通大学软件学院，江西南昌

3、330013；2.江西交通职业技术学院机电工程学院，江西南昌 330013)摘要：针对现有基于深度学习的金属表面缺陷检测方法存在泛化能力差、检测速度低等问题，提出一种新的检测算法 E-YOLOX。该算法采用新的特征提取网络 ECMNet，并使用深度卷积减少网络参数；以线性逆瓶颈残差网络提升特征提取能力，在正向传播过程中保留更多高维张量内的流形分布于低维子空间的关键特征；以扩张跨阶段局部网络结构多样化神经网络的梯度流路径，使深层神经网络更高效地学习和收敛。同时，提出一种新的数据增强方法边缘 Cutout，在训练过程中自适应生成掩膜覆盖图像的随机区域，提升网络的检测和泛化能力。实验结果表明，E-

4、YOLOX-l 在铝型材表面缺陷数据集 AL6-DET 上检测精度达到了 77.2%的 mAP，在钢材表面缺陷数据集 GC10 上检测精度达到了 36.8%的 mAP，较基准模型 YOLOX-l 分别提高 3.6%和 1.7%，同时参数量减少 55%，计算量减少 49%，检测速度达到 57 FPS，提高了 21 FPS。与相关算法对比，该算法取得较高的检测精度，且在精度和速度之间达到较好的均衡。关键词：金属表面；缺陷检测；深度学习；YOLOX；轻量级网络；数据增强中图分类号：TP 391 DOI：10.11996/JG.j.2095-302X.2023040677 文献标识码

5、：A 文章编号：2095-302X(2023)04-0677-14 A real-time metallic surface defect detection algorithm based on E-YOLOX CAO Yi-qin1,ZHOU Yi-wei1,XU Lu2(1.College of Software,East China Jiaotong University,Nanchang Jiangxi 330013,China;2.School of Electromechanical Engineering,Jiangxi V&T College of Communicat

6、ions,Nanchang Jiangxi 330013,China)Abstract:For metallic surface defect detection,a novel algorithm E-YOLOX was proposed to address the shortcomings of current methods,such as poor generalization ability and low detection speed.The algorithm utilized a new feature extraction network,ECMNet,which emp

7、loyed depth convolutions to reduce the parameters and computational cost of the network.The linear inverse bottleneck residual network was in use to enhance the feature extraction capability,while preserving more key features that were manifold distributed in low-dimensional subspaces within high-di

8、mensional tensors during forward propagation.Additionally,the extended cross-stage partial network structure diversified the gradient flow paths of neural networks,making deep neural networks learn and converge more efficiently.Moreover,a new data augmentation method edge Cutout was proposed,which g

9、enerated adaptive masks covering random regions of the image during the training process,enhancing the detection and generalization ability of the network.The experimental results demonstrated that E-YOLOX-l achieved 77.2%mAP in detection accuracy on the aluminum profile surface defect dataset AL6-D

10、ET and 36.8%mAP on steel surface defect dataset GC10-DET,which was 3.6%and 1.7%higher than the baseline algorithm YOLOX-l.At the same time,the number of 678 图像处理与计算机视觉 2023 年 1 parameters was reduced by 55%and the computational cost was reduced by 49%.The detection speed was 57 FPS,an increase of 21

11、 FPS.Compared with other related algorithms,the new algorithm achieved a higher detection accuracy and a better balance between accuracy and speed.Keywords:metallic surface;defect detection;deep learning;YOLOX;lightweight network;data augmentation 铝型材、钢材等金属材料，被广泛应用于汽车制造、桥梁建设、航空航天等支柱产业，为现代社会发展和改善民生做出

12、了巨大贡献。然而，在生产过程中，由于材料损坏、设备故障和操作失误等问题，铝型材表面会产生桔皮、漏底、起坑等缺陷，钢材表面会产生裂缝、冲孔、压痕等缺陷，将严重影响工业产品的可靠性和安全性，因此，金属表面缺陷检测至关重要。随着机器学习和机器视觉的不断发展，金属材料表面的缺陷检测逐渐由人工目测方法转向自动化方法。目前，大多数自动化方法使用的是传统的机器视觉方法，需要通过提取诸如纹理或形状等不同形态的特征来分析缺陷与非缺陷区域之间的差异。LIU 等1使用多元判别函数计算直方图的统计数据，包括差值、平均值和方差，并以此实现对冷轧钢带缺陷的快速检测。LUO 等2提出一种广义完全局部二元模式方法(gener

13、alized completed local binary pattern，GCLBP)，使用 LBP 模式信息和频率信息来探索隐藏在均匀模式中的非均匀模式来检测金属表面的多类缺陷，该方法具有较强的抗干扰能力，但不能抑制图像噪声及适应尺度变化。CALEB 和 STEUER3通过计算灰度共生矩阵提取了 13 种纹理特征，ASHOUR 等4通过结合灰度共生矩阵与离散可分离剪切波变换(Discrete shearlet transform)提取 24 种统计特征，在金属表面缺陷的分类上取得显著效果。AI 和 XU5应用傅里叶变换从振幅谱中计算出 5 种统计特征，用于检测钢板表面的纵向裂缝。MEDIN

14、A 等6同时考虑了空域和频域信息的 Gabor 滤波器对扁钢线圈的缺陷进行分类。这种手工提取特征的方式通常需要复杂的参数设置，易受背景环境和光源变化的影响，缺乏泛化能力。同时，由于实际生产中的部署环境难以达到检测系统所需的理想环境，传统的机器视觉方法通常无法实现高精度的缺陷检测。近年来，深度学习方法在图像处理相关任务中取得了令人瞩目的成就。对于目标检测任务，深度学习能挖掘并学习图像数据中的深层特征，在提升检测效果的同时拥有更高的稳定性，且不易受背景光照等浅层特征影响。目前，基于深度学习的目标检测算法根据其网络结构的不同主要分为两类：一阶段检测算法和二阶段检测算法。二阶段检测算法首先使用

15、一个区域生成网络(region proposal net-work，RPN)分析图片的纹理、色彩和物体边界等信息并生成兴趣区域(region of interest，ROI)，然后对提取的 ROI 进行精细调整获得目标的定位。典型的二阶段网络如 RCNN7，Fast R-CNN8，Faster RCNN9和 Cascade RCNN10在目标检测任务中都可获得较高的检测准确率。一阶段网络以端到端的方式直接输出检测结果，不需要区域生成网络。相较于二阶段网络，一阶段网络以牺牲部分准确率为代价获得了更快的检测速度。一阶段检测网络主要包括 YOLO 系列11-16、SSD(single

16、shot multibox detector)17、FCOS(fully convolutional one-stage)18和 ATSS(adaptive training sample selection)19。其中，YOLO 系列目标检测算法检测速度相对较快，网络轻量且结构简单，是目前应用最为广泛的一阶段目标检测算法。在金属表面缺陷检测领域，黄凤荣等20提出了基于聚类生成 anchor方案的 Faster R-CNN 算法检测零件的表面缺陷。于海涛等21以 YOLOv3 作为基准算法，结合轻量化ResNet网络和改进的空洞空间金字塔池化模块，提出的型钢表面缺陷检测算法 SDNet(sel

17、ect and detect network)。MA 等22在 YOLOv4 的基础上设计了一个并行的双通道注意力模块(dual channel and spatial attention module，DCSAM)，提出YOLO-DCSAM 算法对铝带表面缺陷进行检测。GUO 等23提出了 MSFT-YOLO(multi-scale feature with transformer YOLO)，在 YOLOv5 的基础上增添了一个 TRANS 模块，该模块基于 Transformer网络，能够有效提取特征图的全局特征，实现钢材表面缺陷的快速检测。目前，主流的目标检测算法都使用了锚框机制，通

18、过预先设定的大量锚框参数，在训练过程中基于锚框调整预测的边界框。对于金属表面缺陷检测，锚框机制存在 2 个问题：锚框参数泛化能力差。为了获得理想的检测效果，锚框的数量、大小、第 4 期曹义亲，等：基于 E-YOLOX 的实时金属表面缺陷检测算法 679 比例等参数需要精细调整。因此，锚框参数存在领域适用性，不利于检测算法的多领域应用；加剧了正负样本之间的不均衡问题。基于锚框的检测算法通常会预设多个锚框，如 YOLOv5 使用 3 个锚框匹配特征图上的每个网格，相较于无锚框机制，负样本数量增加 3 倍。为了缓解锚框机制带来的问题，YOLOX 使用基于无锚框的标签匹配方法SimOTA(simpl

19、ified optimal transport assignment)，摒弃了复杂的锚框设定，提高了算法的泛化能力。同时，SimOTA 不仅减少网络预测的样本总数，并使用动态 top-k 方法选择多个样本匹配同一标签，有效缓解正负样本之间的不均衡。本文选择一阶段目标检测算法 YOLOX 作为基准网络设计新的金属表面缺陷检测算法。现阶段的目标检测算法的主流研究方向是通过增加网络深度和宽度，同时增大输入图像尺寸提高检测的准确率24-25。这类算法应用到实际生产中需要的计算资源远超嵌入式设备所具有的计算能力，且面对图像较少、类别简单的铝型材数据集，算法庞大的参数量使得计算复杂，易出现过拟合问题，影响

20、最终的检测结果。因此，在降低网络参数量的同时提高算法的检测精度是亟待解决的问题。本文提出一种扩张跨阶段轻量网络(extended cross stage partial mobile network，ECMNet)和一种新的数据增强方法边缘 Cutout，同时结合目标检测算法 YOLOX 提出一种新的金属表面缺陷检测算法 E-YOLOX(ECMNet-YOLOX)，最后通过改变E-YOLOX 的网络通道数和层数，进而提出E-YOLOX-s，E-YOLOX-m 和 E-YOLOX-l 多种规模的算法。本文主要贡献如下：(1)提出了一种轻量、有效的特征提取网络ECMNet。通

21、过增加梯度流路径的多样性，使深层的神经网络能够更高效地学习和收敛，同时采用逆瓶颈结构提高低维通道上网络的特征提取能力。(2)针对数据集样本较少和相似度较高的问题，提出了一种新的数据增强方法边缘 Cutout，增强网络模型检测性能和泛化能力。(3)提出了一种新的金属表面缺陷检测算法E-YOLOX。(4)为了验证该方法的有效性和泛化性，本文分别在铝型材表面缺陷数据集 AL6-DET、钢材表面缺陷数据集GC10-DET26和公开数据集PASCAL VOC 2012 上进行了对比实验，均取得了较好的效果。1 相关工作 1.1 网络轻量化 1.1.1 YOLO 系列的轻量化发展 YO

22、LOv1 是早期的经典一阶段检测算法，使用VGG16 网络提取图像特征，再通过一层全连接得到预测物体的边界框，实现了端到端目标检测。YOLOv1 以其简洁的网络结构及较二阶段检测算法更高效的检测速度，为目标检测领域带来变革。从 YOLOv2 开始，YOLO 系列设计了新的特征提取网络 DarkNet，由连续的 33 卷积和 11 卷积伴随残差连接所构成。YOLOv3 使用的 DarkNet53 拥有 53 个卷积层，其庞大的参数量和计算量极大地减慢了模型的推理速度。面对深度学习难以部署的困境，YOLOv4 在 DarkNet 中引入了跨阶段局部网络(cross stage partial ne

23、twork，CSPNet)27的结构设计了 CSPDarkNet，在减少网络推理计算的同时实现多样的梯度组合。之后 Scaled-YOLOv4 使用一种缩放方法调整网络的深度和宽度，并在 YOLOv5中发展出了 YOLOv5-s，YOLOv5-m 和 YOLOv5-l等多个规模的网络模型。随着轻量级神经网络的不断发展，MobileNet系列(MobileNet28，MobileNet v229，MobileNet v330)推广了深度可分离卷积、逆瓶颈残差结构等模块提升网络的特征提取能力。ShuffleNet 系列(ShuffleNet31，ShuffleNet v232)使用分组卷积和通道混

24、合方法在不损失性能的同时减少网络的参数量。轻量级网络通过设计不同的卷积方法和网络结构实现卷积网络的轻量化。与常规网络相比，轻量级网络需要更少的参数量和浮点计算量，更适合在嵌入式设备中部署，有利于实际生产中应用。如今，轻量级网络与YOLO系列目标检测算法结合已经成为研究热门方向，如 PP-PicoDet33和 YOLO-Fastest等，极大地减少了模型的参数量，提高了检测速度，但准确率相对较低。1.1.2 深度卷积使用深度卷积(Depthwise convolution)替换所有 33 卷积。深度卷积是一种特殊的分组卷积，分组数等于输入的通道数。深度卷积作为深度可分离卷积(Depthwise

25、 separable convolution)34的一部分，由MobileNet和Xception推广后广泛使用于轻量级卷积网络中。对于输入通道为 M，输出通道为 N，680 图像处理与计算机视觉 2023 年尺寸为 WH 的特征图，通过卷积核大小为 K 的标准卷积，其计算量为 HWK2MN，而使用深度卷积完成相同工作，需要的计算量为 HWK2M，二者计算量之比为 1/N。由此可见，当输出通道 N 较大时，使用深度可分离卷积能够有效降低网络的计算量。1.2 YOLOX 目标检测算法 YOLOX 是一种一阶段无锚框的目标检测算法，在检测速度和检测精度上取得相对平衡的表现。如图 1 所示，YOL

26、OX 算法由 3 个部分组成，分别为特征提取网络、特征融合网络和检测头。图 1 YOLOX 的网络结构 Fig.1 YOLOX network structure 1.2.1 特征提取网络在特征提取网络部分，YOLOX 沿用了YOLOv5 的设计使用了 CSPDarkNet 网络结构。首先，为了减少网络的参数量和计算量，使用了 Focus层对输入图像执行下采样，将图像的宽度和高度信息转化为通道信息，保留了更完整的图片下采样信息。其次，为了增加神经网络梯度流路径的多样性，使用了跨阶段局部网络结构(cross stage partial network，CSPNet)将输入特

27、征图通过 2 个独立的11 卷积转换为 2 个只有一半通道数的特征图，并只对其中一个特征图进行该阶段的卷积运算，之后连结 2 个特征图作为该阶段的输出。最后，为了增加感受野并从中提取相对重要的信息，使用空间金字塔池化层(spatial pyramid pooling，SPP)处理特征图。1.2.2 特征融合网络随着神经网络深度的增加，特征图所蕴含的语义信息不断积累，而浅层的表象信息在不断淡化。因此，需要特征融合网络对提取网络中不同层次的特征图进行融合，从而得到语义信息和表象信息都丰富的特征。YOLOX 使用特征融合网络 PAFPN(path aggregation feature pyram

28、id network)35对特征提取网络最后 3 个阶段输出的特征图进行融合。面对 3 个不同尺度、不同维度的特征图，由特征金字塔网络(feature pyramid network，FPN)36建立一个自顶向下的结构使语义信息从深层特征流向浅层特征。而 PAFPN 在此基础上构建一个自下而上的信息传递路径，将表象信息从浅层特征流向深层特征。1.2.3 检测头长久以来，在目标检测领域中分类问题和定位问题之间存在着冲突，无法有效地合并，因此，许多目标检测算法在检测头阶段就对分类和定位任务进行解耦。如图 1 所示，YOLOX 引入了解耦头分别从特征图中提取预测的类别和坐标。解耦头先将不同通道数的

29、特征图通过 11 卷积统一通道数到 128，之后分成 2 个平行分支，分别使用 2 个 33卷积计算目标的分类和定位，最后使用 11 减少通道得到预测结果。其中，目标置信度分支包括在定位分支内。第 4 期曹义亲，等：基于 E-YOLOX 的实时金属表面缺陷检测算法 681 1.2.4 标签分配 SimOTA YOLOX 是基于无锚框的检测算法，因此特征图上的一个网格可直接视作一个样本。面对多个特征图上的所有样本，检测算法需要进行标签匹配以选择合适的样本计算损失，再利用梯度下降方法实现网络参数的优化。因此，文献16提出了一种新的标签匹配方法 SimOTA。首先，根据样本的空间特征选择候选正样本

30、。特征图具有原图像的空间信息，因此，将图像与特征图重合，选择中心点落在标签内部或距离标签中心小于2.5 长度的网格样本作为候选正样本。之后，使用动态 top-k 方法计算最终正样本的数量。选择与标签的 IoU(intersection over union)值最大的 10 个候选正样本，计算其之和并向上取整，得到最终正样本数量 k。最后，对所有候选正样本计算分类损失和 IoU 损失，选择损失最小的 k 个样本进行网络参数的优化。SimOTA 不仅根据神经网络输出与标签的拟合程度，将原 YOLO 系列中的最终正样本数量从 1加到 k，以缓解正负样本之间的不均衡，而且在标签匹配阶段中增加了损失计算

31、步骤，有效地选择了拟合程度高的样本，以利于网络梯度的优化。2 基于扩张跨阶段轻量网络改进的YOLOX 算法(ECMNet-YOLOX)2.1 特征提取网络 ECMNet 基准模型 YOLOX 使用的是 CSPDarkNet 特征提取网络，该网络是由 YOLOv3 的特征提取网络DarkNet53 改进而来，有较好的图像特征提取能力，且发展出多个规模的检测算法，如小型的YOLOX-s、中等规模的 YOLOX-m 和较大规模的YOLOX-l 等。然而，实验发现 YOLOX-s 与YOLOX-l 的检测性能差距较大，低通道数和浅层神经网络虽然能够减少网络参数量和计算量，

32、但对网络的特征提取能力产生较大影响，降低了检测精度。因此，本文提出一种扩张跨阶段局部轻量网络ECMNet，在不影响特征提取能力的前提下减少网络参数量和计算量，实现快速精确的金属表面缺陷检测。如图 2 所示，ECMNet 在残差网络 ResNet的基础上，做出了逆瓶颈结构、线性结构和扩张跨阶段局部结构 3 点改进。2.1.1 残差网络的逆瓶颈结构如图 2(b)所示，ResNet37使用的残差连接有效解决了深层神经网络梯度消失的问题，因此在ECMNet 层中使用了残差连接。首先，ECMNet 改变了 ResNet 的残差网络中 33 卷积和 11 卷积的位置，并由 33 和 11 卷积分别负责提

33、取空间特征和通道特征。ResNet 残差网络中的 33 卷积在压缩通道后的特征图上提取空间特征，通道映射的过程中容易损失空间特征。因此，直接在输入特征图上提取空间特征，能够减少残差网络的特征损失。其次，对通道映射后的特征图再应用 33 进行深度卷积，在引入少量计算量的同时提取更丰富的空间信息。最后，ECMNet 在残差网络中使用了逆瓶颈结构改变网络的通道数。ResNet 的残差网络是瓶颈结构，使用 2 个 11 卷积先将特征映射到低维通道后再还原。逆瓶颈结构则先将特征映射到高维通道后再还原，有更高的信息利用率，使特征信息在低维通道传播时获得相近于高维通道的效果，有效提升了轻量级网络的特征提取能

34、力。2.1.2 线性网络结构深层神经网络通常需要非线性激活函数来实现函数的拟合并保证梯度的可计算性，尤其在ResNet 和 DarkNet 中，每一层卷积都会跟随一个激活函数 ReLU38。然而，使用非线性激活函数 ReLU必然会破坏输入的特征。根据深度学习的流形分布假设39-40，且借鉴了 MobileNetv2 和 ConvNext41中的激活函数分布，选择只对映射到高维通道后的特征图使用 ReLU 激活函数以保留更多的关键特征。因此，在 ECMNet 层中的第一个 11 卷积和残差连接后分别使用一个激活函数ReLU对特征图进行非线性映射。2.1.3 扩张跨阶段局部结构如图 2(b)所

35、示，在 ECMNet 中，本文提出了扩张跨阶段局部结构。对于 YOLOX 的特征提取网络CSPDarkNet，跨阶段局部网络结构(cross stage partial network，CSPNet)将输入的特征图通过 2 个独立的 11 卷积转换为 2 个只有一半通道数的特征图，并只对其中一个特征图进行该阶段的卷积运算，最后连结 2 个特征图作为该阶段的输出。ECMNet 中，首先对输入的特征图通过 33 卷积减少特征图尺寸，增加通道数。其次，扩张跨阶段局部结构将输入的特征图通过 2 个独立的 11卷积转换为 2 个只有 1/4 通道数的特征图，使一个特征图通过四层的 ECMNet 层，取

36、11 卷积的2 个特征图和每两层 ECMNet 层的特征图，共得到 4 个各有 1/4 通道数的特征图，通过连结操作 682 图像处理与计算机视觉 2023 年图 2 ECMNet 的网络结构 Fig.2 ECMNet network structure(a)ECMNet;(b)ECMNet layer)得到该结构的输出。这种跨阶段连接的网络结构分割了梯度流，使梯度流通过不同的网络路径传播，实现更丰富的梯度组合，多样化的梯度路径使得不同网络层传播的信息具有较大的相关性差异，增强了卷积网络的学习能力，同时减少了计算量。扩张跨阶段局部结构减少了计算瓶颈，使深层的神经网络更好地学习和收敛。2.2

37、边缘 Cutout 数据增强 Cutout42是深度学习在图像领域中的一种简单有效的数据增强方法，其在训练过程中使用像素值为 0 或 114 的掩膜随机遮掩方形区域，使网络趋向关注图像整体的全局特征而不会过分依赖部分突出的局部特征。然而，在金属表面缺陷检测领域，无缺陷图像上出现的随机遮掩通常会被判断为缺陷本身。因此，本文提出一种改进的 Cutout 方法边缘 Cutout。边缘 Cutout 对一张缺陷图像随机遮掩时，计算缺陷附近区域像素的均值，生成自适应掩膜。图 3(a)为 2 张铝型材缺陷图像；图 3(b)为Cutout 方法对 3 块方形区域使用 114 像素进行遮掩，方形区域的长宽相对

38、图像长宽的比例分别为(0.30.3)，(0.30.1)，(0.10.3)；图 3(c)为边缘Cutout 方法对相同区域进行遮掩，掩膜的像素为方形缺陷的边缘区域像素的均值，即黄色区域。图 3 边缘 Cutout 和 Cutout(a)原始训练图片；(b)Cutout 方法；(c)边缘 Cutout 方法)Fig.3 Edge-Cutout and Cutout(a)Original training images;(b)Cutout;(c)Edge-Cutout)第 4 期曹义亲，等：基于 E-YOLOX 的实时金属表面缺陷检测算法 683 在该铝型材数据集中，标签的边缘区域通常属于无缺陷的

39、铝型材表面或铝型材生产的工业背景，取该区域像素的均值随机遮掩缺陷图像时对图像缺陷分布的影响较小。边缘 Cutout 方法使用自适应掩膜不仅有效遮掩了图像的局部特征，使网络更关注全局特征，且增强了缺陷边缘的特征，提高了缺陷定位的准确度。3 实验结果分析 3.1 金属表面缺陷数据集 3.1.1 铝型材表面缺陷数据集 AL6-DET AL6-DET 数据集使用的图像来自阿里云天池平台从南海铝型材标杆企业采集的实际生产中有瑕疵的铝型材监测影像数据。通过对图片的标注和标签的筛选，AL6-DET 数据集共包含 2 235 张分辨率为 25601920 的彩色三通道缺陷图像，其中存在不导电、桔皮、角位漏底、

40、漏底、起坑、杂色共 6类表面缺陷，如图 4 所示。本文将 AL6-DET 数据集划分为训练集 1 787张图片，测试集 448 张图片。AL6-DET 数据集共包含 2 426 个缺陷，其分布如图 5 所示。3.1.2 钢材表面缺陷数据集 GC10-DET43 GC10-DET 数据集包含 2 291 张钢材生产环境下采集的分辨率为 20481000 的灰度图像，其中包含腰折、月间隙、油斑、夹杂、压痕、折痕、水斑、丝状斑、焊缝、冲孔共 10 类表面缺陷，如图 6所示。GC10-DET 数据集划分为训练集 1 834 张图片，测试集 457 张图片。GC10-DET 数据集共包含3 562 个缺

41、陷，其分布如图 7 所示。3.2 实验环境硬件环境为Intel(R)Xeon(R)Gold 6240处理器和 32 G 显存的 Nvidia V100 显卡。软件环境为：Ubuntu 20.04 操作系统，Python 3.9，Pytorch 1.11深度学习框架和 CUDA 11.3 GPU 通用并行计算架构。(a)(b)(c)(d)(e)(f)图 4 铝型材表面缺陷数据集 AL6-DET(a)不导电；(b)桔皮；(c)角位漏底；(d)漏底；(e)起坑；(f)杂色)Fig.4 Aluminum profile surface defect dataset AL6-DET(a)Non-con

42、ductive;(b)Orange peel;(c)Corner leakage;(d)Leakage;(e)Pitting;(f)Mottling)图 5 AL6-DET 数据集标注缺陷的数量分布 Fig.5 The distribution of defects in dataset AL6-DET 684 图像处理与计算机视觉 2023 年 (a)(b)(c)(d)(e)(f)(g)(h)(i)(j)图 6 钢材表面缺陷数据集 GC10-DET(a)腰折；(b)月间隙；(c)油斑；(d)夹杂；(e)压痕；(f)折痕；(g)水斑；(h)丝状斑；(i)焊缝；(j)冲孔)Fig.6 Steel

43、 surface defect dataset GC10-DET(a)Waist folding;(b)Crescent gap;(c)Oil spot;(d)Inclusion;(e)Rolled pit;(f)Welding line;(g)Water spot;(h)Silk spot;(i)Crease;(j)Punching)图 7 GC10-DET 数据集标注缺陷的数量分布 Fig.7 The distribution of defects in dataset GC10-DET 实验过程中，对于本文模型，使用学习率 0.03和学习率调整策略 OneCycleLR 训练 300 轮

44、，并使用随机梯度下降(stochastic gradient descent，SGD)方法进行优化，其动量因子为 0.9，权重衰减系数为 0.000 5。本文实验中所有 YOLO 系列算法的训练均不使用预训练权重，从随机初始化的参数开始，其他算法使用在 ImageNet 数据集上训练的预训练权重。3.3 评价指标本文采用全类别平均检测精度(mean average precision，mAP)，包括 mAP50和 mAP50:95，以及检测速度，常用指标是每秒帧率(frames per second，FPS)来衡量模型的检测性能。平均检测精度(average precision，AP)由精确

45、率(precision，P)和召回率(recall，R)计算得出，精确率为检测出的所有目标中正确的比例，而召回率为数据集中目标实际检测出的比例，即 100%TPPTPFP(1)100%TPRTPFN(2)其中，TP为检测的目标中正确的数量；FP为检测的目标中错误的数量；FN为数据集中未能检测出的目标。平均检测精度AP是不同召回率下精确度的平均值。本文使用COCO数据集的AP计算方法，对101个召回率的插值点下的精确率之和求平均值得到平均检测精度，即 0,0.01,11()101RAPP k(3)全类别平均检测精度mAP是对所有类别的平均检测精度取均值，即 11()cimAPAP ic(4)其中

46、，c为检测类别数；AP(i)为第i类缺陷的平均第 4 期曹义亲，等：基于 E-YOLOX 的实时金属表面缺陷检测算法 685 检测精度。mAP50:95是IoU阈值分别为0.50,0.55,0.60,0.90,0.95条件下所有得到的mAP的均值，本文使用mAP表示mAP50:95。缺陷检测中另一个重要性能指标是检测速度(FPS)，表示模型每秒能够检测的图片数量。3.4 实验结果分析 3.4.1 E-YOLOX与多种模型的性能对比为了更好的分析本文提出的E-YOLOX算法，将本文算法与多种目标检测算法在数据集AL6-DET和GC10-DET上进行独立的训

47、练和测试。对比算法包括YOLOv3，SSD，Sparse RCNN43，ATSS，TOOD44，Varifocal Net45，YOLOv5，YOLOX和YOLOv746。其中除YOLOv5，YOLOX和YOLOv7，其余算法均基于mmdetection47工具实现。在训练图像尺寸方面，除SSD算法使用512512，其余算法均使用640640尺寸训练。每个模型的性能、速度、参数量和计算量见表1。表 1 不同算法的性能对比(mAP50:95)Table 1 Detection results of different algorithms(mAP50:95)算法特征提取网络训练大小 AL6-

48、DET GC10-DET 参数量(M)计算量(G)FPS Sparse RCNN ResNet50 640 72.2 33.7 105.9 64.6 25 SSD VGG16 512 67.5 31.4 24.4 88.4 38 ATSS ResNet50 640 67.9 33.1 31.9 80.6 35 TOOD ResNet50 640 68.8 31.5 31.8 72.3 32 Varifocal Net ResNet50 640 67.9 32.6 32.5 75.7 31 YOLOv3 DarkNet53 608 67.2 30.7 61.6 70.0 39 YOLOv5-s

49、CSPDarkNet 640 72.1 33.5 7.0 15.8 62 YOLOv5-m CSPDarkNet 640 73.8 33.7 20.9 47.9 51 YOLOv5-l CSPDarkNet 640 75.5 34.3 46.2 108.4 43 YOLOX-s CSPDarkNet 640 71.3 33.2 8.9 26.8 53 YOLOX-m CSPDarkNet 640 72.5 33.9 25.3 73.8 42 YOLOX-l CSPDarkNet 640 73.6 35.1 54.2 155.6 36 YOLOv7-tiny E-ELAN 640 70.4 32

50、.2 6.0 13.3 71 YOLOv7 E-ELAN 640 75.2 34.8 37.2 105.3 54 E-YOLOX-s ECMNet 640 74.7 34.5 5.9 18.9 70 E-YOLOX-m ECMNet 640 75.9 35.3 13.6 44.6 61 E-YOLOX-l ECMNet 640 77.2 36.8 24.3 79.0 57 注：加粗数据为最优值 Sparse RCNN，ATSS，TOOD与Varifocal Net使用相同的特征提取网络ResNet50，由于Sparse RCNN为二阶段检测算法，在区域提取网络和兴趣区域对齐网络中使用了多层全连

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 YOLOX 实时金属表面缺陷检测算法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。