基于注意力机制与YOLOv5融合的树脂拉链缺陷检测算法研究 (1).pdf
《基于注意力机制与YOLOv5融合的树脂拉链缺陷检测算法研究 (1).pdf》由会员分享,可在线阅读,更多相关《基于注意力机制与YOLOv5融合的树脂拉链缺陷检测算法研究 (1).pdf(7页珍藏版)》请在咨信网上搜索。
1、 第3 8卷 第3期 青 岛 大 学 学 报(工 程 技 术 版)V o l.3 8 N o.3 2 0 2 3年 9 月J O U R N A L O F Q I N G D A O U N I V E R S I T Y(E&T)S e p.2 0 2 3文章编号:1 0 0 6 9 7 9 8(2 0 2 3)0 3 0 0 2 3 0 7;D O I:1 0.1 3 3 0 6/j.1 0 0 6 9 7 9 8.2 0 2 3.0 3.0 0 4基于注意力机制与Y O L O v 5融合的树脂拉链缺陷检测算法研究孙传珠,李 斌,符朝兴(青岛大学机电工程学院,青岛 2 6 6 0 7
2、1)摘要:针对传统的树脂拉链缺陷人工检测存在的效率低和劳动强度大等问题,本文将YO L O v 5算法与注意力机制(c o n v o l u t i o n a l b l o c k a t t e n t i o n m o d u l e,C B AM)相结合,对树脂拉链缺陷检测算法进行研究,给出了算法的结构原理,并对树脂拉链缺陷进行检测试验。采集带有坏齿、边缘、内部、挤出、开裂和污染的树脂拉链图像,建立数据集并据此标注。同时,利用数据集对YO L O v 5网络模型进行训练,并选择9 0 0张树脂拉链缺陷图像进行测试。测试结果表明,不同树脂拉链缺陷的检测准确率不同,模型对坏牙、边缘、
3、内部、挤压、开裂和污染6种树脂拉链缺陷的识别率分别达到9 9%,1 0 0%,1 0 0%,1 0 0%,1 0 0%和9 9%,检测目标的置信度范围为0.8 20.9 9,检测准确率较高,效果较好,证明模型测试的精确率达到1 0 0%,召回率达到1 0 0%,平均准确率达到9 8%,证明了本文方法的可行性和有效性。本文算法可实现对常见树脂拉链缺陷的检测、分类及定位。该研究对提升树脂拉链制造行业的生产效率具有一定的成效。关键词:缺陷检测;YO L O v 5;树脂拉链;深度学习;注意力机制中图分类号:T P 3 9 1.4 1 文献标识码:A 收稿日期:2 0 2 2 1 2 0 1;修回日期
4、:2 0 2 3 0 3 1 8作者简介:孙传珠(1 9 9 8),男,硕士研究生,主要研究方向为人工智能和机器学习。通信作者:符朝兴(1 9 6 7),男,博士,副教授,主要研究方向为人工智能和机械振动。Em a i l:c x_f 1 6 3.c o m 树脂拉链缺陷的自动检测在工业自动化生产线的产品质量检测中具有重要作用,但由于树脂拉链缺陷的形状和大小各不相同,传统的对树脂拉链缺陷的检测,主要通过人工方式进行,依赖于检测人员的经验,主观性强1,识别标准不统一,检测效率低,劳动强度大,并且由于视觉疲劳及个人情绪等无法避免的客观实际,对检测结果影响较大,不能保证检测的准确率和效率。目前,对树
5、脂拉链缺陷检测方法的研究较少,而与之联系最密切的研究主要是对纺织物瑕疵的检测。HU G H等人2提出一种基于深度卷积生成对抗网络(d e e p c o n v o l u t i o n g e n e r a t i v e a d v e r s a r i a l n e t w o r k s,D C GAN)自动检测织物缺陷的新型无监督方法,该检测方法的准确率较高;ME I S 等人3提出了一种基于多尺度卷积去噪自编码器网络无监督且高效的织物缺陷检测模型,只需要将少量无缺陷的样本进行训练,即可达到较高的纺织物缺陷检测率;张丽瑶等人4采用单发多盒探测器(s i n g l e s h
6、 o t m u l t i b o x d e t e c t o r,S S D)网络对4种织物瑕疵目标进行检测与分类,平均准确率达到8 0%;徐昀等人5基于YO L O v 4目标检测算法,对复杂光照下的织物疵点目标进行检测,检测准确率达9 5%;WANG Y等人6针对瑕疵点目标小及形状不规则等问题,采用改进的YO L O v 5目标检测算法,对织物疵点进行检测与定位,检测平均准确率达到7 0%以上;王恩芝等人7采用改进的YO L O v 5算法,对织物表面缺陷进行检测,准确率高达9 8.8%。由此可以看出,深度学习在织物的瑕疵检测方面具有检测准确率高、检测速度快的优势,而且通过对上述实
7、验进行对比可知,YO L O v 5算法的检测准确率以及检测速度均优于S S D和YO L O v 4等算法。基于此,本文将YO L O v 5算法用在对树脂拉链缺陷的检测中,又因树脂拉链周围纺织物缺陷较难识别,因此在YO L O v 5算法中引入C B AM模块。同时,采集带有坏齿、边缘、内部、挤压、分裂以及污染的树脂拉链图像,建立数据集并进行标注,而对数据量不足影响模型性能及图像类别不青 岛 大 学 学 报(工 程 技 术 版)第 3 8 卷均衡导致过拟合的问题,采用I m g a u g算法对数据集进行增强,并通过实验对模型进行评价和测试。结果表明,本文算法对树脂拉链缺陷检测的准确率和效
8、率都较高,证明了本文方法的可行性和有效性。该研究提升了树脂拉链制造行业的生产效率。1 算法结构原理1.1 Y O L O v 5网格结构YO L O v 5主要由输入端(I n p u t),主干网络(B a c k b o n e),颈网络(N e c k),预测器(P r e d i c t i o n)4部分组成8,YO L O v 5模型网络结构如图1 所示。图1 Y O L O v 5模型网络结构 1)输入端。选择固定尺寸的图片,训练时,需要对输入图片进行数据处理,处理过程采用M o s a i c方法,将4张图片进行翻转和缩放等方式进行处理,处理后进行拼接,对神经网络的鲁棒性起到重
9、要作用。此外,采用自适应计算最佳锚框值和自适应图片缩放方法,对图片进行处理。2)主干网络。主干网络包含F o c u s网络和跨阶段局部网络(c r o s s s t a g e p a r t i a l n e t w o r k s,C S P)。F o-c u s网络通过对输入进行切片及卷积操作,增强对图像特征的提取;C S P网络是由一系列卷积和残差网络构成。3)颈网络。颈网络采用特征金字塔网络(f e a t u r e p y r a m i d n e t w o r k,F P N)+路径聚合网络(p a t h a g-g r e g a t i o n n e t w
10、o r k,F P N)结构,处于主干网络和预测期之间,主要是进一步处理主干网络的特征,提高应用的合理性。4)预测器。预测器是由损失函数(G I OU_L o s s)和非极大值抑制(n o n-m a x i m u m s u p p r e s s i o n,NM S)组成,解决了目标框和预测框不重合的问题,增强了对遮挡目标的检测。1.2 注意力机制注意力在人类感知中起着重要作用9 1 1。在人类视觉系统中,尽管一次性获取的场景量巨大,但人类会选择性的进行处理,该处理方式使想要的场景部分更加突出,以便更好地捕捉视觉结构1 2。C B AM是由通道注意力模块(c h a n n e l
11、a t t e n t i o n m o d u l e,C AM)与空间注意力模块(s p a t i a l a t t e n t i o n m o d u l e,S AM)组合而成,C B AM原理图如图2所示。42 第3期 孙传珠,等:基于注意力机制与YO L O v 5融合的树脂拉链缺陷检测算法研究图2 C B AM原理图 通道注意力模块通过主动的网络学习,获得每个特征通道的重要程度,再给予其不用的权重系数,从而加强重要的特征,抑制不重要的特征。S AM通过将图片原始信息转换到另一空间,且在这个过程中保留关键信息,并为每个位置生成的权重掩膜加权输出,从而使图像感兴趣区域得到增
12、强,无关区域被弱化。1.3 评价指标目标检测需要对图片进行分类和检测1 3,并采用平均精度均值(m e a n a v e r a g e p r e c i s i o n,mA P),对检测效果进行综合评估。在目标检测过程中,模型将对图像计算输出的预测框按照判断结果,可分成 T P、F P、F N、T N 四个类别,然后计算评价指标1 4。真阳性(t r u e p o s i t i v e,T P)表示预测框将目标分为正样本,且实际为正样本数量;假阳性(f a l s e p o s i-t i v e,F P)表示预测框将目标分为正样本,但实际为负样本数量;假阴性(f a l s e
13、 n e g a t i v e,F N)表示预测框将目标分类为负样本,但实际为正样本数量;真阴性(t r u e n e g a t i v e,T N)表示预测框将目标分为负样本,且实际为负样本数量。根据上述4类样本的分布情况,可以得到模型的各种评价指标。数据集中,第i个样本为Ii,第j个类别目标为Cj的精确度(p r e c i s i o n),表示预测框检测到该类别目标中,确实包含了目标Cj的比例,即该图像中,包含目标Cj预测正确的框的数量与所有预测包含j类目标预测框的比值,即Pcj(Ii)=T P/T P+F P(1)召回率(r e c a l l)反映了图像中包含类别目标Cj分类
14、正确的预测框数量与该类别目标真实标签框数量的比值,即Rcj(Ii)=T P/T P+FN(2)漏检率(m i s s e d i n s p e c t i o n)反映了实际包含目标类别Cj,但预测框中未检测到的数量与该类目标真实标签框的数量的比值,与召回率呈相反的变化趋势,即Mcj(Ii)=FN/T P+FN=1-R(Ii)(3)误检率(f a l s e i n s p e c t i o n)反映了预测框中分类为包含目标类别Cj,但该分类错误的数量与模型输出预测框中包含目标类别Cj的数量比值,即Fcj(Ii)=F P/T P+F P=1-Pcj(Ii)(4)平均精确率(a v e r
15、a g e p r e c i s i o n,A P),当验证集包含M张图像时,A P值即为这些图像中目标类别Cj的精确率平均值,即A Pcj=Mi=1Pcj(Ii)/M(5)在进行实际测试过程中,以置信度对满足某一类目标的I OU阈值条件的预测框进行排序,置信度的变化会引起精确率P和召回率R的变化,其中精确率P和置信度成反比,召回率R和置信度成正比。以横轴为召回率R,纵轴为精确率P进行曲线绘制,可以直观呈现三者的变化趋势。绘制P-R曲线后,便能计算A P值(即为P-R曲线下的面积),一般采用插值法,设置1组阈值0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1,
16、分别令召回率R取该组阈值的每一个值,可得该阈值最大精确率,并对所有的精确率取平均值,则为该类的 A P 值,即A Pcj=11 1R0,0.1,0.2,m a xP(R)(6)为评判模型对不同种类目标的检测结果,采用评价指标mA P,该指标表示验证集中所有目标类别的平均精确率的均值,即mA P=Ncj=1A Pcj/M(7)52青 岛 大 学 学 报(工 程 技 术 版)第 3 8 卷其中,Nc为验证集中目标类别的数量,即共有Nc个类别。mA P是深度学习中评价模型性能的重要指标,对模型调整其有重要的参考意义。2 树脂拉链缺陷检测实验2.1 数据集准备本文使用的数据集来自公开数据集1 5和自主
17、采集,其包含不同款式的树脂拉链缺陷的特征,包括坏齿、边缘、内部、挤压、分裂及污染6类,树脂拉链缺陷数据集图片如图3所示。数据集共有4 8 6张图片,其中坏齿4 3张,边缘4 1张,内部4 0张,挤压4 0张,分裂4 2张,污染4 1张,正常类别2 4 6张。图3 树脂拉链缺陷目标数据集图片图4 数据增强算法流程 直接使用采集的图像数据无法训练模型,还需将每个图像的种类和识别区域进行标签化,本文使用L a b e l i m g标注工具进行标注。在模型训练中,如果训练使用的数据集图片数量不足,就会影响模型性能1 6。由于本文采集的数据集图片数量有限,图像类别不均衡,会使训练出的模型存在偏向性和较
18、差的泛化能力,容易产生过拟合现象。为解决这些问题,需要对数据集中的图像进行数据增强1 7,目前,在模型训练中常用的数据增强方法主要有调整图像色彩、尺寸变化、随机剪裁、几何变换、添加噪声、条件生成对抗网络(C o n d i t i o n a l GAN s)1 8 1 9等。本文使用P y-t h o n的图像增强工具I m g a u g进行数据增强,它通过不同的策略改变图片,达到数据增强的目的2 0,经过数据增强,原数据集扩充到2 7 0 6张图像。数据增强算法流程如图4所示。图像增强的参数设置如表1所示。表1 图像增强的参数设置图像增强数量旋转角度/()水平镜像翻转概率垂直镜像翻转概率
19、明亮度改变率高斯模糊参数缩放系数1 0-3 03 00.50.50.51.5030.80.9 52.2 模型训练与评价对于YO L O v 5深度学习模型,选择 P y T o r c h作为深度学习框架,工作机系统环境为W i n 1 0专业版。增强后的数据集分为训练集和验证集,其中训练集占9 0%,验证集占1 0%。模型训练迭代运行次数为3 0 0 次,训练图片的分辨率为6 4 06 4 0,每次送入网络的图片数量为1 6 张。训练过程中各项指标变化情况如图5所示。62 第3期 孙传珠,等:基于注意力机制与YO L O v 5融合的树脂拉链缺陷检测算法研究图5 训练过程中各项指标变化情况
20、由图5可以看出,该模型达到了收敛的状态,精度和召回率达到了1 0 0%,各个损失函数均值维持在很低的水平。当训练集损失函数减小时,验证集损失函数没有增加,模型没有过拟合,并且精度和召回率平稳无较大波动,训练效果较好。当3 0 0次迭代后,该模型达到收敛状态。在模型训练过程中,其准确率和召回率稳定提升。当模型达到饱和后,其准确率(P r e c i s i o n)、召回率(R e c a l l)和平均精度均值(mA P_0.5)均达到1 0 0%;调和均值(mA P_0.50.9 5)保持在 9 8%左右,整体训练达到预期效果。2.3 实验结果与分析本研究选择9 0 0张树脂拉链缺陷图像进行
21、测试,其中每种树脂拉链缺陷数量均为1 5 0,检测后,部分识别结果如图6所示。图6 部分识别结果 树脂拉链缺陷检测算法包括对目标的识别,分类及定位,树脂拉链缺陷识别结果如表2所示。由表2可以看出,不同树脂拉链缺陷的检测准确率不同,边缘、内部、挤压、分裂缺陷达到完全识别,1 5 0个污染中有1处未识别,未识别的对象为单个齿极小范围断裂和黑色纺线上微小尺寸油污这一特征不明显对象。6种树脂拉链缺陷的识别率分别为9 9%,1 0 0%,1 0 0%,1 0 0%,1 0 0%,9 9%。表中的置信度,代表当前识别出的区域是否有对象,若有对象时,则预测对象和真实对象的匹配度,该值是评价检测效果好坏的一个
22、重要指标,置信度数值越大,证明检测效果越好,表中检测目标的置信度范围为0.8 20.9 9,检测效果较好。综上可知,72青 岛 大 学 学 报(工 程 技 术 版)第 3 8 卷该模型对熨烫目标的检测效果满足实验要求。表2 树脂拉链缺陷识别结果检测种类检测数量/处检测成功数量/处检测置信度范围检测成功率/%检测种类检测数量/处检测成功数量/处检测置信度范围检测成功率/%坏齿1 5 01 4 9 0.8 80.9 79 9挤压1 5 01 5 00.8 90.9 71 0 0边缘1 5 01 5 00.8 50.9 81 0 0分裂1 5 01 5 00.8 90.9 91 0 0内部1 5 0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于注意力机制与YOLOv5融合的树脂拉链缺陷检测算法研究 1 基于 注意力 机制 YOLOv5 融合 树脂 拉链 缺陷 检测 算法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。