基于颜色特征的半监督聚类算法在铜片腐蚀等级识别中的应用.pdf
《基于颜色特征的半监督聚类算法在铜片腐蚀等级识别中的应用.pdf》由会员分享,可在线阅读,更多相关《基于颜色特征的半监督聚类算法在铜片腐蚀等级识别中的应用.pdf(7页珍藏版)》请在咨信网上搜索。
1、34数值模拟May20232023年5月CORROSION&PROTECTIONNo.5Vol.44第44卷第5期腐蚀与防护D0I:10.11973/fsyfh-202305007基于颜色特征的半监督聚类算法在铜片腐蚀等级识别中的应用钱企豪,郑战光,梁钊,伍鹏革?,杜彭玉(1.广西大学机械工程学院,南宁530 0 0 4;2.湖南大学机械与运载工程学院汽车车身先进设计制造国家重点实验室,长沙410 0 8 2)摘要:提出一种基于半监督聚类算法的铜片腐蚀等级快速识别方法。该方法首先对于大量铜片腐蚀图像进行图像分割,使其尺寸归一化;然后通过滤波处理减弱异常值影响,利用颜色量化方法获取图像的颜色特征
2、向量,并通过核主成分分析(KPCA)对颜色直方图信息进行降维处理;最后,将标准比色卡提取的颜色特征向量作为半监督k-means的初始聚类中心,结合预处理后腐蚀图像的颜色特征向量训练模型,得到每张图片对应的腐蚀等级。结果表明,通过该算法得到的铜片腐蚀等级分类结果与目测结果一致,说明该方法具有较高的准确性。关键词:铜片腐蚀;颜色特征;图像预处理;半监督聚类;核主成分分析中图分类号:TG174文献标志码:A文章编号:10 0 5-7 48 X(2 0 2 3)0 5-0 0 34-0 7Application of Semi-Supervised Clustering Algorithm Based
3、 on Color Feature toCorrosion Level Identification for CopperQIAN Qihao,ZHENG Zhanguang,LIANG Zhao,WU Pengge,DU Pengyu?2(1.School of Mechanical Engineering,Guangxi University,Nanning 530004,China;2.State Key Laboratory of AdvancedDesign and Manufacturing for Vehicle Body,College of Mechanical and Ve
4、hicle Engineering,Hunan University,Changsha 410082,China)Abstract:A rapid identification method of copper corrosion level based on semi-supervised clustering algorithm wasproposed.In this method,a larger number of images of corroded copper were segmented firstly in order to normalizetheir sizes.Then
5、 the influence of outliers was weakened by filter processing,and the color feature vector of theimages was obtained by color quantization.The dimension of color histogram was reduced by the kernel principalcomponent analysis(KPCA)method.Finally,the corresponding corrosion level of each image was obt
6、ained by takingthe color feature vector extracted from the standard colorimetric card as the initial clustering center of semi-supervisedk-means in combination with the color feature vector training model of pre-processed corrosion images.The resultsshowed that classification results of corrosion le
7、vel of copper by calculation through the algorithm corresponded wellto the visual inspection results,indicating high accuracy of the method.Key words:copper corrosion;color feature;image preprocessing;semi-supervised clustering;kernal principalcomponentanalysis(KPCA)金属的腐蚀会极大地减少其制品的使用寿命,甚至还会引发事故,导致重大
8、损失。通常,应用于工业或生活中的铜与包括大气在内的几种环境介质接收稿日期:2 0 2 1-0 5-2 7基金项目:国家自然科学基金项目(516 7 5110,5146 50 0 2)通信作者:郑战光(19 7 5一),教授,博士,研究方向为机械强度与疲劳寿命预测、冲压成形及模具设计、材料力学与晶体塑性有限元等,137 37 0 6 6 7 58,触时都表现出一定的耐腐蚀性 1。但是由于腐蚀性离子的存在,铜也会与空气中的氧元素逐步发生氧化还原反应形成氧化物,铜表面以点蚀的形式出现分布不均匀的腐蚀 2 。快速识别铜材料腐蚀等级的方法不仅有助于判断铜质产品的可靠程度,而且能给腐蚀性能结果评定提供依据
9、。铜片腐蚀评级的传统方法是人工对比待测样品与标准比色板及相应文字描述,得出外观相近且符35钱企豪,等:基于颜色特征的半监督聚类算法在铜片腐蚀等级识别中的应用合描述的腐蚀等级,但这种评价方式极大程度上依赖评价者的主观判断。随着科学技术的进步,金属材料腐蚀评级方法也得到了发展,包括物理方法(测量质量的变化 3,涡流检测金属锈蚀 4,红外光谱分析,超声脉冲回波检查腐蚀 5,声发射监测金属腐蚀6,利用X射线进行能谱分析、衍射分析或光电子能谱分析 7-10 1,金相显微镜分析 11,扫描电镜分析 12 ,热成像法 13)和电化学方法(线性极化法 14,电化学阻抗谱 15,电化学噪声 16 )等。理想的铜
10、腐蚀评级方法应该兼具高效率、高精度和低成本等特征。数字图像处理技术最初被用于远程检测和各种医疗任务,之后逐渐扩展到检测诸如虫害、干旱或者产品裂纹腐蚀等异常情况 17-2。由于数字图像处理技术可以对金属材料腐蚀实现快速、非侵入性、低成本的分析 2 3,近年来该技术与机器视觉、深度学习等新兴图像处理算法结合 2 4,被大量应用于腐蚀识别领域。龚应忠等 2 5 运用k均值算法提取腐蚀铜片图像特征颜色,并将其与标准色板构筑的特征库对比,实现腐蚀评价。陈桂娟等 2 6 通过小波分割灰度处理后的腐蚀表面形貌图,运用支持向量机准确识别了腐蚀类型。RUXANDRA等 2 7 运用卷积神经网络实现了对铜片腐蚀的
11、快速分类。陈爽 2 8 利用碳钢锈蚀试样图片训练深度神经网络,实现了对耐锈钢腐蚀程度的高精度识别。然而,上述研究中应用的监督学习算法需要大量已被标记的数据来训练分类模型。尽管金属腐蚀图像的采集较为方便,然而这些待处理腐蚀数字图像多为无法直接使用的无标签数据,无法用于训练监督模型。如果对这些样本进行标签划分,不仅需要耗费大量的人力,而且存在因误检对模型造成污染的可能。半监督学习算法可以借助少量有标签数据对无标签数据进行预测,结合两者一同训练分类模型。本工作以标准比色卡为基准,将图像转化为颜色特征向量训练半监督k-means聚类模型,对铜片腐蚀等级进行了有效识别,为后续腐蚀性能判定提供了有效支撑。
12、1半监督学习原理利用传统的机器学习算法训练模型时,如果样本集被标记,则使用有监督算法训练输入与输出间的映射关系,如果样本集没有标记,则运用无监督算法寻求数据间的内在规律。通常在进行异常检测与识别时,只能获得少量可作为判定标准的有标签数据,而大量获取的为无标签数据,无标签数据后续标记较为麻烦且需要耗费大量的人工。半监督学习可以同时利用有标签数据集和无标签数据集训练分类模型。一般而言,当数据量过少时,训练得到的模型欠拟合,监督学习得到的模型效果不能满足需求。样本的分布不能真正代表真实数据的分布特征,现有数据训练得到的模型会出现不能正确找到真实数据分类边界的问题。半监督学习通过加人无标签数据来增强监
13、督学习的分类效果,不仅可以利用现有数据模拟出真实数据在特征空间的分布特点,而且可以在此基础上确定分类边界 2 9 半监督学习利用现有有标签数据生成监督模型,并以此对无标签数据进行预测。在每次预测后,对其结果进行判断,如果置信度高则将预测结果设置为标签。每次迭代过程生成的有标签数据都将被用于训练和更新模型,直至所有的无标签数据被标记,模型的识别精度达到预期效果。2特征提取及识别模型基于颜色特征的半监督铜片腐蚀识别方法,以颜色间相似度为基准,采用合适的方法提取颜色特征向量,再通过标准比色卡训练的半监督模型对图像进行腐蚀等级识别,并通过识别的图像对模型进行改进,最终实现对图像的高精度识别。国标腐蚀标
14、准比色卡借鉴了美国ASTM制定的用于腐蚀评级的标准参照物一一腐蚀标准色板 30,将铜片腐蚀等级分为五大类,分别为新磨光铜片、1、2、3、4级腐蚀铜片。每一大类腐蚀又根据腐蚀铜片的颜色不同进行细分,总共划分了13个腐蚀级别。综合考虑各类颜色空间在色差计算方面的性能表现,选择了基于人眼对颜色感知建立的Lab颜色空间(L明度,a红绿色差,b蓝黄色差),Lab颜色空间可以表示人眼所能感受到的所有颜色 31。在进行预处理后,建立从量化的红绿蓝(RGB)空间到量化的Lab空间之间的映射,其后对于腐蚀图像的处理皆在Lab空间进行。图1为铜片腐蚀识别方法的流程图。其中P为输入的数字图像,X,为图像提取的主要颜
15、色,ym为核主成分分析(KPCA)降维的最终结果2.1颜色特征提取2.1.1提取主要颜色一般来说,参与识别的颜色区间的数目越多,识别模型对颜色的分辨能力就越强。然而,将图像所36钱企豪,等:基于颜色特征的半监督聚类算法在铜片腐蚀等级识别中的应用提取主要颜色X获取图像P统计颜色直方图提取颜色特征ymKPCA降维设置为聚类中心计算核矩阵赋予数据标签半监督k-means聚类核矩阵中心化高计算特征值判断预测与特征向量结果置信度计算确定求得主成分欧氏距离腐蚀级别确定训练模型图1腐蚀等级识别方法流程图Fig.1Flowchart of corrosion level identification meth
16、od有颜色输入分类模型会增加计算负担,不利于批量处理数据。本工作遍历图像像素点,通过统计颜色直方图计算图像中出现的主要颜色。颜色直方图可通过计算每个颜色区间内数字图像的像素数量得到 32 。统计颜色直方图需要将颜色空间划分成若干个小的颜色区间,根据这些区间设定颜色直方图的组距,该过程称为颜色量化 33。颜色量化方法有许多,例如向量量化、聚类方法或者神经网络。本工作采用的是最为常用的聚类方法,即将颜色空间的各个分量(维度)进行均匀的划分。2.1.2 KPCA降维尽管通过颜色直方图获取了图像主要颜色,然而每个颜色由三个分量组成,其产生的颜色特征维数仍然较高,不利于后续算法处理。由于提取的部分特征量
17、彼此存在相关性,因此可以通过主成分分析提取数据集中线性无关的变量进行数据降维处理,以此反映样本整体的特征,减低数据处理难度 34。改进的KPCA可以应用于线性不可分的数据集,且几乎适用于所有非监督或监督非线性分类问题 35KPCA的原理如下:样本X是nXd的矩阵,即X=(x,x 2,,x a)”,通过核函数把样本矩阵X映射到高维的特征空间,使数据线性可分。使用高斯核心近似方程改造协方差矩阵来计算核心近似矩阵K,核心近似矩阵的元素计算方法如式(1)所示。K=k(;,a,)=exp(-Il a;-a,I2)(1)式中:为核函数超参数。对特征空间中的核心近似矩阵进行中心化处理,计算公式见式(2)。K
18、=K-KAn(2)式中:A,为nXn元素全为1/n的矩阵。将式(2)代入核矩阵计算公式,得到简化后的计算公式,见式(3)。K=KKT=K-A,K-KA,+A,KA,(3)K为对称矩阵,其特征向量可构成整个输入空间。根据式(4)计算矩阵K的特征向量与特征值入m,则KPCA的第m个主成分可表示为ym,见式(5)入ma=Kam(4)Nym=2a.k:(5)=12.2半监督k-means聚类半监督学习的假设是利用现有训练数据得到的模型,对无标签数据进行预测,置信度高的数据则可能被正确赋予标签,所以可以加入训练集。聚类是指对物理或抽象对象的集合进行相似度度量并将彼此相似的集合划分到簇中的过程。聚类方法中
19、,k-means模型应用较广且运算速度较快,该模型将数据分为不同的类别,假设同一类别中的数据相似 36 。本工作也采用半监督k-means聚类算法判断采集的未标记数字图像与标准比色卡间的相似度。数字图像样本间的相似度大多通过计算彼此特37钱企豪,等:基于颜色特征的半监督聚类算法在铜片腐蚀等级识别中的应用征向量的欧式距离得到 37 ,欧式距离公式如式(6)所示。d(u,u)=Z(u:-:)2(6)基于这个假设,将数据间欧氏距离尽可能短的数据划分为一个类别,从而将数据聚为k类。将从标准比色卡采集得到的颜色特征向量设置为半监督k-means的初始聚类中心,聚类个数为类别数目13。其后输人模型的腐蚀图
20、像颜色特征向量经逐步判断与初始聚类中心的相似程度后,被划分到最相似的聚类中心的簇中。通过半监督k-means聚类算法分类后,该图像的颜色特征向量将被输人模型和原有的聚类中心一起生成新的聚类中心。3腐蚀图像获取3.1试验方法制备一系列尺寸为7 5mm12.5mm3mm,纯度高于9 9.9%的电解铜铜片试样,用粒径65m碳化硅砂纸将其打磨,并使用分析纯正庚烷洗净。将每份试样缓慢放人装有PAO8基础油的试管中,开口塞上软木塞。设定KD-R1093润滑油铜片腐蚀测定器的加热温度为150,待仪器温度达到设定温度时,将试管放人仪器的试管槽中。一定时间后,关闭仪器并取出铜片,冷却至室温,再用正庚烷洗涤并用滤
21、纸吸干后拍摄图像 38 ,见图2。图2 腐蚀后铜片Fig.2Copper sheets after corrosion3.2图像预处理3.2.1尺寸归一化由于截取图像中待识别区域时产生了误差,获取的腐蚀图像大小分布不均,各种尺寸皆有分布。为了便于后续图像颜色对比,以标准比色卡图像尺寸为标定,对图像进行尺寸归一化处理。综合考虑运算量和图像细节,样本数据归一化尺寸为10 2 12(像素点)。3.2.2色彩滤波利用数字图像识别腐蚀时,由于拍摄环境和拍摄技术可能会造成数据异常,因而在进行具体处理前对图像的色彩空间进行归一化处理,去除光照与阴影的影响 39 。噪声通常会在数字图像当中引起较强视觉效果的孤
22、立像素点或像素块,给图像带来干扰,掩盖图像信息L40对腐蚀图像进行中值滤波 41,即采用一个33的二维滑动窗口对图像进行采样,图像中每一个像素点的灰度值用窗口内各点的中值代替,从而消除孤立的噪声点的影响。由于本工作中采集到的是彩色图像,每个像素点分别有三个灰度分量,故要在窗口内分别找到这三个分量的中值,再用这三个中值去代替窗口中心像素点的三个灰度分量值。对收集的腐蚀图像进行尺寸归一化、滤波处理后得到(10 2,12,3)的像素张量,即10 2 12 尺寸的彩色图像,每张图像的像素由三个通道表示。本工作取各颜色图像总共150 幅,作为训练样本,结合13幅铜片腐蚀等级标准比色卡,共采集了16 3幅
23、图像的特征数据作为测试样本用于后续分类。4结果分析提取主要颜色时,将直方图组距设置为32,该组距能够表达图像中大部分像素的颜色。对于铜片腐蚀识别来说,非常精细的颜色空间划分方法不一定能够提高检索效果。为了有效减少直方图组距的数目,只选用那些数值大即像素数目多的组距来构造图像特征。结果表明,由于忽略了那些数值较小的组距,颜色直方图对噪声的敏感程度降低,检索效果更好。运用算法统计图像的颜色直方图,再通过颜色直方图提取每张图像最主要的10 个颜色,将其转化为(10,3)的颜色张量。运用KPCA对提取的颜色张量进行降维处理,提取图像颜色特征,将得到的样品图片的颜色特征向量输入训练模型。运用KPCA进行
24、特征提取时,主要使用主成分代替原有相关量的方法,而只有当主成分的方差累计贡献率达到8 5%以上时,各主成分涵盖的信息才可以概括原变量的信息。因此,在通过KPCA处理计算颜色信息各主成分方差累计贡献率前,先将13种标准的颜色张量由(10,3)转化为(130)的矩阵,结果如图3所示。数据选取既要去除余信息又要涵盖原数据全部关键信息,根据贡献率计算结果,选取8 个主成38钱企豪,等:基于颜色特征的半监督聚类算法在铜片腐蚀等级识别中的应用100累计贡献率80604020012345678910主成分图3数字图像主成分方差累计贡献率Fig.3Cumulative contribution rate of
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 颜色 特征 监督 算法 铜片 腐蚀 等级 识别 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。