1、第 35 卷第 3 期湖南文理学院学报(自然科学版)Vol.35 No.32023 年 9 月Journal of Hunan University of Arts and Science(Science and Technology)Sep.2023doi:10.3969/j.issn.16726146.2023.03.014基于主成分分析的卷接机组运行状态评价研究王国兴,黄刚,孙小明(山东中烟工业有限责任公司青州卷烟厂,山东 青州,262500)摘要:在对卷接机组运行状态传统评价方法研究的基础上,创新性提出主成分分析和 K 均值聚类分析法用以分析卷接机组设备状态评价。以 4 组 ZJ112
2、 型卷接机组为研究对象,结合机组运行效率、停机频次、产量、停机时间等7 项关键指标,借助于数据软件完成主成分分析,依据主成分分析得到数值进行K均值聚类分析。结果表明,该方法可以将卷接机组运行状态划分为 6 类,能够准确区分 4 台卷接机组在给定时间段内的运行状态,为设备管理人员更加精准掌控卷接机组运行状态特点、制定有效设备管理和维保措施提供决策依据。同时,为卷接设备状态评价研究提供了新思路、新方法,具有一定的借鉴意义。关键词:卷接机组;评价状态;主成分分析;K 均值聚类分析中图分类号:TS 44+3文献标志码:A文章编号:16726146(2023)03007505Research on op
3、eration state evaluation of cigarette units based on principal componentanalysisWang Guoxing,Huang Gang,Sun Xiaoming(Qingzhou Cigarette Factory of Shandong Zhongyan Industry Co.,Ltd.,QingZhou 262500,China)Abstract:Based on the research on traditional transmission evaluation method of the running sta
4、te of cigarette units,this paper innovatively proposed principal component analysis and Kmeans clustering analysis method to analyzethe status evaluation of cigarette units.Four ZJ112 cigarette units were taken as the research object,and seven keyindicators such as operating efficiency,stop frequenc
5、y,output and stop time were combined.the principal componentanalysis was completed with the help of data software,and based on the principal component analysis values wereobtained for Kmeans clustering analysis.The results show that this method can divide the running state of thecigarette units into
6、 six categories,and can accurately distinguish the running state of 4 coiling units within a givenperiod of time,which provides a decision basis for equipment managers to more accurately control the running statecharacteristics of the cigarette units and formulate effective equipment management and
7、maintenance measures.Atthe same time,it also provides a new idea and method for the status evaluation research of the cigarette units.It hascertain reference significance.Key words:cigarette unit equipment;state of evaluation;principal component analysis;Kmeans clustering analysis卷接机械设备的运行状态评价是烟草工业企
8、业设备管理的核心,对于卷烟制造企业来说,设备运行状态评价还处于发展阶段。当前,绝大多数企业使用设备运行效率进行设备运行管理评价,即计算效率值(实际产量与理论产量比值),值越大,认为设备运行效率越好。自精益管理在中国推广应用以来,越来越多的生产制造企业将平均修复时间 MTTR(Mean Time To Repair)和平均故障间隔时间 MTBF(Mean Time Between Failures)引入到设备管理评价中,作为衡量设备运行稳定的重要指标12,直到通信作者:黄刚,。收稿日期:20230117基金项目:山东中烟科技项目(202219)。76湖南文理学院学报(自然科学版)2023 年20
9、21年烟草行业借鉴TPM(Total Productive Maintenance)中的设备综合运行效率OEE(Overall EquipmentEffectiveness)作为评价卷烟企业生产效率和设备运行状态的标准,并制定了相应的测评准则34。在设备状态评价过程中运用各种算法的研究虽然较早,但是并没有很深入,在 2010 年全志军等人5通过将影响卷接设备质量的各种因素综合考虑,使用模糊综合评价方法,构建了评判卷烟机械质量水平的新方法。2016 年朱子玉等人6通过层次分析法(Analytic Hierarchy Process 简称 AHP)建立自动化评价模型,构建设备健康在线评价方式。20
10、18 年许佩7对卷烟机械设备从维修、保养及检测 3 个方面进行研究,尝试将故障诊断技术应用于卷烟包装等设备故障分析中,这些研究为卷接设备的综合运行评价提供了探索和实践。随着两化融合的快速发展,更多的企业试图在卷接生产设备上加装各种传感器用来监控设备的运行状态,比如在振动部件上安装振动监测传感器或加装相应温度传感器等,利用专用软件对检测到的信号进行时域和频域分析,对设备运行状态进行评价,进而找到异常点,实现预警,为设备预防性维护提供参考,但是,由于当前存在技术难点等客观条件的限制,进展较为缓慢。在现有烟草行业卷接设备评价中,大多数评价方法只是针对卷接设备自身的运行效率作为主要评价指标,由于卷烟生
11、产过程较为复杂,可统计的分析变量较多,如何从卷接设备运行过程中提取数据,对卷接设备进行聚类分析,为设备状态评价和分析提供更加有效的信息至关重要,但是,在卷烟工业企业中利用各项运行数据进行设备运行状态评价的研究鲜有报道,本文研究的目标是在前人研究的基础上,对卷接机组生产运行管理过程中所涉及到的多项检测指标进行主成分分析(Principal Component Analysis),将多项运行指标降维为少数几个独立的主成分,再使用 K 均值聚类法从数据中发现规律,为设备运行状态评价提供一套更加实用、高效、简洁的评价模式,从而为卷接机组设备运行评价提供更多的借鉴和参考。1方法和试验过程1.1主成分分析
12、法主成分分析是将多个指标简化为少数相互无关的综合指标的统计方法,这几个简化的指标可以大体上反映样本全部指标的变化89,同时,不减少或者只减少很小一部分原始数据所提供的信息。主成分分析中,将所分析的指标称为随机向量,观察值作为随机向量的样本,并且假设各样本间是独立的,设n个指标Xi=(xi1,xi2,xip),i=1,2,n,是p维随机向量,X=(X1,X2,Xn),并假定二阶矩阵存在,均值 E(X)=,协方差矩阵 D(X)=(ij),主成分是样本中变量的线性组合,线性组合的权数即为相应的单位特征向量中的元素,文献10中有详细说明,这里只给出计算步骤:(1)设有 n 组卷接设备,每组设备有 p
13、个运行观测指标,构成矩阵111212122212ppnnnpxxxxxxxxxX,其中 xij表示第 i 台卷接机组的第 j 个指标。(2)将样本中的数据进行标准化处理:jijijjxxys,11njijixxn,2211()njjijisxxn。通过数据处理,得到标准化矩阵()ijn pyY。(3)计算矩阵 Y 的相关系数矩阵111212122212pppppprrrrrrrrrR,其中111njkijikiry yn,j,k=1,2,p。(4)根据相关系数矩阵 R 的特征值,对值从大到小进行排序,12p0,对应i的特征向量T12(,),1,2,iiipiaaaip=aLL,并且满足条件T1
14、,0,ijijija a(5)确定相应的主成分,并计算主成分下的样本 Z,按照累计贡献率就可以得到样本的主成分分析第 3 期王国兴,等:基于主成分分析的卷接机组运行状态评价研究77矩阵为m()ijnzZ=。(6)可以得到主成分计算公式为1122=.,1,2,jjjpjpZa ya ya yjk+=L。其中,aij表示权重系数,将样本中的观察值的标准化数值 y1,y2,L,yp代入该公式,就可求得主成分的得分Zj。1.2K 均值聚类分析法早在 2011 年,Dong 等人11使用 K 均值(Kmeans)聚类法对船舶设备和系统进行了性能评价,将设备运行中的不确定性和一些客观参数纳入定量计算,计算
15、结果与轮船设备的运行情况相似度较高,因此,这一方法为卷接设备运行状态评价提供了良好的借鉴和参考。由于 K 均值聚类法与其他聚类方法相比具有思想简单,收敛高效等优点,自从1967年MacQueen12总结提出这一经典聚类算法,该方法就在众多的领域得到了广泛的应用和研究。K 均值聚类法可描述为,给定一个数据 k 以及一个具有 n 个样本的集合,在 n 个样本数据中,随机挑选初始聚类中心,再将样本中的其他数据划分到距离中心最近所属类别中,然后对划分的聚类簇重新计算聚类中心,直到达到设定的迭代次数或中心不再改变为止。该研究使用的 K 均值聚类分析中,定义标准函数的最小值函数公式为1(,)jkjjcJd
16、 xm,也称之为目标函数。其中,x是数据的全部属性值所构成的矢量,k 是聚类个数,m1,m2,mk是 k 个聚类中心对应的矢量,cj是聚类中心为 mj的聚类域,而聚类中心矢量的公式为1jjcjNmx,Nj为聚类域 cj中数据的个数。目标函数 J 代表 k 个聚类里的全部数据与其聚类中心 mj之间的误差平方和,其数值越小,表明聚类的数据的聚类程度越好,得到的聚类效果越好13。2应用实例2.1数据来源和处理该研究拟选择国产 4 台 ZJ112 型高速卷接机组(额定生产速度 10 000 支/min,中国烟草总公司常德烟机生产制造)进行数据收集分析,选取 2022 年 10 月份共 25 个工作日
17、4 台机组每天的总废烟量、日产量、百万支剔除废品数、日停机总次数、百万支停机率、机组运行效率以及停机时间 7 项指标共 100组数据进行主成分分析,其中需要单独说明的是,机组运行效率是由“实际产量/理论产量”计算得出,故可将产量项与运行效率项合并分析,减少所选择的指标,通过 K 均值聚类分析法进行分析研究。2.2主成分分析采用 Minitab 分析软件对数据进行分析,结果见表 1。由表 1 可知,卷接机组运行状态指标之间存在相关关系,相关系数在0.3520.879 之间变化。对标准化后的数据进行 PCA 分析,表 2 是相关矩阵的特征值,前 2 个主成分的方差累计贡献率为 75.6%,达到要求
18、的 70.0%80.0%14,因此,选取前 2 个主成分指标就可以代表设备运行状态的所有指标。表 3 所示为各主成分的特征向量值,根据特征向量计算主成分 1(PC1)和主成分 2(PC2)的数值(分别记为 Z1、Z2),如表 4 所示,用以 K 均值聚类分析。2.3K 均值聚类分析采用 K 均值聚类分析之前,根据 PC1 和 PC2 的数值 Z1、Z2进行散点图分析,如图 1,大体可以划分为 6 组,使用 K 均值聚类方法进行聚类分析,聚类分析后的结果如表 5 所示。表 1卷接机组运行状态指标的相关系数分析变量名废烟量/支产量/箱废品数/支停机次数/支百万停机率/%停机时间/s废烟量/支0.3
19、730.8340.4830.2550.168产量/箱0.3730.1770.0810.3520.500废品数/支0.8340.1770.4780.5010.108停机次数/支0.4830.0810.4780.8790.047百万率停机率/%0.2550.3520.5010.8790.249停机时间/s0.1680.5000.1080.0470.24978湖南文理学院学报(自然科学版)2023 年分类完成后,为验证机组设备运行状态分类是否合理,对这 6 类结果进行分析,结果如表 6 所示。为进一步分析各机组的运行状态对每一个机组的聚类进行划分,结果见表 7。根据 K 均值聚类分析和 PC1 和
20、PC2 的值 Z1、Z2,重新绘制聚类图,如图 2 所示。2.4结果分析上述分析结果表明,可将卷接机组运行状态划分为6类,通过对各聚类分组数据的平均值(详见表6)进行分析,可得划分结果的整体差异较大,符合实际。结合表 2 分析,主成分 1 与标准变化量的关系可以用线性组合表示为 Z1=0.444X1*0.062X2*+0.515X3*+0.521X4*+0.504X5*+0.093X6*。其中,Xi*(i=1,2,L,6)为标准变化后的值。X2*(机组产量)系数为负值,说明产量(效率)具有相关项的数值越大,PC1 的数值越小;而其它系数为正且相差不大,它们代表的是机组废品率、停机频次、停机时间
21、等,说明这些数表 2相关矩阵的特征分析主成分特征值比率/%累积/%PC12.734 145.6045.60PC21.802 030.0075.60PC30.879 314.7090.30PC40.552 49.2099.50PC50.024 20.4099.90PC60.008 00.10100.00表 3主成分的特征向量值主成分废烟量/支产量/箱废品数/支停机次数/次百万停机率/%停机时间/sPC10.4440.0620.5150.5210.5040.093PC20.4150.6550.0600.0250.2670.569PC30.3960.2140.5230.5180.4250.274PC
22、40.1160.5590.2090.1520.1190.770PC50.2200.4050.2350.5950.6150.015PC60.6420.2110.5990.2890.3180.000表 4卷接机组设备运行状态的 PC1 和 PC2 的值 Z1、Z2数据编号Z1Z2数据编号Z1Z213.675 8800.111 897971.491 2102.272 37022.267 3300.492 843981.312 3601.317 22032.861 1600.499 353991.993 4501.178 03040.134 3500.740 9261001.092 2803.395
23、750962.154 9502.359 450表 5聚类点群数名称观测值个数类内平方和到质心的平均距离到质心的最大距离聚类 167.5191.0331.515聚类 2136.3600.6211.353聚类 375.9510.8131.417聚类 41615.1980.9021.408聚类 53520.0080.6841.499聚类 6238.9320.5840.945表 6卷接机组运行状态的分类特征名称平均废烟量/支平均产量/支平均废品数/支平均停机次数/次平均百万停机率/%平均停机时间/s聚类 142 707.85 831 333.37 339.370.312.014 666.7聚类 238
24、 549.46 932 538.55 579.554.28.07 987.8聚类 322 205.04 819 571.44 730.848.710.329 267.3聚类 415 213.24 260 625.03 586.721.65.119 695.1聚类 529 392.77 051 257.14 167.339.85.77 937.2聚类 621 467.47 656 826.12 800.625.53.46 082.8图 1PC1 和 PC2 的数值散点图3 2 101234564321012Z1Z23 2 10123456Z1Z2图 2PC1 与 PC2 的 K 均值聚类分析散点
25、图聚类 1聚类 2聚类 3聚类 4聚类 5聚类 64321012第 3 期王国兴,等:基于主成分分析的卷接机组运行状态评价研究79值越大,PC1 的数值越大。主成分 2 与标准变化量的关系可以用线性组合表示为 Z2=0.041 5X1*0.655X2*0.06X3*0.025X4*+0.267X5*+0.596X6*。其中,Xi*(i=1,2,L,6)为标准变化后的值,且只有 X5*(百万停机率)和X6*(停机时间)的系数为正值,表明停机频率越高和停机时间越长 PC2 的数值越大;其它系数均为负值,表明其数据值越大,PC2 的数值越小。从表 6 中可以明显看出,不同聚类具有不同的数据特点,结合
26、表 7 以及卷接机组实际运行情况,可以将聚类的结果按照“优秀”、“较好”、“一般”、“不合格”、“开产、收尾”、“异常”情况划分,聚类 5 数据说明,该方法的准确性较高,结果如表 8 所示。通过 2022 年 10 月的数据表明,卷接机组运行状态可以按照 18#17#16#15#进行排序。表 9 为不同卷接机组的聚类结果百分比,由表9可知,4台生产机组设备运行状态18#机组最为稳定可靠,16#机组运行状态波动最大,停机或质量性维修时间较长,15#机组的运行整体较差。通过聚类分析,可以为设备运行状态评价提供精准定量分析。由表 6 可见,不同聚类差异较大,可以对设备的不同状态进行区分。这些数据可为
27、设备管理人员评估各机组每天、每周、每月运行状态提供更加精准可靠的分析基础,为设备的维护保养判定与维修人员的工作评价等提供了更加充分的决策依据。3结束语本文采用主成分分析和 K 均值聚类分析相结合的方法,对4台机组不同生产时间内卷接机组的运行数据进行了分析。与简单的产量判定和效率计算相比,该方法能够将多维数据进行降维处理,并将具有相同特点的设备运行状态数据聚集成一类,为设备管理人员更好地了解设备运行状态、维保管理机组设备、评定设备维保后状态、评定维修人员工作效果等提供更加有效的判定依据。并且通过聚类分析,可以帮助设备管理人员更好地把控生产过程中的异常信息,为设备维保计划提供决策依据,进而为提升设
28、备运行效能和管理效率提供一套高效的评价方法。参考文献:1马逢时,周暐,刘传冰.六西格玛管理统计指南M.北京:中国人民大学出版社,2007.2何祯.六西格玛管理(第三版)M.北京:中国人民大学出版社,2004.3全国烟草标准化技术委员会卷烟分技术委员会.卷烟工业企业设备综合效率测评导则:YC/T 5902021S.北京:中国质量标准出版传媒有限公司,2021.(下转第87页)表 8卷烟机组运行状态不同聚类定性划分表类别定性分析说明聚类 1不合格产量/运行效率较低,停机时间较长,废烟量、废烟率较高,存在大量产品质量造成的问题,分析存在质量性维修。聚类 2一般产量/运行效率能够达到要求,机组停机率和
29、废品率平均值较高,消耗较大。聚类 3异常产量/运行效率较低,但是废烟量和废烟率较低,且停机时间较长,分析存在异常停机维修情况。聚类 4开产、换牌、收尾产量/运行效率较差,但是机组停机时间和废品率等平均值都相对较少,且 4 台机组的聚类相差不大。聚类 5较好产量/运行效率较好达到良好,机组停机时间、废品量等平均值相对较低。聚类 6优秀产量/运行效率最高,机组停机率和废品率平均值较低。注:聚类 4 表明,在卷接机组实际生产过程中,通过对生产日期的追踪发现,不同机组当停机较长而重新开动时会因调整设备造成差异,以及因月末生产结束造成指标差异,同时也表明该方法能够有效区分设备运行中的异常情况。表 9不同
30、卷接机组的聚类结果百分比(%)机组不合格一般异常开产、换牌、收尾较好优秀15#8.028.08.012.044.00.016#8.016.012.016.036.012.017#4.08.08.020.032.028.018#4.00.00.016.028.052.0表 7不同卷接机组运行状态的聚类结果(个)机组聚类 1聚类 2聚类 3聚类 4聚类 5聚类 615#272311016#24349317#12258718#1004713第 3 期陈端吕,等:洞庭湖区生态系统服务价值与土地利用耦合关系研究87报,2022,37(5):1 1981 213.17 陈端吕,彭保发,熊建新.环洞庭湖区生
31、态经济系统的耦合特征研究J.地理科学,2013,33(11):1 3381 346.18 王兆峰,汤桂林.长株潭城市群旅游城镇化与生态系统服务价值耦合研究J.中南林业科技大学学报(社会科学版),2021,15(5):8897.(责任编校:郭冬生)4孙玉祥.浅谈烟草卷烟机械设备的管理与维护J.科学技术创新.2018,28(1):189190.5全志军,雷霖.卷烟机械质量水平的模糊综合评价方法J.工程技术.2010,65(3):810.6朱子玉,郭丽霞.卷烟工业企业设备健康状态评价体系研究J.研究与探索.2016.2,26(1):3437.7许佩.故障诊断技术在烟草机械中的应用J.价值工程.201
32、8,21(2):205206.8王文初,郭玉凤,刘锋等.基于主成分回归分析的环境因素与学生身高关系的研究J.湖南文理学院学报(自然科学版),2013,25(2):7883.9逄玉俊,柳明,李元.k 均值聚类分析在过程改进中的应用J.华中科技大学学报(自然科学版),2009,37(S1):245247.10 马逢时,吴诚鸥,蔡霞.基于 MINITAB 的现代实用统计(第 3 版)M.北京:中国人民大学出版社,2013.11 DONG L X,CHEN H.First International Conference on Transportation Informational and Safe
33、ty C.Wuhan:AmericanSociety of Civil Engineers,2011:2 4662 472.12 MACQUEEN J.Proceedings of the 5thBerkeley Symposium on Mathematical Statistics and Probability C.Berkeyey:University of California Press,1967:281297.13 SAHOO A K,ZUO M J,TIWARI M K,et al.A data clustering algorithm for stratified data partitioning in artificial neuralnetworkJ.Expert Systems withApplications,2012,39(8):7 0047 01414 万新宇,包为民,荆艳东,等.基于主成分分析的洪水相似性研究J.水电能源科学,2007,25(5):3639(责任编校:张艳燕)(上接第 79 页)