基于最大信息系数和深度残差...卷积的工业过程故障诊断方法_任佳.pdf
《基于最大信息系数和深度残差...卷积的工业过程故障诊断方法_任佳.pdf》由会员分享,可在线阅读,更多相关《基于最大信息系数和深度残差...卷积的工业过程故障诊断方法_任佳.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 37 卷第 1 期 高 校 化 学 工 程 学 报 No.1 Vol.37 2023 年 2 月 Journal of Chemical Engineering of Chinese Universities Feb.2023 文章编号:1003-9015(2023)01-0111-09 基于最大信息系数和深度残差图卷积的工业过程故障诊断方法 任 佳1,3,孙思宇1,鲍 克2(1.浙江理工大学 信息科学与工程学院,浙江 杭州 310018;2.浙江省电子信息产品检验研究院,浙江 杭州 310007;3.中国计量大学 浙江省智能制造质量大数据溯源与应用重点实验室,浙江 杭州 310018)摘
2、 要:针对工业数据非线性、时变性、时空特征耦合的特点,提出一种基于最大信息系数和残差图卷积网络的工业过程故障诊断算法(MIC-RGCN)。引入最大信息系数(MIC)挖掘变量之间的相关关系,将高维变量之间的相关信息转换为空间距离信息,构建相关性矩阵作为图卷积层的邻接矩阵输入;构建改进的深度残差图卷积网络(GCN)模型对数据的时空特征进行深度融合提取并精准分类。在田纳西-伊斯曼过程和三相流过程数据集上将该算法与 4 种典型机器学习和深度学习算法进行对比测试。实验结果表明,该算法有效地提升了故障诊断的准确率。关键词:故障诊断;最大信息系数;图卷积网络;田纳西-伊斯曼过程;三相流过程 中图分类号:TP
3、277 文献标志码:A DOI:10.3969/j.issn.1003-9015.2023.01.014 Fault diagnosis method in industrial processes based on maximal information coefficient and depth residual graph convolution REN Jia1,3,SUN Si-yu1,BAO Ke2(1.School of Information Science and Engineering,Zhejiang Sci-Tech University,Hangzhou 310018
4、,China;2.Zhejiang Electronic Information Products Inspection and Research Institute,Hangzhou 310007,China;3.Key Laboratory of Intelligent Manufacturing Quality Big Data Tracing and Analysis of Zhejiang Province,China Jiliang University,Hangzhou 310018,China)Abstract:Aiming at the nonlinear,time-vary
5、ing,and spatiotemporal characteristics of industrial data,a fault diagnosis algorithm(MIC-RGCN)for industrial processes was proposed based on maximal information coefficient and residual graph convolutional network.The maximal information coefficient(MIC)was introduced to mine the correlation betwee
6、n variables,the correlation information between high-dimensional variables was converted into spatial distance information,so as to construct a correlation matrix as the adjacency matrix of graph convolutional layers.An improved deep residual graph convolutional network(GCN)was designed to perform d
7、eep fusion extraction and accurate classification of the spatiotemporal features in data.The algorithm was compared with four typical machine learning and deep learning algorithms on Tennessee Eastman process and three-phase flow process datasets.The results showed that the algorithm improves the ac
8、curacy of fault diagnosis effectively.Key words:fault diagnosis;maximal information coefficient(MIC);graph convolutional network(GCN);Tennessee Eastman process;three-phase flow process 1 前 言 近年来,随着工业生产设备不断向大型化、自动化、智能化方向发展,设备的安全稳定运行变得愈 收稿日期:2021-12-14;修订日期:2022-04-11。基金项目:国家自然科学基金(51876194);浙江省公益技术研究
9、项目(LGG20F030007);浙江省电子信息产品检验研究院(浙江省信息安全重点实验室)开放课题;浙江省智能制造质量大数据溯源与应用重点实验室开放课题(ZNZZSZ-CJLU2022-01)。作者简介:任佳(1977-),女,浙江杭州人,浙江理工大学副教授,博士。通信联系人:鲍克,E-mail: 引用本文:任佳,孙思宇,鲍克.基于最大信息系数和深度残差图卷积的工业过程故障诊断方法 J.高校化学工程学报,2023,37(1):111-119.Citation:REN Jia,SUN Si-yu,BAO Ke.Fault diagnosis method in industrial proces
10、ses based on maximal information coefficient and depth residual graph convolution J.Journal of Chemical Engineering of Chinese Universities,2023,37(1):111-119.112 高 校 化 学 工 程 学 报 2023年2月 图 1 MIC-RGCN 算法的整体结构 Fig.1 Framework of the MIC-RGCN algorithm Deep residual GCN model Data preprocessing and pre
11、sentation Classification layers GCN layers 01000101101000100|Sliding window MIC Fault 发重要:生产过程一旦发生事故,轻则对产品质量和生产效率造成不良影响,重则造成非常严重的人员伤亡和财产损失1。因此,研发安全高效的故障检测和诊断方法一直是该领域关注的热点2。根据不同的建模方式,可以将故障诊断方法分为机理建模3-5、知识驱动建模6-7和数据驱动建模8-9三大类。机理建模和知识驱动建模需要大量的先验知识和工业背景知识,较难直接应用于复杂工业过程。随着工业过程数据储备的日益丰富和人工智能技术的迅猛发展,基于数据驱动
12、的故障诊断算法受到越来越多的关注10-11,数据驱动建模基于过程历史数据进行模型构建与参数学习。常用的数据驱动建模方法有主成分分析12、支持向量机13、人工神经网络14等。这些浅层的数据驱动建模方法在故障诊断中取得了不错的成果,但对于高维非线性数据的特征提取效果有限。近年来,深度学习在许多领域表现出强大的性能,因此越来越多的专家学者将深度学习应用工业过程故障诊断中15-17。深度学习通过堆叠多层的非线性函数映射层来挖掘数据的深层关系,从而实现更高层、更抽象的数据表达18。深度学习的兴起使时空序列的研究取得了进一步的发展,现有时空序列算法主要从序列生成模型和空间关系建模 2 个角度并行发展。序列
13、生成模型以循环神经网络(recurrent neural network,RNN)为基础,并在 RNN 基础上提出了长短期记忆单元(long short-term memory,LSTM)19和门控循环单元(gated recurrent unit,GRU)20。空间关系建模以卷积神经网络(convolutional neural network,CNN)21为基础,在此基础上提出了处理非欧几里得关系的图神经网络(graph neural network,GNN)22、图卷积网络(graph convolutional network,GCN)等图分析方法。通过将序列模型和空间模型相结合构建时
14、空融合模型可以很好地解决时空序列问题。Shi等23提出了一种卷积 LSTM,将 CNN 和 LSTM 相结合,有效地解决了 LSTM 的数据冗余问题。随后,为了更好地捕捉时空相关性,提出了轨迹 GRU24。Yu 等25提出的时空图卷积网络和 Guo 等26提出的基于注意力机制的时空图卷积网络将图卷积和时间卷积相结合,在时空序列预测中取得了很好的效果。现有时空序列算法的输入通常为图像序列或具有空间距离关系的物理变量。但是工业过程变量之间的相关关系更为复杂,因此现有算法无法直接推广应用到工业过程故障诊断中,如何找到准确衡量变量之间相关性的表示方法至关重要。针对此问题,本研究提出一种基于最大信息系数
15、和残差图卷积网络(maximal information coefficient-residual graph convolutional network,MIC-RGCN)的工业过程故障诊断方法。采用基于最大信息系数的图邻接矩阵生成方法,实现对不同类型变量之间空间关系的提取,有效地解决了工业过程变量之间的相关性难以表示的问题;提出改进的深度残差图卷积模型,该模型能够自动提取、深度挖掘数据的时空融合特征,并精准分类,有效地提高了故障识别的准确率。2 MIC-RGCN 算法实现 MIC-RGCN 算法的整体结构如图 1 所示,由数据预处理及邻接矩阵构建和深度残差图卷积模型 2 部分组成。数据预处
16、理及表示部分包括样本数据标准化处理和邻接矩阵的获取。深度残差图卷积模型部分引入图卷积网络对数据的时空信息进行融合提取,引入残差结构提升模型的学习能力和传播能力,通过分类网络对提取的特征进行分类,最终输出故障类别。2.1 数据预处理及表示 2.1.1 数据预处理 本步骤对原始故障数据进行标准化、移动滑窗截取,以产生用于模型的训练和测试数据。给定数据集1N TDataR,其中,R 为实数集合,N为变量数,T为数据的时序长度。首先按照式(1)对其进行标准化处理,使不同尺度的变量处于同一数量级。第 37 卷第 1 期 任佳等:基于最大信息系数和深度残差图卷积的工业过程故障诊断方法 113 *11s=D
17、ataData (1)式中:为数据的均值,s为数据的方差,*1Data为归一化的1Data。然后用宽度为t,步长为 1 的移动窗口沿时序方向进行滑动截取,得到1Tt+组N t结构的数据集121,iT tXx xxx+=,其中,N tixR,1,2,1iTt=+。2.1.2 基于最大信息系数的邻接矩阵构建 互信息(mutual information,MI)是信息论中一种用来度量变量间相互信赖性的手段。设 2 个随机变量(,)X Y的联合分布为(,)p x y,边缘分布分别为()p x、()p y,则随机变量(,)X Y的互信息(;)I X Y为联合分布(,)p x y与边缘分布()p x、()
18、p y的相对熵,其公式为 2(,)(;)(,)logd d()()p x yI X Yp x yx yp x p y=(2)最大信息系数27(maximal information coefficient,MIC)于 2011 年提出,以信息论和互信息为基础,可以衡量 2 个变量之间线性或非线性的关联程度,相较互信息拥有更高的准确度。当拥有足够的统计样本时,MIC 可以捕获更为广泛的关系,而不限定特定的函数类型(如线性、指数型、周期型等)。对于相同噪声水平的函数关系或非函数关系,MIC 具有近似的值。所以 MIC 不仅可以用来纵向比较同一相关关系的强度,还可以用来横向比较不同关系的强度。对于连
19、续变量,MIC 的计算方法如下:将随机变量(,)X Y的取值分别依序划分至a和b个格子中,得到a行b列的a b的网格划分,使落在第(,)x y个格子的数据点的频率作为(,)p x y的估计,落在第x行的数据点的频率作为()p x的估计,落在第y列的数据点的频率作为()p y的估计,然后根据式(2)计算(,)X Y的互信息。遍历给定范围内不同的a b网格划分,得到其中互信息的最大值即为随机变量(,)X Y的最大信息系数。其计算如式(3)所示,MIC 的计算实例如图 2 所示,从图中可以看出 MIC 能很好地识别变量之间的非线性关系,且能够抵抗噪声干扰,对于明显的非线性关系,MIC 值接近 1。2
20、(;)MIC(;)maxlog(min(,)a b BI X YX Ya b=(3)式中:a、b 为网格的划分数量;B为网格上限,通常取0.6Bn=,n为样本数量。本步骤基于正常工况数据依次进行两两变量间的 MIC 值计算,最终得到所有变量之间相关程度的MIC 矩阵表示,计算过程如下:Step 1:数据截取:给定正常工况数据集2N TDataR,对其进行标准化处理,然后选取l长度的时序数据,得到数据集N lSR。其中,12,iNSs sss=,lis R,1,2,iN=。Step 2:MIC 值计算:依次选取数据集S中的 2 条时序数据,ijs sS,利用式(3)计算 2 条数据之间的MIC
21、值。Step 3:邻接矩阵计算:对数据集S中所有N个变量,按照 Step 2 两两之间进行 MIC 值计算,可得图 2 MIC 计算实例 Fig.2 Examples of MIC y=sin(x)MIC=1.0 y=sin(x)+3 MIC=0.6 is random noise.y=sin(x)+MIC=0.9 is random noise.02-22YX02-22YX02-22YX Y Y Y X X X 114 高 校 化 学 工 程 学 报 2023年2月 图 3 深度残差图卷积模型结构 Fig.3 Model structure of deep residual graph co
22、nvolution Input Adjacency matrix X A ReLU ReLU ReLU Output Softmax Global pooling Fault GCN+BN GCN+BN GCN+BN Conv Conv Dense Dense Dense Dropout 到对称的NN矩阵。在此基础上,为了减少低相关性变量可能造成的干扰,经过验证比对法选择一个合适的阈值,将矩阵中小于的 MIC 值替换为 0,其他值保持不变。综上,通过上述步骤得到 MIC 矩阵N NAR,作为后续 GCN 层的邻接矩阵使用。2.2 深度残差图卷积模型及 GCN 实现 深度残差图卷积模型的内部结构
23、如图 3 所示,模型由 3 层 GCN 层,3 层归一化层(batch normalization layer,BN),2 层卷积层(convolutional layer,Conv),3 层全连接层(dense layer,Dense)和 1 层丢弃层(dropout layer,Dropout)组成。模型运行的过程如下:输入X为经过预处理的数据集,输入A为经过 MIC 计算得到的邻接矩阵;之后,采用 3 层 GCN+BN 网络对数据的时空特征进行提取,并选择线性整流函数(linear rectification function,ReLU)作为激活函数;接着,采用 2 层 Conv 网络对
24、特征进一步深度提取;然后,经过 3 层 Dense 网络,对特征进行更加细化的提取和分类;同时,加入 Dropout 层减少模型过拟合;最后,输出故障分类结果。下面对 GCN 的工作原理进行描述:GCN 由 Kipf 等28提出,它将深度学习的卷积应用图数据,为图结构数据的处理提供了一种崭新的思路。GCN 能够充分整合节点信息,同时根据邻居节点的信息实现对数据特征的嵌入,挖掘特征之间潜在的相关关系。基于上述特点,本研究尝试将 GCN 网络应用工业过程故障诊断模型中,文中所提出的深度残差图卷积模型引入 3 层 GCN 层进行信息提取,具体描述如下:GCN 的输入包括节点特征矩阵 X 和邻接矩阵
25、A,节点特征矩阵 X 为图网络中所有节点的特征集合,邻接矩阵 A 为图网络中所有节点之间的相关关系,每一层 GCN 可以用一个非线性函数表示,公式为 (1)()(,)LLHf H+=A (4)式中:()LH和(1)LH+分别为第L层和第1L+层的输出。GCN 模仿图像上的卷积操作,对邻接矩阵加入自循环得到新的邻接矩阵,并进行归一化,GCN 的计算公式为 ()()()1/21/2()()(,)LLLf HHW=+ADAI D (5)式中:I 为单位矩阵;D 是 A 的对角度矩阵,其对角线元素为 A 的行和,其余元素为 0;()LW为第L层的权重;为激活函数。因此可以得到深度残差图卷积模型中 3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 最大 信息 系数 深度 卷积 工业 过程 故障诊断 方法 任佳
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。