1、第 37 卷第 1 期 高 校 化 学 工 程 学 报 No.1 Vol.37 2023 年 2 月 Journal of Chemical Engineering of Chinese Universities Feb.2023 文章编号:1003-9015(2023)01-0111-09 基于最大信息系数和深度残差图卷积的工业过程故障诊断方法 任 佳1,3,孙思宇1,鲍 克2(1.浙江理工大学 信息科学与工程学院,浙江 杭州 310018;2.浙江省电子信息产品检验研究院,浙江 杭州 310007;3.中国计量大学 浙江省智能制造质量大数据溯源与应用重点实验室,浙江 杭州 310018)摘
2、 要:针对工业数据非线性、时变性、时空特征耦合的特点,提出一种基于最大信息系数和残差图卷积网络的工业过程故障诊断算法(MIC-RGCN)。引入最大信息系数(MIC)挖掘变量之间的相关关系,将高维变量之间的相关信息转换为空间距离信息,构建相关性矩阵作为图卷积层的邻接矩阵输入;构建改进的深度残差图卷积网络(GCN)模型对数据的时空特征进行深度融合提取并精准分类。在田纳西-伊斯曼过程和三相流过程数据集上将该算法与 4 种典型机器学习和深度学习算法进行对比测试。实验结果表明,该算法有效地提升了故障诊断的准确率。关键词:故障诊断;最大信息系数;图卷积网络;田纳西-伊斯曼过程;三相流过程 中图分类号:TP
3、277 文献标志码:A DOI:10.3969/j.issn.1003-9015.2023.01.014 Fault diagnosis method in industrial processes based on maximal information coefficient and depth residual graph convolution REN Jia1,3,SUN Si-yu1,BAO Ke2(1.School of Information Science and Engineering,Zhejiang Sci-Tech University,Hangzhou 310018
4、,China;2.Zhejiang Electronic Information Products Inspection and Research Institute,Hangzhou 310007,China;3.Key Laboratory of Intelligent Manufacturing Quality Big Data Tracing and Analysis of Zhejiang Province,China Jiliang University,Hangzhou 310018,China)Abstract:Aiming at the nonlinear,time-vary
5、ing,and spatiotemporal characteristics of industrial data,a fault diagnosis algorithm(MIC-RGCN)for industrial processes was proposed based on maximal information coefficient and residual graph convolutional network.The maximal information coefficient(MIC)was introduced to mine the correlation betwee
6、n variables,the correlation information between high-dimensional variables was converted into spatial distance information,so as to construct a correlation matrix as the adjacency matrix of graph convolutional layers.An improved deep residual graph convolutional network(GCN)was designed to perform d
7、eep fusion extraction and accurate classification of the spatiotemporal features in data.The algorithm was compared with four typical machine learning and deep learning algorithms on Tennessee Eastman process and three-phase flow process datasets.The results showed that the algorithm improves the ac
8、curacy of fault diagnosis effectively.Key words:fault diagnosis;maximal information coefficient(MIC);graph convolutional network(GCN);Tennessee Eastman process;three-phase flow process 1 前 言 近年来,随着工业生产设备不断向大型化、自动化、智能化方向发展,设备的安全稳定运行变得愈 收稿日期:2021-12-14;修订日期:2022-04-11。基金项目:国家自然科学基金(51876194);浙江省公益技术研究
9、项目(LGG20F030007);浙江省电子信息产品检验研究院(浙江省信息安全重点实验室)开放课题;浙江省智能制造质量大数据溯源与应用重点实验室开放课题(ZNZZSZ-CJLU2022-01)。作者简介:任佳(1977-),女,浙江杭州人,浙江理工大学副教授,博士。通信联系人:鲍克,E-mail: 引用本文:任佳,孙思宇,鲍克.基于最大信息系数和深度残差图卷积的工业过程故障诊断方法 J.高校化学工程学报,2023,37(1):111-119.Citation:REN Jia,SUN Si-yu,BAO Ke.Fault diagnosis method in industrial proces
10、ses based on maximal information coefficient and depth residual graph convolution J.Journal of Chemical Engineering of Chinese Universities,2023,37(1):111-119.112 高 校 化 学 工 程 学 报 2023年2月 图 1 MIC-RGCN 算法的整体结构 Fig.1 Framework of the MIC-RGCN algorithm Deep residual GCN model Data preprocessing and pre
11、sentation Classification layers GCN layers 01000101101000100|Sliding window MIC Fault 发重要:生产过程一旦发生事故,轻则对产品质量和生产效率造成不良影响,重则造成非常严重的人员伤亡和财产损失1。因此,研发安全高效的故障检测和诊断方法一直是该领域关注的热点2。根据不同的建模方式,可以将故障诊断方法分为机理建模3-5、知识驱动建模6-7和数据驱动建模8-9三大类。机理建模和知识驱动建模需要大量的先验知识和工业背景知识,较难直接应用于复杂工业过程。随着工业过程数据储备的日益丰富和人工智能技术的迅猛发展,基于数据驱动
12、的故障诊断算法受到越来越多的关注10-11,数据驱动建模基于过程历史数据进行模型构建与参数学习。常用的数据驱动建模方法有主成分分析12、支持向量机13、人工神经网络14等。这些浅层的数据驱动建模方法在故障诊断中取得了不错的成果,但对于高维非线性数据的特征提取效果有限。近年来,深度学习在许多领域表现出强大的性能,因此越来越多的专家学者将深度学习应用工业过程故障诊断中15-17。深度学习通过堆叠多层的非线性函数映射层来挖掘数据的深层关系,从而实现更高层、更抽象的数据表达18。深度学习的兴起使时空序列的研究取得了进一步的发展,现有时空序列算法主要从序列生成模型和空间关系建模 2 个角度并行发展。序列
13、生成模型以循环神经网络(recurrent neural network,RNN)为基础,并在 RNN 基础上提出了长短期记忆单元(long short-term memory,LSTM)19和门控循环单元(gated recurrent unit,GRU)20。空间关系建模以卷积神经网络(convolutional neural network,CNN)21为基础,在此基础上提出了处理非欧几里得关系的图神经网络(graph neural network,GNN)22、图卷积网络(graph convolutional network,GCN)等图分析方法。通过将序列模型和空间模型相结合构建时
14、空融合模型可以很好地解决时空序列问题。Shi等23提出了一种卷积 LSTM,将 CNN 和 LSTM 相结合,有效地解决了 LSTM 的数据冗余问题。随后,为了更好地捕捉时空相关性,提出了轨迹 GRU24。Yu 等25提出的时空图卷积网络和 Guo 等26提出的基于注意力机制的时空图卷积网络将图卷积和时间卷积相结合,在时空序列预测中取得了很好的效果。现有时空序列算法的输入通常为图像序列或具有空间距离关系的物理变量。但是工业过程变量之间的相关关系更为复杂,因此现有算法无法直接推广应用到工业过程故障诊断中,如何找到准确衡量变量之间相关性的表示方法至关重要。针对此问题,本研究提出一种基于最大信息系数
15、和残差图卷积网络(maximal information coefficient-residual graph convolutional network,MIC-RGCN)的工业过程故障诊断方法。采用基于最大信息系数的图邻接矩阵生成方法,实现对不同类型变量之间空间关系的提取,有效地解决了工业过程变量之间的相关性难以表示的问题;提出改进的深度残差图卷积模型,该模型能够自动提取、深度挖掘数据的时空融合特征,并精准分类,有效地提高了故障识别的准确率。2 MIC-RGCN 算法实现 MIC-RGCN 算法的整体结构如图 1 所示,由数据预处理及邻接矩阵构建和深度残差图卷积模型 2 部分组成。数据预处
16、理及表示部分包括样本数据标准化处理和邻接矩阵的获取。深度残差图卷积模型部分引入图卷积网络对数据的时空信息进行融合提取,引入残差结构提升模型的学习能力和传播能力,通过分类网络对提取的特征进行分类,最终输出故障类别。2.1 数据预处理及表示 2.1.1 数据预处理 本步骤对原始故障数据进行标准化、移动滑窗截取,以产生用于模型的训练和测试数据。给定数据集1N TDataR,其中,R 为实数集合,N为变量数,T为数据的时序长度。首先按照式(1)对其进行标准化处理,使不同尺度的变量处于同一数量级。第 37 卷第 1 期 任佳等:基于最大信息系数和深度残差图卷积的工业过程故障诊断方法 113 *11s=DataData (1)式中:为数据的均值,s为数据的方差,*1Data为归一化的1Data。然后用宽度为t,步长为 1 的移动窗口沿时序方向进行滑动截取,得到1Tt+组N t结构的数据集121,iT tXx xxx+=,其中,N tixR,1,2,1iTt=+。2.1.2 基于最大信息系数的邻接矩阵构建 互信息(mutual information,MI)是信息论中一种用来度量变量间相互信赖性的手