1、第 40 卷第 3 期计算机应用与软件Vol.40 No 32023 年 3 月Computer Applications and SoftwareMar 2023基于数据对齐的生成性对抗网络轴承剩余寿命预测陈世红1陈荣军21(广东生态工程职业学院信息工程学院广东 广州 510520)2(广东技术师范大学计算机科学学院广东 广州 510665)收稿日期:2020 08 06。广东省普通高校特色创新类项目(2020KTSCX271)。陈世红,副教授,主研领域:物联网,大数据,深度学习。陈荣军,副教授。摘要针对传统智能数据驱动轴承剩余寿命预测中存在的首次预测时间确定难度大以及模型泛化能力差等问题,
2、提出一种基于数据对齐的生成性对抗网络轴承剩余寿命预测方法。生成性对抗网络用于了解健康状态数据的分布,依此建立健康指标来确定首次预测时间。为了弥合不同机器之间的数据分布差异,提出一种数据对齐策略来提取实体不变特征。进一步采用对抗训练,在健康状态和退化数据的学习子空间中实现数据对齐,将提取的广义特征表示用于预测轴承的剩余寿命。在两个轴承退化数据集上进行了对比实验,验证了该方法的有效性。关键词剩余使用寿命预测滚动轴承深度学习对抗训练数据对齐中图分类号TP3TH133 33文献标志码ADOI:10 3969/j issn 1000-386x 2023 03 019GENEATIVE ADVESAIAL
3、 NETWOKS PEDICTION OF EMAININGUSEFUL LIFE OF BEAING BASED ON DATA ALIGNMENTChen Shihong1Chen ongjun21(School of Information Engineering,Guangdong Eco-Engineering Polytechnic,Guangzhou 510520,Guangdong,China)2(School of Computer Science,Guangdong Polytechnic Normal University,Guangzhou 510665,Guangdo
4、ng,China)AbstractIn order to solve the problems existing in the traditional intelligent data-driven bearing remaining lifeprediction,such as the difficulty in determining the first prediction time and the poor generalization ability of the model,a generative network bearing remaining life prediction
5、 method based on data alignment is proposed Generative adversarynetwork was used to understand the distribution of health status data and establish health indicators to determine the firstprediction time In order to bridge the differences of data distribution among different machines,a data alignmen
6、tstrategy was proposed to extract entity invariant features The adversarial training was further used to realize the dataalignment in learning subspaces of health status data and degradation dataThe extracted generalized featurerepresentation was used to predict the remaining life of the bearing The
7、 comparison experiments were performed on twodegradation bearing datasets,which verified the effectiveness of the proposed methodKeywordsemaining useful life predictionolling bearingDeep learningAdversarial trainingData alignment0引言旋转机械的预测与健康管理在提高机械可靠性、降低维修成本和提高运行安全性等方面具有重要的意义1 2。在过去的几年里,机械设备的监控管理(P
8、rognostics Health Management,PHM)受到了越来越多的重视,特别是在先进制造产业,如汽车制造、航空航天工业等领域3 4。作为旋转机械中的关键部件之一,滚动轴承的剩余使用寿命(emaining Useful Life,UL)预测更是研究的重中之重5。在过去的几年中,轴承剩余寿命预测方法包括神经网络、支持向量机和神经模糊系统等数据驱动方法,因其易于实现、响应速度快和预测前景好等优点得到了广泛的发展,并取得了一系列研究成果6 8。梁昱等9 提出了一种多方位预测的集成深度学习方法,利114计算机应用与软件2023 年用 TI 和频域特征来构建轴承的健康指标。Pan 等10
9、提出了一种有效的机器健康状态估计方法,采用在线动态模糊神经网络,对轴承健康状况进行预测。另外,还有一种基于卷积神经网络的多尺度特征提取方法11,利用从振动数据中学习到的特征实现了轴承剩余寿命预测。尽管在数据驱动的预测方面取得了进展,但仍旧存在两个问题未被很好地解决:(1)首次预测时间(First Predicting Time,FPT)的确定。传统方法中将所收集的数据与剩余寿命值之间进行直接建模,其对应规则往往是时变的,因此失效初始时刻即首次预测时间的确定将对预测精度影响较大,但是该时间的确定仍主要依赖于峰度等常规特征,限制了预测精度的提升。(2)实体间的数据分布差异数据驱动方法的成功主要依赖
10、于训练和测试数据来自同一分布的假设。由于在轴承 UL 预测问题中,训练和测试数据是在不同条件下收集的。当机器的转速等工作条件相同时,轴承的故障往往是不同的。因此,不同轴承的退化行为不尽相同,导致实体间存在显著的数据分布差异。因此,限制了数据驱动模型的泛化能力。针对上述问题,本文研究并提出一种生成性对抗神经网络模型,用于数据驱动旋转机械轴承的 UL 预测。在两个旋转机械数据集进行了实验验证,数值结果表明,该方法相对于传统的数据驱动方法能够有效解决上述问题,并且实现精度较高的预测。1理论方法1 1问题描述假设 Mtrain个轴承运行到发生故障的振动数据可以用于模型训练,即假设轴承实体在早期工作期间
11、是健康的,在运行一定时间后,它们开始发生退化。从收集的顺序振动数据中准备数据样本,每个样本包含Dinput个数据点。令 xjinji=1Dinput,j=1,2,Mtrain表示训练数据集中属于第 j 个轴承实体的第 i 个样本,其中 nj是第 j 个轴承的顺序样本的数量。寿命预测的目的在于以样本 x 作为输入来学习健康指标函数 h=fHI(x)。输出 h 能够清楚地指示机械健康状况的变化,并且可以基于定义的阈值确定退化的首次预测时间。令 TjFPT表示第 j 个轴承的 FPT。其次,由于可以获得训练实体的 FPT,因此可以将每个轴承的运行到故障数据分为健康状态和退化状态。退化期间的剩余使用寿
12、命百分比可计算为:yji=nj inj TjFPT100%(1)式中:yji表示 xji在第 j 个轴承的第 i 时间步处的 UL 标签。因此所有处于退化状态的训练样本都可以贴上相应的标签,从而获得有监督的 UL 估计训练数据集。此外,还可以利用无监督的测试数据来增强模型的泛化能力12。虽然实验数据一般应视为未观察到,但无监督的数据通常易于收集,尤其是在轴承处于健康状态的早期运行时期13。合并无监督数据有助于提高模型泛化能力,并可以实现更好的预测性能。通过探索有监督的训练数据和无监督的测试数据,本文的主要目的是建立一个 UL 预测模型y=fUL(x),其中:y 是输入数据样本 x 的预测 UL
13、 值;x代表系统的状态监测数据,例如振动信号、电流数据和声发射等。y 是与时间相关的一般估计 UL 值,其单位可以在特定的应用场景中适当确定,例如天、小时或分钟等。1 2对抗神经网络本文引入对抗神经网络进行预测,该模型首先用于生 成 对 抗 网 络(Generative Adversarial Networks,GAN)14。GAN 的目标是从随机噪声中生成现实的数据样本,生成器模块 G 用于将噪声 z 映射到样本 x。为了评估生成的数据 G(z)的质量,采用了判别模块D,该模块经过优化以区分真实样本和伪样本。然而,生成器参数的更新影响了判别器的工作,即生成不能被判别器区分的样本。因此通过两个
14、模块之间的对抗训练,生成器逐渐学习噪声和真实样本之间的基础映射函数 G。网络模型优化的损失函数可以表示为:minGmaxDEx pdata(x)logD(x)+Ez pz(z)log(1 D(G(z)(2)式中:pdata和 pz分别表示实际数据和噪声的分布。近年来,对抗训练从不同领域提取共享特征方面得到了进一步的发展15 16。与 GAN 方案类似,多个域的数据样本首先经过特征提取器模块以获得高级特征,这些特征通常携带有域偏向信息。随后采用域判别器模块,以高级特征为输入,并输出域分类结果。判别器旨在分离不同域的数据,而特征提取器则试图获得不容易分类的特征。通过对抗训练,特征提取器可以将不同域
15、的数据投影到同一区域,从而获得共享特征。2基于数据对齐的生成性对抗网络2 1总体介绍图 1 给出了本文方法的思路。首先,通过传感器第 3 期陈世红,等:基于数据对齐的生成性对抗网络轴承剩余寿命预测115测量机器的瞬时振动加速度数据。具体而言,假设将轴承整个生命周期的振动数据收集为训练数据集。在提出的框架中使用了两个训练阶段,即 FPT 确定和UL 估计。图 1本文预测方法概述通常,可以将处于早期的轴承视为处于健康状态,并使用深度神经网络模型来学习相应的数据分布。提出性能退化评估指标来显示机器的退化程度,从而可以在阶段 1 中确定第一个预测时间。然后,获得所有训练轴承的 FPT,将生命周期数据分
16、为机器健康状态和退化状态。可以计算出退化状态下轴承的剩余使用寿命,从而可以获取数据样本的UL 标签。第 1 阶段的深度神经网络针对 UL 预测的回归问题进一步扩展,并使用带有 UL 标签的有监督数据进行训练。此外,为了增强模型泛化能力,通过对抗训练将来自不同轴承的数据分布差异最小化。来自不同训练和测试轴承的健康状态数据被投影到学习的子空间中的同一区域中,并且各种训练轴承的退化数据也被映射到相同的区域。这样,可以提取不同轴承实体之间的共享特征,并可以大大提高测试数据的预测性能。2 2阶段 1:FPT 确定在阶段 1 中,确定轴承的 FPT,这对预测的准确性至关重要。如图 2 所示,在整个机器生命周期中收集数据之后,通常可以认为处于早期运行状态的轴承处于健康状态。假设在时间 t1和 t2的健康状况相似。但是,如果将 tFPT1不合适地设置为第一个预测时间,则会对它们进行不同的处理,从而导致无效的预测。相反,在这种情况下,tFPT2更适合作为 FPT。图 2机械振动数据中首次预测时间的图示采用深度生成对抗网络模型来学习所有训练轴承的健康状态数据的分布。通常,该网络旨在学习噪声向量 zDz与实