1、第 卷第期计算机集成制造系统 年月 :收稿日期:;修订日期:。;基金项目:国家自然科学基金资助项目();重庆市技术创新与应用示范专项资助项目()。:,(),()数据不完备下基于 的离心鼓风机故障趋势预测方法张友,李聪波,林利红,钱静,易茜(重庆大学 机械传动国家重点实验室,重庆 ;重庆大学 机械与运载工程学院,重庆 )摘要:离心鼓风机在运行过程中,监测数据缺失会导致故障趋势预测滞后和预测精度下降。针对该问题,提出一种考虑数据不完备的离心鼓风机故障趋势预测方法。首先,基于张量分解对缺失监测数据进行填补,获得离心鼓风机的完备监测数据;其次,基于填补后的完备监测数据利用深度置信网络()构建能表征离心
2、鼓风机健康状态的健康指标;最后使用 方法预测健康指标的未来走势,实现离心鼓风机的故障趋势预测。案例分析结果表明,相比缺失数据,利用填补后的数据所建立的预测模型能更早预测故障的发生,同时所提出的预测方法较 、长短时记忆()和门控循环单元()等常用传统方法预测精度更高。关键词:离心鼓风机;故障趋势预测;不完备数据;方法;张量分解中图分类号:文献标识码:,(,;,):,(),(),():;引言离心鼓风机作为典型的旋转机械,常用于建筑、化工、能源等现代工业领域,由于其结构复杂,零部件众多,加之运行在高温、高压、高负载等恶劣工况下,极易发生故障导致设备停机,如果不及时采取有效措施,将会造成重大经济损失甚
3、至人员伤亡,因此,对其关键零部件进行健康监测,开展离心鼓风计算机集成制造系统第 卷机的故障趋势预测研究,对提高其运行可靠性和安全性具有重要意义。随着传感器技术的发展,机械设备可获得的监测信息也越来越多,为采用数据驱动方法实现故障趋势预测奠定了基础。深度学习由于其强大的特征提取功能,在设备健康状态监测中得到了较好的应用,例如等使用递归神经网络(,)实现了轴承剩余使用寿命的预测;等提出一种基于改进卷积神经网络(,)和长短时记忆(,)的预测方法,有效挖掘了更深层次的健康信息。以上方法借鉴了深度学习强大的特征提取能力和数据拟合能力,在设备故障趋势预测问题上取得了一些成效,但这些方法在长序列预测时存在梯
4、度消失导致深层隐含特征提取不足的问题。针对此问题,等将注意力机制运用到门控循环单元(,),实现了涡扇发动机的寿命预测并提升了预测精度;等利用不同时刻的均方根作为健康指标,通过 预测健康指标的走势实现了轴承的寿命预测;等 利用多头概率稀疏自注意力机制改进了 模型,提高了网络模型的预测精度。以上方法所使用的数据均为完备数据,而机械设备在采集设备故障、运行环境异常和人为因素干扰等条件下往往会出现数据缺失,存在数据不完备问题。针对此问题,已有部分学者开展了相关研究,例如 等 提出一种基于感知 的不完备数据填补方法,并成功应用于发电量的预测并提高了预测性能;等 使用生成对抗网络(,)对缺失数据进行填补,
5、实现了加工能耗的精确预测;等 使用期望最大化方法处理缺失数据,实现了球管系统的故障诊断,相比不填补时诊断精度更高。上述文献表明,对存在缺失的数据进行填补修复,并利用这些填补数据开展相应的研究能显著提升模型的预测精度和鲁棒性。然而,缺失数据的填补研究在发电量预测、能耗预测以及故障诊断领域中应用较多,但在故障趋势预测研究中应用较少。监测数据完备可靠是保证设备故障趋势预测的重要前提,尤其是表征设备健康状态的一些关键退化数据缺失时,会使得设备故障预测结果不准甚至出现误判 。数据缺失是影响机械设备健康状态识别的重要因素,在监测数据不完备情况下,应先对原始缺失数据进行填补修复。因此,本文针对离心鼓风机实际
6、运行过程中的数据不完备问题,提出一种考虑数据不完备的离心鼓风机故障趋势预测方法。首先,使用张量分解方法对监测数据缺失值进行填补,得到完备的健康监测数据;然后,基于填补后的完备监测数据,利用深度置信网络(,)构建能表征离心鼓风机健康状态的健康指标(,);最后使用 方法预测健康指标的走势实现离心鼓风机的故障趋势预测。数据不完备下离心鼓风机故障趋势预测框架 问题描述传感器监测数据中蕴含丰富的设备健康信息,有效采集大量监测数据是深度学习方法实现故障趋势预测的前提。离心鼓风机数据采集框架如图所示,主要使用振动、温度、电流和压力传感器采集离心鼓风机的各类监测数据。在离心鼓风机实际运行过程中,由于传感器失灵
7、、脱落、老化甚至损坏以及数据接收系统通信过程发生故障等原因,经常会出现设备监测数据的缺失,这将丢失大量的有用信息,从而导致后续数据挖掘过程中获取的健康信息不足,增加了预测的不确定性。通过有效填补缺失数据,可以提高监测数据质量,进而保证离心鼓风机故障趋势预测的精度。现最常用的填补方法有直接删除空值法或用中位数、平均数和众数代替缺失值方法。由于离心鼓风机的监测数据与时间高度相关,数据前后关联性强,直接使用上述方法会破坏监测数据的连续性、准确性和趋势性,使得故障趋势预测精度不高甚至导致预测失败。因此,亟需一种能够将原始缺失监测数据进行高精度填补修复的方法,以提高离心鼓风机监测数据的质量和利用率,为后
8、续离心鼓风机故障趋势预测提供数据支撑。本文基于张量分解方法利用同时段下具有完备数据的离心鼓风机型号监测数据去填补存在缺失的离心鼓风机型号监测数据,而当数据缺失量过大时,已有的完备信息不足,数据间的相关性难以被挖掘,此时已无法对缺失数据进行有效填补。因此,本文所提出的不完备数据填补过程基于以下假设条件:实验总共获取种型号离心鼓风机的监测数据;同时段下只会出现一种型号离心鼓风机监测数据的缺失;第期张友 等:数据不完备下基于 的离心鼓风机故障趋势预测方法离心鼓风机监测数据缺失率在 以下。故障趋势预测框架针对离心鼓风机实际运行过程中的数据缺失问题,如图所示,提出一种考虑数据不完备的故障趋势预测框架,该
9、框架主要包括离心鼓风机监测数据获取、不完备数据填补、健康指标构建及故障趋势预测个部分。具体步骤如下:()离心鼓风机监测数据获取在离心鼓风机运行过程中,使用振动、温度、电流和压力传感器对离心鼓风机重要零部件进行监测,采集其运行过程中的各类监测信号并上传至服务器,为后续离心鼓风机故障趋势预测提供数据支撑。()不完备数据填补对于存在缺失的不完备监测数据,构建缺失数据的四维张量,用掩模张量标记构建四维张量的缺失位置,基于 分解填补修复不完备监测数据,实现缺失数据的填补,得到完备监测数据。()健康指标构建提取填补后完备监测数据的时域特征并进行归一化处理,选择退化趋势比较明显的特征作为 的输入,经前向预训
10、练和反向微调训练 网络模型,获得包含健康状态信息的深层健康特征,根据离心鼓风机正常和故障状态时的健康特征差异,构建出能够表征离心鼓风机实时健康状态的健康指标。()故障趋势预测将构建的健康指标 划分为训练集和测试集,作为预测模型 的输入,迭代训练 网络模型,得到离心鼓风机 的变化趋势,从而实现离心鼓风机的故障趋势预测。基于张量分解的不完备数据填补张量是向量和矩阵的多维推广,能最大程度保持数据的内在联系,张量分解方法在图像数据填补 和卫星遥感数据填补 等领域已得到了较好的应用。因此,本文基于张量分解方法对离心鼓风机的缺失数据进行填补。在利用张量分解方法进行离心鼓风机缺失数据填补时,需要运用同时段下
11、获得的完备监测数据来填补此时段的缺失数据。因此,本文共设置了种不同型号的离心鼓风机退化实验,利用同时段下其他型号离心鼓风机的完备监测数据来填补存在缺失的离心鼓风机型号监测数据,同时段下当两种及其以上型号的离心鼓风机监测数据出现缺失时,已有的完备离心鼓风机型号监测数据不足,无法充分挖掘数据之间的相关性,填补精度较差,甚至不能进行有效填补。此外,数据缺失长度也是影响监测数据填补的重要因素,填补精度会随着数据缺失长度的增加而下降,实验证明当数据缺失率(缺失数据长度与总数据长度的比值)超过 时,已无法进行有效填补。因此,本文基于张量分解方法对缺失监测数据进行填补修复设置的限制条件如下:实验总共获取种型
12、号离心鼓风机的监测数据;同时段下只会出现一种型号离心鼓风机监测数据的缺失;离心鼓风机监测数据缺失率在 以下。离心鼓风机监测数据张量构建离心鼓风机监测数据蕴含着大量表征设备健康状态的内在信息,将这些监测数据构建成张量可以充分地保留不同数据间的关联关系。根据离心鼓风机监测信息构建的四维张量如图所示,具体构建过程如下:首先,根据离心鼓风机型号的不同,将离心鼓风机的型号作为构建张量的第一维分量。其次,将获得的监测信号数据根据不同型号,按照时间序列分别分割为多个时窗,将分割时窗作为离心鼓风机监测数据张量的第二维分量。之后,由于小波分解能够将有用能量集中在少数小波系数上,具有信噪分离、滤波效果好和信号细节
13、损失少的优点,分别对各个时窗内的监测数据利用 小波进行多尺度分解,并将分解之后的小波系数、和作为离心鼓风机监测数据张量的第三维分量。最后,将时间作为第四维分量,从而构建出关于离心鼓风机监测数据的四维张量?。计算机集成制造系统第 卷 不完备数据填补假设有种型号的离心鼓风机传感器监测数据,则种离心鼓风机的监测数据可表示为,第种型号离心鼓风机的监测数据为,表示监测信号数据总长度,表示监测信号第个数据点,若该种型号离心鼓风机在第个到第个数据点出现缺失,即在,处数据值为空值,则第种型号离心鼓风机的缺失监测数据可表示为:缺,。()基于张量分解方法,可利用完备的离心鼓风机型号监测数据对存在缺失的离心鼓风机型
14、号监测数据进行填补,填补具体流程如下:()缺失监测数据张量构建将上述含有缺失第期张友 等:数据不完备下基于 的离心鼓风机故障趋势预测方法数据的监测信号构建为四维张量?,利用 分解将张量?分解为如下形式:?;,?。()式中:?为四维张量?经 分解后的核心张量,保留了张量?的内在相关信息;、与分别为 分解后关于离心鼓风机型号、时窗、小波系数与时间的因子矩阵。表示张量的模式矩阵积。一个维张量与矩阵的模式矩阵积为:(),。()()掩模张量构建将缺失监测数据构建的张量?中数据缺失位置设为值,数据未缺失位置设为,得到与张量?相同大小的张量?,张量?即为掩模张量,?的表达式如下:?,?值缺失;,?值未缺失。
15、()填补数据与缺失监测数据误差越小,即经过 分解后的值与四维张量?的误差越小,原始缺失数据填补精度越高,即使得如下关于核心张量?以及鼓风机型号、时窗、小波系数和时间的因子矩阵、和的目标函数最小:(?,)?(?)。()式中,?为离心鼓风机缺失监测数据四维张量的近似 分解,为 范数,矩阵 的 范数计算公式为。()初始化及迭代求解利用?进行高阶奇异值分解得到初始核心张量?及初始因子矩阵、和,再使用文献 中所述方法更新迭代式中?以及、和,得到最终、和?。()缺失数据填补利用得到的、和?重构缺失监测数据,从而获得修复数据四维张量?,实现离心鼓风机缺失监测数据的填补,重构公式如下:?。()最后,将修复后的
16、张量还原为原始数据,填补后的监测数据为:填,填,。()第种型号离心鼓风机缺失数据填补完成后的修复数据为填,?,?,式 中,?表 示 缺 失 数 据 点 处 填 补数据。基于 的离心鼓风机故障趋势预测方法 健康指标构建机械设备的健康状态主要采用健康指标()进行定量描述,构建一种能实时反映设备健康状态信息的健康指标是实现机械设备故障趋势预测的前提。作为一种无监督学习方法,避免了对先验知识的依赖,在时间序列数据的特征提取上具有优越的性能。离心鼓风机监测数据为时间序列数据,时间依赖性强,反映了离心鼓风机的实时运行状态,通过逐层训练能够充分获取离心鼓风机输入数据的隐含特征,挖掘监测数据的健康状态信息,并通过对网络结构的调整,能够实现对输入数据的特征提取和降维,获取能表征设备退化趋势的健康指标 。因此,本文利用 来构建能表征离心鼓风机健康状态的。如图所示为 构建健康指标流程,提取填补后离心鼓风机完备监测信息的时域特征,并选取具有明显退化趋势的时域特征,经归一化处理后作为 的输入,不断训练 并反向微调,获取能表征离心鼓风机退化趋势的深层健康特征,通过计算提取深层健康特征与初始健康特征的偏离程度从而得