1、 年第 卷 月第 期机 械 科 学 与 技 术 :收稿日期:基金项目:国家自然科学基金项目(,)、陕西留学人员科技活动择优项目()及陕西省教育厅协同创新中心项目()作者简介:任胜杰(),硕士,研究方向为故障诊断和深度学习,通信作者:郭伟超,副教授,硕士生导师,博士,任胜杰,郭伟超,舒定真,等时频分析和深度学习相结合的滚动轴承故障诊断机械科学与技术,():时频分析和深度学习相结合的滚动轴承故障诊断任胜杰,郭伟超,舒定真,汤奥斐,高新勤,李言(西安理工大学 机械与精密仪器工程学院,西安)摘要:滚动轴承大量使用在旋转机械中,轴承的工况严重影响着机械设备的正常运行。为了提高轴承故障的诊断精度,本文提出
2、了一种时频分析和深度学习相结合的滚动轴承诊断方法。首先,分析了十种不同时频分析方法;其次,建立了深度学习的滚动轴承故障诊断模型,并利用迁移学习克服训练样本数量少的问题,通过对比分析,常数 变换(,)的准确率可达;最后,利用实验数据对所提方法的有效性和可靠性进行验证,分别评估了在不同负载和噪声情况下的识别精度,并与文献中的方法对比,证明所提方法在不同工作环境条件下都有较好的鲁棒性和较高的识别精度。关键词:滚动轴承;故障诊断;时频分析;深度学习;迁移学习中图分类号:.;.文献标志码:文章编号:(),(,):,(),:;滚动轴承作为旋转机械的核心部件,用于支撑旋转体在传动系统中传递扭矩和动力,其健康
3、状况会对机构的性能、稳定性和使用寿命产生严重的影响。避免因为轴承故障引起设备非正常运行最有效的方法是在设备运行过程中对轴承工作状态进行实时监控,及早发现故障,进行维护或更换。在对设备运行状态长期监测的过程中,通过对采集的信机 械 科 学 与 技 术第 卷:号进行处理和分析,提取时域、频域和时频域内的故障特征量,然后通过主成分分析、独立成分分析和判别分析等进行特征降维,去除无用和不敏感的信息而保留有用的特征信息,最后将提取的特征信息输入支持向量机、近邻算法、决策树、高斯混合模型和多特征决策树集成等分类器进行故障分类。这种方法广泛用于机械设备的故障识别领域,但是这种方法最大的缺点是人为干预比重太大
4、,对识别结果影响较大。而深度学习作为机器学习的一个分支,模仿人的分析、学习能力,可以直接处理图像、文本和声音等数据,不需要人为过多干预就能解决复杂的模式识别问题,近年来越来越多的应用于机械设备和机构的故障识别中,并取得了显著效果。如 等基于深度学习理论,使用离散小波变换进行特征提取,利用深度学习网络成功对齿轮箱的故障进行了识别;等提出了一种基于深度学习的轴承故障诊断方法,该方法使用预处理的 频谱图像作为人工神经网络(,)的输入,相比传统人工提取特征在准确率上有大幅度提升;等提出一种基于改进算法的新型分层学习速率自适应深度学习卷积神经网络。该方法在轴承故障类型和故障尺寸评估方面均取得较好的效果。
5、深度学习虽然无需手动选择相关特征,模型会在数据流经网络时自动完成特征提取和选择任务。但是从零开始搭建深度学习网络需要非常大的数据样本,对于少量故障样本学习能力不强;同时,整个训练过程包括复杂的网络搭建和超参数调节,这需要耗费大量的时间和设备资源。而迁移学习(,)能将某个领域内学习到的知识和模型应用到不同但是相关领域内的问题中。如 等利用迁移学习将源机器学习到的故障知识快速迁移到目标机器,成功对两个滚动轴承数据集进行实验,进一步验证了迁移学习可以应用于相似领域问题的求解。利用迁移学习的这个特性,可以利用已标识的数据来训练深度神经网络模型,然后把训练好的深度神经网络模型,应用于相似领域内问题的求解
6、。利用迁移学习相结合的深度神经网络模型不用从零开始训练,而只需要在预训练网络模型的基础上对新的样本进行训练,对网络参数进行微调,就可以方便、快捷地获得满意的识别效果。这为机器学习和深度学习模型的建立提供了一个新思路。如 等提出一种基于深度神经网络(,)的迁移学习故障诊断网络,将网络部分参数迁移至目标任务,与传统无迁移学习的神经网络进行对比,该方法可以在少量样本数据的前提下实现对早期轴承故障的有效诊断。通过以上应用,可以看出深度学习已经成功应用于故障诊断领域,并且取得了显著的成绩。但是目前在轴承故障诊断领域,影响深度学习广泛应用的最大障碍仍然是如何建立高精度的故障诊断模型,。针对这个问题本文提出
7、一种基于信号时频分析和深度学习相结合的方法来构建滚动轴承故障诊断模型,进而来提高滚动轴承故障诊断识别的准确率。首先,利用十种不同时频方法对轴承故障信号进行分析,获得对应的时频图;然后,通过 网络单独训练十种时频图,有效地对滚动轴承故障进行诊断,最高准确率可达;最后,通过与文献和文献对比,验证了本文模型具有更好的负载适应能力和抗噪性。时频分析 数据增强在实际故障识别应用中,通常存在实际采集的故障数据量不足的问题,导致故障诊断模型泛化性能不高。本文借鉴计算机视觉处理,利用重叠采样方法增加训练样本数量以提高模型泛化性能。具体方法如下:如图 所示,当采样频率为,采样时间为,则采样信号总长为 个数据点。
8、通过对训练样本重叠采样,若单个样本的长度取 个数据点,设定移动步长为,根据式()计算出获得的训练样本数量为 个。()式中:为样本数量;为采样信号长度;为单个样本信号长度;为每次移动步长。图 利用重叠采样进行数据增强 十种不同时频分析方法不同的时频图像对故障的表现程度不一样,会直接影响轴承故障模型的分类精度。因此,选择合适的时频分析方法对轴承故障诊断具有重要意义。本文采用的 种不同的时频分析方法如表 所示。第 期 任胜杰,等:时频分析和深度学习相结合的滚动轴承故障诊断:表 采用的十种时频分析方法序号时频分析方法简写连续一维小波变换采用 窗的短时傅里叶变换采用 窗的短时傅里叶变换常数 变换 变换傅
9、立叶同步压缩变换 分布估计瞬时频率可视化光谱峰度持久功率谱对表 中的 种时频分析方法简要介绍如下。)连续小波变换可以为非周期信号提供最佳分辨结果,而且没有泄露效应。连续小波变换(,)计算公式为(,)()()式中:为尺度;()为原始信号;为平移量;()为母小波。)短时傅里叶变换对信号加滑动窗,并对信号做傅里叶变换,得到时变频谱。信号()可以通过指数形式表示为()()()()式中:()、()分别为信号的幅度和相位。再通过一阶泰勒公式展开,则信号()转化为()()()()()()对()进行短时傅里叶变换,那么有(,)()()()()式中()为窗函数,本文采用 和 两种窗函数。将式()代入式()中得信
10、号的时变频谱为(,)()()()()()()()()()()()()()()()()()常数 变换在低频处有较好的分辨率。信号的常数 变换 表达式为()()()()式中:()为长度为 的窗函数;为 变换中的常数因子;为 谱的频率序号。)变换共包含两部分:第一部分是经验模态分解();第二部分是 谱分析。通过 分解,信号()表示为()()()()式中:为循环次数;()为第 个 分量;()为残余分量。再对 分解的信号进行 谱分析,又得()()()式中()为信号()的 变换。)傅里叶同步压缩变换可以获得清晰的频谱估计。信号经过傅里叶同步压缩可表示为(,)(,)(,)()式中:(,)为信号的短时傅里叶变
11、换;(,)为信号的瞬时频率估计。)分布可以提取并跟踪时频脊,对时间和频率具有高分辨率特性,有助于区分相似的调制类型。信号 ()的 分布(,)可表示为(,)()式中:为频率;()()为信号()的瞬时自相关函数。)估计瞬时频率是信号随时间变化的重要参数,与信号中的频率均值有关。对式()求偏导可得估计瞬时频率(,)为:(,)()()()()()()()(,)()()(,)(,)(,)()可视化光谱峰度是一种 阶频谱分析,表征信号在不同窗口长度下的频域峰度变化。()(,)()()式中:()为正交频谱增量;(,)为信号()在频率 的复数包络。则信号()的可视化光谱峰度()可表示为()(,)(,)()持久
12、功率谱()可以通过公式()提取信号的余晖频谱得到。()()()机 械 科 学 与 技 术第 卷:式中:()是()的傅里叶变换,其中()为功率信号()在时间段,上的表示。利用上述 种时频分析方法对如图)所示的故障信号进行处理,得到对应的不同时频图,如图)图)所示。图 故障信号和对应 种不同时频图 滚动轴承诊断模型的构建 深度卷积神经网络 神经网络模型是学者 于 年提出的一种深度卷积神经网络模型。该模型主要包含 个卷积层和 个全连接层,其中卷积层主要的功能是挖掘二维数据中的深层特征,而全连接层是依据挖掘的深层特征实现数据的分类。该网络的优势在于通过引入 函数、和数据增强技术减少过拟合。卷积神经网络
13、的核心组件是卷积层,它可以从输入图像中提取特征。如图 所示,卷积核 从输入图像的左上角开始,每次向右移动 个步幅,卷积核 中的每个参数分别乘以卷积窗口 和 中的参数,将相乘的值相加分别得到 和,作为下一层的输入。一开始卷积核的参数是随机生成的,并在训练过程中不断更新。图 卷积计算池化层是卷积神经网络的另一核心组件,池化层不仅可以模仿人的视觉对特征图进行降维,简化网络计算的复杂度,而且还能用更高层次的特征表示特征图。在本文使用的 模型中,采用最大池化,其工作原理如图 所示。池化核从输入层的左上角开始,每次向右移动 个步幅,不同于卷积层的计算方式,池化层直接计算池化窗口 和 的最大值,作为下一层的
14、输入。图 最大池化示例 迁移学习迁移学习能够将在先前任务中学到的知识和能力应用到新任务中。它的核心思想是从一个或多个源任务中提取特征,从而运用到其它相关的目标任第 期 任胜杰,等:时频分析和深度学习相结合的滚动轴承故障诊断:务,其原理为,()式中:和 分别为源模型和目标模型的数据样本;、和 分别为数据集、标签和分布情况;下标 和 分别为迁移深度学习中的源域和目标域。在迁移过程中,预训练模型前 层参数被迁移至新的任务,目标域模型的后 层参数使用新任务的数据训练,过程为。(:)(:),(:)(:)(),(:),(:)()式中:(:)为目标域模型的所有权重参数。在目标域模型训练过程中,前 层的全部权
15、重参数(:)保持不变,后 层全部权重参数(:)根据新数据集训练优化。贝叶斯超参数优化训练神经网络需要指定网络架构和超参数。选择和 调 整 超 参 数 需 要 大 量 时 间。贝 叶 斯 优 化()是一种非常适合分类和回归模型的自适应超参数优化方法。论文使用贝叶斯优化学习率()、随机梯度下降动量()和 正则化强度 个超参数。目标函数选择训练集的误差率,然后通过测试集数据选择最终模型,以估计模型的泛化误差。其训练时间为.,优化过程如图 所示。可以看出,函数在计算步数为 时,观测值和估计值相等且最小目标值为,因此,函数在第 次计算结果最优。此时,个超参数分别取.、.和.,使模型达到最优。图 贝叶斯参
16、数优化过程 滚动轴承故障诊断模型基于不同时频分析的深度迁移学习的滚动轴承故障诊断流程如图 所示。图 滚动轴承故障诊断流程 )信号采样的原则是保留至少一个转动周期的振动信息,采样长度为()式中:为每段信号所包含的采样点数;为电机转速;为采样频率,。经计算,。)将步骤)预处理后的时域数据利用表 中的时频分析处理,得到十种不同的时频图像,采用随机角度旋转、翻转、尺度变换和平移等对图像进行数据增强,然后将信号转化为 的 时频图像数据集。)构建特征迁移模块,加载 预训练网络,对网络前半部分冻结,后半部分网络进行微调,完成特征迁移模块的构建。)将进一步预处理后的时频图像数据集按照 进行拆分,用于训练,用于测试,同时添加相应标签,并打乱图像训练集。)将训练集和验证集送入经过微调的网络进行迁移学习训练,同时利用贝叶斯对 个超参数进行优化,进而获得 种不同时频分析的滚动轴承故障模型。)利用步骤)中得到的滚动轴承故障诊断模型,分别对测试集进行识别,得到轴承的健康状态情况,进而对滚动轴承进行维修或更换。机 械 科 学 与 技 术第 卷:实验验证本论文使用的滚动轴承实验数据来源于美国凯斯西楚大学()电气工程实