1、 年第 卷 月第 期机 械 科 学 与 技 术 :收稿日期:基金项目:江西省重点研发计划项目()作者简介:杨云(),高级实验师,研究方向为故障诊断、检测技术及自动化,杨云,丁磊,张昊宇改进一维卷积神经网络与双向门控循环单元的轴承故障诊断研究机械科学与技术,():改进一维卷积神经网络与双向门控循环单元的轴承故障诊断研究杨云,丁磊,张昊宇(华东交通大学 电气与自动化工程学院,南昌)摘要:针对传统智能故障诊断依赖于人工经验进行特征提取和传统卷积神经网络(,)参数过多、训练量过大且无法充分利用时间序列信息的缺点,提出一种基于改进一维卷积神经网络与双向门控循环单元的深度学习新算法。首先,该方法利用一维卷
2、积神经网络自提取能力进行特征提取,同时设计了一个全局均值池化层替换传统卷积神经网络的全连接层,减少参数数量;其次,引入双向门控循环单元学习特征信号中的时间序列关系;最后,通过支持向量机替换传统 中的 层进行故障分类,进一步提高诊断的准确率。实验表明,该方法将诊断的准确率提升至,并且加快了诊断的速度。通过与其他方法的对比,证明了该方法有着更高的准确率,更快的诊断速度,更好的鲁棒性。关键词:轴承故障诊断;卷积神经网络;双向门控循环单元;支持向量机中图分类号:;文献标志码:文章编号:(),(,):(,),:;滚动轴承是旋转器械的关键组成部分,它的状态是否正常直接决定了整个旋转机械的运行状况。由于滚动
3、轴承长时间的在复杂多变的负载下高速的旋转,常常因为冲击交变载荷、热疲劳和机械磨损等影响而发生各种各样的故障。一旦故障发生,将第 期 杨云,等:改进一维卷积神经网络与双向门控循环单元的轴承故障诊断研究:会造成重大的事故。带来极大经济损失,更有可能引发安全危机。因此准确且及时的诊断出轴承的问题显得尤为的重要。近年随着计算机技术和传感器技术的不断发展,机械设备故障诊断领域进入“大数据”时代,基于数据驱动的智能故障诊断方法以及逐步成为故障诊断领域的主流应用。轴承故障诊断的实质是模式识别,包括信号采集,特征提取与特征选择和状态识别,其中特征提取与特征选择尤为重要,其效果的好坏直接影响到模式识别的成败。目
4、前常用的特 征 提 取 方 法 包 括 小 波 变 换 法(,)、傅 里 叶 变 换 法(,)、经 验 模 态 分 解 法(,)和集合经验模态分解等。特征选择是研究如何从大量的特征参数中挑选出那这些对识别最为有效的特征,从而降低特征空间的维数并提高故障识别率。特征选择包括两步:)特征评价;)阈值确定。其中阈值确定尤为重要。常用的特征选择的方法包括:主元分析法(,)及其变形方法等。最后将提取出来的特征输入到诸如支持向量机(,)、()神经网络和邻近算法等故障分类器中去进行模式识别,通过反复的迭代训练最终输出分类结果。以上的方法虽然能够实现故障诊断,但是其特征提取操作简单,而且需要大量的专家经验十分
5、依赖人工,这就导致其提取能力有限无法实现泛化。就目前来看,基于浅层网络的学习方法已经无法满足当前的“大数据”时代下故障诊断的需求。自从 年,文献提出了深度学习理论,深度学习的浪潮随之而来。大量的深度学习的算法与模型已经被广泛的应用于图像识别,语音识别,计算机视觉等领域。深度学习是通过模仿人脑的学习方式,构建深层网络模型,加之利用“大数据”训练模型,而获得数据中隐含的特征,是一种特征提取与模式识别为一体的智能模型。卷积神经网络是深度学习的重要分支之一。因其独特的卷积结构、优秀的特征提取能力和较好的泛化能力,已经被广泛的应用于机械故障诊断。宫文峰等提出了一种改进 的方法,将全局均值池化技术代替传统
6、 的全连接层部分,并运用数据增强、等深度学习训练技巧防止模型过拟合,以实现滚动轴承数据的快速智能诊断。肖雄等提出一种基于二维灰度图及辅助分类生成对抗网络的数据增强方法,减少了网络训练参数量,提高了故障识别准确率及网络训练速度。孙洁娣等提出了一种深度卷积神经网络与长短期记忆网络(,)相结合的智能故障诊断方法,利用卷积神经网络优秀的特征提取能力和长短期记忆网络学习特征中的时间依赖关系实现了高精准度的轴承故障诊断。但长短期记忆网络()有着结构复杂,导致收敛速度较慢的缺点。门控循环单元(,)是 的一种变体,在保证了准确性的同时优化了 的结构,提高了收敛速度。应用在轴承故障诊断方面能取得更好的效果。网络
7、只能考虑先前轴承的状态对某一时刻故障诊断的影响,而轴承故障诊断不仅仅由先前的状态所决定,未来的状态也与故障诊断因素相关联。并且 无法充分提取轴承故障特征数据之间存在潜在关联性的缺点。针对上述方法存在的不足,本文提出一种基于改进卷积神经网络()、双向门控循环单元(,)与支持向量机()相混合的轴承故障诊断的方法。记为改进。该方法具有时间和空间的特征表达能力,能够更为充分的利用一维振动信号的序列信息并挖掘隐藏的时间信息。本文采用该方法建立模型,以原始的一维振动信号作为输入,通过改进 自适应的提取特征信息;采用 充分利用信号间的序列关系获取更多的信息;通过 进行故障诊断,获得更加准确地结果。基础理论
8、卷积神经网络卷积神经网络是一种包含卷积计算且具有深度结构的前馈型神经网络,是深度学习的代表性网络之一。卷积神经网络具有表征学习能力和监督学习能力,因此相较传统的智能算法有着更加强大的特征提取能力。经典的卷积神经网络包括卷积层、池化层、全连接层和 层,其具体原理如图 所示。图 卷积神经网络基本结构 卷积层卷积层是卷积神经网络的核心,包括卷积和激机 械 科 学 与 技 术第 卷:励操作。使用卷积核对输入图像上所有的像素点历经一遍,将输出图像加上一个偏置后,用激励函数进行非线性变换,得到特征图像。卷积层运行的数学表达式为 ()()式中:为第 层卷积层;为第 层的输出;为第 个卷积核的偏置;为第 层的
9、输入;()为激活函数;为权重。在 中激活函数包括、和 等,其中(),有着方向传播是避免梯度消失、缓解过拟合的发生、加快收敛速度和提高准确性等优点,本文选择 作为激活函数。池化层池化层的主要目的是降维,减少网络中的参数,防止过拟合。同时还能突出提取特征。常用的池化层包括最大池化层()和平均池化层()。本文采用最大池化层表达式为()()()式中:为最大池化层;为第 个像素;为取最大值。全连接层和 层输入的图像经过多个卷积层和池化层处理后,成为一维特征向量。通过全连接层和 层进行分类。全连接层和 层计算过程为()()式中:为第 的输入;为第 层的输出;为第 层的权重系数;为第 层的偏置系数;全连接层
10、为隐含层时;()为激活函数;全连接为输出层时;()为 函数。改进卷积神经网络为了能对轴承故障进行快速的诊断,本文采用全局均值池化层(,)替换传统卷积神经网络中的全连接层。最后一个卷积层后面接入全局均值池化层,将减少卷积神经网络中以上的参数,提高诊断的速度,防止过拟合的发生。全局均值池化层与平均池化层的操作类似。不同于以窗口的形式进行均值的提取,是对整个特征图进行全局平均值的提取,使得每个分类在特征图中的联系更为明显。并且因为参数的减少更有利于后面 对数据进行分类。双向门控循环单元模型循环神经网络(,)是一类以序列数据作为输入,在序列的演进方向进行递归且所有节点按链式连接的递归神经网络。由于经典
11、的 模型无法解决长时依赖和梯度消失问题,学者提出了长短期记忆网络,通过门函数控制历史数据,具有时间处理能力。包括遗忘门、输入门和输出门。门控循环单元()近年来,针对 存在结构复杂、参数多、收敛速度慢等问题。提出门控循环单元(),是 衍生出的一种变体,能够更好地捕捉序列中时间步距离较大的依赖关系。由更新门和重置门组成,由于更新门替换了 的遗忘门和输入门。因此在保持了 长期记忆的特点的同时,简化了结构,减少了参数,加快了收敛的速度。结构图如图 所示。图 结构图首先,表示更新门,它决定当前状态 会从先前状态 中继承多少信息,以及会从候选状态中获取多少新的信息。更新门 值越大,代表从前状态 继承的数据
12、越多。计算过程为()()接下来,表示重置门,它用来控制候选状态的技术是否取决于先前状态。重置门值越小,代表从先前状态获取的值越少。计算过程为()()候选状态 的表达式为()()先前状态 的表达式为 ()()式()式()中:为 函数,输出区间为,输出“”表示完全保留,“”表示完全遗忘;为双曲正切函数,输出区间,;为偏置参数;为权重系数;为 函数,对应元素相乘的积。第 期 杨云,等:改进一维卷积神经网络与双向门控循环单元的轴承故障诊断研究:双向门控循环单元()故障信息在卷积神经网络中都是按照序列从前往后单相传播,然而某一时刻的故障的故障信息不仅与先前的信息有关,也和未来的信息有关。传统的 网络只能
13、学习过去的信息对故障诊断的影响,无法学习未来的信息。因此本文采用双向门控循环单元(),在结构上相当于与两个方法相反的 的组合。在 的网络中,输入时会提供两个方法相反的,输出也是由这两个 共同决定。使用 不仅能够学习过去信息对故障诊断的影响,也可以学习未来的信息的影响,更有利于提取故障之间更深层次的特征联系,进一步提高诊断的准确性,其具体原理如图 所示。图 结构图其中前向传输隐藏层 表达式为 ()后向传输隐藏层 表达式为 ()输出 表达式为 ()式()式()中:为 时刻的输入;为 时刻的输出;为前向传输隐藏层的权重;为后向传输隐藏层的权重;为 输出的偏置量。支持向量机()支持向量机是由 等提出的
14、建立在统计学基础上有着严谨数学推导的二分类模型,通过统计学理论中的结构最小原理和 维理论构造最优决策函数解决二分类问题。相比传统 中采用的 层进行分类,在小样本条件下有着更好的鲁棒性和更好的分类性能。因此本文将双向门控循环单元输出的特征信号作为 的输入数据,通过使用核函数和软间隔的方法,在高维空间中寻找到最优软间隔最大超平面,完成故障分类。的数学表达式为:,()|()式中:为优化的参数;()为非线性变换,将样本映射到高维空间;为惩罚系数;为偏移量;为松弛变量。本文采用作为核函数,构建的分类函数表达式为:()|,|()式中:为核函数宽度参数;为拉格朗日乘子。改进 轴承故障诊断的模型设计本文针对传
15、统智能轴承故障诊断的局限性、卷积神经网络对动态时间数据利用不充分及 分类器只是将数据进行符合概率分布的简单,无法进一步提升诊断的准确性等问题,提出 网络模型用于轴承故障诊断。该网络包括:两个卷积层,两个池化层,一个,一个全局均值池化层,一个全连接层和多分类 组成,结构图如图 所示。图 改进 模型结构图机 械 科 学 与 技 术第 卷:上述模型由、网络和 组成,能够学习原始数据中深层次的特征信息、动态时间信息和更好的进行特征分类。首先,将一维振动信号输入改进 进行特征提取。其次,将特征信号输入 中,进行时间序列上的进一步学习。最后,将数据输入 中进行特征分类。故障诊断具体流程图如图 所示。图 故
16、障诊断流程图故障诊断步骤如下:)信号采集。获取滚动轴承的振动信号,将不同状态的振动数据分割成相同长度的时间序列信号,并分为训练集和测试集输入到模型之中。)特征提取。通过一维卷积神经网络强大的特征提取能力对输入的原始信号进行特征提取,无需依赖人工经验的进行特征提取。相比于采用传统的,本文提出采用全局均值池化层替代传统 的全连接层,减少了参数、加快了诊断速度。)时间序列。将 网络输出的特征信号输入 中进行学习,滚动轴承振动信号具有一定的周期性而且正、反信号传递的信息不尽相同,能够通过学习双向信号的内在特征,进一步提升故障诊断的准确性。)故障检测。将 输出的数据通过注意力机制的选择,输入到 中进行特征分类。相比在 中常用于分类的 层,鲁棒性更强,分类效果更好。实验结果与分析 实验数据简介本文采用的数据集是美国凯斯西储大学提供的轴承数据集。西储大学的测试设备包含一个电机,一个耦合器和其他设备。加速度计用于收集不同故障类型的信号。驱动端轴承()加速计沿垂直方向安装在 壳体上,本文主要采用驱动端轴承故障诊断的数据,其故障采样频率为 。共计 种故障类型:外圈故障、内圈故障、滚动故障,每种故障有着 种