1、AUTO TIME 125 NEW ENERGY AUTOMOBILE|新能源汽车 时代汽车基于 LSTM 的燃料电池发动机寿命预测1数据采样1.1数据依托本文通过合作单位亿华通获取了多台同型号同批次的 YHTG60 氢燃料电池发动机数据的全生命周期数据集。亿华通自主研发的国产氢燃料电池系统,采用国产自主研发电堆,零下 30低温启动、零下 40低温存储;高度集成化、模块化设计,即插即用。亿华通的传感器数据采样间隔为 5 秒一条,每一条数据包含 260 多个数据指标。本文从 9 台装车运行的氢燃料电池系统的历史数据中提取从装车运行时刻开始,直到氢燃料电池系统从整车换下的时刻的全生命周期历史数据,
2、作为基础原始数据集。1.2数据集提取基于氢燃料电池发动机的衰减特性以及机理模式,依托于全生命周期基础数据集,本文构建了一个全新的氢燃料电池发动机寿命数据集。该数据集包含氢燃料电池发动机启动次数、运行时间、平均单片电压、最低单片电压、最高单片电压、燃料电池输出电流、变载次数、剩余寿命共 8 项指标。其中启动次数、运行时间、平均单片电压、最低单片电压、最高单片电压、燃料电池输出电流为基础原始数据集里直接包含的数据指标,变载次数则根据原始数据集中的燃料电池输出电流通过统计计算而来(一段时间内燃料电池输出电流变化的绝对值超过 80A 计为一次变载);燃料电池发动机剩余寿命根据运行时间计算而来(最大燃料
3、电池发动机运行时间减当前燃料电池发动机运行时间)。2算法描述2.1长短期记忆神经网络 LSTMLSTM 是在循环神经网络(RNN)的基础上改进演变而来,是一种特殊的 RNN 神经网络。RNN 的输入包括了两个:一个是当前时刻输入 xt,用于实时更新状态,另一个是上一时刻隐藏层的状态 ht-1,用于记忆状态,一个RNN就相当于一个神经网络的多个副本,每个副本都把自己收集到的信息传递给后继者。然而,由于 RNN 中每个时间片使用相同的权值矩阵,权值矩阵循环相乘导致会导致极端的非线性行为,产生梯度消失和梯度爆炸。LSTM在RNN的基础上,引入了遗忘门、输入门、输出门的多门机制用于控制特征的流通和损失
4、,用于解决 RNN 的梯度消失和梯度爆炸问题。遗忘门决定了要从上一个状态中舍弃什么信息,它输入上一状态的输出 ht-1、当前状态输入信息 xt 到一个 Sigmoid 函数中,产生一个介于 0 到 1 之间的数值,与上一个时刻的状态 ct-1 相乘之后来确定舍弃(保留)郭克珩1张璞2郝磊21.北京顺亿达运力科技集团有限公司北京市1001922.北京博瑞华通科技有限公司北京市100192摘 要:随着工业 4.0 和数据科学的发展,利用数据对氢燃料电池发动机剩余寿命进行预测,将有利于提前发现发动机性能退化问题,进而及时采取维护保养措施,对发动机安全运行以及延长发动机运行寿命至关重要。传统发动机寿命
5、预测一般基于机理模式的经验判断或者数理统计,但在氢燃料电池发动机这个技术尚不稳定成熟的发展阶段,传统手段无法保证相对较低的误差。本文在不依赖于机理模式的情况下,利用传感器收集的数据,基于神经网络深度学习的模式,构建一种基于数据驱动的长短期记忆神经网络(LSTM)的剩余寿命预测模型,通过机器的训练与学习,分析预测氢燃料电池发动机的寿命衰减情况,为预测性维护提供数据支持。关键词:氢燃料电池发动机长短期记忆神经网络寿命预测预测性维护Life Prediction of Fuel Cell Engine Base on LSTMGuo Keheng,Zhang Pu,Hao LeiAbstract:W
6、ith the development of Industry 4.0 and data science,using data to predict the remaining life of hydrogen fuel cell engine will help to detect the degradation of engine performance in advance,and then timely maintenance measures can be taken,which is very important for the safe operation of the engi
7、ne and the extension of the operating life of the engine.The traditional engine life prediction is generally based on the empirical judgment or mathematical statistics of the mechanism model,but in the development stage of hydrogen fuel cell engine,the technology is unstable and immature,and the tra
8、ditional means cannot guarantee the relatively low error.Without depending on the mechanism mode,this paper uses the data collected by sensors,and based on the model of neural network deep learning,the paper constructs a remaining life prediction model based on data-driven long short-term memory(LST
9、M).Through machine training and learning,the life decay of hydrogen fuel cell engine is studied,providing data support for predictive maintenance.Key words:fuel cell engine,long short-term memory neural network,life prediction,predictive maintenance126 AUTO TIMENEW ENERGY AUTOMOBILE|新能源汽车多少信息。0 表示“完
10、全舍弃”,1 表示“完全保留”,这个阶段完成了对上一个节点 cell state进行选择性忘记,如公式1,公式2所示。遗忘门 ft=(WfXt+ufht-1)(1)遗忘门输出 ftout=ftCt-1 (2)输入门则是对输入有选择性的“记忆”,它决定了要往当前状态中保存什么新的信息,它输入上一状态的输出 ht-1、当前输入信息xt 到一个 Sigmoid 函数中,产生一个介于 0到 1 之间的数值 it 来确定需要保留多少的新信息,如公式 3,公式 4,公式 5。输入门:it=(WiXt+uiht-1)(3)侯选新信息:Ct=tanh(WCXt+uCht-1)(4)新状态:Ct=ftCt-1+
11、Ctit (5)输出门决定了要从 cell state 中输出什么信息,先有一个 Sigmoid 函数产生一个介于0 到 1 之间的数值 Ot 来确定我们需要输出多少 cell state 中的信息。cell state 的信息在与Ot 相乘时首先会经过一个 tanh 层进行“激活”,得到的就是这个 LSTM block 的输出信息 ht。LSTM 各门的计算公示及输出如公式 6,公式 7 所示。遗忘门 Ot=(WOXt+uOht-1)(6)输出信息 ht=Ottanh(Ct)(7)3模型构建3.1数据预处理3.1.1数据过滤首先,基于上述的数据集,根据阈值范围对寿命数据集中的毛刺数据和非法数
12、据进行过滤,其中最大值为缺省表示对次不设限制,见表 1。表1数据过滤阈值指标最小值最大值启动次数0运行时间0平均单片电压01.2最低单片电压01.2最高单片电压01.2燃料电池输出电流0500变载次数0剩余寿命0其次,由于构建的数据集是时序上连续数据集,对于累计值出现跳变或者随时间增大而减小的数据,如启动次数、运行时间、变载次数用时序上连续的临近数据进行替换。3.1.2数据标准化由于数据集中不同指标的量纲、数据的量级存在差异,导致数据不具备可比性,为消除差异,通过数据标准化将原始指标数据按比例缩放,是不同单位或者量级的指标能够进行比较和加权。常用的标准化方法有min-max 标准化、z-sco
13、re 标准化方法。min-max 标准化也叫归一化,是对原始数据的线性变换,使结果落到 0,1 区间,如公式 8 所示:X=X-XminXmax-Xmin (8)z-score 标准化先减去平均值,然后除以方差(公式 9),其中为均值,为方差,从而使得结果的分布具备单位方差。X=X-(9)不同于最小最大标准化的是,z-score 标准化不将值绑定到特定范围,更好地保持样本的间距。当样本中有异常值时,归一化可能将正常的样本压缩到一起,使用梯度下降来训练模型时,模型需更长的时间才能收敛。本文采用 z-score 进行数据标准化处理。3.2LSTM 神经网络构建LSTM 的时序预测可分为单维单步、单
14、维多步、多维单步、多维多步预测。单维单步:输入输出是相同的单维度指标,使用前n步预测后一步,例如通过前n月(5月,6 月)的收入去预测 n+1 月(7 月)的收入,此处 n 为 2。单维多步:输入输出是相同单维度指标,使用前 n 步预测后 m 步,例如通过前 n 月的收入去预测后m月n+1,n+2,n+m的收入。多维单步:输入是多维指标,使用前 n步多维指标预测下一步的目标指标,例如通过前 n 月(5 月,6 月)的收入、购物支出、交通支出等去预测 n+1 月(7 月)的收入。多维多步:输入是多维指标,使用前 n步多维指标预测后 m 步目标指标,例如通过前 n 月的收入、购物支出等去预测后 m
15、 月n+1,n+2,n+m 的收入。本位采用多维多步方式,用氢燃料电池发动机过去两小时的启动次数、运行时间、平均单片电压、最低单片电压、最高单片电压、燃料电池输出电流、变载次数、剩余寿命共 8项指标数据预测未来 30 分钟发动机的剩余寿命。由于数据采样频率为 5 秒一条,2 小时为2*60*60=7200 秒,则 2 小时的时间步长换算为神经网络的输入步长为 7200/5=1440,半小时预测量为 0.5*60*60=1800 秒,预测步长为 1800/5=360,转换为多维多步即为用 8 维前 1440 步长的数据预测后 360 步长的剩余寿命。对后 360 步产的输出求中位数即为最终的输出
16、结果,即未来半小时的燃料电池发动机剩余寿命。本 文 的 LSTM 模 型 基 于 python3.8 和tensorflow1.4 构建,采用多层网络结构,由入到出依次为输入层、LSTM1 层、dropout1层、LSTM2 层、dropout2 层、全连接层、输出层构成。输入层是数据接入的入口,本文采用 2小时的时间步长,按照多维多步的训练模型,指标维度为 8,步长为 1440,网络批次输入的设置为为 128,因此输入层一次输入的数据维度为 128*1440*8 的 3 维矩阵。LSTM 层 是 LSTM 循 环 网 络 单 元,是LSTM 神经网络的核心层,该层实现了遗忘门、输入门、输出门的设计构想。dropout 层加入是为了防止模型过拟合。在模型训练过程中随机让网络某些神经元不工作,可以使得一个神经元的训练不严格依赖于另一个神经元,进而使得特征之间的协同作用减弱,可有效提高网络的泛化能力。全连接层则是负责将输出的 360 步长的数据求中位数,作为输出传递给输出层。输出层最终获取的是一个一维数据,即最终预测的剩余寿命。4寿命预测4.1评价指标神经网络根据目标的不同,一般可分为分类