1、安全生产Safety in Production 24城市燃气 2022/11 总第 573 期张锦玉1,2,陈小辉1,彭超龙3,寿纪斌11.上海航天能源股份有限公司;2.中南财经政法大学统计与数学学院;3.深圳市燃气集团股份有限公司基于VAE-LSTM的中低压燃气调压器异常检测无监督模型研究摘要:燃气调压器在燃气输配过程中起降压稳压的作用。目前行业多采用人工手段对调压器进行异常检测,不能提前预警故障隐患;通过智能手段检测通常需要人工标注数据做有监督处理,消耗大量时间和人力成本;VAE-LSTM混合无监督模型,不需要人工标注,实现异常的完全检出。其中VAE模型使用卷积层结构,通过缩小样本重构误
2、差来进行训练,检测出点异常和上下文异常;LSTM模型在VAE模型训练完成的基础上进行训练,采用滑动样本,通过缩小预测误差来训练,可以检测出集体异常。最后,将混合模型用于有标签的测试集,选择最好的阈值4.545 547预测样本的异常与否,该阈值对应的查准率、查全率和F1值分别为0.910 604、1.0和0.953 211,表明模型预测效果较好。关键词:中低压燃气调压器;VAE-LSTM无监督模型;异常检测doi:10.3969/j.issn.1671-5152.2022.11.0061 引言近年来燃气安全事故频繁发生,2021年6月13日湖北省十堰市发生燃气泄漏爆炸事故,造成25人死亡、138
3、人受伤。及时检测调压器运行状态关系到公众的生命财产安全1,若燃气调压器维护不当,则会出现调压器发生故障、寿命缩短甚至失效等问题,影响下游用户稳定用气,本文通过大数据分析与人工智能等技术的结合2,提出一种无监督的调压器异常检测技术,实现调压器实时在线异常检测,提升调压器的异常报警水平,同时降低维护成本。异常检测技术主要是用来判断设备是正常工作状态还是异常状态。冯良3等人运用Simulink计算不同弹簧刚度、初始压缩量等两种调压器的动态响应曲线,根据该曲线分析调压器稳定性与实际情况相符。安小然4使用EMD算法将调压器出口压力分解为能量矩,输入支持向量机安全预警模型,最终得到的预测结果准确率达到76
4、%。目前燃气调压器异常检测技术仍存在一些问题。通过机理模型需要丰富的人工经验,这些条件限制了调压器异常检测的效率;现有的调压器智能检测技术多为有监督模型,训练数据需要人工标注且耗时较长;当前的调压器异常检测异常种类单一,泛化性能较差。因此提出一种混合人工智能技术进行无监督的调压器异常检测5,在无标签的情况下快速检测是必要的。2 理论与技术模型基础2.1燃气调压器原理与工作状态2.1.1 燃气调压器原理直接作用式调压器6的具体结构如图1,出口压安全生产Safety in Production 25城市燃气 2022/11 总第 573 期力P2由调节弹簧设定,当下游流量增加时,出口压力下降,调节
5、器下腔内压力下降,使得皮膜组件在弹簧力作用下向下移动,从而带动阀杆组件向下移动,阀杆带动主阀瓣离开阀口,使阀口开度变大,从而通过阀口的燃气流量增加,维持下游压力恒定;当下游流量减小时,其作用与上述过程相反,直到调压器阀口关闭为止。2.1.2 燃气调压器运行状态燃气调压器的运行状态分为正常运行状态和异常运行状态7。调压器在正常运行状态时出口压力数值波动范围小,处于稳定变化状态;调压器在异常运行状态时会出现部分时段压力值缺失、出口压力状态值低于稳定值、出口压力状态值高于稳定值和出口压力数据频繁的上下波动等异常情况。2.2VAE-LSTM模型基础2.2.1 VAE模型基本原理(1)变分编码器变分自编
6、码器(VAE)是基于变分贝叶斯推断的生成式网络结构,如图2,变分自编码器用两个网络建立两个概率密度分布模型:一个用于原始输入数据的变分推断,为推断网络;另一个根据生成的隐变量变分概率分布,为生成网络。(2)卷积层如图3所示,卷积层主要用来提取数据特征。卷积层通过改变卷积核的大小可以学习到数据不同尺寸的特征,在检测时间序列中的上下文异常时具有一定的优势。2.2.2 LSTM模型基本原理LSTM模型中的每一个神经元都是有3个门和1个细胞状态结构的神经元。LSTM的结构如图4,保证了可以捕获输入中的长期依赖关系,防止梯度爆炸,同时适合处理时间序列中的集体异常。图1直接作用式燃气调压器结构图图2变分自
7、编码器原理图图3卷积层结构图图4LSTM模型结构图张锦玉等基于VAE-LSTM的中低压燃气调压器异常检测无监督模型研究调节螺杆调节弹簧弹簧罩主薄膜执行器阀 杆主阀口切断阀口切断阀瓣主阀瓣P1关闭弹簧传感器P2安全生产Safety in Production 26城市燃气 2022/11 总第 573 期2.2.3 VAE-LSTM混合模型原理图5显示了VAE-LSTM混合模型的结构,该模型将具有卷积层的变分编码器模型和LSTM模型混合,在编码器后插入LSTM模型,将样本输入VAE模型中的编码器对样本进行降维提取数据信息,使用LSTM模型对样本进行滑动预测,将预测结果输出VAE模型的解码器进行升
8、维重构。模型通过具有卷积层的VAE模型中的编码器降维提取了时间序列中的点异常和上下文异常,通过LSTM模型进行预测提取了时间序列中的集体异常,保证了在模型异常检测时可以同时检测出时间序列中的3种异常。3 数据处理与样本构造3.1数据采集燃气调压器内部安装有传感器对数据进行采集,通过将传感器采集到的数据上传到系统即可实时监控调压器设备。从数字管理平台可以看到该设备自安装以来到当前时刻为止所收集到的全部信息。本研究采集的数据是从2021年6月25日9点37分到2021年10月9日23点57分的数据,共30 596条数据,部分数据如表1,每条数据间隔5min,每个数据只采集出口压力特征。3.2数据处
9、理3.2.1 数据填充首先将所有数据上的秒都设置为0。然后通过检验发现由于调压器内部原因其中有部分时刻没有采集到,因此将计算每个时间点之间的间隔,发现A设备时间点缺失情况如表2。对于缺少的数据点,采用计算前三天同一时间点的出口压力值均值进行缺失填补,共填补105个数据点,数据总的个数为30 701个。图5VAE-LSTM混合模型时间出口压力时间出口压力2021/10/09 23:57:082.05kPa2021/10/09 23:27:081.99kPa2021/10/09 23:52:082.03kPa2021/10/09 23:22:082kPa2021/10/09 23:47:082.0
10、4kPa2021/10/09 23:17:081.97kPa2021/10/09 23:42:082kPa2021/10/09 23:12:082.01kPa2021/10/09 23:37:082.02kPa2021/10/09 23:07:081.99kPa2021/10/09 23:32:082.01kPa2021/10/09 23:02:081.98kPa序列起始时间点结束时间点缺失时间点12021/07/02 15:57:002021/07/02 16:07:001个22021/07/19 07:57:002021/07/19 16:02:0096个32021/08/08 23:57
11、:002021/08/09 00:22:004个42021/10/04 21:17:002021/10/04 21:42:004个表1获取部分数据信息表表2设备缺少数据点安全生产Safety in Production 27城市燃气 2022/11 总第 573 期3.2.2 数据集划分为训练VAE-LSTM模型并验证模型效果,将数据集按照7:3的比例划分成训练集和测试集,训练集包含21 490个数据,测试集包含9 211个数据。3.2.3 数据标准化将数据集进行标准化处理,标准化后如图6所示。图中右侧以一条竖直虚线作为分界线,左边是训练集,右边是测试集,测试集中下方带有标记的是异常值所在时间
12、点。3.3样本构造3.3.1 VAE模型样本构造为训练VAE模型,需要设置滑动窗口大小为p,wt=xt-p+1,xt 代表第t个样本进行滑动训练。具体结构如图7所示。设置滑动窗口大小为48。训练集中包含21 490个时刻的数据点,使用滑动窗口可以构造21 443个样本;训练时需要调整训练集的超参数,因此按照9:1的比例划分训练集和验证集,训练集包含19 298个样本,验证集包含2 145个样本。3.3.2 LSTM模型样本构造设置LSTM模型的样本矩阵为k行,每行有p个时间点数据,即每个样本矩阵的形状为kp,经变分自编码器降维后每行变为q个时间点,即降维后每个样本是形状为kq的矩阵。例如,Wt
13、=wt-(k-1)*p,wt-(k-2)*p,wt表示第t个样本矩阵,Et=et1,et2,etk 表示将第t个样本矩阵嵌入降维后的表示向量,其中et1表示将第t个样本矩阵的第1行进行嵌入降维后的结果。具体结构如图8所示。本研究设置LSTM模型的样本形状为(6,48)的图6原始数据标准化后分布图图7VAE模型样本构造图8LSTM模型样本构造张锦玉等基于VAE-LSTM的中低压燃气调压器异常检测无监督模型研究安全生产Safety in Production 28城市燃气 2022/11 总第 573 期矩阵,即每个样本中包含288个时间点。由于训练集共有21 490个时间点数据,使用滑动窗口构造
14、样本则LSTM模型的样本矩阵共有21 203个,为了检验LSTM训练效果,将当前样本按照9:1的比例划分训练集和验证集,训练集包含19 082个样本矩阵,验证集包含2 121个样本矩阵。4 VAE-LSTM模型训练及测试4.1VAE-LSTM模型结构4.1.1 VAE模型结构(1)编码器结构本研究中VAE模型的编码器结构由4层卷积层、1层flatten层和1层全连接层构成,具体参数如表3。表3中filter表示卷积核的个数;kernel_size表示卷积核的大小;strides表示步长,元组中的两个数字分别控制横坐标和纵坐标的步长;padding填充方式中的same方式会使得输出数据维度和输入
15、数据维度相同,valid方式表示输出数据维度会小于输入数据维度;为避免梯度消失问题激活函数都采用Leaky ReLU函数。(2)解码器结构VAE模型的解码器结构按照编码器的结构构造,由1层全连接层和5层卷积层构成,具体参数如表4。4.1.2 LSTM模型结构LSTM模型由2层lstm层构成,具体网络参数如表5。LSTM需要在VAE模型的基础上进行训练,需要layerinputsfilterkernel_sizestridepaddingoutputconv_1input32(3,1)(2,1)same(10 298,24,1,32)conv_2conv_164(3,1)(2,1)same(10
16、 298,12,1,64)conv_3conv_2128(3,1)(2,1)same(10 298,6,1,128)conv_4conv_3512(4,1)1valid(10 298,1,1,512)flattenconv_4-(10 298,512)denseflatten-(10 298,6)layerinputsfilterkernel_sizestridepaddingoutputdecoded_1encoded-(10 298,512)decoded_2decoded_1256*31-same(10 298,1,1,256*3)decoded_3decoded_2256(3,1)1same(10 298,3,1,256)decoded_4decoded_3128(3,1)1same(10 298,6,1,128)decoded_5decoded_432(3,1)1same(10 298,24,1,32)decodeddecoded_51(5,1)1same(10 298,48,1,1)layerinput_shapeneuronsoutput_shapeparaminput_