1、收稿日期:2023 04 21基金项目:陕西省教育科学“十三五”规划 2020 年度课题(SGH20Y1631);西安交通工程学院中青年基金项目(2022KY 35)第一作者:李宁宁(1987),女,甘肃庆阳人,本科,讲师,研究方向为轨道车辆结构修造。基于时间递归神经网络的轨道车辆自检系统设计李宁宁1,师玲萍2(1 西安交通工程学院 机电学院,陕西 西安 710300;2 西安铁路职业技术学院 机电学院,陕西 西安 710026)摘要:针对轨道车辆内部复杂的信号和多样化的故障类型,为提高故障自检的快速性和有效性,设计了一种基于时间递归神经网络的轨道车辆自检系统,此系统中包含了基于 FPGA 的
2、神经网络加速器、信号处理芯片、通信模块和传感器。加速器是利用时间递归神经网络 LSTM 作为自检系统内部智能化神经网络模型,采用剪枝、量化和编码等方式对模型进行了轻量化压缩,最后设计相应的加速器部署在自检系统中,同时完成了 LSTM 网络轻量化压缩实验和神经网络加速器实验。实验结果表明,自检系统的神经网络压缩算法的设计虽然使模型准确率下降了 12 1%,但是压缩率可达 7 1%;加速器部分在 FPGA 部署时仅占用了 1 28%的硬件存储资源,性能则可以达到 200MHz,吞吐率为 19 39 GOPS。关键词:轨道车辆;故障检测;神经网络;LSTM;模型压缩;硬件加速;FPGA中图分类号:T
3、P311 52文章编号:1000 0682(2023)04 0058 06文献标识码:ADOI:10 19950/j cnki cn61 1121/th 2023 04 011Design of rail vehicle self test system based on time recursive neural networkLI Ningning1,SHI Lingping2(1 School of Mechanical Electrical Engineering,Xian Traffic Engineering Institute,Shaanxi Xian 710300,China;
4、2 School of Mechanical and Electrical Engineering,Xian ailway Vocational Technical Institute,Shaanxi Xian 710026,China)Abstract:In order to improve the rapidity and effectiveness of fault self detection,a rail vehicleself detection system based on time recursive neural network is designed,which incl
5、udes neural networkaccelerator,signal processing chip,communication module and sensor based on FPGA The acceleratoruses the time recursive neural network LSTM as the internal intelligent neural network model of the self checking system The model is lightweight compressed by means of pruning,quantiza
6、tion and coding Fi-nally,the corresponding acceleration circuit is designed and deployed on the accelerator,and the LSTMnetwork lightweight compression experiment and neural network accelerator experiment are completed Theexperimental results show that although the design of the neural network compr
7、ession algorithm reducesthe model accuracy by 12 1%,the compression rate can reach 7 1%In FPGA deployment,the accel-erator occupies only 1 28%of the hardware storage resources,and the performance can reach 200 MHzwith a throughput of 19 39 GOPSKeywords:rail vehicle;fault monitoring;neural network;lo
8、ng short term memory;model compres-sion;hardware acceleration;field programmable gate array0引言轨道交通是我国城镇化交通运输体系的重要组成部分,是一种客运量大、安全可靠性高、运输模式环保的陆地公共交通工具,随着其数量的不断增长85工业仪表与自动化装置2023 年第 4 期和运行速度不断增加,车辆的安全性和可靠性面临着更加严峻的考验1,所以在轨道车辆管理系统中通常会集成相应的自检系统2 3。轨道车辆自检系统需要对车辆运行状态进行实时监测、对异常情况进行及时诊断、对运行参数的运行轨迹进行及时预测。自检系统内
9、部的主要技术包括:传感器技术、信号处理技术、嵌入式通信技术、人工智能数据分析技术等。面对轨道车辆内部复杂的信号和多样化的故障类型,需要设计更加智能高效的车辆自检系统。近年来,越来越多的系统故障研究引入了深度学习神经网络技术4 5,深度学习是当前国内外的热门研究方向之一,已经在计算机视觉6、大数据分析7 等领域有着成熟的应用经验。随着深度学习技术的不断迭代,神经网络结构变得越来越复杂、处理的数据量越来越庞大,很难部署于硬件资源较少的轨道交通车辆等嵌入式硬件平台上,所以需要进行轻量化算法改进。轻量化算法主要是神经网络压缩算法,例如可以实现网络结构精简的剪枝算法8、数据从浮点数向定点数量化的量化算法
10、9。实现网络轻量化之后,还需要在具体硬件平台上实现算法加速,嵌入式多采用 CPU+FPGA 的模式实现神经网络算法的硬件部署:FPGA(Field Program-mable Gate Array,现场可编程逻辑阵列)的可编程性、低功耗和高吞吐率能有效的实现神经网络的算法加速,而嵌入式 CPU(Central Processing Unit,中央处理器)用于实现逻辑控制功能,实现整体嵌入式系统的高效协同工作。综合以上需求,该文设计了一套基于时间递归神经网络的轨道车辆自检系统。这套系统上集成了时间递归神经网络 LSTM,时间递归神经网络是深度学习中,可以智能化处理轨道车辆的运行状态数据的神经网络
11、;此外针对时间递归神经网络难以部署在轨道车辆的嵌入式平台的问题,文中对时间递归神经网络进行了剪枝和量化压缩,最终将压缩后的 LSTM 神经网络在 FPGA 完成了加速部署。1自检系统硬件设计该文所设计的车辆自检系统硬件设计如图 1 所示,硬件部分主要包括自检系统前端嵌入式系统和后端智能分析系统两部分。前端嵌入式系统中包括:ADC(Analog to Digital Converte,模数转换器)芯片、DSP(Digital Signal Processing,数字信号处理)芯片、基于 FPGA 的神经网络加速器、SPI(Serial Pe-ripheral Interface,串行外设接口)通
12、信模块、串口通信模块、存储 SD 卡和蓝牙通信模块。后端智能分析系统包括:蓝牙通信模块和智能诊断分析系统。图 1自检系统硬件设计图车辆故障自检系统硬件设计的具体工作流程:(1)通过传感器收集轨道车辆在运行时的相关数据,如高压供电电路的温度、电压和电流数据,轨道车辆振动数据;(2)将这些数据经过内部转换和处理单元进行处理,例如需要完成模拟信号到数字信号转换和分析处理、通过谐振器采集车辆振动环境和滤波处理;(3)将数据送入带有人工智能神经网络算法的智能诊断系统,系统将最终结果输出并反馈。前端嵌入式系统作用除了采集和处理轨道车辆的内嵌的电压电流传感器、振动传感器的数据,最重要的是其内部集成了可以智能
13、化处理和预测车辆运952023 年第 4 期工业仪表与自动化装置行状态数据的基于 FPGA 的神经网络加速器,用于智能化处理轨道车辆运行中与时间相关运行状态数据,加速器中集成了可实现已完成剪枝和量化压缩的轻量化压缩的时间递归神经网络 LSTM 加速器电路。2基于 FPGA 的神经网络加速器2 1加速核设计在轨道车辆自检系统的嵌入式系统中,基于FPGA 的神经网络加速器中包含了最重要的 LSTM加速器,其架构如图 2 所示。自检系统加速架构主要结构包含片外存储、缓存单元、控制单元和神经网络加速单元。存储部分包括输入输出缓存、权重缓存和外部存储,外部存储一般为动态存储器,用于存放网络运算需要用到的
14、所有数据;加速计算部分包括完成向量计算的 MAC(Multiplier Accumulator,乘累加器)和完成 LSTM 网络基本运算的 PE(Pro-cessing Engine,处理单元);控制器则是用于控制整个网络加速器的数据搬运、逻辑运算等工作。加速器的整体工作过程如下:首先,控制器控制数据从外部存储向内部缓存进行搬运,并且向运算单元发送运算信号;然后开始进行运算,并且向控制器发送搬运输出数据的信号;最后,控制器根据所需要完成的任务量来控制系统运行。图 2加速器架构示意图2 2基于 LSTM 加速单元算法设计轨道交通车辆的运行状态数据通常是跟随时间而动态变化的,在深度学习技术中,处理
15、和预测这种类型数据通常采用循环递归神经网络,而与此同时,要将这种网络应用在嵌入式设备中通常还需要进行轻量化压缩。2 2 1LSTM 网络模型LSTM(Long Short Term Memory,长短时记忆)网络是有记忆功能的时间递归神经网络的一种,可以处理按时间顺序排列的数据10。LSTM 网络的基本结构如图 3 所示,结构中主要通过函数构成的“门”来实现数据的遗忘和存储,运算过程主要包含遗忘门运算、输入门运算、Cell 状态更新和输出门运算。图 3LSTM 网络的基本结构图在 LSTM 网络的基本结构中,基本输入输出包括:当前时刻输入 x(t)、上一时刻的输出 h(t 1)和c(t 1)、
16、当前时刻的输出 h(t)和 c(t)。基本结构内的门函数包括:遗忘门函数 i(t)、输入门中的输入函数 j(t)和记忆存储函数 k(t)、输出门中输出函数o(t),各个门函数之间有着对应的权重矩阵为 W。此外基本结构中还包括了两种激活函数分别为 sig-moid 和 tanh。基本结构按照以下步骤完成运算:(1)遗忘门运算通过当前输入 x(t)和上一刻输出 h(t 1)来确定需要遗忘门函数的 i(t)的值,其中通过 sig 函数控制遗忘程度,具体公式如下:i(t)=sig(Wxix(t)+Whih(t 1)+bi)(1)(2)输入门函数运算需要确定输入函数 j(t)和记忆存储函数 k(t)的值,以便更好地更新结构的状态,其运算函数如式(2)和式(3)所示:j(t)=sig(Wxjx(t)+Whjh(t 1)+bj)(2)k(t)=tanh(Wxkx(t)+Whkh(t 1)+bk)(3)(3)Cell 状态更新则是通过将上一时刻状态c(t 1)与遗忘门函数 i(t)和输入函数 j(t)进一步计算得到当前时刻状态 c(t),具体公式如式(4)所示:c(t)=i(t)c(t 1)+j(t)