1、收稿日期:2023-02-06基金项目:江西省交通运输厅科技项目(2022X0047)作者简介:莫宇蓉,女,高级工程师,学士,主要研究方向为交通运输运行监测管理以及高速公路路网营运。引文格式:莫宇蓉.基于Att-CNN-BiGRU 的高速公路短时交通流预测方法研究 J.市政技术,2023,41(5):36-41.(MOYR.Research on short-term traffic flow forecast method of expressway based on Att-CNN-BiGRU J.Journal of municipal technology,2023,41(5):36-
2、41.)文章编号:1009-7767(2023)05-0036-06第41卷第5期2023年5月Vol.41,No.5May 2023DOI:10.19922/j.1009-7767.2023.05.036Journal of Municipal Technology基于 Att-CNN-BiGRU 的高速公路短时交通流预测方法研究莫宇蓉(江西省交通监控指挥中心,江西 南昌 330036)摘要:消除高速公路交通流数据随机噪声和确定深度神经网络框架以及超参数是短时交通流组合预测模型的关键环节。为了提高高速公路交通流管理水平,针对交通流的时空特征和长时间序列依赖问题,利用 CNN 框架提取了交通流
3、的空间特征,融合了注意力机制加权分配各时间节点对交通流预测的关注度,并结合 BiGRU 提取了时间特征,从而消除了噪声并加强了对时间序列问题的解析,构建了 Att-CNN-BiGRU 组合模型从而预测出高速公路短时交通流。在以江西省高速公路数据集为例的试验中获得的结果表明:该模型的平均绝对误差(MAE)达到了 6.88,均方根误差(RMSE)达到了 9.90,平均百分比误差(MAPE)达到了 30.81%;模型预测精度优于基线模型,且模型可用于高速公路交通流的精确预测。该研究成果可为高速公路交通组织与缓解交通压力提供基础数据支撑。关键词:高速公路;短时交通流预测;组合模型;门控循环单元;卷积神
4、经网络;注意力机制中图分类号:U 491.14;TP 183文献标志码:AResearch on Short-term Traffic Flow Forecast Method ofExpressway Based on Att-CNN-BiGRUMo Yurong(Jiangxi Traffic Monitoring Command Center,Nanchang 330036,China)Abstract:The eliminating the random noise of expressway traffic flow data and determining the depth ne
5、ural networkframework and super parameters are the key links of short-term traffic flow combination forecasting model.In orderto improve the level of expressway traffic flow management,the CNN framework is used to extract the spatial char鄄acteristics of traffic flow in view of the time-space charact
6、eristics of traffic flow and the dependence of long time se鄄ries.The attention mechanism is integrated to distribute the attention of each time node to traffic flow prediction.Inaddition,time features is extract by BiGRU to eliminate noise and strengthen the analysis of time series problems.The Att-
7、CNN-BiGRU composite model is established to predict the short-term traffic flow of expressway.The dataset of expressway in Jiangxi Province are taken as examples.The experimental results show that the mean absoluteerror(MAE)of this model reaches 6.88,the root mean squared error(RMSE)reaches 9.90,and
8、 the mean absolutepercentage error(MAPE)reaches 30.81%.The prediction accuracy of the model is better than those of the baselinemodels.The model can be used for accurate prediction of expressway traffic flow.The research can provide basic datasupport for expressway traffic organization and relief of
9、 traffic pressure.Key words:expressway;short-term traffic flow forecast;combination model;gated recurrent unit;convolutionneural network;attention mechanism第5期随着城市化进程的加快,机动车保有量快速增加,交通拥堵问题也日益加剧。如何对交通流状态进行精准预测,从而灵活、高效地调整管控策略是当前研究的重点。短时交通流预测作为智能交通系统的重要环节之一,准确的短时交通流预测可以帮助决策者更好地把握交通流状态,从而更合理地制定管控策略,同时也可以
10、帮助出行者做出更好的路线引导和出行计划,从而节约费用。目前,国内外对于短时交通流预测问题的研究方法可分为三大类:第1类是时间序列预测方法。其中,比较常见的是差分整合移动平均自回归(ARIMA)模型及其变体。但该类方法不能应对交通流的随机性和非线性变化的特点,因此预测精度不足。第2类是浅层机器学习类算法1。主要包括支持向量机回归(SVR)和K近邻(KNN)算法等。基于机器学习的预测方法可以更好地处理高维数据集,并能够解决非线性的问题,但使用浅层的神经网络依然难以准确把握交通流特征。第3类是近年来快速发展的深度学习类方法。包括循环神经网络类2(GRU3与LSTM)和卷积神经网络类(CNN)4模型等
11、。在深度学习类方法中,循环神经网络自提出以来就被广泛应用于时间序列任务,适用于处理交通流数据的时序性。Wei等5提出了一种考虑节点的空间关系,利用自编码器对上下游流量特征进行提取的自编码器LSTM(AE-LSTM)模型,该模型取得了不错的预测效果。Yang等6在LSTM模型中添加了注意力机制模块,以应对长时间序列的交通流数据中梯度消失的问题。另一方面,Zhao等7考虑CNN自动生成并提取特征的特点,提出一种基于CNN的时间序列分类的模型,解决了传统分类方法中依赖特征选取的问题。Wu等8提出了一种CNN-LSTM预测方法,该方法通过LSTM和CNN并行进行特征提取,LSTM提取时间特征和周期性特
12、征,CNN提取空间特征,最后将特征融合进行预测。然而,并行提取特征会导致交通流特征能充分融合。因此,为了预测短时交通流,笔者提出一种基于注意力机制的CNN-BiGRU预测方法。其中,CNN模块作为编码部分用于提取交通数据的空间特征;基于注意力机制的Bi-GRU模型作为解码器用于提取交通流的时间特征;融合时空特征来预测交通流。1高速公路短时交通流预测方法设计针对高速公路交通流的时空特征和长时间序列依赖问题,利用CNN框架提取交通流的空间特征,融合注意力机制和Bi-GRU模块提取时间特征,最终构建Att-CNN-BiGRU组合模型预测高速公路短时交通流。1.1CNNCNN是一种能够有效地从海量样本
13、数据中提取不同层次特征的典型的前向神经网络,可通过局部感知提取数据特征,实现端到端的学习。CNN通常包含数据输入层、卷积层、激活层、池化层和全连接层,是由卷积运算来代替传统矩阵乘法运算的神经网络,可通过对各个层进行迭代,构成一个完整的CNN,其计算公式为:C=f(X茚wc+bc);(1)%P=(C)+bp;(2)H=准(Pws+bs)。(3)其中:C为卷积层输出状态;P为池化层输出状态;H为结构输出特征向量;wc为卷积层权重矩阵;ws为全连接层权重矩阵;bc、bp、bs分别为卷积层、池化层、全连接层的偏置向量;茚为卷积运算;f(X茚wc+bc)为卷积层激活函数;(C)为池化层激活函数;准(Pw
14、s+bs)为全连接层激活函数。1.2Bi-GRU循环神经网络经典的循环神经网络(RNN)只能从先前的输入中提取,以便预测当前状态。但是在解决某些问题时,前向的信息状态和后向的信息状态同时影响了当前时刻的输出状态,使传统的CNN无法解决这种双向的信息传播模式。基于此,研究者们提出了双向CNN来解决该类问题。因为双向RNN会提取未来数据以提高其准确性,以此衍生出了双向门控RNN。Bi-GRU由2个传播方向相反的GRU组成并共同决定Bi-GRU的输出状态。Bi-GRU结构见图1。双向门控RNN9的工作原理是在每一个时间步长内,由前向传播的门控RNN和后向传播的门控RNN依次处理输入的信息序列,这样每
15、一个时间步长内的信息序列都涵盖了完整的信息,包括前一时刻的历史信息和后一时刻的未来信息。双向门控RNN选择同一时间节点的历史交通信息作为模型的输入,可以更好地适应交通流的周期特性。双向门控RNN计算公式为:莫宇蓉:基于Att-CNN-BiGRU的高速公路短时交通流预测方法研究37Journal of Municipal Technology第41卷h軋t=GRU(xt,h軋t-1);(4)h車t=GRU(xt,h車t-1);(5)ht=wth軋t+th車t+bt。(6)式中:h軋t为前向隐藏层;h車t为后向隐藏层;wt为h軋t对应的t时刻的权重;t为h車t对应的t时刻的权重;GRU(xt,h軋
16、t-1)、GRU(xt,h車t-1)为隐藏层激活函数;bt为t时刻隐藏层状态所对应的偏置。1.3注意力机制注意力机制本质上是从大量信息中筛选出重要信息,并聚焦到重要信息上,忽略不重要的信息10。注意力机制起初是为解决机器翻译中随句子长度的增加,性能显著下降的问题,即长时间序列依赖问题而使用,现已广泛应用于各类时间序列数据的处理中。注意力机制可以被理解为一种使用权重分配的编码和解码方案,引入注意力机制的Encoder-Decoder框架(见图2)。神经网络中引入注意力机制,可根据权重选择重要信息。由于注意力机制加权分配的特点,使得注意力机制可以有效解决长时间序列依赖的问题。注意力机制采用并行计算时间序列之间的相似性从而挖掘信息,不仅提高了计算效率,还避免了信息丢失。注意力机制的原理公式为:Attention(Query,Source)=iSource(Query,Keyi)Valuei。(7)式中:Source表示输入的原始数据信息;Query表示在一定条件下或一定信息下;Key表示数据信息的重要程度;Value表示数据信息中某元素。权重系数计算公式为:et=uatanh(waht+ba