1、第 卷 第 期 年 月中国安全科学学报 中文引用格式:戴秉佑,杨文臣,戢晓峰,等 冬季高速公路逐时路表温度 预测模型中国安全科学学报,():英文引用格式:,():冬季高速公路逐时路表温度 预测模型戴秉佑,杨文臣,高级工程师,戢晓峰教授,周林义高级工程师,房 锐,教授级高级工程师(昆明理工大学 交通工程学院,云南 昆明;云南省交通规划设计研究院有限公司陆地交通气象灾害防治技术国家工程实验室,云南 昆明;云南数字交通重点实验室,云南 昆明;中国气象局交通气象重点实验室,江苏 南京)中图分类号:;文献标志码:.资助项目:国家重点研发计划项目();交通运输行业重点科技项目(,);云南省科技厅基础研究计
2、划项目()。文章编号:();收稿日期:;修稿日期:通信作者:杨文臣(),男,云南昌宁人,博士,高级工程师,硕士生导师,主要从事道路交通安全与环境、智能交通控制系统方面的研究。:。【摘 要】为提高冬季路表温度的预测精度,提出一种基于多维长短时记忆()神经网络的冬季路表温度逐时预测模型,以小时路表温度为模型输出,综合考虑多维气象因素的累积影响和路表温度的周期性,采用滑动窗口构造输入特征矩阵;构建路表温度 逐时预测模型,通过深度学习高效逼近具有复杂非线性和不确定性的路表温度,并以江苏省宁宿徐高速公路、云南省麻昭高速公路为实例进行验证。结果表明:与随机森林()模型和 神经网络相比,路表温度逐时预测模型
3、的准确率得到显著提高,在宁宿徐高速、麻昭高速的平均绝对误差()、均方误差()和均方根误差()分别为.、.、.和.、.、.,预测值与观测值绝对误差位于,)之间的占比为 和。模型能准确捕捉路表温度的周期性和不确定性,在阴雨天和晴朗天的预测值与实测值基本一致,模型鲁棒性较好。【关键词】高速公路;路表温度;长短时记忆()神经网络;逐时预测;气象因素 ,(,;,;,;,):,第 期戴秉佑等:冬季高速公路逐时路表温度 预测模型 (),(),()().,.,.,.,.,),:;();引 言 沥青路面是我国高速公路的主流路面形式,占我国高速公路 以上。冬季,路面低温易导致沥青路面结冰、积雪,使得路面摩擦因数降
4、低,特别是高速公路车辆行驶速度快、交通流量大,极易引发重大交通事故和大范围交通拥堵。路表温度是表征路面结冰的重要征兆因子,准确预测冬季高速公路路表温度和提前预警路面结冰风险,是提升路面养护能力和交通安全水平的关键。根据冬季结冰路面预防性养护处治的要求,如何准确捕捉路表温度变化的趋势,开发高精度的路面温度逐时预测模型,已成为冬季高速公路运营安全管理和交通气象灾害防治亟需解决的问题。当前,路表温度的预测方法主要分为理论分析法、统计分析法和机器学习法 类。理论分析法是根据热力学原理及路表辐射能量平衡条件,采用数值计算开发路表温度预测的机制模型。自 年以来,加拿大、法国、芬兰、美国等欧美国家率先开展了
5、路表温度和路面状态预测的研究,并在道路环境和温度(,)数值预报模型、参数优化、交通气象观测等方面取得较成熟的理论和应用成果。随着动态交通气象监测数据的不断丰富,自 年以来,国内外学者以历史的路面温度数据为基础,采用描述统计分析时空分布特征,引入统计回归等方法构建路表温度预测模型。等利用多元线性回归方法,建立了路表温度临近预测的统计模型;等建立了一种基于逐步线性回归的路表温度预测模型,在斯洛文尼亚公路的应用中,其表现优于 模型。近年来,随着大数据和人工智能等新一代信息技术的快速发展,采用数据驱动的机器学习算法,在处理高维度、大数据的复杂问题数据建模时表现优秀,这为人工智能技术应用于路面温度预测提
6、供了新的契机。等提出基于改进反向传播(,)神经网络的动静态路表温度预测方法,改善了日温度变化点的预测准确性;等提出基于改进极限学习机的路表温度预测模型。当前研究仍存在下述问题:理论分析模型一般有目标场景的边界假设且涉及多个物理参数,数值计算复杂,模型普适性较差。统计分析方法模型多以日最高、最低路表温度为目标,难以保证预测的时效性,且不适用于高维非线性大数据建模,不具备泛化能力,随着数据复杂度的增加,模型的预测精度和可移植性将明显下降。既有机器学习模型多从路表温度周期性角度开发预测模型,未将模型与路面传热特性结合,缺乏对路表温度临近变化趋势的考虑,同时,相较于快速发展的深度学习,传统机器学习模型
7、在学习高维特征间关系的能力弱,导致模型预测准确性和泛化能力都下降。鉴于此,笔者拟通过分析路表温度变化特征,综合考虑路表温度自身的周期性和多维气象因素的临近累积影响,从更精细化的角度,构建能够反映路表温度变化的特征矩阵,利用长短时记忆神经网络(,)能够记忆和更新信息的特点,模拟路面存储和释放热量,开发以小时为中国安全科学学报第卷年时间粒度、连续滚动预测路表温度的模型。以期为面向高速公路冬季路面低温结冰的出行信息服务和动态安全管理提供参考。路表温度 逐时预测模型.整体框架 基于 的路表温度逐时预测模型的整体框架如图 所示,包括数据处理、特征矩阵构建和模型构建 个部分。模型首先针对高速公路气象和路表
8、温度的原始数据作预处理,完成数据清洗、标准化、重采样和特征参数选择,在此基础上,利用滑动窗口方法,构造考虑多维气象因素的累积影响和路表温度周期性的特征矩阵,结合逐时预测的目标,划分训练和测试样本,随后,利用 模型进行训练和拟合,得到数据驱动的预测模型。图 路表温度逐时预测的整体框架 .数据处理 研究数据来源于 自动交通气象站的分钟级实况监测数据,包括路表温度、气温、湿度、风速和降雨量等主要气象因素。原始数据示例见表。表 自动交通气象站的原始数据 时间能见度 气温湿度降雨量风速()风向()路表温度:.:.数据清洗 高速公路气象数据中存在数据异常、数据缺失等问题,为保证数据质量,采用拉伊达准则判断
9、噪声数据,若该数值与平均值之差的绝对值大于其标准差的 倍,则利用平均法计算值替换该数值,即该数值两侧数值的平均值。()()式中:为某个特征的观测值;为 特征观测值序列的均值;为 特征观测值序列的标准差;为噪声数据经过处理后的数值。.标准化与重采样 为提升模型的收敛速度,减少不同特征之间的不同量纲对模型空间复杂度造成的影响,选用 标准化的方法线性变换原始数据。标准化的公式为:()式中 为标准化后的新数据。以标准化后的分钟级气象数据为基础,以 为间隔,重采样整点的高速公路气象因素和路表温度,形成新的研究用数据集。第 期戴秉佑等:冬季高速公路逐时路表温度 预测模型.特征参数选择 考虑到气象特征与路表
10、温度间可能存在着非线性相关的关系,因而采用斯皮尔曼相关系数量化各气象因素与路表温度的相关性,剔除对路表温度影响小或无影响的气象因素,减小模型输入复杂度,提高预测模型的准确率。计算式为:()()式中:为斯皮尔曼相关系数;为样本总数;为 变量排序后的秩次差值。的取值范围为 ,的绝对值越接近,表明 个因素的相关性越强。研究通过剔除原始数据中与路表温度极弱或无相关因素,选择模型输入的特征参数。.模型构建.滑动窗口 利用滑动窗口的方法切分时间序列数据,构造监督学习样本。基于滑动窗口的时间序列划分如图 所示,假设数据集 共有 组数据,当滑动窗口大小为 时,表示利用前 次的历史数据训练模型,预测下一次的值,
11、然后窗口向右滑动继续构造新的监督学习样本。按照此规则,数据集 共计能够构造 条样本。图 滑动窗口 滑动窗口 的大小直接影响输入特征向量和样本个数,将时间相关性高的序列输入模型,可有效提升模型的预测精度;而将时间相关性低的序列输入模型,则会加入无关的信息。因此,最优滑动窗口是开发路表温度逐时预测模型的关键参数。.输入特征矩阵 输入特征矩阵由临近影响特征矩阵和周期性特征矩阵 部分构成。)临近影响特征矩阵。气象因素对路表温度的影响呈滞后性、累积性,未来 的路表温度不仅与历史时刻的路表温度具有时间相关性,还受多维气象因素的累积影响。因此,与传统仅采用单一路表温度作为输入的模型不同,研究构造综合考虑多维
12、特征气象因素的临近累积影响特征矩阵,如下式:,()式中:为重要的特征气象因素的数量;为临近影响的滑动窗口大小,表征历史前 小时;,为 时刻路表温度;,为 时刻路表温度;,为 时刻第 个气象因素的值;,为 时刻的第 个特征气象因素的值。为预测 时刻的路表温度,分别取 时刻至前 小时的多维特征气象因素和路表温度的值作为输入。)周期性特征矩阵。为捕捉路表温度的周期性变化,引入历史日期相同时刻的多维特征气象因素和路表温度构造周期性特征矩阵,如下式:,(),(),(),()式中 为周期性影响的滑动窗口大小,表征历史前,即为预测 时刻的路表温度,分别取前 天至前 的 时刻的多维特征气象因素和路表温度的值作
13、为输入。.等提出,通过引入输入门、遗忘门控制“细胞状态”,使其能够记忆长时间序列中的规律,有效规避循环神经网络(,)梯度消失现象,结构如图 所示。其中,为遗忘门,为输入门,为输出门,为“细胞状态”,为隐藏层输出,与 为激活函数。等研究指出,路面间存在热传导效应,气象因素作用于路面结构上层后,热量向路面深处传导需要一定的时间,而路面深处向路表释放热量也需要一定的时间,这使得气象因素对路表温度的影响呈累积性、滞后性。因此,在路表温度 预测模型中,遗忘门不断地将“细胞状态”中由于时间过长无法影响路表温度的气象因素删除,输入中国安全科学学报第卷年门不断地向“细胞状态”输入临近时间气象因素的影响,从而实
14、现利用“细胞状态”的特点模拟路面的热传导效应,最后,根据“细胞状态”和输出门得到隐藏层输出,预测 时刻模型的路表温度 。图 结构 图 路表温度变化趋势 .模型评估为定量评估模型性能,选择平均绝对误差(,)、均 方 误 差(,)和 均 方 根 误 差(,)来评价预测值与观测值的误差情况。评价指标定义如下:()()()()()式中:为路表温度的观测值;为路表温度的预测值;为观测值的平均值。、和 的值越小,模型预测性能越好。实例分析.研究区域 选取江苏省宁宿徐高速公路、云南省麻昭高速公路为研究对象,利用交通气象站采集的宁宿徐高速新沂河大桥 年和云南省麻昭高速公路 号匝道 年冬季长期分钟级观测数据,观
15、测的交通气象因素包括能见度、降雨量、气温、湿度、风速、风向和路表温度共计约 万条数据。宁宿徐高速新沂河观测点地处平原,靠近桥梁,周边环境多是水体和植被,呈开阔地势,冬季降温散热速度快,偶发性结冰多发;麻昭高速公路 号匝道观测点,周边环境多为山体和植被,由于地处高原山区,冬季冻雨、暗冰等气象灾害频发。以新沂河观测点 年 月为例,路表温度的时变化如图 所示。路表温度表现出明显的周期性变化特征,白天路表温度受气温、太阳辐射影响,温度逐步升高,午后达到最高值,随后逐步下降直至清晨出现最低值。从图 可以看出,相同时刻的路表温度具有相关性,如 日,:时路表温度均达到最高值,且取值相近,均在 左右波动,可将
16、最低值到另一个最低值视为一个周期。其次,以 日:时路表温度为例,路表温度变化还受到气象因素的累积影响。因此,研究综合考虑路表温度周期性和气象因素对路面温度的累积影响,作为模型输入。.特征变量选择 宁宿徐高速公路、麻昭高速公路的路表温度与各气象因素的相关系数如图 所示。第 期戴秉佑等:冬季高速公路逐时路表温度 预测模型图 路表温度与各气象因素之间相关系数 宁宿徐高速、麻昭高速的气温与路表温度的相关系数分别为.,.,说明气温与路表温度存在极强的相关性;宁宿徐高速、麻昭高速的降雨量、风速和湿度与路表温度的相关系数分别为.、.、.和.、.、.,说明降雨量、风速、湿度与路表温度存在弱相关,宁宿徐高速、麻昭高速的能见度、风向与路表温度相关系数分别为.、.和.、.,说明能见度、风向与路表温度存在极弱相关性。因此,研究选择路表温度、气温、湿度、降雨量和风速 个重要的特征气象因素作为模型的输入参数,以未来 的路表温度为模型输出。孙立军等通过试验发现,沥青路面温度与前 时间段内的气象因素相关性最强,综合考虑预测模型的复杂度,累积影响的滑动窗口 取值为,选择将前 的气象因素和路面温度作为表征临近累积影响的输