1、第 卷第期 年月 科技和产业 ,基于优化 模型的机场终端区流量预测向征,全志伟,何雨阳,周鼎凯,储同(中国民用航空飞行学院 空中交通管理学院,四川 广汉 )摘要:将深度学习用于机场终端区流量预测研究。神经网络具有复杂的网络拓扑结构和较多的超参数,这使得超参数的选择很困难。以往神经网络模型的超参数通常是根据经验来调整的,因此,为了解决超参数搜索问题,引入粒子群算法()。针对基本粒子群算法(,)的缺点和不足,提出一种基于自适应惯性权重的混沌粒子群优化()算法,该算法在基本 的基础上进行了改进和优化。具体方法是,使用一种新的动态自适应惯性权重在全局寻优和局部寻优之间取得平衡;进而将混沌思想和粒子群算
2、法相结合,解决粒子群算法易陷入局部最优的问题。实验表明,算法用于 模型的超参数寻优时,既解决了 算法的早熟收敛问题,又提高了流量预测的精度。关键词:空中交通管理;深度学习;粒子群算法;流量预测中图分类号:文献标志码:文章编号:()收稿日期:基金项目:中国民用航空飞行学院科研面上项目()。作者简介:向征(),男,四川成都人,中国民用航空飞行学院空中交通管理学院,副教授,博士,研究方向为空中交通管理及自动化技术;全志伟(),男,江苏泰州人,中国民用航空飞行学院空中交通管理学院,硕士研究生,研究方向为空中交通管理及自动化技术;何雨阳(),女,四川成都人,中国民用航空飞行学院空中交通管理学院,硕士研究
3、生,研究方向为空中交通流量管理;周鼎凯(),男,浙江丽水人,中国民用航空飞行学院空中交通管理学院,硕士研究生,研究方向为空中交通管理及自动化技术;储同(),男,陕西西安人,中国民用航空飞行学院空中交通管理学院,硕士研究生,研究方向为空中交通管理及自动化技术。在中国数十年市场规模不断扩大的背景下,航空事业蓬勃发展。年民航行业发展统计公报显示,机场飞机起降架次同比不断递增,至 年飞机起降架次达 万架次。但由于飞行需求的扩大,以及需求量和供应量之间的不平衡,机场终端区空域往往无法满足计划航班量。空域资源与飞行需求二者之间的矛盾日益突显,再加上恶劣天气多发,导致空域拥堵和飞机延误的状况日益严重,因此产
4、生了非常大的延误成本。这种延误很大一部分是由空中交通流量引起的。空中交通流量预测是实施空中交通管理的前提和基础。提供准确的机场飞行流量预报,不但能够维护整个机场上空的航班秩序,缓解机场终端区空域拥堵问题,提高飞机起降时的安全性,还可用于相关部门获悉机场当前和未来的飞行负荷,为后续制定流量管理优化策略提供依据。目前学者们主要采用预测飞机的四维航迹和过点时间来统计某航路点或终端区的飞行流量。向征等提出了一种全飞行剖面混杂模型来预测飞机过航路点的时间,从而得到流量值。这种方式依赖过点时间的准确性,而空中交通状况复杂多变,影响预测结果的准确性。随着空管数字化系统的不断完善,航班运行、航空气象等数据不断
5、积累,挖掘这些数据隐藏的信息和规律,将深度学习用于飞行流量预测,提升预测准确性。针对流量数据的非线性和时序性特点,提出一种基于 ()的流量预测方法。为解决 模型的超参数选择困难问题,提出一种 (自适应惯性权重的混沌粒子群优化)算法对 模型进行优化。理论方法为获得更精准的机场流量预测结果,开发具有注意力机制的 网络结构,并引入改进粒子群算法进行参数自动寻优。具体方法如下。卷积神经网络()由于高效的特征提取能力,而成为深度学习领域使用最为普遍的算法之一。主要由卷积层和池化层构成,其中卷积层利用卷积核提取流量数据的有效非线性局部特征,而池化层则对所提取的特征信息加以压缩,从而得到更重要的特征信息,并
6、以此增强了模型的泛化能力。网络机场飞行流量数据为时序型数据。如 ,通常是在时间序列中进行前后训练。然而,这样的训练并不能很好地利用数据,也不能进一步探索数据的可能属性。是一种双向的神经网络,由一个正向和一个反向的 网络组合而成。双向网络可以在序列的开始和结束时以递归响应的方式训练隐含层的状态,这样就可以进一步找到当前数据与前一个时间和未来时间的数据之间的某些关系,并进一步处理逆向信息,以优化长期依赖问题,提高模型的预测精度。由输入层、前向隐含层、后向隐含层和输出层组成。网络的数学表达式为 (,)()(,)()()()式中:时刻的输入向量、前向和后向隐含层状态分别为、;、为权值;为偏置。注意力机
7、制 起源于对人脑注意力特征的模拟,首次应用于图像处理领域。在深度学习领域,机制根据不同的特征分配权重,对关键内容分配更多的权重,对其他内容分配更少的权重。通过差异化的权重分配,可以提高信息处理的效率。对于注意力来说,信息的重要度的选择与注意力值有关。一般来说,注意力值计算分为两个步骤:首先在所有输入信息上计算注意力分布,然后根据注意力分布计算输入信息的加权平均得到注意力信息。模型卷积神经网络 可以有效提取流量数据的非线性局部特征,层用来提取序列数据的双向时序特征。将在 隐含层中生成的特征作为对注意力机制()的输入,并且利用注意力机制对在 层中获得的时间信息进行加权,从而对重要程度进行区分以减小
8、冗杂信息对流量预测结果的影响。改进粒子群算法在实验过程中发现,的主要超参数的选择会影响预测的准确性,所以需合理选择部分超参数的取值。粒子群优化算法()是一种模拟鸟群觅食的群体协作随机搜索算法。该算法的核心是根据个体历史最优解与全局历史最优解来更新粒子的速度和位置,更新公式为()()()()()()()()()式中:为速度;、分别为非负的个体学习因子和社会学习因子;为惯性权重;为迭代次数;为当前位置;、为介于(,)的随机数,用于增加搜索的随机性;、分别为粒子个体最优值和全局最优值。改进粒子群算法的设计 动态自适应的惯性权重惯性权重()是用来控制粒子之前的速度对现在速度的影响程度。惯性权值显著影响
9、粒子全局搜索能力与局部搜索能力间的平衡,较大的有利于算法的全局寻优,相反,局部寻优能力更好。在过去的研究总结中,惯性权重线性递减是设置惯性权重的常用方法。然而,算法的寻优进程十分复杂且非线性,线性递减法难以满足,从而导致其在非线性、寻优进程复杂的情况下适应能力有限,易陷入局部最优。为此,提出一种动态自适应惯性权重方法,计算方法为 ()()()式中:为当前迭代次数;为最大迭代次数;为迭代系数。在迭代后期,惯性权值略有增加,从而有助于算法在后期进行全局搜索。结合混沌优化摆脱局部极值常用的混沌模型 方程如式()所示。如果粒子处于局部极值,那么 的值在较长一段时间内保持不变,由于 是 中的最优值,所以
10、在这段时间内 ;因此,式()可以简化为式()。在此之后,所有粒子的速度逐渐变小,最后速度趋于一致,粒子差异消失。如果粒子的速度接近零,该粒子会陷入局部最优位置,则此时处于停滞状态,这种情况称为“早熟”。将全局最优 与当前粒子的适应度值之差除以,得到距离系数,如果这个系数小于某个常数,那么就认为此时为局部最优位置。即如果它满足方程(),一个新的随机位置将被分配给当前的粒子,从而粒子可以继续寻优。这种位置信息是通过混沌 映射的方式产生的。科技和产业 第 卷第期(),()()()式中:为常数;为控制参量;为第次迭代时,当前粒子的适应度值;为第次迭代时的全局最优适应度值。算法流程图是改进后的基于 算法
11、的计算流程。算法的具体设计过程如下。图改进后的 算法流程步骤:种群规模,初始化种群中粒子的速度和位置。步骤:计算适应度。步骤:更新、的信息。)将粒子当前的适应度值与自身以往的最优适应度值 进行比较,如果当前值更好,则将 设置为当前值,否则粒子个体最优位置不变。)将粒子当前的适应度值与种群以往的最优适应度值 进行比较,如果当前值更好,则将 设置为当前值,否则种群最优位置不变。步骤:更新粒子的位置和速度。)根据式()、式(),更新当前迭代的惯性权重。)根据式()更新粒子速度,若粒子速度超出临界值,则将其设为临界值。)根据式(),确定粒子此时的位置是否局部最优。若是,通过式()来更新粒子位置;否则,
12、通过式()来更新粒子位置,如果更新后的粒子位置超出临界点,则在粒子位于的搜索边界继续寻优。步骤:判断算法能否达到终止标准。若达到,则输出结果;反之,则回到步骤。算例分析为检验 算法的有效性,使用了个标准测试函数来测试和验证其准确性、收敛速度和摆脱局部最优解的能力,并将其与其他作者提出的算法进行比较。比较算法有:改进粒子群算法()、基本粒子群算法()、标准粒子群算法()、采用压缩因子的粒子群算法()。实验环境与参数设定软件环境是 、和 。算法参数设置如下:学习因子,最大迭代次数 。另外,算法中,;算法中,;算法中,;算法中,;算法中,。实验结果与分析为了避免偶然性,在测试了 次测试函数后,比较了
13、所有 算法的计算结果的平均值。每种算法对个测试函数的适应度曲线如图图所示,平均最优适应度见表。表各算法寻优结果的平均最优适应度函数 图各算法对 的收敛曲线向征等:基于优化 模型的机场终端区流量预测图各算法对 的收敛曲线图各算法对 的收敛曲线从表可知,对于个测试函数,算法的 表 现 最 好。其 中,对 函 数 的 求 解,算法取得了理论极值。此外,算法在 和 函数中也具有较高的求解精度。因此本文提出的 算法具有很好的收敛性能。基于 算法的流量预测模型提出一种基于 模型的流量预测方法。首先,将流量数据进行预处理,分为训练 集 和 测 试 集。第 二,构 建 模型。在这项工作中,由一层一维卷积层和池
14、化层组成的 框架被用来自动提取流量数据的内在特征。卷积层从流量数据中进行有效非线性局部特征提取,池化层选取最大池化方法对提取的特征进行压缩,生成更关键的特征信息。隐含层建模学习 提取的局部特征的内部动态变化规律,并从局部特征中迭代提取了更复杂的全局特征。隐含层产生的特征被用作注意力机制的输入,该机制用于区分 隐含层提取的时间信息的重要度,可以更有效地利用流量数据本身的时间序列特性来提取深层的时间相关性。注意力机制可以有效减少历史信息的损失,突出重要历史时间点的信息,减少冗余信息对流量预测结果的影响。然后将注意力层的输出作为全连接层的输入,从 而 得 到 最 终 的 流 量 预 测 结 果。此
15、外,在 的每个隐含层之后添加一个 层,这不仅可以防止过度拟合,还可以提高模型的泛化能力,减少模型训练时间。在网络参数优化部分,采用 ()优化算法对各层网络参数进行更新,损失函数采用均方误差()。最后,为了提高预测效果,使用 算法对 模型进行优化。优化对象是模型隐含层神经元数目()、层()、批处理大小()和学习率()。找到参数的最佳组合并作为模型的初始参数,进行网络训练以提高模型的预测性能,并利用测试集验证模型的有效性。仿真实验实验模型使用的数据为 年奥兰多国际机场及其相关气象观测站的相关数据,主要包括航班运行数据和天气数据。数据集的第一部分是航班运行数据,该部分数据来自美国交通运输统计局和美国
16、 的 数据库。以机场为索引,选取奥兰多机场()年的全部航班运行数据进行实验分析。数据集的第二部分是来自美国国家海洋和大气管理局的气象数据。数据包括能见度、气压、温度、相对湿度、降雨量、风速、风量、日期类型等。算法程序编写使用 实现,模型采用 框架实现。参数设置为了测试和验证 算法的参数寻优能力,将该算法与标准粒子群优化算法()和自适应粒子群优化算法()进行了比较。算法的共同参数设置如下:种群大小设为,最大迭代次 数 为 次,学 习 因 子、为 。此 外,算法中混沌优化策略的参数设置为:,。实验结果与分析对 年 月 日的流量进行预测分析,为了进一步证明 模型的有效性,试验将其与其他模型进行对比。图所示为种不同方法的相对误差对比图,模型方法的相对误差很小,科技和产业 第 卷第期正负绝对值均小于 。图为种组合模型日流量预测结果对比图,说明该方法在流量预测方面是有效的。对比:每小时真实流量统计值与预测值,结果如图所示。不同模型预测性能的具体比较见表。图种方法相对误差对比图种组合模型日流量预测结果图:流量预测值与真实值对比表模型预测指标对比模型均方误差均方根误差平均绝对误差 从表可以看出,相比其