1、第 43 卷 第 1 期 高 师 理 科 学 刊 Vol.43 No.1 2023 年 1 月 Journal of Science of Teachers College and University Jan.2023 文章编号:1007-9831(2023)01-0031-07 基于修正动态组合模型对公共交通客运量的预测 郭婷婷,宇世航(齐齐哈尔大学 理学院,黑龙江 齐齐哈尔 161006)摘要:针对公共交通客运量的预测问题,结合 ARIMA、灰色预测以及 BP 神经网络的优势,采用临近期的误差平方和来计算动态权重,将突发事件定义为影响因子,建立了修正动态加权组合模型选取北京市 19782
2、021 年公共交通客运量进行实证分析实证分析结果表明,修正动态加权组合模型的预测效果比单一模型和固定权重组合模型更好 关键词:公共交通客运量;修正动态组合模型;ARIMA 模型;灰色预测模型;BP 神经网络模型;突发事件 中图分类号:TP18 文献标识码:A doi:10.3969/j.issn.1007-9831.2023.01.007 Forecast of public transport passenger volume based on modified dynamic combination model GUO Tingting,YU Shihang(School of Scien
3、ce,Qiqihar University,Qiqihar 161006,China)AbstractAbstract:Aiming at the forecasting problem of public transport passenger volume,combining the advantages of ARIMA,grey prediction and BP neural network,the dynamic weight is calculated by the sum of the squares of errors in the near period,the modif
4、ied dynamic weighted combination model is established by defining emergency events as impact factorsThe public transport passenger volume of Beijing from 1978 to 2021 is selected for empirical analysisThe empirical analysis results show that the modified dynamic weighted combination model has better
5、 prediction effect than the single model and the fixed weight combination model Key wordsKey words:public transport passenger volume;modified dynamic combination model;ARIMA model;grey predictive model;Back-propagation neural network model;emergency event 城市公共交通客运量是城市公共交通规划的重要依据,也是确定行车计划,经济合理地使用车辆,改
6、善提高公共交通质量所不可缺少的数据城市公共交通是指在城市人民政府确定的区域内的公共汽(电)车(含有轨电车)、城市轨道交通系统和有关设施城市公共交通是城市基础设施的重要组成部分,对城市政治经济、文化教育和科学技术等方面的发展影响极大,也是城市建设的一个非常重要的方面发展城市交通不仅是缓解城市交通拥堵的有效措施,也是改善城市居住环境,促进城市可持续发展的必然要求 新冠肺炎疫情对于我国各行各业都产生了不小的影响,其中公共交通运输业也受到了很大的冲击公共交通运输业属于国民基础产业,在社会再生产过程中起到先导性和战略性作用对于交通运输业来说,收稿日期:2022-09-09 基金项目:黑龙江省自然科学基金
7、项目(LH2019A027)作者简介:郭婷婷(1998-),女,黑龙江齐齐哈尔人,在读硕士研究生,从事时间序列分析研究E-mail: 通信作者:宇世航(1971-),女,黑龙江齐齐哈尔人,教授,博士,从事整值时间序列和复杂数据统计推断研究E-mail: 32 高 师 理 科 学 刊 第 43 卷 建立有效应对突发状况的体系,降低突发事件对交通运输的影响,保障公共交通运输的正常运行至关重要因此,在预测客运量的过程中应考虑突发事件带来的影响,单纯依靠时间序列的预测会导致结果偏离实际情况 目前,对于公共交通客运量的预测研究国内外学者已经进行了大量的工作,但多数集中于单一模型的研究文献1使用网络克里金
8、法估计乘客量,用网络距离来反映地铁站只通过地铁隧道连接的事实徐文远2等对公共交通客运量的影响因素进行分析,建立 ARMA 时间序列模型对公交客流量进行拟合和预测 丁聪3等基于梯度提升和随机森林的混合模型对日均客流量进行预测,发现此模型相较于常规 ARIMA 模型和随机森林模型具有更好的适应性王莹4等总结北京地铁进站客流量的波动规律,选用季节时间序列模型对北京地铁进站客流量进行时间序列建模 卢小兰5等使用 Holt-Winters 模型和 SARIMA 模型分别预测铁路的月度客运量,并构建组合预测模型张健6等采用一种时空模型平均方法,有效地降低了由于航空客运量的结构性变化和预测模型不确定性等导致
9、的预测风险,进而做出精准而稳定的客运量预测近年来,组合模型被广泛地应用于各种预测问题中7,组合模型能够结合单一模型的优点,避免其局限性关于突发事件方面,汪志红8基于新冠肺炎疫情对日常生活的影响构建了 ARIMAX 干预模型,模型显示我国铁路客运正在缓慢持续回暖 鉴于以上的分析方法,本文构建修正的动态组合模型,采用 ARIMA、GM(1,1)灰色模型、BP 神经网络对北京市公共交通客运量(包括北京市公共电汽车和轨道交通)进行预测,并利用种模型加权做动态组合,同时考虑突发事件作为影响因子,根据线性回归描述新冠疫情对公共交通客运量的影响,利用每个月公共交通客运量对当年公共交通客运量的占比,得出月公共
10、交通客运量的预测值,计算新冠疫情对公共交通客运量的影响因子将模型用于预测公共交通客运量,可以保证预测结果符合当前疫情下的公共交通客运量变化情况 1 公共交通客运量模型构建 1.1 ARIMA 模型 ARIMA 模型是一种时间序列预测的方法,由自回归(AR)模型和移动平均(MA)模型共同组合而成,因此又被称作差分整合移动平均自回归模型自回归移动平均模型记为ARIMA(,)pdq,其中:p,q是模型的自回归及移动参数;d是差分的阶数 对非平稳性时间序列进行差分,使之变为平稳性时间序列选择合适的 ARIMA 模型,意味着要选择合适的p值和q值,根据自相关系数和偏自相关系数,结合经验不断尝试确定模型的
11、自回归和移动参数,做出模型残差的自相关与偏自相关图,并检验残差是否为白噪声序列如果通过检验,证明信息提取充分,模型拟合较好,可以进行预测 1.2 GM(1,1)灰色模型 灰色系统理论通过对少量不规则的数据进行变换处理使之体现准指数特征,再进行建模9为确定数据是否适合灰色模型,需要对数据进行级比检验,通过级比检验后才可以建立GM(1,1)灰色模型 为检验模型的准确性,使用关联度检验法、后验差比值和小误差概率检验灰色预测模型的效果 1.3 BP 神经网络模型 神经网络方法是一种具有高度灵活性的非线性拟合方法,理论上可以拟合任何函数,并且达到非常高的拟合精度10BP 神经网络是一种按误差反向传播(简
12、称误差反传)训练的多层前馈网络,它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小 BP 神经网络是在输入层与输出层之间增加若干层神经元(见图 1),它们与外界没有直接关系,但它的状态可以改变,从而影响输入层与输出层之间的关系其过程主要分为个阶段,第阶段是信号的前向传播,从输入层经过隐含层,最后到达输出层;第阶段是误差的反向传播,从输出层到隐含层,最后到输入层,依次调节隐含层到输出层的权重和偏置,输入层到隐含层的权重和偏置神经网络的拟合过程就是不断地优化连接相应层神经元之间的参数 为了加快训练速度,避免陷入局部最小值和改善其他能力,学习算法可采用带
13、动量的批处理梯度下降法11 第 1 期 郭婷婷,等:基于修正动态组合模型对公共交通客运量的预测 33 1.4 修正的动态组合模型 1.4.1 加权动态组合 ARIMA 模型只能建立线性的模型,不能捕捉到非线性的部分,GM(1,1)灰色模型对以往的数据有很强的依赖性,BP 神经网络层数以及各节点数都没有相应的理论指导且容易陷入极小值分别计算 3 种模型的误差平方和,误差越大的模型预测精度越低,相应的所占权重就越小,通常用预测误差平方和的倒数来计算权重12 目前大部分研究中所使用的权重都是固定的权重,但预测模型的误差都是动态的,这会导致预测效果不稳定,因此结合经济问题预测的临近期,对不同的预测模型
14、,只采用临近期的误差平方和来计算权重,建立动态组合模型 计算第i种预测模型预测期T时刻前p期的预测误差平方和,随着预测期T的改变,前p期的预测平方误差和iE会随之改变,具体公式为 12,1,2,3Tiitt TpEei-=-=(1)式中:ite为第i个模型在第t年的误差;1,2,3i=分别对应 ARIMA 模型、GM(1,1)灰色模型、BP 神经网络模型 权重系数会随着预测期的不同随之发生改变,第i种预测模型的权重系数为 1311,1,2,3iijjEiE-=(2)1.4.2 影响因子 新冠肺炎疫情作为突发公共卫生事件,从多个渠道给经济运行带来负面影响公共交通客运量能够直观地反映出此次突发事件
15、对于人民生活的影响 采取线性回归将新冠疫情对公共交通客运量的影响描述出来,之后对正常情况下的公共交通客运量进行预测,根据不同月份公共交通客运量的占比,计算出月度公共交通客运量的预测值,通过对比,可以得出新冠疫情对公共交通客运量的影响值,影响值可以用于修正预测模型,更准确地预测突发事件影响下的公共交通客运量具体计算公式为,1,2,1,2,12ijijiarijA=(3)211,1,2,1,2,122jijirrij=(4)100%ijijijaaIa-=(5)式中:ijr为第i年第j月公共交通客运量占当年公共交通客运量的占比;ija为第i年第j月公共交通客运量实际值;iA为第i年当年公共交通客运
16、量;jr为第j月公共交通客运量占当年公共交通客运量的占比的均值;I为影响值;ija为第i年第j月公共交通客运量预测值;1,2i=分别为 2020 年和 2021 年 2 实证分析 文中使用的 19782021 年北京市公共交通客运量数据来源于北京市统计年鉴,新冠肺炎病例数据来源于锐思数据库()2.1 ARIMA 模型 对数据进行一阶差分,使公共交通客运量数据变为平稳序列进行预测ADF 单位根检验结果为Dickey-Fuller=-5.630 20,P=0,认为差分后的序列为平稳序列使用自动建模功能得到的最优模型为 图 1 BP 神经网络结构 34 高 师 理 科 学 刊 第 43 卷 ARIMA(0,1,0),AICc(矫正 AIC 值)为 906.36 对数据进行预测,利用 Forecast 中的 ARIMA 函数进行预测分析,结果见图 2,其中 139 期分别为19782016 年,向后 13 期分别为 20172019 年,其公共交通客运量预测值均为 734 953 万人,预测误差平方和在 0.002 60.009 6 之间,模型预测情况良好 年公共交通客运量/万人 期/年 图