收藏 分享(赏)

基于组合模型的新能源汽车销量预测方法_王欢.pdf

上传人:哎呦****中 文档编号:2258506 上传时间:2023-05-04 格式:PDF 页数:6 大小:2.06MB
下载 相关 举报
基于组合模型的新能源汽车销量预测方法_王欢.pdf_第1页
第1页 / 共6页
基于组合模型的新能源汽车销量预测方法_王欢.pdf_第2页
第2页 / 共6页
基于组合模型的新能源汽车销量预测方法_王欢.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 22卷 第 2期2023年 2月Vol.22 No.2Feb.2023软 件 导 刊Software Guide基于组合模型的新能源汽车销量预测方法王欢,李民,焦宇,余开朝(昆明理工大学 机电工程学院,云南 昆明 650500)摘要:在汽车行业,企业需要对汽车的销量进行准确预测,以制定科学合理的生产计划。为此,以新能源汽车为例,利用历史销量数据构建基于传统时间序列理论的ARIMA预测模型和基于深度学习的LSTM预测模型,并利用Stacking方法对以上两种模型进行集成。实验结果表明,组合模型的平均绝对百分比误差为3.65%,相较于ARIMA(0,1,1)模型和LSTM模型分别降低2.57%

2、和1.86%。该方法可为新能源汽车生产计划提供数据参考,并适用于其他类型汽车。关键词:新能源汽车;销量预测;组合预测模型DOI:10.11907/rjdk.221269开 放 科 学(资 源 服 务)标 识 码(OSID):中图分类号:TP311 文献标识码:A文章编号:1672-7800(2023)002-0136-06New Energy Vehicle Sales Forecasting Method Based on Combination ModelWANG Huan,LI Min,JIAO Yu,YU Kai-chao(School of Mechanical and Electr

3、ical Engineering,Kunming University of Science and Technology,Kunming 650500,China)Abstract:In view of the problem that enterprises need to accurately predict the sales volume of vehicles in order to formulate a scientific and reasonable production plan in the automotive industry,taking new energy v

4、ehicles as an example,using the historical sales volume data to build a ARIMA prediction model based on traditional time series theory and an LSTM prediction model based on deep learning,and uses the Stacking method to integrate the above two models.The experimental results show that the average abs

5、olute percentage error of the combined model is 3.65%,reduced by 2.57%and 1.86%respectively,compared with ARIMA(0,1,1)model and LSTM model.This method can provide data reference for the production plan of new energy vehicles,and is applicable to other type of car.Key Words:new energy vehicles;sales

6、forecast;combined forecasting model0 引言传统汽车虽然便于人们出行,但带来了严重的环境污染和能源消耗。新能源汽车在保护环境、降低能耗、减少碳排放等方面优势明显,随着人们环保意识日益提高,国家对新能源汽车的补贴政策,使得新能源汽车销量剧增。为此,制定科学、合理的新能源汽车生产计划和营销策略至关重要。本文基于数据挖掘技术,结合新能源汽车历史销量数据对未来销量进行预测,并对不同模型的预测效果进行比较分析,为预测新能源汽车或其他类型汽车的销量提供参考与借鉴。1 相关研究在需求预测方面,主要包括定性和定量预测。其中,定性预测仅依靠主观判断预测商品销量,常用方法包括德尔

7、菲法、小组讨论法等1;定量预测则利用数据建立数学模型进行预测,常用模型包括因果模型、时间序列模型、灰色预测模型、神经网络模型等。定性预测对专家技能和经验要求较高,主观性较强;定量预测效果则与预测模型相关,不受研究者主观因素影响。目前,研究者们通常构建时间序列模型、回归模型、神经网络等模型预测汽车销量。例如,Chen2根据月销售数收稿日期:2022-03-14基金项目:云南省智能化自动化产业发展研究项目(YNDR2017G1C06)作者简介:王欢(1995-),女,昆明理工大学机电工程学院硕士研究生,研究方向为数据挖掘;李民(1973-),女,博士,昆明理工大学机电工程学院副教授、硕士生导师,研

8、究方向为智能化自动化制造;焦宇(1997-),男,昆明理工大学机电工程学院硕士研究生,研究方向为企业信息化及系统工程;余开朝(1962-),男,硕士,昆明理工大学机电工程学院教授、硕士生导师,研究方向为生产及制造系统工程。本文通讯作者:李民。第 2 期王欢,李民,焦宇,等:基于组合模型的新能源汽车销量预测方法据建立自回归移动平均模型(Auto-regressive Moving-Average,ARMA)销量预测模型。Hlsmann等3利用时间序列理论和决策树算法预测美、德两国的汽车销量。吴奇等4考虑影响汽车销量的汽车价格波动、销售人员的能力、品牌知名度等因素,构建基于混沌支持向量机的汽车销量

9、预测模型。彭友5在构建BP神经网络乘用车销量预测模型时,考虑消费者信息指数、贷款基准利率和汽油价格因素,在一定程度上提高了模型预测精度。研究表明,关键词百度指数在一定程度也影响着产品销量6-13。例如,Dean等14利用谷歌搜索数据建立多变量汽车销量预测模型。谢天保等15提取某品牌网络搜索数据的关键特征建立随机森林预测模型,并将该模型与线性回归、支持向量回归等模型进行比较以验证模型的先进性。蒋楷丞等16在线性回归模型中考虑汽车评论数据和宏观经济指标的影响因素。结果表明,加入评论数据中包含的消费者感情色彩和宏观经济指标,可有效提升模型预测精度。然而,网络搜索关键词并未形成统一方法,仅根据研究人员

10、主观确定或依靠统计模型筛选关键词,会因个人主观因素影响模型预测精度17-20。此外,搜集关键词数据的工作量较大,使用爬虫技术获取一定信息后会受到网站监控,甚至封停IP。为此,本文提出一种基于历史销量数据的销量预测模型,既减少数据收集时间,又能提升预测精度,为企业决策提供数据支持。通过基于传统时间序列和LSTM预测的组合销量预测模型对新能源汽车销量进行预测,实验表明该模型能在减少数据处理时间的同时,提升预测精度。2 传统预测模型2.1时间序列模型按照时间先后顺序排列的动态序列数据称为时间序列,现已被广泛应用于计量经济学、智慧交通、天气预报等领域,预测的实质就是研究变量的变化规律21。时间序列模型

11、22主要包括自回归模型、移动平均模型(Moving-Average,MA)、自回归移动平均模型(ARMA)和自回归单整移动平均模型(ARIMA(p,d,q)。(1)自回归模型(Auto-regressive,AR)。公式如下:yt=1yt-1+2yt-2+pyt-p+t(1)其中,p为模型阶次,1、2,p为自回归系数,t为随机干扰误差项。为简便运算,引入滞后算子Bp表示p步的滞后算子,AR(p)可记为:(B)Yt=t(2)其中,(B)=1-1Y-pYp。(2)移动平均模型。该模型主要研究时间序列与当期和前期随机干扰项的线性组合,用数学语言可表示为MA(q):yt=t-1t-1-qt-q(3)其

12、中,1、2,q为滑动平均系数,t均值为0,方差为2的白噪声序列。引入滞后算子可记为:yt=(B)t(4)(B)=1-1B-2B2-qBq(5)(3)自回归移动平均模型。将自回归和移动平均两种方法组合构造ARMA(p,q)模型,即将序列值误差、冲击值及序列值线性组合,数学表达式为:yt=1yt-1+2yt-2+pyt-p+t-1t-1-qt-q(6)使用滞后算子为:(B)xt=(B)t(7)(4)自回归单整移动平均模型。由于实际时间序列并非全属于平稳数据,因此需要对非平稳的原数据进行差分处理,d表示差分阶数。数学表达式为:(B)dXt=(B)t(8)其 中,(B)=1-1B-2B2-pBp,(B

13、)=1-1B-2B2-qBq,d=(1-B)d,t与Xt-1,Xt-p独立且tWN(0,2)。2.2LSTM神经网络循环神经网络(Recurrent Neural Network,RNN)擅长处理序列数据23,但存在严重的梯度消失问题,阻止模型深入学习变量间的长期依赖关系。LSTM 网络是 RNN 的变体,被广泛用于机器翻译、股票预测等方面24。研究表明,LSTM模型在训练过程中会选择性的丢弃部分记忆,强制更新隐藏状态,以缓解模型梯度消失问题。因此,在大量样本数据情况下,LSTM模型相较于标准RNN模型效果更好。由图1可见,LSTM网络主要由输入门(input gate)、遗忘门(forget

14、 gate)、输出门(output gate)、单元状态及隐藏状态构成25。其中,单元状态指 LSTM单元的内部记忆,隐藏状态指外部隐藏状态,输入门确定送入单元状态的个数,遗忘门确定送入当前单元状态的个数,输出门确定输出到隐藏状态的单元状态。遗忘门采用元素乘法(记为)控制先前记忆细胞Ct-1、上一时间步的隐藏状态及当前输入Xt是否传递到当tanh+隐藏状态:Ht-1输入:XtHtCt遗忘门输入门候选记忆细胞输出门tanch记忆细胞:Ct-1 Fig.1LSTM model图1LSTM模型 1372023 年软 件 导 刊前时间步,输入门通过候选记忆细胞Ct控制Xt进入当前记忆细胞的方式,输出门

15、利用tanh激活函数控制记忆细胞将记忆传递至隐藏状态(tanh 值趋于 1)或保存在记忆细胞(tanh值趋于0)。2.3Stacking集成方法在实际研究过程中,研究对象通常会受多种因素影响,每种研究模型的理论知识和侧重点也不同,仅基于一种方法进行预测无法客观、全面了解研究对象的潜在规律。为此,本文将传统时间预测模型和LSTM网络进行融合,提高模型预测精度。其中,融合模型可分为以下两类:(1)对组合模型各结构赋值权重。计算公式如下:fi=1f1t+2f2t+ifit(9)其中,i为每个模型所赋的权重。(2)深度学习模型。主要包括随机森林法、Bagging法、Boosting法、Stacking

16、法等。由于Stacking进行模型集成时,强调了学习器间的区别26,因此本文选取该方法进行实验。具体为,首先基于初始样本集拟合多种预测模型;然后利用各模型的预测结果组成新的数据集;最后基于新数据集构建最终预测模型。3 模型构建3.1数据获取数据来源于中国汽车工业协会(http:/ Absolute Percentage,APE)和平均绝对百分比误差(Mean Absolute Percentage,MAPE)评估模型,具体公式如下:APE=|fi-yiyi|(10)MAPE=100ni=1n|fi-yiyi(11)3.3ARIMA模型3.3.1数据处理利用 Eviews 软件的 CensusX-12 算法对数据进行检验,研究销量历史数据是否存在季节周期规律,再对销量数据进行乘法季节分解。由图2可见,分解后的数据存在明显季节周期规律。图3为对剔除季节因素影响后的数据。同时,记录原数据的季节系数,以便于后期进行数据恢复。在建立ARIMA模型前,需要对数据进行平稳性检验。首先,对剔除的季节规律影响销量数据(记为 Y_sa)进行ADF检验。然后,对Y_sa进行差分处理得到差分数据(记为 Dy_

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2