1、Modeling and Simulation 建模与仿真建模与仿真,2023,12(4),3360-3365 Published Online July 2023 in Hans.https:/www.hanspub.org/journal/mos https:/doi.org/10.12677/mos.2023.124308 文章引用文章引用:陈德慧.ARIMA 模型在股价预测上的应用J.建模与仿真,2023,12(4):3360-3365.DOI:10.12677/mos.2023.124308 ARIMA模型模型在在股价预测上的应用股价预测上的应用 以以中中国银行为例国银行为例 陈德慧
2、陈德慧 上海工程技术大学管理学院,上海 收稿日期:2023年4月13日;录用日期:2023年6月27日;发布日期:2023年7月5日 摘摘 要要 随着我国资本市场的扩大开放,国外资本进一步流入我国股市,中国股市迎来新的挑战与机遇。金融市随着我国资本市场的扩大开放,国外资本进一步流入我国股市,中国股市迎来新的挑战与机遇。金融市场股票的价格预测问题再次成为公众关注的热点。基于此,选取金融市场股票的历史收盘价数据,以场股票的价格预测问题再次成为公众关注的热点。基于此,选取金融市场股票的历史收盘价数据,以R为实现工具,通过建立为实现工具,通过建立ARIMA模型来进行模型来进行分析分析与预测,为股市投资
3、者提供帮助。与预测,为股市投资者提供帮助。关键词关键词 ARIMA模型模型,股价股价,短期预测短期预测 Application of ARIMA Model in Stock Price Prediction Taking Bank of China as an Example Dehui Chen School of Management,Shanghai University of Engineering Science,Shanghai Received:Apr.13th,2023;accepted:Jun.27th,2023;published:Jul.5th,2023 Abstrac
4、t With the expansion and opening up of Chinas capital market,foreign capital further flows into Chinas stock market,and Chinas stock market faces new challenges and opportunities.The price prediction of stocks in financial markets has once again become a hot spot of public concern.Based on this,this
5、 paper selects the historical closing price data of stocks in the financial market,and uses R as the realization tool to analyze and predict by establishing ARIMA model,so as to provide help for stock market investors.陈德慧 DOI:10.12677/mos.2023.124308 3361 建模与仿真 Keywords ARIMA Model,Stock Price,Short
6、-Term Forecast Copyright 2023 by author(s)and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 股票市场在金融领域中一直有着举足轻重的地位。股票价格的波动能够在一定程度上反映一个国家经济周期的变化。近年来随着经济的发展和疫情的冲击,股票的价格再次引发了大家广泛的关注。韩金磊等采
7、用长短期记忆网络(LSTM)和灰色模型对股价进行预测研究1;荆思寒等基于 A 股上市公司股票交易数据建立了股票风险传染模型2;左川等记录了深度学习在股票投资领域中的应用3。股票是经济的晴雨表,无论是对于国家还是对于投资者来说股价预测都具有重要的意义4 5。股票价格往往对时间因素非常敏感,因此本文建立 ARIMA 时间序列模型对短期股票价格进行分析与预测。2.模型的模型的建立建立 2.1.ARIMA 模型的定阶方法模型的定阶方法 ARIMA模型的定阶方法主要是通过观察自相关图和偏自相关图,根据其系数的相关特性来判断阶数。若 AC 是拖尾的,PAC 是 p 阶截尾的,则选择 AR(p)模型;若 P
8、AC 是拖尾的,AC 是 q 阶截尾的,则选择 MA(q)模型;若 AC 和 PAC 都表现为拖尾性,则选择 ARMA(p,q)模型,然后通过模型的参数检验,进一步判断 p、q 的阶数。由于样本具有随机性,相关系数并不会表现出完美截尾的情况,通常会呈现出小值振荡的情况,这就给模型的定阶带来了一定的困难。根据以往的经验,如果样本自相关系数或偏自相关系数在初始的 d 阶明显大于两倍标准差范围,其后几乎 95%的自相关系数都在两倍标准差范围内,并且由非零自相关系数衰减为小值波动的过程非常突然,这时可以视为自相关系数或偏自相关系数 d 阶截尾。2.2.ARIMA 模型建模步骤模型建模步骤 构建 ARI
9、MA 模型的大致步骤有以下几个:(一)序列的平稳性。首先,需要观察原序列是不是平稳的6。当原序列不是平稳的情况时,可以选择一些合理的方法让原序列变成平稳的,如差分转化。(二)模型的定阶。通过软件能够计算得出序列特征的自相关系数与偏自相关系数等。ARIMA 模型的滞后阶数 p 和 q 再利用其他方法确定。(三)模型的构建。构建该模型的残差序列是否是正态分布的也值得关注。残差序列的自相关图以及偏自相关图可以观察得出其结论,或运用检验序列相关的方法来测试残差序列的随机性。(四)模型的预测。经过了上面的步骤后就大致拟合出了模型,并可以在未来的短期时间里进行股价的预测7。3.关于股票价格的预测关于股票价
10、格的预测 选取中国银行(601988)2022 年 4 月 10 日至 2023 年 4 月 10 日的股票日开盘价数据。基于 ARIMA 模Open AccessOpen Access陈德慧 DOI:10.12677/mos.2023.124308 3362 建模与仿真 型的建模理论,建立阶数 p=0,d=1,q=1 的 ARIMA(0,1,1)模型对中国银行未来三天的股票日开盘价进行预测8。3.1.平稳性检验平稳性检验 3.1.1.时序图检验时序图检验 从图 1 的折线图大概可以推测出该序列数据可能并不是平稳的。因为股票的开盘价数据为原始数据,该数据在短期内波动是比较大的,在长期的时间序列
11、中也没有遵循显著的规律9 10。Figure 1.Timing diagram of opening price of China Bank 图图 1.中国银行开盘价时序图 3.1.2.单位根单位根(ADF)检验检验 为了更加精准得确认该序列是不是平稳的,对序列做 ADF 单位根检验。在显著性水平下,该序列的P 值大于 0.05,因此该时间序列的数据不是平稳的。对原始数据的时间序列进行一阶差分处理后,将一阶差分后的数据再次进行 ADF 检验。序列的 p 值小于显著性水平 0.05,因此推断出该序列属于平稳的时间序列。对于一阶差分后的数据再进行白噪声检验,该序列为非白噪声系列。综上,对以上结果分
12、析该序列为平稳非白噪声序列。3.2.序列的自相关图和偏自相关图并识别模型序列的自相关图和偏自相关图并识别模型 在对时间序列数据进行平稳性处理之后,需要利用 ACF、PACF 图,如图 2、图 3 所示来识别模型形式,并确定滞后阶数 p、q 的值。观察样本自相关图和偏自相关图,如图 2、图 3 所示。由图 2 可知自相关系数除了滞后一阶的数值较大,其他数值均在两倍标准差范围内做小值随机波动,并且相关系数衰减的过程非常突然,所以可以判断自相关系数为一阶截尾。由图 3 可知,偏自相关系数缓慢衰减且过程相当连续,呈现拖尾性质。综上,决定建立 ARIMA(0,1,1)模型来预测该序列,即模型的阶数 p=
13、0,d=1,q=1。但此推测仍然具有一些主观性,所以需要进一步检验来验证11。3.3.模型的拟合性检验模型的拟合性检验 完成上述参数估计步骤后,最关键的步骤就是要对该拟合模型的残差序列进行正态性检验12。我们 陈德慧 DOI:10.12677/mos.2023.124308 3363 建模与仿真 Figure 2.ACF diagram of first-order differential data 图图 2.一阶差分后数据的 ACF 图 Figure 3.PACF diagram of first-order differential data 图图 3.一阶差分后数据的 PACF 图 在
14、做序列拟合的时候,Y 应该是 X 的函数。但是现实并没有那么友善,往往会出现一些奇奇怪怪的事让X 与 Y 不符合这个函数。比如对身高的影响,一对双胞胎,从小一块长大,但是他们身高不可能完全一样。所以把这种只有上帝才知道怎么回事的变化叫做随机误差项,它本身就是随机的、不可预测的。我们所做的模型中的残差就是对这个随机误差的估计,残差如果不是随机的,那说明残差中的一部分还是与预测变量有关系,需要再继续拟合。如果它是随机的就可以认为它是对随机误差比较好的拟合,就可以认为你的可确定部分 X 提取了所有的可预测部分,证明你的模型是把所有的 X 提取全了。我们对文中所建模型的残差序列进行正态性检验,发现其残
15、差符合正态分布。表明所建模型拟合程度较好,可以较为准确地预测未知数据。3.4.对开盘价进行预测分析对开盘价进行预测分析 下面利用所构建的 ARIMA 模型对中国银行股票的日开盘价进行预测。由于 ARIMA 模型短期内预测陈德慧 DOI:10.12677/mos.2023.124308 3364 建模与仿真 的结果较为精确,因此本文只是对股票价格做出短期限内的预测,即 2023 年 4 月 11 日至 2023 年 4 月 13日的开盘价。如表 1 所示:Table 1.Opening price and forecast price results 表表 1.开盘价与预测价结果 日期 开盘价
16、开盘价预测 误差比 2023.4.11 3.43 3.15 0.0816 2023.4.12 3.46 3.18 0.0809 2023.4.13 3.49 3.24 0.0716 通过表 1 可以观察到,利用这个模型预测的中国银行股票 2023 年 4 月 11 日至 2023 年 4 月 13 日的开盘价分别是 3.43、3.46、3.49,误差比分别为 0.0816、0.0809、0.0716。我们发现实际值与预测值之间的误差比是比较小的,根据上述数据进一步证实了此次构建的模型是准确的。4.结语与建议结语与建议 本文对中国银行股票开盘价这一时间序列进行 ADF 单位根检验,绘制该序列的自相关图和偏自相关图。建立了阶数 p=0,d=1,q=1 的 ARIMA(0,1,1)模型对股票开盘价进行预测。由于 ARIMA 模型不能精确拟合股票价格的长期趋势,只适用于短期预测。于是我们运用该模型预测中国银行未来三天的股票开盘价13。模型预测中国银行股票 2023 年 4 月 11 日至 2023 年 4 月 13 日的开盘价分别是 3.43、3.46、3.49。真实值与预测值的误差比分别为