1、浙江科技学院学报,第 卷第期,年月 ,:收稿日期:基金项目:国家自然科学基金项目()通信作者:胡月(),男,河南省西峡人,教授,硕士,主要从事概率论极限理论与金融精算研究。:。多时间尺度下变体生成式对抗网络的股价预测付乐,胡月,董虹伶,翟佳阳(浙江科技学院 理学院,杭州 )摘要:股价预测能为公司经营、投资决策和市场监管提供重要依据。【目的】为了避免特征提取不足与预测不准等问题,我们构建了多时间尺度下变体生成式对抗网络对股价涨跌方向进行预测。【方法】首先以双向长短期记忆网络构造生成器,以卷积神经网络构造判别器;然后分别对生成器与判别器在多时间尺度数据上进行博弈训练,提取长期与短期特征后将结果拼接
2、;最后获得预测模型。【结果】选取沪深 指数、建设银行与陕西煤业股价为样本进行实证分析,试验发现沪深 指数涨跌预测准确率达到 ,个股数据验证表明本文模型具有一定的稳定性与优越性。【结论】本模型能提高预测股价涨跌的准确率,丰富了金融数据分析方法。关键词:股价预测;多时间尺度;生成式对抗网络;双向长短期记忆网络;卷积神经网络中图分类号:文献标志码:文章编号:(),(,):,;,;,:;股票价格预测是金融领域重要且具挑战性的问题之一,故吸引了很多研究者。研究结果表明,股票市场是可预测的,合理准确的股价预测能产生较高的财务收益,并可对冲市场风险。但股价走势受众多因素的共同影响,呈现出非线性、非平稳性、低
3、信噪比与长记忆性等特点,是一个极为复杂的动力学系统。正因如此,一般方法很难挖掘到股票价格中的有效特征进行预测。年 提出有效市场假说,该理论认为股价波动服从随机游走而不具有可预测性。但在之后的研究中对市场有效性程度争论不断,等认为金融市场并不总是具备市场有效性的。实际上,信息经济学研究者认为市场要想实现真正的有效性,就必须具有必然的无效性。随着关于金融市场的研究逐步深入,等发现,相比短期市场,股票市场会存在中期惯性和长期反转,从而可预测性更高。年 提出适应性市场假说,该理论认为市场环境不断变化,投资者要求的风险溢价时变性造就了金融市场的可预测性,而市场具有可预测性是维持其有效性必不可少的动力。解
4、决股票价格预测问题的模型可归结为两类。由于股票价格是一种时间序列,其传统预测方法是利用计量经济学模型根据获取到的历史数据对未来值进行预测,因此第一类划分为计量经济学模型。常用方法有自回归模型(,)、移动平均模型(,)、自回归移动平均模型(,)和差分移动平均自回归模型(,),如 等 利用差分移动平均自回归模型对中型股进行趋势预测。第二类是基于软计算的模型。由于金融时间序列存在高维度、非线性等特点,这些基于软计算的模型从过去的支持向量机(,)与随机森林(,)等传统机器学习模型逐渐演化为卷积神经网络与循环神经网络等深度学习模型。深度学习从 年开始逐渐成为人工智能领域热门技术之一,在语音识别、计算机视
5、觉 与自然语言处理 领域取得了巨大的成功。近年来,研究者探索深度学习在金融领域的应用,已经取得了初步成果:如 等 成功运用 (,长短期记忆网络)方法预测了指数时间序列。杨青等 的研究发现深度学习在预测精度与预测结果稳定性方面优于、(,多层感知机)及 ;乔若羽 的研究结果表明 和 (,门控循环单元)的预测精度高于卷积神经网络(,)等多种深度学习方法。年 等 提出了生成式对抗网络模型(,),它通过生成器和判别器互相博弈学习生成更精确的数据,以实现纳什均衡为最终优化目的。最近几年广泛应用于复杂分布上,一经提出就迅速成为深度学习领域新的研究热点,同时其相关理论研究与实践应用也在迅速扩展。目前,已经成功
6、地应用于图像修复、语义分割和视频预测 等领域,等 发现 在真实数据上的收盘价预测方面优于 。综合上述文献可知,深度学习因对复杂非线性序列具备强大的拟合能力而在股价预测方面体现出了一定的优势。但当前对深度学习在金融市场的应用研究还存在一些不足:一是多数研究是预测股价数值而非涨跌方向,这样的预测结果并不具备实用性;二是当前很多研究只是使用一种时间尺度下的数据进行预测,不能充分提取研究对象的有效信息。为解决上述问题,本研究提出一种基于目前深度学习领域中热点模型 的变体模型 (,基于双向长短期记忆网络的生成式对抗网络)对沪深 指数收盘价第期付乐,等:多时间尺度下变体生成式对抗网络的股价预测格进行预测,
7、并使用大众熟悉且历史股价稳定的建设银行与陕西煤业股票数据进行模型有效性验证。方法与模型图多时间尺度 模型结构 本研究提出利用对抗训练模拟经验丰富的股票交易员使用指标数据预测股价,然后用历史数据判断预测是否准确,并充分利用不同时间尺度数据来同时提取长期(日交易数据)与短期(交易数据)信息,以实现更优的预测效果。多时间尺度 模型结构如图所示,图中,“”表示下一交易日股价将会上涨,“”表示下一交易日股价将会下跌。我们分别将不同时间尺度数据进行预处理,然后输入 模型中,再将两个时间尺度下得到的数据输入判别模型中进行处理,得到最终预测结果。数据准备原始数据输入主要包括两个部分:股票日交易数据和 交易数据
8、。在进行数据预处理之前,首先通过原始数据生成对应时间尺度的相关技术指标数据(技术指标见表)、傅里叶变换提取到的股票整体与局部趋势数据及基于 降噪后的预测价格,以便尽可能多地挖掘该股票的有效信息。然后对数据质量进行统计检查,以确保数据不受异方差、多重共线性和序列相关性的影响。最后利用一种基于梯度提升树回归的算法 (,极端梯度提升模型)进行特征重要性分析与筛选,从而获得对目标股票具有解释力的特征。表技术指标 指标含义指标含义 移动平均值 上布林带 移动平均值 下布林带 异同移动平均线 指数移动平均值 指数移动平均值 动量指标 指数移动平均值 对数动量指标获取的股票数据可能存在缺值与乱序错误,因此为
9、了取得合格数据需进行排序与插值 等处理。分析中使用的输入数据包括原始数据的开盘价、收盘价、最高价、最低价、交易量、数据准备阶段获取的技术指标与基于 降噪后的预测价格,共 项。为了消除各输入数据数值大小与计量单位不同的影响进而使得数据具有可比性,需进行标准化处理,计算公式如下:。()式()中:为标准化时间序列数据;与 分别为输入时间序列数据的最小值与最大值。将标准化后的数据以划分为训练集与测试集:训练集用于训练模型与调整参数,测试集用于对模型进行测试评估。生成式对抗网络可以模拟金融交易员操作,其核心思想是博弈论中的纳什均衡,模型通过 框架中生成器和判别器进行联合对抗训练。生成器的目的是利用真实数
10、据生成样本数据,而判别器则是用来识别输入其中的数据是真实数据还是生成的样本数据。经过一系列迭代优化,当判别器无法准确判断出数据来源时,生成器与判别器达到纳什平衡,对抗训练结束。这样我们就得到一个生成器,这个模型可以生成我们所需要的数据。模型参考 的原理来修改其网络结构,如图所示。浙江科技学院学报第 卷图 结构图 生成器生成器结构主体采用双向长短期记忆网络,该网络具有优良的金融时间序列数据处理能力,网络结构如图所示,其中表示输入量。由前向 与后向 组合而成,最终每个时间步输出,表示拼接操作,即如果 的隐含层维度是,那么 的维度则为 。经过多次试验后发现,单循环层为 个神经元时 生成器模型预测效果
11、较好,此时 神经元数为 。是一种在长期信息学习中表现出优越性的基本深度学习模型,其内部单元设计了输入门、输出门与遗忘门等结构,通过各个门对保存在细胞状态中的长期信息进行修改来实现选择性记忆与遗忘信息。内部单元结构如图所示。图 网络结构 图 内部单元结构 内部单元更新信息过程如下:(,);()(,);()(,);();()(,);()()。()式()()中:为 激活函数;为 激活函数;为单元输入向量;为上一时刻记忆单元的输出;表示遗忘门,用于决定丢弃细胞状态中哪些信息;与分别为遗忘门的权重与偏置项;表示输入门,用于决定哪些信息需要添加到细胞状态中;与分别为输入门的权重与偏置项;第期付乐,等:多时
12、间尺度下变体生成式对抗网络的股价预测为备选值向量,用于添加到新的细胞状态中;表示通过遗忘门与输入门更新细胞状态的过程;表示输出门,用于决定输出细胞状态中哪些信息。与分别为输出门的权重与偏置项;为该时刻记忆单元的输出。判别器图 结构 判别器结构主体采用,经多次试验后发现,三层卷积层与两层全连接层的 效果最佳。其中每个卷积层依次有、个卷积核,卷积核尺寸为与两种规格,卷积按照步进行,全连接层为两层,每层为 个神经元,结构如图所示。是一类带有卷积结构的深度前馈人工神经网络,由输入层和输出层及多个隐含层组成,其隐含层通常由卷积层、池化层与全连接层组成。卷积层通过卷积核进行特征提取的过程可以表示如下:,(
13、)。()式()中:,为提取到的特征;,与分别为共享权重与偏置量;与分别为局部感受野的长和宽;,为卷积层接收到的数据。通过卷积层抽取特征后,再经全连接层进行分类得到输出项。对抗训练在实际操作中,生成器与判别器交替优化:)优化判别器,将真实数据与样本数据输入中,最大化的判别准确率;)优化生成器,将数据输入中,最小化的判别准确率。本文模型的迭代次数设为 次,批处理大小设为 ,学习率设为 ,优化器采用 ,它可以动态调整模型中参数的学习率。由此生成的样本数据质量与模型收敛速度都有很大的提高。为清楚起见,我们使用 (,随机梯度下降法)进行迭代,批处理大小设置为,然后通过对样本的损失求和将该算法推广到批处理
14、大小为。设(,)为数据集样本,为了使判别器尽可能地判断不出数据来源,生成器应减少对抗性损失。的对抗性损失:()(),)。()式()中:为预测值;为 交叉熵损失,定义如下:(,)()()()。()式()中:为判别器输出特征;为对应的标签。但实践证明仅将对抗性损失最小化并不能保证生成样本无限接近真实数据。为解决这个问题,生成器还应减少预测误差损失,其定义如下:(?,)。()式()中:或;是真实值。此外,我们定义方向预测损失函数 如下:(?,)()()。()将上述定义的项损失与参数 ,与 相结合就得到的最终损失如下:(,)()(?,)(?,)。()保持权重不变,迭代使(,)最小化。设(,)为不同的数
15、据样本,由于只是为了确定输入序列是还是,目标损失等于上的对抗性损失。当权重保持不变时,迭代使目标损失最小化:(,)(?,)(),)(?),)。()按照上述步骤交替训练生成器与判别器,最终生成器生成的数据无限接近真实数据,当判别器无法浙江科技学院学报第 卷准确判断出数据来源时,训练结束。实证分析 数据来源以沪深 指数为主要研究对象,利用多时间尺度 模型预测下一交易日股价涨跌方向,然后使用大众熟悉且历史股价稳定的建设银行与陕西煤业两只股票数据用于验证模型有效性。股票交易信息来源于同花顺终端 ,选取 年月日到 年 月 日的沪深 指数日交易和 交易数据:包括开盘价、收盘价、最高价、最低价与交易量。其中
16、,日交易数据有 条,交易数据有 条。把要输入模型中的数据按照 节所述方法进行预处理。沪深 指数训练集与测试集划分示意如图。在日交易尺度与 交易尺度上设置时间步长分别为 与,即利用交易日前 日收盘价结合交易时间前 个 收盘价预测下一交易日收盘价涨跌方向。进行数据预处理之前,通过原始数据生成对应时间尺度的相关技术指标数据及基于 降噪后的预测价格,以便尽可能多地挖掘该股票的有效信息。图沪深 指数训练集与测试集划分示意 模型评价指标与基准模型本研究选用均方误差(,)、均方根误差(,)及分类任务评价指标中的准确率、精确率、召回率与值作为模型预测效果的评价指标。其中,准确率指预测正确样本数占总体样本数的比例;精确率指预测将要上涨样本中实际上涨样本所占的比例;召回率指实际上涨样本中预测将要上涨样本所占的比例;值指精确率与召回率的调和平均。与 为数值预测评价指标,其计算公式分别如下:();()()。()式()()中:,为预测值;,为真实值。就预测值而言,与 越小,预测误差越小,模型的预测效果也就越好;反之效果越差。就预测涨跌方向而言,准确率、精确率、召回率与值越高,模型预测效果越好;反之预测效果越差。