收藏 分享(赏)

国信证券_20181228_国信证券金融工程专题研究:递归神经网络RNN长短期记忆细胞(LSTM)的分行业多因子预测.pdf

上传人:a****2 文档编号:3052367 上传时间:2024-01-18 格式:PDF 页数:30 大小:1.24MB
下载 相关 举报
国信证券_20181228_国信证券金融工程专题研究:递归神经网络RNN长短期记忆细胞(LSTM)的分行业多因子预测.pdf_第1页
第1页 / 共30页
国信证券_20181228_国信证券金融工程专题研究:递归神经网络RNN长短期记忆细胞(LSTM)的分行业多因子预测.pdf_第2页
第2页 / 共30页
国信证券_20181228_国信证券金融工程专题研究:递归神经网络RNN长短期记忆细胞(LSTM)的分行业多因子预测.pdf_第3页
第3页 / 共30页
国信证券_20181228_国信证券金融工程专题研究:递归神经网络RNN长短期记忆细胞(LSTM)的分行业多因子预测.pdf_第4页
第4页 / 共30页
国信证券_20181228_国信证券金融工程专题研究:递归神经网络RNN长短期记忆细胞(LSTM)的分行业多因子预测.pdf_第5页
第5页 / 共30页
国信证券_20181228_国信证券金融工程专题研究:递归神经网络RNN长短期记忆细胞(LSTM)的分行业多因子预测.pdf_第6页
第6页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 金融工程研究金融工程研究 Page 1 证券研究报告证券研究报告深度报告深度报告 金融工程金融工程 Table_Title 金融工程专题研究金融工程专题研究 数量化投资数量化投资 2018 年年 12 月月 28 日日 相关研究报告:相关研究报告:金融工程专题研究:基于市场强弱下月初效应的指数投资方法 2018-08-13 金融工程专题研究:市场强弱下动态回撤率控制 2018-06-13 金融工程专题研究:指数调样掘金:做优质剔除股的中长期反转 2018-11-05 金融工程专题研究:单向波动差值择时之六:成交额过滤转多信

2、号的改进方法 2018-12-10 金融工程专题研究:降低调仓频率,获取超额收益 2018-08-01 证券分析师:黄志文证券分析师:黄志文 电话:0755-82133928 E-MAIL: 证券投资咨询执业资格证书编码:S0980510120059 证券分析师:邹璐证券分析师:邹璐 电话:0755-82130833-701418 E-MAIL: 证券投资咨询执业资格证书编码:S0980516080005 独立性声明:独立性声明:作者保证报告所采用的数据均来自合规渠道,分析逻辑基于本人的职业理解,通过合理判断并得出结论,力求客观、公正,结论不受任何第三方的授意、影响,特此声明。专题报告专题报告

3、 递归神经网络递归神经网络 RNN长短期记忆长短期记忆细胞(细胞(LSTM)的分行业多因子预测)的分行业多因子预测 递归神经网络递归神经网络 RNN RNN 不同于传统神经网络的感知机的最大特征就是跟时间挂上钩,即包含了一个循环的网络,就是下一时间的结果不仅受下一时间输入的影响,也受上一个时间输出的影响,进一步地说就是信息具有持久的影响力。人们在看到新的信息的时候产生的看法或者判断,不仅仅是对当前信息的反应,先前的经验、思想也会参与到这次信息推断当中。分行业建模分行业建模 往期系列报告中,我们尝试了不同神经网络模型在整个股票分析上的表现能力。而股票市场中,经常观察到某一行业或者板块的股票在特定

4、时期中表现出齐涨共跌的特征。这说明,在这些股票中,存在着某种行业性或产业性的共同影响因素。另外,根据产业周期理论,任何产业或行业通常都要经历幼稚期、成长期、成熟期、稳定期四个阶段。每个行业都处于各自的生命周期,其所属股票价格趋势也有不同特征。通过使用神经网络对不同行业单独进行分析,有利于抓住各个行业独有的影响因素,防止不同行业之间影响因素的相互影响,从而更精准的作出预测。RNN 网络训练网络训练 在往期的报告中我们循着网络结构复杂度提高的方向简析了自适应计算次数ACT 与维度叠加(Grid-LSTM)在多因子预测模型上的表现。随着网络结构复杂度加深,对计算机的性能要求越来越高。我们在本篇报告中

5、采用对最普及的神经网络进行优化的方法,在复杂度一定的网络结构上尽可能提升网络的表现力。同时,在往期的报告中我们在把多因子输入时,都预先经过了一遍人工筛选;本次我们将获取的 69 个因子全部输入模型,让模型自己筛选,减少人工干预。对于神经网络的训练来说,由于采用月频数据作为训练集,训练集相对来说比较稀少,随着训练次数的增加,过拟合现象明显加重。采用单独的验证集验证神经网络可以有效地监测过拟合现象的产生,控制神经网络的无效训练次数。训练结果分析训练结果分析 通过神经网络对不同行业股票走势进行分析预测,我们观察到神经网络在不同行业的验证集上的表现随着神经网络训练次数的增加有不同的表现,我们认为这说明

6、了不同行业对历史经验的依赖程度有差异。神经网络最终在大部分行业的预测准确率处于 40%左右,与之前不分行业进行预测的准确率相差不大。训练所用样本集大小对训练表现有较大的影响,大样本集的验证准确度表现出过拟合前有较大的上升区间。请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 2 内容目录内容目录 深度神经网络与投资深度神经网络与投资.5 递归神经网络 RNN.5 长短期记忆网络(LSTM).6 循环神经网络分行业多因子选股模型循环神经网络分行业多因子选股模型.8 样本数据参数.8 循环神经网络模型参数.9 循环神经网络模型分行业训练结果循环神经网络模型分行业训练结

7、果.11 行业划分.11 训练结果.11 循环神经网络模型行业大类选股效果循环神经网络模型行业大类选股效果.13 结论结论.16 附录:单行业训练结果附录:单行业训练结果.17 国信证券投资评级国信证券投资评级.28 分析师承诺分析师承诺.28 风险提示风险提示.28 证券投资咨询业务的说明证券投资咨询业务的说明.28 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 3 图表目录图表目录 图图 1:递归神经网络及其展开形式递归神经网络及其展开形式.5 图图 2:LSTM 的单元结构的单元结构.7 图图 3:全市场股票训练及测试准确率:全市场股票训练及测试准确率.

8、11 图图 4:全市场股票训练及测试损失(:全市场股票训练及测试损失(loss).11 图图 5:消费行业大类训练及测试准确率:消费行业大类训练及测试准确率.12 图图 6:消费行业大类训练及测试损失(:消费行业大类训练及测试损失(loss).12 图图 7:工业行业大类训练及测试准确率:工业行业大类训练及测试准确率.12 图图 8:工业行业大类训练及测试损失(:工业行业大类训练及测试损失(loss).12 图图 9:新兴产业行业大类训练及测试准确率:新兴产业行业大类训练及测试准确率.12 图图 10:新兴产业行业大类训练及测试损失(:新兴产业行业大类训练及测试损失(loss).12 图图 1

9、1:金融行业训练及测试准确率:金融行业训练及测试准确率.13 图图 12:金融行业大类训练及测试损失(:金融行业大类训练及测试损失(loss).13 图图 13:全市场神经网络模型全市场神经网络模型 20%选股多空组合净值选股多空组合净值.14 图图 14:消费行业大类神经网络模型消费行业大类神经网络模型 20%选股多空组合净值选股多空组合净值.14 图图 15:工业行业大类神经网络模型工业行业大类神经网络模型 20%选股多空组合净值选股多空组合净值.15 图图 16:新兴行业大类神经网络模型新兴行业大类神经网络模型 20%选股多空组合净值选股多空组合净值.15 图图 17:金融行业大类神经网

10、络模型金融行业大类神经网络模型 20%选股多空组合净值选股多空组合净值.16 图图 18:可选消费行业训练及测试准确率:可选消费行业训练及测试准确率.17 图图 19:可选消费行业:可选消费行业训练及测试损失(训练及测试损失(loss).17 图图 20:可选消费行业:上涨可选消费行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合.17 图图 21:日常消费行业训练及测试准确率:日常消费行业训练及测试准确率.18 图图 22:日常消费行业训练及测试损失(:日常消费行业训练及测试损失(loss).18 图图 23:日常消费行业:上涨日常消费行业:上涨/下跌概率排名前下跌概率排名前 20%组

11、合组合.18 图图 24:医疗行业训练及测试准确率:医疗行业训练及测试准确率.19 图图 25:医疗行业:上涨:医疗行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合.19 图图 26:医疗行业:上涨医疗行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合.19 图图 27:公用行业训练及测试准确率:公用行业训练及测试准确率.20 图图 28:公用行业训练及测:公用行业训练及测试损失(试损失(loss).20 图图 29:公用行业:上涨公用行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合.20 图图 30:工业行业训练及测试准确率:工业行业训练及测试准确率.21 图图 31:

12、工业行业训练及测试损失(:工业行业训练及测试损失(loss).21 图图 32:工业行业:上涨工业行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合.21 图图 33:能源行业训练及测试准确率能源行业训练及测试准确率.22 图图 34:能源行业训练及测试损失(:能源行业训练及测试损失(loss).22 图图 35:能源行业:上涨能源行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合.22 图图 36:材料行业训练及测试准确率:材料行业训练及测试准确率.23 图图 37:材料行业训练及测:材料行业训练及测试损失(试损失(loss).23 图图 38:材料行业:上涨材料行业:上涨/下跌

13、概率排名前下跌概率排名前 20%组合组合.23 图图 39:信息技术行业训练及测试准确率:信息技术行业训练及测试准确率.24 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 4 图图 40:信息技术行业训练及测试损失(:信息技术行业训练及测试损失(loss).24 图图 41:信息技术行业:上涨信息技术行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合.24 图图 43:金融行业训练及测试准确率:金融行业训练及测试准确率.25 图图 44:金融行业训练及测试损失(:金融行业训练及测试损失(loss).25 图图 45:金融行业:上涨金融行业:上涨/下跌概率

14、排名前下跌概率排名前 20%组合组合.25 图图 46:房地产行业训练及测试准确率:房地产行业训练及测试准确率.26 图图 47:房地产行业训练及测试损失(:房地产行业训练及测试损失(loss).26 图图 48:房地房地产行业:上涨产行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合.26 图图 49:单个行业测试集预测准确率单个行业测试集预测准确率.27 表表 1:样本行业大类划分:样本行业大类划分.11 表表 2:行业大类各阶段准确率表现:行业大类各阶段准确率表现.13 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 5 深度神经网络与投资深度神经网

15、络与投资 深度学习对各个行业、各个领域的的影响在逐步加深,其中也包括量化投资领域。目前,大部分对深度学习在投资领域的研究都处于一个尝试、摸索阶段。随着越来越多的深度学习模型被不断地开发出来,前期较为普遍探索方向在于尝试着用各种新的模型来对既有数据进行预测,主要关注点在于不同模型的表现。本篇报告的目的在于对神经网络模型在投资领域的一个深度挖掘,尝试的是深度学习模型在不同问题上的能力表现、对深度学习模型从不同角度进行观察与理解,从而试图理解深度学习模型在选股领域的能力。递归神经网络递归神经网络 RNN RNN 不同于传统神经网络的感知机的最大特征就是跟时间挂上钩,即包含了一个循环的网络,就是下一时

16、间的结果不仅受下一时间的输入的影响,也受上一个时间输出的影响,进一步地说就是信息具有持久的影响力。放在实际中也很容易理解,人们在看到新的信息的时候产生的看法或者判断,不仅仅是对当前信息的反应,先前的经验、思想的也是参与进去这次信息的推断的。人类的大脑不是一张白纸,是包含许多先验信息的,即思想的存在性、持久性是显然的。举个例子,你要对某电影中各个时点发生的事件类型进行分类:温馨、烂漫、暴力等等,如果利用传统神经网络是很难做到这一点的,但是 RNN 因为具备一定的记忆功能,可以较好处理这个问题。图图 1:递归神经网络及其展开形式递归神经网络及其展开形式 资料来源:国信证券经济研究所分析师归纳整理

17、我们可以写出其具体表达式:hthhthxtbhWxW1*h)h(h*tt otohtbhW*o)(*ttoo 其中,xt表示 t 时刻的输入,ot表示 t 时刻的输出,ht表示 t 时刻隐层的状态。请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 6 RNN 模型本质上也是采用 BP(Back Propagation)算法进行权值和阈值的调整优化,只是增加了时间序列,叫做 BPTT(Back Propagation Through Time)。公式如下:令:)h()(h1*t1*t1-kkkhhkWC 则有:kitkkjkittkkijkiijhCwwC11*1*

18、thh 其中tC表示 t 时刻模型输出与真实值之间的交叉熵。对于上述公式中,如果为 sigmoid 函数或者 tanh 函数,根据的递推式,当时间跨度较大时,就会很小,从而使 BP 的梯度很小,产生“梯度消失”。可以采取换一种激活函数(Activation Function),如 Relu 等方式避免。图图 2:激活函数:激活函数 资料来源:国信证券经纪研究所整理 另外,对于参数 Whh:由于 RNN 中 Whh 在每个时刻都是指的相同参数,所以中会出现 Whh 的累乘。而多次累乘后,数值的分布有明显的趋势:要么趋近于 0,要么趋近于绝对值很大的值。而这两种情况,就很可能会分别造成“梯度消失”

19、和“梯度爆炸”。长短期记忆网络(长短期记忆网络(LSTM)LSTM(long-short term memory),长短期记忆网络,就是为了解决上面“梯度消失问题”而产生的。LSTM 其实就是将 RNN 中隐层(Hidden Layer)的一个神经元,用一个更加复杂的结构替换,称为记忆块(Memory Block)。单个记忆块的结构如下:请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 7 图图 2:LSTM 的单元结构的单元结构 资料来源:国信证券经纪研究所整理 先对其中结构进行简要介绍:输入门(Input Gate),输出门(Output Gate),忘记门(

20、Forget Gate):这三个 Gate 本质上就是权值,形象地说,类似电路中用于控制电流的开关。当值为 1,表示开关闭合,流量无损耗流过;当值为 0,表示开关打开,完全阻塞流量;当值介于(0,1),则表示流量通过的程度。而这种0,1的取值,其实就是通过激活函数实现的。Cell:Cell 表示当前Memory Block 的状态,对应于原始RNN中的Hidden Layer的神经元 Activation Function:图中多处出现了激活函数(Activation Function 小圆圈+某种激活函数曲线的图案),对这些激活函数的选择有一个通用的标准。一般,对 Input Gate,Ou

21、tput Gate,Forget Gate,使用的激活函数是 sigmoid 函数;对于 Input 和 Cell,激活函数使用 tanh 函数。其具体公式如下:)h(i1titihtixbWxWsigmoid)h(1-tffhtfxtbWxWsigmoidf)tanh(1gtchtgxtbhWxWg)(o1totohtoxbhWxWsigmoid 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 8 tt1-ttgicctf)(tanhhttCot 其中,tttfoi,分别表示时刻 t 输入门,输出门,忘记门输出值;tg表示时刻 t要更新的输入;th表示时刻 t

22、 的输出;tc表示 Cell 在时刻 t 的状态。对于 LSTM 中公式tt1-ttgictfc,我们计算对于某一参数 有:.)(1111-ktkkkkkkktktfcccccCcC 公式里其余的项不重要,这里就用省略号代替了。可以看出当tf=1 时,就算其余项很小,梯度仍然可以很好地传导到上一个时刻,此时即使层数较深也不会发生“梯度消失”的问题;当tf=0 时,即上一时刻的信号不影响到当前时刻,则此项也会为 0;tf在这里控制着梯度传导到上一时刻的衰减程度,与它忘记门的功能一致。LSTM 只能避免 RNN 的“梯度消失”;“梯度膨胀”虽然不是个严重的问题,但它会导致参数会被修改的非常远离当前

23、值,使得大量已完成的优化工作成为无用功。可以采用梯度裁剪(gradient clipping)来优化这个问题。(如果梯度的范数大于某个给定值,将梯度同比收缩)。循环神经网络分行业多因子选股模型循环神经网络分行业多因子选股模型 样本样本数据参数数据参数 训练样本集时间训练样本集时间:2007 年 5 月 1 日-2016 年 12 月 31 日,该时间区间下月度数据训练样本总数超过 15.3 万条。验证样本集验证样本集:随机取自训练样本集,数量为训练集样本总数的 10%;实际用于训练的样本为剩余的 90%.在先前的系列报告中发现,尽管在对训练集数据进行长达万余的训练后,交叉检验准确率能够达到 8

24、5%-90%,然而在最终测试测试数据集上的表现准确率只有 50%左右。本篇报告通过采用验证样本集,每用训练样本集对神经网络训练一定次数后,将当前模型用验证样本集进行验证,以此观察神经网络的表现。当发现神经网络在验证样本集上的表现基本趋于稳定时,或损失值明显出现上升时,取此时的模型对测试集进行预测。测试样本集时间测试样本集时间:2017 年 1 月 31 日-2018 年 12 月 25 日 因子数:因子数:不评价因子的有效性,也不对因子进行合并或筛选,全部输入模型中作为样本的原始特征(共计 69 个因子)。分类:分类:为了验证预测的准确性,同时降低样本中的噪声的影响,我们将样本的收益率分为三类

25、:上涨(月收益率大于 3%)、下跌(月收益率小于-3%)、中性 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 9(月收益率在-3%到 3%之间)。循环神经网络模型参数循环神经网络模型参数 输入维度输入维度:69,对应 69 个因子。输出维度输出维度:3,对应 3 分类 LSTM 时间长度:时间长度:24 个月,即每一个训练样本包含过去 24 个月的因子数据,依次从第一个月输入神经网咯,并将返回值与下一个月因子同时循环输入神经网络,以此类推,直到得到第 24 个月的预测值。隐藏层数:隐藏层数:2 层。在测试过程中我们发现 LSTM 层数的增加能加快模型的收敛。把

26、隐藏层数设置为 2 层是兼顾了隐藏层神经元数、模型预测能力和模型复杂度。隐藏层神经元数:隐藏层神经元数:每层都为 400 个。通过添加更多层以及向层内添加更多的单元,深度网络可以表示复杂性不断增加的函数。把隐藏层神经元数设置为 400个是兼顾了隐藏层神经元数、模型预测能力和模型复杂度。随机断开输入神经元比例(随机断开输入神经元比例(dropout):):0.4。在不同层循环体结构之间使用dropout 可以让循环神经网络更耐用(robust),并避免过拟合。初始化权值初始化权值方法:方法:Random normal。神经网络对初始的参数值很敏感。从之前系列报告中我们可以发现训练后神经网络权值分

27、布大体服从数学期望为 0 的正态分布。因此使用期望为 0 的正态分布。单个训练批次样本数(单个训练批次样本数(batch size):):250/350/500。不同行业构成的训练集样本大小不同,根据训练集大小选择上述三个单个训练批次样本数。损失函数损失函数:cross entropy。分类问题的经典损失函数。学习速率:学习速率:decayed learning rate=learning rate*decay rate (global step/decay step)学习率对模型有着显著的影响。太小的学习率会导致网络收敛过于缓慢,而学习率太大可能会影响收敛,并导致损失函数在最小值上波动,甚至

28、出现梯度发散。采用指数衰减学习率能有效避免这一问题。Learning rate 设定为 0.01,decay rate 设定为 0.96,decay step 表示完整的使用一遍训练数据所需的迭代轮数。优化算法(优化算法(optimizer):适应时刻估计方法(Adam Adaptive Moment Estimation)。相较于其他算法,其收敛速度更快,学习效果更为有效,而且可以纠正其他优化技术中存在的问题,如学习率消失、收敛过慢或是高方差的参数更新导致损失函数波动较大等问题。请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 10 在设置了以上参数后,LSTM

29、 网络的结构如图所示。图图 4:LSTM 网络结构网络结构 资料来源:国信证券经纪研究所整理 Output LSTM_2:batch_size*24*400 Drop_out Fully_connected_layer Softmax batch_size*400 batch_size*3 Input size:batch_size*24*69 LSTM_1:batch_size*24*400 Drop_out 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 11 循环神经网络模型分行业训练结果循环神经网络模型分行业训练结果 行业划分行业划分 采用万得资讯终端的

30、一级行业划分,分为:能源、材料、工业、可选消费、日常消费、医疗保健、金融、信息技术、公用事业、房地产、电信服务、其他。在实际训练中,我们发现部分行业样本数量过少,对于模型训练过程造成了显著障碍,因此正文中展示的结果为我们将 12 个行业合并为 4 个行业大类后,各个大类下的训练结果。(单个行业的训练结果见正文后附录)表表 1:样本行业大类划分:样本行业大类划分 大类名称大类名称 所含行业所含行业 训练样本数量训练样本数量 股票数量(截至最新)股票数量(截至最新)消费 可选消费、日常消费、医疗、公用 5.3 万 990 工业 工业、能源、材料 6.8 万 1385 新兴 信息技术 1.8 万 4

31、65 金融 金融、房地产 1.4 万 216 全市场 N/A 15.5 万 3060 资料来源:国信证券经济研究所分析师归纳整理 按照上述设置,我们分别在全市场样本集和四个行业大分类样本集上对 LSTM模型进行了训练。训练过程中,模型在训练集、验证集上正确率和损失(loss)的变化情况展示如下。训练结果训练结果 图图 3:全市场股票训练及测试准确率全市场股票训练及测试准确率 图图 4:全市场股票训练及测试损失(全市场股票训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本

32、土智慧 Page 12 图图 5:消费行业大类训练及测试准确率消费行业大类训练及测试准确率 图图 6:消费行业大类训练及测试损失(消费行业大类训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 7:工业行业大类训练及测试准确率工业行业大类训练及测试准确率 图图 8:工业行业大类训练及测试损失(工业行业大类训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 9:新兴产业行业大类训练及测试准确率新兴产业行业大类训练及测试准确率 图图 10:新兴产业行业大类训练及测

33、试损失(新兴产业行业大类训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 13 图图 11:金融金融行业行业训练及测试准确率训练及测试准确率 图图 12:金融行业大类训练及测试损失(金融行业大类训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 我们看到,随着训练步数增加,随着训练次数的增加、LSTM 网络模型在训练集上准确率的提高,LSTM 网络模型在验证集的准确率却基本维持稳定或下降。模

34、型在训练集上的准确度均能达到 90%附近,而在验证集上的预测准确率却普遍在 500-800 步附近就稳定在 40-50%附近不再提高,此时训练损失(loss)也出现显著上升,此后的训练存在较大的过拟合风险。表表 2:行业大类各阶段准确率表现:行业大类各阶段准确率表现 大类名称大类名称 最终训练准确率最终训练准确率 最终验证准确率最终验证准确率 测试准确率测试准确率 消费 80.8%53.5%37.2%工业 83.1%56.6%41.4%新兴 84.8%53.9%40.6%金融 89.2%48.4%37.9%全市场 84.8%61.6%41.4%资料来源:国信证券经济研究所分析师归纳整理 取模型

35、验证准确度初步稳定后的模型作为最终模型,并对测试集样本的股票涨幅进行分类预测,其预测准确度如上表。四个行业大类预测准确度均在 30%-40%左右,均未高于全市场训练结果。观察 LSTM 网络模型所预测的准确率在不同行业的训练集与验证集上的走势可以发现,LSTM 网络模型对不同行业的学习能力存在差异;但最终各行业样本外的测试准确率水平相对一致。循环神经网络模型行业大类循环神经网络模型行业大类选股效果选股效果 我们选取在明显的过拟合表现发生前的步数节点上得到的神经网络模型,来观察 LSTM 网络模型最终在各个行业的测试集时间段中选股的效果:根据模型输出的对个股收益的三类预测,将股票分为三个组合高收

36、益预测、低收益预测、中性预测。选股标准为模型最终预测前的激活值(即 softmax 层的输出值),每一期选取各个行业激活值最大的 20%的股票作等权组合:请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 14 图图 13:全市场神经网络模型全市场神经网络模型 20%选股多空组合净值选股多空组合净值 资料来源:国信证券经济研究所分析师归纳整理 可以看到,全市场神经网络选股的净值曲线录得较为稳定的多空区分效果,多头持续跑赢空头和全市场平均收益。而在行业大类下,仅有工业分类的多空区分表现相对稳定,且多头和空头组合相对于全行业大类等权净值,有持续跑赢(跑输)的稳定超额收益

37、;其余三个行业多空净值比存在明显波动。新兴产业的多空区分表现较差,多头存在较多时段时段跑输空头。图图 14:消费行业大类神经网络模型消费行业大类神经网络模型 20%选股多空组合净值选股多空组合净值 资料来源:国信证券经济研究所分析师归纳整理 0.600.700.800.901.001.101.2017-0117-0417-0717-1018-0118-0418-0718-10空头净值多头净值全样本等权多空净值比0.600.650.700.750.800.850.900.951.001.051.1017-0117-0417-0717-1018-0118-0418-0718-10空头净值多头净值全

38、样本等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 15 图图 15:工业行业大类神经网络模型工业行业大类神经网络模型 20%选股多空组合净值选股多空组合净值 资料来源:国信证券经济研究所分析师归纳整理 图图 16:新兴行业大类神经网络模型新兴行业大类神经网络模型 20%选股多空组合净值选股多空组合净值 资料来源:国信证券经济研究所分析师归纳整理 0.600.700.800.901.001.101.201.3017-0117-0417-0717-1018-0118-0418-0718-10空头净值多头净值全样本等权多空净值比0.600.650.7

39、00.750.800.850.900.951.001.051.1017-0117-0417-0717-1018-0118-0418-0718-10空头净值多头净值全样本等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 16 图图 17:金融行业大类神经网络模型金融行业大类神经网络模型 20%选股多空组合净值选股多空组合净值 资料来源:国信证券经济研究所分析师归纳整理 结论结论 本篇报告是 RNN 深度神经网络系列报告的第 4 篇,主要的目的是查看 RNN 网络在不同行业之间的预测性能。从结果中可以发现,RNN 网络在各行业的训练中的确存在不同,但这

40、些不同并没有反映到最终的预测准确率上。经验表明,训练集大小对神经网络训练表现有很大的影响,这一点在本报告中得到了明确的体现:股票数量小的行业在训练过程中,验证集上准确率提高极小,并且随步数增加变化波动较大,体现出明显的过拟合表现;股票数量较大的行业、以及以全市场整体作为样本时,此问题相对不明显。而另一方面,最终在样本外时间段(即测试集上)的预测准确率,却并未随着训练样本数据量的增大而有显著增加。同时我们也发现,RNN 网络在对训练集的学习还不充分时,在验证集上的表现已经存在过拟合的现象。深度学习网络在量化投资领域的运用与它在其它已成熟的应用领域的运用存在较大差别。对神经网络在量化投资的领域的学

41、习训练过程还有待进一步的尝试与研究。0.600.700.800.901.001.101.201.3017-0117-0417-0717-1018-0118-0418-0718-10空头净值多头净值全样本等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 17 附录:单行业训练结果附录:单行业训练结果 图图 18:可选消费可选消费行业行业训练及测试准确率训练及测试准确率 图图 19:可选消费行业训练及测试损失(可选消费行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 20:可选消

42、费行业:上涨可选消费行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:0.600.650.700.750.800.850.900.951.001.051.1017-0117-0417-0717-1018-0118-04空头多头行业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 18 图图 21:日常消费日常消费行业行业训练及测试准确率训练及测试准确率 图图 22:日常消费日常消费行业训练及测试损失(行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 23:

43、日常消费日常消费行业:上涨行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:0.600.650.700.750.800.850.900.951.001.051.1017-0117-0417-0717-1018-0118-04空头多头行业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 19 图图 24:医疗医疗行业行业训练及测试准确率训练及测试准确率 图图 25:医疗医疗行业:上涨行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图

44、 26:医疗医疗行业:上涨行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:0.600.700.800.901.001.101.2017-0117-0417-0717-1018-0118-04空头多头行业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 20 图图 27:公用公用行业行业训练及测试准确率训练及测试准确率 图图 28:公用公用行业训练及测试损失(行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 29:公用公用行业:上涨行业:上涨/下跌概率排名

45、前下跌概率排名前 20%组合组合 资料来源:0.600.700.800.901.001.101.201.301.4017-0117-0417-0717-1018-0118-04空头多头行业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 21 图图 30:工业工业行业行业训练及测试准确率训练及测试准确率 图图 31:工业工业行业训练及测试损失(行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 32:工业工业行业:上涨行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合

46、资料来源:0.600.700.800.901.001.101.2017-0117-0417-0717-1018-0118-04空头多头行业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 22 图图 33:能源能源行业行业训练及测试准确率训练及测试准确率 图图 34:能源能源行业训练及测试损失(行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 35:能源能源行业:上涨行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:0.600.700.800.901.00

47、1.101.201.3017-0117-0417-0717-1018-0118-04空头多头行业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 23 图图 36:材料材料行业行业训练及测试准确率训练及测试准确率 图图 37:材料材料行业训练及测试损失(行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 38:材料材料行业:上涨行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:0.600.700.800.901.001.101.2017-0117-0417-

48、0717-1018-0118-04空头多头行业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 24 图图 39:信息技术信息技术行业行业训练及测试准确率训练及测试准确率 图图 40:信息技术信息技术行业训练及测试损失(行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 41:信息技术信息技术行业行业:上涨:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:0.600.700.800.901.001.101.2017-0117-0417-0717-1018-011

49、8-04空头多头行业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 25 图图 42:金融金融行业行业训练及测试准确率训练及测试准确率 图图 43:金融金融行业训练及测试损失(行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 44:金融金融行业:上涨行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:0.600.650.700.750.800.850.900.951.001.051.1017-0117-0417-0717-1018-0118-04空头多头行

50、业内等权多空净值比 请务必阅读正文之后的免责条款部分 全球视野全球视野 本土智慧本土智慧 Page 26 图图 45:房地产房地产行业行业训练及测试准确率训练及测试准确率 图图 46:房地产房地产行业训练及测试损失(行业训练及测试损失(loss)资料来源:国信证券经济研究所分析师归纳整理 资料来源:国信证券经济研究所分析师归纳整理 图图 47:房地产房地产行业:上涨行业:上涨/下跌概率排名前下跌概率排名前 20%组合组合 资料来源:0.600.700.800.901.001.101.2017-0117-0417-0717-1018-0118-04空头多头行业内等权多空净值比 请务必阅读正文之后

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用范文 > 工作总结

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2