1、 金融金融工程工程专题报告专题报告 请请务必阅读正文之后的免责声明务必阅读正文之后的免责声明 渤海证券股份有限公司具备证券投资咨询业务资格渤海证券股份有限公司具备证券投资咨询业务资格 1 of 27 金金融融工工程程研研究究 证证券券研研究究报报告告 金金融融 工工程程专专题题报报告告 证券分析师证券分析师 郝倞 022-23861600 hao_ 相关相关研究研究 有色金属子行业轮动模型有色金属行业量化专题 黄金、白银量化研究有色金属行业量化专题 以道式理论为基础的顺势、整理体系金融工程CTA 策略专题报告 核心观点核心观点:本报告包含有色金属行业择时和有色金属行业内多因子选股两个模型。择时
2、模型使用宏观和行业的基本面数据,分为绝对收益和相对收益两种情况。选股模型为多因子模型针对单一行业的细化研究。有色金属行业择时模型有色金属行业择时模型 利用均值T检验的方法得到获取绝对收益的有效择时因子,包括PMI、消费者信心指数、城镇可支配收入、M0 同比、社会融资规模、十种有色金属产销量当月同比、有色金属采矿业主营业务收入同比、有色金属采矿业固定资产投资完成额同比,择时策略相对基准的年化收益率由 6.18%增加到7.72%,择时策略的最大回撤为 23.85%,而基准的最大回撤为 82.17%。利用均值T检验的方法得到获取相对收益的有效择时因子,包括城镇可支配收入、城镇人均消费性支出、CPI
3、同比、M0 同比、社会融资规模、十种有色金属产销量当月同比、有色金属采矿业主营业务收入同比、有色金属冶炼及压延业固定资产投资完成额同比七个指标,择时策略相对基准的年化收益率由 1.97%增加到 6.30%,择时策略的最大回撤为 5.65%,而基准的最大回撤为 44.93%。有色金属行业多因子选股模型有色金属行业多因子选股模型 针对有色金属行业内的股票,我们测试了估值、盈利、成长、动量、波动率、流动性六大类因子,从中挑选、合成了六个有效因子,分别为:市盈率、单季度归母净利润一年增长率、单季度营收一年增长率、当季净资产收益率、动量类合成因子、成交量波动合成因子、一个月换手率。使用移动均值模型和 I
4、C 优化模型分别测试了这六个因子的收益预测效果。从回测结果来看,移动平均模型的效果要好于 IC 优化模型。移动平均模型的参数窗口期为 12 时模型表现最优,年化收益率可达 11.64%,且不同窗口期差别不大。而 IC 优化模型的最优年化收益率为 9.88%,虽然最优结果相差不多,但 IC优化模型不同窗口期差别较大,稳定性弱于移动平均模型。风险提示风险提示 模型过度优化风险,模型失效风险。有色金属行业择时及多因子选股模型研究有色金属行业择时及多因子选股模型研究 行业基本面量化系列专题之三行业基本面量化系列专题之三 分析师:分析师:郝倞 SAC NO:S1150517100003 2018 年 9
5、 月 26 日 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 2 of 27 目 录 1.引言.4 2.有色金属行业择时模型.5 2.1 择时模型的理论基础.5 2.2 择时因子库与有效性检验.5 2.3 有色金属行业绝对收益择时模型.10 2.4 有色金属行业相对收益择时模型.10 3.有色金属行业多因子选股模型.11 3.1 理论介绍.11 3.2 单因子测试.13 3.3 收益预测模型.20 3.3.1 移动均值模型.21 3.3.2 因子 IC 优化模型.22 4.进一步研究方向.23 5.风险提示.24 金融工程专题报告金融工程专题报告
6、请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 3 of 27 图 目 录 图 1:渤海有色金属指数与申万有色金属指数对比.4 图 2:绝对收益择时策略净值走势图.10 图 3:相对收益择时策略净值走势图.11 图 4:移动均值模型净值曲线.21 图 5:IC 优化模型净值曲线.23 表 目 录 表 1:剔除部分公司及原因.4 表 2:宏观部分待选因子.6 表 3:行业部分待选因子.7 表 4:各因子绝对收益择时有效性检验结果.7 表 5:各因子相对收益择时有效性检验结果.8 表 6:绝对收益择时策略指标表现.10 表 7:相对收益择时策略指标表现.11 表 8:待选因子列表.13
7、表 9:价值类因子中市盈率、相对行业 PB 有效.16 表 10:成长类因子中单季度类、一年增长率类有效.17 表 11:成长类因子相关系数.17 表 12:盈利类因子季度 ROA、季度 ROE、滚动 ROE 有效.18 表 13:盈利类因子相关系数.18 表 14:动量类因子均有效.18 表 15:流动性因子一月换手率变动有效.19 表 16:波动性因子中月度、季度收益率波动有效.19 表 17:市盈率与当季资产收益率历史相关系数大于 50%,需正交化处理.20 表 18:移动均值模型评价指标.22 表 19:IC 优化模型评价指标.23 金融工程专题报告金融工程专题报告 请务必阅读正文之后
8、的免责声明请务必阅读正文之后的免责声明 4 of 27 1.引言引言 上一篇报告中介绍了有色金属子行业轮动模型,本篇报告介绍有色金属行业择时模型和有色金属行业内的多因子选股模型。首先,我们根据上市公司年报中的业务介绍以及申万和中信的行业划分方式,对原属于申万有色金属行业的部分公司予以剔除。剔除的公司和具体原因如下表。表表 1 1:剔除部分公司及原因:剔除部分公司及原因 代码 公司名称 剔除原因 600766.SH 园城黄金 历史为其他业务 600687.SH 刚泰控股 历史为其他业务 000697.SZ 梦舟股份 转型为文娱行业 603399.SH 吉翔股份 转型为文娱行业 600888.SH
9、 新疆众和 划归电子行业 002806.SZ 华锋股份 划归电子行业 600673.SH 东阳光科 转型为医药行业 000697.SZ 炼石有色 因钼价格与公司生产成本倒挂,公司钼矿停产,业绩由公司航空业务板块产生 002070.SZ*ST 众和*ST 000693.SZ*ST 华泽*ST 600432.SH*ST 吉恩*ST 000511.SZ*ST 烯碳*ST 资料来源:Wind,渤海证券研究所 剔除上述上市公司后,对于原申万有色金属行业的剩余公司,我们采用流通市值加权法构建行业指数,并作为后续择时模型的研究标的。图图 1 1:渤海有色金属指数与申万有色金属指数对比:渤海有色金属指数与申万
10、有色金属指数对比 资料来源:Wind,渤海证券研究所 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 5 of 27 2.有色金属行业择时模型有色金属行业择时模型 我们使用宏观数据和行业数据对有色金属行业分别进行以绝对收益为目的的择时策略构建,和以相对 Wind 全 A 的相对收益择时策略构建。2.1 择时模型的理论基础择时模型的理论基础 根据择时因子数据的变动方向分为上升和下跌两种情况,分别统计上升和下跌情况下渤海有色指数的均值,若上升情况下的收益均值大于下跌,则认为因子与行业指数表现之间呈现正相关关系,反之,认为呈现负相关的关系。再利用均值T检验
11、的方法判断某个择时因子上升和下跌情况下的收益是否存在显著的差别:121222211221212(1)(1)11()2nnyyttnSnSnnnn 其中1y与2y分别为上升和下跌情况下申万有色金属指数次月收益率序列的均值,1S与2S分别为上升和下跌情况下申万有色金属指数次月收益率序列的标准差,1n与2n分别表示择时因子上升和下跌的月份数量。统计上原假设为12yy,当 t 值大于 2,即 P 值小于 0.05 时,我们认为在 5%的置信水平下,拒绝原假设,认为择时因子的上升和下跌变动对于申万有色金属指数收益率有显著的影响,上升和下跌情况下的收益率存在明显的差别。2.2 择时因子库与有效性检验择时因
12、子库与有效性检验 我们根据有色金属行业的分析逻辑,分别从宏观经济与行业供求两个角度选取择时因子,并根据因子发布时间和频率对数据进行如下处理:1、数据对齐:由于部分数据发布具有滞后性,为了避免使用未来信息,在提取数据时对日期进行修正,保证数据为当时能够获取的最新数据。例如 T 月的数据若在 T+1 月发布,则在 T+1 月底更新该数据,并用于 T+2 月的择时决策。金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 6 of 27 2、统一频率:本篇专题报告采用月度调仓,因此将因子频率统一调整为月度,对于季度数据,在缺失数值的月份由最近一期数据填补,对于日
13、度数据,为了反映当月的整体情况,采用均值化处理,且日度数据不存在滞后性的问题。3、同比、环比、TTM 环比、TTM 同比化:部分数据具有明显的周期性,使用同比指标更能反映实际变动情况,但从时效性角度考虑,环比更能反映变化,考虑到有些数据存在较多噪声,采用 TTM 环比、TTM 同比化进行过滤更加合适。需要根据择时因子的特点选择适当的处理方法。4、引入最优观察期:由于影响因子的传导具有滞后性,上期因子的变动未必能直接在下期有所表现,需要综合考虑观察期内因子的变动情况,因此我们对因子数据变动采取 N 期移动平均的方式进行处理,根据均值的变动方向确定趋势,其中使 t 值绝对值最大的 N 值被称为最优
14、观察期。表表 2 2:宏观部分待选因:宏观部分待选因子子 类别类别 名称名称 更新频率更新频率 发布时间发布时间 景气度 PMI 月 当月月末 消费者信心指数 月 次月中末 经济增长 GDP 同比 季 次月中旬 规模以上工业增加值同比 月 次月中旬 价格指数 CPI 月 次月月初 RPI 月 次月月末 PPI 月 次月初 消费 社会消费品零售总额同比 月 次月中旬 城镇居民人均可支配收入 季 次月中旬 城镇居民人均消费支出 季 次月中旬 投资 固定资产投资完成额同比 月 次月中旬 房地产开发投资完成额同比 月 次月中旬 进出口 出口同比 月 次月月初 进口同比 月 次月月初 货币供应量 M0
15、同比 月 次月中旬 M1 同比 月 次月中旬 M2 同比 月 次月中旬 M1 同比-M2 同比 月 次月中旬 货币需求量 社会融资规模 月 次月中旬 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 7 of 27 利率 中国 5 年期国债全价指数 日 当月月末 汇率 人民币实际有效汇率指数 月 次月中旬 资料来源:Wind,渤海证券研究所 表表 3 3:行业部分待选因子:行业部分待选因子 类别类别 名称名称 更新频率更新频率 发布时间发布时间 价格指数类 有色金属价格指数 月 次月月初 产销量及库存类 十种有色金属产量当月同比 月 次月中旬 十种有色
16、金属产销量当月同比 季 次月月末 十种有色金属库存比年初增长 季 次月月末 行业景气指数类 有色金属行业景气指数之先行指数 月 次月中旬 有色金属行情景气指数之一致指数 月 次月中旬 行业盈利类 有色金属矿采选业主营业务收入累计同比 月 次月月末 有色金属矿采选业利润总额累计同比 月 次月月末 有色金属冶炼及压延加工业主营业务收入累计同比 月 次月月末 有色金属冶炼及压延加工业利润总额累计同比 月 次月月末 固定资产投资类 有色金属矿采选业固定资产投资完成额 月 次月中旬 有色金属冶炼及压延加工业固定资产完成额 月 次月中旬 资料来源:Wind,渤海证券研究所 我们分别在以获得决定收益为目标的
17、择时条件和以获得相对收益为目标的择时条件下测试各因子的有效性,其中相对收益为申万有色金属指数相对 Wind 全 A 的相对收益。各因子的测试结果如下:表表 4 4:各因子绝对收益择时有效性检验结果:各因子绝对收益择时有效性检验结果 择时因子择时因子 上升收益率均值上升收益率均值 下降收益率均值下降收益率均值 t t 值值 P P 值值 最优观最优观察期察期 PMI 4.10%-0.15%2.04 0.04 17 消费者信心指数 2.62%-0.87%2.18 0.03 13 GDP 同比 2.40%-0.17%1.62 0.11 4 规模以上工业增加值同比 2.20%-0.03%1.40 0.
18、16 11 CPI 1.61%0.47%0.71 0.48 1 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 8 of 27 RPI 1.69%0.41%0.80 0.43 1 PPI-0.07%2.40%-1.55 0.12 11 社会消费品零售总额同比 0.73%1.35%-0.38 0.71 5 城镇居民人均可支配收入 0.96%1.22%-0.17 0.87 1 城镇局民人均消费支出 1.80%0.13%1.03 0.30 1 固定资产投资完成额同比 3.50%-0.45%2.11 0.04 3 房地产开发投资完成额同比 3.34%-0.0
19、8%1.82 0.07 15 出口同比 2.26%0.17%1.30 0.19 11 进口同比 0.74%1.38%-0.40 0.69 4 M0 同比 3.85%-1.02%3.07 0.00 13 M1 同比 2.88%-0.56%2.17 0.03 3 M2 同比 2.97%-0.35%2.07 0.04 24 M1 同比-M2 同比 2.10%0.09%1.26 0.21 1 社会融资规模 4.23%-1.73%3.25 0.00 24 中国 5 年期国债全价指数 1.42%-1.68%1.38 0.17 7 人民币实际有效汇率指数 2.05%-0.75%1.67 0.10 23 有色
20、金属价格指数 2.87%0.32%1.32 0.19 11 十种有色金属产量当月同比 2.44%-0.19%1.65 0.10 13 十种有色金属产销量当月同比 4.50%-1.06%2.84 0.01 4 十种有色金属库存比年初增长 2.16%0.98%0.59 0.56 20 有色金属行业景气指数之先行指数 1.77%1.07%0.29 0.77 4 有色金属行情景气指数之一致指数 2.31%0.20%0.90 0.37 1 有色金属矿采选业主营业务收入累计同比 3.09%-0.62%2.34 0.02 12 有色金属矿采选业利润总额累计同比 3.00%-0.60%2.27 0.02 9
21、有色金属冶炼及压延加工业主营业务收入累计同比 2.38%0.16%1.37 0.17 6 有色金属冶炼及压延加工业利润总额累计同比 2.55%0.04%1.55 0.12 16 有色金属矿采选业固定资产投资完成额 5.80%-0.21%2.82 0.01 18 有色金属冶炼及压延加工业固定资产完成额 3.56%0.16%1.69 0.09 12 资料来源:Wind,渤海证券研究所 表表 5 5:各因子相对收益择时有效性检验结果:各因子相对收益择时有效性检验结果 择时因子择时因子 上升收益率均值上升收益率均值 下降收益率下降收益率均值均值 t t 值值 P P 值值 最优观察最优观察期期 PMI
22、 1.61%-0.54%1.96 0.05 23 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 9 of 27 消费者信心指数 0.81%-0.58%1.71 0.09 13 GDP 同比 0.77%-0.46%1.53 0.13 6 规模以上工业增加值同比 0.80%-0.40%1.48 0.14 11 CPI 0.86%-0.60%1.80 0.07 1 RPI 0.79%-0.46%1.55 0.12 1 PPI 0.10%0.31%-0.25 0.80 13 社会消费品零售总额同比 0.34%0.09%0.31 0.75 1 城镇居民人均可
23、支配收入 0.23%0.17%0.08 0.94 24 城镇局民人均消费支出 0.96%-0.37%1.62 0.11 16 固定资产投资完成额同比 1.51%-0.86%2.48 0.01 3 房地产开发投资完成额同比 1.35%-0.58%2.00 0.05 15 出口同比 0.68%-0.19%1.08 0.28 12 进口同比 0.37%0.07%0.37 0.71 21 M0 同比 1.74%-0.98%3.41 0.00 13 M1 同比 0.74%-0.30%1.28 0.20 8 M2 同比 0.94%-0.36%1.60 0.11 24 M1 同比-M2 同比 0.90%-0
24、.49%1.74 0.08 1 社会融资规模 1.93%-1.60%3.79 0.00 24 中国 5 年期国债全价指数 0.31%-1.15%1.41 0.16 7 人民币实际有效汇率指数 0.49%-0.20%0.84 0.40 7 有色金属价格指数 0.53%-0.05%0.57 0.57 23 十种有色金属产量当月同比 0.93%-0.43%1.68 0.09 12 十种有色金属产销量当月同比 1.72%-0.53%2.17 0.03 24 十种有色金属库存比年初增长 0.64%-0.04%0.66 0.51 13 有色金属行业景气指数之先行指数 0.60%-0.56%1.03 0.3
25、1 3 有色金属行情景气指数之一致指数 0.51%-0.67%1.05 0.30 15 有色金属矿采选业主营业务收入累计同比 1.78%-1.14%3.70 0.00 16 有色金属矿采选业利润总额累计同比 1.34%-0.72%2.56 0.01 10 有色金属冶炼及压延加工业主营业务收入累计同比 0.95%-0.49%1.79 0.08 24 有色金属冶炼及压延加工业利润总额累计同比 0.67%-0.18%1.04 0.30 9 有色金属矿采选业固定资产投资完成额 1.81%-0.29%1.90 0.06 18 有色金属冶炼及压延加工业固定资产完成额 1.32%-0.38%1.65 0.1
26、0 12 资料来源:Wind,渤海证券研究所 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 10 of 27 2.3 有色金属有色金属行业行业绝对收益绝对收益择时模型择时模型 根据上节检验结果,并考虑到各因子间的相关性,我们选择 PMI、消费者信心指数、城镇可支配收入、M0 同比、社会融资规模、十种有色金属产销量当月同比、有色金属采矿业主营业务收入同比、有色金属采矿业固定资产投资完成额同比八个择时因子构建绝对收益择时模型。采用等权求和的方式,单个因子信号设为 1、-1,若综合各因子择时信号总和大于 0,则在下月配置有色金属行业,否则,保持空仓。回测
27、期间为 2000 年 1 月至 2018 年 6 月。绝对收益择时模型相对基准指数的年化收益率有所提升,年化收益率由6.18%增加到7.72%,最大回撤从82.17%提到到23.85%。因此我们认为利用有效的择时因子能够对有色金属行业进行绝对收益的择时。图图 2 2:绝对收益择时策略净值:绝对收益择时策略净值强于基准走势强于基准走势 资料来源:Wind,渤海证券研究所 表表 6 6:绝对收益择时策略指标表现:绝对收益择时策略指标表现 标的 年化收益率 夏普比率 最大回撤 收益回撤比 择时策略 7.72%0.18 23.85%0.32 基准 6.18%0.08 82.17%0.08 资料来源:W
28、ind,渤海证券研究所 2.4 有色金属有色金属行业行业相对收益相对收益择时模型择时模型 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 11 of 27 根据上节检验结果,考虑到各因子间的相关性,我们选择城镇可支配收入、城镇人均消费性支出、CPI 同比、M0 同比、社会融资规模、十种有色金属产销量当月同比、有色金属采矿业主营业务收入同比七个择时因子构建绝对收益择时模型。采用等权求和的方式,单个因子信号设为 1、-1,若综合各因子择时信号总和大于 0,则在下月配置有色金属行业,否则,保持空仓。策略基准为申万有色金属指数相对 wind 全 A 的超额收
29、益率。回测期间为 2000 年 1 月至 2018 年 6 月。相对收益择时模型相对基准指数的年化收益率有所提升,年化收益率由1.97%增加到 6.30%,最大回撤从 44.93%提高到 5.65%。可见在相对收益条件下,通过择时模型可以提高部分交易结果。图图 3 3:相对收益择时策略净值:相对收益择时策略净值强于基准走势强于基准走势 资料来源:Wind,渤海证券研究所 表表 7 7:相对收益择时策略指标表现:相对收益择时策略指标表现 标的 年化收益率 夏普比率 最大回撤 收益回撤比 择时策略 6.30%0.22 5.65%1.11 基准 1.97%-0.05 44.93%0.04 资料来源:
30、Wind,渤海证券研究所 3.有色金属行业多因子选股模型有色金属行业多因子选股模型 3.1 理论介绍理论介绍 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 12 of 27 1964 年,美国学者 William Sharpe 等人在资产组合理论和资本市场理论的基础上提出了资本资产定价模型(Capital Asset Pricing Model,简称 CAPM),对证券市场中资产的预期收益率与风险资产之间的关系进行了刻画。套利定价理论(Arbitrage Pricing Theory,简称APT)是 CAPM的拓广,其假设证券的回报率与未知数量的未
31、知因素相联系,给出了因素模型。因素模型是一种统计模型,套利定价理论利用因素模型来描述资产价格的决定因素和均衡价格。1992 年,Fama 和 French 对美国股票市场决定不同股票回报率差异的因素的研究发现,股票的市场的 beta 值不能解释不同股票回报率的差异,而上市公司的市值、账面市值比、市盈率可以解释股票回报率的差异。于是建立了 Fama-French 三因子模型。但是,三因子模型并不代表资本定价模型的完结,模型中还有很多未被解释的部分,如动量、波动率、流动性等因素。于是最后诞生了出了利用多个因子刻画股票未来收益率与风险的多因子模型(Multiple Factor Model,简称MF
32、M)。多因子模型本质是将对 只股票的收益-风险预测转变成对于 个因子的收益-风险预测,将估算个股收益率的协方差阵转化为估算因子收益率的协方差阵,极大地降低了预测工作量,提高了准确度。Barra 结构化风险模型是目前全球最知名的多因子模型之一。根据 Barra 手册的内容,多因子模型被分为两部分,收益模型与风险模型,收益模型的基本表达形式如下:j1ju*rKkkjkfX 其中:股票 i 下一期的预期收益率;:股票 在因子 上的因子暴露(因子载荷);kf:因子 的因子收益;iu:股票 i 的残差收益率;已知股票在每个因子上的因子暴露,通过多因子的收益预测模型,估计各个因子的因子收益率,从而得到股票
33、的预期收益率,这就是多因子收益模型的主要思路。金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 13 of 27 多因子模型的建立主要包括以下步骤:1)单因子测试;2)收益模型的建立;3)风险模型的建立与二次规划;在多因子分行业测试部分,我们仅完成单因子测试和收益模型的建立,并不涉及风险模型的建立与二次规划部分的内容。3.2 单因子测试单因子测试 样本范围:渤海有色金属行业所有股票,剔除上市交易不满两年的股票。样本期:2010 年 1 月-2018 年 7 月,按月提取。因子的选择上,我们具体测试了估值、盈利、成长、动量、波动率、流动性六大类因子,并在
34、测试名单中涵盖了 Barra CNE5 手册中的大部分因子,具体因子定义见下表:表表 8 8:待选因子列表待选因子列表 大类因子大类因子 小类因子小类因子 因子解释因子解释 动量动量 momentum Barra 动量因子 RSTR_m24 相对强弱动量,半衰期不变 RSTR_m12 相对强弱动量,T=240,半衰期 60 RSTR_m6 相对强弱动量,T=120,半衰期 30 RSTR_m3 相对强弱动量,T=60,半衰期 15 RSTR_m1 相对强弱动量,T=20,半衰期 5 RS_1 最新收盘价/21 个交易日前收盘价 RS_3 最新收盘价/63 个交易日前收盘价 RS_6 最新收盘价
35、/126 个交易日前收盘价 RS_12 最新收盘价/252 个交易日前收盘价 alpha alpha 系数 流动性流动性 STOM_Barra 指数月度季度换手率 STOQ_Barra 指数加权季度换手率 STOA_Barra 指数加权年度换手率 STOM 月度平均换手率 STOQ 季度平均换手率 STOS 半年平均换手率 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 14 of 27 STOA 年度平均换手率 LNCAP 总市值 nonlinearsize 中等市值 MSM 一个月换手率变动 MSQ 季度换手率变动 MSS 半年换手率变动 波动率
36、波动率 dastd 年度平均波动率 cmra 年度收益率波动 hsigma sigma Beta 贝塔系数 yieldvol_1 月度日收益率波动率 yieldvol_3 季度日收益率波动率 yieldvol_6 半年日收益率波动率 VOL_1 成交量月度波动率 VOL_3 成交量季度波动率 VOL_6 成交量半年波动率 VOL_12 成交量年度波动率 价值价值 ETOP 1/历史 PE 值 CETOP 1/市现率 BTOP 最近公告日 BP epcut_ttm 1/市盈率 sp_ttm 1/营收市值比 ep_rel 1/相对 PE;PE/行业 PE bp_rel 1/相对 PB;PB/行业
37、PB peg 1/市盈率相对盈利增长比率 EPFWD 预期 EP 值 成长成长 qfa_yoysales 单季度营业收入一年增长率 qfa_yoynetprofit 单季度归母净利润一年增长率 yoy_or 营业收入一年增长率 yoy_growth_netprofit 归母净利润一年增长率 growth_or_ 3 营业收入三年增长率 growth_netprofit_3 归母净利润三年增长率 sgro 过去 5 年企业营业收入复合增长率 egro 过去 5 年企业归属母公司净利润复合增长率 EGRLF 未来 3 年企业一致预期净利润增长率 EGRSF 未来 1 年企业一致预期净利润增长率 盈
38、利盈利 qfa_roe 当季净资产收益率 roe_ttm 滚动 ROE qfa_roa 当季资产收益率、资产回报率 roa_ttm 滚动 ROA roic_qq 投入资本回报率 sales2EV 营业收益率 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 15 of 27 资料来源:Wind,渤海证券研究所 提取的因子数据需经过数据对齐、去极值、标准化、缺失值处理等步骤,才可进入下一步的因子回归模型。数据对齐:上市公司财报的报告期和报告发布日期之间有一定延迟,为避免未来信息,在提取数据的时候,需要对日期进行修正,保证因子数据为当时能获取的最新财报数据
39、。去极值:为避免数据中的极端值对回归结果产生过多影响,我们使用中位数去极值法,将超过上下限的极端值用上下限值代替。MADMiMADMMADMiMADMiMADMiMADMixxxxxxxxxxxxxxxxx*5,*5*5*5,*5,*5 xi:原始序列 xM:序列 xi 的中位数 :序列|的中位数 :去极值处理后的新序列 标准化:由于各个因子的单位不同,为了使其具有可比性,需要对其进行ZScore 标准化处理,即减去序列均值除以序列标准差,使因子序列近似成为一个符合 N(0,1)正态分布的序列。缺失值处理:提取出的因子可能会因为技术原因等情况出现缺失值,为避免缺失值影响收益结果,选股时直接采取
40、了移除处理。根据 Barra 手册中关于因子显著性测试的内容,对因子进行横截面回归,考虑到市值因素的影响:TiTidTdTisizeTsizeTiufxfx,1r 其中1rTi为股票 i 在 T+1 期的收益率,Tisizef,为第 T 期,股票 i 的流通市值,Tidf,为第 T 期,股票 i 在 d 因子上的因子暴露,Tsizex、Tdx为回归模型运算所得的因子收益率,Tiu为回归模型运算所得股票 i 的残差。金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 16 of 27 在每一个横截面上使用上述模型进行加权最小二乘回归(WLS),权重采用流通
41、市值的平方根,一定程度上消除了异方差性。经过回归模型,我们可以得到 t 检验的 t 值序列与因子收益序列Tdx。最终,回归模型输出以下几个指标:a)t 值绝对值平均值:衡量因子整体显著性的指标;b)t 值绝对值2 概率:衡量因子显著性是否稳定;c)因子收益平均值:衡量因子收益能力大小的指标;d)因子收益标准差:衡量因子收益能力波动率的指标;e)因子收益 t 值:衡量因子收益率统计上是否显著不为 0 的指标;f)因子收益0 概率:衡量因子收益率方向性是否一致的指标;g)IC 平均值:衡量模型预测能力的指标;h)IC 标准差:衡量模型预测能力是否稳定的指标;i)IRIC:IC 平均值/IC 标准差
42、;j)IC0 概率:衡量模型预测收益方向性是否一致的指标。在选取因子时,因为我们是对单个行业进行测试,股票数量较少。所以我们主要使用因子收益 T 值作为因子选择的主要标准,当 T 值大于等于 1.96 时即认为因子有效。传统的多因子模型是线性回归模型,线性回归模型中的解释变量之间如果存在高度相关关系,模型估计会失真或难以估计准确。为避免这一问题,我们测试了大类因子间各因子历史序列的相关性,得到相关性矩阵,辨别出相关性较高因子。对于这类因子,未来考虑采用因子剔除、合并或逐步回归等方式做进一步处理。价值类测试结果如下表所示:表表 9 9:价值类因子:价值类因子中市盈率、相对行业中市盈率、相对行业
43、PBPB 有效有效 指标名称指标名称 因子收因子收 因子收因子收 因子收因子收 因子收因子收 因子收因子收 t t 值绝值绝 t t 值绝值绝 ICIC平平 ICIC标标 IRIC IRIC IC0IC0 金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 17 of 27 益 平 均益 平 均值值 益 标 准益 标 准差差 益益 t t 检检验结果验结果 益益 t t 值值 益益00 的的概率概率 对 值 平对 值 平均值均值 对 值对 值 22的概率的概率 均值均值 准差准差 的概率的概率 ETOP 0.28 1.59 0 1.79 57.28%0.
44、78 1.94%0.06 0.14 0.39 65.05%CETOP 0.08 1.44 0 0.58 55.34%0.72 3.88%0.02 0.13 0.17 65.05%BTOP_barra 0.31 1.98 0 1.56 57.28%1.06 14.56%0.07 0.17 0.39 60.19%epcut_ttm 0.31 1.61 1 1.97 58.25%0.82 2.91%0.05 0.14 0.34 64.08%sp_ttm 0.01 2.11 0 0.06 44.66%1.11 20.39%0.02 0.20 0.09 49.51%ep_rel 0.28 1.58 0
45、1.80 60.19%0.78 1.94%0.05 0.14 0.38 65.05%bp_rel 0.31 1.61 1 1.96 60.19%0.82 2.91%0.05 0.14 0.33 66.02%peg 0.13 1.97 0 0.65 51.46%0.79 6.80%0.01 0.14 0.10 55.34%EPFWD 0.33 1.73 1 1.96 66.99%0.75 4.85%0.05 0.16 0.34 66.99%资料来源:Wind,渤海证券研究所 价值类因子选择 epcut_ttm 因子。因 EPFWD 包含预期数据,而仅有部分公司有该值,故剔除。此外,bp_rel
46、与 epcut_ttm 历史相关系数为 89.52%,相关性较大,剔除 bp_rel 因子。成长类测试结果如下表所示:表表 1010:成长类因子:成长类因子中单季度类、一年增长率类有效中单季度类、一年增长率类有效 指标名称指标名称 因子收因子收益 平 均益 平 均值值 因子收因子收益 标 准益 标 准差差 因子收因子收益益 t t 检检验结果验结果 因子收因子收益益 t t 值值 因子收因子收益益00 的的概率概率 t t 值绝值绝对 值 平对 值 平均值均值 t t 值绝值绝对 值对 值 22的概率的概率 ICIC平平均值均值 ICIC标标准差准差 IRIC IRIC IC0IC0的概率的概
47、率 qfa_yoynetprofit 0.42 1.52 1 2.78 64.08%0.80 5.83%0.05 0.14 0.37 66.02%qfa_yoysales 0.45 1.53 1 2.98 61.17%0.83 5.83%0.03 0.13 0.24 56.31%yoy_growth_netprofit 0.41 1.55 1 2.65 64.08%0.81 6.80%0.05 0.14 0.34 64.08%yoy_or 0.51 1.49 1 3.50 60.19%NaN 3.88%0.04 0.14 0.28 51.46%growth_netprofit_3 0.19 1
48、.42 0 1.35 53.40%0.79 7.77%0.02 0.14 0.15 56.31%growth_or _3 0.24 1.44 0 1.67 52.43%0.79 2.91%0.02 0.14 0.16 58.25%sgro 0.23 1.69 0 1.36 51.46%0.83 4.85%0.03 0.14 0.22 61.17%egro 0.19 1.42 0 1.35 53.40%0.79 7.77%0.02 0.14 0.15 56.31%EGRLF 0.10 1.68 0 0.59 56.31%0.73 2.91%0.00 0.13 0.00 49.51%EGRSF 0
49、.26 2.16 0 1.23 68.93%0.70 2.91%0.03 0.16 0.21 63.11%资料来源:Wind,渤海证券研究所 表表 1111:成长成长类因子类因子相关系数相关系数 相关系数 qfa_yoynetprofit qfa_yoysales yoy_growth_netprofit yoy_or qfa_yoynetprofit 100.00%29.14%82.36%23.02%金融工程专题报告金融工程专题报告 请务必阅读正文之后的免责声明请务必阅读正文之后的免责声明 18 of 27 qfa_yoysales 29.14%100.00%32.21%91.07%yoy_
50、growth_netprofit 82.36%32.21%100.00%31.30%yoy_or 23.02%91.07%31.30%100.00%资料来源:Wind,渤海证券研究所 考虑到因子间的相关系数,剔除yoy_growth_netprofit和yoy_or因子,保留剩余的两个因子。盈利类因子测试如下表所示:表表 1212:盈利类因子:盈利类因子季度季度 ROAROA、季度、季度 ROEROE、滚动、滚动 ROEROE 有效有效 指标名称指标名称 因子收因子收益 平 均益 平 均值值 因子收因子收益 标 准益 标 准差差 因子收因子收益益 t t 检检验结果验结果 因子收因子收益益 t