1、谨请参阅尾页重要声明及华泰证券股票和行业评级标准 1 证券研究报告证券研究报告金工研究/深度研究 2019年04月09日 林晓明林晓明 执业证书编号:S0570516010001 研究员 0755-82080134 陈烨陈烨 执业证书编号:S0570518080004 研究员 010-56793942 李子钰李子钰 0755-23987436 联系人 何康何康 联系人 1金工金工:市值因子收益与经济结构的关系市值因子收益与经济结构的关系2019.03 2金工金工:人工智能选股之数据标注方法实证人工智能选股之数据标注方法实证2019.03 3金工金工:“华泰周期轮动”基金组合构建“华泰周期轮动”
2、基金组合构建2019.03 机器学习机器学习选股选股模型的调仓频率实证模型的调仓频率实证 华泰人工智能系列之十八周频调仓周频调仓 XGBoost 模型表现最好,需要借助组合优化来控制模型换手率模型表现最好,需要借助组合优化来控制模型换手率 2017 年以来,月频调仓的机器学习模型超额收益指标明显下滑。本文根据理论分析,认为可以通过加快调仓频率来提升机器学习选股模型的表现。在实证中,本文对比了三种调仓频率的 XGBoost 模型,周频调仓 XGBoost表现最好。此外,对于周频调仓 XGBoost 来说,需要使用组合优化来控制换手率才能达到最优的回测结果。最后,本文测试了周频调仓 XGBoost
3、在不同交易成本下的表现,投资者可以参考不同交易成本下的回测结果来设计调仓方案。根据理论分析,可以通过加快调仓频率来提升根据理论分析,可以通过加快调仓频率来提升机器学习选股模型机器学习选股模型的表现的表现 2017 年以来,月频调仓的机器学习模型超额收益指标明显下滑。本文计算了 XGBoost 模型的月度 RankIC 均值,2017 年之后,其月度 RankIC 均值出现下滑,可能原因之一是 2017 年以后 A 股市场变得更加有效,月频调仓的模型面临挑战。根据 Richard Grinold 提出的公式=,在IC(信息系数)下滑的情况下,为了达到给定的 IR(信息比率)水平,一个可行的方法就
4、是增大 BR(投资策略的广度),增大 BR 有两种方法,一是增加投资组合中资产的数目,二是加快调仓频率,本文测试了加快调仓频率的方法,得到了更优的回测结果。本文对比了三种调仓频率的本文对比了三种调仓频率的 XGBoost 模型,周频调仓模型,周频调仓 XGBoost 表现最好表现最好 本文对比了以下三个模型:(1)月频调仓 XGBoost;(2)半月频调仓XGBoost;(3)周频调仓 XGBoost。我们构建了相对于中证 500 的行业、市值中性全 A 选股策略并进行回测(交易成本为双边 0.4%)。当回测期为2011013120190329 时,对于年化超额收益率、超额收益最大回撤、信息比
5、率和 Calmar 比率,周频 XGBoost 都表现最好。2017 年以来,月频XGBoost 在每月后半月的超额收益增长率表现欠佳,加快调仓频率可以较大提升模型在后半月的超额收益增长率,且有助于平滑模型在整个月内的超额收益增长率分布并平摊交易成本。对于较高调仓频率的模型对于较高调仓频率的模型,使用组合优化来控制换手率很有必要,使用组合优化来控制换手率很有必要 本文测试了半月频 XGBoost 和周频 XGBoost 在更高换手率情况下的回测结果(交易成本为双边 0.4%)。当回测期为 2011013120190329 时,周频XGBoost 在年均双边换手率为 23.91 倍时表现最好,其
6、年化超额收益率为21.02%,超额收益最大回撤为 3.98%,信息比率为 3.86,Calmar 比率为5.28。半月频 XGBoost 在年均双边换手率为 24.64 倍时表现最好,两个模型在不控制换手率时都达到了很高的年均双边换手率(周频 XGBoost 为59.63 倍,半月频 XGBoost 为 32.96 倍),而且回测结果表现都不佳。所以对于较高调仓频率的模型来说,使用组合优化来控制换手率很有必要。本文测试了本文测试了周频调仓周频调仓 XGBoost 在不同交易成本下的表现在不同交易成本下的表现 对于具有较高换手率的策略来说,交易成本是一个不可忽视的问题,本文选取周频 XGBoos
7、t 模型,测试了其在不同交易成本(双边 0.3%,0.4%,0.6%,1%)下的表现。周频 XGBoost 相比于月频 XGBoost,回测超额收益有显著提升,但需要注意的是调仓频率越高,对交易水平的要求也越高,投资者可以参考不同交易成本下的回测结果来设计调仓方案。风险提示:较高的调仓频率对交易水平、市场流动性有一定要求,极端情况下可能造成过高交易成本。通过人工智能模型构建的选股策略是历史经验的总结,存在失效的可能。人工智能模型可解释程度较低,使用须谨慎。相关研究相关研究 2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2
8、019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 2 正文目录正文目录 本文研究导读.3 机器学习模型超额收益表现的下滑和应对方法.4 月频调仓 XGBoost 模型的超额收益特点.4 调仓频率和组合优化.5 测试流程.6 测试结果.9 不同换手率约束下的模型回测对比.9 模型在更高换手率情况下的回测结果.11 模型在不同交易成本下的回测结果.12 结论.14 风险提示.15 附录:换手率控制的数学推导.16 图表目录图表目录 图表 1:XGBoost 全 A 月频调仓选股策略超额收益表现(中证 500 行业市值中性,个股权重偏离上限为 1%).4 图表 2:X
9、GBoost 模型在全 A 股的逐年月度 RankIC 均值.4 图表 3:测试流程示意图.6 图表 4:选股模型中涉及的全部因子及其描述.7 图表 5:三个模型构建全 A 选股策略回测指标对比(回测期 2011013120190329).9 图表 6:三个模型构建全 A 选股策略回测指标对比(回测期 2017010320190329).10 图表 7:三个模型超额收益表现(中证 500 行业市值中性,个股权重偏离上限为 1%).10 图表 8:2017 年以来三个模型超额收益增长率分布(计交易成本).11 图表 9:2017 年以来三个模型超额收益增长率分布(不计交易成本).11 图表 10
10、:两个模型构建全 A 选股策略回测指标对比(回测期 2011013120190329).12 图表 11:不同交易成本下周频 XGBoost 构建全 A 选股策略回测指标对比(回测期2011013120190329).12 图表 12:不同交易成本下周频 XGBoost 超额收益表现(中证 500 行业市值中性,个股权重偏离上限为 1%).13 2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 3 本文研究导读本文研究导读 前期的人工智能选股
11、报告中,我们使用的机器学习模型都使用月频调仓的方式进行回测。我们观察到 2017 年以来,月频调仓的机器学习模型超额收益指标明显下滑。针对这个问题,本文将从模型调仓频率的角度出发,结合组合优化方法,探讨更高频率调仓对模型表现的影响。本文将主要关注以下问题:1.2017 年以来,月频调仓的机器学习模型超额收益表现下滑,可能原因是什么?如何应对?2.改变机器学习模型的调仓频率,对模型策略的表现有何影响?此时如何通过组合优化来控制模型的换手率?2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请
12、参阅尾页重要声明及华泰证券股票和行业评级标准 4 机器学习模型机器学习模型超额收益超额收益表现的下滑表现的下滑和应对方法和应对方法 本章中,我们以 XGBoost 模型为例,首先讨论近年来模型超额收益表现下滑的现象,然后给出解决方案。月频月频调仓调仓 XGBoost 模型的超额收益特点模型的超额收益特点 前期的人工智能选股报告中,我们重点关注使用机器学习模型进行股票收益预测。在获得了机器学习模型下个月的收益预测结果后,构建月频调仓的选股策略进行回测。图表 1 中展示了 XGBoost 全 A 选股月频调仓策略(中证 500 行业市值中性,个股权重偏离上限为1%)的超额收益表现,可以看出,模型在
13、 2017 年以后超额收益波动明显变大,并反复出现回撤,2017 年至今(2019 年 3 月 29 日)年化超额收益率为 4.87%,信息比率为 0.87,相比 2011 年至 2016 年(年化超额收益率为 20.75%,信息比率为 3.90)明显下滑。(注:为了提高策略的可执行性,本文的回测使用均价(vwap)作为成交价进行回测,之前的报告使用收盘价作为成交价进行回测,因此策略表现有一定差异。)图表图表1:XGBoost 全全 A月频调仓选股策略月频调仓选股策略超额收益表现超额收益表现(中证中证 500 行业市值中性行业市值中性,个股权重偏离上限为个股权重偏离上限为 1%)资料来源:Wi
14、nd,朝阳永续,华泰证券研究所 量化多因子模型本质上是统计套利模型,利用市场的失效来获取 Alpha。随着 A 股市场的发展,市场的有效性在逐渐增强,此时月频调仓的模型显现出其弊端。图表 2 展示了XGBoost 模型在全 A 股的逐年月度 RankIC 均值(计算方法:将 XGBoost 模型的预测值视为单因子,进行行业市值中性,然后计算月度 RankIC。图表 2 中 2019 年的月度 RankIC均值是 2019 年 1 月到 3 月的均值)。图表图表2:XGBoost 模型在全模型在全 A股的逐年月度股的逐年月度 RankIC 均值均值 资料来源:Wind,朝阳永续,华泰证券研究所-
15、5%-3%-1%1%3%5%-250%-200%-150%-100%-50%0%50%100%150%200%250%2011-022011-082012-022012-082013-022013-082014-022014-082015-022015-082016-022016-082017-022017-082018-022018-082019-02超额收益回撤(右轴)累积超额收益(左轴)00.050.10.150.22011年 2012年 2013年 2014年 2015年 2016年 2017年 2018年 2019年月度RankIC均值2 0 2 6 3 6 9 5/3 6 1 3
16、9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 5 从图表 2 可以看出,2017 年之前,XGBoost 模型的月度 RankIC 均值维持在较高位置,2017 年之后,其月度 RankIC 均值出现下滑,可能原因之一是 2017 年以后 A 股市场变得更加有效,月频调仓的模型面临挑战。1989 年,Richard Grinold 在其论文The Fundamental Law of Active Management中提出了估计投资组合信息比率(IR)的公式:=即 IR 取决于投资策
17、略的广度 BR(Breadth)和信息系数 IC(Information Coefficient)。1.BR(Breadth):投资策略的广度,即策略每年对超额收益率做出的独立预测数目;2.IC(Information Coefficient):信息系数是每个预测与真实超额收益之间的相关系数,与前文中的 RankIC 概念类似。在 IC 下滑的情况下,为了达到给定的 IR 水平,一个可行的方法就是增大 BR,增大 BR有两种方法,一是增加投资组合中资产的数目,二是加快调仓频率,本文将测试加快调仓频率的方法。调仓频率和调仓频率和组合优化组合优化 当模型的调仓频率偏高,例如达到周频调仓的水平时,不
18、进行换手率约束往往会带来较大的换手率,这对于交易水平一般的机构来说,会造成过高的交易成本而使得模型策略难以执行。此时需要借助组合优化模型来控制换手率,本节将简要介绍组合优化框架。对于投资组合的优化问题,可以采用二次规划的方法构建符合目标的投资组合,其一般形式为:max (1)s.t.=+(2)|0|(3)(4)(5)(6)其中,为个股主动权重向量,为个股绝对权重向量,为个股预期收益向量,为个股协方差预测矩阵。(1)式为优化目标,最大化预期收益与预期风险之差。(2)式描述了个股主动权重和绝对权重的关系,为基准中个股权重向量。(3)式为换手率约束,0为个股初始权重向量,为换手率上限。(4)式为风格
19、因子暴露约束,为个股的风格因子暴露矩阵,和为风格因子暴露上下限。(5)式为行业暴露约束,为个股的行业哑变量暴露矩阵,和为行业暴露上下限。(6)式为个股主动权重的上下限约束,和为个股重点权重上下限。在本文的应用中,为简单起见,我们设=0,控制模型的市值和行业暴露为 0,个股主动权重的上下限约束=-0.01,=0.01。换手率约束|0|是一个非光滑约束条件,不能直接使用线性规划求解,因此需要将其转换为线性约束条件,本文在附录部分对此进行了推导。2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨
20、请参阅尾页重要声明及华泰证券股票和行业评级标准 6 测试流程测试流程 图表图表3:测试测试流程流程示意图示意图 资料来源:华泰证券研究所 本文使用前期报告中表现优秀的 XGBoost 模型进行测试,测试流程包含如下步骤:1 数据获取:1)股票池:全 A 股。剔除 ST 股票,剔除每个截面期下一交易日停牌的股票,剔除上市 3 个月内的股票,每只股票视作一个样本。2)回测区间:2011 年 1 月 31 日至 2019 年 3 月 29 日。2 特征提取和预处理:1)每个自然月的最后一个交易日,计算 82 个因子暴露度,作为样本的原始特征,因子池如图表 4 所示。2)中位数去极值:设第 T 期某因
21、子在所有个股上的暴露度序列为,为该序列中位数,1为序列|的中位数,则将序列中所有大于+51的数重设为+51,将序列中所有小于 51的数重设为 51;3)缺失值处理:得到新的因子暴露度序列后,将因子暴露度缺失的地方设为中信一级行业相同个股的平均值;4)行业市值中性化:将填充缺失值后的因子暴露度对行业哑变量和取对数后的市值做线性回归,取残差作为新的因子暴露度;5)标准化:将中性化处理后的因子暴露度序列减去其现在的均值、除以其标准差,得到一个新的近似服从 N(0,1)分布的序列。3 数据标注:本文将对比以下三个模型:1)月频 XGBoost:在每月第一个交易日以当日均价调仓。2)半月频 XGBoos
22、t:在每月第一个交易日以当日均价调仓,在每月位于中间的交易日以当日均价调仓,例如 2019 年 3 月时在 3 月 1 日和 3 月 15 日调仓。3)周频 XGBoost:在每周第一个交易日以当日均价调仓。对于以上三个模型,都使用股票未来一个月的超额收益(相对中证 500)作为标签 4 交叉验证调参和训练模型:本文采用年度交叉验证调参的方式。当第 N 年的最优超参数确定之后,对于其中的某个截面 T 来说,将过去 72 个月的数据合并作为样本内数据集,使用第 N 年的最优超参数训练模型。5 样本外预测:确定最优参数后,以 T 截面期所有样本预处理后的特征作为模型的输入,得到每个样本的预测值 f
23、(x)。将预测值视作合成后的因子。6 组合优化:主要使用组合优化模型控制模型换手率,保持行业市值中性和约束个股上下限。7 模型评价:我们以模型合成因子构建选股策略的结果作为模型评价标准。8 模型对比:对比第 3 步中的三个模型的选股指标(年化超额收益率、超额收益最大回撤、信息比率、Calmar 比率、换手率)。数据获取特征提取和预处理数据标注交叉验证调参和训练模型样本外预测组合优化模型评价模型对比2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标
24、准 7 图表图表4:选股模型中涉及的全部因子及其描述选股模型中涉及的全部因子及其描述 大类因子大类因子 具体因子具体因子 因子描述因子描述 估值 EP 净利润(TTM)/总市值 估值 EPcut 扣除非经常性损益后净利润(TTM)/总市值 估值 BP 净资产/总市值 估值 SP 营业收入(TTM)/总市值 估值 NCFP 净现金流(TTM)/总市值 估值 OCFP 经营性现金流(TTM)/总市值 估值 DP 近 12 个月现金红利(按除息日计)/总市值 估值 G/PE 净利润(TTM)同比增长率/PE_TTM 成长 Sales_G_q 营业收入(最新财报,YTD)同比增长率 成长 Profit
25、_G_q 净利润(最新财报,YTD)同比增长率 成长 OCF_G_q 经营性现金流(最新财报,YTD)同比增长率 成长 ROE_G_q ROE(最新财报,YTD)同比增长率 财务质量 ROE_q ROE(最新财报,YTD)财务质量 ROE_ttm ROE(最新财报,TTM)财务质量 ROA_q ROA(最新财报,YTD)财务质量 ROA_ttm ROA(最新财报,TTM)财务质量 grossprofitmargin_q 毛利率(最新财报,YTD)财务质量 grossprofitmargin_ttm 毛利率(最新财报,TTM)财务质量 profitmargin_q 扣除非经常性损益后净利润率(最
26、新财报,YTD)财务质量 profitmargin_ttm 扣除非经常性损益后净利润率(最新财报,TTM)财务质量 assetturnover_q 资产周转率(最新财报,YTD)财务质量 assetturnover_ttm 资产周转率(最新财报,TTM)财务质量 operationcashflowratio_q 经营性现金流/净利润(最新财报,YTD)财务质量 operationcashflowratio_ttm 经营性现金流/净利润(最新财报,TTM)杠杆 financial_leverage 总资产/净资产 杠杆 debtequityratio 非流动负债/净资产 杠杆 cashratio
27、 现金比率 杠杆 currentratio 流动比率 市值 ln_capital 总市值取对数 动量反转 HAlpha 个股 60 个月收益与上证综指回归的截距项 动量反转 return_Nm 个股最近 N 个月收益率,N=1,3,6,12 动量反转 wgt_return_Nm 个股最近 N 个月内用每日换手率乘以每日收益率求算术平均值,N=1,3,6,12 动量反转 exp_wgt_return_Nm 个股最近N个月内用每日换手率乘以函数exp(-x_i/N/4)再乘以每日收益率求算术平均值,x_i 为该日距离截面日的交易日的个数,N=1,3,6,12 波动率 std_FF3factor_N
28、m 特质波动率个股最近 N 个月内用日频收益率对 Fama French三因子回归的残差的标准差,N=1,3,6,12 波动率 std_Nm 个股最近 N 个月的日收益率序列标准差,N=1,3,6,12 股价 ln_price 股价取对数 beta beta 个股 60 个月收益与上证综指回归的 beta 换手率 turn_Nm 个股最近 N 个月内日均换手率(剔除停牌、涨跌停的交易日),N=1,3,6,12 换手率 bias_turn_Nm 个股最近 N 个月内日均换手率除以最近 2 年内日均换手率(剔除停牌、涨跌停的交易日)再减去 1,N=1,3,6,12 一致预期 rating_aver
29、age wind 评级的平均值 一致预期 rating_change wind 评级(上调家数-下调家数)/总数 一致预期 rating_targetprice wind 一致目标价/现价-1 一致预期 CON_EP 朝阳永续一致预期 EP 一致预期 CON_EP_REL 朝阳永续一致预期 EP 季度环比 一致预期 CON_BP 朝阳永续一致预期 EP 一致预期 CON_BP_REL 朝阳永续一致预期 EP 季度环比 一致预期 CON_GPE 朝阳永续一致预期 GPE 一致预期 CON_GPE_REL 朝阳永续一致预期 GPE 季度环比 一致预期 CON_ROE 朝阳永续一致预期 ROE 一致
30、预期 CON_ROE_REL 朝阳永续一致预期 ROE 季度环比 一致预期 CON_EPS 朝阳永续一致预期 EPS 一致预期 CON_EPS_REL 朝阳永续一致预期 EPS 季度环比 2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 8 一致预期 CON_NP 朝阳永续一致预期归母净利润 一致预期 CON_NP_REL 朝阳永续一致预期归母净利润季度环比 股东 holder_avgpctchange 户均持股比例的同比增长率 技术 MAC
31、D 经典技术指标(释义可参考百度百科),长周期取 30 日,短周期取10 日,计算 DEA 均线的周期(中周期)取 15 日 技术 DEA 技术 DIF 技术 RSI 经典技术指标,周期取 20 日 技术 PSY 经典技术指标,周期取 20 日 技术 BIAS 经典技术指标,周期取 20 日 资料来源:Wind,朝阳永续,华泰证券研究所 2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 9 测试结果测试结果 不同换手率约束下的模型回测对比不同
32、换手率约束下的模型回测对比 本节中,我们将对比以下三个模型:1.月频 XGBoost:在每月第一个交易日以当日均价调仓。2.半月频 XGBoost:在每月第一个交易日以当日均价调仓,在每月位于中间的交易日以当日均价调仓,例如 2019 年 3 月时在 3 月 1 日和 3 月 15 日调仓。3.周频 XGBoost:在每周第一个交易日以当日均价调仓。基于以上三个模型,我们构建了相对于中证 500 的行业、市值中性全 A 选股策略并进行回测(交易成本为双边 0.4%)。图表 5 中,每一列是一组测试。每一组测试都使用换手率约束将三个对比模型的年度双边换手率控制在相近的水平下。当回测期为 2011
33、013120190329 时,对于年化超额收益率、超额收益最大回撤、信息比率和 Calmar 比率,周频 XGBoost 都表现最好。半月频 XGBoost 相比月频 XGBoost 没有明显优势。图表图表5:三个模型构建全三个模型构建全 A选股策略选股策略回测回测指标指标对比对比(回测期回测期 2011013120190329)模型选择模型选择 年均双边年均双边换手率换手率(从左至右:从左至右:换手率逐渐增大换手率逐渐增大)全全 A选股,基准为中证选股,基准为中证 500(行业行业市值中性市值中性,个股权重偏离上限为个股权重偏离上限为 1%)年化超额收益率年化超额收益率 月频月频 XGBoo
34、st 16.28%17.01%16.27%16.07%半月频半月频 XGBoost 15.65%16.75%16.79%16.95%周频周频 XGBoost 17.73%19.00%19.73%20.44%超额收益最大回撤超额收益最大回撤 月频月频 XGBoost 5.41%4.70%4.37%4.54%半月频半月频 XGBoost 5.53%4.75%4.65%5.06%周频周频 XGBoost 4.23%3.95%4.07%4.22%信息比率信息比率 月频月频 XGBoost 3.07 3.18 3.04 2.97 半月频半月频 XGBoost 2.93 3.10 3.11 3.11 周频
35、周频 XGBoost 3.36 3.61 3.66 3.77 Calmar 比率比率 月频月频 XGBoost 3.01 3.62 3.72 3.54 半月频半月频 XGBoost 2.83 3.52 3.61 3.35 周频周频 XGBoost 4.20 4.81 4.85 4.85 年均双边换手率年均双边换手率(倍倍)月频月频 XGBoost 9.37 11.43 13.49 14.98 半月频半月频 XGBoost 9.37 11.38 13.35 14.90 周频周频 XGBoost 9.16 11.57 13.59 15.06 资料来源:Wind,朝阳永续,华泰证券研究所 为了观察模
36、型在 2017 年以来的表现,我们将回测期设为 2017010320190329,回测结果在图表 6 中。2017 年以来,半月频 XGBoost 与周频 XGBoost 的表现比较接近,它们都要比月频 XGBoost 表现要好。2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 10 图表图表6:三个模型构建全三个模型构建全 A选股策略选股策略回测回测指标指标对比对比(回测期回测期 2017010320190329)模型选择模型选择 年均双边
37、年均双边换手率换手率(从左至右:从左至右:换手率逐渐增大换手率逐渐增大)全全 A选股,基准为中证选股,基准为中证 500(行业行业市值中性市值中性,个股权重偏离上限为个股权重偏离上限为 1%)年化超额收益率年化超额收益率 月频月频 XGBoost 7.60%7.14%6.74%4.87%半月频半月频 XGBoost 10.63%10.34%8.57%7.71%周频周频 XGBoost 8.71%9.20%9.49%9.36%超额收益最大回撤超额收益最大回撤 月频月频 XGBoost 5.37%4.70%4.37%4.54%半月频半月频 XGBoost 4.84%4.68%4.38%4.79%周
38、频周频 XGBoost 4.11%3.48%3.35%3.92%信息比率信息比率 月频月频 XGBoost 1.38 1.29 1.21 0.87 半月频半月频 XGBoost 1.96 1.93 1.59 1.40 周频周频 XGBoost 1.56 1.63 1.67 1.64 Calmar 比率比率 月频月频 XGBoost 1.41 1.52 1.54 1.07 半月频半月频 XGBoost 2.20 2.21 1.96 1.61 周频周频 XGBoost 2.12 2.64 2.83 2.39 年均双边换手率年均双边换手率(倍倍)月频月频 XGBoost 9.35 11.36 13.
39、39 14.41 半月频半月频 XGBoost 9.51 11.45 13.48 14.98 周频周频 XGBoost 9.20 11.73 13.69 15.11 资料来源:Wind,朝阳永续,华泰证券研究所 图表 7 展示了三个模型的详细超额收益表现。图表图表7:三个三个模型超额收益表现模型超额收益表现(中证中证 500 行业市值中性行业市值中性,个股权重偏离上限为个股权重偏离上限为 1%)资料来源:Wind,朝阳永续,华泰证券研究所 -5%-3%-1%1%3%5%-400%-300%-200%-100%0%100%200%300%400%2011-022011-082012-022012
40、-082013-022013-082014-022014-082015-022015-082016-022016-082017-022017-082018-022018-082019-02月频XGBoost超额收益回撤(右轴)半月频XGBoost超额收益回撤(右轴)周频XGBoost超额收益回撤(右轴)月频XGBoost累积超额收益(左轴)半月频XGBoost累积超额收益(左轴)周频XGBoost累积超额收益(左轴)月频XGBoost 年化超额收益率:16.07%超额收益最大回撤:4.54%信息比率:2.97半月频XGBoost 年化超额收益率:16.95%超额收益最大回撤:5.06%信息比率
41、:3.11周频XGBoost 年化超额收益率:20.44%超额收益最大回撤:4.22%信息比率:3.77以上三个模型的年双边换手率:15倍左右2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 11 为了更细致地对比 2017 年以来上面三个模型的超额收益,我们将一个月内的交易日分为以下四个等分区间(以 2018 年 12 月为例进行说明),统计模型在各个区间内的平均超额收益增长率(注:这里超额收益增长率可类比为对冲中证 500 指数组合净值的
42、增长率)。1.每月前 1/4:2018 年 12 月 3 日至 7 日。2.每月 1/41/2:2018 年 12 月 10 日至 14 日。3.每月 1/23/4:2018 年 12 月 17 日至 21 日。4.每月后 1/4:2018 年 12 月 24 日至 28 日。图表 8 和图表 9 展示了图表 7 中的三个模型 2017 年以来每月超额收益增长率分布情况。由于交易成本的产生时间会明显影响超额收益的计算,我们展示了计交易成本(双边 0.4%)的情形(图表 8)和不计交易成本的情形(图表 9)。图表图表8:2017 年以来年以来三个三个模型模型超额收益超额收益增长率增长率分布分布(
43、计交易成本计交易成本)图表图表9:2017 年以来三个模型年以来三个模型超额收益超额收益增长率增长率分布分布(不计交易成本不计交易成本)资料来源:Wind,朝阳永续,华泰证券研究所 资料来源:Wind,朝阳永续,华泰证券研究所 观察 4 个区间的超额收益增长率分布,可以得到以下现象:1.每月前 1/4:由于月频 XGBoost 的全部调仓动作在该区间内完成,其超额收益增长率受交易成本影响较大(图表 8)。当不计交易成本时,其超额收益增长率与另外两个模型差别不大(图表 9)。2.每月 1/41/2:这是月频 XGBoost 表现最好的区间,无论是否计交易成本,超额收益增长率都比半月频 XGBoo
44、st 稍好。3.每月 1/23/4:无论是否计交易成本,月频 XGBoost 的超额收益增长率都低于另外两个模型。4.每月后 1/4:无论是否计交易成本,月频 XGBoost 的超额收益增长率都远低于另外两个模型,劣势明显。根据以上现象,我们可以得出结论:2017 年以来,月频 XGBoost 在每月后半月的超额收益增长率表现欠佳,加快调仓频率可以较大提升模型在后半月的超额收益增长率,且有助于平滑模型在整个月内的超额收益增长率分布并平摊交易成本。模型在更高换手率情况下的回测结果模型在更高换手率情况下的回测结果 上一节的模型中,月频 XGBoost 在不控制换手率的情况下,达到的最大年均双边换手
45、率是 14.98 倍。但是对于周频 XGBoost 和半月频 XGBoost 来说,还可以继续放松换手率限制来达到更高的年度双边换手率,图表 10 展示了它们在更高换手率下的回测结果(交易成本为双边 0.4%)。当回测期为 2011013120190329 时,半月频 XGBoost 在年均双边换手率为 24.64 倍时表现最好,其年化超额收益率为 17.30%,超额收益最大回撤为 4.93%,-0.50%0.00%0.50%1.00%每月前1/4每月1/41/2每月1/23/4每月后1/4月频XGBoost超额收益增长率半月频XGBoost超额收益增长率周频XGBoost超额收益增长率-0.
46、50%0.00%0.50%1.00%每月前1/4每月1/41/2每月1/23/4每月后1/4月频XGBoost超额收益增长率半月频XGBoost超额收益增长率周频XGBoost超额收益增长率2 0 2 6 3 6 9 5/3 6 1 3 9/2 0 1 9 0 4 1 0 1 6:0 9 金工研究/深度研究|2019 年 04 月 09 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 12 信息比率为 3.17,Calmar 比率为 3.51。周频 XGBoost 在年均双边换手率为 23.91 倍时表现最好,其年化超额收益率为 21.02%,超额收益最大回撤为 3.98%,信息比率为
47、3.86,Calmar 比率为 5.28。两个模型在不控制换手率时都达到了很高的年均双边换手率(半月频XGBoost 为 32.96 倍,周频 XGBoost 为 59.63 倍),而且回测结果表现都不佳,这主要是因为交易成本过高所致。所以对于较高调仓频率的模型来说,使用组合优化来控制换手率很有必要。图表图表10:两个模型构建全两个模型构建全 A选股策略选股策略回测回测指标指标对比对比(回测期回测期 2011013120190329)模型选择模型选择 年均双边年均双边换手率换手率(从左至右:从左至右:换手率逐渐增大换手率逐渐增大)全全 A选股,基准为中证选股,基准为中证 500(行业行业市值中
48、性市值中性,个股权重偏离上限为个股权重偏离上限为 1%)年化超额收益率年化超额收益率 半月频半月频 XGBoost 17.09%16.84%17.13%17.30%16.65%16.20%周频周频 XGBoost 19.73%20.10%20.53%21.02%20.86%15.73%超额收益最大回撤超额收益最大回撤 半月频半月频 XGBoost 4.72%4.99%4.93%4.93%5.52%5.49%周频周频 XGBoost 4.07%3.78%4.14%3.98%4.10%5.62%信息比率信息比率 半月频半月频 XGBoost 3.15 3.10 3.15 3.17 3.00 2.9
49、2 周频周频 XGBoost 3.66 3.74 3.78 3.86 3.78 2.70 Calmar 比率比率 半月频半月频 XGBoost 3.62 3.37 3.47 3.51 3.02 2.95 周频周频 XGBoost 4.85 5.31 4.97 5.28 5.09 2.80 年均双边换手率年均双边换手率(倍倍)半月频半月频 XGBoost 13.50 16.39 20.79 24.64 31.27 32.96(不控制换手率)周频周频 XGBoost 13.59 16.52 20.49 23.91 31.29 59.63(不控制换手率)资料来源:Wind,朝阳永续,华泰证券研究所
50、模型在不同交易成本下的回测结果模型在不同交易成本下的回测结果 对于具有较高换手率的策略来说,交易成本是一个不可忽视的问题,我们选取上一节中表现最好的周频 XGBoost 模型(年均双边换手率为 23.91 倍),测试其在不同交易成本下的表现,结果展示在图表 11 中。图表图表11:不同交易成本下不同交易成本下周频周频 XGBoost 构建全构建全 A选股策略选股策略回测回测指标指标对比对比(回测期回测期 2011013120190329)双边交易成本双边交易成本(从左至右:从左至右:0.3%,0.4%,0.6%,1%)全全 A选股,基准为中证选股,基准为中证 500(行业行业市值中性市值中性,