1、 http:/ 1/22 请务必阅读正文之后的免责条款部分 金融工程 投研漫谈(一)投研漫谈(一)多因子和人工智能谁是“正规军”?兼谈金融预测框架 多因子和人工智能谁是“正规军”?兼谈金融预测框架|投研漫谈|研究背景研究背景 投研漫谈系列旨在分享投研感悟,并科普金融教科书中最基础、对投资可能有用的知识,此外,亦为解释以往深度报告中的思路来源。鉴于目前国内“主流投资者”对人工智能缺乏认可,此篇报告我们将从多因子和人工智能谁是“正规军”这个有趣的角度切入,阐述两者的理论基础及内在联系。随机折现因子(随机折现因子(SDF)资产定价的中心问题是处理风险和收益之间的关系,在金融市场不存在无风险套利机会的
2、条件下,资产的价格和未来的收益可以通过“随机折现因子”联系起来,从而得到基本的定价方程,由于该方程的普适性,所以 Cochrane 把这个等式命名为“资产定价中心公式”:()()p xmx 与均衡定价和套利定价的表达形式相比,随机折现因子定价模型更具有一般性,更容易理解,而且对金融数据基本上没有任何的假设限定对金融数据基本上没有任何的假设限定。在随机折现因子框架下,可以用一种较为简单的方式理解现代金融理论的许多经典问题,也可以推导出CAPM,APT,Black-Scholes 的期权定价模型等等。随机折现因子模型是上世纪70年代末以来资产定价理论的统一框架统一框架。SDF、多因子模型和人工智能
3、、多因子模型和人工智能 随机折现因子的具体形式无从准确论证,所以,当随机折现因子呈现因子的线性组合形式时,资产的收益率就被表示成多因子形式,也就是说对 SDF 进行不同特定形式的假设,最终得到的定价方程不同。也就是说对 SDF 进行不同特定形式的假设,最终得到的定价方程不同。当然,AI 方法作为对复杂不确定函数的估计利器,也能对 SDF 进行估计。所以,不管是多因子还是人工智能方法,只是对 SDF 估计的技术不同,两种手段本身并无优劣。不管是多因子还是人工智能方法,只是对 SDF 估计的技术不同,两种手段本身并无优劣。因子模型无论对学界和业界,可解释性更强,也更具象。AI 方法更抽象,但是在金
4、融投资实战运用上,可能效果更好。文章结构文章结构 我们首先从资产收益的内积空间出发,通过无套利原理阐述了该空间在折现函数下的完备性,完备的内积空间是 Hilbert 空间,通过 Hilbert 空间下的 Reisz表示定理,证明了随机折现因子的存在性。随后,通过假设 SDF 为因子形式,得到了多因子模型。由于 SDF 的复杂性和抽象性,AI 方法可能有更好的估计,所以,我们阐述了 AI 方法。最后,我们探讨了两种方法的融合,以及作者对金融预测框架的思考。资产定价中心公式:图片来自:https:/faculty.chicagobooth.edu/john.cochrane/teaching/as
5、set_pricing.htm 证券研究报告 分析师:包赞 S1230518090006 分析师:包赞 S1230518090006 TEL:021-80108127 TEL:021-80108127 浙商人工智能思路,寻找:*()tf 使得:*()ititttit itw rfmw r 2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 2/22 请务必阅读正文之后的免责条款部分 正文目录 正文目录 1.引言1.引言.3 2.定价理论2.定价理论.4 2.1.资产定价中心公式.4 2.2.定价中心公式的另
6、一种证明.7 2.3.定价中心公式的应用.8 3.随机折现因子与多因子模型3.随机折现因子与多因子模型.10 4.随机折现因子与人工智能4.随机折现因子与人工智能.12 5.人工智能在技术上配合多因子5.人工智能在技术上配合多因子.14 6.人工智能投资实战应用再探讨6.人工智能投资实战应用再探讨.17 附录附录.19 1、Hilbert 空间的 Riesz 表示定理:.19 2、参考文献.20 3、SDF 的 GMM 估计.20 图表目录 图 1:神经网络.14 -An Discussion on Multi-Factor Models and AI Methods in Finance B
7、ased on Asset Pricing Theory AbstractAn Discussion on Multi-Factor Models and AI Methods in Finance Based on Asset Pricing Theory Abstract To avoid describing many complex financial concepts,we use Hilbert space theory to prove the existence of stochastic discount factor(SDF).Both multifactor models
8、 and AI methods are just estimation methods of SDF.Neither multifactor models nor AI methods should be discriminated.Multifactor models may be more interpretable.But large economic gains to investors using machine learning forecasts,in some cases doubling the performance of factor-based strategies f
9、rom many literatures.2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 3/22 请务必阅读正文之后的免责条款部分 1.1.引言 引言 资产定价是金融投资的核心问题,而资产定价的中心问题是处理风险和收益之间的关系,在金融市场不存在无风险套利机会的条件下,资产的价格和未来的收益可以通过“随机折现因子”联系起来,从而得到基本的定价方程,由于该方程的普适性,所以 Cochrane 把这个等式命名为“资产定价中心公式”:()()p xmx 与均衡定价和套利定价的表达形式相比,随机折现因子定价模
10、型更具有一般性,更容易理解,而且对金融数据基本上没有任何的假设限定对金融数据基本上没有任何的假设限定。在随机折现因子框架下,可以用一种较为简单的方式理解现代金融理论的许多经典问题,也可以推导出CAPM,APT,Black-Scholes 的期权定价模型等等。随机折现因子模型是上世纪70年代末以来资产定价理论的统一框架。随机折现因子模型是上世纪70年代末以来资产定价理论的统一框架。这个统一框架貌似并不受国内业界重视,其实对其理解还是很有助于实战投资。这个框架下的多因子模型一直作为主流模型体系存在于学界和业界,学界著名的有 Fama-French 三因子模型、APT 模型,业界有 Barra 模型
11、,其框架体系以其较好的可解释性、思路直接不抽象等原因赢得了广大金融投资人员的欢迎,作者从事绩效归因岗位多年,对 Barra 等多因子模型有所了解,也发现了多因子模型在实际运用中的缺陷,由于本文并不是讨论多因子和人工智能的优劣问题,所以在此不对其缺陷进行讨论。本文写作的缘由,主要是发现从事卖方工作以来,发现很多人对人工智能方法存在偏见和不理解。人工智能不是非主流、也不是数据挖掘,而且金融投资和学术研究不同,学术研究以发现规律、追求真理为纲,金融投资是以收益率、赚钱为根本,在这样的背景下,人工智能更该有其一席之地。既然谈到两种方法的比较,肯定从“根本”出发,而且本文切入的角度是二者谁是“正规军”,
12、更要“往他们祖坟上查”,要从讨论他们的“出身”开始。就像郭德纲出道时备受排挤,根本原因就是师承问题,拜师侯耀文后,总算情况比之前好了很多。所以,本文对多因子和人工智能论正规军,也是从出身、从二者的起源开始讨论。我们首先从资产收益的内积空间出发,通过无套利原理阐述了该空间在折现函数下的完备性,完备的内积空间是 Hilbert 空间,通过 Hilbert 空间下的 Reisz 表示定理,证明了随机折现因子的存在性。随后,通过假设 SDF为因子形式,得到了多因子模型。由于 SDF 的复杂性和抽象性,AI 方法可能有更好的估计,所以,我们阐述了AI 方法。最后,我们探讨了两种方法的融合,以及作者对金融
13、预测框架的思考。下文的资产定价基础理论,其介绍过程对于非金融专业出身的人来说略显抽象,作者尽量用一种直白、简单的方式来表述。2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 4/22 请务必阅读正文之后的免责条款部分 2.2.定价理论 定价理论 资产定价问题是上世纪六十年代来西方金融理论中发展最快的一个领域。1952年,H.M.Markovitz提出了资产组合理论,导致了现代资产定价理论的形成。它把投资者投资选择的问题系统阐述为不确定性条件下投资者效用最大化的问题。标志着现代证券理论研究进入了量化分析阶段
14、。资产定价理论在20 世纪60-70 年代得到了迅猛发展。60 年代,Sharpe(1964)、Litner(1965)、Mossin(1966)和Black(1972)提出了资本资产定价模型(CAPM)。70 年代,Merton(1973)提出了跨期资本资产定价模型(Intertemporal CAPM),Rubinstein(1976),Lucas(1978)和Breeden(1979)的基于消费需求的定价模型(Consumption-based CAPM)。Stephen Ross 于1976 年提出了套利定价理论(APT)。资产定价模型主要分为两大类:均衡定价模型与套利定价模型。均衡定
15、价模型主要目的是寻找风险溢价的真正来源,模型主要包括一些影响市场经济结构的宏观经济变量,均衡定价模型一般在学术界里面比较流行,但是要求的假设条件严格,比较难于理解,CAPM,ICAPM,CCAPM 都属于均衡定价模型。套利定价理论使用更为广泛,因为它所要求的假设条件更少,更易于理解。Duffie(1992)把资产定价理论在早期所取得的巨大成就,与当时的几乎无所进展,进行对比指出:“对于八十年代中期走出校园的学生来说,1969-1979 这10年就像动态资产定价理论的黄金时代一般,而从1979 以来的十几年间,资产定价理论的发展似乎已经结束了”。Campbell(2000)也认为:从理论观点看,
16、资产定价理论局限于无套利均衡框架也意味着这个领域的停滞不前。随机折现因子模型的出现使得资产定价理论出现新的曙光,与其他的资产定价的表达形式相比,随机折现因子模型更具有一般性,更易于理解,而且几乎不对金融数据不作任何的限定。在这个框架下,我们可以得到资产定价基本定理的简单表达方式,风险中性原理也能更容易地理解。现在主要面临的挑战是理解和挖掘影响随机折现因子的经济因素或者决定投资者风险溢价的特别因素。随机折现因子模型的出现使得资产定价理论出现新的曙光,与其他的资产定价的表达形式相比,随机折现因子模型更具有一般性,更易于理解,而且几乎不对金融数据不作任何的限定。在这个框架下,我们可以得到资产定价基本
17、定理的简单表达方式,风险中性原理也能更容易地理解。现在主要面临的挑战是理解和挖掘影响随机折现因子的经济因素或者决定投资者风险溢价的特别因素。2.1.2.1.资产定价中心公式 资产定价中心公式 资产定价理论其实有一点复杂,作者当年尽管是数学背景,在研一学习定价理论时,仍然很是吃力,原因主要是其深度融合了数学知识和金融知识,金融是“模”,搭建了思路框架,数学是“板”,严谨的充实了其中的内容,有“模”无“板”和有“板”无“模”都会导致对其内涵吃不透,且其中用到线性空间理论和泛函分析等较为抽象的定理,更是让人云里雾里,感觉抽象无比。尽管国外很多教材都有介绍定价理论,为了直白简单的表达本文的核心意思,在
18、下文简明的描述一下资产定价理论,可能比国外教材更加通俗易懂。估值是静态的定价,定价是动态的估值,和估值不同,定价考虑更多的2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 5/22 请务必阅读正文之后的免责条款部分 风险因素、宏观状态、考虑一切和价格有关的因素,所以定价有个抽象的条件期望在里面。当然,二者起源的思想都一样,即现在资产的价格等于未来现金流折现。现在资产的价格等于未来现金流折现。不像国内教科书那样从风险中性概率等概念入手,教科书中太多金融概念会给没有金融知识的研究人员带来困扰。我们从完备的内积
19、空间也就是希尔伯特空间进入,尽管这个概念仍然抽象,但是其中数学定理具有绝对不可质疑性,有助于培养定价理论的信念。下文的推导与论述很多来自经典教材,教材目标是理论的渐进深入和知识结构的完整,我们的目标是快速理解理论并且为实战服务。所以,有些地方和教材不一样,进行了改写。当然,这些改写只是形式上的,由于书上有的理论公式比较隐蔽,稍加改写,会立刻显出其实战意义。我们首先简单粗暴的引入下面等式,即任意资产收益率和 m 乘积的期望等于 1。这个是被 Cochrane 称作“资产定价中心公式”(“Central Asset Pricing Formula”),其枢轴与中心的价值会在下文展现。1,11tti
20、 tEmR 这里的,1,1,i ti ti tPRP 所以:,11,1i ttti tPEmP 我们得到任意资产的定价公式:定价公式:,1,1i ttti tPEmP 上述等式是适用于任意资产,当然也适用于确定性的无风险资产,所以:1fRm 资产定价中心公式“中心”的地方在于,任意的资产价格都可以用 m m 来折现定价,m 就是资产定价理论里面著名的随机折现因子(stochastic discount factor,SDFSDF)。本文的讨论也是围绕这个概念开展。资产定价中心公式很神奇,但是肯定需要证明的。下面我们来证明证明到底存不存在这样一个通用的定价因子。证明:证明:(1)内积空间(1)内
21、积空间 现在,我们考虑未来的收益是一系列连续状态随机变量。回想一下,连续状态随机变量定义为从样本空间到实线的映射:2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 6/22 请务必阅读正文之后的免责条款部分():xxR 在这种情形下,m 也是实数类型的随机变量。我们定义2:xRx。这一集合里包含所有“合理”的收益。紧接着,我们定义定义内的内积为:内的内积为:1212,x xx x 众所周知,是具有上述内积的空间内积的空间。(2)完备的内积空间是 Hilbert 空间(2)完备的内积空间是 Hilbert
22、空间 资产 i 的未来现金流为:,1i tiPx 其中:12=(,)Siiiixx xx,表示未来现金流的各种不同状态下的价格。有 n 个资产:1,11,1tn tnPxPx 向量形式:1tPx 未来现金流在现在的价格:tPq 那么:()qx 这里的()代表着未来现金流的折现函数折现函数,根据金融中的无套利原理无套利原理:1 1221122xxxx 而且无限小的未来现金流折现到现在的价格也是无限小,无限小的价格也在这个空间里,也就是说这个内积空间是完备的,完备的内积空间就是希尔伯特空间(Hilbert space),(3)Hilbert 空间的 Riesz 表示定理(3)Hilbert 空间的
23、 Riesz 表示定理 2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 7/22 请务必阅读正文之后的免责条款部分 Hilbert 空间的 Riesz 表示定理:Hilbert 空间的 Riesz 表示定理:令令H为为 HilbertHilbert 空间。空间。f是H上任意有界线性泛函,则存在唯一的,则存在唯一的gH使得每个使得每个hH下,都有下,都有(),f hh g。因为不存在套利,那么 q 是上的一个线性正泛函。根据 Riesz 表示定理(定理见附录),对于一些m,上的每一个有界线性定价泛函 q
24、可以用内积表示:(),()q xx mmx 不能有负价格,q 必须为正才能排除套利,所以几乎可以肯定 m0。反之亦然。因此,我们可以得出结论,几乎可以肯定,当且仅当 m0 时不存在套利。有关更多详细信息,请参见 Hansen&Richard(1987)。证明结束。证明结束。2.2.2.2.定价中心公式的另一种证明 定价中心公式的另一种证明 从微观经济学中的效用最大化框架出发,我们假设理性人在 t-1 期持有数量为1tq的投资资产,资产在 t-1 期的价格是1tp,t 期的消费是tc,t 期的工资收入是tw,那么他在 t 期的预算约束是:1()tttttttcp qpd qw 我们构建如下生命周
25、期期望效用最大化问题:0,1max()ttttc qtEu c Subject to:1()tttttttcp qpd qw 其中:是折现因子。由于这这个问题下,我们只假设存在一个代理人,所以,资产数量是恒定的,所以:1 ttqqt 用拉格朗日方法求解优化:0111()()ttttttttttttLEu ccp qpd qw 我们对着rc和rq 分别求一阶导:2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 8/22 请务必阅读正文之后的免责条款部分 F.O.C:F.O.C:0()0rrrrLEu cc
26、F.O.C:F.O.C:111()0rrrrrrLppdq 把第一个算式中的拉格朗日乘子带入第二个一阶条件:1111()()()tttttttttEu c pEu cdp 于是,我们得到:111()()1()ttttttu cpdEu cp 从上面等式,我们得到资产价格是未来收入的折现,并且,存在随机折现因子,我们用 m 代替:11()()tttu Cmu C 11()ttttpE mx 上一小节的方法和从消费出发的方法,都是教材中描述的经典方法,但是很明显,第一种方法更直观、直接、普适。2.3.2.3.定价中心公式的应用 定价中心公式的应用 上文证明了这个式子的正确性:1,11tti tEm
27、R 把之前的收益率改写成常规的收益率:,1,11i ti tRr。所以得到:1,10tti tEm r 这个等式这么看还不那么激动人心,我们可以再改写一下:2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 9/22 请务必阅读正文之后的免责条款部分 1,11()()ti ttErf m 而:,11,11()i tti ttrEr 所以:,111()i tttrf m 这个就是的收益率预测等式收益率预测等式。收益率预测等式有如下启示:(1)收益率预测等式有如下启示:(1)根据 Riesz 表示定理,m 在完
28、备空间 里,但是 m 具体是什么函数形式是不知道的。(2)(2),11,11()i tti ttrEr 里面的1()tE函数表示各类经济状态、各种已知未知的信息,所以期望收益与真实收益有个残差的区别,如果市场完全信息如果市场完全信息,那么,11,11()=()i tti ttrErf m,即资产的收益可以由随机折现因子表示。(3)(3)由于 Reisz 表示定理,只说了存在性和唯一性,并没有说明其具体函数形式具体函数形式,事实上随机折现因子的具体函数形式无法精准确定,像幽灵一样存在于资本市场,存在于“人心”。值得欣喜的是,很多投研人员,虽然没有系统学习过金融专业知识,凭借良好的悟性和经验,隐约
29、感觉到了他的存在。(4)(4)下面著名的定价等式都是,11,11()=()i tti ttitrErf m,因子部分是 m,线性函数就是()f:ititittitrMKTe (1)ititittittittitrMKTs SMBh HMLe (2)ititittittittittitrMKTs SMBh HMLm MOMe (3)ititittittittittittitrMKTs SMBh HMLr RMWc CMAe (4)上面(1)-(4)式中,左边的 r 表示基金的日收益与日无风险收益的差额,右边的各个因子表示因子的日收益率,MKT 表示市场日收益与日度无风险收益的差值。(1)式表示的
30、是 CAPM 模型,只有市场的超额收益一个因子。(2)式用的是市场、市值、账面市值比三个因子。构建方法上,用不同因子的上 50%分位的股票组合收2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 10/22 请务必阅读正文之后的免责条款部分 益减去下 50%分位组合的收益,得到多空组合下因子的每日收益数据。(3)式是依据 carhart 四因子模型,比三因子多了动量因子,动量因子是利用过往十一个月涨幅靠前 30%组合作为多头,跌幅靠前 30%作为空头,作为未来一个月的多空组合,从而获得日收益率。(4)是 F
31、amaFrench(2013)五因子模型来构建定价模型,比三因子多了 RMW 和 CMA 因子,分别衡量了盈利能力强弱股票的收益差异,和新增投资多少的股票组合的差异。3.3.随机折现因子与多因子模型 随机折现因子与多因子模型 下面论述,是为了证明多因子模型起源于对 SDF 的因子形式假设SDF 的因子形式假设。(1)非系统性风险不被定价(1)非系统性风险不被定价 根据:cov(,)()()()X YE XYE X E Y()cov(,)()()pmxm xmx 因此:1cov(,)cov(,)ffxm RpmmRRm R 因此:cov(,)ffRRRm R 风险溢价与cov(,)m R成比例。
32、有时我们也许会对 x 进行分解:mxx 其中proj(|)mxx m是 x 的系统性风险,proj(|)xx m为非系统性(特殊)风险。很容易看出:cov,ffmRRRm R 2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 11/22 请务必阅读正文之后的免责条款部分 其中/mmRxp。换句话说,非系统性风险没有被定价。(2)Beta-定价(2)Beta-定价 对于资产 i,总收益可以写成:cov,var()var()iifR mmRRmm 或者:,ifi mmRR 其中,,i m衡量了资产 i 包含的
33、系统性风险;m为“风险价格”。(3)因子模型(3)因子模型 我们假设随机折现因子具有下面因子形式随机折现因子具有下面因子形式:mab f 其中 f 为一列“因子”,b 为因子载荷,a 为一个常数,我们称之为“因子模型”。在不丧失一般性的前提下,我们假设0f,那么1/fmaR。既然1imR,那么就有:cov,11iiiR fbm RRmmaa 使得i为iR在f上的回归系数,那么,1iifffR。所以:111iiR fffffbffbRaaaa 注意到ffbmf。如果我们定义 ()fRmf 可以得到:2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5
34、 金融工程报告金融工程报告 http:/ 12/22 请务必阅读正文之后的免责条款部分 ifiRR 这就是-定价模型的一般形式。反之,我们也可以从ifiRR 中得到mab f。因此,因子模型相当于 beta 定价模型。CAPM 和 APT都是因子模型的特例。CAPM 和 APT都是因子模型的特例。上面论述,我们可以看出来多因子模型源起于对 SDF 的因子形式假设SDF 的因子形式假设。4.4.随机折现因子与人工智能 随机折现因子与人工智能 上文在对 SDF 因子形式的假设下,得到了多因子模型。当然,收益预测等式:当然,收益预测等式:,111()i tttrf m 其中的 其中的1()tf m
35、真实形式是什么样的谁也不知道,如果 m 不是表述成某类固定因子的线性组合,而是其它动态的收益率序列的函数形式,这时用到的就是人工智能算法。注意,人工智能算法不违背 m 的性质,相反,由于其动态性,不是像多因子那样取固定一组因子,其估计性能可能更好。为什么要将人工智能与机器学习应用于资产定价?真实形式是什么样的谁也不知道,如果 m 不是表述成某类固定因子的线性组合,而是其它动态的收益率序列的函数形式,这时用到的就是人工智能算法。注意,人工智能算法不违背 m 的性质,相反,由于其动态性,不是像多因子那样取固定一组因子,其估计性能可能更好。为什么要将人工智能与机器学习应用于资产定价?(1)两大研究思
36、路或者说流派已经垄断了现代实证资产定价研究。第一个试图描述和理解不同资产预期收益间的差异。第二思路是重点研究股票市场风险溢价的动态变化。衡量资产的风险溢价从根本上讲是一个预测问题风险溢价是对未来超额收益的条件预期。机器学习与人工智能的方法主要用于复杂情形的预测,因此非常适合于风险溢价的测量问题。(2)用于风险溢价的预测的条件变量十分丰富,也就是影响tI(,1,1EE()()ti tittrIr)的变量及其多。专家们已经积累了大量具有预测收益能力的指标。各类文献中讨论过不下数百个股票层面的预测指标、数十个宏观经济预测因子。此外,预测变量间往往是高度相关的。当预测变量数接近观测样本数或预测变量高度
37、相关时,传统的预测方法会失效。而机器学习擅长变量选择以及降维,能够减少预测变量之间的自由度并且压缩冗余变量,非常适合此类具有挑战性的预测问题。2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 13/22 请务必阅读正文之后的免责条款部分(3)更复杂的,如果要加入高维预测变量,那么如何确定它们的函数形式呢?是线性还是非线性的?如果是非线性的,又应采取何种形式呢?我们必须考虑预测变量之间的相互作用吗?如果全面考虑到这些问题,可选的具体模型将是千千万万。鲜有理论文献对条件变量的筛选以及函数形式的选取进行指导。而
38、机器学习非常适合此类函数形式无法确定的问题,具体体现在以下三个方面。首先是它的多样性。机器学习下的函数搜索范围十分广阔。其次,从广义线性模型到回归树和神经网络的方法,机器学习的设计初衷就是用以厘清变量间复杂的非线性关系。第三,机器学习中存在参数惩罚以及保守模型选择准则,它可以避免过拟合偏差和错误发现。对人工智能方法在定价上的应用进行简单举例。一般形式上,假设资产超额收益是下面预测形式:对人工智能方法在定价上的应用进行简单举例。一般形式上,假设资产超额收益是下面预测形式:,1,1,1Ei tti ti trr,11,E()ti tti trf mgz 我们的目标是找到,1Eti tr 的函数形式
39、,准则是使得对样本外的,1i tr解释度最大。我们把预测变量记为预测变量记为,i tz,并且假设条件期望函数 g是这些预测变量的灵活函数,也就是函数形式不去特定限制。我们下面来看两个函数形式举例。(1)简单线性预测模型(1)简单线性预测模型 这时的函数为:,;i ti tg zz 目标函数为样本外解释度最大,也就是求下面函数最小化:2,1,111();NTi ti titrg zNT(2)神经网络预测模型(2)神经网络预测模型 神经网络的具体算法不在这多说,本文中心不在于介绍具体技术。2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报
40、告金融工程报告 http:/ 14/22 请务必阅读正文之后的免责条款部分 图图 1:神经网络:神经网络 资料来源:浙商证券 神经网络最终的输出也是各个神经元的线性加总:5(1)(1)(1)01(;)jjjg zx 目标函数还是这样一个2l形式:2,1,111();NTi ti titrg zNT 5.5.人工智能在技术上配合多因子 人工智能在技术上配合多因子 在这一部分,我们介绍人工智能方法去辅助多因子方法两个模型。下面的第一个模型从根本上讲还是多因子模型,第二个方法二者融合的要深一些,但还是基于因子。(1)线性形式(1)线性形式 2 3 2 5 6 3 3 5/4 3 3 4 8/2 0
41、1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 15/22 请务必阅读正文之后的免责条款部分 传统投资方法假设收益服从一个线性多因子模型:1122iiiiiLLiRau Fu Fu Fe 因子包含一系列对资产收益有解释能力的变量,包含宏观经济状态、资产基本面信息、技术属性等等。该因子模型原本是一个解释模型,并非用于预测,为实现预测功能,每一个因子值需要用估计值代替:1122iiiiiLLiRau Fu Fu Fe 其中LF 是因子 L 基于现有的信息,对未来价值的估计值。我们有多种模型可以对该未来价值进行估计,最简单的可以用历史均值进行估计,更为复杂精细的,可以
42、构建人工智能模型去预估因子未来值人工智能模型去预估因子未来值。上式因子模型既可以用来控制风险,也可以用来提高回报。前者通过获取资产收益之间相关性的主要来源,人们可以构建一个均衡的投资组合,从而分散特定风险。对于后者,如果能够预测某个因素的未来价值,则可以通过构建一个倾向于“好”因素而不是“坏”因素的投资组合来获得更高的回报。(2)非线性多因子模型(2)非线性多因子模型 尽管线性因子模型已被证明是用于投资组合分析和投资管理的非常有用的工具,但是因子值与预期收益之间存在线性关系这一假设是相当严格的。具体而言,线性模型的使用假定每个因子独立地影响收益,因此,它们忽略了不同因素之间可能存在的相互作用。
43、此外,如果使用线性模型,随着因子暴露的增加,资产的预期收益可以无限制增长,这显然是不合理的。为了克服线性模型的这些缺点,必须考虑更通用的非线性模型:1212,iiiiLLiRf uuuF FFe 为简化该模型,我们用历史均值作为未来因子的估计值,可以得到:121212,iiiiLLiiiiLiRf uuuF FFef uuue 其中,ilu为预测期初的因子暴露。2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 16/22 请务必阅读正文之后的免责条款部分 我们有丰富的模型可以用来估计非线性方程 f,以下简
44、单介绍一种巴克莱曾经用的多层前馈神经网络多层前馈神经网络(H方法对因子暴露与未来收益之间的非线性关系进行建模。该神经网络模型并非试图预测股票的未来收益,而是专注于区分“好”“坏”股票。他的目标是预测出股票相对于市场的表现优劣,从而避免了对市场走势的预测。模型所使用到的数据包括:股票池内所有公司的月初因子暴露以及月度股票收益率。用到的因子包括 E/P、B/P、过去的股价表现、分析师情绪指标等等。证券收益中包含了大量未被因子模型捕捉的噪声,当这些信息被用来训练神经网络时,网络试图复制学习的大部分内容将是训练集中出现的噪声。为了最小化对噪声的学习,为了最小化对噪声的学习,训练中同时使用了验证集和正则
45、化。验证集验证集用尚未对其进行培训的数据监视模型的性能,当验证集误差开始增加时,停止学习过程。正则化正则化进一步限制了由网络实现的功能的复杂性,并且通过减少模型方差,提高了泛化性。选股模型采取了滚动训练/测试窗口滚动训练/测试窗口的方法。首先,为每个月的数据建立 M 个“两层”前馈网络。每个网络使用随机梯度下降进行训练,选取四分之一的月度数据(随机选择)用作验证集。通过主成分剪枝进行正则化。一旦训练完成,将在连续 N 个月的数据上构建的模型组合起来(从而提高模型的稳健性)以预测下个月的收益。因此,k 月股票 i 的收益预测(样本外)由下式给出:*1211(),*N MkkkikjiiiLjR
46、kNNuuuNM 其中,()iR k是股票 i 的预测收益,()kjNN是 k-j 月建立的神经网络,kilu是因子 i 在 k 月初的因子暴露。在美国市场的检验证明,不同股票池下,非线性多因子模型(多层前馈神经网络)下的组合夏普表现均优于简单线性多因子模型(广义最小二乘)。数据表明,非线性模型在极端情况下具有更为优越的预测能力。尽管原始数据的信噪比非常低,但多层前馈神经网络模型能够挖掘因子暴露与预期收益之间有意义的关系。当用于构建对冲投资组合时,这些预测能够获得具有良好风险特征的持续回报。2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融
47、工程报告金融工程报告 http:/ 17/22 请务必阅读正文之后的免责条款部分 6.6.人工智能投资实战应用再探讨 人工智能投资实战应用再探讨 根据前文收益率预测等式:*()it ititttititw rw fmw*()it itttitititw rfmww 在完全信息市场完全信息市场,定价函数包含所有有效信息,残差可以被抵消,所以:*()0it itttw rfm*()it itttw rfm 上式我们看出,特定的*()ttfm对应着特定的组合权重。当市场信息不完全,残差不能被抵消,高配残差为正的证券时:当市场信息不完全,残差不能被抵消,高配残差为正的证券时:*()ititttit i
48、tw rfmw r 这个就是指数增强的基本原理。实际上指数增强策略时,多因子的思路就是刚才说的,找未来有超额收益的证券去超配。多因子的思路就是刚才说的,找未来有超额收益的证券去超配。还有一个方式,在想法上更抽象、方法技术上更直接,我们可以直接找到符合下面特性的函数*()tf:*()ititttw rfm 2 3 2 5 6 3 3 5/4 3 3 4 8/2 0 1 9 1 1 1 1 1 7:4 5 金融工程报告金融工程报告 http:/ 18/22 请务必阅读正文之后的免责条款部分 这个思路和前文描述的人工智能算法有所不同,前文描述的是方法是先用人工智能方法预测收益或者对股票分类,然后构建
49、组合。这个方法是“一步到位”,找到一个方法直接构建组合。作者之前研报一直用这样的思路,很多客户表示不解或者感到奇怪,其实这个思路是从最根本的定价理论引出来的思路是从最根本的定价理论引出来的。其实这个思路一点也不奇怪,金融学中的“异象”问题,就是*tf函数问题。我们找我们找*tf,就是在找 anomaly,只是这个异象不像常规异象那样容易命名,里面的机理也更复杂。,就是在找 anomaly,只是这个异象不像常规异象那样容易命名,里面的机理也更复杂。作者从业以来一贯坚持这个思路。这个思路具有很强的实践意义,把基于收益率的预测问题,转化为了*f函数的寻找问题,稳健性更强,也是我们人工智能系列研报一贯
50、遵循的思路。人工智能系列一“指数增强”新思维人工智能+传统金融“指数增强”新思维人工智能+传统金融就是通过稀疏优化算法,找到一中线性组合,使得其大概率产生超额收益。人工智能系列二次优理论下的组合配置与策略构建人工智能再出发延续这个思路,通过差分进化算法得到组合,同样,具备 60%以上的胜率,年化超额在 6%左右。当然,上面说的很简单,找个*f即可,但是,这个*f不容易寻找,需要对很多种算法很了解,且需要对线性空间理论有良好的理解,在这样的基础上大量试验,最终找出稳健的算法,也就是*f。这个过程更像是工程实验,没有好的办法,就是大量的实验。这个过程更像是工程实验,没有好的办法,就是大量的实验。作