1、第 39卷第 5期2009年 3月数学的实践与认识M ATHEM ATICS IN PRACTICE AND THEORYVol.39 No.5 March,2009 RiskMetrics模型评估与扩展张术林1,2,魏正红3(1.中山大学工商管理博士后 科研流动站,广东 广州510075)(2.广发证券博士后 工作站,广东 广州 510075)(3.深圳大学师范学院 数学系,广东 深圳 518000)摘要:RiskMetrics是当今最为流行的风险度量模型,然而其基础假设-标准化收益服从正态分布,却备受置疑.放宽此假设,以更灵活的 t分布,广义误差分布,混合正态分布,Johnson Su-正
2、态,Pearson IV 分布代替,建立了五种扩展的 RiskMetrics模型.我们用沪深股市日收益数据进行实证比较分析,回测结果表明,扩展模型明显优于标准模型,而基于非对称分布假设的模型优于基于对称分布的模型.关键词:风险价值;RiskMetrics模型;t分布;广义误差分布;混合正态分布;Johnson Su-正态;PearsonIV分布;回测检验1 引言收稿日期:2006-08-10风险管理是当今企业管理的核心内容之一.理论研究者和风险管理人员一直致力于建立准确可靠的风险度量模型.RiskMetrics模型是由 J.P.Morgan建立的基于 Value-at-Risk(VaR)概念的
3、第一种全面市场风险度量模型,其软件产品 RiskMetricsTM1得到了业界的广泛认同和使用.RiskMetrics模型有两个基础假设:一,条件波动可以 IGARCH(1,1)过程刻画;二,标准化收益(收益除以条件波动)服从正态分布.关于条件波动建模有很多文献 2.RiskMetrics模型利用指数加权滑动平均法估计波动,其实质是一种特殊(G)ARCH模型,但参数估计比一般(G)ARCH,随机波动模型简单得多,1991年,Nelson3证明了对于股票收益等过程,任何一类(G)ARCH模型,即使设定错误,也能给出条件波动的一致估计,也就是说,虽然RiskMetrics条件波动模型未必正确,但当
4、样本量充分大时,估计值也能充分接近真实值.第二个假设则一直备受置疑.大量实证分析表明,收益序列具有高峰厚尾,非对称等特征,不能用正态分布刻画4,5.基于正态分布的 VaR模型常常低估风险水平6.本文扩展了 RiskMetrics模型,放宽其条件收益服从正态分布的假设,使用参数灵活的 t分布,广义误差分布(GED),混合正态分布(MN),Johson Su-正态分布(Su-N),PearsonIV分布(PIV)等分布替代,建立五种扩展模型.这五种分布都可以看作广义的正态分布,在适当参数值,t 分布,广义误差分布比正态分布厚尾,而混合正态,Johson Su-正态,PearsonIV分布厚尾且非对
5、称.在第 2节中,我们简单分析标准 RiskMetrics模型,建立五种扩展的 RiskMetric模型;第3节,我们使用这六种模型估计沪深股市 4种主要指数和 16种股票的风险价值(VaR),并用回测法对其进行评估;最后一节是结论.2 RiskMetrics模型设 r1,r2,rT为一列收益序列,标准 RiskMetrics模型假设收益序列具有如下结构:rt=htut;ut服从标准正态分布;h2t=h2t-1+(1-)r2t-1 称为衰减指数,0 2)其中()为 gamma函数,为自由度.学生 T分布关于 0对称,当 4时,其四阶矩存在,峰度 k=3(-2)/(-4)3.当 时,学生 T分布
6、逼近于正态分布,因此,正态分布可以看作特殊的学生 T分布.广义误差分布(GED()Nelson(1991)8引入广义误差分布拟和标准化收益.标准化广义误差分布的密度函数为fGED(x;)=exp(-1/2|x/|)2(1+1/)(1/),0.其中 为尾部参数,=2-2/(1/)(3/).广义误差分布关于 0对称.当=2时,GED即为标准正态分布;当 2时,广义误差分布比正态分布薄尾.混合正态分布(MN(p,_,e)Longerstay9认为在大部分市场正常时期,标准化收益可以用标准正态分布刻画,而在少数非正常时期,比如政府公布重要法令,引起市场震荡,则标准化收益不能用标准正态分布刻画,而需要用
7、另一个不同的正态分布,即_t=_1,t,以概率 p_2,t,以概率 1-p其中,u1t为标准正态分布,u2t为均值为 _,标准差为1+e2的正态分布,a 为 0/1随机变量,以概率 p取值 1,概率 1-p取值 0,其密度函数为fMN(x;p,_,e)=pN(x;0,1)+(1-p)N(x;_,1+e2)其中,N(;0,1),N(;_,1+e2)分别为标准正态分布和均值为 _,标准差为 e 的正态分布密度函数.Johson Su-正态分布(Su-N(,)355期张术林,等:RiskMetrics模型评估与扩展Johnson Su-正态分布是正态分布的双曲正弦函数10,由两个参数确定:,Z=si
8、n h(+Z),-Z0其中 Z为标准正态随机变量.标准化 Johnson Su-正态分布的的密度函数为fSuN(x;,)=e2 c(e x+_)2+1)2exp-(sin h-1(e x+_)-)22 2其中 _=exp(2/2)sin h();e2=1/2(exp(2)-1)(exp(2)cos h(2 )+1).改变参数 ,Johson Su-正态分布能拟和任意偏度,峰度的分布.Pearson IV分布(PIV(m,W)Pearson IV 型分布属于 Pearson曲线族,许多常见分布如正态分布,学生 t 分布,Gamma分布,F分布,Beta分布等都属于 Pearson分布族.Pear
9、son IV分布是其中非常重要的一类.标准 Pearson IV分布(均值为零,方差为 1)密度由两个参数所确定:偏度参数 W 和峰度参数 m,其密度函数为10:fPIV(x;m,W)=C 1+x2*-mexpW arctan(x*)其中C=4(m-1)2+W22(m-1)2m-3c/2-c/2cos2m-2eW tdt,x*=x4(m-1)2+W2+W2 m-32(m-1)2 m-3当 m 2时,其前四阶矩存在,偏度,峰度可以表示为:s=2 Wm-22m-34(m-1)2+W2(1)k=3(2m-3)(m-2)(2m-5)2m+4-32(m-1)24(m-1)2+W2(2)由式(1),当 W
10、=0时,偏度 s=0,分布对称;当 W 0(W0(s 0),分布右偏(左偏),故 W 可以视作对称参数.再由式(2),在对称情况下,W=0,峰度 k=3(2m-3)2m-5,当m ,k 3,我们得到正态分布.从而 m 可以视为峰度参数,m越小分布越厚尾.上述这几种分布都可以看作是正态分布的推广.在适当参数值,这几种分布都比正态分布厚尾.学生 T分布,广义误差分布只有一个未知参数,属于对称分布族;Johson Su-正态,Pearson IV分布有两个未知参数,可以拟和非对称分布;混合正态分布需要估计三个参数.我们使用最大似然法估计参数,其中混合正态分布由于似然函数较复杂,我们使用 EM算法见文
11、 11.我们统称基于这五种分布的 RiskMetrics模型为扩展 RiskMetrics模型.给定置信水平q,其风险价值为 VaRt,q=-F(1-q)*ht,其中 ht为条件波动,F()代表这几种分布中的一种.3 实证分析在这一节里,我们分别用标准 RiskMetrics模型和扩展 RiskMetrics模型估计一日 VaR,并利用回测法对 6种模型进行评估.3.1 模型检验回测法是用预测的 VaR与的对应的收益进行比较.假设一个模型是好的,则在既定36数学的实践与认识39卷置信水平 q,实际观测值 r1,r2,rT中超出 VaR估计值 VaRq的次数(失效次数)应该接近于 T(1-q).
12、假设实际失效次数为 n,如果 n接近 T(1-q),我们可以认为模型是好的;如果 n远大于 T(1-q),则我们认为模型低估了风险;反之则认为模型低高估了.Kupiec12提出了一个基于失效率的检验.假设在 T个观测值中,有 n次失效,定义失效序列 It=Irt-VaRt,q,其中 I()()为示性函数,则 n=Tt=1It,失效频率为 p=nT,在零假设p=1-q=p下,似然比(LR)统计量逼近自由度为 1的 i2分布:LR=-2 ln(1-p)T-npn+2 ln(1-p)T-npn i213.2 数据及结果我们考察 2001年 1月 2日 2004年 12月 31日 4年间 965个交易
13、日沪深股市 4种主要指数及 16只 A股股票(按随机原则分别从沪市和深市各选取 8只).依据每日收盘价计算百分比对数收益.数据来源于广发证券交易数据库.2001年 1月 2日至 2002年 12月 31日两年共 480个数据被用作 样本内数据 估计最优衰减指数及各种扩展模型的参数.表 1是模型参数估计结果.第四行是广义误差分布的尾部参数,所有尾部指数均小于 2,说明标准化收益厚尾;最后一行为 PearsonIV分布的参数估计值,也可以看出标准化收益厚尾且非对称.表 1参数估计值上证指数上证A指深成指深成A指G万科深发展招商地产五粮液中信国安捷利股份上风高科三九生化浦发银行齐鲁石化东北高速G武钢
14、四川长虹东方集团大连热电中国国贸0.967 0.966 0.965 0.960 0.967 0.999 0.919 0.958 0.999 0.939 0.946 0.945 0.999 0.952 0.937 0.941 0.983 0.979 0.981 0.900t4.424.404.784.934.394.125.764.704.385.424.824.104.424.495.474.364.184.844.125.76GED1.101.101.151.171.091.091.191.101.111.161.141.001.071.091.231.021.101.171.061.20M
15、N0.980.980.980.980.970.970.960.970.960.970.950.960.980.960.970.970.970.980.970.960.950.941.000.980.131.150.241.050.48-0.08 0.11-0.69 0.870.701.470.850.030.720.430.073.013.042.983.123.332.722.592.652.503.312.513.073.072.762.623.053.043.082.812.93SuN0.060.060.090.090.040.190.050.100.11-0.06 0.080.050.
16、180.070.210.040.110.100.130.060.700.710.660.65-0.70-0.72 0.600.67-0.69 0.620.67-0.75 0.680.690.60-0.72-0.72 0.65-0.73 0.59PIV2.762.742.943.032.692.593.392.892.713.212.902.552.802.783.322.692.592.932.563.470.290.280.400.420.120.660.120.410.41-0.28 0.290.190.740.290.970.170.360.420.420.24表 2是标准化收益的样本统计量.可以看出,与标准差相比,所有平均收益均接近于零.收益序列具有高峰厚尾特征.根据样本偏度检验,T/6s N(0,1),其中 s为偏度系数,T=964为样本量,由正态分布表,5%,10%水平双边临界值(绝对值)分别为 1.96,1.65(调整后分别为 0.16,0.13).由此判断,在 5%,10%显著水平,除招商地产,中国国贸外,所有标准化收益均非对称.表 2 标准化收益样本统计量统计量上证指