1、一、引言自2014年我国债券市场发生首例违约以来,债券违约事件频发。据Wind数据库统计,2018年我国信用债券违约总额已达 1209.1 亿元,大于 2014 2017 年四年之和。2019年债券违约总额为1444.08亿元,相较2018年进一步增加。从历史上来看,欧债危机、美国次贷危机等都源于债券市场大面积违约,一度使得全球经济陷入危机。企业破产、财务困境和债券违约的预警研究源于20世纪60年代(Beaver,1966;Altman,1968),我国在这方面的研究也已有30多年的历史(吴世农和黄世忠,1987),后续研究(陈静,1999;张玲,2000;吴世农和卢贤义,2001)主要在20
2、00 年前后。近年来,对这一课题的新研究并不多。最近的研究发现,随着我国债券市场的发展,发债企业、债券种类和债券发行量越来越多,但债券违约事件频发,不仅债券违约数量大幅增加,种类多元,而且违约债券的信用级别呈现上升趋势,涉及的企业类型、所属行业和地区也越来越多(吴世农等,2021)。因此,如何识别、预警、防范债券违约风险,构建具有信息含量的高效的债券预警模型,成为债券违约预警研究的热点问题。本文以我国20142020年所有发生债券违约的发债企业和所有未发生债券违约的发债企业为样本,收集相关财务信息和非财务信息,应用Fisher判定模型和Logistic判定模型构建我国债券违约的预警模型。研究结
3、果表明,本文所构建的债券违约预警模型具有较强的解释能力和较高的预测精度,为现有债券违约风险管理提供了新的依据和工具。本文的主要边际贡献在于:一是探讨财务预警指标及其滞后年限与债券违约预警模型准确率之间的关系,为如何选择财务指标用于债券违约的预警模型提供新的思路。二是指出哪些指标对于债券违约预警具有重要意义。三是在根据财务信息构建债券违约预警模型的基础上,探讨引入非财务信息(包括企业所有制、企业所在省份与所在行业风险情况和宏观经济情况等),是否可以有效地提高债券违约预警模型的准确度。二、文献综述债券违约的原因比较复杂,往往是内外因、财务与非郑 煜,吴世农(博士生导师)基于财务信息和非财务信息的债
4、券违约预警模型研究Fisher模型与Logistic模型的实证分析与应用【摘要】自2014年我国债券市场发生首例债券违约以来,债券违约事件日益增多。尤其近几年来,无论是发生债券违约的企业、债券违约的只数还是违约总金额,都呈现爆发式增长和蔓延态势。在此背景下,本文使用20142020年债券市场全样本数据,基于财务信息构建债券违约预警模型,在Fisher模型与Logistic模型判别效果对比后选择了Logistic模型,并在此基础上加入部分非财务信息指标,以进一步提升模型的预测能力。最终得到基于财务和非财务信息的Logistic模型。研究结论如下:第一,Logistic模型整体判别效果优于Fish
5、er模型。第二,构建的基于财务和非财务信息的Logistic模型具有较好的预测能力,经济含义清晰,具备实际使用价值。第三,财务指标如净资产收益率、资本累积率、刚性负债率、筹资NCF/平均总资产等是债券违约预警模型中的显著指标,这些指标对于预警债券违约具有重要作用。第四,部分非财务指标对于提升模型预警能力有明显效果,非财务信息诸如发债企业所在省份风险情况、行业风险情况、企业所有制形式等为预警债券违约提供了显著的增量信息,也反映了我国债券违约具有所有制、地域和行业的群聚特征。【关键词】债券违约;预警模型;财务信息;非财务信息【中图分类号】F275【文献标识码】A【文章编号】1004-0994(20
6、23)12-0022-8【基金项目】国家自然科学基金重大项目(项目编号:71790601)【作者单位】厦门大学管理学院,厦门 36100522 财会月刊2023.12DOI:10 19641/j cnki 42-1290/f 2023 12 003财务因素等相互作用影响下最终导致债券违约。从债券违约的影响因素来看,已有研究发现主要是财务、经营、公司治理和行业及宏观经济因素等。因此,早期的债券违约预警模型主要基于财务和经营因素,此后陆续发现债券违约具有行业特征、公司治理特征,同时与经济周期具有显著的关系。从债券违约的研究方法来看,先后应用简约模型、结构模型、统计线性判别分析、非线性判别分析等传统
7、的统计模型,以及近年来使用基于机器学习方法的人工神经网络(ANN)、支持向量机模型(SVM)和集成学习模型(ELM)等。相比传统统计方法构建的债券违约预警模型,目前基于机器学习方法的债券预警模型在准确度方面有明显的优势(吴世农等,2021),但较难以解释债券违约的成因,也因此难以提出相应的对策。我国首例债券违约发生的时间较晚,且债券市场集中爆发违约也只是近几年的现象,因此债券违约预警模型的相关研究近几年才引起广泛的关注。目前,债券违约预警模型的研究需要解决三个主要问题:一是财务预警指标的选择;二是非财务预警指标的选择;三是预警模型的选择。(一)预警指标的选择1.财务预警指标。Beaver(19
8、66)、Altman(1968)、Ohlson(1980)、吴世农和黄世忠(1987)、王春峰等(1998)、陈静(1999)、张玲(2000)、吴世农和卢贤义(2001)、方洪全等(2004)、郭斌等(2006)、Chen和Hsiao(2008)、Xiao等(2012)在财务危机或企业信用风险预警时较多选取的财务指标包括:资产负债率、ROE、流动比率、营运资本/总资产、总资产周转率、应收账款周转率、EBIT/总资产、留存收益/总资产等。Altman和Brenner(1981)、Clark和Weinstein(1983)发现并证实了除传统财务指标外,企业股票的收益率等也能对企业财务危机起到预警
9、作用。另外,Aziz等(1988)、张友棠(2004)、蔡基栋和晏静(2004)的研究从不同方面证明了现金流量相关指标对提高预警模型准确度和稳定性具有显著作用。现有文献侧重于使用自由现金流或经营活动净现金流等指标,而近年来我国出现的许多债券发行主体违约都涉及企业激进投资扩张或再融资困难等因素,因此,基于我国国情,除现金流量相关指标以外,还需深入探讨企业过度投资、融资模式、融资约束和融资净现金流对债券违约的影响。2.非财务预警指标。一般情况下,非财务指标可以分为三类:一是宏观经济指标;二是行业和区域状况指标;三是企业的非财务指标。Alves(1978)率先提出,需要将宏观经济指标纳入企业财务危机
10、预警模型。Nam(2008)在对风险模型的拓展中创造了宏观依赖模型,加入GDP增速指标,大大增强预警模型的解释力。姚红宇和施展(2018)使用我国企业的样本数据证明了部分宏观经济指标和地方经济指标对于提高预警模型的精度有显著作用。尽管不少学者已经考虑到宏观经济指标对于企业财务危机或债务违约具有重要影响,但近年来一些企业因宏观融资环境的骤然变化导致资金链断裂从而发生债券实质性违约的情形,已有研究中所纳入的宏观经济指标并不能准确地进行解释和预测。Perry(1981)指出,企业所处不同的行业将呈现截然不同的行业特征,因此他将行业信息指标纳入预警模型作为重要变量。企业的非财务指标包括一系列定性和定量
11、信息。郭斌等(2006)将消除行业影响后的行业相对财务指标以及加入银行的授信额度、企业的贷款方式、公司规模、M2增长率、CPI增长率等非财务指标引入模型,发现模型的表现有所提升。姚红宇和施展(2018)在模型中引入了企业所有制形式和地方经济指标,发现预测结果好于Altman模型。Liang等(2016)、Wang等(2014)、Brown(2012)、杨海军和太雷(2009)发现加入一些公司治理变量可优化机器学习算法的分类能力,或改进模型对不平衡样本的处理能力。综上所述,值得纳入考量的非财务预警指标包括:从宏观角度看,经济周期、宏观经济政策的变化等;从地区角度看,当地经济发展状况、社会资本等;
12、从行业角度看,行业周期变化、资产轻重、其他行业信息指标等;从微观角度看,公司治理特征、股权结构、企业所有制形式、法律纠纷等。(二)预警模型的选择此前学者主要使用传统的统计分析方法构建模型进行财务危机、企业违约的预警或信用风险分析,包括结构模型、简约模型和判别模型。随着计算机科学和人工智能技术的发展,现代人工智能方法也逐渐被用于构建预警模型。在结构模型方面,Black 和 Scholes(1973)、Merton(1974)提出使用期权定价理论构建结构化模型来评估企业的信用风险,把公司价值作为影响债券是否违约的重要因素。但由于我国债券市场违约历史并不长,违约历史数据不充足,且我国债券市场很多信用
13、债券成交并不活跃,价格发现机制很难充分发挥作用。其余结构模型如Black和Cox(1976)提出的首达违约模型(First PassageModel),其前提假设条件是利率始终不变,这与实际情况明显不符;美国KMV公司建立的KMV模型,其存在无法度量非上市公司的局限性。因此,上述结构模型均较难实际运用于我国信用债券违约预警。在简约模型方面,此模型最早由 Jarrow 和 Turnbull(1995)提出。他们认为债券违约是外生的,违约只与公司的外部因素(如经济因素和统计价值)有关,基于这个基本认识来计算违约率。此后,学者主要从两方面研究违约强度:一是分析违约强度的影响因素。Duffie与Lan
14、do(2001)、Kay(2003)指出影响违约强度的因素可以分为宏2023.12财会月刊23观经济因素和企业自身因素,一般后者对违约强度起主要作用。二是分析违约强度遵循的随机过程。研究发现,简约模型在预测能力上并无显著优势。在判别模型方面,最早由Beaver(1966)提出了单指标判定模型,而后 Altman(1968)提出多指标判定模型(Z-score模型),Altman(1977)又基于Z-score模型提出了包含七个变量的ZETA模型。从统计学的角度,上述模型均要求变量服从正态分布且相互独立,两个不同主体有各自的均值但有相同的方差协方差矩阵等条件,这与现实情况往往不完全一致。而后,Oh
15、lson(1980)提出的Logistic 模型、Zmijewski(1984)引入的与Logistic 模型相似的Probit模型,使得上述假设条件得以放宽,模型预测准确度也被证明有所提高。此后许多研究亦证明Logistic模型具有较好的预警效果(吴世农和卢贤义,2001)。在基于机器学习的预警模型方面,Odom 和Sharda(1990)、Coat和Fant(1993)、Altman等(1994)、杨淑娥和黄礼(2005)等学者的研究均表明神经网络分析法有较好的预测效果。Varetto(1998)使用遗传算法来进行企业财务危机预警,但发现预警准确度较低。Dimitras等(1999)使用粗
16、糙集理论进行企业财务危机预警,但在实践中粗糙集方法抗干扰能力较差,因而其更多是与其他基于机器学习的方法如神经网络分析等结合使用。Corinna Cortes 和 Vapnik(1995)提出支持向量机理论,而后 Fan 和Palaniswami(2000)率先运用该理论方法进行企业财务危机预警,取得了良好的预警效果。Barboza 等(2017)以1985 2013 年美国上市公司为样本,比较了传统的统计模型和机器学习模型对公司破产的预测精度。吴世农等(2021)以20142020年发债企业为样本,比较两种基于统计判定方法的预警模型和三类基于机器学习的七种预警模型的准确度。近年来,国内许多学者尝试优化神经网络或支持向量机并进行预警研究,如杨旸和林辉(2016)、阎娟娟等(2006)。但此前被证明有较好预警效果的神经网络方法和支持向量机等方法,是一种“数据驱动”模型,实际上对数据量有很高的要求,若借鉴运用于我国信用债券预警则需要有较多的历史违约数据积累。此外,基于机器学习所构建的预警模型一个明显的缺陷是其运算过程缺乏透明度,目前除了基于随机森林算法的决策树模型能够度量出变量的“重要性”,