1、书书书基于数据挖掘技术的虚假财务报告识别研究邓庆山著江西高校出版社书书书图书在版编目(C I P)数据基于数据挖掘技术的虚假财务报告识别研究/邓庆山著 南昌:江西高校出版社,2011 5ISBN 978 7 5493 0263 5.基 .邓 .数据采集 应用 会计报表 鉴别 研究.F231 5中国版本图书馆 CIP 数据核字(2011)第 084605 号出 版 发 行社址邮 政 编 码总编室电话销 售 电 话网址印刷照排经销开本印张字数版次印数书号定价江西高校出版社江西省南昌市洪都北大道 96 号330046(0791)8504319(0791)8508191www juacp com南昌市
2、光华印刷有限责任公司江西太元科技有限公司照排部各地新华书店850mm 1168mm1/325 125120 千字2011 年 5 月第 1 版第 1 次印刷1 1000 册ISBN 978 7 5493 0263 52800 元赣版权登字 07 2011 96版权所有侵权必究前言公司财务造假是一个存在已久、影响极其恶劣的国际性难题。1720 年的英国南海公司事件是世界上第一例上市公司财务造假案。南海公司事件直接导致了两个结果:一是股份公司近百年的关闭;二是以注册会计师为主体的民间审计的出现。尽管如此,公司财务造假现象一直没有消失,远的如 1929 年美国罗宾斯财务造假导致的美国股市的大崩溃,近
3、的如 2001 年美国的安然公司事件都是典型的财务造假案例。而在我国,继琼民源、PT 郑百文等财务造假丑闻之后,又暴露出了银广夏、ST 黎明、蓝田股份等财务造假恶性案件。上市公司财务造假问题引起了社会各方面的关注。针对公司的财务造假问题,专家学者进行了大量的定性或者定量的研究,取得了一定的研究成果。本书从舞弊理论、舞弊特征、舞弊识别模型等三个角度充分分析了国内外研究现状,在此基础上,进行了以下几个方面的研究。一、分析财务造假的原因和手段。本书从两个角度分析了财务造假的原因,一是客观原因,二是内在动因。客观原因包括:政府职能的问题、公司治理结构的缺陷、证券市场相关制度的不完善、不健全的监管机制等
4、;内在动因有:公司为了取得股票发行资格、提高股票发行价格、取得配股资格、避免被“戴帽”或者争取“摘帽”、为维持和提高股票价格、为了获取信贷资金和商业信用、为了业绩考核、为了满足发行债券的条件、为了减少纳税而粉饰会计报表等。财务造假的手段主要是利用关联方交易、资产重组、选用不当会计政策、会计政策与会计估计变更、资产评估等手段进行利润调节。1前言二、分析确定舞弊识别变量和实验样本。我们将 19992002 年持续经营、未被取消上市资格的上市公司作为训练样本的选择基础,将 20032006 年上市公司作为选择测试样本的基础。我们将审计意见为“拒绝表示意见”或“否定意见”或“无法表示意见”作为选择虚假
5、财务报告样本的基础;另外再根据中国证券市场的历史特点,按照一定的标准选择控制样本。参考前人的研究成果,从偿债能力及管理效率比率、利润现金创造能力比率、费用配比合理性比率、公司增长潜力比率、公司发展协调性比率等几个角度分析确定了 47 个备选舞弊识别变量。三、设计基于分类方法的虚假财务报告识别框架,并使用多种分类方法进行虚假财务报告识别研究,引入期望错误分类成本概念,对分类实验结果进行比较。首先根据大部分分类方法以及财务报表数据的特点,设计了基于分类方法的虚假财务报告的识别框架。并依据此框架,分别使用 Logistic 回归、神经网络、支持向量机、朴素贝叶斯等分类方法进行了实证分析。在进行实证分
6、析时,使用按一定标准选择的训练样本和经过论证分析后选择确定的识别变量对这四种分类模型分析进行了训练,然后使用测试样本检验不同的分类模型的分类效果,并基于期望错误分类成本,对这四种分类模型的识别效果进行了综合比较分析,发现神经网络和朴素贝叶斯两种分类方法在识别准确率和稳定性方面要好于另外两种方法。四、提出一种聚类方法进行虚假财务报告的聚类分析。在目前的审计环境下,单纯以公司财务报告的注册会计师审计结果来判断该财务报告的真假是有风险的(尤其是判断为真的时候)。所以有监督分类方法的学习结果可能使得分类存在一定的偏差。由于聚类是一种无监督学习的数据挖掘技术,无监督的学习与有监督的学习不同,它不要求学习
7、样本带有类别的信息,或者说不需要有先验知识,所以聚类方法对纷繁复杂的、真假难辨的2基于数据挖掘技术的虚假财务报告识别研究会计信息进行真假识别或许更有帮助。基于此,本书设计了一种基于聚类有效性测度的自组织映射和 K 均值聚类相结合的聚类模型 V KSOM。此模型继承了自组织映射自主学习的优点;将 K均值聚类运用于训练完成后的自组织映射平面网格结点,可以有效地划分聚类边界,克服了自组织映射聚类边界不清晰的缺点;由于自组织映射受结点初始值(随机产生)及样本学习顺序(随机的)的影响,聚类结果不稳定,为了选择最佳的聚类结果,本模型引入一种有效性测度来评判每次聚类结果。使用该聚类模型对虚假财务报告进行聚类
8、分析,实验结果表明该模型是行之有效的。本书的主要内容来自本人的博士毕业论文。在此我要特别感谢我的博士生导师梅国平教授,在梅老师的精心指导下,我才能在学术研究的道路上取得一点成绩,本书也才能得以定稿。此外,对本书提供过帮助的人还有关爱浩博士、毛小兵博士、陈辉博士等,在此一并致谢。邓庆山2011 年 2 月3前言目录第一章绪论1第一节本书研究背景1第二节虚假财务报告识别研究的意义2第三节相关概念界定4一、什么是会计信息4二、什么是会计信息失真4第四节技术路线与内容安排5一、技术路线5二、论文内容安排6第二章文献综述8第一节国外财务舞弊研究综述8一、舞弊理论研究8二、舞弊特征研究10三、舞弊识别模型
9、研究14第二节国内财务舞弊研究综述24一、舞弊理论研究24二、舞弊特征研究25三、舞弊识别模型研究第三节数据挖掘技术及其应用现状32一、数据挖掘的含义与功能32二、数据挖掘在经济管理领域的典型应用33第四节评述34第三章财务造假分析361目录29第一节造假原因分析36一、客观环境分析36二、内在动因分析39第二节造假手段分析43一、关联方交易43二、资产重组45三、选用不当会计政策46四、会计政策、会计估计变更46五、资产评估47六、其他手段47第四章研究样本与变量选择49第一节样本选择49一、虚假财务报告样本49二、控制样本50三、测试样本54第二节变量选择56一、选择标准56二、变量分析5
10、6第三节指标计算及其标准化67一、中心化67二、标准化68第五章基于分类方法的虚假财务报告识别研究69第一节基于分类方法的虚假财务报告识别框架69第二节Logistic 回归分析及其应用71一、Logistic 回归简介71二、实验过程与分析73第三节神经网络及其应用78一、人工神经网络的特点782基于数据挖掘技术的虚假财务报告识别研究二、神经元及其特性79三、BP 神经网络模型80四、基于神经网络的虚假财务报表的识别83第四节支持向量机及其应用90一、支持向量机理论90二、基于支持向量机的会计信息失真的识别95第五节贝叶斯分类及其应用100一、朴素贝叶斯分类简介100二、朴素贝叶斯分类的应用
11、102第六节几种分类方法实验结果的比较107第六章虚假财务报告的聚类研究111第一节自组织映射112第二节K 均值聚类方法114第三节聚类有效性114第四节V KSOM 模型117第五节V KSOM 模型的应用119一、实验样本选择119二、变量选择119三、实验过程与结果分析120第七章总结与展望123第一节研究总结123第二节研究的局限和今后研究方向126参考文献127附录 1:分类训练样本中 88 家公司列表137附录 2:分类测试样本中 172 家公司列表142附录 3:聚类实验样本中 100 家公司列表1503目录书书书第一章绪论第一节本书研究背景近十年来,我国频繁出现上市公司会计造
12、假、财务舞弊等案件,比如,“银广夏”虚构主营业务收入、虚构巨额利润;“琼民源”制造虚假会计信息以抬高股价,致使广大股东承受巨大的经济损失;红光实业虚构产品销售、虚增产品库存、实际亏损报表却盈利,以此获取股票发行资格等等。近年来,国家加大了对财务舞弊等违法行为的处罚力度,但是仍然有很多企业为了满足局部群体的利益,不惜铤而走险,以身试法,采用各种手段出具与企业真实经营情况不符的财务报表。上海国家会计学院财务舞弊研究中心对2005 年的财务舞弊情况做了调查,调查报告显示:有 84 家公司在该年度自行披露会计重大差错更正;38 家公司因涉及财务有关问题而被证监会限令整改;有 50 家公司被证监会立案调
13、查;有 58 家公司被证监会公开处罚或者被上海证券交易所和深圳证券交易所公开谴责。在国外,这种财务造假事件不断出现。据商业周刊报道,自上世纪末期至今,美国上市公司财务丑闻被曝光的范围和规模超过了大萧条以来的任何时期。2001 年 12 月 Enron(安然公司)因会计丑闻曝光刷新了公司破产规模的纪录;6 个月之后WorldCom(世界通信)再度爆发丑闻,再创公司破产规模的纪录;07 年日本三洋电机财务造假得以曝光;曾经显赫的朗讯、泰科、施乐、默克涉嫌虚假财务报告而成为会计丑闻家族的一员。虚假财务报告的泛滥不仅给政府机构监管公司运营带来困难,更给整个1第一章绪论国家经济、投资者等利益相关方带来实
14、质性的损害。据某些研究人员估计,虚假财务报告每年给美国经济带来的损失高达 4000 亿美元。目前我国资本市场动荡不定,上证指数从 2005 年的不到 1 千点到 2007 年 6 千点之上,到 2008 年最低的 1600 点,再到现如今的 3 千点左右。股市的起伏一方面是受国际资本市场大环境的影响,一方面反映了广大股民的不理性投资行为,财富效应总能吸引着越来越多的投资者参与到证券市场中。上市公司为了追求相关群体的利益最大化,依然有着强烈的财务造假的动机。上市公司财务造假必然会损害广大投资者的利益。财务报表舞弊问题是我国证券市场当前和未来一段时期内面临的最大挑战之一。第二节虚假财务报告识别研究
15、的意义公司财务舞弊的影响具体包括下面几个方面:第一,弱化市场的资源配置功能。市场资源配置功能要得以充分发挥,最重要的前提就是要求信息是真实有效并且公开的,然而公司财务舞弊,出具虚假会计信息必然会误导市场,从而导致资源配置的不合理。第二,误导投资者。投资者不会盲目投资,在进行投资之前,必然会要求了解上市公司的经营情况,他们通常是通过分析公司的财务报表来达到这个目的,但是虚假会计信息使得投资者无法获知企业的真实经营情况,这必然影响投资者的决策和判断,从而使投资者蒙受经济损失。第三,损害相关机构利益。公司为了获取充足的发展资金,会向银行或者其他金融机构贷款,公司也可能会以赊账的方式向其供应商购买相关
16、产品或者服务。公司财务造假势必会影响到上述不同机构的切身利益。强化会计监督,加大企业会计信息真实性的判断与识别是非常有必要、非常有意义的。2基于数据挖掘技术的虚假财务报告识别研究对投资者来说,会计信息是投资者进行决策的重要依据,通过会计信息而反映出的企业经营状况与业绩直接影响投资者的最终决策。虚假会计信息将误导投资者,使得投资者蒙受损失。学会识别上市公司的虚假财务报告,将减少投资者的损失,做出正确的决策。如果能提供一种相对简单的虚假财务报告的识别方法,将大大简化投资者的工作量,从海量的财务数据信息中解脱出来,做出正确的判断和决策。对监管者来说,掌握一套能有效识别上市公司财务欺诈的方法或者建立一个识别财务欺诈的模型,将极大地有利于他们工作的开展。首先,对于监管者来说,他们的一个重要职责就是监管上市公司,及时发现和查处出具虚假财务报告的上市公司,保护公平有序的市场竞争环境,切实维护广大投资者的切身利益。其次,相关监管人员还要对公司的上市或者再融资进行审核,使得提供真实有效的财务报告、并且达到融资要求的公司能够获批,反之,拒绝那些为达到融资要求而采用各种手段对财务报告进行粉饰的公司。此外,监