1、小议政府统计质量改进的措施 论文关键词:统计数据,数据质量,理论研究,经验证据 论文。本文在回忆现有文献根底上,指出要从根本上解决我国政府统计数据失真问题,还得从改革现行的统计管理体制入手,摆脱地方政府干扰,确保统计独立性,同时认为在现行框架下增加诸如消费价格指数权重、房屋销售价格及房价指数、固定资产投资等指标的统计透明度可以在很大程度上防止当前很多对中国政府统计数据不必要和不公正的质疑。 近年来,中国政府数据统计质量问题日益受到国内外学者的关注,相应的研究文献大量涌现,研究主要集中在统计数据质量的含义和衡量标准、统计数据失真的作用机理、统计数据质量控制技术、评估方法和管理理论,同时还有针对中
2、国统计数据质量进行实证方面的评估以及改进统计数据质量的政策建议方面的讨论。 一、引言 202223年2月25日,国家统计局发布的202223年国民经济和社会开展统计公报显示,202223年全国70个大中城市房屋销售价格上涨1.5%。而根据202223年1月19日国家统计局公布的202223年全国房地产市场数据,相比前一年均价上涨约24%。 改革三十多年来,中国的统计体系已经发生了很大的变化,统计部门也做出了很多努力。但总体看来,统计体系严重滞后于经济开展现实,统计工作显然还有更大的改进余地,而且当下更显迫切。中国下一步要改善经济增长质量、改善宏观经济决策、进一步深入改革和完善市场经济体制,其中
3、一个很重要的环节就是要改革现有的经济统计体系,这就必须要涉及到统计部门的改革。由于现有的关于这个主题的文献很多,评述所有学者的奉献几乎是一件不可能完成的事情,因此,笔者只回忆了其中极具影响力的文献(当然,疏漏也在所难免),根据“理论实证政策这一主线对其进行梳理,希望本文能够引起学界和业界对中国统计体系的关注及其改革方向和对策的讨论。 本文余下局部结构安排如下。第二局部研究了统计数据质量理论方面的内容,第三局部研究了统计数据质量评估的经验证据,第四局部研究了改进统计数据质量的对策,第五局部是一个简单的小结。 二、统计数据质量的理论研究 目前国际上针对统计数据质量还没有一个统一的定义,不同的学者也
4、有各自不同的定义。总的来说,从用户、生产者和被调查者三个角度考察,衡量统计数据质量的标准共有11个,即适用性、准确性、及时性、可比性、可衔接性、可取得性、可解释性、客观性(或诚信)、方法专业性(或健全性)、有效性、减轻调查负担。 (一)统计数据失真机理 统计部门的行为会直接影响数据质量,如统计数据搜集整理过程中出现的设计误差、调查误差、汇总误差等(王强,1990;颜德纶,1990)。统计主体间的博弈是产生数据质量问题的重要诱因,如企业和统计部门、上下级、区域间基于利益的博弈(朱秀君,2022;卢冶飞,2022;朱文兴、张继良,2023);官员业绩博弈、干预基层博弈和干预统计博弈(林勇、杨言勇,
5、202223);地方官员在经济竞争当中的政治晋升博弈(周黎安,2022)。 以上文献主要从统计部门、统计体系和统计外部体制环境三个方面分析了中国统计数据失真的原因。事实上,三个方面是相互影响的,尤其是外部体制环境对统计部门的影响这一因素在中国尤为显著。很多时候,统计部门受到地方政府的干扰以及同级部门之间源于考核指标的竞争,而牺牲了统计数据的真实性。尤其是地方政府源于升迁和争取中央政策支持而产生的数据攀比和赶超,不能不引起公众对其所公布的统计数据真实性的疑心。 基于对以上三个方面因素作用机理的理解,国内外学者主要从统计数据质量控制、统计数据质量评估、统计数据质量管理三个方面出发,进行了大量的理论
6、研究,给出了控制、评估和管理方法。 (二)统计数据质量控制 统计数据质量的控制,主要是数据搜集和整理过程中对误差的控制,针对统计误差所开展的理论研究,涉及测量误差的统计分布和检验、抽样误差以及非抽样误差、缺失数据的统计处理方法、汇总数据的误差等。基于这些研究,产生了抽样调查方法和非抽样误差控制技术(金勇进、陶然,202223)。neyman(1934)关于分层抽样最优分配及回归、比率估计的研究是统计数据质量研究的一个重要里程碑。 (三)统计数据质量评估 统计数据质量评估一方面可以检验所搜集到的数据本身的质量,另一方面还可以检验数据搜集过程中质量是否得到有效控制。 刘孝新等(1997)运用事后预
7、测和反常结果判断法对统计数据质量进行了评估和推断。成邦文和董丽娅(2022)从一致性误差和非一致性误差两个方面分析了社会经济统计数据误差,关于前者的分析内容有趋势性分析、机构比照分析和相关指标关联分析,而对后者的分析那么包括分布形态一致性检验和异常数据的识别。刘洪和黄燕(202223,202223)先后运用趋势模拟评估法和相关指标分析法,对统计数据质量进行了定量评估。张德然(2022)给出了根据各数据点的跳跃度所提供的信息来检验异常值的方法。 可以看出,在数据质量的评估方面,国内学者的关注点是(政府)统计数据(statistics),而国外学者提出的方法那么针对的是一般意义上的数据(data)
8、。因此,将国外的研究方法引入国内来评估政府统计数据质量是可行的,同时还需结合数据体系的特点和兼容性进行具体的评估分析。 (四)统计数据质量管理 在对统计数据质量进行有效控制和评估的同时,建立统计数据质量管理体系是实现统计数据质量持续改进和统计工作全过程质量提高的有效途径(金勇进、陶然,202223)。颜德纶(1990)将质量管理学中的pdca循环理论与统计工作相结合,提出了覆盖统计工作全过程的统计数字质量全面管理的思想;傅德印和刘晓梅(1994)分析了在我国贯彻is2023000系列标准,建立数据质量体系的可行性,给出了统计数据质量体系的结构和要素及其建立和实施步骤。 国外关于数据质量管理体系
9、的研究,很多基于全面质量管理(tqm)的原那么、方法、指南,也继承了is2023000系列标准的框架(wang,storeyandfirth,1995;wang,1998;wang,allenandhams,2022)。ryu和park(2023)构建了数据质量管理成熟度模型来评估组织数据质量管理能力,共分为初始、已定义、已管理和优化数据管理级四个等级。如同数据质量评估,国外关于数据质量管理的研究也是针对一般意义上的数据(data)。 三、统计数据质量评估的经验证据 理论层面上关于统计数据包括失真机理、质量控制、质量评估和质量管理的研究给出了一般性的研究根底、研究方法和研究框架,针对中国官方统
10、计数据质量问题,国内外学者也进行大量的实证层面的研究,而且这些研究绝大多数直指国际上争议颇大的gdp及其增长率的准确性问题。 (一)来自国外的证据 国外关于中国经济增长统计数据质量问题的正式研究成果,大多数认为中国政府公布的经济增长率一定程度上偏高。这些研究从统计口径和统计方法的角度提出了对中国政府统计数据质量的质疑。 1997年的世界银行研究报告认为,中国在19781995年期间经济增长率实际应为8.202223。maddison(1998)研究说明,这一时期中国经济年均增长率应为7.5%,而同期国家统计局公布的增长率为9.9%。 不过,余芳东(2022)指出世界银行按汇率转换的中国gdp数
11、据一定程度上低估了中国实际经济规模,而由于受资料来源和计算方法的限制,世界银行公布的购置力评价结果明显高估中国的实际经济规模,不能反映现实的支出结构、消费结构和商品价格水平。 根据中国官方数据,农村贫困人口从1978年的31%下降到了2022年的3%,park和wang(2022)认为这一数据低估了农村贫困率,高估了贫困减少速度。scharping(2022)也分析了人口数据,指出方案生育政策和人口流动性的增强导致中国的人口统计数据存在严重问题。这一分析是符合中国实际的,由于中国人口统计体系统计工程和统计标准的不完善,导致了很多农村人口和贫困人口的漏统。 klein和ozmucur(2022)
12、利用中国19802022年的年度数据,根据包括电力、煤炭、货运等在内的15个根本经济变量来解释gdp的增长,结果说明这些变量与中国官方发布的gdp增长之间的相关关系是符合经济规律的。 中国官方数据显示,19972022年中国进口额增长了70%,财政收入增长了90%,lardy(2022)通过解释这两个经济指标数据不可能被高估的原因,认为中国官方发布的19972022年gdp增长率为7%以上是可信的,并没有被高估。 利用价格指数法,szirmai和ren(2023)发现19801987年间工业总产出高估了1个百分点;在19861994年间,cdp的增长率高估了3.8个百分点(ren,1997)。
13、 利用生产指数法,wu(1997)发现19781994年间工业增长高估了3.4个百分点,19781997年间高估了3.3个百分点;maddison(1998,2022)发现19781994年间gdp增长率高估了2.4个百分点,而19951998年间高估了2.1个百分点(官方数据为8.7%)。 需要指出的是,价格指数法和生产指数法是国际上通用的计算增长率的两种方法,前者对于工业增长率和效劳业增长率的计算都是适用的。而后者那么主要适用于工业增长率的计算,对绝大多数的效劳业增长率并不适用。 (二)来自国内的证据 近年来,关于中国宏观经济统计数据质量的讨论在国内也相当热烈。国内学者主要从微观角度进行了
14、评估和检验。 孟连和王小鲁(2022)通过168种工业产品产量指数,货物运输业增长、电力和能源消费量增长各自与工业增长之间的相关分析,以及生产函数分析三种方法,得出结论:改革前的19531977年间和改革后的19781991年间,工业增长率没有明显虚增,但19921997年增长率明显过高,应从16.2%调整到12.2%。gdp增长率在19531977年期间可能有2.2个百分点的虚增,在19781991年期间可能有1.0个百分点的虚增,在19921997年期间可能虚增了2.5个百分点。 成邦文、董丽娅和杨峻(2022)采用对数正态分布检验法,对1998年研究与开发机构的人员、经费、资产、活动、成
15、果、技术交易六个方面共86个指标数据进行评估,结论说明在5%的显著性水平上数据质量是比较好的。同时,在对全国4806个研究院所的统计数据评估中,86个指标有65个在1%的显著性水平上通过了检验(占76%,包括主要指标),说明全国研究与开发机构主要调查指标数据的质量也是比较好的。 不同文献使用的方法的不同可能会导致评估结果的差异,当然我们也应看到这些方法的适用性及优缺点,但不可否认的是,国内外学者大量的实证研究从多个角度证明了中国政府统计数据质量问题确实存在。那么如何解决现有问题,改革现有统计体系。 四、统计数据质量改进的对策探讨 针对统计数据质量问题,中国政府统计部门已经采取了一系列措施,并取得了初步成效。如改革统计调查方法、统计汇总方法、工业不变价增加值计算方法及扩充统计调查范围等,逐步细化统计的产业部门分类(特别是规模以下工业)和支出工程分类,建立经常性的效劳业统计调查制度(特别是新兴效劳业),建立各专业分季度统计调查制度,完善价格统计,弥补未被观测的统计缺口,建立相对独立的统计管理体制来完善gdp核算(许宪春,2022)。 在具体指标数据准确性方面,中国人民银行武汉分行、国家统计局湖北调查总队联合课题组(2023)认为中国应当尽快