王小鲁:直面收入分配恶化 不能躺在虚假数据上分析(2)
2 怎样评价抽样调查的可靠性?
施、王两文质疑研究报告的两个最主要理由,就是统计局住户调查样本量大,所采用的分层随机抽样方法“有着较严密的科学依据”;而我们的调查样本小得多,没有采取与统计局相同的抽样方法,对样本的选择“存在主观性”,因此缺乏可信度。但这些评论回避了两个最重要的问题。
第一,样本量大小,并不决定样本是否无偏。只有当不存在系统性偏差时,大样本才在精确度上更占优势。与2亿城镇居民家庭相比,统计局6.5万个住户样本也只占万分之三。但这个样本目前的问题,并不在于样本量大小,而在于大量遗漏高收入户。首先,由于在抽样过程中频繁遇到高收入居民拒访,而替换的样本不可能保证同样的收入水平。这就必然导致样本覆盖面的系统性偏差。在这种缺陷未被纠正的情况下,样本量再大,也不能提高其可信性。
第二,抽样方法的“科学性”,不能弥补数据失真导致的非抽样误差。目前统计局样本的收入数据,根据的是样本户的填报。而我们在调查中发现,如果没有有效措施,70%的高收入户有低报收入的倾向,而且报出的收入与他们的真实收入平均相差几倍。但在此之前,我们未曾听说统计局针对低报收入采取过措施。
王有捐先生在文章中说:“65000户样本量对全国和分省(区、市)有较高的代表性,在置信度为95%时,主要收支指标的抽样误差(不含漏报、少报等产生的非抽样误差)在5%以内。”但现在的主要问题恰恰出在“漏报、少报等产生的非抽样误差”。避开这个主要问题,抽样误差再小也没有意义。就像医生给病人开错了药,药品质量再好也不解决问题。对于抽样调查的评价,首先应该是结果的真实性,而不能满足于理论上的“科学性”。
我们的研究项目在抽样和推算方法上所做的探索,正是针对高收入样本容易遗漏和收入数据不真实这两个关键问题。我们如果采取与统计局同样的随机抽样方法,也难免同样的系统性偏差。因此我们针对不同收入区间设立了样本配额,以确保不遗漏高收入样本;同时借鉴了社会学的调查方法,通过各地的专业调查人员直接以他们熟悉的人群(亲属、朋友、同事、邻里)为调查对象来收集各项收入支出信息。由于调查人员基本了解调查对象的家庭经济状况,并存在一定的信任关系,使严重低报收入的情况大大减少。
提到社会学调查方法,不能不提到我国老一辈社会学家费孝通和他的著作《江村经济》。这本书是他对自己姐姐居住村庄的乡亲邻里进行调查的成果,成为一部解剖中国乡村经济有代表性、影响深远的著作。没有听说谁批评他的调查“样本太小”,“没有采用随机抽样方法”,因此“不科学”。这首先是因为信息的真实性和所反映问题的代表性。而这些并不是所有的大样本随机抽样调查都能做到的。国际抽样调查权威Kish在他的著作中,也没有不适当地强调抽样方法的“科学性”,反而把它看做“‘自己创造的艺术’和它的科学性的结合”(Kish:《抽样调查》,中文版1997)。
在我们的调查中,为进一步降低敏感度,我们采取了匿名调查的方式,提供了信息保密和仅用于研究目的的承诺;在问卷设计上采取了先问消费、后问收入,先问分项、后问合计,不追问收入具体来源等调查方法。调查前,对各地调查人员进行了培训。调查后,对收到的问卷进行了严格的质量和逻辑检验,剔除了相当数量不合格问卷。所有这些措施,都是为了保证数据的真实性。这使我们得到的调查数据避免了严重的系统性偏差。
由于在特定条件下采取了这种非常规调查方法,我们深知虽然得到的数据比较可信,但样本分布并不代表城镇居民的总体分布,不能用来做总体推断。我们所采用的恩格尔系数法,就是在这种情况下所找到的一个解决问题的方法。由于基础数据的可信性和样本在不同地区、不同收入层次、不同职业身份的居民群体间分布的广泛性,我们能够用它获取收入水平与恩格尔系数以及其他参数间的真实关系,并基于这种关系来对一定居民群体的收入水平进行推算。
这一方法得到的结果,并不是一个总体推断,而是在统计局分组样本的基础上,利用统计局数据中可信度较高的变量(一个主要变量是恩格尔系数)来推算其真实收入水平,以校正其原来失真的数据。这一方法和总体推断方法得到的结果非常不同。这在报告中有详细的数据比较和说明。而施、王两位一直强调我们是在做“总体推断”,说“不是直接推断也是间接推断”,是很不客观的。他们所批评的“没有采用随机抽样方法”,也并不构成我们这项研究的缺点,反而是在有限条件下能找到的一个验证统计数据失真的有效解决方法。
当然也要说明,这项研究的目的,是对统计数据的偏差进行检验并作出近似推算,而不是要代替常规统计。作为一个民间研究机构,我们不可能拥有像国家统计局那样庞大的统计机构和遍布全国的调查队伍,不可能进行能与之相比的大规模调查。但我们充分相信,所得到的高收入群体收入水平的推算结果,远比现有的统计数据更真实,也能够为改善统计数据提供一个参考。
相关专题:
免责声明:本文仅代表作者个人观点,与凤凰网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
|
|
共有评论0条 点击查看 | ||
作者:
编辑:
wangft
|