灰色收入与国民收入分配(中)

来源:百度文库 编辑:神马文学网 时间:2024/04/28 20:27:25
三、求解城镇居民真实收入
1.城镇居民分组收入推算结果
把上文模型(2)中各参数的估计结果(见表5)、统计样本中的分组恩格尔系数、以及各控制变量的全国平均赋值,带入模型(2),就可以倒推出对应于不同恩格尔系数的人均收入水平。表6将这些根据模型分析推算出的结果,与分组统计数据、以及使用分组分析法得到的结果同时列出,以进行对比
表6.基于恩格尔系数法求解的城镇分组人均收入(元)
从表6的数据看,用分组比较恩格尔系数和通过模型分析取得恩格尔系数与收入水平的关系这两种方法,得到的结果总体上是比较接近的。它们对最低收入、低收入和中低收入这三组收入水平的推算,虽然都不同程度上高于统计收入,但总体上差异不太大(其中模型分析法的结果更为接近)。从中等收入组往上,推算收入与统计收入的差距明显扩大。差距最大的是最高收入组,其中分组比较法的结果是16.4万元,模型分析法的结果是13.9万元,分别是统计收入的3.76倍和3.19倍。这两个结果所反映的收入分布基本格局是一致的,而且与2007年报告的结果(2005年数据)相比,尽管数据来源不同,但具有较高的相似性。
表6显示,主要由于高收入和最高收入组的收入差异,按模型分析法推算得到的全国城镇人均收入平均值为32154元,而不是按统计局的分组数据加权平均的16885元,或统计局公布的15781元。推算数与统计数差不多相差了一倍。
在表7中,我们也提供了2005年和2008年两次研究的推算收入(2008年采用模型分析法的结果)与统计收入之比。我们发现,2008年(次于最高收入组的)高收入组推算收入相对于统计收入差异明显变大,但总体而言差异最大的还是最高收入组。我们把这些没有包括在统计数据中的居民收入称为隐性收入,在表中最后一列计算了各组的隐性收入占隐性收入总量的比重。很明显,隐性收入主要集中在最高收入家庭。
表7.2005和2008年推算收入与统计收入之比
以上两种推算结果中,分组比较法可能误差会大一些,这是由两个原因导致的。第一,分组分析法只能通过计算各组的平均恩格尔系数和平均收入水平,得到与某一特定的恩格尔系数对应的人均收入。但无法排除收入以外的因素对恩格尔系数的影响。但这些因素对调查样本的影响和对统计样本的影响有可能是不同的,因此推算出的人均收入水平有可能不够准确。而模型分析法则控制了收入以外因素对恩格尔系数的影响,并计算了这些因素的全国平均影响程度。所得到的结果,是在这些影响之下,对应于某个恩格尔系数的人均收入水平,因此也应该更真实、更准确。
第二,分组分析法通过根据恩格尔系数重新分组的方法,在总体上避免了调查样本分布与统计样本分布不一致而对总体的收入分布产生错误影响。但这一方法对各组平均收入的计算,仍与组内的样本分布有关。而调查样本的组内分布有可能与统计样本的组内分布有所不同。尽管这对总体分布的影响不会很大,但不能排除产生一定误差的可能性。举例说,全国城镇居民最高收入组和最低收入组的组内收入水平很可能不是均等分布的,而是分别向低端和高端倾斜。但调查样本的组内分布,不一定符合这个特点。而模型分析法则是根据收入和其他因素对恩格尔系数的影响系数,直接从恩格尔系数推算出对应的收入水平,准确程度应该高于分组比较法。
基于以上两点考虑,在以下的计算中,我们将根据模型分析法(模型2)的估计结果进行。
图2更直观地给出了两种方法得到的推算收入与统计收入的比较。可以看到,两种方法具有一致性,但也有些差异。其中按模型分析法得到的高收入组人均收入明显高于按分组比较法得到的人均收入,而模型分析法得到的最高收入组人均收入则低于按分组比较法得到的收入。
此外,为了进行对比,我们把2007年研究报告提供的2005年推算数据与统计数据比较图(见图3,依据分组比较法)也放在图2后面。这两张图很相似,显示了两次调查和研究结论的基本一致性。
图2.2008城镇居民分组人均收入:推算数据与统计数据比较
图3.2005城镇居民分组人均收入:推算数据与统计数据比较
还需要指出,在2007年报告中,作者判断根据调查样本推算的分组收入水平可能存在一定正方向误差,因此对推算结果做了一定程度的下调。从表6可见,下调后的2005年推算数与未进行调整处理的2008年推算数与统计数的比例比较一致,只有(次)高收入组例外。这看来说明,当时的下调是合理的,而且当时的误差可能主要来自分组比较法自身,因此这次使用模型分析法进行推算,就消除了这一误差。
但这里也要再次强调,这里的推算只解决了统计收入低报的问题,并没有解决统计数据遗漏高收入样本的问题,因此实际上这里对最高收入居民人均收入的推算仍然可能在一定程度上偏低。
这种情况也反映在我们的调查样本中。按分组比较法对调查样本分组之后,有少数高收入样本没有能够列入这7个收入组。这是因为这些样本家庭的恩格尔系数更低;加入这些样本后,最高收入组的平均恩格尔系数就会低于统计数据中最高收入组的恩格尔系数。在这次的有效样本中,有76个高收入样本被排除在外,他们的人均可支配收入都在40万元以上,平均收入为66万元。他们的平均恩格尔系数只有0.224,而国家统计局城镇住户样本中最高收入组的平均恩格尔系数为0.292。这似乎说明,在统计部门的城镇住户样本中,可能很少包括人均收入40万元以上的住户。因此严格地说,这里的最高收入组并不是收入最高的居民组,因为还有一些更高收入的居民没有包括在内。
但我们无法用这些调查样本来反映高收入居民的统计遗漏的情况,这是因为我们无法知道被遗漏的高收入人群在全部城镇居民家庭中占有多大比重,也不能用调查数据中这些没有包括在内的高收入样本的分布来代表全国被遗漏的高收入样本分布,因为调查样本的分布状况与全国更高收入居民的分布状况未必一致。而且,在我们的调查样本中也仍然存在遗漏。在这次调查样本中,收入最高家庭的人均可支配收入为176万元,比这收入更高的样本还是没有包括在内。
这也从一个侧面说明,在统计调查中,更高收入的居民被遗漏了。而我们在这里所采取的两种恩格尔系数推算方法,都只能纠正已有的统计样本中对收入的低报,而无法纠正因遗漏高收入样本而导致的收入统计数据偏低问题。因此在某种程度上,我们对"最高收入组"人均收入的推算仍然是偏低的,不过其可靠程度还是远远高于目前的统计数据。
2.隐性收入和居民收入差距有多大?
从表6和表7可以看到,2008年占10%的城镇居民最高收入家庭,人均可支配收入应为13.9万元,而不是统计显示的4.4万元。两者相差3.2倍。最高收入家庭这些没有包括在统计数据中的隐性收入占城镇居民隐性收入总量的63%。再加上高收入组,城镇20%高收入居民的隐性收入,占全部城镇居民隐性收入总量的80%以上。
据此推算城镇居民收入分配差距,按城镇居民家庭10%分组,2008年城镇最高收入家庭与最低收入家庭的实际人均收入分别是5350元和13.9万元,差距是26倍(上一个报告推算的2005年差距是31倍),而按统计数据计算只有9倍。(这次推算的收入差距小于上次的推算,主要是因为这次推算的最低收入组的人均收入比统计收入高了12%。而这又与如下情况有关:在调查样本中有少数负收入样本没有包括在内,因为他们在正常情况下不属于低收入阶层,他们的负收入是暂时性的经营亏损造成的。但不包括这些样本,在一定程度上提高了最低收入组的推算收入。估计这种情况在统计样本中并没有剔除。这可能是最低收入组推算收入高于统计收入的一个主要原因。)
用城镇最高收入20%的家庭和农村最低收入20%的家庭来近似地代表全国最高和最低收入10%家庭,那么全国最高10%家庭的人均收入是9.7万元,而最低10%家庭的人均收入是1500元,两者在2008年相差65倍(2005年的推算是55倍),而按统计数据计算只有23倍。
相信这种隐性收入绝大部分发生在城镇。近似假定农村居民收入统计数据是真实的,使用城镇居民人均推算收入数据来代替统计收入数据,与农村人均纯收入统计数据(分组加权平均结果)分别乘以城乡人口数,则可以近似得到2008年全国居民可支配收入总额为23.2万亿元,但如果按城乡住户收入统计数据计算,2008年全国居民收入总额只有14.0万亿元。两者相比,隐性收入高达9.26万亿元,比作者在2007年报告中推算的2005年隐性收入(4.85万亿元)扩大了近一倍(上升91%)。而同期,名义GDP只增长了71.4%。这说明隐性收入仍在以快于GDP增长的速度迅速扩大。
在各自包括了隐性收入后,2008年比2005年全国居民可支配收入总额增长了69.3%,与名义GDP的增长幅度接近于同步。而按官方统计数据计算(不包括隐性收入),全国居民可支配收入2008年只比2005年上升了57.4%,远远滞后于GDP的增长。因此它在GDP中所占比重从2005年的48.4%下降到2008年的44.5%,下降了3.9个百分点。显然,隐性收入的增长速度远高于正常收入的增长速度。分别按统计数据和推算数据计算的城镇人均可支配收入、全国居民可支配收入总量及其占GDP比重在2005-2008年期间的增长幅度、以及名义GDP的增长幅度,见表8
表8.2005-2008年居民收入变动
注1:城镇居民人均可支配收入和农村居民人均纯收入各有两组不同的统计数据。这里给出的是按统计局公布的分组收入统计进行加权平均计算得到的。而统计局公布的2005和2008年全部城镇居民人均收入分别为10493元和15781元,比加权平均数分别低5.5%和6.5%。公布的农村人均纯收入数比分组加权平均数低得更多(8%左右)。原因不明。
注2:全国居民可支配收入(统计数据)是根据统计公布的城镇人均可支配收入和农村人均纯收入(表头以下第一行和第四行数字)各自与城乡统计人口的乘积求和近似得到的。
注3:隐性收入占GDP的比重,是在GDP不进行相应调整的情况下计算得出的。
3.从其他途径验证隐性收入
要检验以上推算是否合理,除了方法问题需要探讨,更重要的是要看推算结果与事实的吻合程度。长期以来,在居民收入统计数据、宏观经济数据、住房、汽车和其他奢侈品销售方面,存在许多明显的矛盾或者不可解释之处。而如果把上面推算的隐性收入包括到居民收入中来,这些矛盾就基本上消失了。作者认为,这应该是检验上述推算是否合理的一个主要方法。如果存在上文所估计的巨额隐性收入,它也必然会在国民经济的宏观层面有一系列反映。下面我们试图通过几个不同途径来进行验证。
(1)居民储蓄与消费总额
2008年,根据城乡居民收入统计数据和城乡人口数推算,全国城乡居民储蓄总额为3.55万亿元(这里的储蓄定义为可支配收入与消费之间的差额)。这是居民的真实储蓄规模吗?居民储蓄以不同形式存在,或直接、间接地用于各种投资。因此我们把宏观经济层面反映出的各种关于居民净投资的信息整理加总(扣除借贷),可以近似推算出居民总储蓄的规模。
这一年,全国金融机构的城乡居民人民币储蓄存款余额增加了4.54万亿元(我们知道金融机构的存款数据应该是较为准确的),说明仅居民用于金融机构存款的储蓄部分就超过了按收入统计推算的储蓄总额1万亿元。
同一年,商品住宅销售2.12万亿元(不包括二手房),扣除个人住房贷款增长额3000亿元,用去居民储蓄1.82万亿元。
同一年,农村个人建房投资支出3711亿元。调查发现城镇居民个人建房也相当普遍,在城镇居民自有住房中大约占到15%-16%。虽然发生率低于农村,但单位投资额大幅度高于农村。估计总额不会小于农村自建房投资。而且这类投资使用贷款的情况很少,主要来自个人储蓄。据此估计,城乡居民自建房投资使用了个人储蓄7000亿元。
2008年,"规模以上"私营工业企业所有者权益净增加1.09万亿元。这些资金实际上是由企业所有者的收入与储蓄形成。服务业私营企业的个人出资的投资,估计不低于工业中的私人投资,应超过1万亿元。第二、三产业"规模以下"私营企业、股份制企业、和2874万户有证照的个体经营户个人出资的私人投资,以及建筑业的这类私人投资,粗略估计在5千亿-1万亿元之间。几项合计,第二、三产业来自个人储蓄的私人投资估计在2.5-3万亿元之间。
2008年,A股市场股票流通市值比2007年缩水50.9%,而上证综指和深证综指分别下跌65.4%和62.4%,跌幅均大于流通市值缩水幅度;两相抵消,估计当年仍然净吸纳投资1.35万亿元。国债和企业债券发行额共1.7万亿元。如果按这些投资的三分之一来自个人资金计算,股票(A股)和债券共吸纳私人储蓄1万亿元。
除此之外,居民对期货、黄金、外汇等金融产品的投资,加上居民手持现金和国外存款等项的增加,粗略估计5000亿元(也许低估了)。
以上各项合计,2008年全国居民储蓄总额至少应为11万亿-11.5万亿元,而不是按收入统计数据计算的3.5万亿元。这说明该年至少有7.5万亿-8万亿元的居民隐性收入没有包括在收入统计中。此外,根据住户消费统计计算的居民消费支出总额为9.46万亿元。尽管居民消费统计与居民收入统计相比遗漏较小,但调查发现还是有相当幅度的遗漏。如果按遗漏20%的保守估计,则意味着居民消费也被低估了近2万亿元。与被低估的储蓄相加,2008年实际的居民隐性收入总额至少应在9.5-10万亿元之间。这与上文根据模型分析法推算的9.3万亿元隐性收入是基本吻合的。
以上这种情况,并不仅仅发生在2008年。对近些年的宏观数据进行分析,都可以得到类似的结果。而且通过宏观数据分析所显示的隐性收入总量,有不断扩大的趋势。
(2)房价收入比
根据国外经验,通常商品住宅价格是居民家庭年收入的3-5倍,是可承受的价格,否则住房市场不会有良好的发展。而按收入统计计算,我国城镇居民的房价收入比一直在10倍左右,住房市场却持续火爆,这始终是国内外研究者面对的一个不解之谜。2008年,商品住宅销售2.1万亿元,2009年猛增到3.8万亿元。如果按统计收入算,扣除贷款,这也远远超过了城镇10%最高收入户的全部收入总额。这是一个无法用统计数据解释的现象。
根据我国2008年城镇居民收入统计,人均可支配收入1.578万元,平均家庭规模2.91人,合家庭年收入4.59万元,而同一年商品住宅销售2.12万亿元,共5.93亿平米,按每套平均110平米计,估算售出515万套,每套均价41.1万元,是统计显示的城镇居民平均家庭年收入的9倍。而按同样方法计算,2007和2009年都超过了10倍。这远远超出了城镇居民承受能力。还应当考虑到,一部分家庭是从炒房者手中购买的二手房,所以他们实际付出的价格超过原来的一手房价格,这没有包括在新房上市的价格中。但这没有妨碍住房市场的持续火爆。这些现象说明城镇居民平均收入可能被低估了一倍以上。
按照统计显示,占城镇家庭数20%的高收入家庭(最高收入10%和次高收入10%家庭合计)2008年人均收入为3.5万元,平均家庭年收入8.9万元。按社会平均的房价计算,他们的房价收入比大致在5左右。这意味着即使高收入家庭,在2008年也仅仅是勉强达到有能力购买商品房的范围边沿。而事实说明这是不真实的。
1990-2009年累计,商品住宅累计销售超过4600万套,超过了城镇高收入家庭的总数(约4100万户)。调查数据证明,实际上相当一部分高收入家庭不需要商品房(有公房、公司提供的住房、或"房改"房),而对已经购买商品房的高收入居民来说,他们的商品房房价标准远远高于社会平均的房价标准,而且大约有三分之一的高收入家庭拥有第二、三套或更多的住宅。这些情况说明,高收入居民的实际收入水平远不止被低估了一倍。
(3)家庭汽车与收入
根据我国的私人汽车拥有量统计,2008年我国私人拥有的小型和微型汽车为2814万辆,如果按90%属于城镇居民计算,城镇家庭的家用汽车普及率已达12.1%(每百户拥有家庭汽车12.1辆),说明占城镇住户20%的高收入家庭,除去一部分暂时没有买车意愿的家庭外,汽车已基本普及。实际上一些中等收入家庭也已经成为有车阶层。汽车拥有量统计有牌照发放和年检数为依据,应该是准确的。而根据城镇住户抽样统计收入,每百户城镇家庭仅拥有8.8辆家用汽车。比前者少了近三分之一。这就从另一个角度说明住户抽样调查遗漏了相当数量的高收入家庭样本。而且更明显的矛盾是,有车家庭的统计收入水平根本不足以拥有汽车。
如果按家用汽车平均价格10万元、年相关费用2万元(燃油、维修保养、保险、年检、停车费、过路费等)计,通常至少需要20万元以上的家庭年收入来支持。根据统计数据,20%高收入家庭的年可支配收入平均只有8.9万元,下限6万元,远远达不到普及家庭汽车的程度。而按本报告前面的推算结果,这20%城镇家庭的实际家庭年收入平均约为24万元,下限在12万元左右,大部分具备了购车能力。这再次说明高收入居民的统计收入被严重低估了,本报告前面对他们收入的推算则大体上与其购车能力相吻合。
(4)其他
除去以上列举的城镇居民住房、汽车等情况,城镇居民在其他许多方面的支出也是统计收入不能解释的。其中一个例子是国外消费。2008年,全国因私出境人数超过4000万人次,相当于20%的城镇高收入家庭每户一人次。如果假定1/3是商务原因而予扣除,其余为旅游、探亲、留学等,按人均花费3万元人民币计算,全国这方面的居民支出达到8000亿元。这部分没有包括在国内社会消费品零售总额中的支出,同样在收入统计中无法找到来源。
此外据报道,中国每年有几百亿元私人资金存入国外银行;另据公安部官员估计,中国每年赌资外流至少在几百亿到上千亿元之间。
-----------------------
3.2008年全国城镇人口略少于农村人口;但城镇居民每户平均人口数也少于农村居民,因此城乡户数相差不多。实际上城镇20%最高收入家庭占全国家庭数的比重为10.7%,农村20%最低收入家庭占全国家庭数的比重为9.3%,可以分别近似地代表10%的最高和最低收入家庭。
4.有几点需要说明:第一,农村"纯收入"与"可支配收入"在统计口径上有差异,我们在这里忽略这种差异,将其近似地视为可支配收入。第二,国家统计局根据住户调查公布的城、乡居民人均收入,与所公布的分组人均收入之间,似有不一致的地方。公布的城镇人均可支配收入比按分组人均可支配收入加权平均得到的结果低5.5%到6.5%,公布的农村人均纯收入比分组加权平均结果低8%左右(见《中国统计年鉴》"人民生活"部分)。目前还不知道这种不一致是如何产生的。本报告的计算以分组加权平均计算结果为准。第三,依据住户统计调查的居民人均收入和全国城乡人口数计算得到的全国居民可支配收入(统计数据),与国家统计局在"资金流量表"中提供的全国居民可支配收入,有统计口径的差别。在本表中,该数据来自前一个来源。而在本报告下一部分关于国民收入分配格局的讨论中,所使用的居民可支配收入统计数据,则来自后一个来源。请注意这一区别。
5.各项推算依据的基础数据来自国家统计局关于城乡居民收支、人口、金融机构存贷款、私营工业企业所有者权益、各类固定资产投资、房地产市场、证券市场、股票交易等统计数据,见《中国统计年鉴2009》相关章节以及国家统计局《第二次全国经济普查主要数据公报》。个人住房贷款根据银行金融市场司副司长霍颖励在国新办新闻发布会上提供的情况(2009年1月,新华网)。