
摘要:
本文采用2011年我国31省、市、自治区城镇居民家庭平均每人全年消费性支出数据,根据经济发展、地理环境以及消费习惯等因素影响,我国各地区城镇居民的消费性支出水平很不平衡,消费结构差异也较大。本文利用因子分析,聚类分析、k均值聚类法等方法,对2011年我国31 个省(直辖市、自治区)城镇居民人均消费性支出的各项指标进行计量分析,对城镇居民家庭消费水平进行评价和排序,以期反映消费水平与结构上的差异,为制定更加合理的引导性提供有效依据。
关键词:城镇居民 消费水平 因子分析 聚类分析;
一、背景:
近年来,我国国民经济得到了迅速发展,人民生活水平进一步提高,物质文明建设达到了前所未有的水平。但由于我国各地区经济发展水平不均衡,加之各地人口、资源、等各方面存在的差异,使各地区居民人均消费水平参差不齐,不同的地区具有不同的特点。在这一背景下,研究我国各地区城镇居民家庭平均每人全年消费性支出情况
其次,消费结构可以反映居民的生活质量和经济发展水平。一般来说,经济越发达的地区,其消费结构就越趋向于追求安逸享受的消费结构。在这样的消费结构中,奢侈品支出如住房、服务性支出所占的比例就会较大。反之,在经济较不发达的地区中,生活必需品消费支出所占的比例就会较大。随着社会主义市场经济的逐步完善,我国的社会生产力不断日益加快发展,经济总量和综合实力迅速上升,城镇居民的生活水平显著提高。
主要利用三种统计方法进行分析:主成分分析法、因子分析法、聚类分析法。本文选取2009年我国城镇居民人均消费支出数据,利用聚类分析法和因子分析法,将全国31个省、市、自治区进行分类和排序,并与人们实际观察到的情况进行比较。
二、实证分析
指标体系的选择
(1)评价城镇居民消费水平的九个指标,分别为:
人均现金消费支出(元/人);人均食品支出(元/人);人均衣着支出(元/人);
人均居住支出(元/人);人均家庭设备及用品支出(元/人);人均交通通信支出(元/人);
人均文教娱乐支出(元/人);人均医疗保健支出(元/人);人均其他消费支出(元/人)。
三、聚类分析
聚类分析是对多种属性统计样本进行分类的一种多元统计分析方法。其基本思想是:一般我们认为,所研究的样品或指标之间存在着程度不同的相似性。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品聚为一类。关系密切的聚为一个小的分类单位,关系疏远的聚为一个大的分类单位,直到把所有样品或指标都聚类完毕,这样就可以形成一个由小到大的分类系统。
利用SPSS统计软件进行聚类分析,将我国城镇居民人均消费支出分为两类,结果如下表:
| 聚类表 | ||||||
| 阶 | 群集组合 | 系数 | 首次出现阶群集 | 下一阶 | ||
| 群集 1 | 群集 2 | 群集 1 | 群集 2 | |||
| 1 | 6 | 8 | 19765.343 | 0 | 0 | 4 |
| 2 | 12 | 14 | 27025.002 | 0 | 0 | 10 |
| 3 | 3 | 31 | 32557.391 | 0 | 0 | 8 |
| 4 | 5 | 6 | 35485.076 | 0 | 1 | 13 |
| 5 | 4 | 30 | 39223.623 | 0 | 0 | 9 |
| 6 | 24 | 28 | 39977.765 | 0 | 0 | 21 |
| 7 | 22 | 23 | 41165.885 | 0 | 0 | 14 |
| 8 | 3 | 29 | 42100.555 | 3 | 0 | 12 |
| 9 | 4 | 16 | 65930.078 | 5 | 0 | 12 |
| 10 | 12 | 17 | 71063.573 | 2 | 0 | 15 |
| 11 | 21 | 25 | 76848.952 | 0 | 0 | 14 |
| 12 | 3 | 4 | 86185.582 | 8 | 9 | 18 |
| 13 | 5 | 7 | 94662.656 | 4 | 0 | 17 |
| 14 | 21 | 22 | 96244.956 | 11 | 7 | 19 |
| 15 | 12 | 18 | 112493.500 | 10 | 0 | 19 |
| 16 | 13 | 19 | 127845.732 | 0 | 0 | 27 |
| 17 | 5 | 15 | 149741.039 | 13 | 0 | 22 |
| 18 | 3 | 20 | 152636.536 | 12 | 0 | 20 |
| 19 | 12 | 21 | 162530.119 | 15 | 14 | 22 |
| 20 | 3 | 27 | 216332.575 | 18 | 0 | 23 |
| 21 | 24 | 26 | 243353.344 | 6 | 0 | 25 |
| 22 | 5 | 12 | 261060.185 | 17 | 19 | 23 |
| 23 | 3 | 5 | 3601.461 | 20 | 22 | 25 |
| 24 | 2 | 10 | 523725.488 | 0 | 0 | 27 |
| 25 | 3 | 24 | 593941.397 | 23 | 21 | 29 |
| 26 | 1 | 11 | 668049.885 | 0 | 0 | 28 |
| 27 | 2 | 13 | 809528.8 | 24 | 16 | 29 |
| 28 | 1 | 9 | 972091.5 | 26 | 0 | 30 |
| 29 | 2 | 3 | 1825359.491 | 27 | 25 | 30 |
| 30 | 1 | 2 | 6942855.592 | 28 | 29 | 0 |
然而,这种分类方法第二类地区中,例如贵州、甘肃、青海同江苏、山东地区消费差距明显,与人们观察到的实际情况不符合,因此运用聚类分析法存在一定缺陷,
四、因子分析
因子分析是主成分分析的一种推广,它也是利用降维的思想,把一些具有错综复杂关系的变量归结为少数几个不可观测的综合因子的一种多变量统计分析方法。前面利用聚类分析法,仅仅是把我国各地区城镇居民人均消费分为三类,这样分类,存在一定缺陷,我们希望找出几个真正影响居民人均消费的公共因子,在做因子分析之前,应当检验数据是否适合做因子分析。根据KMO检验,KMO值越大表示数据越适合做因子分析,KMO值低于0.5时,表明数据不太适合做因子分析,由表一可知,适合进行因子分析
| KMO 和 Bartlett 的检验 | ||
| 取样足够度的 Kaiser-Meyer-Olkin 度量。 | .868 | |
| Bartlett 的球形度检验 | 近似卡方 | 327.810 |
| df | 28 | |
| Sig. | .000 | |
| 公因子方差 | ||
| 初始 | 提取 | |
| 衣着 | 1.000 | .796 |
| 医疗器械 | 1.000 | .927 |
| 教育文化娱乐服务 | 1.000 | .861 |
| 交通和通信 | 1.000 | .1 |
| 其他 | 1.000 | .0 |
| 家庭设备用品及服务 | 1.000 | .847 |
| 居住 | 1.000 | .847 |
| 食品 | 1.000 | .756 |
| 提取方法:主成份分析。 | ||
| 解释的总方差 | ||||||
| 成份 | 初始特征值 | 提取平方和载入 | ||||
| 合计 | 方差的 % | 累积 % | 合计 | 方差的 % | 累积 % | |
| 1 | 6.816 | 85.196 | 85.196 | 6.816 | 85.196 | 85.196 |
| 2 | .402 | 5.020 | 90.216 | |||
| 3 | .250 | 3.130 | 93.346 | |||
| 4 | .190 | 2.375 | 95.721 | |||
| 5 | .131 | 1.3 | 97.365 | |||
| 6 | .106 | 1.325 | 98.690 | |||
| 7 | .073 | .908 | 99.598 | |||
| 8 | .032 | .402 | 100.000 | |||
| 提取方法:主成份分析。 | ||||||
根据结果可知,初始解只有两个因子的特征值大于1,这两个因子可以解释原有八个指标总方差的83.845%,已经足以解释各地区城镇居民的人均消费共性以及差异性。
旋转后的因子载荷矩阵及旋转空间中的成分图
| 成份矩阵a | |
| 成份 | |
| 1 | |
| 衣着 | .2 |
| 医疗器械 | .963 |
| 教育文化娱乐服务 | .928 |
| 交通和通信 | .944 |
| 其他 | .943 |
| 家庭设备用品及服务 | .921 |
| 居住 | .921 |
| 食品 | .869 |
| 提取方法 :主成分分析法。 | |
| a. 已提取了 1 个成份。 | |
| 旋转成份矩阵a |
| a. 只抽取了一个成份。无法旋转此解。 |
因子得分系数矩阵
以各因子的方差贡献率占两个因子总方差贡献率的比重作为权重进行加权汇总, 算出各地区的综合得分
| 成份得分系数矩阵 | |
| 成份 | |
| 1 | |
| 衣着 | .131 |
| 医疗器械 | .141 |
| 教育文化娱乐服务 | .136 |
| 交通和通信 | .138 |
| 其他 | .138 |
| 家庭设备用品及服务 | .135 |
| 居住 | .135 |
| 食品 | .128 |
| 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 | |
成份得分协方差矩阵 | |
| 成份 | 1 |
| 1 | 1.000 |
| 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 | |
分类结果如下表:
| 类别 | |
| 第一类 | 上海、北京、广东、浙江、天津 |
| 第二类 | 其余地区 |
| 第三类 | 、云南、甘肃、贵州、青海 |
本文根据2011年我国城镇居民人均消费支出数据,利用聚类分析法和因子分析法,对各地区31个省、市、自治区城镇居民人均消费进行分类,首先利用两种聚类分析法:K均值法和系统聚类法,分类结果相比较,系统聚类分析法要好于K均值法,但也存在一定缺陷,然后利用因子分析法进行因子分析,根据因子综合得分对我国各地区城镇居民人均消费支出进行排序和分类,并进行综合评价,结果表明,分为三类较好地反映实际情况,相对于聚类分析法,它是一种比较好的排序方法,从聚类分析、判别分析、主成分分析、因子分析的结果可以看出,尽管不同的分析方法所得的结果有所不同,但上海、北京、天津、广东的城镇居民人均消费水平处于较高的位置,而青海、、甘肃的人均消费水平处于低位
参考文献:
国家统计局.
多元统计分析(第三版)
数据来源:
本文选取了2011年我国各地区城镇居民家庭平均每人全年现金消费支出的相关指标数据,所有数据取自《中国统计年鉴2012》,
