SPSS统计分析
图是出自《中国统计年鉴—2009》这一资料性年刊,它系统收录了全国和各省、自治区、直辖市2008年经济、社会各方面的统计数据,以及近三十年和其他重要历史年份的全国主要统计数据。此年鉴正文内容分为24个篇章,本文选取其中的第九篇章-人民生活,用以分析
| 10-5 城镇居民家庭基本情况 | |
| | |
| 项 目 | 1990 | 1995 | 2000 | 2008 | 2009 | |
| | | | | | |
| 调查户数 (户) | 35660 | 35520 | 42220 | 675 | 65506 | |
| 平均每户家庭人口 (人) | 3.50 | 3.23 | 3.13 | 2.91 | 2. | |
| 平均每户就业人口 (人) | 1.98 | 1.87 | 1.68 | 1.48 | 1.49 | |
| | | | | | | |
| 平均每户就业面 (%) | 56.57 | 57. | 53.67 | 50.86 | 51.56 | |
| 平均每一就业者负担人数 | | | | | | |
| (包括就业者本人) (人) | 1.77 | 1.73 | 1.86 | 1.97 | 1.94 | |
| 平均每人全部年收入 (元) | 1516.21 | 4279.02 | 6295.91 | 17067.78 | 18858.09 | |
| 工薪收入 | 1149.70 | 3390.21 | 4480.50 | 11298.96 | 12382.11 | |
| 经营净收入 | 22.50 | 72.62 | 246.24 | 1453.57 | 1528.68 | |
| 财产性收入 | 15.60 | 90.43 | 128.38 | 387.02 | 431.84 | |
| 转移性收入 | 328.41 | 725.76 | 1440.78 | 3928.23 | 4515.45 | |
| #可支配收入 | 1510.16 | 4282.95 | 6279.98 | 15780.76 | 17174.65 | |
| 平均每人消费性支出 (元) | 1278. | 3537.57 | 4998.00 | 11242.85 | 122.55 | |
| 食 品 | 693.77 | 1771.99 | 1971.32 | 4259.81 | 4478.54 | |
| 衣 着 | 170.90 | 479.20 | 500.46 | 1165.91 | 1284.20 | |
| 居 住 | 60.86 | 283.76 | 565.29 | 1145.41 | 1228.91 | |
| 家庭设备用品及服务 | 108.45 | 263.36 | 374.49 | 691.83 | 786.94 | |
| 医疗保健 | 25.67 | 110.11 | 318.07 | 786.20 | 856.41 | |
| 交通通信 | 40.51 | 183.22 | 426.95 | 1417.12 | 1682.57 | |
| 教育文化娱乐服务 | 112.26 | 331.01 | 669.58 | 1358.26 | 1472.76 | |
| 杂项商品与服务 | 66.57 | 114.92 | 171.83 | 418.31 | 474.21 | |
| 平均每人消费性支出构成 | | | | | | |
| (人均消费性支出=100) | | | | | | |
| 食 品 | 54.25 | 50.09 | 39.44 | 37. | 36.52 | |
| 衣 着 | 13.36 | 13.55 | 10.01 | 10.37 | 10.47 | |
| 居 住 | 6.98 | 8.02 | 11.31 | 10.19 | 10.02 | |
| 家庭设备用品及服务 | 10.14 | 7.44 | 7.49 | 6.15 | 6.42 | |
| 医疗保健 | 2.01 | 3.11 | 6.36 | 6.99 | 6.98 | |
| 交通通信 | 1.20 | 5.18 | 8.54 | 12.60 | 13.72 | |
| 教育文化娱乐服务 | 11.12 | 9.36 | 13.40 | 12.08 | 12.01 | |
| 杂项商品与服务 | 0.94 | 3.25 | 3.44 | 3.72 | 3.87 | |
| | | | | | |
描述性分析:图一给出了基本的描述性统计图,图中显示各个变量的全部观测量的Mean(均值)、Std.Deviation(标准差)和观测值总数N。从表中可看出家庭设备用品及服务,食品,衣着,居住的平均值分别为7.5295,43.6367,11.5521,9.3039.其中食品的支出明显高于其他三项支出。并且食品的标准差也明显高于其他三个。
| 描述统计量 |
| N | 均值 | 标准差 |
| 家庭设备用品及服务_A | 5 | 7.5295 | 1.57763 |
| 食__品_A | 5 | 43.6376 | 7.99417 |
| 衣__着_A | 5 | 11.5521 | 1.74488 |
| 居__住_A | 5 | 9.3039 | 1.75823 |
| 有效的 N (列表状态) | 5 | | |
交叉表分析
| 平均每户家庭人口__人_* 平均每人消费性支出__元_ 交叉制表 | |
| | | 平均每人消费性支出__元_ | 合计 | |
| | | 1278. | 3537.57 | 4998.00 | 11242.85 | 122.55 | |
| 平均每户家庭人口__人_ | 2. | 计数 | 0 | 0 | 0 | 0 | 1 | 1 | |
| 期望的计数 | .2 | .2 | .2 | .2 | .2 | 1.0 | |
| 平均每户家庭人口__人_ 中的 % | .0% | .0% | .0% | .0% | 100.0% | 100.0% | |
| 平均每人消费性支出__元_ 中的 % | .0% | .0% | .0% | .0% | 100.0% | 20.0% | |
| 总数的 % | .0% | .0% | .0% | .0% | 20.0% | 20.0% | |
| 残差 | -.2 | -.2 | -.2 | -.2 | .8 | | |
| 标准残差 | -.4 | -.4 | -.4 | -.4 | 1.8 | | |
| 2.91 | 计数 | 0 | 0 | 0 | 1 | 0 | 1 | |
| 期望的计数 | .2 | .2 | .2 | .2 | .2 | 1.0 | |
| 平均每户家庭人口__人_ 中的 % | .0% | .0% | .0% | 100.0% | .0% | 100.0% | |
| 平均每人消费性支出__元_ 中的 % | .0% | .0% | .0% | 100.0% | .0% | 20.0% | |
| 总数的 % | .0% | .0% | .0% | 20.0% | .0% | 20.0% | |
| 残差 | -.2 | -.2 | -.2 | .8 | -.2 | | |
| 标准残差 | -.4 | -.4 | -.4 | 1.8 | -.4 | | |
| 3.13 | 计数 | 0 | 0 | 1 | 0 | 0 | 1 | |
| 期望的计数 | .2 | .2 | .2 | .2 | .2 | 1.0 | |
| 平均每户家庭人口__人_ 中的 % | .0% | .0% | 100.0% | .0% | .0% | 100.0% | |
| 平均每人消费性支出__元_ 中的 % | .0% | .0% | 100.0% | .0% | .0% | 20.0% | |
| 总数的 % | .0% | .0% | 20.0% | .0% | .0% | 20.0% | |
| 残差 | -.2 | -.2 | .8 | -.2 | -.2 | | |
| 标准残差 | -.4 | -.4 | 1.8 | -.4 | -.4 | | |
| 3.23 | 计数 | 0 | 1 | 0 | 0 | 0 | 1 | |
| 期望的计数 | .2 | .2 | .2 | .2 | .2 | 1.0 | |
| 平均每户家庭人口__人_ 中的 % | .0% | 100.0% | .0% | .0% | .0% | 100.0% | |
| 平均每人消费性支出__元_ 中的 % | .0% | 100.0% | .0% | .0% | .0% | 20.0% | |
| 总数的 % | .0% | 20.0% | .0% | .0% | .0% | 20.0% | |
| 残差 | -.2 | .8 | -.2 | -.2 | -.2 | | |
| 标准残差 | -.4 | 1.8 | -.4 | -.4 | -.4 | | |
| 3.50 | 计数 | 1 | 0 | 0 | 0 | 0 | 1 | |
| 期望的计数 | .2 | .2 | .2 | .2 | .2 | 1.0 | |
| 平均每户家庭人口__人_ 中的 % | 100.0% | .0% | .0% | .0% | .0% | 100.0% | |
| 平均每人消费性支出__元_ 中的 % | 100.0% | .0% | .0% | .0% | .0% | 20.0% | |
| 总数的 % | 20.0% | .0% | .0% | .0% | .0% | 20.0% | |
| 残差 | .8 | -.2 | -.2 | -.2 | -.2 | | |
| 标准残差 | 1.8 | -.4 | -.4 | -.4 | -.4 | | |
| 合计 | 计数 | 1 | 1 | 1 | 1 | 1 | 5 | |
| 期望的计数 | 1.0 | 1.0 | 1.0 | 1.0 | 1.0 | 5.0 | |
| 平均每户家庭人口__人_ 中的 % | 20.0% | 20.0% | 20.0% | 20.0% | 20.0% | 100.0% | |
| 平均每人消费性支出__元_ 中的 % | 100.0% | 100.0% | 100.0% | 100.0% | 100.0% | 100.0% | |
| 总数的 % | 20.0% | 20.0% | 20.0% | 20.0% | 20.0% | 100.0% | |
| 卡方检验 |
| 值 | df | 渐进 Sig. (双侧) |
| Pearson 卡方 | 20.000a | 16 | .220 |
| 似然比 | 16.094 | 16 | .446 |
| 线性和线性组合 | 3.653 | 1 | .056 |
| 有效案例中的 N | 5 | | |
| a. 25 单元格(100.0%) 的期望计数少于 5。最小期望计数为 .20。 |
皮尔逊卡方系数概率>0,05说明两边量显著相关性,拟然比概率>0.05说明两个变量拟合度不高,线性和线性组合的概率也>0.05,说明两者线性关系不显著。
两样本的T检验
| 组统计量 |
| 项____目 | N | 均值 | 标准差 | 均值的标准误 |
| 平均每人全部年收入__元_ | >= 2000.00 | 3 | 14073.9267 | 6795.17917 | 3923.19852 |
| < 2000.00 | 2 | 27.6150 | 1953.60169 | 1381.40500 |
| v#可支配收入 | >= 2000.00 | 3 | 13078.4633 | 5928.76581 | 3422.97454 |
| < 2000.00 | 2 | 26.5550 | 1960.65861 | 1386.39500 |
| 平均每人消费性支出__元_ | >= 2000.00 | 3 | 9501.8000 | 3933.716 | 2271.13250 |
| < 2000.00 | 2 | 2408.2300 | 1597.12794 | 1129.34000 |
| 样本检验 |
| | 方差方程的 Levene 检验 | 均值方程的 t 检验 |
| | | | 差分的 95% 置信区间 |
| | F | Sig. | t | df | Sig.(双侧) | 均值差值 | 标准误差值 | 下限 | 上限 |
| 平均每人全部年收入__元_ | 假设方差相等 | 4.458 | .125 | 2.162 | 3 | .119 | 11176.31167 | 5168.42657 | -5271.92836 | 27624.55170 |
| 假设方差不相等 | | | 2.687 | 2.451 | .093 | 11176.31167 | 4159.29879 | -3905.16884 | 26257.79218 |
| v#可支配收入 | 假设方差相等 | 4.107 | .136 | 2.244 | 3 | .111 | 10181.90833 | 4538.25439 | -4260.84257 | 24624.65923 |
| 假设方差不相等 | | | 2.757 | 2.572 | .084 | 10181.90833 | 3693.08080 | -2760.28818 | 23124.10485 |
| 平均每人消费性支出__元_ | 假设方差相等 | 3.237 | .170 | 2.325 | 3 | .103 | 7093.57000 | 3050.45874 | -2614.35116 | 16801.49116 |
| 假设方差不相等 | | | 2.797 | 2.772 | .074 | 7093.57000 | 2536.42498 | -1366.73059 | 15553.87059 |
平均每人全部年收入F观测值是4.458,Sig0.125>0.05,所以接受原假设。所以认为平均每人每年收入在2000年前和2000年后的方差没有显著差异.t的观测值是2.162,sig0.119>0.05.所以认为均值没有显著性差异。可支配收入F的观测值4.107, Sig.0.136>0.05所以认为可支配收入2000年前和2000年后的方差没有显著差异。平均每人消费性支出F的观测值是3.237,sig0.170.>0.05.所以认为平均每人消费性支出2000年前和2000年后的方差没有显著差异。
| 相关性 |
| | 家庭设备用品及服务_A | 食__品_A | 衣__着_A | 居__住_A |
| 家庭设备用品及服务_A | Pearson 相关性 | 1 | .855 | .675 | -.725 |
| 显著性(双侧) | | .065 | .211 | .166 |
| 平方与叉积的和 | 9.956 | 43.147 | 7.437 | -8.045 |
| 协方差 | 2.4 | 10.787 | 1.859 | -2.011 |
| N | 5 | 5 | 5 | 5 |
| 食__品_A | Pearson 相关性 | .855 | 1 | .950* | -.917* |
| 显著性(双侧) | .065 | | .013 | .029 |
| 平方与叉积的和 | 43.147 | 255.627 | 53.003 | -51.538 |
| 协方差 | 10.787 | 63.907 | 13.251 | -12.884 |
| N | 5 | 5 | 5 | 5 |
| 衣__着_A | Pearson 相关性 | .675 | .950* | 1 | -.951* |
| 显著性(双侧) | .211 | .013 | | .013 |
| 平方与叉积的和 | 7.437 | 53.003 | 12.178 | -11.665 |
| 协方差 | 1.859 | 13.251 | 3.045 | -2.916 |
| N | 5 | 5 | 5 | 5 |
| 居__住_A | Pearson 相关性 | -.725 | -.917* | -.951* | 1 |
| 显著性(双侧) | .166 | .029 | .013 | |
| 平方与叉积的和 | -8.045 | -51.538 | -11.665 | 12.366 |
| 协方差 | -2.011 | -12.884 | -2.916 | 3.091 |
| N | 5 | 5 | 5 | 5 |
| *. 在 0.05 水平(双侧)上显著相关。 |
2图2给出了相关系数矩阵表,其中显示3个自变量两两间的Pearson相关系数,以及关于相关关系等于零的假设的单尾显著性检验概率。从表中看到因变量家庭设备用品及服务与自变量食品、衣着之间相关关系数依次为0.885、0.675,反映家庭设备用品及服务与食品、衣着之间存在显著的相关关系。说明食品与衣着对于家庭设备用品及服务条件的好转有显著的作用。自变量居住于因变量家庭设备用品及服务之间的相关系数为-0.735,它于其他几个自变量之间的相关系数也都为负,说明它们之间的线性关系不显著。此外,食品与衣着之间的相关系数为0.950,这也说明它们之间存在较为显著的相关关系。
曲线估计
以平均每人消费性支出为因变量,以可支配收入为自变量。
| 模型汇总 |
| R | R 方 | 调整 R 方 | 估计值的标准误 |
| 1.000 | .999 | .999 | .028 |
| 自变量为 v#可支配收入。 |
由上表可得。判定系数R接近1,所以认为平均每人消费性支出和可支配收入存在很强的相关关系。
| ANOVA |
| 平方和 | df | 均方 | F | Sig. |
| 回归 | 3.438 | 1 | 3.438 | 4268.654 | .000 |
| 残差 | .002 | 3 | .001 | | |
| 总计 | 3.440 | 4 | | | |
| 自变量为 v#可支配收入。 |
|
F统计量的观测值为4268.654。Sig.为0.所以认为可支配收入与平均每人消费性支出成幂关系。
| 系数 |
| 未标准化系数 | 标准化系数 | t | Sig. |
| B | 标准误 | Beta |
| ln(v#可支配收入) | .923 | .014 | 1.000 | 65.335 | .000 |
| (常数) | 1.527 | .190 | | 8.031 | .004 |
| 因变量为 ln(平均每人消费性支出__元_)。 |
根据上表可得曲线估计后的回归表达