2.14 解答:(1)散点图为:
(2)x与y之间大致呈线性关系。
(3)设回归方程为
=
(4)
=
(5)由于
服从自由度为n-2的t分布。因而
也即:=
可得
即为:(2.49,11.5)
服从自由度为n-2的t分布。因而
即
可得
(6)x与y的决定系数
(7)
ANOVA | |||||||
x | |||||||
平方和 | df | 均方 | F | 显著性 | |||
组间 | (组合) | 9.000 | 2 | 4.500 | 9.000 | .100 | |
线性项 | 加权的 | 8.167 | 1 | 8.167 | 16.333 | .056 | |
偏差 | .833 | 1 | .833 | 1.667 | .326 | ||
组内 | 1.000 | 2 | .500 | ||||
总数 | 10.000 | 4 |
(8) 其中
接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。
(9)相关系数
=
小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.
(10)
序号 | ||||
1 | 1 | 10 | 6 | 4 |
2 | 2 | 10 | 13 | -3 |
3 | 3 | 20 | 20 | 0 |
4 | 4 | 20 | 27 | -7 |
5 | 5 | 40 | 34 | 6 |
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)当广告费=4.2万元时,销售收入
,即(17.1,39.7)
2.15 解答:
(1) 散点图为:
(2)x与y之间大致呈线性关系。
(3)设回归方程为
=
(4)
=0.2305
0.4801
(5) 由于
服从自由度为n-2的t分布。因而
也即:=
可得
即为:(0.0028,0.0044)
服从自由度为n-2的t分布。因而
即
可得
(6)x与y的决定系数 =0.908
(7)
ANOVA | |||||||
x | |||||||
平方和 | df | 均方 | F | 显著性 | |||
组间 | (组合) | 1231497.500 | 7 | 175928.214 | 5.302 | .168 | |
线性项 | 加权的 | 1168713.036 | 1 | 1168713.036 | 35.222 | .027 | |
偏差 | 62784.4 | 6 | 104.077 | .315 | .885 | ||
组内 | 66362.500 | 2 | 33181.250 | ||||
总数 | 1297860.000 | 9 |
(8) 其中
接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。
(9) 相关系数
=
小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.
(10)
序号 | ||||
1 | 825 | 3.5 | 3.0768 | 0.4232 |
2 | 215 | 1 | 0.8808 | 0.1192 |
3 | 1070 | 4 | 3.9588 | 0.0412 |
4 | 550 | 2 | 2.0868 | -0.0868 |
5 | 480 | 1 | 1.8348 | -0.8348 |
6 | 920 | 3 | 3.4188 | -0.4188 |
7 | 1350 | 4.5 | 4.9688 | -0.4668 |
8 | 325 | 1.5 | 1.2768 | 0.2232 |
9 | 670 | 3 | 2.5188 | 0.4812 |
10 | 1215 | 5 | 4.4808 | 0.5192 |
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)
(12),
即为(2.7,4.7)
近似置信区间为:,即(2.74,4.66)
(13)可得置信水平为为,即为(3.33,4.07).
2.16 (1)散点图为:
可以用直线回归描述y与x之间的关系.
(2)回归方程为:
(3)
从图上可看出,检验误差项服从正态分布。
第三章 多元线性回归
3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:
相关性 | |||||
y | x1 | x2 | x3 | ||
Pearson 相关性 | y | 1.000 | .556 | .731 | .724 |
x1 | .556 | 1.000 | .113 | .398 | |
x2 | .731 | .113 | 1.000 | .547 | |
x3 | .724 | .398 | .547 | 1.000 | |
y | . | .048 | .008 | .009 | |
x1 | .048 | . | .378 | .127 | |
x2 | .008 | .378 | . | .051 | |
x3 | .009 | .127 | .051 | . | |
N | y | 10 | 10 | 10 | 10 |
x1 | 10 | 10 | 10 | 10 | |
x2 | 10 | 10 | 10 | 10 | |
x3 | 10 | 10 | 10 | 10 |
系数a | |||||||||||||||||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | B 的 95.0% 置信区间 | 相关性 | 共线性统计量 | ||||||||||||||
B | 标准 误差 | 试用版 | 下限 | 上限 | 零阶 | 偏 | 部分 | 容差 | VIF | ||||||||||||
1 | (常量) | -348.280 | 176.459 | -1.974 | .096 | -780.060 | 83.500 | ||||||||||||||
x1 | 3.754 | 1.933 | .385 | 1.942 | .100 | -.977 | 8.485 | .556 | .621 | .350 | .825 | 1.211 | |||||||||
x2 | 7.101 | 2.880 | .535 | 2.465 | .049 | .053 | 14.149 | .731 | .709 | .444 | .687 | 1.455 | |||||||||
x3 | 12.447 | 10.569 | .277 | 1.178 | .284 | -13.415 | 38.310 | .724 | .433 | .212 | .586 | 1.708 | |||||||||
a. 因变量: y |
(2)
所以三元线性回归方程为
模型汇总 | |||||||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | 更改统计量 | ||||
R 方更改 | F 更改 | df1 | df2 | Sig. F 更改 | |||||
1 | .8a | .806 | .708 | 23.44188 | .806 | 8.283 | 3 | 6 | .015 |
a. 预测变量: (常量), x3, x1, x2。 |
由于决定系数R方=0.708 R=0.8较大所以认为拟合度较高
(4)
Anovab | ||||||
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 13655.370 | 3 | 4551.790 | 8.283 | .015a |
残差 | 3297.130 | 6 | 549.522 | |||
总计 | 16952.500 | 9 | ||||
a. 预测变量: (常量), x3, x1, x2。 | ||||||
b. 因变量: y |
(5)
系数a | |||||||||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | B 的 95.0% 置信区间 | 相关性 | 共线性统计量 | ||||||
B | 标准 误差 | 试用版 | 下限 | 上限 | 零阶 | 偏 | 部分 | 容差 | VIF | ||||
1 | (常量) | -348.280 | 176.459 | -1.974 | .096 | -780.060 | 83.500 | ||||||
x1 | 3.754 | 1.933 | .385 | 1.942 | .100 | -.977 | 8.485 | .556 | .621 | .350 | .825 | 1.211 | |
x2 | 7.101 | 2.880 | .535 | 2.465 | .049 | .053 | 14.149 | .731 | .709 | .444 | .687 | 1.455 | |
x3 | 12.447 | 10.569 | .277 | 1.178 | .284 | -13.415 | 38.310 | .724 | .433 | .212 | .586 | 1.708 | |
a. 因变量: y |
去除x3后作F检验,得:
Anovab | ||||||
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 123.199 | 2 | 46.600 | 11.117 | .007a |
残差 | 4059.301 | 7 | 579.900 | |||
总计 | 16952.500 | 9 | ||||
a. 预测变量: (常量), x2, x1。 | ||||||
b. 因变量: y |
继续做回归系数检验
系数a | |||||||||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | B 的 95.0% 置信区间 | 相关性 | 共线性统计量 | ||||||
B | 标准 误差 | 试用版 | 下限 | 上限 | 零阶 | 偏 | 部分 | 容差 | VIF | ||||
1 | (常量) | -459.624 | 153.058 | -3.003 | .020 | -821.547 | -97.700 | ||||||
x1 | 4.676 | 1.816 | .479 | 2.575 | .037 | .381 | 8.970 | .556 | .697 | .476 | .987 | 1.013 | |
x2 | 8.971 | 2.468 | .676 | 3.634 | .008 | 3.134 | 14.808 | .731 | .808 | .672 | .987 | 1.013 | |
a. 因变量: y |
(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)
(8)
(9)
残差统计量a | |||||
极小值 | 极大值 | 均值 | 标准 偏差 | N | |
预测值 | 175.4748 | 292.5545 | 231.5000 | 38.95206 | 10 |
标准 预测值 | -1.438 | 1.567 | .000 | 1.000 | 10 |
预测值的标准误差 | 10.466 | 20.191 | 14.526 | 3.127 | 10 |
调整的预测值 | 188.3515 | 318.1067 | 240.1835 | 49.83914 | 10 |
残差 | -25.19759 | 33.22549 | .00000 | 19.14022 | 10 |
标准 残差 | -1.075 | 1.417 | .000 | .816 | 10 |
Student 化 残差 | -2.116 | 1.754 | -.123 | 1.188 | 10 |
已删除的残差 | -97.61523 | 50.88274 | -8.68348 | 43.43220 | 10 |
Student 化 已删除的残差 | -3.832 | 2.294 | -.255 | 1.658 | 10 |
Mahal。 距离 | .4 | 5.777 | 2.700 | 1.555 | 10 |
Cook 的距离 | .000 | 3.216 | .486 | .976 | 10 |
居中杠杆值 | .099 | .2 | .300 | .173 | 10 |
a. 因变量: y |
(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好
3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,GDP就增加0.607个单位。
在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。
第四章 违背基本假设的情况
4.9 解:
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | -.831 | .442 | -1.882 | .065 | |
x | .004 | .000 | .839 | 11.030 | .000 | |
a. 因变量: y |
残差散点图为:
(2)由残差散点图可知存在异方差性
再用等级相关系数分析:
相关系数 | ||||
x | t | |||
Spearman 的 rho | x | 相关系数 | 1.000 | .318* |
Sig.(双侧) | . | .021 | ||
N | 53 | 53 | ||
t | 相关系数 | .318* | 1.000 | |
Sig.(双侧) | .021 | . | ||
N | 53 | 53 | ||
*. 在置信度(双测)为 0.05 时,相关性是显著的。 |
(3)
模型描述 | ||
因变量 | y | |
自变量 | 1 | x |
权重 | 源 | x |
幂值 | 1.500 | |
模型: MOD_1. |
ANOVA | |||||
平方和 | df | 均方 | F | Sig. | |
回归 | .006 | 1 | .006 | 98.604 | .000 |
残差 | .003 | 51 | .000 | ||
总计 | .009 | 52 |
系数 | ||||||
未标准化系数 | 标准化系数 | t | Sig. | |||
B | 标准误 | 试用版 | 标准误 | |||
(常数) | -.683 | .298 | -2.296 | .026 | ||
x | .004 | .000 | .812 | .082 | 9.930 | .000 |
(4)
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | .582 | .130 | 4.481 | .000 | |
x | .001 | .000 | .805 | 9.699 | .000 | |
a. 因变量: yy |
4.13 解:
(1)
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | -1.435 | .242 | -5.930 | .000 | |
x | .176 | .002 | .999 | 107.928 | .000 | |
a. 因变量: y |
(2)
模型汇总b | |||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | Durbin-Watson |
1 | .999a | .998 | .998 | .09744 | .663 |
a. 预测变量: (常量), x。 | |||||
b. 因变量: y |
所以DW<,故误差项存在正相关。
残差图为:
随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。
(3)=1-0.5*DW=0.6685 计算得:
Y’ x’
7.39 44.90
7.65 45.80
6.84 40.69
8.00 48.50
7.79 46.85
8.26 49.45
7.96 48.47
8.28 50.04
7.90 48.03
8.49 51.17
7.88 47.26
8.77 52.33
8.93 52.69
9.32 54.95
9.29 55.54
9.48 56.77
9.38 55.83
9.67 58.00
9.90 59.22
模型汇总b | |||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | Durbin-Watson |
1 | .996a | .993 | .993 | .07395 | 1.344 |
a. 预测变量: (常量), xx。 | |||||
b. 因变量: yy |
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | -.303 | .180 | -1.684 | .110 | |
xx | .173 | .004 | .996 | 49.011 | .000 | |
a. 因变量: yy |
即:=-0.303+0.6685+0.173(—0.6685)
(4)
模型汇总b | |||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | Durbin-Watson |
1 | .978a | .957 | .955 | .07449 | 1.480 |
a. 预测变量: (常量), x3。 | |||||
b. 因变量: y3 |
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | .033 | .026 | 1.273 | .220 | |
x3 | .161 | .008 | .978 | 19.528 | .000 | |
a. 因变量: y3 |
即:=0.033++0.161(-)
(5)差分法的DW值最大为1.48消除相关性最彻底,但是迭代法的值最小为0.07395,拟合的较好。
4.14解:(1)
模型汇总b | |||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | Durbin-Watson |
1 | .541a | .293 | .2 | 329.69302 | .745 |
a. 预测变量: (常量), x2, x1。 | |||||
b. 因变量: y |
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | -574.062 | 349.271 | -1.4 | .107 | |
x1 | 191.098 | 73.309 | .345 | 2.607 | .012 | |
x2 | 2.045 | .911 | .297 | 2.246 | .029 | |
a. 因变量: y |
DW=0.745
(2)=1-0.5*DW=0.6275
模型汇总b | |||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | Durbin-Watson |
1 | .688a | .474 | .452 | 257.670 | 1.716 |
a. 预测变量: (常量), x22, x12。 | |||||
b. 因变量: y2 |
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | -179.668 | 90.337 | -1.9 | .052 | |
x12 | 211.770 | 47.778 | .522 | 4.432 | .000 | |
x22 | 1.434 | .628 | .269 | 2.283 | .027 | |
a. 因变量: y2 |
所以回归方程为:
(3)
模型汇总b | |||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | Durbin-Watson |
1 | .715a | .511 | .490 | 283.79102 | 2.042 |
a. 预测变量: (常量), x23, x13。 | |||||
b. 因变量: y3 |
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | 7.698 | 39.754 | .194 | .847 | |
x13 | 209.1 | 44.143 | .544 | 4.755 | .000 | |
x23 | 1.399 | .583 | .274 | 2.400 | .020 | |
a. 因变量: y3 |
所以回归方程为:
第五章 自变量选择与逐步回归
5.9 后退法:输出结果
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | 1438.120 | 2252.472 | .638 | .533 | |
农业x1 | -.626 | .168 | -1.098 | -3.720 | .002 | |
工业x2 | -.328 | .207 | -1.352 | -1.587 | .135 | |
建筑业x3 | -.383 | .555 | -.251 | -.691 | .501 | |
人口x4 | -.004 | .025 | -.014 | -.161 | .875 | |
最终消费x5 | .672 | .130 | 3.710 | 5.178 | .000 | |
受灾面积x6 | -.006 | .008 | -.015 | -.695 | .499 | |
2 | (常量) | 1079.754 | 299.759 | 3.602 | .003 | |
农业x1 | -.2 | .130 | -1.126 | -4.925 | .000 | |
工业x2 | -.303 | .131 | -1.249 | -2.314 | .035 | |
建筑业x3 | -.402 | .525 | -.263 | -.765 | .456 | |
最终消费x5 | .658 | .095 | 3.636 | 6.905 | .000 | |
受灾面积x6 | -.006 | .007 | -.017 | -.849 | .409 | |
3 | (常量) | 1083.150 | 295.816 | 3.662 | .002 | |
农业x1 | -.624 | .127 | -1.095 | -4.931 | .000 | |
工业x2 | -.373 | .093 | -1.535 | -3.998 | .001 | |
最终消费x5 | .657 | .094 | 3.627 | 6.981 | .000 | |
受灾面积x6 | -.005 | .007 | -.015 | -.758 | .460 | |
4 | (常量) | 874.604 | 106.869 | 8.184 | .000 | |
农业x1 | -.611 | .124 | -1.073 | -4.936 | .000 | |
工业x2 | -.353 | .088 | -1.454 | -3.994 | .001 | |
最终消费x5 | .637 | .0 | 3.516 | 7.142 | .000 | |
a. 因变量: 财政收入y |
Anovae | ||||||
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 1.365E8 | 6 | 2.274E7 | 602.127 | .000a |
残差 | 528793.319 | 14 | 37770.951 | |||
总计 | 1.370E8 | 20 | ||||
2 | 回归 | 1.365E8 | 5 | 2.729E7 | 772.734 | .000b |
残差 | 529767.852 | 15 | 35317.857 | |||
总计 | 1.370E8 | 20 | ||||
3 | 回归 | 1.3E8 | 4 | 3.411E7 | 991.468 | .000c |
残差 | 550440.103 | 16 | 34402.506 | |||
总计 | 1.370E8 | 20 | ||||
4 | 回归 | 1.3E8 | 3 | 4.547E7 | 1355.753 | .000d |
残差 | 570180.931 | 17 | 33540.055 | |||
总计 | 1.370E8 | 20 | ||||
a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 | ||||||
b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 | ||||||
c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 | ||||||
d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 | ||||||
e. 因变量: 财政收入y |
模型汇总 | |||||||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | 更改统计量 | ||||
R 方更改 | F 更改 | df1 | df2 | Sig. F 更改 | |||||
1 | .998a | .996 | .994 | 194.34750 | .996 | 602.127 | 6 | 14 | .000 |
2 | .998b | .996 | .995 | 187.93046 | .000 | .026 | 1 | 14 | .875 |
3 | .998c | .996 | .995 | 185.47913 | .000 | .585 | 1 | 15 | .456 |
4 | .998d | .996 | .995 | 183.13944 | .000 | .574 | 1 | 16 | .460 |
a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 | |||||||||
b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 | |||||||||
c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 | |||||||||
d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 |
逐步回归法:输出结果
模型汇总 | |||||||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | 更改统计量 | ||||
R 方更改 | F 更改 | df1 | df2 | Sig. F 更改 | |||||
1 | .994a | .9 | .988 | 285.68373 | .9 | 1659.441 | 1 | 19 | .000 |
2 | .996b | .992 | .991 | 247.77768 | .003 | 7.258 | 1 | 18 | .015 |
3 | .998c | .996 | .995 | 183.13944 | .004 | 15.948 | 1 | 17 | .001 |
a. 预测变量: (常量), 最终消费x5。 | |||||||||
b. 预测变量: (常量), 最终消费x5, 农业x1。 | |||||||||
c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。 |
Anovad | ||||||
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 1.354E8 | 1 | 1.354E8 | 1659.441 | .000a |
残差 | 1550688.654 | 19 | 81615.192 | |||
总计 | 1.370E8 | 20 | ||||
2 | 回归 | 1.359E8 | 2 | 6.794E7 | 1106.637 | .000b |
残差 | 1105088.003 | 18 | 61393.778 | |||
总计 | 1.370E8 | 20 | ||||
3 | 回归 | 1.3E8 | 3 | 4.547E7 | 1355.753 | .000c |
残差 | 570180.931 | 17 | 33540.055 | |||
总计 | 1.370E8 | 20 | ||||
a. 预测变量: (常量), 最终消费x5。 | ||||||
b. 预测变量: (常量), 最终消费x5, 农业x1。 | ||||||
c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。 | ||||||
d. 因变量: 财政收入y |
系数a | |||||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | 相关性 | ||||
B | 标准 误差 | 试用版 | 零阶 | 偏 | 部分 | ||||
1 | (常量) | 710.372 | 90.1 | 7.816 | .000 | ||||
最终消费x5 | .180 | .004 | .994 | 40.736 | .000 | .994 | .994 | .994 | |
2 | (常量) | 1011.912 | 136.901 | 7.392 | .000 | ||||
最终消费x5 | .311 | .049 | 1.718 | 6.374 | .000 | .994 | .832 | .135 | |
农业x1 | -.414 | .154 | -.726 | -2.694 | .015 | .987 | -.536 | -.057 | |
3 | (常量) | 874.604 | 106.869 | 8.184 | .000 | ||||
最终消费x5 | .637 | .0 | 3.516 | 7.142 | .000 | .994 | .866 | .112 | |
农业x1 | -.611 | .124 | -1.073 | -4.936 | .000 | .987 | -.767 | -.077 | |
工业x2 | -.353 | .088 | -1.454 | -3.994 | .001 | .992 | -.696 | -.062 | |
a. 因变量: 财政收入y |
5.10
(1)
模型汇总 | ||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 |
1 | .908a | .824 | .736 | 625.88326 |
2 | .000b | .000 | .000 | 1217.15945 |
a. 预测变量: (常量), x6, x3, x2, x4, x5。 | ||||
b. 预测变量: (常量) |
Anovac | ||||||
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 1.830E7 | 5 | 3660971.683 | 9.346 | .002a |
残差 | 3917298.522 | 10 | 391729.852 | |||
总计 | 2.222E7 | 15 | ||||
2 | 回归 | .000 | 0 | .000 | . | .b |
残差 | 2.222E7 | 15 | 1481477.129 | |||
总计 | 2.222E7 | 15 | ||||
a. 预测变量: (常量), x6, x3, x2, x4, x5。 | ||||||
b. 预测变量: (常量) | ||||||
c. 因变量: y |
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | 5922.827 | 2504.315 | 2.365 | .040 | |
x2 | 4.8 | 2.507 | .677 | 1.940 | .081 | |
x3 | 2.374 | .842 | .782 | 2.818 | .018 | |
x4 | -817.901 | 187.279 | -1.156 | -4.367 | .001 | |
x5 | 14.539 | 147.078 | .050 | .099 | .923 | |
x6 | -846.867 | 291.634 | -.9 | -2.904 | .016 | |
2 | (常量) | 7542.938 | 304.290 | 24.7 | .000 | |
a. 因变量: y |
(2)后退法:输出结果
模型汇总 | ||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 |
1 | .908a | .824 | .736 | 625.88326 |
2 | .907b | .824 | .759 | 597.04776 |
a. 预测变量: (常量), x6, x3, x2, x4, x5。 | ||||
b. 预测变量: (常量), x6, x3, x2, x4。 |
Anovac | ||||||
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 1.830E7 | 5 | 3660971.683 | 9.346 | .002a |
残差 | 3917298.522 | 10 | 391729.852 | |||
总计 | 2.222E7 | 15 | ||||
2 | 回归 | 1.830E7 | 4 | 4575257.669 | 12.835 | .000b |
残差 | 3921126.262 | 11 | 3566.024 | |||
总计 | 2.222E7 | 15 | ||||
a. 预测变量: (常量), x6, x3, x2, x4, x5。 | ||||||
b. 预测变量: (常量), x6, x3, x2, x4。 | ||||||
c. 因变量: y |
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | 5922.827 | 2504.315 | 2.365 | .040 | |
x2 | 4.8 | 2.507 | .677 | 1.940 | .081 | |
x3 | 2.374 | .842 | .782 | 2.818 | .018 | |
x4 | -817.901 | 187.279 | -1.156 | -4.367 | .001 | |
x5 | 14.539 | 147.078 | .050 | .099 | .923 | |
x6 | -846.867 | 291.634 | -.9 | -2.904 | .016 | |
2 | (常量) | 6007.320 | 2245.481 | 2.675 | .022 | |
x2 | 5.068 | 1.360 | .706 | 3.727 | .003 | |
x3 | 2.308 | .486 | .760 | 4.750 | .001 | |
x4 | -824.261 | 167.776 | -1.165 | -4.913 | .000 | |
x6 | -862.699 | 232.4 | -.916 | -3.711 | .003 | |
a. 因变量: y |
(3)逐步回归
模型汇总 | ||||
模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 |
1 | .498a | .248 | .194 | 1092.83206 |
2 | .697b | .485 | .406 | 937.95038 |
3 | .811c | .657 | .572 | 796.60909 |
a. 预测变量: (常量), x3。 | ||||
b. 预测变量: (常量), x3, x5。 | ||||
c. 预测变量: (常量), x3, x5, x4。 |
Anovad | ||||||
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 5502210.090 | 1 | 5502210.090 | 4.607 | .050a |
残差 | 1.672E7 | 14 | 1194281.918 | |||
总计 | 2.222E7 | 15 | ||||
2 | 回归 | 1.079E7 | 2 | 5392697.554 | 6.130 | .013b |
残差 | 1.144E7 | 13 | 879750.910 | |||
总计 | 2.222E7 | 15 | ||||
3 | 回归 | 1.461E7 | 3 | 4869041.506 | 7.673 | .004c |
残差 | 7615032.418 | 12 | 634586.035 | |||
总计 | 2.222E7 | 15 | ||||
a. 预测变量: (常量), x3。 | ||||||
b. 预测变量: (常量), x3, x5。 | ||||||
c. 预测变量: (常量), x3, x5, x4。 | ||||||
d. 因变量: y |
系数a | ||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | 5161.259 | 1142.744 | 4.517 | .000 | |
x3 | 1.511 | .704 | .498 | 2.146 | .050 |
2 | (常量) | 472.298 | 2150.138 | .220 | .830 | |
x3 | 3.188 | .913 | 1.050 | 3.492 | .004 | |
x5 | 212.325 | 86.3 | .737 | 2.451 | .029 | |
3 | (常量) | 1412.807 | 1865.912 | .757 | .4 | |
x3 | 3.440 | .782 | 1.133 | 4.398 | .001 | |
x5 | 348.729 | 92.220 | 1.210 | 3.782 | .003 | |
x4 | -415.136 | 169.163 | -.587 | -2.454 | .030 | |
a. 因变量: y |
(4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x6, x3, x2, x4作为最终模型。而逐步回归法只引入了x3。说明了方法对自变量重要性的认可不同的,这与自变量的相关性有关联。相比之下,后退法首先做全模型的回归,每一个变量都有机会展示自己的作用,所得结果更有说服力
第六章 多重共线性的情形及其处理
6.6
解:由下表我们可以看出
系数a | ||||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | 共线性统计量 | |||
B | 标准 误差 | 试用版 | 容差 | VIF | ||||
1 | (常量) | -6381.575 | 2736.958 | -2.332 | .035 | |||
x1 | -.593 | .279 | -1.040 | -2.127 | .052 | .003 | 318.536 | |
x2 | .549 | .199 | 2.260 | 2.753 | .016 | .001 | 7.470 | |
x3 | -.756 | .911 | -.495 | -.830 | .420 | .002 | 472.951 | |
x4 | .080 | .031 | .281 | 2.590 | .021 | .0 | 15.706 | |
x5 | .006 | .006 | .038 | .918 | .374 | .434 | 2.305 | |
x6 | -.010 | .014 | -.027 | -.750 | .466 | .574 | 1.742 | |
a. 因变量: y |
系数a | ||||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | 共线性统计量 | |||
B | 标准 误差 | 试用版 | 容差 | VIF | ||||
1 | (常量) | -2677.422 | 2858.846 | -.937 | .3 | |||
x1 | -.053 | .237 | -.092 | -.221 | .828 | .006 | 160.620 | |
x3 | 1.433 | .533 | .937 | 2.690 | .017 | .009 | 112.478 | |
x4 | .036 | .032 | .127 | 1.137 | .274 | .087 | 11.509 | |
x5 | .006 | .008 | .041 | .822 | .424 | .434 | 2.303 | |
x6 | .002 | .015 | .006 | .157 | .878 | .7 | 1.545 | |
a. 因变量: y |
系数a | ||||||||
模型 | 非标准化系数 | 标准系数 | t | Sig. | 共线性统计量 | |||
B | 标准 误差 | 试用版 | 容差 | VIF | ||||
1 | (常量) | -2214.129 | 1888.503 | -1.172 | .258 | |||
x3 | 1.318 | .109 | .862 | 12.068 | .000 | .199 | 5.023 | |
x4 | .031 | .019 | .107 | 1.586 | .132 | .221 | 4.523 | |
x5 | .006 | .007 | .041 | .841 | .412 | .434 | 2.302 | |
x6 | .003 | .015 | .008 | .209 | .837 | .671 | 1.4 | |
a. 因变量: y |
=-2214.129+1.318x3+0.031x4+0.006x5+0.003x6