
练习题4.1参
(1) 存在且。
因为
当和之间的相关系数为零时,即
有
同理可知。
(2)
由(1)中结论,我们可得出以下公式:
即有:
因此, 从而可以说明,是与的一个线性组合。
(3) 存在。
因为
当时,
同理,有
练习题4.2参
根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。
练习题4.3参
(1)由题知,对数回归模型为:
用最小二乘法对参数进行估计得:
| Dependent Variable: LOG(Y) | ||||
| Method: Least Squares | ||||
| Date: 11/17/10 Time: 23:51 | ||||
| Sample: 1985 2007 | ||||
| Included observations: 23 | ||||
| Coefficient | Std. Error | t-Statistic | Prob. | |
| LOG(GDP) | 1.656674 | 0.092206 | 17.96703 | 0.0000 |
| LOG(CPI) | -1.057053 | 0.2147 | -4.924618 | 0.0001 |
| C | -3.060149 | 0.337427 | -9.069059 | 0.0000 |
| R-squared | 0.992218 | Mean dependent var | 9.155303 | |
| Adjusted R-squared | 0.991440 | S.D. dependent var | 1.276500 | |
| S.E. of regression | 0.118100 | Akaike info criterion | -1.313463 | |
| Sum squared resid | 0.2752 | Schwarz criterion | -1.165355 | |
| Log likelihood | 18.10482 | Hannan-Quinn criter. | -1.276214 | |
| F-statistic | 1275.093 | Durbin-Watson stat | 0.745639 | |
| Prob(F-statistic) | 0.000000 | |||
(0.337) (0.092) (0.215)
t= -9.069059 17.96703 -4.924618
(2)存在多重共线性。居民消费价格指数的回归系数的符号不能进行合理的经济意释,且其简单相关系数为0.9808,说明lnGDP和lnCPI存在正相关的关系。
(3)根据题目要求进行如下回归:
模型为:
用最小二乘法对参数进行估计得:
(0.384) (0.035)
t= -10.58 34.62222
模型为:
用最小二乘法对参数进行估计得:
(1.254) (0.228)
t= -4.341218 11.68091
模型为:
用最小二乘法对参数进行估计得:
(0.734) (0.134)
t= -1.958231 16.814
模型1、2说明:单方程拟合效果都很好,回归系数显著,判定系数较高,GDP和CPI对进口的显著的单一影响,
模型3说明:运用方差扩大因子法,计算VIF=1/(1-R^2)=35.7143远远大于10,说明lnGDP与lnCPI之间存在严重的多重共线性。若这两个变量同时引入模型会引起了多重共线性。
(4)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意的。
练习题4.4参
本题很灵活,主要应注意以下问题:
(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。
(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。
练习题4.5参
从模型拟合结果可知,样本观测个数为27,消费模型的判定系数,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。
依据参数估计量及其标准误,计算各个变量的t统计量值:
除外,其余的值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。
练习题4.6参
1)建立多元回归模型为
其中,为中国能源消费标准煤总量,为国名总收入,为国内生产总值,为工业增加值,为建筑业增加值,为交通运输邮电业增加值,为人均生活电力消费,为能源加工转换效率。
回归结果为:
| Dependent Variable: Y | ||||
| Method: Least Squares | ||||
| Date: 11/17/10 Time: 13:39 | ||||
| Sample: 1985 2007 | ||||
| Included observations: 23 | ||||
| Coefficient | Std. Error | t-Statistic | Prob. | |
| X1 | 10.68885 | 3.034175 | 3.522820 | 0.0031 |
| X2 | -12.43067 | 3.675319 | -3.382201 | 0.0041 |
| X3 | 0.2653 | 0.190824 | 1.392080 | 0.1842 |
| X4 | 22.60071 | 10.19131 | 2.2176 | 0.0424 |
| X5 | 0.874955 | 2.953978 | 0.296195 | 0.7711 |
| X6 | 909.0161 | 345.5062 | 2.630969 | 0.01 |
| X7 | 1444.437 | 1382.319 | 1.044938 | 0.3126 |
| C | -28023.73 | 94945.12 | -0.295157 | 0.7719 |
| R-squared | 0.9801 | Mean dependent var | 1393.6 | |
| Adjusted R-squared | 0.985041 | S.D. dependent var | 51705.05 | |
| S.E. of regression | 6323.831 | Akaike info criterion | 20.61025 | |
| Sum squared resid | 6.00E+08 | Schwarz criterion | 21.00520 | |
| Log likelihood | -229.0178 | Hannan-Quinn criter. | 20.70958 | |
| F-statistic | 207.9591 | Durbin-Watson stat | 1.316360 | |
| Prob(F-statistic) | 0.000000 | |||
2)如果决定用表中全部变量作为解释变量,会预料到会有多重共线性,因为:从变量的经济意义上看工业增加值、建筑业增加值和交通运输邮电业增加值均是国内生产总值的组成部分,它们之间必然存在某种线性组合,因此必然存在多重共线性。
3)1.模型的变换(差分)
先用差分试试,回归结果如下
| Dependent Variable: Y-Y(-1) | ||||
| Method: Least Squares | ||||
| Date: 11/17/10 Time: 14:16 | ||||
| Sample (adjusted): 1986 2007 | ||||
| Included observations: 22 after adjustments | ||||
| Coefficient | Std. Error | t-Statistic | Prob. | |
| X7-X7(-1) | 1603.680 | 959.3853 | 1.671570 | 0.1168 |
| X6-X6(-1) | 92.39133 | 368.5883 | 0.250663 | 0.8057 |
| X5-X5(-1) | 1.793205 | 2.130120 | 0.841833 | 0.4140 |
| X4-X4(-1) | 1.851981 | 9.928112 | 0.186539 | 0.8547 |
| X3-X3(-1) | 0.116616 | 0.118745 | 0.982073 | 0.3427 |
| X2-X2(-1) | -10.92141 | 5.196650 | -2.101624 | 0.0542 |
| X1-X1(-1) | 11.01442 | 5.081630 | 2.167497 | 0.0479 |
| C | 2470.655 | 2366.093 | 1.044192 | 0.3141 |
| R-squared | 0.751475 | Mean dependent var | 8586.409 | |
| Adjusted R-squared | 0.627212 | S.D. dependent var | 8613.515 | |
| S.E. of regression | 5259.098 | Akaike info criterion | 20.24859 | |
| Sum squared resid | 3.87E+08 | Schwarz criterion | 20.534 | |
| Log likelihood | -214.7345 | Hannan-Quinn criter. | 20.34205 | |
| F-statistic | 6.047474 | Durbin-Watson stat | 1.538011 | |
| Prob(F-statistic) | 0.002151 | |||
2.
1)逐步回归(采用逐步添加变量法)
第一步:
| 变量 | x1 | x2 | x3 | x4 | x5 | x6 | x7 |
| 参数估计 | 0.733281 | 0.735285 | 1.665481 | 13.19088 | 10.804 | 678.0058 | 19332.3 |
| t统计量 | 26.46983 | 25.36274 | 18.02565 | 25.96363 | 13.51473 | 22.42294 | 4.702427 |
| 可绝系数 | 0.9709 | 0.968386 | 0.939293 | 0.9697 | 0.6881 | 0.959907 | 0.512906 |
| 调整的可决系数 | 0.969514 | 0.966881 | 0.9302 | 0.96835 | 0.197 | 0.957998 | 0.4711 |
第二步:
| x1 | x2 | x3 | x4 | x5 | x6 | x7 | 调整的可绝系数 | |
| x1, x2 | 6.6398(3.511) | -5.931 (-3.123) | 0.978 | |||||
| x1, x3 | 0.551 (5.359) | 0.435 (1.831) | 0.973 | |||||
| x1, x4 | 0.504 (0.987) | 4.133 (0.449) | 0.968 | |||||
| x1, x5 | 1.052 (8.77) | -5.027 (-2.711) | 0.977 | |||||
| x1, x6 | 1.007 (2.902) | -255.804 (-0.792) | 0.970 | |||||
| x1, x7 | 0.750 (17.876) | -813.436 (-0.535) | 0.968 |
通过第一步回归我们可以看出,在各个变量的经济意义和t检验通过的情况下,X4是仅次于X1可绝系数最高的变量,因此我们考虑保留X4并做进一步回归,结果如下:
| X4 | X1 | X2 | X3 | X5 | X6 | X7 | 调整的可绝系数 | |
| X4, x1 | 4.133 (0.449) | 0.504 (0.987) | 0.968 | |||||
| X4, x2 | 10.163 (1.012) | 0.169 (0.302) | 0.967 | |||||
| X4, x3 | 9.696 (5.296) | 0.4 (1.977) | 0.972 | |||||
| X4, x5 | 16.563 (7.531) | -2.972 (-1.573) | 0.970 | |||||
| X4, x6 | 13.182 (2.558) | 0.4 (0.002) | 0.967 | |||||
| X4, x7 | 13.855 (17.984) | -1769.9 (-1.140) | 0.969 |
在后面的回归中,无法再引入变量使得模型效果更好,因此采用逐步回归的结果为:
练习题4.7参
答:模型可能存在多重共线性。
回归结果如下:
| Dependent Variable: CS | ||||
| Method: Least Squares | ||||
| Date: 11/19/10 Time: 10:05 | ||||
| Sample: 1978 2007 | ||||
| Included observations: 30 | ||||
| Coefficient | Std. Error | t-Statistic | Prob. | |
| NZ | -1.907548 | 0.342045 | -5.576888 | 0.0000 |
| GZ | 0.045947 | 0.042746 | 1.0742 | 0.2936 |
| JZZ | 6.458374 | 0.765767 | 8.433867 | 0.0000 |
| TPOP | 0.096022 | 0.091660 | 1.047591 | 0.3057 |
| CUM | 0.003108 | 0.042807 | 0.072609 | 0.9427 |
| SZM | -0.027627 | 0.0404 | -0.5916 | 0.5776 |
| C | -5432.507 | 8607.753 | -0.631118 | 0.5342 |
| R-squared | 0.9654 | Mean dependent var | 10049.04 | |
| Adjusted R-squared | 0.986955 | S.D. dependent var | 12585.51 | |
| S.E. of regression | 1437.448 | Akaike info criterion | 17.58009 | |
| Sum squared resid | 47523916 | Schwarz criterion | 17.90704 | |
| Log likelihood | -256.7013 | Hannan-Quinn criter. | 17.68468 | |
| F-statistic | 366.6801 | Durbin-Watson stat | 1.654140 | |
| Prob(F-statistic) | 0.000000 | |||
| Dependent Variable: CS-CS(-1) | ||||
| Method: Least Squares | ||||
| Date: 11/19/10 Time: 10:08 | ||||
| Sample (adjusted): 1979 2007 | ||||
| Included observations: 29 after adjustments | ||||
| Coefficient | Std. Error | t-Statistic | Prob. | |
| NZ-NZ(-1) | 0.0995 | 0.371971 | 0.267883 | 0.7913 |
| GZ-GZ(-1) | 0.015052 | 0.024311 | 0.619157 | 0.5422 |
| JZZ-JZZ(-1) | 3.283320 | 0.984825 | 3.333914 | 0.0030 |
| TPOP-TPOP(-1) | -1.652573 | 1.090000 | -1.516122 | 0.1437 |
| CUM-CUM(-1) | 0.013884 | 0.025656 | 0.541159 | 0.5938 |
| SZM-SZM(-1) | 0.028539 | 0.034063 | 0.837842 | 0.4111 |
| C | 1997.183 | 1579.506 | 1.2435 | 0.2193 |
| R-squared | 0.845448 | Mean dependent var | 1730.672 | |
| Adjusted R-squared | 0.803298 | S.D. dependent var | 2725.660 | |
| S.E. of regression | 1208.860 | Akaike info criterion | 17.23925 | |
| Sum squared resid | 32149561 | Schwarz criterion | 17.56929 | |
| Log likelihood | -242.9691 | Hannan-Quinn criter. | 17.34261 | |
| F-statistic | 20.05787 | Durbin-Watson stat | 0.856774 | |
| Prob(F-statistic) | 0.000000 | |||
逐步回归:第一步
| 变量 | nz | gz | jzz | tpop | cum | szm |
| 参数估计 | 1.454186 | 0.417628 | 3.186851 | 0.8297 | 0.332292 | 0.11153 |
| t统计量 | 12.40398 | 20.19779 | 22.67733 | 6.206025 | 16.38246 | 0.320338 |
| 可绝系数 | 0.846034 | 0.935773 | 0.9483 | 0.579041 | 0.905528 | 0.003651 |
第二步:
| 变量 | nz | gz | jjz | tpop | cum | szm | 调整的可绝系数 |
| jjz,nz | -1.709 (-9.716) | 6.662 (18.302) | 0.988 | ||||
| jjz,gz | 0.163 (2.231) | 1.984 (3.575) | 0.953 | ||||
| jjz,tpop | 4.086 (20.259) | -0.348 (-5.163) | 0.721 | ||||
| jjz,cum | 3.740 (4.834) | -0.060 (-0.727) | 0.946 | ||||
| jjz,szm | 3.233 (24.376) | -0.171 (-2.279) | 0.954 |
但是之后的回归结果均不理想,无法再引入新的变量,因此回归结果为:
