
| 编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 货运总量y(万吨) | 160 | 260 | 210 | 265 | 240 | 220 | 275 | 160 | 275 | 250 |
| 工业总产值x1(亿元) | 70 | 75 | 65 | 74 | 72 | 68 | 78 | 66 | 70 | 65 |
| 农业总产值x2(亿元) | 35 | 40 | 40 | 42 | 38 | 45 | 42 | 36 | 44 | 42 |
| 居民非商品支出x3(亿元) | 1.0 | 2.4 | 2.0 | 3.0 | 1.2 | 1.5 | 4.0 | 2.0 | 3.2 | 3.0 |
所以y,,,的相关系数矩阵为:
(2)求y关于,,的三元线性回归方程。
由系数表可以知道,y关于,,的三元线性回归方程为:
(3)对所求得的方程作拟合优度检验。
由模型汇总可知,样本的决定系数为0.806,所以可以认为回归方程为样本观测值的拟合程度较好,即回归方程的显著性较高。
(4)对回归方程作显著性检验。
对方差分析表可以知道p值为0.015<0.05 说明自变量,,对因变量y产生的线性影响较显著。而F=8.283>时,就拒绝原假设,认为在显著性水平0.05下,y与,,有显著的线性关系,即回归方程是显著的。
(5)对每一个回归系数作显著性检验。
由系数表可以知道,,的P值分别为0.1和0.049说明回归系数较显著,的P值为0.284>0.05说明的回归系数不显著,应该予以剔除。
(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,作回归方程的显著性检验和回归系数的显著性检验。
由系数表可以知道,重新建立的回归方程:
由方差分析表可知,P值为0.07说明自变量,对因变量y产生的线性影响较显著。
由系数表可知,此时各个回归系数的P值均很小,说明回归系数的显著性较高。
(7)求出每一个回归系数的置信水平为95%的置信区间。
由上表可知,的系数的95%的置信区间为(0.381,8.970)
的系数的95%的置信区间为(3.134,14.808)
(8)求标准化回归方程。
由系数表可知,标准化后的回归方程为
(9)求当=75,=42,=3.1时的,给定置信水平为95%,用SPSS软件计算精确置信区间,手工计算近似预测区间。
由上表可知,=267.8 的置信水平为95%的置信区间为(260.055,334.12038)
的置信水平为95%的近似区间估计为(241.63377,298.54556)
(10)结合回归方程对问题作一些基本分析。
对于前面的分析,虽然R方的值蛮大的,但这并不能说明回归方程显著,此时还需要通过对回归方程以及回归方程系数进行检验。
当一个回归方程通过显著性检验之后,并不能说明这个方程中所以自变量都对因变量y有显著影响,因此还需对回归系数进行检验。
