实验参与人:张世辉
200903020113
毛胜华 200903020129
1、 实验题目:农业总产值的影响因素
1、 模型设定
我们想要研究的是有关农业总产值的影响因素,通过查找相关资料和有关文献,最终选取了三个解释变量,分别是:水电设备容量、有效灌溉面积、主要农业机械总动力。
由初步的分析知,三个解释变量与被解释变量是正相关的。由此设定模型:
Y=
其中:Y=农业总产值(亿元)
X1=水电设备容量(千瓦)
X2=有效灌溉面积(千公顷)
X3=主要农业机械总动力(万千瓦)。
解释变量的系数的预期为正。
数据来源于《中国统计年鉴2009》,选取了1990~2008年间的各项数据。
在试验中,我运用计量经济学的方法对上述模型所存在的问题进行研究。
2、Y与X1、X2、X3的散点图
①Y与X1的散点图
②Y与X2的散点图
③Y与X3的散点图
3、原始回归报告
= -76800.9252 + 0.0005299500849×X1 + 1.803170688×X2 - 0.3695497913×X3
(-1.719309)(1.657607)(1.658483)(-0.0416)
R2=0.926347 2=0.911616 SE=14.745 F=62.88574 D-W=0.604840 N=19 =1683.525 =14168.54 nh=0.1183该模型回归估计的判决系数R2较高,方程较为显著,但是从考虑拟合程度,方程的拟合程度并不高。三个解释变量的系数为正数,与预期一致,通过经济学意义检验。但三个解释变量参数的个别检验均通不过T-检验,三个解释变量参数的联合检验通过F-检验,说明三个变量对被解释变量的联合影响显著。因此可能存在多重共线性问题。而D-W值显示可能有自相关问题。
2、 针对该模型的各项试验
(1) 多重共线性
1、 检验
查找X1、X2、X3的相关系数得到相关数据:
可以看出三个解释变量之间存在严重的严格线性相关关系,通过计算VIF值得:vif=83.45可以判定该模型存在多重共线性问题,且情况严重。
2、 实验
进行岭回归估计实验,在实验过程中取试探性的选取λ=0,
0.01……0.18,计算相应的,i=1,2,……19,观察岭迹图。
1 与λ的散点图
2 与λ的散点图
3 与λ的散点图
经图形提醒,选择共同平缓的区段中的第十二个点,即:λ=0.12,进行计算,算出=-28737.76。得到岭回归函数:
=-28737.76+0.000167×X1+0.626987×X2+0.105469×X3
考虑拟合程度:=1723.06 =14168.54 nh=0.1216
方程拟合有所下降,但是拟合损失较小,可以接受。
(2) 异方差问题
1、 检验
①图形法:
由此图,可知模型可能没有异方差问题。此外,该模型的
(X ji,Y i)散点图并没有显著呈现喇叭形收缩或扩大。
②等级相关检验
由于本模型中,各个解释变量呈现随时间递增,因此计算统计量:T j==-1.1837,进行T-检验,=1.753, T j<。未通过T-检验,模型无异方差问题。
③F检验
计算统计量:F=或F= 得F=1.138。=2.43,F<,未通过F检验,模型无异方差问题。(本模型为小样本模型,此处只是练习)
(3) 自相关问题
1、 检验
①图示法
散点图:(t,e t) (e(-1),e)
两个图形均提示模型可能存在正的自相关。
②D-W检验
查D-W表得:d l=0.97,d u=1.69,模型D-W=0.604840落于下界,因此存在正的自相关。
③连贯检验
查连贯表得N a=5,由于LN=4, LN ①公式法 由于本模型数据N<30,所以采用小样本公式法。计算==0.776308347826087,经过方程变换,得到(~)模型,做OLS估计得到原模型的广义最小平方估计报告: = 1030.984214+ 8.9506181e-006×- 0.1586093905×+ 0.3977872885× (0.592769)(0.055525)(-1.9276)(2.875811) R2=0.705821 2=0.6985 SE=1205.331 D- W=0.917518 =665.4622 =4218.835 nh=0.157735850084868 由此报告可知,在处理自相关问题后,拟合程度下降,且下降幅度低于5%,拟合损失能接受,X2、X3的T-检验的显著性明显提高,而X1依然通不过T-检验,同时D-W=0.917518,此方法依然没有解决自相关问题。 ② 回归法 由,得到==0.723356,经过方程变换,得到(~)模型,做OLS估计得到原模型的广义最小平方估计报告: = -34405.84214 + 0.0001179937693×+ 0.6993525311× + 0.1733839869×(-0.931243) (0.5885) (0.7801) (0.604974) R2=0.767094 2=0.720513 SE=1206.265 D-W=0.759727 =7.069 =4906.611 nh=0.131877333675679 由此报告可知,在处理自相关问题后,拟合程度下降,但下降幅度低于5%,拟合损失能接受,且与公式法相比,拟合程度有所提高,但X1、X2、X3依然通不过T-检验,同时D-W=0.759727,此方法依然没有解决自相关问题。 ③Durbin两步法 由,得到=0.825003。经过方程变换,得到(~)模型,做OLS估计得到原模型的广义最小平方估计报告: = 836.0112062 + 6.9564728e-006× + 0.1576603657× + 0.40461212× (0.478840) (0.043946) (0.043946) (2.850007) R2=0.634415 2=0.561298 SE=1199.098 D- W=0.952735 =550.8468 =3583.769 nh=0.1537006814719 由此报告可知,在处理自相关问题后,拟合程度下降,但下降幅度低于5%,拟合损失能接受, X3的T-检验的显著性明显提高,而X1、X2依然通不过T-检验,同时D-W=0.952735,仍然存在正的自相关,此方法依然没有解决自相关问题。 ④广义差分变换 = -26779.90918 + 8.811743607e-005×+ 0.5226611444× + 0.23074146× (-0.520872) (0.432255) (0.435875) (0.6848) + [AR(1)=0.8429665666] (3.918377) R2=0.967584 2=0.957610 SE=12.773 D-W=0.867393 =998.505 =14680.44 nh=0.13847 广义差分变换在拟合程度有所损失,但下降幅度低于5%,拟合损失能接受,但是X1、X2、X3依然没有通过T-检验,而且D-W值很低,仍然存在正的自相关,自相关问题没有得到解决。 分析:该模型的自相关问题并没有得到很好的解决,主要原因是模型在选择时不谨慎,以及自相关问题得不一定能解决性。 (4) 引入虚拟变量 1、 检验 由(X ji,Y i)散点图可以看出,本模型应采用三段定点引入虚拟变量。 定点介入虚拟变量:D T= G t= 得到新的模型:,做OLS估计,得到回归报告: = -4905.137403 - 0.0009861163077×X1 + 0.001794521716×X11 - 0.0006028128422×X12 (-0.172503) (-1.354105) (1.948332) (-1.280200) - 0.5005262513×X2 + 1.152463249×X21 + 1.14719824×X22 + 1.653380835×X3 – (-0.735277) (1.069376) (1.577283) (4.842408) 2.217585656×X31 + 0.61140748×X32 (-3.792772) (2.061553) R2=0.998004 2=0.996009 SE=402.6338 D-W=2.602511 F=500.1160 =317.6 =14168.54 nh=0.019558 小组式: =- 0.0009861163077×X1- 0.5005262513×X2+ 1.653380835×X3 t<7 =-66.34872+0.000808405409×X1+0.651936997×X2-0.5204821×X3 7≦t<11 =-85510.32702-0.001411218251×X1+1.799135237×X2+0.0471023×X3 11≦t 在进行了虚拟变量试验后,回归估计的判决系数R2显著提高,从角度考虑的拟合程度也显著提高,并且拟合程度很好,各项统计指标明显好转,D-W值显示方程没有自相关问题。但有解释变量通不过T-检验,在完成介入虚拟变量后依然存在多重公共线性问题。