习题参
潘省初
第一章 绪论
1.1 试列出计量经济分析的主要步骤。
一般说来,计量经济分析按照以下步骤进行:
(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据
(4)估计参数 (5)假设检验 (6)预测和分析
1.2 计量经济模型中为何要包括扰动项?
为了使模型更现实,我们有必要在模型中引进扰动项u来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3什么是时间序列和横截面数据? 试举例说明二者的区别。
时间序列数据
时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4估计量和估计值有何区别?
估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如就是一个估计量,。现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为。
第二章 计量经济分析的统计学基础
2.1 略,参考教材。
2.2请用例2.2中的数据求北京男生平均身高的99%置信区间
==1.25
用 =0.05,N-1=15个自由度查表得=2.947,故99%置信限为
=174±2.947×1.25=174±3.684
也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。
2.3 25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体?
原假设
备择假设
检验统计量
查表 因为Z= 5 >,故拒绝原假设, 即
此样本不是取自一个均值为120元、标准差为10元的正态总体。
2.4 某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500元,在下一个月份中,取出16个这种食品店的一个样本,其月平均销售额为2600元,销售额的标准差为480元。试问能否得出结论,从上次调查以来,平均月销售额已经发生了变化?
原假设 :
备择假设 :
查表得 因为t = 0.83 <, 故接受原假
设,即从上次调查以来,平均月销售额没有发生变化。
第三章 双变量线性回归模型
3.1 判断题(说明对错;如果错误,则予以更正)
(1)OLS法是使残差平方和最小化的估计方法。对
(2)计算OLS估计值无需古典线性回归模型的基本假定。对
(3)若线性回归模型满足假设条件(1)~(4),但扰动项不服从正态分布,则尽管OLS估计量不再是BLUE,但仍为无偏估计量。错
只要线性回归模型满足假设条件(1)~(4),OLS估计量就是BLUE。
(4)最小二乘斜率系数的假设检验所依据的是t分布,要求的抽样分布是正态分布。对
(5)R2=TSS/ESS。错
R2 =ESS/TSS。
(6)若回归模型中无截距项,则。对
(7)若原假设未被拒绝,则它为真。错。我们可以说的是,手头的数据不允许我们拒绝原假设。
(8)在双变量回归中,的值越大,斜率系数的方差越大。错。因为,只有当保持恒定时,上述说法才正确。
3.2设和分别表示Y对X和X对Y的OLS回归中的斜率,证明
=
r为X和Y的相关系数。
证明:
3.3证明:
(1)Y的真实值与OLS拟合值有共同的均值,即;
(2)OLS残差与拟合值不相关,即。
(1)
,即Y的真实值和拟合值有共同的均值。
(2)
3.4证明本章中(3.18)和(3.19)两式:
(1)
(2)
(1)
(2)
3.5考虑下列双变量模型:
模型1:
模型2:
(1) 1和 1的OLS估计量相同吗?它们的方差相等吗?
(2) 2和 2的OLS估计量相同吗?它们的方差相等吗?
(1),注意到
由上述结果,可以看到,无论是两个截距的估计量还是它们的方差都不相同。
(2)
这表明,两个斜率的估计量和方差都相同。
3.6有人使用1980-1994年度数据,研究汇率和相对价格的关系,得到如下结果:
其中,Y=马克对美元的汇率
X=美、德两国消费者价格指数(CPI)之比,代表两国的相对价格
(1)请解释回归系数的含义;
(2)Xt的系数为负值有经济意义吗?
(3)如果我们重新定义X为德国CPI与美国CPI之比,X的符号会变化吗?为什么?
(1)斜率的值 -4.318表明,在1980-1994期间,相对价格每上升一个单位,(GM/$)汇率下降约4.32个单位。也就是说,美元贬值。截距项6.682的含义是,如果相对价格为0,1美元可兑换6.682马克。当然,这一解释没有经济意义。
(2)斜率系数为负符合经济理论和常识,因为如果美国价格上升快于德国,则美国消费者将倾向于买德国货,这就增大了对马克的需求,导致马克的升值。
(3)在这种情况下,斜率系数被预期为正数,因为,德国CPI相对于美国CPI越高,德国相对的通货膨胀就越高,这将导致美元对马克升值。
3.7随机调查200位男性的身高和体重,并用体重对身高进行回归,结果如下:
其中Weight的单位是磅(lb),Height的单位是厘米(cm)。
(1)当身高分别为177.67cm、1.98cm、187.82cm时,对应的体重的拟合值为多少?
(2)假设在一年中某人身高增高了3.81cm,此人体重增加了多少?
(1)
(2)
3.8设有10名工人的数据如下:
X 10 7 10 5 8 8 6 7 9 10
Y 11 10 12 6 10 7 9 10 11 10
其中 X=劳动工时, Y=产量
(1)试估计Y=α+βX + u(要求列出计算表格);
(2)提供回归结果(按标准格式)并适当说明;
(3)检验原假设β=1.0。
(1)
序号 | Yt | Xt | ||||||
1 | 11 | 10 | 1.4 | 2 | 2.8 | 4 | 1.96 | 100 |
2 | 10 | 7 | 0.4 | -1 | -0.4 | 1 | 0.16 | 49 |
3 | 12 | 10 | 2.4 | 2 | 4.8 | 4 | 5.76 | 100 |
4 | 6 | 5 | -3.6 | -3 | 10.8 | 9 | 12.96 | 25 |
5 | 10 | 8 | 0.4 | 0 | 0 | 0 | 0.16 | |
6 | 7 | 8 | -2.6 | 0 | 0 | 0 | 6.76 | |
7 | 9 | 6 | -0.6 | -2 | 1.2 | 4 | 0.36 | 36 |
8 | 10 | 7 | 0.4 | -1 | -0.4 | 1 | 0.16 | 49 |
9 | 11 | 9 | 1.4 | 1 | 1.4 | 1 | 1.96 | 81 |
10 | 10 | 10 | 0.4 | 2 | 0.8 | 4 | 0.16 | 100 |
∑ | 96 | 80 | 0 | 0 | 21 | 28 | 30.4 | 668 |
估计方程为:
(2)
回归结果为(括号中数字为t值):
R2=0.518
(1.73) (2.93)
说明:
Xt的系数符号为正,符合理论预期,0.75表明劳动工时增加一个单位,产量增加0.75个单位,
拟合情况。 R2为0.518,作为横截面数据,拟合情况还可以.
系数的显著性。斜率系数的t值为2.93,表明该系数显著异于0,即Xt对Yt有影响.
(3) 原假设 :
备择假设 :
检验统计量
查t表, ,因为│t│= 0.978 < 2.306 ,
故接受原假设:。
3.9用12对观测值估计出的消费函数为Y=10.0+0.90X,且已知=0.01, =200, =4000,试预测当X=250时Y的值,并求Y的95%置信区间。
对于x0=250 ,点预测值 =10+0.90*250=235.0
的95%置信区间为:
即 234.71 - 235.29。也就是说,我们有95%的把握预测将位于234.71 至235.29 之间.
3.10设有某变量(Y)和变量(X)1995—1999年的数据如下:
X | 6 | 11 | 17 | 8 | 13 |
Y | 1 | 3 | 5 | 2 | 4 |
(2)
(3) 试预测X=10时Y的值,并求Y的95%置信区间。
(1)列表计算如下:
序号 | Yt | Xt | ||||||
1 | 1 | 6 | -2 | -5 | 10 | 25 | 4 | 36 |
2 | 3 | 11 | 0 | 0 | 0 | 0 | 0 | 121 |
3 | 5 | 17 | 2 | 6 | 12 | 36 | 4 | 2 |
4 | 2 | 8 | -1 | -3 | 3 | 9 | 1 | |
5 | 4 | 13 | 1 | 2 | 2 | 4 | 1 | 169 |
∑ | 15 | 55 | 0 | 0 | 27 | 74 | 10 | 679 |
我们有:
(2)
(3) 对于=10 ,点预测值 =-1.015+0.365*10=2.635
的95%置信区间为:
=
即 1.5 -3.099,也就是说,我们有95%的把握预测将位于1.865 至3.405 之间.
3.11根据上题的数据及回归结果,现有一对新观测值X=20,Y=7.62,试问它们是否可能来自产生样本数据的同一总体?
问题可化为“预测误差是否显著地大?”
当X0 =20时,
预测误差
原假设:
备择假设:
检验:
若为真,则
对于5-2=3个自由度,查表得5%显著性水平检验的t临界值为:
结论:
由于
故拒绝原假设,接受备则假设H1,即新观测值与样本观测值来自不同的总体。
3.12有人估计消费函数,得到如下结果(括号中数字为t值):
= 15 + 0.81 =0.98
(2.7) (6.5) n=19
(1)检验原假设:=0(取显著性水平为5%)
(2)计算参数估计值的标准误差;
(3) 求的95%置信区间,这个区间包括0吗?
(1)原假设 备择假设
检验统计量
查t表,在5%显著水平下 ,因为t=6.5>2.11
故拒绝原假设,即,说明收入对消费有显著的影响。
(2)由回归结果,立即可得:
(3) 的95%置信区间为:
3.13 回归之前先对数据进行处理。把名义数据转换为实际数据,公式如下:
人均消费C=C/P*100(价格指数)
人均可支配收入Y=[Yr*rpop/100+Yu*(1-rpop/100)]/P*100
农村人均消费Cr=Cr/Pr*100 城镇人均消费Cu=Cu/Pu*100
农村人均纯收入Yr=Yr/Pr*100 城镇人均可支配收入Yu=Yu/Pu*100
处理好的数据如下表所示:
年份 | C | Y | Cr | Cu | Yr | Yu |
1985 | 401.78 | 478.57 | 317.42 | 673.20 | 397.60 | 739.10 |
1986 | 436.93 | 507.48 | 336.43 | 746.66 | 399.43 | 840.71 |
1987 | 456.14 | 524.26 | 353.41 | 759.84 | 410.47 | 861.05 |
1988 | 470.23 | 522.22 | 360.02 | 785.96 | 411.56 | 841.08 |
19 | 444.72 | 502.13 | 339.06 | 741.38 | 380.94 | 842.24 |
1990 | 4.88 | 547.15 | 354.11 | 773.09 | 415.69 | 912.92 |
1991 | 491. | 568.03 | 366.96 | 836.27 | 419.54 | 978.23 |
1992 | 516.77 | 620.43 | 372.86 | 885.34 | 443.44 | 1073.28 |
1993 | 550.41 | 665.81 | 382.91 | 962.85 | 458.51 | 1175.69 |
1994 | 596.23 | 723.96 | 410.00 | 1040.37 | 492.34 | 1275.67 |
1995 | 6.35 | 780.49 | 449.68 | 1105.08 | 541.42 | 1337.94 |
1996 | 6.69 | 848.30 | 500.03 | 1125.36 | 612.63 | 13.35 |
1997 | 711.96 | 7.63 | 501.75 | 1165.62 | 8.50 | 1437.05 |
1998 | 737.16 | 957.91 | 498.38 | 1213.57 | 677.53 | 1519.93 |
1999 | 785.69 | 1038.97 | 501.88 | 1309.90 | 703.25 | 1661.60 |
2000 | 854.25 | 1103.88 | 531. | 1407.33 | 717. | 1768.31 |
2001 | 910.11 | 1198.27 | 550.11 | 1484.62 | 747.68 | 1918.23 |
2002 | 1032.78 | 1344.27 | 581.95 | 1703.24 | 785.41 | 2175.79 |
2003 | 1114.40 | 1467.11 | 606.90 | 1822.63 | 818.93 | 2371.65 |
= 90.93 + 0.692 R2=0.997
t: (11.45) (74.82) DW=1.15
农村: = 106.41 + 0.60 R2=0.979
t: (8.82) (28.42) DW=0.76
城镇: = 106.41 + 0.71 R2=0.998
t: (13.74) (91.06) DW=2.02
从回归结果来看,三个方程的R2都很高,说明人均可支配收入较好地解释了人均消费支出。
三个消费模型中,可支配收入对人均消费的影响均是显著的,并且都大于0小于1,符合经济理论。而斜率系数最大的是城镇的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。说明城镇居民的边际消费倾向高于农村居民。
第四章 多元线性回归模型
4.1 应采用(1),因为由(2)和(3)的回归结果可知,除X1外,其余解释变量的系数均不显著。(检验过程略)
4.2 (1) 斜率系数含义如下:
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入不变的情况下, 引起年净收益上升0.273%.
0.733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%.
拟合情况:,表明模型拟合程度较高.
(2) 原假设
备择假设
检验统计量
查表, 因为t=2.022<,故接受原假设,即不显著异于0, 表明土地投入变动对年净收益变动没有显著的影响.
原假设
备择假设
检验统计量
查表, 因为t=5.8>,故拒绝原假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响.
(3) 原假设
备择假设: 原假设不成立
检验统计量
查表,在5%显著水平下 因为F=47>5.14,故拒绝原假设。
结论,:土地投入和资金投入变动作为一个整体对年净收益变动有影响.
4.3 检验两个时期是否有显著结构变化,可分别检验方程中D和D•X的系数是否显著异于0.
(1) 原假设 备择假设
检验统计量
查表 因为t=3.155>, 故拒绝原假设, 即显著异于0。
(2) 原假设 备择假设
检验统计量
查表 因为|t|=3.155>, 故拒绝原假设, 即显著异于0。
结论:两个时期有显著的结构性变化。
4.4 (1)
(2)变量、参数皆非线性,无法将模型转化为线性模型。
(3)变量、参数皆非线性,但可转化为线性模型。
取倒数得:
把1移到左边,取对数为:,令
4.5 (1)截距项为-58.9,在此没有什么意义。X1的系数表明在其它条件不变时,个人年消费量增加1百万美元,某国对进口的需求平均增加20万美元。X2的系数表明在其它条件不变时,进口商品与国内商品的比价增加1单位,某国对进口的需求平均减少10万美元。
(2)Y的总变差中被回归方程解释的部分为96%,未被回归方程解释的部分为4%。
(3)检验全部斜率系数均为0的原假设。
=
由于F=192 F0.05(2,16)=3.63,故拒绝原假设,回归方程很好地解释了应变量Y。
(4)A. 原假设H0:β1= 0 备择假设H1:β1 0
t0.025(16)=2.12,
故拒绝原假设,β1显著异于零,说明个人消费支出(X1)对进口需求有解释作用,这个变量应该留在模型中。
B. 原假设H0:β2=0 备择假设H1:β2 0
4.6(1)弹性为-1.34,它统计上异于0,因为在弹性系数真值为0的原假设下的t值为: 得到这样一个t值的概率(P值)极低。可是,该弹性系数不显著异于-1,因为在弹性真值为-1的原假设下,t值为: 这个t值在统计上是不显著的。 (2)收入弹性虽然为正,但并非统计上异于0,因为t值小于1()。 (3)由,可推出 本题中,=0.27,n=46,k=2,代入上式,得=0.3026。 4.7 (1)薪金和每个解释变量之间应是正相关的,因而各解释变量系数都应为正,估计结果确实如此。 系数0.280的含义是,其它变量不变的情况下,CEO薪金关于销售额的弹性为0.28; 系数0.0174的含义是,其它变量不变的情况下,如果股本收益率上升一个百分点(注意,不是1%),CEO薪金的上升约为1.07%; 与此类似,其它变量不变的情况下,公司股票收益上升一个单位,CEO薪金上升0.024%。 (2)用回归结果中的各系数估计值分别除以相应的标准误差,得到4个系数的t值分别为:13.5、8、4.25和0.44。用经验法则容易看出,前三个系数是统计上高度显著的,而最后一个是不显著的。 (3)R2=0.283,拟合不理想,即便是横截面数据,也不理想。 4.8 (1)2.4%。 (2)因为Dt和(Dt t)的系数都是高度显著的,因而两时期人口的水平和增长率都不相同。1972-1977年间增长率为1.5%,1978-1992年间增长率为2.6%(=1.5%+1.1%)。 4.9 原假设H0: β1 =β2,β3 =1.0 备择假设H1: H0不成立 若H0成立,则正确的模型是: 据此进行有约束回归,得到残差平方和。 若H1为真,则正确的模型是原模型: 据此进行无约束回归(全回归),得到残差平方和S。 检验统计量是: ~F(g,n-K-1) 用自由度(2,n-3-1)查F分布表,5%显著性水平下,得到FC , 如果F< FC, 则接受原假设H0,即β1 =β2,β3 =0; 如果F> FC, 则拒绝原假设H0,接受备择假设H1。 4.10 (1)2个, (2)4个, 4.11 4.12 对数据处理如下: lngdp=ln(gdp/p) lnk=ln(k/p) lnL=ln(L/P) 对模型两边取对数,则有 lnY=lnA+ lnK+ lnL+lnv 用处理后的数据回归,结果如下: t:(-0.95) (16.46) (3.13) 由修正决定系数可知,方程的拟合程度很高;资本和劳动力的斜率系数均显著(tc=2.048), 资本投入增加1%,gdp增加0.96%,劳动投入增加1%,gdp增加0.18%,产出的资本弹性是产出的劳动弹性的5.33倍。 第五章 模型的建立与估计中的问题及对策 5.1 (1)对 (2)对 (3)错 即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。 (4)对 (5)错 在扰动项自相关的情况下OLS估计量仍为无偏估计量,但不再具有最小方差的性质,即不是BLUE。 (6)对 (7)错 模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。 (8)错。 在多重共线性的情况下,尽管全部“斜率”系数各自经t检验都不显著, R2值仍可能高。 (9)错。 存在异方差的情况下,OLS法通常会高估系数估计量的标准误差,但不总是。 (10)错。 异方差性是关于扰动项的方差,而不是关于解释变量的方差。 5.2 对模型两边取对数,有 lnYt=lnY0+t*ln(1+r)+lnut , 令LY=lnYt,a=lnY0,b=ln(1+r),v=lnut,模型线性化为: LY=a+bt+v 估计出b之后,就可以求出样本期内的年均增长率r了。 5.3(1)DW=0.81,查表(n=21,k=3,α=5%)得dL=1.026。 DW=0.81<1.026 结论:存在正自相关。 (2)DW=2.25,则DW´=4 – 2.25 = 1.75 查表(n=15, k=2, α=5%)得du =1.543。 1.543<DW´= 1.75 <2 结论:无自相关。 (3)DW= 1.56,查表(n=30, k=5, α=5%)得dL =1.071, du =1.833。 1.071<DW= 1.56 <1.833 结论:无法判断是否存在自相关。 5.4 (1)横截面数据. (2)不能采用OLS法进行估计,由于各个县经济实力差距大,可能存在异方差性。 (3)GLS法或WLS法。 5.5 (1)可能存在多重共线性。因为①X3的系数符号不符合实际.②R2很高,但解释变量的t值低:t2=0.9415/0.8229=1.144, t3=0.0424/0.0807=0.525. 解决方法:可考虑增加观测值或去掉解释变量X3. (2)DW=0.8252, 查表(n=16,k=1,α=5%)得dL=1.106. DW=0.8252< dL=1.106 结论:存在自相关. 单纯消除自相关,可考虑用科克伦-奥克特法或希尔德雷斯-卢法;进一步研究,由于此模型拟合度不高,结合实际,模型自相关有可能由模型误设定引起,即可能漏掉了相关的解释变量,可增加相关解释变量来消除自相关。 5.6 存在完全多重共线性问题。因为年龄、学龄与工龄之间大致存在如下的关系:Ai=7+Si+Ei 解决办法:从模型中去掉解释变量A,就消除了完全多重共线性问题。 5.7 (1)若采用普通最小二乘法估计销售量对广告宣传费用的回归方程,则系数的估计量是无偏的,但不再是有效的,也不是一致的。 (2)应用GLS法。设原模型为 (1) 由于已知该行业中有一半的公司比另一半公司大,且已假定大公司的误差项方差是小公司误差项方差的两倍,则有,其中。则模型可变换为 (2) 此模型的扰动项已满足同方差性的条件,因而可以应用OLS法进行估计。 (3)可以。对变换后的模型(2)用戈德弗尔德-匡特检验法进行异方差性检验。如果模型没有异方差性,则表明对原扰动项的方差的假定是正确的;如果模型还有异方差性,则表明对原扰动项的方差的假定是错误的,应重新设定。 5.8(1)不能。因为第3个解释变量()是和的线性组合,存在完全多重共线性问题。 (2)重新设定模型为 我们可以估计出,但无法估计出。 (3)所有参数都可以估计,因为不再存在完全共线性。 (4)同(3)。 5.9(1)R2很高,logK的符号不对,其 t值也偏低,这意味着可能存在多重共线性。 (2)logK系数的预期符号为正,因为资本应该对产出有正向影响。但这里估计出的符号为负,是多重共线性所致。 (3)时间趋势变量常常被用于代表技术进步。(1)式中,0.047的含义是,在样本期内,平均而言,实际产出的年增长率大约为4.7%。 (4)此方程隐含着规模收益不变的约束,即 + =1,这样变换模型,旨在减缓多重共线性问题。 (5)资本-劳动比率的系数统计上不显著,看起来多重共线性问题仍没有得到解决。 (6)两式中R2是不可比的,因为两式中因变量不同。 5.10(1)所作的假定是:扰动项的方差与GNP的平方成正比。模型的估计者应该是对数据进行研究后观察到这种关系的,也可能用格里瑟法对异方差性形式进行了实验。 (2)结果基本相同。第二个模型三个参数中的两个的标准误差比第一个模型低,可以认为是改善了第一个模型存在的异方差性问题。 5.11 我们有 原假设H0: 备则假设H1: 检验统计量为: 用自由度(25,25)查F表,5%显著性水平下,临界值为:Fc=1.97。 因为F=2.5454>Fc=1.97,故拒绝原假设原假设H0:。 结论:存在异方差性。 5.12 将模型变换为: 若、为已知,则可直接估计(2)式。一般情况下,、为未知,因此需要先估计它们。首先用OLS法估计原模型(1)式,得到残差et,然后估计: 其中为误差项。用得到的和的估计值和生成 令,用OLS法估计 即可得到和,从而得到原模型(1)的系数估计值和。 5.13 (1)全国居民人均消费支出方程: = 90.93 + 0.692 R2=0.997 t: (11.45) (74.82) DW=1.15 DW=1.15,查表(n=19,k=1,α=5%)得dL=1.18。 DW=1.15<1.18 结论:存在正自相关。可对原模型进行如下变换: Ct -ρCt-1 = α(1-ρ)+β(Yt-ρYt-1)+(ut -ρut -1) 由 令:C t= Ct –0.425Ct-1 , Y t= Yt-0.425Yt-1 ,α’=0.575α 然后估计 C t=α +βY t + εt ,结果如下: = 55.57 + 0.688 R2=0.994 t:(11.45) (74.82) DW=1.97 DW=1.97,查表(n=19,k=1,α=5%)得du=1.401。 DW=1.97>1.18,故模型已不存在自相关。 (2)农村居民人均消费支出模型: 农村: = 106.41 + 0.60 R2=0.979 t: (8.82) (28.42) DW=0.76 DW=0.76,查表(n=19,k=1,α=5%)得dL=1.18。 DW=0.76<1.18,故存在自相关。 解决方法与(1)同,略。 (3)城镇: = 106.41 + 0.71 R2=0.998 t: (13.74) (91.06) DW=2.02 DW=2.02,非常接近2,无自相关。 5.14 (1)用表中的数据回归,得到如下结果: =54.19 + 0.061X1 + 1.98*X2 + 0.03X3 - 0.06X4 R2=0.91 t: (1.41) (1.58) (3.81) (1.14) (-1.78) 根据tc(α=0.05,n-k-1=26)=2.056,只有X2的系数显著。 (2)理论上看,有效灌溉面积、农作物总播种面积是农业总产值的重要正向影响因素。在一定范围内,随着有效灌溉面积、播种面积的增加,农业总产值会相应增加。受灾面积与农业总产值呈反向关系,也应有一定的影响。而从模型看,这些因素都没显著影响。这是为什么呢? 这是因为变量有效灌溉面积、施肥量与播种面积间有较强的相关性,所以方程存在多重共线性。现在我们看看各解释变量间的相关性,相关系数矩阵如下: X1 X2 X3 X4 X2 X3 X4 表中r12=0.6,r13=0.5,说明施肥量与有效灌溉面积和播种面积间高度相关。 我们可以通过对变量X2的变换来消除多重共线性。令X22=X2/X3(公斤/亩),这样就大大降低了施肥量与面积之间的相关性,用变量X22代替X2,对模型重新回归,结果如下: =-233.62 + 0.088X1 + 13.66*X2 + 0.096X3 - 0.099X4 R2=0.91 t: (-3.10) (2.48) (3.91) (4.77) (-3.19) 从回归结果的t值可以看出,现在各个变量都已通过显著性检验,说明多重共线性问题基本得到解决。
X11 0.6 0.880 0.715 0.6 1 0.5 0.685 0.880 0.5 1 0.883 0.715 0.685 0.883 1