
)))基于虚拟变量模型分析
s邓楠婷杨新竹孙一迪李佳西南财经大学统计学院
=摘要>自从上世纪90年代以来,我国旅游业迅速发展,国内旅游消费支出从1994年的1023.51亿元人民币增加到2008年的8749.30亿元人民币,其中城镇居民的从848.21亿元增加到5971.75;旅游人数从524百万人次增加到1712百万人次,其中城镇居民204.55百万人次增加到703百万人次;从人均花费从195.33元增加到511.03,其中城镇居民从414.67元增加到849.36元,高于平均水平。我们小组认为城镇居民较农村居民更有闲暇时间及消费能力,因而我们对城镇居民旅游情况进行定量分析。本文中采用的数据来源于2009中国统计年鉴。
=关键词>国内旅游城镇居民消费支出计量经济学模型
一、引言
改革开放以来,我国整体经济有了飞跃式的发展。在社会和平的背景下,人们的生活水平得到了大幅度的提高,可支配收入也有显著的增加。在忙碌的工作过后,人们也愿意花费手中的余钱去各地旅游,带来了旅游业的快速发展。虽然农村居民旅游总人数大于城镇居民旅游总人数,但是城镇居民人均花费却高于农村居民人均花费及总人均消费,因此城镇居民在国内旅游市场中占有十分重要的角色。我们对城镇居民的旅游消费进行模型分析,同时也是对国内旅游情况的概览。
二、影响因素分析
1.城镇居民家庭人均可支配收入。城镇居民的人均可支配收入影响着他们的消费情况,是研究其各类型消费水平的基本数据。可支配收入越多,相应的消费也就越多。
2.城镇居民消费水平。城镇居民消费水平体现的是居民对消费的一种态度,代表着居民消费的整体状况。
3.旅客平均运输长度。这一指标代表的是所有出行者旅行距离的平均情况,其中包含着公路、铁路、航空、水运这四个方面。距离越远,相应的,也就意味着在旅游这项消费投入的费用越大。
4.闲暇时间。自1999年起,国家变更了国家年节及纪念日放假办法,这一新条例的实行产生了三个分别长为一周的/黄金周0假日。/黄金周0的出台为各地居民出门旅游提供了更多可以自由安排的时间,给大家了旅游的机遇。同时,在/五一0、/十一0、/春节0三个时间集中的假日,人们有了较长的时间进行中长距离的旅行,走得更远,去更多的景点。总的来说,/黄金周0的实行为我国旅游业的发展起到了不可忽视的促进作用。
三、指标与模型选择
本研究中被解释变量是城镇居内旅游人均花费(Y)。解释变量的选择,也就是影响国内城镇人均旅游花费的主要因素我们初步选择了以上四个)))城镇居民家庭人均可支配收入(X1)、城镇居民消费水平(X2)、旅客平均运输长度(X3)、闲暇时间(D1,虚拟变量,1999年起我国开始实行/黄金周0长假制度,故1999年之前设定为基础类型0, 1999之后设定为1).
确定模型:Y=A1+B1X1+B2X2+B3X3+A2D1+ut
其中,B1、B2、B3为待估参数,ut为随机扰动项
四、数据
我们收集到的1994~2008年的相关数据(见表1)
表1:国内城镇旅游人均花费(Y)、城镇居民家庭人均可支配收入(X1)、城镇居民消费水平(X2)、旅客平均运输长度(X3)、闲暇时间(D1) =回归结果及其含义>
Dependent Vari ab le:Y
M et hod:Least Squares
Date:12/05/09T i m e:14:23
Sa m p l e:19942008
I n cl uded observati on s:15
年份Y X1X2X3D1
1994414.673496.2103.1790
19954.024283106.8770
1996534.14838.9114.5740
1997599.85160.3103.175.827810
199********.1101.277.149260
1999614.85854.02105.1811
2000678.66280104.582.91
2001708.36859.6104.585.750031
2002739.77702.8105.2881
2003684.98472.2100.3871
2004731.421.6103.492.271
2005737.110493107.694.571
2006766.411759.5108.494.840491
2007906.913785.8106.925021
2008849.361815780.76107.380.884141
(数据来源:中国统计年鉴2009)
Va ri a b le C oe fficient Std.E rr o r t-Statistic Pr o b.
C-325.3711260.5734-1.2486730.2402
X1-0.0980730.037921-2.5862470.0271
X20.
1659960.051215 3.2411440.00 X3 5.653557 2.623705 2.1547990.0566
D125.5269138.813340.6576840.5256 R-squared0.941951M ean dependent va r669.1635 Ad j u sted R-s quared0.918731S.D.dependent v ar133.7779
S.E.of reg r ess ion38.13695Aka ike info criterion10.38145
Su m squared r es i d14544.27Schw arz c riterion10.61746
L og li k e lihood-72.86085F-sta tistic40.56702 Dur bin-W atson sta t 1.707499Pr o b(F-statistic)0.000004
通过此表,t值D1、C、X3不显著,而X1与预期相反,很可能存在严重多重共线性。
=修正多重共线性>
Y分别与X1、X2、X3、D1做一元回归结果如下:
变量X1X2X3参数估计量0.0248050.035513 5.494227 t统计量4.9700205.634346 1.2075
R20.8795110.150.671424
R20.8594300.8820670.616661
其中,加入X2的方程R2最大,以X2为基础,顺次加入其他变量逐步回归,结果如下:
79
实证分析经比较,新加入X1的方程R2=0.1815,改进最大,但是,X1的t 值为负与预期的相反,这说明X1、X3引起严重多重共线性,应予剔除。
最后修正多重共线性影响的回归结果:
Dependent Vari ab le:Y
M et hod:Least Squares
Date:12/05/09T i m e:15:36
Sa m p l e:19942008
I n cl uded observati on s:15
Variable C oeffic ient Std.E r ror t-Statistic Prob.
C337.495138.946888.6655240.0000
X20.0355130.0063035.6343460.0001
D186.1000634.352722.5063540.0276 R-s qua r ed0.15M e an dependent var669.1635 Adjusted R-squa r ed0.882067S.D.dependent var133.7779
S.E.of regression45.94116Aka i k e i n f o crite ri o n10.66946
Sum squared resid25327.08Schw a r z criterion10.81107
Log li k e liho od-77.02092F-statistic53.35577 Dur bin-Wa tson s tat1.729794P r ob(F-statistic)0.000001
Y^t=337.4951+0.035513X2+86.10006D1
t=(8.665524)(5.634346)(2.506354)
R2=0.15R2=0.882067F=53.35577D W=1.729794
由于各系数t值均大于2,表明各解释变量的系数显著地不等于0,城镇居民旅游人均花费额的回归模型分别为:
Y t=423.59516+0.035513X2T+E t t[1998 033051349+5..712+E t t>1998
=>
1.经济意义检验。主要是检验参数估计值的符号以及数值的大小
在经济意义上是否合理。
通过模型可以知道,城镇居民旅游消费支出与城镇居民消费水平成正相关关系,和时间成正相关关系,符合经济学的一般意义,经济检验通过。
2.统计意义检验。统计意义检验一般包括拟合优度检验、方程显著性检验(F检验)、变量显著性检验(t检验)。
首先,因为复相关系数R2=0.15,可决系数R2=0.882067,模型拟合优度较好,回归系数显著。
其次,需要进行方程显著性检验,给定显著性水平A=0.05,查F分布表,得F
0.05
(2,12)=3.。F=53.35577>F0.05(2,12)=3.,所以,拒绝原假设,即表明回归方程式高度显著的,说明变量城镇居民消费水平X2,D1整体上对Y有高度显著影响,模型通过方程显著性检验。
最后,由回归系数的显著性检验有,Constant、X2和D1的t值分别
为t
=8.665524,t1=5.634346,t2=2.506354,在显著性水平A=0.05上的情况下,查t分布表,t A/2(12)=2.179,|t|>t A/2(12),所以拒绝原假设,即包括常数项在内的3个变量都在95%的水平上显著,通过了变量的显著性检验。
3.计量经济学检验。
3.1自相关检验。建模过程中的基本假设之一是随机误差项相互
,表现为C ov(E
i
,E j)=0,其中i X,j,,i j=1,2,,,n,如果出现C ov (E,i E j)X0,其中i X,j,i j=1,2,,,n,即对于不同样本点,随机误差项之间不再是完全相互,而是存在某种相关性,也就是出现了序列相关性。采用D.W检验法来检验模型的随机误差项的自相关性,查检验表,在显著性水平为2.5%,样本容量为21,自变量个数为2的条件下dL=1.01,dU=1.41,易知满足条件d U ARCH Test: F-statistic0.3080Probab ili ty0.557482 Ob s*R-squ ared0.412252Probab ili ty0.520829 Test E qu ati on: Dependen tVari able:RE SI D^2 M ethod:Least Squ ares Date:12/05/09T i m e:17:18 Sa m p l e(ad j u sted):19952008 Incl uded ob servati ons:14after ad j u st m en ts Va ri a b le C oe fficient Std.E rr o r t-Statistic Pr o b. C1292.055569.4197 2.2690730.0425 RESI D^2(-1)0.18300.2731720.6033900.5575 R-squared0.029447M ean dependent va r1555.165 Ad j u sted R-s quared-0.051433S.D.dependent v ar1336.233 S.E.of reg r ess ion1370.165Aka ike info criterion17.41481 Su m squared r es i d2*******Schw arz c riterion17.50611 L og li k e lihood-119.9037F-sta tistic0.3080 Dur bin-W atson sta t 1.874397Pr o b(F-statistic)0.557482 从表中可以看出,nR2=0.412252,由ARCH检验知,在A=0.05下,查X2分布表,得临界值X20.05(2)=5.9915,nR2=0.412252< X20.05(2)=5.9915,同时X2和X22的t检验值不显著。所以拒绝原假设,表明模型不存在异方差。 五、结论分析及总结 通过上述模型分析及各项检验,我们不难看出解释变量一,解释变量二以及虚拟变量与被解释变量之间存在线性关系,即城镇居民家庭人均可支配收入、城镇居民消费水平以及闲暇时间在很大程度上影响着城镇居内旅游的人均花费水平。这与现实中的情况是吻合的,并且具有实际的经济意义。尽管在金融危机的影响下在08年有小幅的回落,但在全国居民的人均可支配收入与消费水平整体递增的情形下,我国的旅游业呈现出稳步上升的趋势。 而与之对应的,在模型分析中由于出现严重共线性而被剔除的解释变量三,即旅客平均运输长度,则需要在此进行分析说明。通过上文中的数据验证以及进一步的分析理解,我们发现从实际生活经验来分析,尽管旅客旅游的距离长短在交通运输费用上会对旅游消费产生一定正方向的影响,但是在现实生活与旅行中,航空公司等运输机构的淡季降价、旺季升价、团体打折以及节日活动等诸多因素都对交通运输费用产生复杂的影响,另外旅游者的习惯性消费、消费偏好等心理因素也会对其产生较大的影响。对于这些超出作者专业知识的问题希望能在其他消费心理学或行为经济学的学者的文章中找到答案。 参考文献: [1]刘文斌.关于我国国内旅游消费支出的计量经济学模型的初步研究.经济师[J]2009(8). [2]常茜、张磊.居民假日旅游消费调查.中国统计[J].2009年3月. [3]刘文彬.我国城乡居民的经济收入与旅游消费关系的定量分析.统计与决策[J]2009(10). 80 实证分析
