
| 题 目: | 影响我国财政收入的多元线性回归模型 |
财政收入按收入形式可以分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。从定性分析的角度来说,财政收入会受到各种不同因素的影响,如:农业增加值、工业增加值、建筑业增加值、社会总人口数、社会消费额总额、国土受灾面积等等。本文建立模型仅选取我国第一产业增加值、第二产业增加值(包括工业和建筑业)、第三产业增加值、社会从业人数,以及其他收入水平5个因素为解释变量,分析它们对财政收入的影响程度。
关键词:财政收入;多元线性回归;分析
影响我国财政收入的多元线性回归模型
一、提出解释变量与被解释变量
Y表示财政收入(亿元),为被解释变量;五个解释变量分别为:X1 表示第一产业增加值(亿元),X2表示第二产业增加值(亿元), X3表示第三产业增加值(亿元),X4表示社会从业人数(万人),X5表示其他收入(亿元)。数据的搜集如下:
模型中各个解释变量和被解释变量1994年到2013年共20年的数据
| 指标 | 第一产业增加值 | 第二产业增加值 | 第三产业增加值 | 全国公共财政收入 | 年末就业人员数 | 非税收入 |
| 频度 | 年 | 年 | 年 | 年 | 年 | 年 |
| 单位 | 亿元 | 亿元 | 亿元 | 亿元 | 万人 | 亿元 |
| 1994 | 9572.69 | 22445.4 | 16179.76 | 5218.1 | 67455 | 0 |
| 1995 | 12135.81 | 28679.46 | 19978.46 | 6242.2 | 68065 | 0 |
| 1996 | 14015.39 | 33834.96 | 23326.24 | 7407.99 | 65 | 0 |
| 1997 | 14441. | 37543 | 26988.15 | 8651.14 | 6982 | 0 |
| 1998 | 14817.63 | 39004.19 | 30580.47 | 9875.95 | 70637 | 0 |
| 1999 | 14770.03 | 41033.58 | 33873.44 | 11444.08 | 71394 | 0 |
| 2000 | 14944.72 | 45555.88 | 38713.95 | 13395.23 | 72085 | 0 |
| 2001 | 15781.27 | 49512.29 | 44361.61 | 16386.04 | 72797 | 0 |
| 2002 | 16537.02 | 536.77 | 498.9 | 103. | 7328 | 0 |
| 2003 | 17381.72 | 62436.31 | 56004.73 | 21715.25 | 73736 | 0 |
| 2004 | 21412.73 | 73904.31 | 561.29 | 26396.47 | 742 | 0 |
| 2005 | 22420 | 87598.09 | 74919.28 | 319.29 | 747 | 0 |
| 2006 | 24040 | 103719.54 | 88554.88 | 38760.2 | 74978 | 0 |
| 2007 | 28627 | 125831.36 | 111351.95 | 51321.78 | 75321 | 5699.81 |
| 2008 | 33702 | 149003.44 | 131339.99 | 61330.35 | 755 | 7106.56 |
| 2009 | 35226 | 157638.78 | 148038.04 | 68518.3 | 75828 | 96.71 |
| 2010 | 40533.6 | 187383.21 | 173595.98 | 83101.51 | 76105 | 90.72 |
| 2011 | 47486.21 | 220412.81 | 205205.02 | 103874.43 | 72 | 14136.04 |
| 2012 | 52373.63 | 235161.99 | 231934.48 | 117253.52 | 76704 | 16639.24 |
| 2013 | 55322 | 256810 | 275887 | 129209. | 76977 | 18678.94 |
二 、理论模型的建立
一个国家财政收入的高低与其经济发展的状况高度相关。财政收入的直接来源决定于各个产业的增加值,同时从各个解释变量与被解释变量之间的散点图可以看出解释变量与被解释变量Y存在的线性相关关系,因此将理论模型设计如下:
Y = 0 + 1 X1 + 2X2+3X3+4X4+5X5+u
三、模型估计结果与分析
Eviews软件估计结果如下:
| Dependent Variable: Y | ||||
| Method: Least Squares | ||||
| Date: 04/26/15 Time: 22:13 | ||||
| Sample (adjusted): 2007 2013 | ||||
| Included observations: 7 after adjustments | ||||
| Variable | Coefficient | Std. Error | t-Statistic | Prob. |
| C | 3366.676 | 41.285 | 0.8084 | 0.5672 |
| X1 | 0.220160 | 0.1082 | 2.021810 | 0.2924 |
| X2 | -0.083805 | 0.039323 | -2.131175 | 0.2793 |
| X3 | 0.002837 | 0.261254 | 0.010860 | 0.9931 |
| X4 | 0.023711 | 0.013112 | 1.808306 | 0.3216 |
| X5 | 0.871216 | 0.743695 | 1.171469 | 0.4498 |
| R-squared | 0.999570 | Mean dependent var | 415.78 | |
| Adjusted R-squared | 0.997423 | S.D. dependent var | 100.94 | |
| S.E. of regression | 512.2151 | Akaike info criterion | 15.08374 | |
| Sum squared resid | 2623.3 | Schwarz criterion | 15.03738 | |
| Log likelihood | -46.79310 | Hannan-Quinn criter. | 14.51071 | |
| F-statistic | 465.4439 | Durbin-Watson stat | 2.370180 | |
| Prob(F-statistic) | 0.035176 | |||
通过Eviews软件分析结果计算如下:
=3366.676+0.2202X1-0.0838X2+0.0028X3+0.0237X4+0.8712X5
(0.8085) (2.0218) (-2.1312) (0.0109) (1.8083) (1.1715)
R2=0.99, F=465.44, T=20
通过公式可以看出,X2的系数为负值,显然不合理,因为第二产业增加值不可能对财政收入产生负相关关系。
四、理论模型的修正
(一)理论模型的修正
通过分别用Eviews软件作各个解释变量与被解释变量的散点图和估计结果可以看出, X4(社会从业人数)与解释变量y(财政收入)之间的并不存在线性关系,同时通过数据的初步分析,决定将解释变量X4从解释变量中剔除。同时,导致X2的系数变为负数,与经济理论相悖。通过分析,第一产业增加值与第二产业增加值之间在经济意义上有很强的相互影响关系,只有当第一产业发展时,第二产业才会有发展的空间,也就是说,第一产业第二产业的发展之间是相辅相成的关系。为了便于研究,决定将X2从模型当中剔除。解释变量X5表示财政收入当中的其他收入,指的是基本建设贷款归还收入、基本建设收入、捐赠收入等。因此,X5直接作为财政收入的一部分,对研究影响财政收入的简介因素的影响没有重大意义,因此也将X5从模型当中剔除。得到的修正模型如下:
Y = 0 + 1X1 ++3X3+u
(二)已修正模型的估计
| Dependent Variable: Y | ||||
| Method: Least Squares | ||||
| Date: 04/28/15 Time: 20:32 | ||||
| Sample: 1994 2013 | ||||
| Included observations: 20 | ||||
| Variable | Coefficient | Std. Error | t-Statistic | Prob. |
| C | 8480.380 | 747.1123 | 11.35088 | 0.0000 |
| X1 | 0.091858 | 0.032074 | 2.863978 | 0.0108 |
| X3 | 0.1819 | 0.061190 | 2.974143 | 0.0085 |
| R-squared | 0.996743 | Mean dependent var | 25277.07 | |
| Adjusted R-squared | 0.996360 | S.D. dependent var | 14119.29 | |
| S.E. of regression | 851.8824 | Akaike info criterion | 16.47026 | |
| Sum squared resid | 12336961 | Schwarz criterion | 16.61961 | |
| Log likelihood | -161.7026 | Hannan-Quinn criter. | 16.49941 | |
| F-statistic | 2601.199 | Durbin-Watson stat | 1.396925 | |
| Prob(F-statistic) | 0.000000 | |||
=8480.38+0.0919X1+0.1820X3
(747.11) (2.86) (2.97)
R2=0.99, F=2601.20, T=20
五、已修正模型检验
(一)经济意义检验
从模型的估计结果说明,在假定其他变量不变的情况下,当第一产业增加值每增加1亿元,财政收入平均增加0.0919亿元。在嘉定其他条件不变的情况下,第三产业增加值每增加1亿元,财政收入平均增加0.1820亿元。这一结果与理论分析相一致。
(二)拟合优度的检验(可决系数检验)
从估计结果显示,可决系数R2=0.9967,修正的可决系数R2=0.9963,这说明模型对样本的拟合优度很好,即解释变量“第一产业增加值”、“第三产业增加值”对被解释变量“财政收入”的大部分差异做出了解释。
(三)回归方程的显著性检验(F检验)
针对原假设H0: 1=3,给定显著性水平α=0.05。在F分布表中查出自由度为k-1=1和n-k=18的临界值Fα(1,18)=4.41.由表知F=2601.2,明显大于临界值4.41,所以应拒绝原假设,说明回归方程总体的显著性相当不错,即 解释变量“第一产业增加值”、“第三产业增加值”联合起来对 被解释变量“财政收入”有显著影响。
(四)回归系数的t检验
分别针对原假设H0:j=0(j=0,1,3),给定显著性水平α=0.1,查t分布表得自由度为n-k=18的临界值t2/α(n-k)=1.734,由表得与0, 1, 3相对应的t统计量分别为11.35088,2.863978,2.974143,均大于1.734,应当拒绝原假设。即在其他解释变量不变的情况下, 解释变量“第一产业增加值”、“第三产业增加值”分别对解释变量“财政收入”有显著影响。
(五)多重共线性的诊断——Klein判别法
首先,通过观察表1结果发现,模型的拟合优度R2=0.999570,F-statistic=465.44,二者的值都偏高;同时,各个解释变量的t-Statistic值最大不超过2.02,说明解释变量之间可能存在多重共线性。
表2 Correlation
| Y | X1 | X3 | |
| Y | 1.000000 | 0.997521 | 0.997583 |
| X1 | 0.997521 | 1.000000 | 0.996724 |
| X3 | 0.997583 | 0.996724 | 1.000000 |
通过Eviews软件对各个解释变量相互之间的相关系数进行检验,得到结果如表2 所示,根据Klein判别法,比较各个解释变量相关系数与模型可决系数R2得到,各个解释变量之间的相关系数超过模型可绝系数R2。因此,模型中所存在的多重共线性。
(六)异方差检验——White检验
运用Eviews软件对该回归模型进行怀特(White)检验,得到检验结果如表3所示。
| 表3 Heteroskedasticity Test: White | |||||
| F-statistic | 1.229334 | Prob. F(2,17) | 0.3172 | ||
| Obs*R-squared | 2.527067 | Prob. Chi-Square(2) | 0.2827 | ||
| Scaled explained SS | 1.781109 | Prob. Chi-Square(2) | 0.4104 | ||
| Test Equation: | |||||
| Dependent Variable: RESID^2 | |||||
| Method: Least Squares | |||||
| Date: 06/23/15 Time: 19:14 | |||||
| Sample: 1994 2013 | |||||
| Included observations: 20 | |||||
| Variable | Coefficient | Std. Error | t-Statistic | Prob. | |
| C | 997581.6 | 314007.6 | 3.176934 | 0.0055 | |
| X1^2 | -9.62E-05 | 8.08E-05 | -1.190461 | 0.2502 | |
| X3^2 | 0.000347 | 0.000328 | 1.056680 | 0.3054 | |
| R-squared | 0.126353 | Mean dependent var | 616848.1 | ||
| Adjusted R-squared | 0.023571 | S.D. dependent var | 883993.9 | ||
| S.E. of regression | 873513.3 | Akaike info criterion | 30.33592 | ||
| Sum squared resid | 1.30E+13 | Schwarz criterion | 30.48528 | ||
| Log likelihood | -300.3592 | Hannan-Quinn criter. | 30.36507 | ||
| F-statistic | 1.229334 | Durbin-Watson stat | 1.735586 | ||
| Prob(F-statistic) | 0.317215 | ||||
从表3中看出,Prob.Chi-Square(2)=0.2827。当α=0.1时。Prob.Chi-Square(2)>0.1,因此接受H0(Ut具有同方差)。可知,该模型不具有异方差,在90%d 置信区间明显成立。
(七)自相关检验——LM检验
将回归模型Y = 0 + 1X1 ++3X3+u,运用软件进行进行拉格朗日乘数(LM)检验,将滞后期分别取设定为1、2、3和4,得到检验结果的P值如表4所示:
表4 Breusch-Godfrey Serial Correlation LM Test
| F-statistic | 0.372255 | Prob. F(1,16) | 0.5503 |
| Obs*R-squared | 0.454739 | Prob. Chi-Square(1) | 0.5001 |
| F-statistic | 1.044469 | Prob. F(2,15) | 0.3761 |
| Obs*R-squared | 2.444784 | Prob. Chi-Square(2) | 0.2945 |
| F-statistic | 0.675859 | Prob. F(3,14) | 0.5811 |
| Obs*R-squared | 2.530109 | Prob. Chi-Square(3) | 0.4699 |
| F-statistic | 0.5007 | Prob. F(4,11) | 0.7323 |
| Obs*R-squared | 3.110221 | Prob. Chi-Square(4) | 0.5396 |
| F-statistic | 0.553716 | Prob. F(4,13) | 0.7000 |
| Obs*R-squared | 2.911449 | Prob. Chi-Square(4) | 0.5728 |
六、结论与对策
(一)结论
第一,从模型可以看出,在我国,第一产业增加值和第三产业增加值与财政收入存在着高度的正相关,第一产业增加值和第三产业增加值的增加均对财政收入的增长有的促进作用;
第二,第一产业增加值和第三产业增加值对财政收入的影响显著。
第三,财政收入的增长第三产业增加值的依赖较强,第一产业增加值每增加1亿元,财政收入平均增加0.0919亿元,而第三产业增加值每增加1亿元,财政收入平均增加0.1820亿元。
(二)对策
第一,发展国家第一和第三产业,保证财政收入的稳定增长;
第二,注重第三产业的发展,因为第三产业增加值的增加能较大程度的提高财政收入。
参考文献:
[1]李子奈,潘文卿.《计量经济学》(第三版)北京:高等教育出版社,2000.
[2]中经网统计数据库
[3]李子奈,叶阿中.《高等计量经济学》北京:清华大学出版社,2000
