
摘要 文章主要研究季节时间序列模型在我国季度GDP时间序列预测中的应用,并分析探讨 模型的准确性和实用性。通过对不同模型进行参数估计和比较后发现:ARIMA模型能很好地拟合我国GDP时间序列,用该模型进行预测得出了1952年至2011年前两个季度的GDP数值,分析发现GDP仍然呈增长趋势,但其速度放缓。预测结果的 准确性较高,并具有一定现实意义。
时间序列分析的ARMA 模型预测问题, 实质上是通过对社会经济发展变化过程的分析研究, 找出其发展变化的量变规律性, 用以预测经济现象的未来。预测时不必考虑其他因素的影响, 仅从序列自身出发, 建立相应的模型进行预测, 这就从根本上避免了寻找主要因素及识别主要因素和次要因素的困难; 和回归分析相比, 可以避免了寻找因果模型中对随机扰动项的限定条件在经济实践中难以满足的矛盾。实际上这也是ARMA 模型预测与其他预测方法相比的优越性所在。本文运用时间序列的分析方法,对我国历年的国内生产总值进行分析。将ARMA模型对该序列进行拟合,最终得出我国国内生产总值的变化规律。并且利用模型预测了较为准确的短期两年预测值。
文章分析了1952-2011年我国GDP时间序列,在将该时间序列平稳化的基础上,建立自回归移动平均模(ARMA),从中得出我国GDP序列的变化规律,并且预测未来两年我国GDP的数值。
关键词 时间序列;GDP ;ARMA模型;预测值;显著水平
一 问题重述
国内生产总值(GDP)代表一国或一个地区所有常住单位和个人在一定时期内全部生产活动的最终成果,是社会总产品价值扣除了中间投入价值后的余额,是国民经济各行业在核算期内增加值的总和。GDP是联合国国民经济核算体系(SNA)中最重要的总量指标,不仅为制定者提供了反映经济总体规模和结构、状况和人民平均生活水平的量化依据,而且成为评价各个国家或地区经济表现的标尺,为世界各国广泛使用。在社会经济高速发展的条件下,对我国GDP的发展模式的研究,以及在此基础上对未来我国GDP的发展水平的预测就显得尤为的重要。本文就此对我国GDP时间序列进行分析,并且采用ARMA模型对序列进行拟合,最后在此基础上对后期二年数据进行预测。
二 问题分析
时间序列分析的ARMA 模型预测问题, 实质上是通过对社会经济发展变化过程的分析研究, 找出其发展变化的量变规律性, 用以预测经济现象的未来。预测时不必考虑其他因素的影响, 仅从序列自身出发, 建立相应的模型进行预测, 这就从根本上避免了寻找主要因素及识别主要因素和次要因素的困难;和回归分析相比, 可以避免了寻找因果模型中对随机扰动项的限定条件在经济实践中难以满足的矛盾。通过对一阶差分的对数序列的自相关系数和偏相关系数图的分析观察,可以知道模型大致可选取两种模型。第一种,自相关系数为拖尾,而偏相关系数为一阶截尾。此时选取模型可以为ARMA模型。第二种,自相关二阶截尾,而偏相关系数为一阶截尾。此时选取模型可以为ARMA模型。
实际上这也是ARMA 模型预测与其他预测方法相比的优越性所在。本文运用时间序列的分析方法,对我国历年的国内生产总值进行分析。将ARMA模型对该序列进行拟合,最终得出我国国内生产总值的变化规律。并且利用模型预测了较为准确的短期两年预测值。
三 符号说明
| T时刻自变量的数值 | |
| E | 数学期望 |
| 自回归模型的阶数 | |
| 表示时间序列在t时期的误差或偏差。 | |
| 自回归系数 | |
| 移动平均系数 |
1、假设本文中数据来源可靠,所有数据真实可信。
2、假设本文中所给的数据能够全面反映我国GDP的变化。
3、假设在短时间内我国GDP的变化呈现连续的。
五 模型的建立与求解
1.ARMA模型
1.1 ARMA模型概述
ARMA模全称为自回归移动平均模型(Auto-regressive Moving Average Model,简称 ARMA)是研究时间序列的重要方法。其在经济预测过程中既考虑了经济现象在时间序列上的依存性, 又考虑了随机波动的干扰性, 对经济运行短期趋势的预测准确率较高, 是近年应用比较广泛的方法之一。ARMA模型是由美国统计学家GE1P1Box和英国统计学家G1M1 Jenk in在20世纪70年代提出的著名时序分析模型,即自回归移动平均模型。ARMA模型有自回归模型AR(q)、移动平均模型MR(q)、自回归移动平均模型ARMA(p,q) 3种基本类型。其中ARMA(p,q)自回归移动平均模型,模型可表示为:
其中,P为自回归模型的阶数,q为移动平均模型的介数;表示时间序列在时刻的值;为自回归系数;表示移动平均系数;表示时间序列在t时期的误差或偏差。
1.2 ARMA模型建模流程
首先用ARMA模型预测要求序列必须是平稳的,也就是说,在研究的时间范围内研究对象受到的影响因素必须基本相同。若所给的序列并非稳定序列,则必须对所给的序列做预处理,使其平稳化,然后用ARMA模型建模。建模的基本步骤如下:
(1)求出该观察值序列的样本自相关系数(ACF)和样本偏相关(PACF)的值。
(2)根据样本自相关系数和偏自相关系数的性质选择适当的模型进行拟合。
(3)估计模型中未知参数的值。
(4)检验模型的有效性。如果拟合模型通不过检验,转向步骤(2),重新选择模型再拟合。
(5)模型优化。如果拟合模型通过检验,仍然转向步骤(2),充分考虑各种可能,建立多个拟合模型,从所有通过检验的拟合模型中选择最优模型。
(6)利用拟合模型,预测序列的将来走势。
2.我国GDP时间序列模型的建立
2.1 数据的预处理
本文选取了我国1952-2011年的GDP数据作为时间序列观察值。对此时间序列做时序图如图1所示:
图1 我国GDP时序图
由时间序列的时序图可以发现GDP随时间的增长是呈指数趋势。因此,对原始序列作对数变换并作出其时序图如图2所示:
图1 取对数后的GDP时序图
通过观察取对数后的GDP时序图,发现经过处理后的序列具有趋势性。由于GDP带有很强的趋势成分, 而我们的目的主要是利用ARMA 模型对其周期成分进行分析, 因此需要对此类的数据先进行消除趋势性的处理, 然后建立ARMA模型。
拿到观察值序列之后,无论是采用确定性时序分析方法还是随机时序分析方法,分析的第一步都是要通过有效的手段提取信息中所蕴含的确定性信息。在Box和Jenkins在Time Series Analysis Forecasting and Control一书中特别强调差分方法的使用,他们使用大量的案例分析证明差分方法是一种非常简便﹑有效的确定性信息提取方法。实践中,我们会根据序列的不同特点选择合适的差分方式,常见情况有以下三种;
(1)序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳。
(2)序列蕴含着曲线趋势,通常低阶(2阶或3阶)差分就可以提取出曲线趋势的影响。
(3)蕴含固定周期的序列,一般进行步长为周期长度的差分运算就可以较好地提取周期信息。
从理论上而言,足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。差分运算是一种对信息的提取﹑加工过程,每次差分都会有信息的损失,在实际中差分运算的阶数要适当,应当避免过差分。观察时序图2,可使用一阶差分就可以提取序列的足够信息。做一阶差分后,做其序列图3如下:
图3 一阶差分后对数GDP时序图
从图(3)可以观察得出,序列大致趋于平稳。
为了进一步检验序列是否真正平稳,在此使用Eviews统计软件对已转换进行平稳性检验。对时间序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征作出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。目前最常用的平稳性统计检验方法是单位根检验(unit root test)。使用单位根检验法对变换数据进行检验得出检验结果如表1所示:
| Null Hypothesis: DLOGGDP has a unit root | ||
| t-Statistic | Prob1* | |
| Augmented Dickey- Fuller Test Statistic | -4.1283230054 | 0.00130081454 |
| Test Critical Values 1% level | -3.5526655874 | |
| 5% level | -2.9145174713 | |
| 10% level | -2.5950333156 | |
结合图3与表1,结果表明序列logGDP经过一阶差分之后序列平稳。
2.2 模型的识别与选择
计算出样本自相关系数和偏相关系数的值之后,我们主要是根据它们表现出来的性质,选择适当的ARMA模型拟合观察值序列。这个过程实际上就是要根据样本自相关系数和偏相关系数的性质估计自相关阶数和移动平均阶数,因此模型的识别过程也成为定阶过程。一般ARMA模型定阶的基本原则如图4所示:
图4 ARMA(p,q)模型选择原则
Eviews是专门为大型机开发的、用以处理时间序列数据的时间序列软件包的金融统计软件,其主要功能有:
(1)采用统一的方式管理数据,通过对象、视图和过程实现对数据的各种操作;
(2)输入、扩展和修改时间序列数据或截面数据,依据已有序列按任意复杂的公式生成新的序列;
(3)计算描述统计量:相关系数、协方差、自相关系数、互相关系数和直方图;
(4)进行T 检验、方差分析、协整检验、Granger 因果检验;
(5)执行普通最小二乘法、带有自回归校正的最小二乘法、两阶段最小二乘法和三阶段最小二乘法、非线性最小二乘法、广义矩估计法、ARMA 模型估计法等;
利用Eviews统计软件对差分数据进行操作,可得样本自相关系数和偏相关系数图如图5所示:
图5 差分序列自相关系数与偏相关系数图
通过对一阶差分的对数序列的自相关系数和偏相关系数图的分析观察,可以知道模型大致可选取两种模型。第一种,自相关系数为拖尾,而偏相关系数为一阶截尾。此时选取模型可以为ARMA模型。第二种,自相关二阶截尾,而偏相关系数为一阶截尾。此时选取模型可以为ARMA模型。
2.3 参数估计
选择拟合好后的模型之后,下一步就是要利用序列的观察值确定该模型的口径,即估计模型中未知参数的值。对于一个非中心化ARMA(p,q)模型,有
式中,
该模型共含个未知参数:。对于未知参数的估计方法有三种:矩估计﹑极大似然估计和最小二乘估计。其中本文使用最小二乘估计法对序列进行参数估计。
在ARMA(p,q)模型场合,记
残差项为:
残差平方和为:
是残差平方和达到最小的那组参数值即为的最小估计值。
使用Eviews统计软件操作可得序列两种可能的参数估计图如图6﹑7所示:
图6 ARMA(1, 0)模型参数估计与检验结果
图7 ARMA(1,1)模型参数估计与检验结果
由图6﹑7模型的参数估计与检验结果对比看,可以知道,ARMA(1,0)模型中其调整后的为0.333657小于ARMA(1,2)模型中的0.373158;而AIC和SC值分别为-2.515346,-2.444297分别小于ARMA(1,2)模型中的-2.559993,-2.453418。
根据以上模型的识别与选择,我们选用了ARMA作为最佳预测模型。估计该模型的参数及模型的相关检验结果如图7。结果表明, 模型ARMA的参数估计值具有统计意义。其展开式为:
2.4参数的显著性检验
参数的显著性检验就是要检验每一个未知参数是否显著非零。这个检验的目的是为了是使模型最精简。如果某个参数不显著,即表示该参数所对应的那个自变量对因变量的影响不明显,该自变量就可以从拟合模型中删除。最终模型将由一系列参数显著非零的自变量表示。由图7模型参数估计与检验结果,可以观察到t统计量值的值均小于0.05。表明模型参数显著。
六 模型的显著性检验
模型的显著性检验主要是检验模型的有效性。一个模型是否显著有效主要看它提取的信息是否充分。一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,换言之,拟合残差项中将不再蕴含任何相关信息,即残差序列应该为白噪声序列。这样的模型我们成为显著有效模型。反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明了拟合模型不够有效。对于序列模型ARMA(1 ,2)我们利用EViews统计软件进行模型的显著性检验。检验结果如图8所示:
图8 残差白噪声检验结果
此时,可以认为残差序列是纯随机序列, 模型满足检验要求,即拟合模型显著有效。
七 模型的预测与评价
由预测方程及其条件方程:
测得到2010、2011年的GDP值分别为396975.3亿元、484638.24亿元 ,其标准差为0.06697。
而已知2010、2011年实际GDP分别为403260亿元、471563.37亿元。预测误差分别为:
预测值与真实值误差均在3%以内预测较为准确。利用此模型对2012﹑2013年GDP进行预测结果如表2所示:
| 表2 2012﹑2013年模型预测值 | ||
| 年份 | 2012 | 2013 |
| 预测值(亿元) | 549019.4 | 4974.5 |
时间序列分析的ARMA 模型预测问题, 实质上是通过对社会经济发展变化过程的分析研究, 找出其发展变化的量变规律性, 用以预测经济现象的未来。预测时不必考虑其他因素的影响, 仅从序列自身出发, 建立相应的模型进行预测, 这就从根本上避免了寻找主要因素及识别主要因素和次要因素的困难; 和回归分析相比, 可以避免了寻找因果模型中对随机扰动项的限定条件在经济实践中难以满足的矛盾。实际上这也是ARMA 模型预测与其他预测方法相比的优越性所在。本文运用时间序列的分析方法,对我国历年的国内生产总值进行分析。将ARMA模型对该序列进行拟合,最终得出我国国内生产总值的变化规律。并且利用模型预测了较为准确的短期两年预测值。
八 参考文献
[1] 王燕.编著.应用时间序列分析(第二版).北京:中国人民大学出版社.
[2] 张晓峒.著.EViews使用指南与案例:机械工业出版社.
[3] 易丹辉.主编.数据分析与EViews应用.北京:中国人民大学出版社.
[4] 高敏学﹑李静萍﹑许健.编著.国民经济核算原理与中国实践.中国人民大学出版社,第二版
[5] 徐国祥1 统计预测和决策[M ] . 上海: 上海财经大学出版社,
[6] 高铁梅.计量经济分析方法与建模[M].清华大学出版社.
[7] 中国社会科学院金融研究所 . http://ifb.cass.cn/jrtj/
[8] Gelpl.Box and Glml.Jenkins 《Time Series Analysis forecasting and Control》
[9]韩忠庚,数学建模方法及其应用,北京:高等教育出版社,2009。
[10]翰林,林军,数学建模教程,北京:科学出版社,2011。
[11]《数量经济技术经济研究》多因素敏感性分析的建模研究,第3期:19 92 年。
[12]工程数学学报CHINESE JOURNAL OF ENGINEERING MATHEMATICS
Vol. 29 No. 3,2012年。
[13]李焕琴,MATLAB软件与基础教学实验,西安:西安交通大学出版社,2008。
附件一
1952-2011年我国GDP时间序列:
| 年份 | GDP(亿元) | 年份 | GDP(亿元) | 年份 | GDP(亿元) |
| 1952 | 679.00 | 1972 | 2518.10 | 1992 | 26932.50 |
| 1953 | 824.00 | 1973 | 2723.90 | 1993 | 35333.90 |
| 1954 | 859.00 | 1974 | 27.90 | 1994 | 48197.9 |
| 1955 | 910.00 | 1975 | 2997.30 | 1995 | 60793.70 |
| 1956 | 1028.00 | 1976 | 2943.70 | 1996 | 71176.60 |
| 1957 | 1068.00 | 1977 | 3201.90 | 1997 | 773.00 |
| 1958 | 1307.00 | 1978 | 35.20 | 1998 | 84402.30 |
| 1959 | 1439.00 | 1979 | 4062.60 | 1999 | 677.10 |
| 1960 | 1457.00 | 1980 | 4545.60 | 2000 | 99214.60 |
| 1961 | 1220.00 | 1981 | 41.60 | 2001 | 109655.20 |
| 1962 | 1149.30 | 1982 | 5323.40 | 2002 | 120332.70 |
| 1963 | 1233.30 | 1983 | 5962.70 | 2003 | 135822.80 |
| 19 | 1454.00 | 1984 | 7208.10 | 2004 | 159878.30 |
| 1965 | 1716.10 | 1985 | 9016.00 | 2005 | 184937.40 |
| 1966 | 1868.00 | 1986 | 10275.60 | 2006 | 216314.40 |
| 1967 | 1773.90 | 1987 | 12058.60 | 2007 | 265810.30 |
| 1968 | 1723.10 | 1988 | 15042.80 | 2008 | 314045.40 |
| 1969 | 1937.90 | 19 | 16992.30 | 2009 | 340902.80 |
| 1970 | 2252.70 | 1990 | 18667.80 | 2010 | 401202.00 |
| 1971 | 2426.40 | 1991 | 21781.50 | 2011 | 471563.37 |
