一、实验项目:ARIMA模型建立与预测。
二、实验目的
1、准确掌握ARIMA(p,d,q)模型各种形式和基本原理;
2、熟练识别ARIMA(p,d,q)模型中的阶数p,d,q的方法;
3、学会建立及检验ARIMA(p,d,q)模型的方法;
4、熟练掌握运用ARIMA(p,d,q)模型对样本序列进行拟合和预测;
三、预备知识
(一)模型
1、AR(p)(p阶自回归模型)
其中ut白噪声序列,δ是常数(表示序列数据没有0均值化)
AR(p)等价于
AR(p)的特征方程是:
AR(p)平稳的充要条件是特征根都在单位圆之外。
2、MA(q)(q阶移动平均模型)
其中{ut}是白噪声过程。
MA(q)平稳性
MA(q)是由ut本身和q个ut的滞后项加权平均构造出来的,因此它是平稳的。
MA(q)可逆性(用自回归序列表示ut)
可逆条件:即收敛的条件。即Θ(L)每个特征根绝对值大于1,即全部特征根在单位圆之外。
3、ARMA(p,q)(自回归移动平均过程)
ARMA(p,q)平稳性的条件是方程Φ(L)=0的根都在单位圆外;可逆性条件是方程Θ(L)=0的根全部在单位圆外。
4、ARIMA(p,d,q)(单整自回归移动平均模型)
差分算子:
对d阶单整序列xt~I(d)
则wt是平稳序列,于是可对wt建立ARMA(p,q)模型,所得到的模型称为xt~ARIMA(p,d,q),模型形式是
由此可转化为ARMA模型。
(二)模型识别
要建立模型ARIMA(p,d,q),首先要确定p,d,q,步骤是:一是用单位根检验法,确定xt~I(d)的d;二是确定xt~ AR(p)中的p;三是确定xt~ MA(q)中的q。平稳序列自相关函数
ρ0=1,ρ-k=ρk(对称)
1、平稳AR(p)的自相关系数和偏自相关系数
(1)平稳AR(p)的自相关系数
|φi|<1,i=1,2,…,p,E(ut)=0
,k>0
,k>0
平稳AR(p)的自相关系数是
,k>0
(2)k阶平稳自回归过程AR(k)的偏自相关系数
两边同除以γ0
对任意j>0都成立。根据和对称性,得到Yule-Walker方程组
对于给定的k,ρ1,ρ2,…,ρk已知,每个方程组最后一个解就是相应的偏自相关系数:φ11,φ22的,…,φkk。
ρ3是k=3的自相关系数,意义:度量平稳序列xt与xt-3的相关系数,至于中间xt-1,xt-2起什么作用无法顾及。
φ33的k=3的偏自相关系数。意义:剔除中间变量xt-1,xt-2的影响后,度量xt与xt-3的相关程度。
2、平稳MA(q)的自相关系数和偏自相关系数
(1)MA(q)自相关系数
当k>q时,ρk=0,xt与xt+k不相关,这种现象称为截尾,因此可根据自相关系数是否从某一点开始一直为0来判断MA(q)模型的阶数q。
(2)MA(q)偏自相关系数
MA(q)模型对应一个AR(∞),通过AR(∞)来解决
3、ARMA(p,q)有拖尾特征,p和q的识别通过从低阶逐步试探直到合适的模型为止。
(三)模型估计
用Eviews软件进行估计
(四)模型检验
1、用t统计量检验模型参数显著性;
2、为保证ARMA(p,q)的平稳性和可逆性,模型特征根皆应在单位圆以外,或倒数在单位圆内;
3、用Q统计量对残差进行白噪声检验。
原假设和备择假设
(序列不存在自相关,是白噪声)
不全为0(序列存在自相关,不是白噪声)
统计量
其中上述r是样本相关系数,T是样本容量,分布是极限分布。K是自相关系数的个数,即最大滞后期。若样本较大,则K=[T/10]或T的平方根;若样本较小,则K=[T/4]。
判别规则是:
接受原假设,
拒绝原假设。
(五)模型外推预测
已有ARMA(p,q)模型
和观察值Xt,Xt-1,Xt-2,…,X1。把观察值代入,在t+1时刻有
上式中,观察值已知,只有误差处理问题。
下标大于t的误差项,由于未来的误差未知,因此用期望值0代替未来的误差。下标从1到t的误差项,可用残差估计值(要建模时可找到)代替。于是
1步预测公式:
类似地,2步预测公式和l步预测公式分别是:
其中,h-p<=0时,;h-q>0时,
四、实验内容
1、ARIMA(p,d,q)模型阶数识别;
2、ARIMA(p,d,q)模型估计与检验;
3、ARIMA(p,d,q)模型外推预测。
五、实验软件环景:Eviews软件。
六、实验步骤:按、以美元对欧元汇率1993.1到2007.12的月均价数据为例进行实验。
(一)创建Eviews工作文件(Workfile)
从Eviews主选单中选“File/New\ Workfile”,选择“monthly”选项,输入“Start date:1993:01End date:2007:12”。
(二)录入数据,并对序列进行初步分析
1、导入数据
Quick/Empty Group
在Ser01输入数据;改变量名:点击Ser01全选第一列,在命令栏输入EURO。将文件保存命名,注意存放地址。
2、序列初步分析
选定变量EURO,双击它,View\\Graph\\Line,输出EURO的曲线
从图形看到美元对欧元汇率在2001年左右处于高位,2002年以后一直处于下跌态势。数据总体上类似于随机游走过程形式,应该是非平稳的。
(三)ARIMA(p,d,q)模型阶数识别
1、确定单整阶数d
(1)用不含时间趋势项、解释变量中不含差分项的模型,即对模型进行单位检验(Unit Root Test)。假设;备择假设。
在工作文件窗口,选定变量EURO,双击它,在EURO页面上,点击View\\Unit Root Test\\ADF,表示已经进入扩展的DF检验。选择Level(对水平变量进行单位根检验,检验系数对应的项EUROt-1)\\Intercept(不含时间趋势变量)\\Automatic selecttion(解释变量不含EUROt-1的差分),并且在maximum中选择0(表示差分滞后项数取0,即不含EUROt-1的差分)
Null Hypothesis: EURO has a unit root | ||||
Exogenous: Constant | ||||
Lag Length: 0 (Automatic based on SIC, MAXLAG=0) | ||||
t-Statistic | Prob.* | |||
Augmented Dickey-Fuller test statistic | -0.583908 | 0.8699 | ||
Test critical values: | 1% level | -3.466994 | ||
5% level | -2.877544 | |||
10% level | -2.575381 | |||
*MacKinnon (1996) one-sided p-values. | ||||
Augmented Dickey-Fuller Test Equation | ||||
Dependent Variable: D(EURO) | ||||
Method: Least Squares | ||||
Date: 04/11/11 Time: 08:24 | ||||
Sample (adjusted): 1993M02 2007M12 | ||||
Included observations: 179 after adjustments | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
EURO(-1) | -0.007496 | 0.012838 | -0.583908 | 0.5600 |
C | 0.005875 | 0.011475 | 0.511990 | 0.6093 |
R-squared | 0.001923 | Mean dependent var | -0.000766 | |
Adjusted R-squared | -0.003716 | S.D. dependent var | 0.020297 | |
S.E. of regression | 0.020334 | Akaike info criterion | -4.941907 | |
Sum squared resid | 0.073187 | Schwarz criterion | -4.906293 | |
Log likelihood | 444.3006 | F-statistic | 0.340948 | |
Durbin-Watson stat | 1.369377 | Prob(F-statistic) | 0.560026 | |
t=(0.511990)(-0.583908)
p=(0.6093) (0.5600)
要确定差分方程的样本容量T,原有的样本容量是180,差分后样本容量是T=179;取α=5%,查附表2,得临界值τ=-2.88;统计量观察值为t=-0.583908>τ=-2.88,所以接受假设(从概率值大于0.05也得到接受的结论),即认为汇率序列(EURO)是非平稳的。
(2)对模型,作假设;备择假设。
在工作文件窗口,选定变量euro,双击,在euro页面上,点击View\\Unit Root Test\\ADF,表示已经进入扩展的DF检验。选择1st different(对1阶差分进行单位根检验,检验系数对应的项是Δeurot-1)\\Intercept(不含时间趋势变量)\\User specifi 取0(解释变量不含Δeurot-1的差分)。得到结果
Null Hypothesis: D(EURO) has a unit root | ||||
Exogenous: Constant | ||||
Lag Length: 0 (Automatic based on SIC, MAXLAG=0) | ||||
t-Statistic | Prob.* | |||
Augmented Dickey-Fuller test statistic | -9.676555 | 0.0000 | ||
Test critical values: | 1% level | -3.467205 | ||
5% level | -2.877636 | |||
10% level | -2.575430 | |||
*MacKinnon (1996) one-sided p-values. | ||||
Augmented Dickey-Fuller Test Equation | ||||
Dependent Variable: D(EURO,2) | ||||
Method: Least Squares | ||||
Date: 04/11/11 Time: 08:36 | ||||
Sample (adjusted): 1993M03 2007M12 | ||||
Included observations: 178 after adjustments | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
D(EURO(-1)) | -0.691721 | 0.071484 | -9.676555 | 0.0000 |
C | -0.000638 | 0.001452 | -0.439553 | 0.6608 |
R-squared | 0.347267 | Mean dependent var | -8.27E-05 | |
Adjusted R-squared | 0.343559 | S.D. dependent var | 0.023885 | |
S.E. of regression | 0.019352 | Akaike info criterion | -5.040911 | |
Sum squared resid | 0.065909 | Schwarz criterion | -5.005160 | |
Log likelihood | 450.11 | F-statistic | 93.63572 | |
Durbin-Watson stat | 1.871573 | Prob(F-statistic) | 0.000000 | |
t=(-0.439553)(-9.676555)
p=(0.6608) (0.0000)
取α=5%,求样本容量T,原来样本容量是180,2阶差分分后T=178,查附表2,得DF检验的临界值为τ=-2.88,
对Δeuro平稳性检验的统计量观察值为t=-9.676555<τ=-2.88,所以拒绝假设,即认为个人可支配收入一阶差分时间序列(Δeuro)是平稳的。
即Δeuro~I(0),因此euro~I(1),即euro是一阶单整的,从而d=1。
2、确定自回归阶数p和移动平均阶数q
因为d=1,所以用euro1阶差分Δeuro的自相关函数(ACF)和偏自相关函数(PACF)判断p和q值。
生成Δeuro
GENR deuro=euro-euro(-1)
(也可以在1st different实现)
在deuro页面上,选View\\Correlogram\\Level
Deuro的偏自相关函数(PACF)系数在1为0.310,2处为期不远0.205,但是从3以后明显接近0,所以取p=2。
Deuro的自相关函数(ACF)在1为0.310,但是从2以后明显接近0,所以取q=1。
至于p和q的最终确定还要从低开始试探,直到定出合适的模型为止。初步适合EURO的模型有:
ARIMA(1,1,0)、ARIMA(2,1,0)、ARIMA(0,1,1)、ARIMA(1,1,1)、ARIMA(2,1,1)。
(四)ARIMA(p,d,q)模型估计与检验
(1)ARIMA(1,1,0) 模型估计与检验
Quick\\Estimate\\LS(NLS and ARMA)
在对话框输入d(euro) c ar(1)
常数c的概率太大(0.6606),接受c=0的假设,所以模型应该去掉常数。
Quick\\Estimate\\LS(NLS and ARMA)
在对话框输入d(euro) ar(1)
模型为:
t=(4.343228)
p=(0.0000)
从p值看,系数是显著的。从Inverted AR Roots(自回归特征方程根的倒数)是0.31,在单位圆之外,说明模型是平稳的。但还要对残差进行白噪声检验:
在Quick\\Estimate\\LS(NLS and ARMA)
在对话框输入d(euro) ar(1)
OK出结果的页面上
View\\Residual Tests\\Correlogram-Q-statistics
选K=13(由[178/10]或178平方根来)
Date: 04/11/11 Time: 10:51 | ||||||
Sample: 1993M03 2007M12 | ||||||
Included observations: 178 | ||||||
Q-statistic probabilities adjusted for 1 ARMA term(s) | ||||||
Autocorrelation | Partial Correlation | AC | PAC | Q-Stat | Prob | |
.|. | | .|. | | 1 | 0.065 | 0.065 | 0.7661 | |
*|. | | *|. | | 2 | -0.165 | -0.170 | 5.7306 | 0.017 |
*|. | | *|. | | 3 | -0.104 | -0.084 | 7.7276 | 0.021 |
.|. | | .|. | | 4 | -0.021 | -0.038 | 7.8087 | 0.050 |
.|* | | .|. | | 5 | 0.081 | 0.056 | 9.0190 | 0.061 |
.|. | | .|. | | 6 | 0.000 | -0.027 | 9.0191 | 0.108 |
.|. | | .|. | | 7 | 0.031 | 0.051 | 9.1958 | 0.163 |
.|* | | .|* | | 8 | 0.100 | 0.106 | 11.072 | 0.136 |
.|. | | .|. | | 9 | -0.002 | 0.001 | 11.073 | 0.198 |
.|* | | .|* | | 10 | 0.099 | 0.143 | 12.948 | 0.165 |
.|. | | .|. | | 11 | 0.023 | 0.034 | 13.054 | 0.221 |
.|. | | .|. | | 12 | -0.027 | 0.011 | 13.196 | 0.281 |
.|. | | .|. | | 13 | 0.010 | 0.030 | 13.216 | 0.354 |
类似地,对模型ARIMA(2,1,0)、ARIMA(0,1,1)、ARIMA(1,1,1)、ARIMA(2,1,1)进行估计与检验。
ARIMA(1,1,0),ARIMA(2,1,0)、ARIMA(0,1,1)三个检验都通过参数显著性检验,模型平稳性和可逆性检验,残差序列白噪声检验。
但是模型ARIMA(1,1,1)、ARIMA(2,1,1)没有通过检验。
模型评价与比较
模型 | Φ1 | Φ1 | Φ1 | R^2 | p-Q |
ARIMA(1,1,0) | 0.310 | 0.095 | 0.340 | ||
ARIMA(2,1,0) | 0.373 | -0.202 | 0.126 | 0.698 | |
ARIMA(0,1,1) | 0.385 | 0.122 | 0.727 |
即
(五)模型外推应用
已知2007:12,2007:1,2007:10的汇率分别是:0.68686,0.68111,0.70249,利用ARIMA(2,1,0)模型对2008年1月美元对欧元汇率进行预测。