时间序列分析模型——ARIMA模型
嵌入式牛简介:什么是ARIMA模式?
镶嵌牛鼻:ARIMA
嵌入式牛问:ARIMA模型具体可以应用在哪里?
镶嵌牛文字:
一、研究目的
传统的计量经济学方法是一种基于经济理论的模型,用来描述变量之间的关系。然而,经济理论通常不足以对变量之间的动态关系提供严格的解释,内生变量可以出现在方程的左端和右端,这使得估计和推断更加复杂。为了解决这些问题,出现了一类模型,如向量自回归模型(VAR)和向量误差修正模型(VEC),它利用非结构化的方法来建立变量之间的关系。
在经典的回归模型中,主要是通过回归分析来建立不同变量之间的函数关系(因果关系)来考察事物之间的关系。本案例将讨论如何利用时间序列数据本身建立模型来研究事物的发展规律,并据此对事物的未来发展做出预测。研究时间序列数据的意义:现实中往往需要研究事物随时间发展变化的规律。这就需要研究这个东西过去发展的历史记录来得到它自身发展的规律。现实中很多问题,比如利率的波动,收益的变化,反映股市的各种指数,通常都可以用时间序列数据来表示。通过对这些数据的研究,可以发现这些经济变量的变化规律(对于某些变量来说,影响其发展变化的因素太多,或者主要影响变量的数据很难收集,因此很难建立回归模型来发现其变化发展规律。这时候时间序列分析模型就显示出了它的优势——因为这类模型不需要建立因果关系模型,只需要其变量的数据),而这样的建模方法就属于时间序列分析的研究范畴。在时间序列分析中,ARIMA模型是最典型和最常用的模型。
二、ARIMA模式的原理
1和ARIMA的意义。ARIMA由三部分组成,即AR、I和MA。ar-表示自动?回归,即自回归模型;I-代表积分,即整数阶。时间序列模型必须是平稳的才能建立计量经济模型,ARIMA模型作为时间序列模型也不例外。因此,首先要对时间序列进行单位根检验。如果是非平稳序列,就要通过差分将其转化为平稳序列,经过几次差分后,称为多阶整数。ma-表示移动平均线,即移动平均线模型。可以看出,模型实际上是AR模型和MA模型的结合。
ARIMA模型和ARMA模型的区别:ARMA模型是针对平稳时间序列建立的。ARIMA模型旨在对非平稳时间序列进行建模。也就是说,要建立非平稳时间序列的ARMA模型,需要通过差分将其转化为平稳时间序列,然后建立ARMA模型。
2.ARIMA模型的原理。如前所述,ARIMA模型实际上是AR模型和MA模型的结合。
AR模型的形式如下:
其中,参数为常数,是阶自回归模型的系数;是自回归模型的滞后阶;它是一个均值为0、方差为0的白噪声序列。模型符号-表示顺序自回归模型。
MA模型的形式如下:
其中:参数为常数;参数是顺序移动平均模型的系数;是移动平均线模型的滞后阶数;它是一个均值为0、方差为0的白噪声序列。模型符号-表示顺序移动平均模型。
ARIMA模式采取以下形式:
记住模型。是自回归模型的滞后阶,时间序列的单整数阶,阶移动平均模型的滞后阶。当时模式退化为马模式;当时,ARIMA模型退化为AR模型。
3.建立ARIMA模型需要解决的三个问题。从以上分析可以看出,建立ARIMA模型需要解决以下三个问题:
(1)将非平稳序列转化为平稳序列。
(2)确定模型的形式。即模型属于AR,MA,ARMA中的哪一个。这主要通过模式识别来解决。
(3)确定变量的滞后阶数。也就是数之和。这也是通过模型识别来完成的。
4.ARIMA模型的识别
ARIMA模型识别的工具是自相关系数和偏自相关系数。
自相关系数:滞后k阶的时间序列的自相关系数由下式估算:
其中是序列的样本均值,是k周期值的相关系数。它被称为时间序列的自相关系数,自相关系数可以部分地描述一个随机过程的形式。它显示了序列中相邻数据之间的相关程度。
偏自相关系数:偏自相关系数是给定条件下它们之间的条件相关。相关程度用偏自相关系数来度量。k阶滞后下估计偏自相关系数的公式为:
其中是具有k阶滞后的自相关系数的估计值。之所以称之为偏相关,是因为它度量的是K周期的相关性,不考虑k-1周期的相关性。如果这种形式的自相关可以用滞后小于k阶的自相关来表示,则在k相位滞后下,部分相关的值趋于0。
标识:
AR(p)模型的自相关系数随K的增加呈现指数衰减或振荡衰减,具体衰减形式取决于AR(p)模型的滞后项系数。AR(p)模型的偏自相关系数按P阶截断。因此,AR(p)模型的阶次p可以通过识别AR(p)模型的偏自相关系数的个数来确定。
MA(q)模型的自相关系数在Q步后被截断。MA(q)模型的偏自相关系数必然呈现拖尾衰减形式。
ARMA(p,q)模型是AR(p)模型和MA(q)模型的组合模型,所以ARMA(p,q)的自相关系数是AR(p)自相关系数和MA(q)自相关系数的混合。当p=0时,它具有截断的性质;当q=0时,它具有拖尾性质;当p和q都不为0时,它具有拖尾性质。
通常,ARMA(p,q)过程的偏自相关系数在p阶滞后之前可能有几个明显的尖峰,但从p阶滞后项开始逐渐趋于零;但其自相关系数是q阶滞后前有几个明显的尖柱,从q阶滞后项开始逐渐趋于零。
第三,数据和变量的选择
本案例选取中国实际GDP的时间序列建立ARIMA模型,样本区间为1978—2001。数据来源于国家统计局网站上的各年统计年鉴,GDP数据通过GDP指数换算成按1978的价格计算的值。见表1:
表1:1978至2003年中国国内生产总值(单位:亿元)
年度国内生产总值
19783605.6198610132.8199446690.7
19794074198711784.7199558510.5
19804551.3198814704199668330.4
19814901.4198916466199774894.2
19825489.2199018319.5199879003.3
19836076.3199121280.4199982673.1
19847164.4199225863.7200089340.9
19858792.1199334500.7200198592.9
第四,建立ARIMA模型的步骤
1,单位根检验,确定整数阶。
根据单位根检验的案例分析,GDP时间序列是二阶一元的。也就是d=2。通过两次差分将GDP序列转化为平稳序列?。利用序列建立ARMA模型。
2.模型识别
确定模型形式和滞后阶数,用自相关系数(AC)和偏自相关系数(PAC)完成辨识。
首先将GDP数据输入Eviews软件,检查其二阶差分的AC和PAC。打开GDP序列窗口,点击查看按钮,菜单出现,选择相关图,如下图所示:
打开关联图对话框,选择二阶差分,点击确定,得到序列的AC和PAC。(也可以对GDP序列进行二阶差分,然后在相关图中选择级别。)
从图中可以看出,序列的自相关系数(AC)在1阶截断,偏自相关系数(PAC)在2阶截断。所以判断模型是ARMA模型,而。即:
3.建模
从上面的分析可以知道,模型是成立的。首先,对GDP序列进行两次微分,得到序列。然后在Workfile工作簿中新建一个方程对话框,方程用列表法定义。自回归滞后项用ar表示,移动平均项用ma表示。本例中有两个自回归项,所以用ar(1)和ar(2)表示,一个移动平均项用ma(1)表示,如图:
点击确定,得到模型估计结果:
从拟合优度来看,模型的拟合效果较好,DW统计量为2.43,各变量的T统计量也通过了显著性检验,模型较为理想。检验残差也是稳定的,所以判断模型建立正确。