6009221.doc
商务数据分析
电子商务系列
第四十课 平稳时间序列分析
对时间序列数据的分析,首先要对它的平稳性和纯随机性进行检验。根据检验的结果可以将序列分为不同的类型,对不同类型的序列将会采用不同的分析方法。如果一个时间序列被识别为平稳非白噪声序列,那就说明该序列是一个蕴涵着相关信息的平稳序列。在统计上,我们通常是建立一个线性模型来拟合该序列的发展,借此提取该序列中被蕴涵着有用信息。目前,最常用的拟合平稳序列的模型是ARMA(Auto Regression Moving Average)模型。
一、 平稳性检验
1. 严平稳和宽平稳
平稳时间序列有两种定义,根据限制条件的严格程度,分为:
? 严平稳时间序列(strictly stationary)—指序列所有的统计性质都不会随着时间的推移而发生
变化。
? 宽平稳时间序列(week stationary)—指序列的统计性质只要保证序列的二阶矩平稳就能保证
序列的主要性质近似稳定。
如果在任取时间t、s和k时,时间序列Xt满足如下三个条件:
EXt2??
(40.1) (40.2) (40.3)
EXt??
E(Xt??t)(Xs??s)?E(Xk??k)(Xk?s?t??k?s?t)
则称为宽平稳时间序列。也称为弱平稳或二阶平稳。对于正态随机序列而言,由于联合概率分布仅由均值向量和协方差阵决定,即只要二阶矩平稳,就等于分布平稳了。 2. 平稳时间序列的统计性质
根据平稳时间序列的定义,可以推断出两个重要的统计性质: ? 常数均值。即式(40.2)的条件。
? 自协方差只依赖于时间的平均长度。即式(40.3)的条件。 如果定义自协方方差函数(autocovariance function)为:
?(t,s)?E(Xt??t)(Xs??s)
那么它可由二维函数简化为一维函数?(s?t),由此引出延迟k自协方差函数:
(40.4)
?(k)??(t,t?k)
容易推断出平稳时间序列一定具有常数方差:
(40.5)
Dxt?E(Xt??t)2??(t,t)??(0)上海财经大学经济信息管理系IS/SHUFE
Page 1 of 32
(40.6)
如果定义时间序列自相关函数(autocorrelation function),简记为ACF:
6009221.doc
商务数据分析
电子商务系列
?(t,s)?E(Xt??t)(Xs??s)
DXt?DXs(40.7)
由延迟k自协方差函数的概念可以等价得到延迟k自相关函数的概念:
?(k)?E(Xt??t)(Xt?k??t?k)DXt?DXt?k?(k)r(k)???(0)?(0)r(0)容易验证自相关函数具有几个基本性质: ? ?
(40.8)
?(0)?1; ?(?k)??(k);
? 自相关阵为对称非负定阵; ? 非惟一性。 注意区分:
协方差函数和相关函数——度量两个不同事件彼此之间的相互影响的程度。
自协方差函数和自相关函数——度量用一事件在两个不同时期之间的相互影响的程度。 3. 样本的估计值
在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值序列变成了只含有一个变量的常数序列,所以常数均值?的估计值为
???x??nt?1txn
(40.9)
同样可以根据平稳序列二阶矩平稳的性质,得到基于样本计算出来的各种估计值。延迟k自协方
差函数的估计值:
?(k)??总体方差的估计值:
?(xt?1n?kt?x)(xt?k?x)n?k
(40.10)
?(0)??延迟k自相关函数的估计值:
?(xt?1nt?x)2
(40.11)
n?kn?k??(k)??(k)???t?1??(0)(xt?x)(xt?k?x)?(xt?1n (40.12)
t?x)2上海财经大学经济信息管理系IS/SHUFE
Page 2 of 32
6009221.doc
商务数据分析
电子商务系列
4. 平稳性检验的方法
对序列的平稳性检验有两种方法:一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一是构造检验统计量进行假设检验的单位根检验(unit root test)方法。
? ?
时序图和自相关图检验 单位根检验(unit root test)
所谓单位根检验就是通过检验时间序列自回归特征方程的特征根是在单位圆内还是在单位圆外(包括在单元圆上),来检验时间序列的平稳性。
单位根检验统计量中最常用的是ADF检验统计量,又称增广DF检验(augmented Dickey-Fuller)。对任一p阶自回归AR(p)过程
xt??1xt?1????pxt?p??t
它的特征方程为
(40.13)
?p??1?p?1????p?0
如果该方程所有的特征根都在单位圆内,即特征根不在单位圆内,不妨设?1(40.14)
?i?1,i?1,2,?,p则序列Xt平稳。如果至少存在一个
?1,则序列Xt非平稳,且自回归系数之和恰好等于1。即
(40.15)
?1??2????p?1
因而,对于AR(p)过程可以通过检验自回归系数之和是否大于等于1来考察该序列的平稳性。设
???1??2????p?1,那么原假设H0:??0(序列Xt非平稳),ADF检验统计量:
???? ?S(?)(40.16)
?)为参数?的样本标准差。1979年,Dickey和Fuller使用蒙特卡洛模拟方法算出了?检验式中,S(?统计量的临界值表。
二、 纯随机性检验
如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的数据序列,即过去的
行为对未来的发展没有丝毫影响,这种序列我们称之为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。因此,为了确保平稳序列还值不值得分析下去,需要对平稳序列进行纯随机性检验。 1. 纯随机序列
如果在任取时间t和s时,时间序列Xt满足如下三个条件:
EXt??
上海财经大学经济信息管理系IS/SHUFE
(40.17)
Page 3 of 32
6009221.doc
商务数据分析
电子商务系列
r(t,s)??2r(t,s)?0当t?s时 当t?s时
(40.18) (40.19)
称此序列为纯随机序列,也称为白噪声(white noise)序列,简记为Xt~WN(?,?2)。之所以称之
为白噪声序列是因为人们最初发现白光具有这种特性。比较平稳时间序列的定义,可看出白噪声序列一定是平稳序列,且是一种最简单的平稳序列。见图40-1所示是随机生成的1000个服从标准正态分布的白噪声序列观察值。
标准正态分布白噪声序列Xt432白噪声10-1-2-3-401002003004005006007008009001000时间
图40-1 标准正态白噪声序列时序图
根据白噪声序列的定义,白噪声序列具有三个重要的性质: ? 常数均值(EXt??);
? 纯随机性(r(t,s)?0); ? 方差齐性(r(t,s)??2)。 2. 纯随机性检验
Barlett证明,如果一个时间序列是纯随机的,得到一个观察期数为n的观察序列Xt,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零、方差为序列观察数倒数的正态分布,即
?(k)~N(0,)
式中k为延迟期数,n为样本观察期数。
1n(40.20)
根据Barlett定理,可以构造QBP检验统计量和QLB检验统计量来检验序列的纯随机性。原假设:
上海财经大学经济信息管理系IS/SHUFE
Page 4 of 32