SAS讲义 第四十课平稳时间序列分析

6009221.doc

商务数据分析

电子商务系列

把式(40.71)代入式(40.70)中,可得到:

????xt??Gi?Ix?jt?i?j??i?0?j?0?

????GiIjxt?i?ji?0j?0??(40.75)

显然xt是历史数据xt?1,xt?2,?的线性函数。不妨简记为:

xt??Cixt?1?i

i?0?(40.76)

那么,对于任意一个将来时刻t?l而言,也可以表示成(40.76)式。但问题是xt,xt?1,xt?2,?已知,而

xt?l?1,xt?l?2,?,xt?1未知。根据线性函数的可加性,所有未知信息都可以用已知信息的线性函数表示

出来,并用该函数进行估计:

??ixt?i ?t?l??Dxi?0(40.77)

用et(l)衡量预测误差:

?t?l et(l)?xt?l?xV?min?Var?et(l)??

?t?l为xt,xt?1,xt?2,?的线性函数,所以也称为线性预测方差最小法。 因为x(40.78)

显然,预测的误差越小预测的精度就越高,目前最常用的预测原则是预测误差的方差最小法:

(40.79)

?t?l是在序列xt,xt?1,xt?2,?已知的情况下得到的条件无在线性预测方差最小法下得到的估计值x偏最小方差估计值。且预测方差只与预测步长l有关,而与预测起始点t无关。但预测步长l越大预测

?t?l的1??的置信区间为: 值的方差越大,因此只适合于短期预测。在正态假定下,估计值x?t?l?z1??/2(1?G12???Gl2?1)1/2?? x(40.80)

八、 proc autoreg过程

自回归过程autoreg用于估计和预测误差项自相关或异方差的时间序列数据的线性回归模型。自

回归误差模型被用来校正自相关系数和广义自回归条件异方差模型GARCH(generalized autoregressive conditional heteroskedastic),并且其变体如广义的ARCH(GARCH)、方差无穷的GARCH(IGARCH)、指数的GARCH(EGARCH)和依均值的GARCH(GARCH-M)被用于异方差的建模和校正。

自回归过程autoreg可以拟合任意阶的自回归误差模型,并且可以拟合子集自回归模型。为了诊

上海财经大学经济信息管理系IS/SHUFE

Page 21 of 32

6009221.doc

商务数据分析

电子商务系列

断自相关性,过程产生广义Durbin-Watson(DW)统计量和其边缘概率。普通回归分析假定误差方差对于所有观察是相同的,但当误差方差不相同时,数据被称为异方差,此时普通最小二乘法估计不是有效的,同时也影响预测值置信区间的精确性。Autoreg过程能检验异方差,并且提供GARCH模型族来估计和校正数据易变性。对于带有自相关扰动和随时间变化的条件异方差模型,过程输出条件均值和条件方差的预测值。

proc autoreg过程由下列语句控制:

proc autoreg data=数据集 <选项列表> ;

model 因变量=独立回归变量列表 ; output out=数据集 <选项列表>; by 变量列表; run ;

其中,至少要有一个model语句。每个model语句都可跟随一个output语句。 1. proc autoreg语句<选项列表>。

? outest=数据集名——把估计参数输出到指定数据集中。

? covout =数据集名——把估计参数的协方差阵输出到指定数据集中。

2. model语句的

? center——通过减去均值中心化因变量并且取消模型的均值参数。 ? noint——取消模型的均值参数。

? nlag=数值/(数值列表)——指定自回归误差的阶或者自回归误差的时间间隔的子集。例如,nlag=3与nlag=(1 2 3)作用相同,但与nlag=(1 3)等不同。

? garch=()——指定广义条件异方差GARCH模型的类型。例如,定义GARCH(2,1)回归模型时,可用下面SAS语句:

? model y=x1 x2 /garch=(q=2,p=1);

? 请特别注意SAS系统的自回归参数符号q和p与我们前面所述公式中的符号p和q正好相反。定义GARCH-M(1,1)回归模型时,可用下面SAS语句:

? model y=x1 x2 /garch=(q=2,p=1,mean);

? type=选择值,指定GARCH模型的类型:选择值为noineq时指定无约束GARCH模型,缺省值;选择值为nonneg时指定非负约束GARCH模型;选择值为stn时指定约束GARCH模型系数的和小于1;选择值为integ时指定IGARCH模型;选择值为exp时指定EGARCH模型。选项noint取消条件异方差模型中的均值参数。选项tr对GARCH模型的估计使用信赖区域方法,缺省值为对偶拟牛顿法

? all——要求打印所有输出选项。

? archtest——要求用portmantea Q检验统计量和Engle的拉格朗日乘子LM(Lagrange multiplier test)检验是否存在条件异方差情况,即是否有ARCH效应。

? coef——打印前几条观察的变换系数。 ? corrb——打印参数估计的估计相关系数。 ? covb——打印参数估计的估计协方差。

? dw=n——打印直到阶n的DW统计量,缺省值n为1。

? dwprob——打印DW统计量的p值。当误差自由度大于300时dwprob选项被忽略。 ? ginv——打印Yule-Walker解的自协方差的Toeplitz矩阵的逆。

上海财经大学经济信息管理系IS/SHUFE

Page 22 of 32

6009221.doc

商务数据分析

电子商务系列

? itprint——打印每步迭代的目标函数和参数估计。

? lagdetp——打印DW t统计量,它用于检验存在时滞因变量时残差的自相关性。 ? lagdep=回归变量——打印DW h统计量,它用于检验一阶自相关性。。 ? partial——打印偏自相关。 ? noprint——取消所有打印。

? backstep——去掉非显著自回归参数。参数按最小显著性的次序被去掉。 ? slstay=数值——指定被backstep选项使用的显著水平,缺省值为0.05。

? converge=数值——指定在迭代自回归参数估计时参数的变化量的最大绝对值小于此数值,那么认为收敛,缺省值为0.001。

? maxiter=数值——指定允许迭代的最大次数,缺省值为50。 ? method=ml/ols/yw/ityw——指定估计的方法:ml为最大似然估计;ols为无条件最小二乘法;yw为Yule-Walker估计;ityw为迭代Yule-Walker估计。

? nomiss——使用没有缺失值的第一个连贯时间序列数据集,进行模型拟合估计。否则,跳过数据集开始的任何缺失值,使用独立回归变量和因变量都不带缺失值的所有数据。请特别注意,为了保持时间序列中正确的时间间隔,必须要增加时间刻度值,这样就会产生因变量缺失值的观察。当因变量缺失时,过程可以产生预测值。如果缺失值很多,则应使用ML估计。

3. output语句。

? out=数据集名——指定包含预测值和变换值的输出数据集。

? alphacli=数值——设置时间序列预测值置信区间的显著水平。缺省值为0.05。

? alphaclm=数值——设置模型结构部分预测值置信区间的显著水平。缺省值为0.05。

? cev=变量名——把条件误差方差写入到输出数据集的指定变量中。仅GARCH模型被估计时才使用。

? cpev=变量名——把条件预测误差方差写入到输出数据集的指定变量中。仅GARCH模型被估计时才使用。

? constant=变量名——把被变换的均值写入到输出数据集的指定变量中。 ? lcl=变量名——把预测值的置信下限写入到输出数据集的指定变量中。 ? ucl=变量名——把预测值的置信上限写入到输出数据集的指定变量中。

? lclm=变量名——把模型结构部分预测值的置信下限写入到输出数据集的指定变量中。 ? uclm=变量名——把模型结构部分预测值的置信上限写入到输出数据集的指定变量中。 ? p=变量名——把预测值写入到输出数据集的指定变量中。

? rm=变量名——把来自模型结构部分预测的残差写入到输出数据集的指定变量中。 ? transform=变量名——把被变换的变量写入到输出数据集的指定变量中。 4. by语句。

? 在by语句定义的组变量上,进行单独的自回归过程autoreg分析。

九、 实例分析

例40.1 对模拟方法生成的时间趋势加二阶自回归误差模型的时间序列数据,用自回归过程进行分析和建模,以便于比较和判断各种求解模型和运算结果的好坏。模拟的模型为:

上海财经大学经济信息管理系IS/SHUFE

Page 23 of 32

6009221.doc

商务数据分析

电子商务系列

xt?10?0.5t??t?t?1.3?t?1?0.5?t?2?at

at~WN(0,22)

1. 建立模拟模型数据集。

data randar; e1=0; e11=0;

do t=-10 to 36;

e=1.3*e1-0.5*e11+2*rannor(12346); x=10+0.5*t+e; e11=e1; e1=e; if t>0 then output; end; run;

proc print data=randar; run;

(40.81)

程序说明:产生了t=1到36条x观察值。x观察值满足公式(40.81)中要求,程序中的e变量对应于公式中?t;e1变量对应于公式中?t?1;e11变量对应于公式中?t?2;表达式2*rannor(12346),将生成独立同分布均值为0,标准差为2的正态分布随机数,对应于公式中均值为0,标准差为2即方差为4的白噪声误差序列:at~WN(0,22)。DO循环从t=-10开始而不是直接从t=1开始的原因,是

让模拟生成的二阶自回归误差序列?t有一段时间(t=-10到0)进行初始化,以便到达稳定的随机序列值。

2. 普通最小二乘法回归模型。

proc autoreg data=randar; model x=t; run;

proc gplot data=randar;

plot x*t=1 x*t=2 / overlay; symbol1 v=star i=join; symbol2 v=none i=rl;

title 'Auto-Regression:OLS'; run;

程序说明:普通回归proc reg过程基于几个统计假设。关键的统计假设为误差相互对立。然而,对于时间序列数据,普通回归后的残差常常是相关的。这将导致三个重要的后果:第一个是对于参数的显著性和置信限的统计检验将不正确;第二个是回归系数的估计不象考虑到自相关性时的估计一样

上海财经大学经济信息管理系IS/SHUFE

Page 24 of 32

联系客服:779662525#qq.com(#替换为@)