SAS讲义 第四十课平稳时间序列分析 下载本文

6009221.doc

商务数据分析

电子商务系列

图40-9 autoreg过程拟合模型的两种预测值

对表40.4中的输出结果分析。结果输出主要分成两大部分:普通最小二乘法回归模型和自回归误差模型的有关输出结果。首先显示的是由初始OLS产生的回归结果,包括诊断统计量和参数估计表,与表40.2中的输出结果一致,估计模型见公式(40.82)。然后是由OLS残差计算出的自相关系数,并将自相关系数用“*”号图形化显示。

对于自回归误差模型的输出结果,首先给出Preliminary MSE = 1.794304为最大似然估计迭代计算开始的初始Yule-Walker估计值。然后给出了在原假设时间间隔为1和2的自相关系数为0情况下,1阶和2阶自相关系数检验统计量、标准差和t值,从t=-7.890和3.681来分析,它们的绝对值都很大,拒绝1阶和2阶自相关系数为0的原假设。自回归误差模型的回归结果同样包括回归统计量和参数估计表,表的形式与OLS输出表一样。参数估计表显示了回归系数的ML估计,比OLS输出的参数估计表多二个附加行,被标记为A(1)和A(2),分别来显示自回归误差的一阶系数和二阶系数的估计值。估计模型为:

xt?7.883338?0.509553t??t?t?1.246428?t?1?0.628285?t?2?at

估计Var(at)?1.710916(40.83)

请注意SAS系统的autoreg过程输出的自回归误差?t的估计参数符号与上式中正好相反。最后显示了基于假设自回归参数的估计值就等于真实参数值的情况,重新计算了参数的标准误差和t值,如重新

计算截距7.883338的标准差为1.1678而不是1.1693。

比较自回归误差模型和普通最小二乘法回归模型,由残差计算的整体R统计量0.9542>0.8200,这反映了由于过去残差的使用而改进了拟合模型,将会使下一个预测值更准确。显然,自回归误差模型部分R统计量总是小于普通最小二乘法回归模型部分R统计量,0.7280<0.8200,这是因为在部分模型时,普通最小二乘法回归已经达到最优,它的部分模型R统计量与整体模型R统计量是相等的。

上海财经大学经济信息管理系IS/SHUFE

Page 29 of 32

222226009221.doc

商务数据分析

电子商务系列

自回归误差模型的信息准则SBC和AIC值都分别比OLS模型的SBC和AIC值小,如133.4765<173.6591,127.1424<170.4921,同样说明估计模型(40.83)式比估计模型(40.82)式要好。对于自回归误差模型的MSE为1.710916,此值远小于真实值4,而对于OLS模型的MSE为6.32216,此值远大于真实值4,从MSE值的大小对比中,也可以得出自回归误差模型较好。要注意在小样本情况下,自回归误差模型倾向于低估?2,而OLS模型倾向于高估?2。最后,我们还注意到,自回归误差模型的DW统计量为2.2761,接近2,残差序列不相关,而OLS模型的DW统计量为0.4752,接近0偏离2,残差序列正相关,同样可以得出自回归误差模型已经完全提取了内在规律的信息,只剩下纯随机波动。

比较图40-8中OLS模型的趋势线和图40-9中AR(2)模型的趋势线,趋势线公式分别为:

OLS:xt?8.230758?0.502110tAR(2):xt?7.883338?0.509553t5. 预测自回归误差模型

data randar37; x=. ;

do t=37 to 46; output; end; run;

data randar37;

merge randar randar37; by t; run;

proc autoreg data=randar37; model x=t /nlag=2 method=ml;

(40.84)

output out=poutp p=xhat pm=trendhat lcl=lcl ucl=ucl; run;

proc gplot data=poutp;

plot x*t=1 xhat*t=2 trendhat*t=3 lcl*t=3 ucl*t=3/overlay href=36.5; symbol1 v=star i=none c=red h=2.5; symbol2 v=plus i=join c=blue h=2.5 l=1; symbol3 v=none i=join c=green w=2 ; title1 'Auto-Regression:AR(2)'; title2 'predict estimation'; run;

程序说明:为了产生将来时间间隔上的预测值,我们需要在输入数据集中预先增加将来时间。对

于独立回归变量t应增加将来时间间隔值,而对应的因变量x,预测观察值应该先置为缺失值。第一个data randar37过程,生成时间间隔t从37到46,x为缺失值的10条观察的数据集randar37。第二个data randar37过程,将第一个过程生成的数据集randar37中的10条观察加到模拟数据集randar后,生成一个新的增大数据集randar37。第三个proc autoreg过程,使用新的增大数据集randar37进行自回归误差模型拟合,拟合自回归误差模型为公式(40.83),拟合的预测趋势线是 (40.83)式中的部分模

上海财经大学经济信息管理系IS/SHUFE

Page 30 of 32

6009221.doc

商务数据分析

电子商务系列

型公式(即不包括自回归误差?t)。通过output语句将预测值(xhat)、预测趋势(trendhat)、以及95%置信上限(ucl)和置信上限(lcl)输出到poutp数据集中。第四个proc gplot过程,绘制原始值、预测值、趋势值和置信限的散布图。在时间t=36.5处画一条垂直参考线(选项href=36.5)表示将来时间间隔上的预测值从这里开始。请注意,预测考虑了对于趋势的偏离但对于较长的预测收敛回到趋势直

线上,但同时置信区间却是变大。

图40-10 autoreg过程拟合模型的未来10期预测值

6. 逐步自回归

proc autoreg data=randar;

model x=t /nlag=5 method=ml backstep; title 'Auto-Regression:Backstep'; run;

程序说明:一旦通过模型的自相关系数检验,确定需要做自相关性校正,那么必须选取要用的自回归误差模型的阶。一种好的方法是通过逐步自回归来寻找这个阶数。逐步自回归方法最初拟合一个长阶自回归模型,然后逐步去掉自回归参数直到所剩下的自回归参数都有显著t检验为止。为了使用逐步自回归,在proc autoreg过程的model语句中使用backstep选项,并用nlag=选项指定一个长阶。在指定长阶时,一个好的想法是指定大于任何潜在季节性的阶值,例如,对于月度数据,取nlag=13;对于季度数据,取nlag=5。程序运行后结果见表40.5所示。

表 40.5 逐步自回归

上海财经大学经济信息管理系IS/SHUFE

Page 31 of 32

Autoreg Procedure Dependent Variable = X Ordinary Least Squares Estimates SSE 214.9534 DFE 34 商务数据分析 电子商务系列 MSE 6.32216 Root MSE 2.514391 SBC 173.6591 AIC 170.4921 Reg Rsq 0.8200 Total Rsq 0.8200 Durbin-Watson 0.4752 Variable DF B Value Std Error t Ratio Approx Prob Intercept 1 8.230758 0.8559 9.616 0.0001 T 1 0.502110 0.0403 12.447 0.0001 Estimates of Autocorrelations Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 0 5.970929 1.000000 | |********************| 1 4.516919 0.756485 | |*************** | 2 2.024114 0.338995 | |******* | 3 -0.44021 -0.073725 | *| | 4 -2.11748 -0.354632 | *******| | 5 -2.85343 -0.477887 | **********| | Backward Elimination of Autoregressive Terms Lag Estimate t-Ratio Prob 4 -0.052908 -0.1983 0.8442 3 0.115986 0.5746 0.5698 5 0.131734 1.2139 0.2340 Preliminary MSE = 1.794304 Estimates of the Autoregressive Parameters Lag Coefficient Std Error t Ratio 1 -1.16905667 0.148172 -7.890 2 0.54537934 0.148172 3.681 Maximum Likelihood Estimates SSE 54.7493 DFE 32 MSE 1.710916 Root MSE 1.30802 SBC 133.4765 AIC 127.1424 6009221.doc 对表40.5中的输出结果分析。结果显示了5个时间间隔的自相关系数的估计。自回归项向后消除报告显示了在时间间隔4、3、5时自回归不显著(0.8442>0.05、0.5698>0.05、0.2340>0.05),即不能拒绝在这些时间间隔上自相关系数为0的原假设,因此被消除。而在时间间隔1、2时自回归显著,因此被保留下来。接下来就拟合二阶自回归误差模型,拟合结果与表40.4中的输出结果相同,在此不做重复介绍。自回归参数的缺省显著水平为0.05 ,可以通过在model语句中用slstay=选项来控制此显著水平。

上海财经大学经济信息管理系IS/SHUFE

Page 32 of 32