Santa-Clara和Valkanov,2004)认为通过非线性估计方法优化MIDAS回归方程中权重函
?所绘出的权重函数图形中可以获得滞后阶数的最优长度数中的参数向量θ,得出的参数θ
,这样确定的滞后阶数完全是数据驱动的,所以是最优的。然而在宏观经济的实际运用
中,滞后阶数的选择具有任意性和经验性的特点,也有部分的学者使用AIC和BIC准则作为滞后阶数的选择标准。
(三)MIDAS模型的扩展
MIDAS模型自吉塞尔斯等人 (Ghysels,Santa-Clara和Valkanov,2004)提出以来,发展相当迅速,具有非常强的扩展性。目前该模型已经结合AR模型、非对称模型、因子模型、状态空间模型,以及半参数和非参数模型,下面选择几种扩展形式做简单的介绍。
1、MIDAS-AR模型
MIDAS法的一个基本拓展是在模型中加入自回归因子,吉塞尔斯等人(Ghysels,Santa-Clara和Valkanov,2004)认为在MIDAS模型中引入滞后被解释变量将导致模型有效性的损失,只有当解释变量中包含季节因素时才能使用。克莱蒙茨和加维奥(Clements和Galv?o,2005)提出将动态自回归作为一般因素引入模型解决了这个问题,则包含一阶自回归的h步向前预测模型可以表示为:
m)(m)
yt=β0+λyt?1+β1B(L1/m;θ)(1?λL)xt(? (9) h+εt该模型的估计可以先通过估计方程(2)得到标准MIDAS方程的残差,然后估计λ的
?1
?y和x*=x?λ?x,并使用非线性?=(ε?2)?ε?。接着构造y*=y?λ初值λε0
①
∑
t?h
∑
tt?htt0t?ht?ht?h0t?2h
最小方法估计如下的模型,即可得到模型的参数估计。
yt*=β0+β1B(L1/m;θ)xt*?h+εt (10)
2、非对称MIDAS模型
吉塞尔斯等人(Ghysels,Santa-Clara和Valkanov,2005)引入了非对称MIDAS模型,模型形式如下:
m)1/mm)(m)
(11) yt=β0+β1(φB(L1/m;θ+)1t+?1xt(?;θ?)1t??1xt(?1+(2?φ)B(L1)+εt
其中1it?1(i={+,?})是一个指标函数,分别当xt?1>0或xt?1<0时其值都为1。该模型度量正负x冲击对y的有差别的影响。参数φ的取值区间为[0,2]保证了权重和为1。通过估
计参数φ即可获得高频数据中正负冲击对低频数据的影响。
3、半参数或非参数MIDAS模型
半参数或非参数MIDAS模型是陈和吉塞尔斯(Chen和Ghysels,2008)基于林顿和马门(Linton和Mammen,2005)的半参数ARCH(∞)提出来的,主要应用于高频金融时间序列的混频建模,基本形式如下:
yt+1=β0+∑∑BijL1/Mi,θm(xt(mi))+εt (12)
i=1j=1K
L
()其中m(?)是一个未知函数,陈和吉塞尔斯(Chen和Ghysels,2008)提供了该模型的估计方法,并通过实证得出了该模型的有效性优于同频数据模型。
除此之外,该模型在经济金融领域应用还结合了因子模型、状态空间模型等,这里就不再赘述。
①
?所绘出的权重函数图形在第j阶滞后趋于零,就可以将滞后阶数选为K=j。 如果优化后的参数θ
27
二、MIDAS方法在我国宏观经济中的实证分析
MIDAS模型在宏观经济和金融中运用都无一例外地显示了其在利用高频数据建模方面的比较优势,然而MIDAS模型在中国股票市场波动的实证研究中,徐剑刚、张晓蓉、唐国兴(2007)使用MIDAS模型和ABDL模型(安德森等人(Andersen,Bollerslev,Diebold和Labys,2003)采用分数自回归(ARFI)模型预测未来波动的模型)并利用上证指数和深成指的5分钟数据来预测股票市场的波动率,其实证结果表明ABDL模型在预测波动方面优于MIDAS模型,这与吉塞尔斯等人(Ghysels,Santa-Clara和Valkanov,2006)对美国股票市场波动的分析认为MIDAS模型优于ABDL模型相矛盾。孔等人(Kong,liu和wang,2008)使用MIDAS和GARCH方法研究中国股票市场波动过程,其结果表明GARCH模型比MIDAS模型更好地预测可实现方差中的极值波动,而MIDAS模型在预测条件方差方面比GARCH模型要好。鉴于MIDAS模型在中国金融市场波动方面并不完全具有比较优势,因此下文将通过MIDAS的蒙特卡洛模拟和MIDAS的实证研究初步探讨MIDAS模型在中国宏观经济方面的应用有效性。
(一)中国宏观经济中的混频数据
在分析MIDAS模型在中国宏观经济应用有效性方面涉及到中国混频数据的使用,本
??t和1992年1月到文使用1992年第1季度到2009年第4季的GDP增长率的同比变化率y
??t(3)来构建MIDAS模型,2009年12月的月度通货膨胀率的同比变化率x混频数据的图形如
图2所示,从图中可以看出中国宏观经济数据多是混频数据,在年度数据的区间内包含有
大量的季度和月度数据,如果仅使用低频数据建模,就会忽略原始数据的信息,方程的参数估计准确性和模型的预测精确度就会降低,甚至会出现偏误,因此如何充分利用高频数据的信息用于宏观经济分析和预测是值得分析和探讨的。
图2 中国混频数据图形
(%)年度国内生产总值增长率 月度通货膨胀 (用CPI数据计算) 季度通货膨胀 (当季月度数据平均值) (%)季度国内生产总值增长率 季度通货膨胀 (季末月度数据替代) 2515102050152000200120022003200420052006200720082009(年)1050199319951997199920012003200520072009(年) 28
(二)MIDAS模型有效性的蒙特卡洛模拟
本文参考安德烈乌等人(Andreou,Ghysels和Andreou,2010)的蒙特卡洛方法构建服从正态分布(具有平稳特征的序列)、自回归过程 (具有自相关性特征的序列)和自回归条件异过程(具有波动聚类特征的序列)三种不同形态的高频数据,并设定不同的样本长度、权重函数形式、滞后阶数和信噪比程度来度量MIDAS模型在不同情况下对各种时间序列数据估计的有效性。
1、蒙特卡洛模拟的数据生成
首先,构造三种不同的高频时间序列数据用于MIDAS模型有效性的模拟。
第一种:构造服从正态分布的平稳高频时间序列数据,即xt(m)~i..id.N(0,1); 第二种:构造服从自回归过程的高频时间序列数据,即xt(m)=(σt(m))2et(m),其中
m)2
??t(???(m)et(m)~i..id.N(0,1),并选取c0=0.25,c1=0.85。id.N(0,1),(σt(m))2=c0+c1(x 1),xt?1~i..
m)(m)
??t(?第三种:构造服从自回归条件异方差的高频时间序列数据,即xt(m)=c+φx,1+et
m)
??t(?其中et(m)~i..id.N(0,1),xid.N(0,1),并选取c0=0.25,c1=0.85。 1~i..
其次,使用两参数的指数Almon权重构造低频数据。本文约束θ0≤300,θ1<0,即以构建符合宏观经济实际的递减型权重函数,并在此约束的基础上构建快速衰减权重函数
(θ0=7×10?4,θ1=?5×10?2) 和缓慢衰减权重函数 (θ0=0,θ1=?5×10?4),并依据yt=β0+β1B(L1/m;θ)xt(m)+ut构建低频数据,其中B(L1/m;θ)表示两参数的指数Almon权重
id.N(0,0.125)。本文将参数β0和β1初函数,xt(m)是上述三种不同形态的高频数据,ut~i..
始值分别选取β00=0.5,β10=0.5、β10=2和β10=4,其中上述β1的初始值分别表示低、中和高信噪比 (SNR,Signal to Noise Ratios)。
2、蒙特卡洛模拟的数据
我们选择样本长度T=200、T=500和T=1000的低频数据,选择频率倍差m=5、
m=50和m=100(为了模拟的简便起见,本文选择与频率倍差相等的滞后阶数) 分别构建MIDAS模型的数据,再使用NLS (非线性最小二乘估计法) 对模型中的参数β1进行估计,同时将MIDAS模型中的高频数据通过等权重处理为低频数据,再使用OLS (普通最小二乘法)估计同频数据中的参数β1。最后,本文对上述估计进行1000次的模拟①,得
?与真实值β0的误差平方和MSE,并使用出两种方法的参数估计值β1
1
RMSE=MSELS/MSENLS度量MIDAS模型在不同的情形下有效性,若RMSE越大,则
MIDAS模型估计β1的误差相对于同频数据估计的误差就越小,说明MIDAS模型估计有具体情况如表1所示。 效。表1给出了在不同参数设定条件下蒙特卡洛模拟得出的RMSE,
从蒙特卡洛模拟的结果可以看出MIDAS模型的有效性受以下几个方面因素的影响,首先,MIDAS模型的NLS估计结果受到样本长度T、滞后阶数m,一般来说样本长度越
①
这里选择进行1000次的蒙特卡洛模拟是根据对RMSE结果再进行100次的模拟发现模拟出的RMSE波动非常小,其偏差不超过均值的5%,因此认为1000次蒙特卡罗模拟出的RMSE是稳定的,当然如果要求更加稳定的RMSE值,蒙特卡罗模拟的次数越多越好,鉴于计算机计算速率和本文精度要求,本文选择模拟1000次是有说服力的。
29
长、滞后阶数越长,表中的RMSE就越大①,MIDAS混频数据模型的有效性就更加突出;其次,本文在构建MIDAS模型时设定了三种不同信噪比,从表中可以看出信噪比程度越高,RMSE就越大,使用MIDAS模型估计就非常越有必要 (从图3中第三行的三个图可以直观看出,其他情况一致的条件下,信噪比程度越高,估计结果的分布就越集中于参数的真实值);第三,通过比较三种形态的时间序列数据我们可以看出,MIDAS模型在估计服从AR(1)的高频数据中最为有效,随后是 ARCH(1),估计服从独立同分布的正态高频数据时的优势不是非常明显,尤其是在样本长度短、信噪比低的时候,MIDAS模型的优势体现不出来。最后,从表1上下两个部分的对比可以看出,MIDAS模型在快速递减权重的模型中具有非常大的优越性 (从图3也可以看出),而在缓慢递减权重的模型中,
MIDAS模型的优越性并不突出,甚至在滞后阶数较低的情况下,其估计比OLS估计的同频数据模型的结果还要差。
表1 MIDAS模型有效性的蒙特卡洛模拟
①
如图3中第一行 (第二行),当其他条件不变的情况下,样本长度越长 (滞后阶数越长),MIDAS模
?的分布就越接近于真实值,说明估计效果越明显。而同频数据估计出的β?的分布都比较型估计出的β1
1
发散,说明其估计结果不具有优越性,只有当滞后阶数较小时,同频数据和混频数据模型估计结果才比较接近。 30