经济科学·2010年第5期
?
中国宏观经济混频数据模型应用
——基于MIDAS模型的实证研究
刘金全 刘 汉 印 重
(吉林大学数量经济研究中心 吉林长春 130012)
摘 要:传统宏观计量模型需要利用加总或插值等方法将混频数据统一到同频数据再应用于宏观经济模型中。而混频数据模型是直接利用混频数据构建模型,避免了因数据加总或插值导致的信息损失和人为信息的虚增,充分利用了现有高频数据的信息,改进了宏观计量模型估计的有效性和预测的精度。混频数据抽样模型(MIDAS)是混频数据模型的一种,它使用参数控制的滞后权重多项式函数对高频滞后数据进行有权重的加总并构建模型,再通过数值优化和非线性的方法估计混频数据模型中的最优参数。MIDAS模型是攫取现有高频数据的全样本信息用于宏观经济和金融的分析与预测的有效方法,本文基于该模型的实证研究探寻混频数据在中国宏观经济应用中的有效性。
关键词:混频数据 MIDAS模型 宏观经济 有效性
一、引 言
宏观经济中有诸多能反映当前宏观经济状态和未来宏观经济走势的经济数据,如季度GDP数据、月度CPI和PPI数据、金融市场收益的日数据、股票市场波动的日内数据等等。这些数据受到经济个体、企业、组织和国家,甚至是国际社会的广泛关注,人们试图使用不同的数据处理方法和构建各种模型从这些纷繁复杂的数据中攫取信息,以便得出当期宏观经济的准确预报和未来一段时间内宏观经济走势的精确预测。然而,在构建宏观计量模型时却经常出现数据抽样的频率高低有别的问题,而大多数宏观计量模型都要求模型等式两边的数据频率一致,因此要想利用传统的宏观计量模型去估计、预报和预测宏观经济就必须对混频数据进行处理,有的采用加总或替代的方法将高频数据处理为低频数据 (Silvestrini和Veredas,2008),有的采用插值法将低频数据处理为高频数据 (Chow和Lin,1971;1976、赵进文和薛艳,2009),但是这两种方法经常受到质疑,人们认为加总或替代法在数据处理过程中忽视了高频数据中部分样本信息,抹杀了高频数据的波动,在一定
*
基金项目:国家自然科学基金项目“非线性随机波动模型估计方法及应用研究”(70971055);教育部人文社会科学重点研究基地2008年度重大项目“我国经济周期波动态势与宏观经济总量内在关联机制的动态计量研究”(08JJD790133);吉林大学“211工程”和“985工程”建设项目资助。作者:刘金全,吉林大学数量经济研究中心教授,经济学博士,博士研究生导师;刘汉,吉林大学数量经济学专业博士研究生;印重,吉林大学数量经济学专业博士研究生。
23
程度上人为地减少了样本信息,但是由于该方法的简便易行,在实际应用中基本上都采用这种方法;而插值法在应用上相对较少,但是对该方法的研究却相当多。人们普遍认为插值法虽然能获得高频数据,但是这种高频数据一定程度上有人为构造的嫌疑,因此使用这种高频数据建模时都非常谨慎,这也是该方法在实际应用中使用较少的重要原因。
混频数据模型不对混频数据做任何处理,而是充分利用原始数据的信息构建混频数据模型。当前处理混频数据的模型主要有混合数据抽样(MIDAS,MIxed DAta Sampling)模型和混频向量自回归移动平均(VARMA)模型。MIDAS模型是吉塞尔斯等人(Ghysels,Santa-Clara和Valkanov,2004)在分布滞后模型的基础上提出来的混合数据抽样,MIDAS模型的提出的初衷是想利用混频数据模型从高频金融数据中攫取信息来预测金融市场的波动 (MIDAS在金融方面的应用如:Ghysels,Santa-Clara和Valkanov,2005;2006、Forsberg和Ghysels,2007、Chen和Ghysels,2008等等)。克莱蒙茨和加维奥 (Clements和Galv?o,2005)开始将MIDAS模型应用于宏观经济领域,马赛林诺和舒马赫(Marcellino和Schumacher,2007)将因子模型引入到MIDAS模型,模型的预测结果显示MIDAS模型在短期预测中表现优秀,且非限制MIDAS模型在很多实际预测中具有最佳的预测效果。克莱蒙茨和加维奥(Clements和Galv?o,2008)使用MIDAS-AR模型并运用1959年到2005年的工业产出、就业率和产能利用率这三个月度指标预测美国季度产出增长率,结果显示MIDAS模型在宏观经济总量的短期预测方面具有比较优势。霍格雷夫(Hogrefe,2008)比较了单频,混频、邹和林(Chow和Lin1971)的插值法在预测美国GDP的修订数据中的优劣,研究结果认为MIDAS模型在样本外预测中表现最好。吉塞尔斯和赖特(Ghysels和Wright 2009)利用MIDAS和卡尔曼滤波,利用高频日数据实现了对实际GDP增长率、通货膨胀率、短期国库券和失业率的预测,其结果表明MIDAS比简单的随机基准预测要好。克莱蒙茨和加维奥(Clements和Galv?o,2009)使用多种先行指数的多变量MIDAS模型来预测美国产出,结果表明使用MIDAS具有比较优势,预测结果比AR模型要好。另一种处理混频数据的模型是由扎德罗兹尼(Zadrozny,1988)提出的用于连续混频时间序列的VARMA模型,随后扩展到离散混频时间序列的VARMA(Zadrozny,1990;2008),该模型的基本思想将低频数据看作是有循环缺省值的高频数据(如季度数据看可以看作是该季末月度数据的值,如:2010年第1季度数据可以看作是2010年3月份的数据,其它月份的数据视作缺省值),然后运用卡尔曼滤波方法估计具有状态空间形式的混频VARMA模型和缺省的高频数据。扎德罗兹尼(Zadrozny,2008)的研究结果显示使用状态空间的VARMA模型预测美国的GNP比使用自回归模型要有更好的预测效果。
本文首先模拟不同样本长度、滞后阶数和各种高频数据形式的MIDAS模型,并使用蒙特卡洛模拟探寻影响MIDAS模型有效性的主要因素。然后,通过比较传统同频数据模型 (加总法和插值法)和MIDAS混频数据模型在中国宏观经济分析和预测方面的优劣,分析混频数据模型在我国宏观经济中的有效性①,模型估计结果显示混频数据模型的参数估计和方差都要比传统的同频数据要好,初步说明MIDAS模型在中国宏观经济中的应用是有效的,值得进一步地探索和挖掘。
①
目前将MIDAS混频模型应用到我国宏观经济研究的文献还没有,但是对于中国股票市场的研究已经有相关的文献 (徐剑刚、张晓蓉和唐国兴,2007年;Kong,Liu和Wang,2008),但MIDAS的有效性并没有得到完全证实,徐剑刚、张晓蓉和唐国兴(2007)甚至认为MIDAS不如安德森等人(Andersen,Bollerslev,Diebold和Labys,2003)的分数自回归(ARFI)模型。
24
二、MIDAS模型简介
吉塞尔斯等人(Ghysels,Santa-Clara和Valkanov,2004)提出的MIDAS混频数据模型源于分布滞后模型的思想,主要应用于金融市场波动和预测方面,目前该方法在预报当前宏观经济状态,分析和预测未来宏观经济走势方面也有广泛的应用。
(一)基础MIDAS模型及其设定
为了更加清晰理解MIDAS的构建过程,本文首先给出分布滞后模型,其表示方法如下:
yt=β0+B(L)xt+εt (1)
其中,B(L)是由有限或者无限滞后多项式算子,模型假设数据具有相同的频率。
MIDAS模型不是严格意义上的分布滞后模型,其最显著的特点是能够处理混频数据,并能获得优于分布滞后模型的参数估计结果(Ghysels,Santa-Clara和Valkanov,2004)。
,等式右边的高频数假定在MIDAS回归模型中,等式左边的低频数据为yt(t=1,??,T)
据为xτ(τ=1,??,mT),令xt(m)=xτ,其中m表示混频数据的频率倍差,即xt(m)在t?1期到t期进行了m次抽样。则MIDAS回归模型即可表示为如下的形式:
yt=β0+β1B(L1/m;θ)xt(m)+εt(m) (2)
其中,滞后算子多项式B(L1/m;θ)=∑k=0B(k;θ)Lk/m是参数向量θ的一个函数,L1/m是
m)
高频数据的滞后算子,如L1/mxt(m)=xt(?1/m,K是高频数据的滞后阶数。
K
假设宏观经济中,yt是季度数据序列,xt(m)是与yt在同一样本期间内抽样m次的高频数据,若m=3,则xt(m)相对来说就是一个月度数据序列,若yt为2010年第一季度的数据,
(3)则xt(3)表示2010年3月的数据,xt(3)?1/3表示2010年2月的数据,xt?1表示2009年12月的
数据。一个滞后阶数K=12的MIDAS宏观经济模型为:
yt=β0+β1B(L1/3;θ)xt(3)+εt(3)
(3)(3)
=β0+β1[B(0;θ)xt(3)+B(1;θ)xt(3)?1/3+??+B(12;θ)xt?12/3]+εt
(3)
(二)MIDAS模型中的设定问题
MIDAS模型估计中关键问题是权重函数B(k;θ)中的参数向量θ和滞后阶数K的选取,这涉及权重函数的选择,本文给出应用于宏观经济中的三种常用的有限和无限权重多项式函数B(k;θ)。
第一种是Almon多项式函数,其基本形式为:
θ0+θ1k+θ2k2??θpkp
B(k;θ)=K (4)
2p
∑k=1(θ0+θ1k+θ2k??θpk)第二种为Almon多项式函数的变形,称为指数Almon多项式函数,它是目前使用最多的一种多项式函数形式,它能构造各种不同的权重函数(如图1所示),它能够保证权重数为正数,且能使方程获得零逼近误差的良好性质(Ghysels和Valkanov,2006),具体形式为:
exp(θ0+θ1k+θ2k2??θpkp)
(5) B(k;θ)=K
p2
??θθθθexp(+k+kk)∑k=1p012
25
第三种为β多项式函数,该多项式函数是仅带有两个参数的β多项式函数,它同样也能构造多种形态的权重函数①,函数的具体形式可以表示为:
f(k/K,θ1;θ2)
B(k;θ1,θ2)=K (6)
∑k=1f(k/K,θ1;θ2)
其中,
xa?1(1?x)b?1Γ(a+b)
f(x,a,b)= (7)
Γ(a)Γ(b)
Γ(a)=∫e?xxa?1dx (8)
0∞
MIDAS模型中,上述三种权重函数均能保证高频滞后阶数的权重函数为正,且上述权重的函数定义中暗含了权重之和为1的假设。第一个多项式函数在金融市场波动的预测和分析中使用较多,第二和第三个多项式函数在宏观经济的分析与预测中应用比较多,MIDAS模型应用于宏观经济,其多项式函数的形式常常选取两参数的指数Almon多项式函数,吉塞尔斯等人 (Ghysels,Sinko和Valkanov,2007)的表明指数Almon多项式函数能够构造丰富的滞后多项式函数 (如图1所示),但在宏观经济模型的构造过程常常约
,以保证滞束指数Almon多项式函数的参数θ1≤300,θ2<0(Clements和Galv?o,2005)后高频数据对应的权重函数在宏观经济应用中是递减的。
图1 四种不同形态的指数Almon权重函数
0.080.06权重权重递减型权重函数B(k;θ) 0.150.12递增型权重函数B(k;θ) 0.040.02θ=7 ×10?4,θ= ?5 ×10?3210.090.060.03θ= ?7 ×10?4 ,θ= 2 ×10?32100.080.06权重612182430364248滞后阶数先降后升型权重函数B(k;θ) 00.040.03权重612182430364248滞后阶数先升后降型权重函数B(k;θ) 0.04θ=0.2,0.0206θ= ?5 ×10?3210.020.01θ= ?0.2,θ= 4×10?32112182430364248滞后阶数0612182430364248滞后阶数 MIDAS模型设定的另一个关键问题是高频数据滞后多项式的选择问题,这涉及在模
型的估计和预测中使用多长期间的高频数据来预测低频数据②。吉塞尔斯等人(Ghysels,
①
β滞后多项式函数也能构造出不同的形态的权重函数,限于篇幅所限,本文不列出β滞后多项式函数构造的常见形式,如果读者感兴趣,可向作者索取。
理论上来说,选择的滞后阶数越长就能获得更全的信息,估计模型就越有效,预测就越精准。但是高频数据的滞后会导致数据的损失,长滞后阶数在高频金融数据也许可行,但是宏观经济数据的长度一般都非常短,滞后阶数越长,能用于MIDAS模型中的样本就越少,这样反而会影响模型的估计与预测。
②
26