yit = ?i + Xit '? +?i
?i,?it服从独立同分布。对其作如下变换
?)? + (Xit -??X)'? + vit (29) ?y= (1-?yit -?ii?)?i + (?it -???)渐近服从独立同分布,? = 1-其中vit = (1-?i?????T??22,应用OLS估计,
?= 0时,则所得估计量称为随机效应估计量或可行GLS估计量。当?(29)式等同于混合OLS?=1时,估计;当?(29)式等同于离差变换OLS估计。
对于随机效应模型,可行GLS估计量不但是一致估计量,而且是有效估计量,但对于
个体固定效应模型,可行GLS估计量不是一致估计量。
面板数据模型估计量的稳健统计推断。在实际的经济面板数据中,N个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。
对于第i个个体,当N??,Xi?的方差协方差矩阵仍然是T?T有限阶的,所以可以用以前的方法克服异方差。采用GMM方法还可以得到更有效的估计量。
EViwes中对随机效应回归模型的估计采用的就是可行(feasible )GLS估计法。
4.面板数据模型设定的检验方法
面板数据建模的一项重要任务就是判别模型中是否存在个体固定效应。以个体随机效应模型yit = ?i + Xit '? +?it,为例,无论是固定效应还是随机效应模型,?i都被看作是随机变量,并都有假定条件
E(yit ??i, Xit) = ?i + Xit '?
下面介绍两种检验方法,F检验和Hausman检验。
4.1 F检验
先介绍原理。F统计量定义为 F =
(SSEr?SSEu)/m (30)
SSEu/(T?k)其中SSEr 表示施加约束条件后估计模型的残差平方和,SSEu 表示未施加约束条件的估计模型的残差平方和,m表示约束条件个数,T 表示样本容量,k表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下,F统计量渐近服从自由度为( m , T – k )的F分布。
F ? F( m , T – k )
以检验建立混合回归模型还是个体固定效应回归模型为例,介绍F检验的应用。建立假设
H0:?i =?。模型中不同个体的截距相同(真实模型为混合回归模型)。 H1:模型中不同个体的截距项?i不同(真实模型为个体固定效应回归模型)。 F统计量定义为:
F=
(SSEr?SSEu)/[(NT?k)?(NT?N?k)](SSEr?SSEu)/N= (31) SSEu/(NT?N?k)SSEu/(NT?N?k)148
其中SSEr表示约束模型,即混合估计模型的残差平方和,SSEu表示非约束模型,即个体固定效应回归模型的残差平方和。约束条件为N个。k表示公共参数个数。
以案例1为例,已知SSEr= 4824588,SSEu=2270386,个体数15。
F=
(SSEr?SSEu)/N(4824588?2270386)/15=
SSEu/(NT?N?k)2270386/(105?15?2)170280= 6.6 (32) 25799F0.05(15, 88) = 1.8
=
因为F= 6.6 > F0.05(15, 88) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型比混合回归模型更合理。
以检验建立混合回归模型还是时点固定效应回归模型为例,介绍F检验的应用。建立假设
H0:?t =?。模型中不同截面的截距相同(真实模型为混合回归模型)。
H1:模型中不同截面的截距项?t不同(真实模型为时点固定效应回归模型)。 F统计量定义为:
F=
(SSEr?SSEu)/[(NT?k)?(NT?T?k)](SSEr?SSEu)/T= (31)
SSEu/(NT?T?k)SSEu/(NT?N?k)其中SSEr表示约束模型,即混合估计模型的残差平方和,SSEu表示非约束模型,即时点固
定效应回归模型的残差平方和。约束条件为T个。k表示公共参数个数。
以案例1为例,已知SSEr= 4824588,SSEu= 4028843,截面个数7。
F=
(SSEr?SSEu)/T(4824588?4028843)/7= 4028843/(105?7?2)SSEu/(NT?N?k)113678= 2.7 (32) 41967=
F0.05(7, 96) = 2.1
因为F= 2.7 > F0.05(15, 88) = 2.1,推翻原假设,比较上述两种模型,建立时点固定效应回归模型比混合回归模型更合理。
4.2 Hausman检验
原假设与备择假设是
H0: 个体效应与回归变量无关(个体随机效应回归模型) H1: 个体效应与回归变量相关(个体固定效应回归模型) 例:
?=0.6976,s(??) = 0.0127(个体固定效应回归模型估计结果,对应图10); ?WW~~?RE=0.7246,s(?RE) = 0.0106(个体随机效应回归模型估计结果,对应图13)
~2???(0.6976?0.7246)2(?)WRE H = = = 14.89 22~22?0.0127?0.0106s(?W)?s(?RE)因为H =14.89 > ?20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回
149
归模型。
注意:EViews 5.0可以直接进行Hausman检验(见案例9)。
5.面板数据建模案例分析 案例1(file:5panel02):图14是混合估计对应数据的散点图。回归结果如下(EViwes输出见案例),
CP = 129.63 + 0.76 IP
(2.0) (79.7)
110001000090008000CP9000pooled regression80007000between regression7000600050004000300020002000400060008000IP100001200014000CPMEAN60005000400030004000500060007000800090001000011000
IPMEAN 图14 混合估计散点图 图15 平均数估计散点图
图15是平均值数据散点图。先对数据按个体求平均数CP和IP。然后用15组平均值数据回归,
CP= -40.88 + 0.79IP
(-0.3) (41.1)
12000within regression80002400first diffrence3 regression200016004000IPMDIP12008000-40004000-8000-6000-4000-20000CPM2000400060000400800DCP120016002000 图16 离差变换估计散点图 图17 差分估计散点图
图16是离差变换数据散点图。先计算CP、IP分别对CP、IP的离差变换数据,然后用离差变换数据计算OLS回归。
CPM = 0.77 IPM
(90)
图17是一阶差分数据散点图。先对CP、IP各个体作一阶差分,然后用一阶差分数据回归。
DCP = 0.71 DIP
150
(24)
由上一节知此问题应该建立个体固定效应回归模型,所以离差变换OLS估计方法是最有效的,参数估计值0.77最可信。
案例2 美国公路交通事故死亡人数与啤酒税的关系研究(file:5panel01a)
见Stock J H and M W Watson, Introduction to Econometrics, Addison Wesley, 2003第8章。美国每年有4万高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨1?3点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有1982?1988年48个州共336组美国公路交通事故死亡人数(number)与啤酒税(beertax)的数据。
VFR82 vs. BEER824.54.03.5VFR82VFR88 vs. BEER883.63.22.8VFR880.40.81.21.62.02.42.83.02.52.01.51.00.02.42.01.61.20.00.40.81.2BEER881.62.02.4BEER82 图18 1982年数据散点图(File: 5panel01a-graph01) 图19 1988年数据散点图(File:5panel01a- graph07)
1982年数据的估计结果(散点图见图18)
number1982 = 2.01 + 0.15 beertax1982
(0.15) (0.13)
1988年数据的估计结果(散点图见图19)
?number1988 = 1.86 + 0.44 beertax1988
(0.11) (0.13)
4.54.03.53.0VFR?2.52.01.51.00.50.00.40.81.21.62.02.42.8 图20 混合估计共336个观测值。估计结果仍不可靠。(file: 5panel01b)
1982?1988年混合数据估计结果(散点图见图20)
?BEERTAXnumber1982?1988 = 1.85 + 0.36 beertax1982?1988
(42.5) (5.9) SSE=98.75
显然以上三种估计结果都不可靠(回归参数符号不对)。原因是啤酒税之外还有许多因
151