J.Durbin(杜宾)和G.S.Watson (沃特森)于1951年提出的一种适用于小样本的检验方法。DW检验只能用于检验随机误差项具有一阶自回归形式的序列相关问题。
缺点和局限性:DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断;
DW统计量的上、下界表要求n≥15,这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断;
DW检验不适应随机误差项具有高阶序列相关的检验;
只适用于有常数项的回归模型且解释变量中不能含滞后的被解释变量,并且解释变量是非随机的,数据中无缺失项 四)LM检验
即拉格朗日乘数检验,也可用于检验回归方程的残差序列是否存在高阶自相关,而且在方程中存在滞后因变量的情况下,LM检验仍然有效,由Breusch和Godfrey 于1978年提出,也称BG(GB)检验 (五)补救措施 一)差分法——是将原模型变换为差分模型,分为一阶差分法和广义差分法。
二)广义最小二乘法(GLS)——最具有普遍意义的最小二乘法。其中普通最小二乘法和加权最小二乘法是它的特例。 3.多重共线性的概念、原因、后果、检验及补救措施 (一)概念
多元线性回归模型有一个经典假定,就是要求多元线性回归模型
中的解释变量X
之间无完全的共线性。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。分完全共线性和近似共线性。 (二)原因
经济变量相关的共同趋势;模型中包含的滞后变量;样本资料的限制;利用截面数据建立模型也可能出现多重共线性。
(三)后果
严重多重共线性情形的后果:多重共线性不改变参数估计量的无偏性
多重共线性使参数最小二乘估计量的方差变大,即估计值的精度降低 各个回归系数的值很难精确估计,甚至可能出现符号错误的现象 回归系数对样本数据的微小变化变得非常敏感 (四)检验
一)方差膨胀(扩大)因子法VIF
的大小反映了解释变量之间是否存在多重共线性,经验表明,当
≥10时,就说明解释变量Xj 与其余解释
变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计值。 二)直观判定法 有些解释变量的回归系数所带符号与定性分析结果违背时,可能存在多重共线性问题;一些重要的解释变量在回归方程中没有通过显著性检验时,可初步判断存在着严重的多重共线性;解释变量间的相关系数较大时,可能会出现多重共线性问题;当增加或剔除一个解释变量,或者改变一个观测值时,回归系数的估计值发生较大变化,我们就认为回归方程存在严重的多重共线性;对于采用时间序列数据做样本,以多元线性形式建立的计量经济模型,往往存在多重共线性。 三)特征根判别法
特征根分析——当矩阵X’X至少有一个特征根近似为零时,X的列向量间必存在严重多重共线性。
四)逐步回归检验法
将变量逐个的引入模型,每引入一个解释变量后,都要进行F检验,并对已经选入的解释变量逐个进行 t 检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除,以确保每次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被剔除,因而也是一种检测多重共线性的有效方法。 (五)补救措施 一)使用非样本先验信息——如果据先前的经济计量分析或经济理论分析已知模型中的共线性解释变量的参数间具有某种线性关系,则可利用此条件消除解释变量间的多重共线性。
二)横截面与时间序列数据并用—— 就是先利用横截面数据估计某一参数,将结果代入原方程后,再利用时间序列数据估计另一参数。
三)剔除一些不重要的共线性解释变量——当涉及解释变量较多时,大多数回归方程都受到多重共线性的影响。这时,最常用的办法是首先作解释变量的筛选,舍去一些解释变量。
四)增大样本容量——建立一个实际经济问题的回归模型,如果所收集的样本数据太少,也容易产生多重共线性。从本质上讲,多重共线性是样本现象。
五)逐步回归法——用被解释变量对每一个所考虑的解释变量做简单回归;以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。
六)使用有偏估计——改进古典的最小二乘法,提出以采用有偏估计为代价来提高估计量稳定性的方法,如岭回归法、主成分法、偏最小二乘法等。
4.随机解释变量问题的三种情况、原因、后果及修正方法(IV)
如果存在一个或多个随机变量作为解释变量,则该模型称为随机解释变量问题。 (一)三种情况(假设
为随机解释变量)
随机解释变量与随机误差项相互独立。即Cov(X2t,ut)=0 随机解释变量与随机误差项同期相关,即Cov(X2t,ut)≠0
随机解释变量与同期误差项无关但异期有关,即Cov(X2t,ut)=0 Cov(X2t,ut-s)≠0 (s≠0)
(二)原因
省略解释变量的影响——省略的解释变量同模型中某个解释变量相关易造成解释变量与解释误差项相关 滞后被解释变量做解释变量
联立方程模型中,如果一个变量在一个模型中作为被解释变量,而在另一个方程中作为解释变量,就使该变量成了随机解释变量。
数据测量误差
(三)后果:取决于随机解释变量与随机误差项是否相关
如果随机解释变量与随机误差项相互独立,得到的参数估计量仍然是无偏的,且是一致估计量 如果随机解释变量与随机误差项同期不相关,但异期相关,得到的参数估计量有偏,但却是一致的 如果随机解释变量与随机误差项同期相关,得到的参数估计量有偏但非一致 (四)修正方法 工具变量法(IV):在进行参数估计的过程中选择适当的工具变量,替代回归模型中随机误差项相关性的 变量。
IV估计量仍然是有偏的,但却是一致估计量
第五章 虚拟解释变量模型
1.虚拟解释变量的概念
给定某一质量变量某属性的出现为1,未出现为0,称这样的变量为虚拟变量。虚拟变量主要是用来代表质的因素,但是有些情况下也可以用来代表数量因素。例如在建立储蓄函数时,“收入”显然是一个重要解释变量,虽然是“数量”因素,但是为了方便也可以用虚拟变量表示。 2.虚拟变量的设定原则,注意虚拟变量陷阱
设定原则:如果只有一个质的因素,且具有m个特征,那么如果是含有截距项的,就要引入m-1个虚拟变量;不含有截距项的, 应该引入m个虚拟变量
虚拟变量陷阱:如果虚拟变量设定不当,会使最小二乘法失效,称这种情况为虚拟变量陷阱。在有截距项的情况下,如果一个质的因素有多少个特征就引入多少个虚拟变量是行不通的。 3.虚拟变量引入方法
(一)截距变动(加法模型) 一)包含一个虚拟变量的截距变动模型
假设只有一个质的因素影响被解释变量的变化,而且这个因素仅有两种特征,这时候在有截距项的回归模型中只需要引入一个虚拟变量。
例:用一个虚拟变量来表示这个质的因素,消费函数为
式中,Yi=第i个居民的消费水平,Xi=第i个居民的收入水平,Di为虚拟变量。我们用Di=1表示正常年份这一特征,用Di=0来表示非正常年份。
则
二者具有相同的斜率,但是截距不同。 二)包含多个虚拟变量的截距变动模型
很多质的因素往往不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达国家。 例:模型
入了三个虚拟变量:
,其中,Yt=季度的消费,Xt=季度的收入,对于四个季度,我们引
则 四个季度的回归模型分别为
(二)斜率变动(乘法模型)
在实际问题中,斜率单独变动出现的情形一般比较少,它指的是改变了变动的速率。
例:回归模型
其中,Yi=第 i 个家庭的消费水平,Xi=第 i 个家庭的收入水平
则
(三)截距和斜率同时变动(混合模型)
在多数情况下,质的因素不但对回归模型的截距有影响,而且还会改变模型的斜率。 例:模型
,式中,Yi=第个家庭的消费水平,Xi=第个家庭的收入水平
则
β1和 β3 分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。
第六章 滞后变量模型
1.分布滞后模型的概念及系数含义
滞后模型概念:在经济活动中,某一个经济变量的影响不仅取决于同期各种因素,而且也取决于过去时期的各种因素,有时还受自身过去值的影响。人们把这些过去时期的变量,称作滞后变量,把那些包括滞后变量作为解释变量的模型称作滞后变量模型。
分布滞后模型定义:如果一个回归模型不仅包含解释变量的现期值,而且还包含解释变量的滞后值,则这个回归模型就是分布滞后模型。它的一般形式为
有限分布滞后模型:滞后长度k为一个确定的数
无限分布滞后模型:没有规定最大滞后长度
系数含义:回归系数β0 称为短期(或即期)乘数,它表示解释变量X 变化一个单位对同期被解释变量Y产生的影响;β1,β2,?称为延期(或动态)乘数,它们度量解释变量X的各个前期值变动一个单位对被解释变量 Y 的滞后影响;所有乘数的和
称为长期 (或总分布)乘数,表示X变动一个单位,由于滞后
效应而形成的对Y总影响的大小。 2.有限分布滞后模型估计存在困难 用OLS对分布滞后模型进行估计时存在的困难 产生多重共线问题 损失自由度问题
对于有限分布滞后模型,最大滞后期k较难确定 分布滞后模型中的随机误差项往往是严重自相关的
有限分布滞后模型估计的两种方法:
?经验加权法:指根据观察及经验为滞后变量的系数指定权数,使滞后变量按权数的线性组合,构成新的变量W,然后用最小二乘法估计参数。 步骤:根据经验确定滞后长度 ; 确定
的权数 ;
利用第一组权数构造第一个新的序列;
应用最小二乘法求系数的估计值、,并对估计方程进行统计检验及经济计量检验,记下相应统计量的取值。 按同样的方法重新给定第二组、第三组等权数,并依次构造新的序列,建立新方程; 选优,根据最优权数就可以得到滞后变量对应系数的最优估计值。 ?阿尔蒙多项式估计方法 基本思想:如果有限分布滞后模型中的参数以利用多项式减少模型中的参数。
依据:数学分析的维斯特拉斯定理,多项式可以逼近各种形式的函数。于是,阿尔蒙对模型中的系数
用阶数适当
的分布可以近似用一个关于i 的低阶多项式表示,就可
的多项式去逼近。 优缺点:
优点——克服了自由度不足的问题;阿尔蒙变换具有充分的柔顺性;可以缓解多重共线性问题
缺点——仍没有能够解决原模型滞后阶数k应该取什么值为最好的问题;多项式中阶数m 必须事先确定,而m 的实际确定往往带有很大的主观性;并没能完全消除多重共线性问题对回归模型的影响。 3.自回归模型
自适应预期经济理论假定(解释变量为不可观测变量)
经济理论基础:影响被解释变量Yt的因素不是Xt而是Xt+1的预期
假定:自适应预期假定——预期形成是一个根据预期误差不断调整的过程,预期误差乘以预期调整系数就是两个时期预期值的改变量
不可观测变量的变换方法:引入预期调整系数,通过自适应预期假定,将自适应预期模型变换成一阶自回归模型 部分调整模型的经济理论假定(被解释变量为不可观测变量)
行为假定:模型所表达的不应是t 期解释变量观测值与同期被解释变量观测值之间的关系,而应是t 期解释变量观测值与同期被解释变量希望达到的水平之间的关系。
不可观测变量的变换方法:引入部分调整系数,将部分调整模型变换成一阶自回归模型 4.自适应预期模型的估计(IV),部分调整模型的估计(OLS) 自适应预期模型的估计
一般表达式:
特点:在模型中出现了滞后被解释变量Yt-1作为Yt的解释变量,而Yt-1是随机的,这就违背了解释变量是非随机变量的经典假定,这一点与部分调整模型相同。
模型中的随机误差项存在自相关,违背了经典假设条件。 工具变量法(IV):
基本思想是选择适当的一个外生变量或几个外生变量的组合作为工具变量,使得它同模型中随机解释变量高度相关、与随机误差项无关,且与模型中其它解释变量也无关,然后,对在原模型基础上求得的正规方程组,用该工具变量代替相应正规方程组中的随机解释变量。 部分调整模型的估计
由于部分调整模型滞后被解释变量与误差项同期不相关,因此可使用普通最小二乘法(OLS)进行参数估计,得到有偏、一致的估计量。
5.了解格兰杰因果关系检验方法
从统计上确认两个变量在时间上有先后关系, Granger提出了一个比较简单的检验方法。