OLS估计量的期望:偏回归系数的期望值
j=1, 2, ?, k
在多元回归模型满足经典假定的条件下,普通最小二乘估计量是总体参数的无偏估计。即:
在多元回归分析中,如果回归模型的函数形式设定有误或遗漏了与包含在模型中的变量相关的重要解释变量,都会导致经典假定E(ui)=0不成立,即E(ui)≠0。如此,则使得最小二乘估计量回归标准误的估计:由于干扰项不可观测,因此必须据样本结果估计
不是总体参数的无偏估计,即。
的无偏估计量为
。
且
G-M定理及意义:
其中正的平方根被称为回归标准误。
定义:在多元线性回归模型的经典假定下,普通最小二乘估计量估计量。即普通最小而成估计量
分别是的最佳线性无偏
,是所有线性无偏估计量中方差最小的。
意义:当经典假定成立时,我们不需要再去寻找其它无偏估计量,没有一个会优于普通最小二乘估计量。也就是说,如果存在一个好的线性无偏估计量,这个估计量的方差最多与普通最小二乘估计量的方差一样小,不会小于普通最小二乘估计量的方差。 3.多元回归模型的检验 回归系数的显著性检验—t检验(多元回归中的t 检验决策规则与一元回归相同) 总体回归模型:
在服从正态分布及经典假定条件下,
;判断拒绝或接受
(决策规则:假设;计算原假设下t的统计量;给定显著水平α下,查t分布表临界值原假设)
回归模型的整体性检验—F检验 多元回归模型的总体显著性就是对原假设否与X2, X3, ?, Xk 在整体上有线性关系。
进行检验。检验的目的就是判断被解释变量Y 是
即
F 统计量与判定系数R2 的关系如下:
;判断接受或
(决策规则:设定假设;计算F统计量;在给定显著水平α下,查找分布表得临界值
拒绝原假设)
4.回归模型的函数形式
对数系数的经济含义,对线性模型的优点
在进行某商品的市场需求分析时,我们知道价格是影响需求量的重要因素,我们设定如下模型
,(Yi =需求量,Xi =价格)
取对数可得:令
,则
令
则
优点:(1)斜率系数
度量了Y对X的弹性,也就是当解释变量X变化1%时,Y的变化百分比。
(2)斜率系数与变量X,Y的测量单位无关。
(3)当Y > 0时,使用对数形式LnY比使用水平值Y作为被解释变量的模型更接近经典线性模型。 (4)取对数后会缩小变量的取值范围,使得估计值对被解释变量或解释变量的异常值不会很敏感。 半对数线性模型系数的经济含义,对线性模型的优点 (一)对数到线性模型
在经济系统中, 人们用GDP、失业、进出口、投资、人口等指标的增长率来描述经济系统的发展状态。对数—线性模型为我们提供了方便,该类对数—线性模型为
,Yt =要研究的经济现象,t=时间
变量。式中,被解释变量为对数形式,解释变量为线性形式,称为对数到线性的半对数模型。
斜率系数的含义为:解释变量X绝对量改变一个单位时,被解释变量Y 的相对改变量。即
(二)线性到对数模型
类似于对数到线性的半对数模型,如果我们想测度解释变量的相对改变量对被解释变量的绝对改变量的影响,我们就需要使用解释变量是对数形式,被解释变量是线性形式的回归模型。
倒数模型(双曲线模型)的三种形式 (1)
图①可用来描述平均总成本曲线,单位固定成本随着产量X的增加而下降。
(2)
图②可用来描述宏观经济学中著名的菲利普斯曲线(Phillips curve)。在工资变化率Y 随失业率X 的变化中,存在两个明显不同的阶段。
(3)
③可用来描述恩格尔支出曲线。如令Y 为对某一商品的支出,X 为收入,则某些商品具有如下特性:(1)收入上存在一个临界水平。(2)消费上有一饱和水平。
第四章 违反经典假定的回归模型
1.异方差的概念、原因、后果、检验及修正方法(WLS) (一)概念
在线性模型的基本假定中,关于方差不变的假定不成立,其他假定不变的情形称为异方差性。 (二)原因
引起异方差的原因还有很多,如模型中省略了重要的解释变量,模型的函数形式设定不准确等都容易产生异方差。一般情况下样本数据为截面数据时容易产生异方差性。 (三)后果 [1].参数估计量虽是无偏的,但不是最小方差线性无偏估计 [2].参数的显著性检验失效
[3]回归方程的应用效果极不理想,或者说模型的预测失效。 (四)检验
一)残差图分析法:以残差常用的横坐标有三种选择: 以
为横坐标,i=1,2,...,n;比拟合优度
为横坐标;以观测时间或序号为横坐标
为纵坐标的残差图上的n 个点散布应是随机的、无任何规律。残差
为纵坐标,以其他适宜的变量为横坐标画散点图。
一般情况下,当回归模型满足所有假定时,以
有一定趋势则表示回归模型有一定的异方差性。 二)等级相关系数法
又称斯皮尔曼(Spearman)检验,既适用于大样本,也适用于小样本。将异方差性同误差项和某个解释变量之间的相关程度联系起来,从而将对异方差性的研究转化为对它们之间相关程度的研究。 三个步骤:第一步,作Y 关于X 的普通最小二乘估计,求出 第二步,取
的绝对值,即
,把
和
的估计值,即
的值。
按递增或递减的次序划分等级。算出等级相关系数
第三步,做等级相关系数的显著性检验。 若Xi 和
之间存在系统关系,则说明模型中存在异方差。在多元的情况下,需对每一个解释变量做等级相关系
数检验。只有当每个解释变量检验都不存在异方差时模型中才不存在异方差。否则,模型中存在异方差。 三)戈里瑟(Glejser)检验 用残差绝对值
对每个解释变量建立各种回归模型,并检验回归系数
是否为0。如果,
则有异方差。
这种方法不仅能检验出模型中存在的异方差,而且把异方差的表现形式找出来便于后面改进时使用。 四)怀特(White)检验 用残差平方
对所有解释变量及其平方项和交叉乘积项
进行线性回归,并检验各回
归系数是否全部为0。 对于两个解释变量的回归模型
,怀特检验步骤如下:
第一步,使用普通最小二乘法估计模型,,并获得残差第二步,辅助回归,将残差ei 的平方定系数
对所有的解释变量及解释变量的平方与交叉积回归,求这个辅助回归的判
第三步,在无异方差的原假设下,可以证明,辅助回归的变量个数 r(不包括常数项)的第四步,如果n*
分布
,则有异方差
乘以样本容量n,渐近地服从自由度为辅助回归中解释
≥选定显著水平临界值
五)戈德菲尔德-匡特(Goldfeld-Quandt)检验(样本分段比检验)
首先将样本按某个解释变量的大小顺序排列,并将样本从中间截成两段;然后各段分别用普通最小二乘法拟合回归模型,并分别计算各段的残差平方和。
(五)修正方法:寻求适当的补救方法,对原来的模型进行变换,使变换后的模型满足同方差性假定,然后进行模型参数的估计,就可得到理想的回归模型。 加权最小二乘法(WLS):一元回归模型 ?
已知时,如果每个观察值的误差项方差
是已知的,使用
为权数,对模型做变换,即可 通过加权变换
使原模型中的异方差误差项转换为同方差误差项,使加权变换后的模型满足最小二乘法的假定,从而使用普通最小二乘法估计参数,这种方法称为加权最小二乘法。 ?
未知时,一般情况下,我们可根据误差与解释变量或被解释变量的关系来确定变换的权数。一般我们先采用
戈里瑟检验方法确定ei 与Xi 之间的关系。 如如
之间为线性关系,对模型两边同时乘以
,将异方差模型变为同方差模型。
之间为线性关系,选择1/Xi为权数,将异方差模型变为同方差模型。
2.自相关的概念、原因、后果、检验(DW检验)及补救方法 (一)概念:如果一个回归模型
,则我们称随机误差项之间存在着自相关现象(或者说不同时点的
一般会出现自相关的情形。
误差项之间存在相关),也称为序列相关。随机误差项
(二)原因 遗漏了重要的解释变量;经济变量的滞后性;回归函数形式的设定错误也可能引起序列相关;蛛网现象(Cobweb Phenomenon);对原始数据加工整理 (三)后果(与异方差类似)
参数的估计量是无偏的,但不是有效的;可能严重低估误差项的方差;常用的F 检验和t 检验失效;如果不加处理地运用普通最小二乘法估计模型参数,回归参数的置信区间和利用回归模型进行预测的结果会存在较大的误差 (四)检验 一)图示检验法
图示法是一种直观的诊断方法,它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项et ,et作为ut随机项的真实估计值,再描绘et 的散点图,根据散点图来判断et的相关性。 二)自相关系数法 自相关系数
的取值范围是[-1,1],当
接近于1时,表明误差序列存在正相关,当
接近于-1时,表明误差
序列存在负相关。 三)DW检验