《经济计量学精要》笔记和课后习题详解 - 图文 下载本文

值的优劣程度,需要计算判定系数,用符号r2表示。

1.总平方和的分解 因为,

??e Yi?Yii把上式恒等变化,得:

?Y?Y???Y??Y???Y?Y??

iiii?Y?Y?为Y的变异,?Y??Y?为由X的变异所解释的部分,?Y?Y??为未解释部分或残差的变异。

iiiii用小写字母表示均值的离差,得

?i?ei yi?y?,即真实Y的均值等于估计Y的均值,因此e?0,或写为 由于Y?Yyi?b2xi?ei

?i?b2xi。(注:y)

对上式两边同时平方再求和,经过简单数学变换,得

?y或等价地,

2i?i??ei ??y2222?yi?b22?xi??ei (3-12)

各种平方和定义如下:

2?y??y2i2=总平方和?TSS?,真实Y值围绕其均值Y的总变异。

i??Y)的变异,也称为回归平方和(由解释变量解=解释平方和?ESS?,估计的Y值围绕其均值(Y释的部分)。

?e2i=残差平方和?RSS?,即Y变异未被解释的部分。

则式(3-12)可简化为

TSS=ESS+RSS (3-13)

式(3-13)表明,Y值与其均值的总离差可以分解为两部分:一部分归于回归线,另一部分归于随机因素,因为并不是所有的真实观察值Y都落在拟合直线上,参见下图。

2.判定系数r2

如果选择的SRF很好地拟合了样本数据,则ESS远大于RSS。如果所有真实的Y值都落在拟合的SRF上,则ESS等于TSS,RSS为0;另一方面,如果SRF拟合得不好,则RSS远大于ESS。如果X不能解释Y的变异,则ESS为0,而RSS等于TSS。当然,这是极端情形。一般的情形是:ESS和RSS均不为零,如果ESS远大于RSS,则SRF在很大程度上解释了Y的变异;如果RSS远大于ESS,则SRF只能部分解释Y的变异。把式(3-13)的两边同除以TSS,得

1=定义,

ESSRSS (3-14) +TSSTSSESS (3-15) TSSr2=称r2为(样本)判定系数,通常用来度量回归线的拟合优度。用文字表述为,判定系数度量了回归模型对Y变异的解释比例(或百分比)。

r2有两个重要性质:

(1)非负性,因为ESS与RSS都是平方和,都是非负的;

(2)0?r2?1,因为部分?ESS?不可能大于整体?TSS?。若r?1,则表示“完全拟合”,即线性模型完全

2解释Y的变异。若r2?0,则表示Y与X之间无任何关系。

3.r2的计算公式

根据式(3-15),式(3-14)可改写为

RSS2?ei1?r??r? 2TSS?yi22因此,

r24.判定系数r与相关系数r

2e??1??y22ii

样本相关系数r度量了两个变量X与Y之间的线性相关程度,r可写为:

r???Xi?????xy?X?X??Y?Y??x?yi?XYi?Y2iii222

ii相关系数也能够通过判定系数r计算得到

2r??r2 即在双变量回归模型中,相关系数的平方等于判定系数。

七、回归分析结果的报告

回归分析结果的报告有多种形式。在没有使用统计软件之前,回归结果的报告通常采用下面的形式:

??B?BXYi12ise?????t?????p?????r2???df???

第一行括号内的数值表示估计回归系数的标准误,第二行括号内的数值表示在零假设下(每个回归系数的真实值为零)估计的t值(即估计的系数与其标准误之比),第三行括号内的数值表示获得t值的p值。一般情况下,如果没有设定特殊的零假设,习惯地规定零假设为:总体参数为零。如果拒绝零假设(即检验统计量是显著的),则表示真实的总体参数值不为零。

用上述形式报告回归结果的一个优点是,可以一目了然地看到每个估计系数是否是统计显著的,即是否显著不为零。通过列出的p值能够确定t值的精确显著水平。

注:当判定拒绝或不拒绝零假设时,需要预先确定一个可以接受的p值水平(即临界p值),然后把计算的p值与临界p值进行比较。如果计算的p值小于临界p值,则拒绝原假设,如果计算的p值大于临界p值,则不能拒绝零假设。

八、正态性检验

双变量回归模型的经典假定是假定误差项ui服从正态分布,但是由于不能直接观察真实的误差项ui,因此需要用ui的替代量ei去检验ui的正态性。常用的检验方法如下:

1.残差直方图

残差直方图是用于获知随机变量概率密度函数(PDF)形状的一种简单图形工具。在横轴上,把变量值(例如OLS残差)划分为若干适当的区间,在每一个区间,建立高度与观察值个数(即频率)相一致的长方形。

如果把钟形正态曲线叠加在直方图上,就会对变量的概率分布有一直观了解。在实践中,常常通过回归残差的直方图粗略地了解其概率分布的形状。

2.正态概率图

另一种研究随机变量PDF的简单图形工具是正态概率图,这需要在专用的正态概率纸上作图。在横轴上(X轴)标出变量值(例如OLS残差值ei),在纵轴上(Y轴)标出如果服从正态分布变量所对应的期望值。因此,如果变量来自正态总体,则正态概率近似一条直线。 3.雅克-贝拉检验

常用的正态性检验方法是雅克-贝拉检验,它是建立在OLS残差基础上的一种渐近(或大样本)检验方法。首先计算出随机变量(例如OLS残差)的偏度系数S(PDF对称性的度量)和峰度系数K(PDF“胖瘦”的度量)。对于正态分布变量,偏度为0,峰度为3。

雅克和贝拉建立了如下检验统计量:

n?2?K?3?JB??S?6?4?其中,n为样本容量,S为偏度,K为峰度。

2?? ??2雅克和贝拉证明了:在正态性假设下,上式给出的JB统计量渐近服从自由度为2的?分布,用符号表示为

2 JBasy~?(2)其中,asy表示“渐近地”。

从统计量的表达式可以看出,如果变量服从正态分布,则S为0,?K?3?为0,因而JB统计量为零。但是如果变量不服从正态分布,则JB统计量为一个逐渐增大值。根据?分布表很容易计算出JB统计量的值。如果

2

在选定的显著水平下,计算的?值超过临界的?值,则拒绝正态分布的零假设;如果没有超过临界的?值,则不能拒绝零假设。当然,如果能够计算出?值的p值,则可以得知获此?值的精确概率。

九、预测

回归分析的目的之一是根据解释变量的值预测因变量的均值。给定样本观测值以外的一个样本X0,可以根

22222?,但对任一给定样本,Y?不可能等于其真实均值,因此需要求出真实据估计的回归方程得出预测值的估计值Y00?的置信区间就需要求出Y?的抽样分布。在CLRM假定下,可以证明Y?服从正态分均值预测值的一个区间。求Y000布,其均值、方差分别为

E?YX0??B1?B2X0?X0?X2?1?VarY0????nxi2???????2?

????其中,X——X的样本均值;

?x2i——X与X的离差平方和;

?2——ui的方差;

n——样本容量。

?服从自由度为?n?2?的t分布。因此,对于?2代替,则Y由于实践中?2是未知的,如果用其无偏估计量?0给定的X0,能够利用t分布建立一个Y的真实(总体)均值100?1???%的置信区间:

??B?BX?b?bX?tseY????1??? P?b1?b2X0?t?/2seY0120120?/20??

3.2 课后习题详解

一、问 题

1.解释概念

(1)最小二乘 (4)估计量的标准误 (7)自相关

????

(2)OLS估计量 (5)同方差性 (3)估计量的方差 (6)异方差性

(9)解释平方和(ESS) (12)估计值的标准误

(8)总平方和(TSS) (11)判定系数r

2(10)残差平方和(RSS)

(13)BLUE (14)显著性检验 (15)t检验 (16)单边检验 (17)双边检验 (18)统计显著 答:(1)在回归模型中,最小二乘法就是以残差(被解释变量的实际值同拟合值之间的差)平方和最小的原则对回归模型中的系数进行估计的方法。

(2)运用最小二乘法法计算出的总体回归参数的估计量。

(3)回归参数估计量是一个随机变量,其方差衡量了估计量同估计量均值的偏离程度。 (4)估计量方差的(正)平方根。 (5)方差相同。 (6)方差不同。