8.如何评价回归分析模型。 五、计算题
1.以1978~1997年中国某地区进口总额Y(亿元)为被解释变量,以地区生产总值X(亿元)为解释变量进行回归,得到回归结果如下:
???261.09?0.2453X YttSe=(31.327) ( ) t=( ) (16.616) R2=0.9388 n=20 要求:(1)将括号内缺失的数据填入;
(2)如何解释系数0.2453和系数-261.09; (3) 检验斜率系数的显著性。(计算结果保留三位小数)
2.据10年的样本数据得到消费模型为
???231.80?0.7194X YSe=(0.9453) (0.0217) R2=0.9909
取显著性水平α=5%,查t分布表可知
t0.025(8)=2.306 t0.05(8)=1.860 t0.025(10)=2.228 t0.05(10)=1.812
要求:(1)检验回系数的显著性。
(2)给出斜率系数的95%置信区间。(计算结果保留三位小数)
3.用10年的GDP与货币存量的数据进行回归,使用不同度量的货币存量得到如下两个模型:
模型1:GDPt = -787.4723+8.0863M1t Se =(77.9664) ( 0.2197) 模型2:GDPt = -44.0626+1.5875M2t Se = (61.0134) (0.0448)
已知GDP的样本方差为100,模型1的残差平方和
?ei?11021i=100,模型2的残差平方和
?ei?11022i=70,请比较两回归模型,并选择一个合适的模型。(计算结果保留二位小数)
?=100,X=200,4.用12对观测值估计出的消费函数为Y=10.0+0.9X,且已知?22?(X?X)=4000。试预测当X0=250时,Y的均值Y0的值,并求Y0的95%置信区间
[t0.025(10)=2.228, 计算结果保留二位小数]。
参考答案
一、单项选择题
9
1.C 2.A 3.C 4.D 5.A 6.D 7.B 8.C 9.C 10.B 11.A 12.B 13.C 二、多项选择题 1.ABC 2.BCE 3.DE 4.BD 5.ABCD 三、名词解释
1.回归分析:就是研究被解释变量对解释变量的依赖关系,其目的就是通过解释变量的已知或设定值,去估计或预测被解释变量的总体均值。
2.相关分析:测度两个变量之间的线性关联度的分析方法。
3.总体回归函数:E(Y/Xi)是Xi的一个线性函数,就是总体回归函数,简称总体回归。它表明在给定Xi下Y的分布的总体均值与Xi有函数关系,就是说它给出了Y的均值是怎样随X值的变化而变化的。
4.随机误差项:为随机或非系统性成份,代表所有可能影响Y,但又未能包括到回归模型中来的被忽略变量的代理变量。
5.有效估计量:在所有线性无偏估计量中具有最小方差的无偏估计量叫做有效估计量。 6.判定系数:R2??Y)(Y???(Y?Y)ii22?ESS,是对回归线拟合优度的度量。R2测度了在TSSY的总变异中由回归模型解释的那个部分所占的比例或百分比。
四、简答题
1.简述回归分析与相关分析的关系。
答:相关分析主要测度两个变量之间的线性关联度,相关系数就是用来测度两个变量之间的线性关联程度的。而在回归分析中,我们的主要目的在于根据其它变量的给定值来估计或预测某一变量的平均值。例如,我们想知道能否从一个学生的数学成绩去预测他的统计学平均成绩。
在回归分析中,被解释变量Y被当作是随机变量,而解释变量X则被看作非随机变量。而在相关分析中,我们把两个变量都看作是随机变量。
2.简述随机误差项u的意义。
答:随机误差项u是代表所有对Y有影响但未能包括在回归模型中的那些变量的替代变量。因为受理论和实践条件的限制而必须省略一些变量,其理由如下:
(1)理论的欠缺。虽然有决定Y的行为的理论,但常常是不能完全确定的,理论常常有一定的含糊性。
(2)数据的欠缺。即使能确定某些变量对Y有显著影响,但由于不能得到这些变量的数据信息而不能引入该变量。
(3)核心变量与非核心变量。例如,在居民消费模型中,除了收入X1外,家庭的人口数X2、户主宗教信仰X3、户主受教育水平X4也影响家庭消费支出。但很可能X2、X3、X4合起来的影响也是很微弱的,是一种非系统的或随机的影响。从效果与成本角度来看,引入
10
它们是不合算的。所以,人们把它们的联合效用当作一个随机变量来看待。
(4)人类行为的内在随机性。即使我们成功地把所有有关的变量都引进到模型中来,在个别的Y中仍不免有一些“内在”的随机性,无论我们花了多少力气都解释不了的。随机误差项ui能很好地反映这种随机性。
(5)节省原则,我们想保持一个尽可能简单的回归模型。如果我们能用两个或三个变量就基本上解释了Y的行为,就没有必要引进更多的变量。让ui代表所有其它变量是一种很好的选择。
3.试述最小二乘估计原理。
????X?e?Y????X ,??e, e?Y?Y??Y??答:样本回归模型为:Yi??残12iiiiiiii12i?之差。对于给定的Y和X的n对观测值,我们希望样本回归差ei是实际值Yi与其估计值Yi?尽可能地靠近观测值Yi。为了达到此目的,我们就必须使用最小二乘准则,模型的估计值Yi使:
22????X)2 ?e?(Y?Y)?(Y???i?ii?i12i
尽可能地小。
?e2i?,??), 残差平方和是估计量??的函数,对任意给定的一组数?f(?12j?和??值,使据(样本),最小二乘估计就是选择?12
4.试述经典线性回归模型的经典假定。
?e2i?和??就是回最小。如此求得的?12归模型中回归系数的最小二乘估计,这种方法就称为最小二乘法。
答:对于总体线性回归模型,其经典假定如下。 假定1:误差项ui的均值为零。
假定2:同方差性或ui的方差相等。对所有给定的Xi,ui的方差都是相同的。 假定3:各个误差项之间无自相关,ui和uj(i≠j)之间的相关为零。 假定4:ui和Xi的协方差为零或E(uiXi)=0 该假定表示误差项u和解释变量X是不相关的。
假定5:正确地设定了回归模型,即在经验分析中所用的模型没有设定偏误。 假定6:对于多元线性回归模型,没有完全的多重共线性。就是说解释变量之间没有完全的线性关系。
5.叙述高斯一马尔可夫定理,并简要说明之。
答:在给定经典线性回归模型的假定下,最小二乘估计量是最佳线性无偏估计量。
?是?的最佳线性无偏估计量。即 该定理说明最小二乘估计量?jj
11
第一,它是线性的,即它是回归模型中的被解释变量Y的线性函数。
?)??。 ?)等于其真值?,即E(?第二,它是无偏的,即它的均值或期望值E(?jjjj第三,它在所有这样的线性无偏估计量中具有最小方差。具有最小方差的无偏估计量叫做有效估计量。
五、计算题 1.解:
(1)Se=0.015 t=-8.342 (2)斜率参数0.2453表示地区生产总值增加1亿元,进口需求增加0.2453亿元。截距系数-261.09无实际意义。 (3)斜率系数的t统计量为16.616,远大于临界水平,据t检验应拒绝真实斜率系数为零的假设。 2.解:
(1)t统计量分别为
???231.801t????245.213 ???0.9453Se(?1)1
t??2??0.71942???33.152
?Se(?2)0.0217
t?.213?t0.025(8)?2.306 ??2450t???33.152?t0.025(8)?2.306
1?,??均为显著的。 所以?12
(2)β2的置信区间为
??t·?)??????t·?) ?(?(?2?/2Se222?/2Se20.7194-2.306×0.0217≤β2 ≤0.7194+2.306×0.0217 0.669≤β2 ≤0.980 3.解:
模型1判定系数为
R?1?21?(Y?Y)?(Y?Y)?e22i?e21i2?1?100?0.90
10?100模型2的判定系数为
2R2?1?2?1?70?0.93
10?100
模型1的t统计量分别为
t????10.10
1t???36.81
2 12