1、根据某城市1978——1998年人均储蓄(y)与人均收入(x)的数据资料建立了如下回归模型
???2187.521?1.6843x y se=(340.0103)(0.0622)
R2?0.9748,S.E.?1065.425,DW?0.2934,F?733.6066试求解以下问题:
(1)取时间段1978——1985和1991——1998,分别建立两个模型。
???145.4415?0.3971x 模型2:y???4602.365?1.9525x 模型1:y t=(-8.7302)(25.4269) t=(-5.0660)(18.4094) R?0.9908,2?e212?1372.202 R2?0.9826,?e2?5811189
计算F统计量,即F??e22?e21?58111891372.202?4334.9370,对给定的
??0.05,查F分布表,得临界值F0.05(6,6)?4.28。请你继续完成上述工作,并回答所做
的是一项什么工作,其结论是什么?
(2)根据表1所给资料,对给定的显著性水平??0.05,查?分布表,得临界值
2?0.05(3)?7.81,其中p=3为自由度。请你继续完成上述工作,并回答所做的是一项什么
工作,其结论是什么? 表1
ARCH Test: F-statistic Obs*R-squared
6.033649 Probability 10.14976 Probability
0.007410 0.017335
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 06/04/06 Time: 17:02 Sample(adjusted): 1981 1998
Included observations: 18 after adjusting endpoints Variable C
RESID^2(-1)
CoefficieStd. Error t-Statistic nt
244797.2 373821.3 1.226048 0.330479
1
Prob. 0.5232 0.0023
0.654851 3.709908
RESID^2(-2) RESID^2(-3) -1.405351 0.379187 1.015853 0.328076 -3.706222 3.096397 0.0023 0.0079 971801.3 1129283. 30.26952 30.46738 6.033649 0.007410
R-squared 0.563876 Mean dependent var Adjusted R-squared 0.470421 S.D. dependent var S.E. of regression 821804.5 Akaike info criterion Sum squared resid 9.46E+12 Schwarz criterion Log likelihood -268.4257 F-statistic
Durbin-Watson stat 2.124575 Prob(F-statistic) 1、(1)解:该检验为Goldfeld-Quandt检验。 因为 F=4334.937>4.28,所以模型存在异方差。 (2)解:该检验为ARCH检验
由Obs*R-squared=10.1498>7.81,表明模型存在异方差。
2、根据某地区居民对农产品的消费y和居民收入x的样本资料,应用最小二乘法估计模型,估计结果如下,拟合效果见图。由所给资料完成以下问题:(1)在n=16,??0.05的条件下,查D-W表得临界值分别为
dL?1.106,dU?1.371,试判断模型中是否存在自相关;
(2)如果模型存在自相关,求出相关系数?,并利用广义差分变换写出无自相关的广义差分模型。
???27.9123?0.3524x yse=(1.8690)(0.0055)
R?0.9966,?ei2?22.0506,DW?0.6800,F?4122.531
2i?1162001801603210-1-2868890Residual9294Actual9698Fitted00140120100
2
2、(1)因为DW=0.68<1.106,所以模型中的随机误差存在正的自相关。
?=0.66(??=1-d/2)(2)由DW=0.68,计算得?,所以广义差分表达式为: yt?0.66yt?1?0.34?1??2(xt?0.66xt?1)?ut?0.66ut?1
3、某人试图建立我国煤炭行业生产方程,以煤炭产量为被解释变量,经过理论和经验分析,确定以固定资产原值、职工人数和电力消耗量变量作为解释变量,变量的选择是正确的。于是建立了如下形式的理论模型:煤炭产量= 固定资产原值+ 职工人数+ 电力消耗量+μ,选择2000年全国60个大型国有煤炭企业的数据为样本观测值;固定资产原值用资产形成年当年价计算的价值量,其它采用实物量单位;采用OLS方法估计参数。指出该计量经济学问题中可能存在的主要错误,并简单说明理由。 3、⑴ 模型关系错误。直接线性模型表示投入要素之间完全可以替代,与实际生产活动不符。 ⑵ 估计方法错误。该问题存在明显的序列相关性,不能采用OLS方法估计。 ⑶ 样本选择违反一致性。行业生产方程不能选择企业作为样本。 ⑷ 样本数据违反可比性。固定资产原值用资产形成年当年价计算的价值量,不具备可比性。 ⑸ 变量间可能不存在长期均衡关系。变量中有流量和存量,可能存在1个高阶单整的序列。应该首先进行单位根检验和协整检验。
4、根据某种商品销售量和个人收入的季度数据建立如下模型:
Yt?b1?b2D1t?b3D2t?b4D3t?b5D4t?b6xt?ut 其中,定义虚拟变量Dit为第i季度时其数值取1,其余为0。这时会发生什么问题,参数是否能够用最小二乘法进行估计?
4、答:发生完全多重共线性问题,参数不能用最小二乘法进行估计。
5、根据某城市1978——1998年人均储蓄与人均收入的数据资料建立了如下回归模型:
???2187.521?1.6843x y se=(340.0103)(0.0622)
R2?0.9748,S.E.?1065.425,DW?0.2934,F?733.6066
试求解以下问题:
(1) 取时间段1978——1985和1991——1998,分别建立两个模型。
???145.4415?0.3971x 模型1:y t=(-8.7302)(25.4269) R?0.9908,2?e21?1372.202
???4602.365?1.9525x 模型2:y t=(-5.0660)(18.4094) R?0.9826,计算F统计量,即F?2?e22?5811189
?e22?e21给定??0.05,?58111891372.202?4334.9370,
3
查F分布表,得临界值F0.05(6,6)?4.28。请你继续完成上述工作,并回答所做的是一项什么工作,其结论是什么?
(2) 利用y对x回归所得的残差平方构造一个辅助回归函数:
?t2?242407.2?1.2299??t2?1?1.4090??t2?2?1.0188??t2?3 ? R?0.5659,计算(n?p)R?18*0.5659?10.1862
2给定显著性水平??0.05,查?分布表,得临界值?0.05(3)?7.81,其中p=3,自由度。
22请你继续完成上述工作,并回答所做的是一项什么工作,其结论是什么? (3)试比较(1)和(2)两种方法,给出简要评价。 5、答:(1)这是异方差检验,使用的是样本分段拟和(Goldfeld-Quant),F?4334.937?4.28,因此拒绝原假设,表明模型中存在异方差。
(2)这是异方差ARCH检验,(n?p)R?18*0.5659?10.1862?7.81,所以拒绝原假设,表明模型中存在异方差。
(3)这两种方法都是用于检验异方差。但二者适用条件不同:
A、Goldfeld-Quant 要求大样本;扰动项正态分布;可用于截面数据和时间序列数据。 B、ARCH检验仅适宜于时间序列数据,无其他条件。
6、Sen和Srivastava(1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型:
2Yi??2.40?9.39lnXi?3.36(Di(lnXi?7))
(4.37) (0.857) (2.42) 2
R=0.752
其中:X是以美元计的人均收入;
Y是以年计的期望寿命;
Sen和Srivastava 认为人均收入的临界值为1097美元(ln1097?7),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。(括号内的数值为对应参数估计值的t-值)。 (1)解释这些计算结果。
(2)回归方程中引入Di?lnXi?7?的原因是什么?如何解释这个回归解释变量? (3)如何对贫穷国进行回归?又如何对富国进行回归? 6、解:(1)由lnX?1?X?2.7183,也就是说,人均收入每增加1.7183倍,平均意义上各国的期望寿命会增加9.39岁。若当为富国时,Di?1,则平均意义上,富国的人均收入每增加1.7183倍,其期望寿命就会减少3.36岁,但其截距项的水平会增加23.52,达到21.12的水平。但从统计检验结果看,对数人均收入lnX对期望寿命Y的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。
(2)若Di?1代表富国,则引入Di?lnXi?7?的原因是想从截距和斜率两个方面考证富国的影响,其中,富国的截距为??2.40?3.36?7?21.12?,斜率为?9.39?3.36?6.03?,
4
因此,当富国的人均收入每增加1.7183倍,其期望寿命会增加6.03岁。 (3)对于贫穷国,设定Di???1若为贫穷国,则引入的虚拟解释变量的形式为
0若为富国?(Di(7?lnXi));对于富国,回归模型形式不变。
7、某公司想决定在何处建造一个新的百货店,对已有的30个百货店的销售额作为其所处地
理位置特征的函数进行回归分析,并且用该回归方程作为新百货店的不同位置的可能销售额,估计得出(括号内为估计的标准差)
??30?0.1?X?0.01?X?10.0?X?3.0?X Yt1t2t3t4t (0.02) (0.01) (1.0) (1.0)
其中:Yt=第i个百货店的日均销售额(百美元);
X1t=第i个百货店前每小时通过的汽车数量(10辆);
X2t=第i个百货店所处区域内的人均收入(美元); X3t=第i个百货店内所有的桌子数量; X4t=第i个百货店所处地区竞争店面的数量; 请回答以下问题:
(1) 说出本方程中系数0.1和0.01的经济含义。
(2) 各个变量前参数估计的符号是否与期望的符号一致? (3) 在?=0.05的显著性水平下检验变量X1t的显著性。
(临界值t0.025(25)?2.06,t0.025(26)?2.056,t0.05(25)?1.708,t0.05(26)?1.706) 7、解:(1)每小时通过该百货店的汽车增加10辆,该店的每日收入就会平均增加10美元。该区域居民人均收入每增加1美元,该店每日收入就会平均增加1美元。
(2) 最后一个系数与期望的符号不一致,应该为负数,即该区竞争的店面越多,该店收入越低。其余符号符合期望。
(3) 用t检验。t=0.1/0.02=5,有t>t0.025(25)?2.06知道,该变量显著。
8、一国的对外贸易分为出口和进口,净出口被定义为出口与进口的差额。影响净出口的因素很多,在宏观经济学中,汇率和国内收入水平被认为是两个最重要的因素,我们根据这一理论对影响中国的净出口水平的因素进行实证分析。
设NX表示我国净出口水平(亿元);GDP为我国国内生产总值(亿元),反映我国的国内收入水平;D(GDP)表示GDP的一阶差分;E表示每100美元对人民币的平均汇率(元/百美元),反映汇率水平。利用1985——2001年我国的统计数据(摘自《2002中国统计年鉴》),估计的结果见下表。
(1)选择解释我国净出口水平最适合的计量经济模型,写出该模型并说明选择的原因,其它模型可能存在什么问题;
(2)解释选择的计量经济模型的经济意义。 相关系数矩阵
5
Dependent Variable: NX Method: Least Squares
Date: 03/21/02 Time: 11:02 Sample: 1985 2001
Included observations: 17 Variable C E R-squared Coefficient Std. Error -2135.887 645.9685 4.851832 0.983587 t-Statistic Prob. -3.306488 0.0048 4.932794 0.0002 879.9059 1348.206 16.46161 16.55963 24.33245 0.000180
0.618636 Mean dependent var
Adjusted R-squared 0.593211 S.D. dependent var S.E. of regression 859.8857 Akaike info criterion Sum squared resid 11091052 Schwarz criterion Log likelihood -137.9237 F-statistic
Durbin-Watson stat 0.890230 Prob(F-statistic)
Dependent Variable: NX Method: Least Squares
Date: 03/21/02 Time: 11:04 Sample: 1985 2001
Included observations: 17 Variable C GDP R-squared
Coefficient Std. Error -761.6691 313.1743 0.036827 0.005810 t-Statistic Prob. -2.432093 0.0280 6.338492 0.0000 879.9059 1348.206 16.12312 16.22115 40.17648 0.000013 0.728145 Mean dependent
var
Adjusted R-squared 0.710021 S.D. dependent var S.E. of regression 726.0044 Akaike info criterion Sum squared resid 7906237. Schwarz criterion Log likelihood -135.0465 F-statistic
Durbin-Watson stat 1.289206 Prob(F-statistic)
Dependent Variable: NX Method: Least Squares
Date: 03/21/02 Time: 11:06 Sample: 1985 2001
Included observations: 17 Variable C E GDP
Coefficient Std. Error -822.2318 789.9381 0.180334 2.145081 0.035671 0.015008 6
t-Statistic Prob. -1.040881 0.3156 0.084069 0.9342 2.376855 0.0323 R-squared
0.728282 Mean dependent
var
Adjusted R-squared 0.689465 S.D. dependent var S.E. of regression 751.2964 Akaike info criterion Sum squared resid 7902248. Schwarz criterion Log likelihood -135.0422 F-statistic
Durbin-Watson stat 1.279954 Prob(F-statistic)
Dependent Variable: NX Method: Least Squares
Date: 03/21/02 Time: 11:09 Sample(adjusted): 1986 2001
Included observations: 16 after adjusting endpoints Variable C E
D(GDP) R-squared
Coefficient Std. Error -3036.617 444.7869 8.781248 0.929788 -0.301465 0.054757 t-Statistic 879.9059 1348.206 16.24026 16.38730 18.76202 0.000109
Prob. -6.827128 0.0000 9.444358 0.0000 -5.505550 0.0001 962.9563 1346.761 15.45070 15.59557 47.03583 0.000001 0.878586 Mean dependent
var
Adjusted R-squared 0.859907 S.D. dependent var S.E. of regression 504.0793 Akaike info criterion Sum squared resid 3303247. Schwarz criterion Log likelihood -120.6056 F-statistic
Durbin-Watson stat 2.214778 Prob(F-statistic) 8、解:(1)根据回归结果,认为最后一个回归模型(第四个)最佳,即将NX(净出口)对汇率、DGDP(GDP的一阶差分)回归的模型最好。因为其各个变量t检验显著,模型的F检验显著,拟合优度最高。而其他三个:第一个NX对E的回归拟合优度太低,第二个NX对GDP回归拟合优度也较低,而第三个将NX对E、GDP的回归有多重共线性存在。
(2)所选模型的经济意义是:影响净出口的主要因素是汇率和GDP的增长量。汇率每提高一个单位,净出口就会增加8.781248个单位(亿元),DGDP每增加一个单位(亿元),则净出口增加0.03682亿元。
9、下面结果是利用某地财政收入对该地第一、二、三产业增加值的回归结果,根据这一结果试判断该模型是否存在多重共线性,说明你的理由。
Dependent Variable: REV Method: Least Squares Sample: 1 10
Included observations: 10 Variable C GDP1 GDP2
Coefficient Std. Error 17414.63 14135.10 -0.277510 0.146541 0.084857 0.093532
7
t-Statistic Prob. 1.232013 0.2640 -1.893743 0.1071 0.907252 0.3992
GDP3 R-squared
0.190517 0.151680 1.256048 0.2558 63244.00 54281.99 20.25350 20.37454 320.4848 0.000001 0.993798 Mean dependent
var
Adjusted R-squared 0.990697 S.D. dependent var S.E. of regression 5235.544 Akaike info criterion Sum squared resid 1.64E+08 Schwarz criterion Log likelihood -97.26752 F-statistic
Durbin-Watson stat 1.208127 Prob(F-statistic) 9、答:存在严重多重共线性。因为方程整体非常显著,表明三次产业GDP对财政收入的解释能力非常强,但是每个个别解释变量均不显著,且存在负系数,与理论矛盾,原因是存在严重共线性。
10、通过建模发现,某企业的某种产品价格P和可变成本V之间满足如下关系:
lnP?34.5?0.56lnV。目前可变成本占产品价格的20%。现在,企业可以改进该产品,但是改进要增加10%可变成本(其他费用保持不变)。问,企业是否该选择改进? 10、解:(1)由模型可知,价格和可变成本之间的弹性为0.56。假设改进产品,则可变成本增加10%,价格的变化率为0.56*10%=5.6%,可见价格增加的幅度不如可变成本增加的幅度。
(2)利润增量为5.6%*P-10%*V,只要利润增量大于0,就应该选择改进。
(3)易得,只要当P/V>(10/5.6),就有利润大于0。而目前成本只占价格的20%,远小于10/5.6,所以应该选择改进。
11、某公司想决定在何处建造一个新的百货店,对已有的30个百货店的销售额作为其所处地理位置特征的函数进行回归分析,并且用该回归方程作为新百货店的不同位置的可能销售额,估计得出(括号内为估计的标准差)
??30?0.1?X?0.01?X?10.0?X?3.0?X Yt1t2t3t4t (0.02) (0.01) (1.0) (1.0)
其中:Yt=第i个百货店的日均销售额(百美元);
X1t=第i个百货店前每小时通过的汽车数量(10辆);
X2t=第i个百货店所处区域内的人均收入(美元); X3t=第i个百货店内所有的桌子数量; X4t=第i个百货店所处地区竞争店面的数量; 请回答以下问题:
(1)说出本方程中系数0.1和0.01的经济含义。
(2)各个变量前参数估计的符号是否与期望的符号一致? (3)在?=0.05的显著性水平下检验变量X1t的显著性。
(临界值t0.025(25)?2.06,t0.025(26)?2.056,t0.05(25)?1.708,t0.05(26)?1.706) 11、答:(1)每小时通过该百货店的汽车增加10辆,该店的每日收入就会平均增加10美元。该区域居民人均收入每增加1美元,该店每日收入就会平均增加1美元。
(2) 最后一个系数与期望的符号不一致,应该为负数,即该区竞争的店面越多,该店收入越低。其余符号符合期望。
(3) 用t检验。t=0.1/0.02=5,有t>t0.025(25)?2.06知道,该变量显著。 13、已知某公司的广告费用(X)与销售额(Y)的统计数据如下表所示: X(万元) 40 25 20 30 40 40 25 20 50 20 50 20 8
Y(万元) 490 395 420 475 385 525 480 400 560 365 510 540 (1) 估计销售额关于广告费用的一元线性回归模型 (2) 说明参数的经济意义
(3) 在的显著水平下对参数的显著性进行t检验。
??319.086?4.185X 13、解:(1)利用OLS法估计样本回归直线为:Yii(2)参数的经济意义:当广告费用每增加1万元,公司的销售额平均增加4.185万元。 (3) t???1?)Var(?1?3.79?t0.025(10),广告费用对销售额的影响是显著的。
??14、设某商品的需求模型为Yt??0??1Xt?1?ut,式中,Y是商品的需求量,Xt?1是人们???对未来价格水平的预期,在自适应预期假设Xt?1?Xt?r(Xt?Xt)下,通过适当变换,
使模型中变量Xt?1成为可观测的变量。
??14、解:将自适应预期假设写成Xt?1?(1?r)Xt?rXt ?原模型Yt??0??1Xt?1?ut ①
?将①滞后一期并乘以(1?r),有
(1?r)Yt?1??0(1?r)??1(1?r)Xt??(1?r)ut?1 ②
①式减去②式,整理后得到
Yt?r?0?r?1Xt?(1?r)Yt?1?vt
式中:vt?ut?(1?r)ut?1
15、为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据: 年 份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
地方预算内财政收入Y (亿元) 21.7037 27.3291 42.9599 67.2507 74.3992 88.0174 131.7490 144.7709 164.9067 184.7908 225.0212 265.6532 9
国内生产总值(GDP)X (亿元) 171.6665 236.6630 317.3194 449.2889 615.1933 795.6950 950.0446 1130.0133 1289.0190 1436.0267 1665.4652 1954.6539 资料来源:《深圳统计年鉴2002》,中国统计出版社 利用EViews估计其参数结果为
(1)建立深圳地方预算内财政收入对GDP的回归模型; (2)估计所建立模型的参数,解释斜率系数的经济意义; (3)对回归结果进行检验;
(4) 若是2005年年的国内生产总值为3600亿元,确定2005年财政收入的预测值和预测区间(??0.05)。
15、解:地方预算内财政收入(Y)和GDP的关系近似直线关系,可建立线性回归模型: Yt??1??2GDPt?ut
???3.611151?0.134582GDP 即 Ytt (4.16179) (0.003867)
t=(-0.867692) (34.80013)
2
R=0.99181 F=1211.049 2
R=0.99181,说明GDP解释了地方财政收入变动的99%,模型拟合程度较好。 模型说明当GDP 每增长1亿元,平均说来地方财政收入将增长0.134582亿元。 当2005年GDP 为3600亿元时,地方财政收入的点预测值为:
???3.611151?0.134582?3600?480.884(亿元) Y2005区间预测:
222x??(n?1)?587.2686?(12?1)?3793728.494 ?ix22 (Xf1?X)?(3600?917.5874)?7195337.357 取??0.05,Yf平均值置信度95%的预测区间为:
Yf^t?2?^21(Xf?X)? 2nx?i 10
GDP2005?3600时
480.8842.228?7.5325?17195337.357??480.88425.2735(亿元) 123293728.494Yf个别值置信度95%的预测区间为:
Yf^21(Xf?X)t?2?1?? 2nx?i^即 =480.8842.228?7.5325?1?17195337.357? 123293728.494 ?480.88430.3381(亿元)
16、运用美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量(X)的数据建立了一个回归模型,并运用Glejser方法和White方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。结果如下:
??192.9944?0.0319XY
(0.1948)(3.83)
R2?0.4783,s.e.?2759.15,F?14.6692White Heteroskedasticity Test: F-statistic Obs*R-squared 3.057161 Probability 5.212471 Probability
0.076976 0.073812
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 08/08/05 Time: 15:38 Sample: 1 18
Included observations: 18 Variable C X X^2 R-squared
Coefficient Std. Error -6219633. 6459811. 229.3496 126.2197 -0.000537 0.000449 t-Statistic Prob. -0.962820 0.3509 1.817066 0.0892 -1.194942 0.2507 0.289582 Mean dependent 6767029.
var
Adjusted R-squared 0.194859 S.D. dependent var 1470600
3
S.E. of regression 13195642 Akaike info criterion 35.77968 Sum squared resid 2.61E+15 Schwarz criterion 35.92808 Log likelihood -319.0171 F-statistic 3.057161 Durbin-Watson stat 1.694572 Prob(F-statistic) 0.076976 11
??6.4435Xe
(4.5658) R2?0.2482请问:(1)White检验判断模型是否存在异方差。
(2)Glejser检验判断模型是否存在异方差。 (3)该怎样修正。
16、解:(1)给定??0.05和自由度为2下,查卡方分布表,得临界值??5.9915,而
2222White统计量nR?5.2125,有nR??0.05(2),则不拒绝原假设,说明模型中不存在异方
差。
(2)因为对如下函数形式
e??2X?? 得样本估计式
??6.4435Xe
(4.5658) R2?0.2482由此,可以看出模型中随机误差项有可能存在异方差。
(3)对异方差的修正。可取权数为w?1/X。
17、Sen和Srivastava(1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型:
Yi??2.40?9.39lnXi?3.36(Di(lnXi?7))
(4.37) (0.857) (2.42) 2
R=0.752
其中:X是以美元计的人均收入;
Y是以年计的期望寿命;
Sen和Srivastava 认为人均收入的临界值为1097美元(ln1097?7),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。 (括号内的数值为对应参数估计值的t-值)。 (1)解释这些计算结果。
(2)回归方程中引入Di?lnXi?7?的原因是什么?如何解释这个回归解释变量? (3)如何对贫穷国进行回归?又如何对富国进行回归? 17、解:(1)由lnX?1?X?2.7183,也就是说,人均收入每增加1.7183倍,平均意义上各国的期望寿命会增加9.39岁。若当为富国时,Di?1,则平均意义上,富国的人均收入每增加1.7183倍,其期望寿命就会减少3.36岁,但其截距项的水平会增加23.52,达到21.12的水平。但从统计检验结果看,对数人均收入lnX对期望寿命Y的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。
12
(2)若Di?1代表富国,则引入Di?lnXi?7?的原因是想从截距和斜率两个方面考证富国的影响,其中,富国的截距为??2.40?3.36?7?21.12?,斜率为?9.39?3.36?6.03?,因此,当富国的人均收入每增加1.7183倍,其期望寿命会增加6.03岁。 (3)对于贫穷国,设定Di???1若为贫穷国,则引入的虚拟解释变量的形式为
?0若为富国(Di(7?lnXi));对于富国,回归模型形式不变。
18、为研究体重与身高的关系,我们随机抽样调查了51名学生(其中36名男生,15名女生),并得到如下两种回归模型:
???232.06551?5.5662hW (7.5.1)
t=(-5.2066) (8.6246)
???122.9621?23.8238D?3.7402hW (7.5.2)
t=(-2.5884) (4.0149) (5.1613)
其中,W(weight)=体重 (单位:磅);h(height)=身高 (单位:英寸)
?1D???0男生女生
请回答以下问题:
① 你将选择哪一个模型?为什么?
② 如果模型(7.5.2)确实更好,而你选择了(7.5.1),你犯了什么错误? ③ D的系数说明了什么? 18、答:
(1)选择第二个模型。因为不同的性别,身高与体重的关系是不同的,并且从模型的估计结果看出,性别虚拟变量统计上是显著的。
(2)如果选择了第一个模型,会发生异方差问题。 (3)D的系数23.8238说明当学生身高每增加1英寸时,男生比女生的体重平均多23.8238磅。
19、美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street
1
Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下。 航空公司名称 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 航班正点率(%) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 投诉率(次/10万名乘客) 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 美国西部(Americawest)航空公司 70.8 1
资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社
13
环球(TWA)航空公司 利用EViews估计其参数结果为 68.5 1.25
(1)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程。 (2)对估计的回归方程的斜率作出解释。
(3)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少? 19、解:(1)描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程: Yi??1??2Xi?ui
??6.017832?0.070414X 即 Yii (1.052260)(0.014176) t=(5.718961) (-4.967254)
2
R=0.778996 F=24.67361 (2)这说明当航班正点到达比率每提高1个百分点, 平均说来每10万名乘客投诉次数将下降0.07次。
(3)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数为
??6.017832?0.070414?80?0.384712(次) Yi20、设消费函数为: Yi??1??2X2i??3X3i?ui
式中,Yi为消费支出;X2i为个人可支配收入;X3i为个人的流动资产;ui为随机误差
222
项,并且E(ui)?0,Var(ui)??X2i(其中?为常数)。试回答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
220、解:(1)因为f(Xi)?X2i,所以取W2i?1,用Wi乘给定模型两端,得 X2i 14
YiXu1??1??2??33i?i X2iX2iX2iX2i上述模型的随机误差项的方差为一固定常数,即 Var(ui1)?2Var(ui)??2 X2iX2i(2)根据加权最小二乘法,可得修正异方差后的参数估计式为
??Y*???X*???X* ?12233? ?2??W?2i**2****yi*x2i???W2ix3i????W2iyix3i???W2ix2ix3i???W*22i2ix???W*22i3ix????W**22i2i3ixx?
??其中
3W???***2****yxWx?WyxWx?????????2ii3i2i2i2ii2i2i2ix3i?
??W2i*2*2**2ix2i???W2ix3i????W2ix2ix3i?2 X*2WX???W2i2i,X*3WX???W2i2i3i,Y*WY???W2i2ii
** x2i?X2i?X2**x3?X?Xi3i3y*?Yi?Y*
21、考虑以下凯恩斯收入决定模型:
Ct??10??11Yt?u1t It??20??21Yt??22Yt?1?u2t
Yt?Ct?It?Gt其中,C=消费支出,I=投资指出,Y=收入,G=政府支出;Gt和Yt?1是前定变量。 (1)导出模型的简化式方程并判定上述方程中哪些是可识别的(恰好或过度)。 (2)你将用什么方法估计过度可识别方程和恰好可识别方程中的参数。 21、解:(1)给定模型的简化式为
?10??20u?u2t?22?Yt?1?1t1??11??211??11??211??11??21???21?10??11?20?u??21u1t?u1t?11?22 Ct?10 ?Yt?1?112t1??11??211??11??211??11??21???11?20??21?10?22??11?22?u??11u2t?u2tIt?20?Yt?1?211t1??11??211??11??211??11??21Yt?由模型的结构型,M=3,K=2。下面只对结构型模型中的第一个方程和第二个方程判断其识别
性。
15
首先用阶条件判断。第一个方程,已知m1?2,k1?0,因为
K?k1?2?0?2?m1?1?2?1?1,
所以该方程有可能为过度识别。 第二个方程,已知m2?2,k2?1,因为 K?k2?2?1?1?m2?1?2?1?1
所以该方程有可能恰好识别。第三个方程为定义式,故可不判断其识别性。 其次用秩条件判断。写出结构型方程组的参数矩阵
???1010??1100??? ???2001??11??220?
?0?1?1101???对于第一个方程,划去该方程所在的行和该方程中非零系数所在的列,得
?B0?1??220??0????
??101?由上述矩阵可得到三个非零行列式,根据阶条件,该方程为过度识别。事实上,所得到的矩阵的秩为2,则表明该方程是可识别,再结合阶条件,所以该方程为过度识别。同理,可判断第二个方程为恰好识别。
(2)根据上述判断的结果,对第一个方程可用两段最小二乘法估计参数;对第二个方程可用间接最小二乘法估计参数。
22、表中是中国1978年-1997年的财政收入Y和国内生产总值X的数据:
中国国内生产总值及财政收入 单位:亿元 年 份 1978 1979 1980 1081 1082 1983 1984 1985 1986 1987 1988 1989
国内生产总值X 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 7206.7 8989.1 10201.4 11954.5 14992.3 16917.8 16
财政收入Y 1132.26 1146.38 1159.93 1175.79 1212.33 1366.95 1642.86 2004.82 2122.01 2199.35 2357.24 2664.90 1990 1991 1992 1993 1994 1995 1006 1997 18598.4 21662.5 26651.9 34560.5 46670.0 57494.9 66850.5 73452.5 2937.10 3149.48 3483.37 4348.95 5218.10 6242.20 7407.99 8651.14 数据来源:《中国统计年鉴》
试根据这些数据完成下列问题;
(1)建立财政收入对国内生产总值的简单线性回归模型,并解释斜率系数的经济意义; (2)估计所建立模型的参数,并对回归结果进行检验;
(3)若是1998年的国内生产总值为78017.8亿元,确定1998年财政收入的预测值和预测区间(??0.05)。 22、解:(1)建立中国1978年-1997年的财政收入Y和国内生产总值X的线性回归方程 Yt??1??2Xt?ut
利用1978年-1997年的数据估计其参数,结果为
??857.8375?0.100036X Yii (12.77955)(46.04910) t=(12.77955) (46.04910)
2
R=0.991593 F=24.67361
GDP增加1亿元,平均说来财政收入将增加0.1亿元。
r2?
ESS?0.991593,模型的拟合程度较高。TSS17 (2)
??0??0H0:?H1:?22??2t?~t(18)??SE(?)2
t?46.0491?t0.025(18),拒绝H0说明国内生产总值对财政收入有显著影响。
(3)若是1998年的国内生产总值为78017.8亿元,确定1998年财政收入的点预测值为
??857.8375?0.100036?78017.8?8662.426141(亿元) Yt1998年财政收入平均值预测区间(??0.05)为:
222x??(n?1)?22024.60?(20?1)?9216577098 ?ix(Xf?X)2?(78017.8?22225.13)2?3112822026
Yft?2?^^21(Xf?X)? 2nx?i8662.4262.101?208.5553?19216577098? 203112822026?8662.426760.3111(亿元)
23、克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:
??8.133?1.059X?0.452X?0.121XY123 (8.92) (0.17) (0.66) (1.09) R2?0.95 F?107.37(括号中的数据为相应参数估计量的标准误)。 试对上述模型进行评析,指出其中存在的问题。
23、解:从模型拟合结果可知,样本观测个数为27,消费模型的判定系数R?0.95,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。
依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:
2t0?8.1331.0590.4520.121?0.91,t1??6.10,t2??0.69,t3??0.11 8.920.170.661.09除t1外,其余的tj值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估
18
计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。
24、表中给出了1970~1987年期间美国的个人消息支出(PCE)和个人可支配收入(PDI)数据,所有数字的单位都是10亿美元(1982年的美元价)。估计下列模型: 得到: Dependent Variable: PCE Method: Least Squares Date: 07/27/05 Time: 21:41 Sample: 1970 1987 Included observations: 18 CoefficieVariable nt Std. Error t-Statistic Prob. C -216.4269 32.69425 -6.619723 0.0000 PDI 1.008106 0.015033 67.05920 0.0000 Mean dependent R-squared 0.996455 var 1955.606 S.D. dependent Adjusted R-squared 0.996233 var 307.7170 Akaike info S.E. of regression 18.88628 criterion 8.819188 Schwarz Sum squared resid 5707.065 criterion 8.918118 Log likelihood -77.37269 F-statistic 4496.936 Prob(F-statistiDurbin-Watson stat 1.366654 c) 0.000000 Dependent Variable: PCE Method: Least Squares Date: 07/27/05 Time: 21:51 Sample (adjusted): 1971 1987 Included observations: 17 after adjustments Variable CoefficieStd. Error t-Statistic Prob.
19
PCEt?A1?A2PDIt??tPCEt?B1?B2PDIt?B3PCEt?1??t
nt C -233.2736 45.55736 -5.120436 PDI 0.982382 0.140928 6.970817 PCE(-1) 0.037158 0.144026 0.257997 Mean dependent R-squared 0.996542 var S.D. dependent Adjusted R-squared 0.996048 var Akaike info S.E. of regression 18.47783 criterion Schwarz Sum squared resid 4780.022 criterion Log likelihood -72.05335 F-statistic Prob(F-statistiDurbin-Watson stat 1.570195 c) (1) 解释这两个回归模型的结果。
(2) 短期和长期边际消费倾向(MPC)是多少? 24、答:(1)第一个模型回归,结果如下:
0.0002 0.0000 0.8002 1982.876 293.9125 8.829805 8.976843 2017.064 0.000000 ???215.2202?1.007PDI PCEttt?(?6.3123) (?64.2447) R2?0.9961 DW=1.302
第二个模型进行回归,结果如下:
???231.233?0.9759PDI?0.043PCE PCEttt?1t?(?4.7831) (6.3840) (0.2751) R2?0.996196 DW=1.4542
(2)从模型一得到MPC=1.0070;从模型二得到,短期MPC=0.9759,长期
MPC=0.9759+(-0.043)=0.9329。
25、为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:
???151.0263?0.1179X?1.5452X Yi1i2i t=(-3.066806) (6.652983) (3.378064) R=0.934331 R?0.92964 F=191.1894 n=31
2
2(1) 从经济意义上考察估计模型的合理性。
20
(2) 在5%显著性水平上,分别检验参数?1,?2的显著性;在5%显著性水平上,检验模型的整体显著性。
25、答:(1)由模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。 (2)取??0.05,查表得t0.025(31?3)?2.048
因为3个参数t统计量的绝对值均大于t0.025(31?3)?2.048,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。
取??0.05,查表得F0.05(2,28)?3.34,由于F?199.1894?F0.05(2,28)?3.34,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。
26、研究某地区1962-1995年基本建设新增固定资产Y(亿元)和全省工业总产值X(亿元)按当年价格计算的历史资料。估计结果如下: Dependent Variable: Y Method: Least Squares Date: 07/27/05 Time: 22:31 Sample (adjusted): 1963 1995 Included observations: 33 after adjustments CoefficieVariable nt Std. Error t-Statistic Prob. C 1.896645 1.167127 1.625055 0.1146 X 0.102199 0.024782 4.123961 0.0003 Y(-1) 0.014700 0.182865 0.080389 0.9365 Mean dependent R-squared 0.584750 var 7.804242 S.D. dependent Adjusted R-squared 0.557066 var 5.889686 Akaike info S.E. of regression 3.919779 criterion 5.656455 Schwarz Sum squared resid 460.9399 criterion 5.792502 Log likelihood -90.33151 F-statistic 21.12278 Prob(F-statistiDurbin-Watson stat 1.901308 c) 0.000002 *(1) 如果设定模型Yt????Xt??t 作部分调整假定,估计参数,并作解释。
21
* (2) 如果设定模型Yt????Xt??t 作自适应假定,估计参数,并作解释。
(3) 比较上述两种模型的设定,哪一个模型拟合较好? 26、答:在局部调整假定和自适应假定下,上述二模型最终都转化为一阶自回归模型。为此,先估计如下形式的一阶自回归模型:
*Yt??*??0Xt??1*Yt?1?ut*
即为Eviews给出结果,从结果看,t值F值都很显著,R不是很高。
****(1)根据局部调整模型的参数关系,有????,?0???,?1?1??,?t???t,将上述估
2计结果代入得到: ??0.9853,??0.1037,??1.9249
故局部调整模型为: Yt*?1.9249?0.1037Xt??t
意义:为了达到全省工业总产值的计划值,寻求一个未来预期新增固定资产的最佳量。全省工业总产值每计划增加1(亿元),则未来预期最佳新增固定资产量为0.1037亿元。 (2)根据自适应模型的参数关系,有
?*???,?0*???,?1*?1??,?t*??t?(1??)?t?1,代入得到:
??0.9853,??0.1037,??1.9249
故局部调整模型为:
Yt?1.9249?0.1037X*t??t
意义:新增固定资产的变化取决于全省工业总产值的预期值。全省工业总产值每预期增加增加1(亿元),当期新增固定资产量为0.1037(亿元)。
(3)局部调整模型和自适应模型的区别在于:局部调整模型是对应变量的局部调整而得到的;而自适应模型是由解释变量的自适应过程而得到的。由回归结果可见,Y滞后一期的回归系数并不显著,说明两个模型的设定都不合理。
27、考虑如下的货币供求模型:
d货币需求: Mt??0??1Yt??2Rt??3Pt?u1t s货币供给:Mt??0??1Yt?u2t
其中,M=货币,Y=收入,R=利率,P=价格,u1t,u2t为误差项;R和P是前定变量。
(1) 需求函数可识别吗? (2) 供给函数可识别吗?
(3) 你会用什么方法去估计可识别的方程中的参数?为什么?
(4) 假设我们把供给函数加以修改,多加进两个解释变量Yt?1 和Mt?1,会出现什么识
22