三、判断题(判断下列命题正误,并说明理由)
1、简单线性回归模型与多元线性回归模型的基本假定是相同的。 2、在模型中引入解释变量的多个滞后项容易产生多重共线性。
3、D-W检验中的D-W值在0到4之间,数值越小说明模型随机误差项的自相关度越小,数值越大说明模型随机误差项的自相关度越大。 4、在计量经济模型中,随机扰动项与残差项无区别。
5、在经济计量分析中,模型参数一旦被估计出来,就可将估计模型直接运用于实际的计量经济分析。
6、线性回归模型意味着因变量是自变量的线性函数。
7、多重共线性问题是随机扰动项违背古典假定引起的。
8、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与样本容量大小有关。
9、双变量模型中,对样本回归函数整体的显著性检验与斜率系数的显著性检验是一致的。
10、如果联立方程模型中某个结构方程包含了所有的变量, 则这个方程不可识别。 11、在实际中,一元回归没什么用,因为因变量的行为不可能仅由一个解释变量来解释。
12、多重共线性问题是随机扰动项违背古典假定引起的
13、在异方差性的情况下,常用的OLS法必定高估了估计量的标准误。 14、虚拟变量只能作为解释变量。
15、随机扰动项的方差与随机扰动项方差的无偏估计没有区别。
16、经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估计量将有偏的。 17、虚拟变量的取值只能取0或1。
18、拟合优度检验和F检验是没有区别的。
19、联立方程组模型不能直接用OLS方法估计参数。
20、双变量模型中,对样本回归函数整体的显著性检验与斜率系数的显著性 检验是一致的;
21、多重共线性问题是随机扰动项违背古典假定引起的。
22、在模型
Yt??1??2X2t??3X3t?ut的回归分析结果报告中,有
,则表明解释变量
F?263489.23,F的p值?0.000000X2t 对
Yt的影响
是显著的。
23、结构型模型中的每一个方程都称为结构式方程,结构方程中,解释变量只可以是前定变量。
24、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。
25、在对参数进行最小二乘估计之前,没有必要对模型提出古典假定
26、当异方差出现时,常用的t和F检验失效;
27、解释变量与随机误差项相关,是产生多重共线性的主要原因。
28、经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估计量将有偏的。 29、由间接最小二乘法与两阶段最小二乘法得到的估计量都是无偏估计。 30、在异方差性的情况下,常用的OLS法必定高估了估计量的标准误。 31、 即使经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估计量仍然是无偏的。
32、 变量模型中,对样本回归函数整体的显著性检验与斜率系数的显著性检验是一致
的。
33、多重共线性问题是随机扰动项违背古典假定引起的;
34、秩条件是充要条件,因此利用秩条件就可以完成联立方程识别状态的确 定。
35、在经济计量分析中,模型参数一旦被估计出来,就可将估计模型直接运用于实际的计量经济分析。
36、假定个人服装支出同收入水平和性别有关,由于性别是具有两种属性(男、女)的定性因素,因此,用虚拟变量回归方法分析性别对服装支出的影响时,需要引入两个虚拟变量。
37、双变量模型中,对样本回归函数整体的显著性检验与斜率系数的显著性检验是一致的。
38、随机扰动项的方差与随机扰动项方差的无偏估计没有区别。
39、经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估计量将有偏的。
40、在简单线性回归中可决系数R与斜率系数的t检验的没有关系。 41、异方差性、自相关性都是随机误差现象,但两者是有区别的。
42、通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。
43、满足阶条件的方程一定可以识别。
44、库依克模型、自适应预期模型与局部调整模型的最终形式是不同的。 45、半对数模型Y??0??1lnX??中,参数?1的含义是X的绝对量变化, 引起Y的绝对量变化。
46、对已经估计出参数的模型不需要进行检验。
47、经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估计量将有偏的。
248、在有M个方程的完备联立方程组中,当识别的阶条件为H?Ni?M?1(H为联立方程组中内生变量和前定变量的总数,
Ni为第i个方程中内生变量和前定变量的总数)时,
则表示第i个方程不可识别。
49、随机误差项和残差是有区别的。 四、计算分析题
1、根据某城市1978——1998年人均储蓄(y)与人均收入(x)的数据资料建立了如下回归模型
???2187.521?1.6843x y se=(340.0103)(0.0622)
R2?0.9748,S.E.?1065.425,DW?0.2934,F?733.6066试求解以下问题
(1) 取时间段1978——1985和1991——1998,分别建立两个模型。
???145.4415?0.3971x 模型2:y???4602.365?1.9525x 模型1:y t=(-8.7302)(25.4269) t=(-5.0660)(18.4094) R?0.9908,2?e212?1372.202 R2?0.9826,?e2?5811189
计算F统计量,即F??e22?e21?58111891372.202?4334.9370,对给定的
??0.05,查F分布表,得临界值F0.05(6,6)?4.28。请你继续完成上述工作,并回答所做
的是一项什么工作,其结论是什么?
(2)根据表1所给资料,对给定的显著性水平??0.05,查?分布表,得临界值
2?0.05(3)?7.81,其中p=3为自由度。请你继续完成上述工作,并回答所做的是一项什么
工作,其结论是什么? 表1
ARCH Test: F-statistic Obs*R-squared
Test Equation:
6.033649 Probability 10.14976 Probability
0.007410 0.017335
Dependent Variable: RESID^2 Method: Least Squares
Date: 06/04/06 Time: 17:02 Sample(adjusted): 1981 1998
Included observations: 18 after adjusting endpoints Variable C
RESID^2(-1) RESID^2(-2) RESID^2(-3)
CoefficieStd. Error t-Statistic nt
244797.2 373821.3 1.226048 0.330479 -1.405351 0.379187 1.015853 0.328076
0.654851 3.709908 -3.706222 3.096397
Prob. 0.5232 0.0023 0.0023 0.0079 971801.3 1129283. 30.26952 30.46738 6.033649 0.007410
R-squared 0.563876 Mean dependent var Adjusted R-squared 0.470421 S.D. dependent var S.E. of regression 821804.5 Akaike info criterion Sum squared resid 9.46E+12 Schwarz criterion Log likelihood -268.4257 F-statistic
Durbin-Watson stat 2.124575 Prob(F-statistic)
2、根据某地区居民对农产品的消费y和居民收入x的样本资料,应用最小二乘法估计模型,估计结果如下,拟合效果见图。由所给资料完成以下问题:
(1) 在n=16,??0.05的条件下,查D-W表得临界值分别为
dL?1.106,dU?1.371,试判断模型中是否存在自相关;
(2) 如果模型存在自相关,求出相关系数?,并利用广义差分变换写出无自相关
的广义差分模型。
???27.9123?0.3524x yse=(1.8690)(0.0055)
R?0.9966,?ei2?22.0506,DW?0.6800,F?4122.531
2i?1162001801603210-1-2868890Residual9294Actual9698Fitted00140120100
3、某人试图建立我国煤炭行业生产方程,以煤炭产量为被解释变量,经过理论和经验分析,确定以固定资产原值、职工人数和电力消耗量变量作为解释变量,变量的选择是正确的。于是建立了如下形式的理论模型:煤炭产量= 固定资产原值+ 职工人数+ 电力消耗量+μ,选择2000年全国60个大型国有煤炭企业的数据为样本观测值;固定资产原值用资产形成年当年价计算的价值量,其它采用实物量单位;采用OLS方法估计参数。指出该计量经济学问题中可能存在的主要错误,并简单说明理由。
4、根据某种商品销售量和个人收入的季度数据建立如下模型: Yt?b1?b2D1t?b3D2t?b4D3t?b5D4t?b6xt?ut
其中,定义虚拟变量Dit为第i季度时其数值取1,其余为0。这时会发生什么问题,参数是否能够用最小二乘法进行估计?
5、根据某城市1978——1998年人均储蓄与人均收入的数据资料建立了如下回归模型:
???2187.521?1.6843x y se=(340.0103)(0.0622)
R2?0.9748,S.E.?1065.425,DW?0.2934,F?733.6066
试求解以下问题:
(2) 取时间段1978——1985和1991——1998,分别建立两个模型。
???145.4415?0.3971x 模型1:y t=(-8.7302)(25.4269) R?0.9908,2?e21?1372.202
???4602.365?1.9525x 模型2:y t=(-5.0660)(18.4094) R?0.9826,2?e22?5811189
计算F统计量,即F??e22?e21给定??0.05,?58111891372.202?4334.9370,
查F分布表,得临界值F0.05(6,6)?4.28。请你继续完成上述工作,并回答所做的是一项什么工作,其结论是什么?
(3) 利用y对x回归所得的残差平方构造一个辅助回归函数:
?t2?242407.2?1.2299??t2?1?1.4090??t2?2?1.0188??t2?3 ? R?0.5659,计算(n?p)R?18*0.5659?10.1862
2给定显著性水平??0.05,查?分布表,得临界值?0.05(3)?7.81,其中p=3,自由度。
22请你继续完成上述工作,并回答所做的是一项什么工作,其结论是什么? (3)试比较(1)和(2)两种方法,给出简要评价。
6、Sen和Srivastava(1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型:
Yi??2.40?9.39lnXi?3.36(Di(lnXi?7))
(4.37) (0.857) (2.42) 2
R=0.752
其中:X是以美元计的人均收入;
Y是以年计的期望寿命;
Sen和Srivastava 认为人均收入的临界值为1097美元(ln1097?7),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。 (括号内的数值为对应参数估计值的t-值)。 (1)解释这些计算结果。
(2)回归方程中引入Di?lnXi?7?的原因是什么?如何解释这个回归解释变量? (3)如何对贫穷国进行回归?又如何对富国进行回归? 7、某公司想决定在何处建造一个新的百货店,对已有的30个百货店的销售额作为其所处地理位置特征的函数进行回归分析,并且用该回归方程作为新百货店的不同位置的可能销售额,估计得出(括号内为估计的标准差)
??30?0.1?X?0.01?X?10.0?X?3.0?X Yt1t2t3t4t (0.02) (0.01) (1.0) (1.0) 其中:Yt=第i个百货店的日均销售额(百美元);
X1t=第i个百货店前每小时通过的汽车数量(10辆);
X2t=第i个百货店所处区域内的人均收入(美元); X3t=第i个百货店内所有的桌子数量; X4t=第i个百货店所处地区竞争店面的数量; 请回答以下问题:
(1) 说出本方程中系数0.1和0.01的经济含义。
(2) 各个变量前参数估计的符号是否与期望的符号一致?
(3) 在?=0.05的显著性水平下检验变量X1t的显著性。
(临界值t0.025(25)?2.06,t0.025(26)?2.056,t0.05(25)?1.708,t0.05(26)?1.706) 8、一国的对外贸易分为出口和进口,净出口被定义为出口与进口的差额。影响净出口的因素很多,在宏观经济学中,汇率和国内收入水平被认为是两个最重要的因素,我们根据这一理论对影响中国的净出口水平的因素进行实证分析。
设NX表示我国净出口水平(亿元);GDP为我国国内生产总值(亿元),反映我国的国内收入水平;D(GDP)表示GDP的一阶差分;E表示每100美元对人民币的平均汇率(元/百美元),反映汇率水平。利用1985——2001年我国的统计数据(摘自《2002中国统计年鉴》),估计的结果见下表。
(1)选择解释我国净出口水平最适合的计量经济模型,写出该模型并说明选择的原因,其它模型可能存在什么问题;
(2)解释选择的计量经济模型的经济意义。 相关系数矩阵
Dependent Variable: NX Method: Least Squares
Date: 03/21/02 Time: 11:02 Sample: 1985 2001
Included observations: 17 Variable C E R-squared
Coefficient Std. Error -2135.887 645.9685 4.851832 0.983587 t-Statistic Prob. -3.306488 0.0048 4.932794 0.0002 879.9059 1348.206 16.46161 16.55963 24.33245 0.000180
0.618636 Mean dependent
var
Adjusted R-squared 0.593211 S.D. dependent var S.E. of regression 859.8857 Akaike info criterion Sum squared resid 11091052 Schwarz criterion Log likelihood -137.9237 F-statistic
Durbin-Watson stat 0.890230 Prob(F-statistic)
Dependent Variable: NX Method: Least Squares
Date: 03/21/02 Time: 11:04 Sample: 1985 2001
Included observations: 17 Variable C GDP Coefficient Std. Error -761.6691 313.1743 0.036827 0.005810 t-Statistic Prob. -2.432093 0.0280 6.338492 0.0000 R-squared
0.728145 Mean dependent
var
Adjusted R-squared 0.710021 S.D. dependent var S.E. of regression 726.0044 Akaike info criterion Sum squared resid 7906237. Schwarz criterion Log likelihood -135.0465 F-statistic
Durbin-Watson stat 1.289206 Prob(F-statistic)
Dependent Variable: NX Method: Least Squares
Date: 03/21/02 Time: 11:06 Sample: 1985 2001
Included observations: 17 Variable C E GDP R-squared
Coefficient Std. Error -822.2318 789.9381 0.180334 2.145081 0.035671 0.015008 t-Statistic 879.9059 1348.206 16.12312 16.22115 40.17648 0.000013
Prob. -1.040881 0.3156 0.084069 0.9342 2.376855 0.0323 879.9059 1348.206 16.24026 16.38730 18.76202 0.000109 0.728282 Mean dependent
var
Adjusted R-squared 0.689465 S.D. dependent var S.E. of regression 751.2964 Akaike info criterion Sum squared resid 7902248. Schwarz criterion Log likelihood -135.0422 F-statistic
Durbin-Watson stat 1.279954 Prob(F-statistic)
Dependent Variable: NX Method: Least Squares
Date: 03/21/02 Time: 11:09 Sample(adjusted): 1986 2001
Included observations: 16 after adjusting endpoints Variable C E
D(GDP) R-squared
Coefficient Std. Error -3036.617 444.7869 8.781248 0.929788 -0.301465 0.054757 t-Statistic Prob. -6.827128 0.0000 9.444358 0.0000 -5.505550 0.0001 962.9563 1346.761 15.45070 15.59557 47.03583 0.000001 0.878586 Mean dependent
var
Adjusted R-squared 0.859907 S.D. dependent var S.E. of regression 504.0793 Akaike info criterion Sum squared resid 3303247. Schwarz criterion Log likelihood -120.6056 F-statistic
Durbin-Watson stat 2.214778 Prob(F-statistic)
9、下面结果是利用某地财政收入对该地第一、二、三产业增加值的回归结果,根据这一结果试判断该模型是否存在多重共线性,说明你的理由。
Dependent Variable: REV Method: Least Squares Sample: 1 10
Included observations: 10 Variable C GDP1 GDP2 GDP3 R-squared
Coefficient Std. Error 17414.63 -0.277510 0.084857 0.190517 14135.10 0.146541 0.093532 0.151680 t-Statistic 1.232013 -1.893743 0.907252 1.256048 Prob. 0.2640 0.1071 0.3992 0.2558 63244.00 54281.99 20.25350 20.37454 320.4848 0.000001 0.993798 Mean dependent
var
Adjusted R-squared 0.990697 S.D. dependent var S.E. of regression 5235.544 Akaike info criterion Sum squared resid 1.64E+08 Schwarz criterion Log likelihood -97.26752 F-statistic
Durbin-Watson stat 1.208127 Prob(F-statistic) 10、通过建模发现,某企业的某种产品价格P和可变成本V之间满足如下关系:lnP?34.5?0.56lnV。目前可变成本占产品价格的20%。现在,企业可以改进该产品,但是改进要增加10%可变成本(其他费用保持不变)。问,企业是否该选择改进?
11、某公司想决定在何处建造一个新的百货店,对已有的30个百货店的销售额作为其所处地理位置特征的函数进行回归分析,并且用该回归方程作为新百货店的不同位置的可能销售额,估计得出(括号内为估计的标准差)
??30?0.1?X?0.01?X?10.0?X?3.0?X Yt1t2t3t4t (0.02) (0.01) (1.0) (1.0) 其中:Yt=第i个百货店的日均销售额(百美元);
X1t=第i个百货店前每小时通过的汽车数量(10辆);
X2t=第i个百货店所处区域内的人均收入(美元); X3t=第i个百货店内所有的桌子数量; X4t=第i个百货店所处地区竞争店面的数量; 请回答以下问题:
(4) 说出本方程中系数0.1和0.01的经济含义。
(5) 各个变量前参数估计的符号是否与期望的符号一致? (6) 在?=0.05的显著性水平下检验变量X1t的显著性。
(临界值t0.025(25)?2.06,t0.025(26)?2.056,t0.05(25)?1.708,t0.05(26)?1.706) 12、以广东省东莞市的财政支出作为被解释变量、财政收入作为解释变量做计量经济模型,即Y????X??,方程估计、残差散点图及ARCH检验输出结果分别如下:
方程估计结果:
Dependent Variable: Y
Method: Least Squares
Date: 05/31/03 Time: 12:42 Sample: 1980 1997
Included observations: 18 Variable C X R-squared
Coefficient Std. Error -2457.310 680.5738 0.719308 0.011153 t-Statistic Prob. -3.610644 0.0023 64.49707 0.0000 25335.11 35027.97 18.36626 18.46519 4159.872 0.000000 0.996168 Mean dependent
var
Adjusted R-squared 0.995929 S.D. dependent var S.E. of regression 2234.939 Akaike info criterion Sum squared resid 79919268 Schwarz criterion Log likelihood -163.2963 F-statistic
Durbin-Watson stat 2.181183 Prob(F-statistic)
残差与残差滞后1期的散点图:
ARCH检验输出结果:
ARCH Test: F-statistic
Obs*R-squared 2.886465 Probability 7.867378 Probability
0.085992 0.096559
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 06/10/03 Time: 00:33 Sample(adjusted): 1984 1997
Included observations: 14 after adjusting endpoints Variable C
Coefficient Std. Error -9299857. 7646794.
t-Statistic Prob. -1.216177 0.2549
RESID^2(-1) RESID^2(-2) RESID^2(-3) RESID^2(-4) R-squared
0.033582 -0.743273 -0.854852 37.04345 0.308377 0.320424 11.02966 10.91380 0.108900 -2.319650 -0.077505 3.394182 0.9157 0.0455 0.9399 0.0079 0.561956 Mean dependent 5662887.
var
Adjusted R-squared 0.367269 S.D. dependent var 1632308
2
S.E. of regression 12984094 Akaike info criterion 35.86880 Sum squared resid 1.52E+15 Schwarz criterion 36.09704 Log likelihood -246.0816 F-statistic 2.886465 Durbin-Watson stat 1.605808 Prob(F-statistic) 0.085992 根据以上输出结果回答下列问题:
(1)该模型中是否违背无自相关假定?为什么?(??0.05,dl?1.158,du?1.391) (2)该模型中是否存在异方差?说明理由(显著性水平为0.1,?0.1(4)?7.7794)。 (3)如果原模型存在异方差,你认为应如何修正?(只说明修正思路,无
需计算)
13、已知某公司的广告费用(X)与销售额(Y)的统计数据如下表所示: X(万元) Y(万元) 40 25 20 30 40 40 525 25 480 20 400 50 560 20 365 50 510 20 540 490 395 420 475 385 2(1) 估计销售额关于广告费用的一元线性回归模型 (2) 说明参数的经济意义
(3) 在的显著水平下对参数的显著性进行t检验。
??14、设某商品的需求模型为Yt??0??1Xt?1?ut,式中,Y是商品的需求量,Xt?1是人们
???对未来价格水平的预期,在自适应预期假设Xt?1?Xt?r(Xt?Xt)下,通过适当变
换,使模型中变量Xt?1成为可观测的变量。
15、为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据: 年 份 1990 1991 1992 1993 1994 1995 1996 1997 1998 地方预算内财政收入Y (亿元) 21.7037 27.3291 42.9599 67.2507 74.3992 88.0174 131.7490 144.7709 164.9067 国内生产总值(GDP)X (亿元) 171.6665 236.6630 317.3194 449.2889 615.1933 795.6950 950.0446 1130.0133 1289.0190 ?1999 2000 2001 184.7908 225.0212 265.6532 1436.0267 1665.4652 1954.6539 资料来源:《深圳统计年鉴2002》,中国统计出版社 利用EViews估计其参数结果为
(1)建立深圳地方预算内财政收入对GDP的回归模型; (2)估计所建立模型的参数,解释斜率系数的经济意义; (3)对回归结果进行检验;
(4) 若是2005年年的国内生产总值为3600亿元,确定2005年财政收入的预测值和预测区间(??0.05)。
16、运用美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量(X)的数据建立了一个回归模型,并运用Glejser方法和White方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。结果如下:
??192.9944?0.0319XY
(0.1948)(3.83)
R2?0.4783,s.e.?2759.15,F?14.6692White Heteroskedasticity Test: F-statistic
Obs*R-squared 3.057161 Probability 5.212471 Probability
0.076976 0.073812
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 08/08/05 Time: 15:38 Sample: 1 18
Included observations: 18 Variable C
Coefficient Std. Error -6219633. 6459811.
t-Statistic Prob. -0.962820 0.3509
X X^2 R-squared 229.3496 126.2197 -0.000537 0.000449 1.817066 0.0892 -1.194942 0.2507 0.289582 Mean dependent 6767029. var
Adjusted R-squared 0.194859 S.D. dependent var 1470600
3
S.E. of regression 13195642 Akaike info criterion 35.77968 Sum squared resid 2.61E+15 Schwarz criterion 35.92808 Log likelihood -319.0171 F-statistic 3.057161 Durbin-Watson stat 1.694572 Prob(F-statistic) 0.076976
??6.4435Xe
(4.5658) R2?0.2482请问:(1)White检验判断模型是否存在异方差。
(2)Glejser检验判断模型是否存在异方差。 (3)该怎样修正。
17、Sen和Srivastava(1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型:
Yi??2.40?9.39lnXi?3.36(Di(lnXi?7))
(4.37) (0.857) (2.42) 2
R=0.752
其中:X是以美元计的人均收入;
Y是以年计的期望寿命;
Sen和Srivastava 认为人均收入的临界值为1097美元(ln1097?7),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。 (括号内的数值为对应参数估计值的t-值)。 (1)解释这些计算结果。
(2)回归方程中引入Di?lnXi?7?的原因是什么?如何解释这个回归解释变量? (3)如何对贫穷国进行回归?又如何对富国进行回归?
18、为研究体重与身高的关系,我们随机抽样调查了51名学生(其中36名男生,15名女生),并得到如下两种回归模型:
???232.06551?5.5662hW (7.5.1)
t=(-5.2066) (8.6246)
???122.9621?23.8238D?3.7402hW (7.5.2)
t=(-2.5884) (4.0149) (5.1613)
其中,W(weight)=体重 (单位:磅);h(height)=身高 (单位:英寸)
?1D???0男生女生
请回答以下问题:
① 你将选择哪一个模型?为什么?
② 如果模型(7.5.2)确实更好,而你选择了(7.5.1),你犯了什么错误? ③ D的系数说明了什么?
19、美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street
1
Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下。 航空公司名称 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 环球(TWA)航空公司 利用EViews估计其参数结果为 航班正点率(%) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 68.5 投诉率(次/10万名乘客) 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 美国西部(Americawest)航空公司 70.8
(1)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程。 (2)对估计的回归方程的斜率作出解释。
(3)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少? 20、设消费函数为
Yi??1??2X2i??3X3i?ui
式中,Yi为消费支出;X2i为个人可支配收入;X3i为个人的流动资产;ui为随机误差
222
项,并且E(ui)?0,Var(ui)??X2i(其中?为常数)。试回答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程; 1
资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社
(2)写出修正异方差后的参数估计量的表达式。 21、考虑以下凯恩斯收入决定模型:
Ct??10??11Yt?u1t It??20??21Yt??22Yt?1?u2t
Yt?Ct?It?Gt其中,C=消费支出,I=投资指出,Y=收入,G=政府支出;Gt和Yt?1是前定变量。 (1)导出模型的简化型方程并判定上述方程中哪些是可识别的(恰好或过度)。 (2)你将用什么方法估计过度可识别方程和恰好可识别方程中的参数。 22、表中是中国1978年-1997年的财政收入Y和国内生产总值X的数据:
中国国内生产总值及财政收入 单位:亿元
年 份 1978 1979 1980 1081 1082 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1006 1997 国内生产总值X 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 7206.7 8989.1 10201.4 11954.5 14992.3 16917.8 18598.4 21662.5 26651.9 34560.5 46670.0 57494.9 66850.5 73452.5 财政收入Y 1132.26 1146.38 1159.93 1175.79 1212.33 1366.95 1642.86 2004.82 2122.01 2199.35 2357.24 2664.90 2937.10 3149.48 3483.37 4348.95 5218.10 6242.20 7407.99 8651.14 数据来源:《中国统计年鉴》
试根据这些数据完成下列问题;
(1)建立财政收入对国内生产总值的简单线性回归模型,并解释斜率系数的经济意义; (2)估计所建立模型的参数,并对回归结果进行检验;
(3)若是1998年的国内生产总值为78017.8亿元,确定1998年财政收入的预测值和预测区间(??0.05)。
23、克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:
??8.133?1.059X1?0.452X2?0.121X3Y (8.92) (0.17) (0.66) (1.09) R2?0.95 F?107.37(括号中的数据为相应参数估计量的标准误)。 试对上述模型进行评析,指出其中存在的问题。
24、表中给出了1970~1987年期间美国的个人消息支出(PCE)和个人可支配收入(PDI)数据,所有数字的单位都是10亿美元(1982年的美元价)。估计下列模型: 得到: Dependent Variable: PCE Method: Least Squares Date: 07/27/05 Time: 21:41 Sample: 1970 1987 Included observations: 18 Variable CoefficieStd. Error t-Statistic Prob.
PCEt?A1?A2PDIt??tPCEt?B1?B2PDIt?B3PCEt?1??t
nt C -216.4269 32.69425 -6.619723 PDI 1.008106 0.015033 67.05920 Mean dependent R-squared 0.996455 var S.D. dependent Adjusted R-squared 0.996233 var Akaike info S.E. of regression 18.88628 criterion Schwarz Sum squared resid 5707.065 criterion Log likelihood -77.37269 F-statistic Prob(F-statistiDurbin-Watson stat 1.366654 c) 0.0000 0.0000 1955.606 307.7170 8.819188 8.918118 4496.936 0.000000 Dependent Variable: PCE Method: Least Squares Date: 07/27/05 Time: 21:51 Sample (adjusted): 1971 1987 Included observations: 17 after adjustments CoefficieVariable nt Std. Error t-Statistic Prob. C -233.2736 45.55736 -5.120436 0.0002 PDI 0.982382 0.140928 6.970817 0.0000 PCE(-1) 0.037158 0.144026 0.257997 0.8002 Mean dependent R-squared 0.996542 var 1982.876 S.D. dependent Adjusted R-squared 0.996048 var 293.9125 Akaike info S.E. of regression 18.47783 criterion 8.829805 Schwarz Sum squared resid 4780.022 criterion 8.976843 Log likelihood -72.05335 F-statistic 2017.064 Prob(F-statistiDurbin-Watson stat 1.570195 c) 0.000000 (1) 解释这两个回归模型的结果。
(2) 短期和长期边际消费倾向(MPC)是多少?
25、为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:
???151.0263?0.1179X?1.5452X Yi1i2i t=(-3.066806) (6.652983) (3.378064) R=0.934331 R?0.92964 F=191.1894 n=31
2
2(1) 从经济意义上考察估计模型的合理性。
(2) 在5%显著性水平上,分别检验参数?1,?2的显著性;在5%显著性水平 上,检验模型的整体显著性。
26、研究某地区1962-1995年基本建设新增固定资产Y(亿元)和全省工业总产值X(亿元)按当年价格计算的历史资料。估计结果如下:
Dependent Variable: Y Method: Least Squares Date: 07/27/05 Time: 22:31 Sample (adjusted): 1963 1995 Included observations: 33 after adjustments CoefficieVariable nt Std. Error t-Statistic Prob. C 1.896645 1.167127 1.625055 0.1146 X 0.102199 0.024782 4.123961 0.0003 Y(-1) 0.014700 0.182865 0.080389 0.9365 Mean dependent R-squared 0.584750 var 7.804242 S.D. dependent Adjusted R-squared 0.557066 var 5.889686 Akaike info S.E. of regression 3.919779 criterion 5.656455 Schwarz Sum squared resid 460.9399 criterion 5.792502 Log likelihood -90.33151 F-statistic 21.12278 Prob(F-statistiDurbin-Watson stat 1.901308 c) 0.000002 *(1) 如果设定模型Yt????Xt??t 作部分调整假定,估计参数,并作解释。
* (2) 如果设定模型Yt????Xt??t 作自适应假定,估计参数,并作解释。
(3) 比较上述两种模型的设定,哪一个模型拟合较好?
27、考虑如下的货币供求模型:
d货币需求: Mt??0??1Yt??2Rt??3Pt?u1t s货币供给:Mt??0??1Yt?u2t
其中,M=货币,Y=收入,R=利率,P=价格,u1t,u2t为误差项;R和P是前定变量。
(1) 需求函数可识别吗? (2) 供给函数可识别吗?
(3) 你会用什么方法去估计可识别的方程中的参数?为什么?
(4) 假设我们把供给函数加以修改,多加进两个解释变量Yt?1 和Mt?1,会出现什么识别问题?你还会用你在(3)中用的方法吗?为什么?
三、判断题 1、 错
在多元线性回归模型里除了对随机误差项提出假定外,还对解释变量之间提出无多重共线性的假定。 2、对
在分布滞后模型里多引进解释变量的滞后项,由于变量的经济意义一样,只是时间不一致,所以很容易引起多重共线性。
3、错
DW值在0到4之间,当DW落在最左边(0 中间(du 4、错 它们均为随机项,但随机误差项表示总体模型的误差,残差表示样本模型的误差。 5、错 参数一经估计,建立了样本回归模型,还需要对模型进行检验,包括经济意义检验、统计检验、计量经济专门检验等。 6、错 线性回归模型本质上指的是参数线性,而不是变量线性。同时,模型与函数不是同一回事。 7、错 应该是解释变量之间高度相关引起的。 8、错 引入虚拟变量的个数与样本容量大小无关,与变量属性,模型有无截距项有关 9、正确 2F?t要求最好能够写出一元线性回归中,F统计量与T统计量的关系,即的来 历;或者说明一元线性回归仅有一个解释变量,因此对斜率系数的T检验等价于对方 程的整体性检验。 10、正确 没有唯一的统计形式 11、错 在实际中,一元回归是很多经济现象的近似,能够较好的反映回归的核心思想,是很有的。 12、错 应该是解释变量之间高度相关引起的。 13、错 有可能高估也有可能低估。 如:考虑一个非常简单的具有异方差性的线性回归模型: Yi??Xi?ui;Var(ui)??i2=Zi2?2 2?Xu?XiVar(ui) 则:Var(??)?Var(ii)??Xi2(?Xi2)214、错 虚拟变量还能作被解释变量。 15、错 随机扰动项的方差反映总体的波动情况,对一个特定的总体而言,是一个确 定的值。 在最小二乘估计中,由于总体方差在大多数情况下并不知道,所以用样本数据去估计 ?2是?2线性无偏估?:???ei2/(n?k)。其中n为样本数,k为待估参数的个数。?2 ?2计,为一个随机变量。 16、错 即使经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估 ?2)?E(?2?计量仍然是无偏的。因为E(??K?)??ii2,该表达式成立与否与正态性无 关。 17、错 虚拟变量的取值是人为设定的,也可以取其它值。 18、错 (1)F-检验中使用的统计量有精确的分布,而拟合优度检验没有; (2)对是否通过检验,可决系数(修正可决系数)只能给出一个模糊的推测;而F检验可以在给定显著水平下,给出统计上的严格结论。 19、错 递归方程可以用OLS方法估计参数,而其它的联立方程组模型不能直接用OLS方法估计参数。 20、正确 最好能够写出一元线性回归模型;F统计量与T统计量的关系,即F?t的 来历;或者说明一元线性回归仅有一个解释变量,因此对斜率系数的T检验等价于对方程的整体性检验。 21、错误 应该是解释变量之间高度相关引起的。 22、错误 解释变量 2X2t和 X3t对 Yt的联合影响是显著的 23、错误 结构方程中,解释变量可以是前定变量,也可以是内生变量。 24、错误 模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”; 模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。 25、错误 在古典假定条件下,OLS估计得到的参数估计量是该参数的最佳线性无偏估计(具有线性、无偏性、有效性)。总之,提出古典假定是为了使所作出的估计量具有较好的统计性质和方便地进行统计推断。 26、错误 由于方差不在具有最小性。这时往往会夸大t检验,使得t检验失效;但是F检验仍然有效。 27、错误 产生多重共线性的主要原因是:经济本变量大多存在共同变化趋势; 模型中大量采用滞后变量;认识上的局限使得选择变量不当;……。 28、错误 即使经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估 ?2)?E(?2?计量仍然是无偏的。因为E(??K?)??ii2,该表达式成立与否与正态性无 关。 29、错误 间接最小二乘法适用于恰好识别方程的估计,其估计量为无偏估计; 而两阶段最小二乘法不仅适用于恰好识别方程,也适用于过度识别方程。两阶段最小二乘法得到的估计量为有偏、一致估计。 30、错误 有可能高估也有可能低估;如:考虑一个非常简单的具有异方差性的线性回归模型: Yi??Xi?ui;Var(ui)??i2=Zi2?2 2?Xu?XiVar(ui) 则:Var(??)?Var(ii)??Xi2(?Xi2)231、正确 ?2)?E(?2?Ki?i)??2,该表达式成立与否与正态性无关。 E(?? 32、正确 要求最好能够写出一元线性回归中,F统计量与T统计量的关系,即F?t的来历;或者说明一元线性回归仅有一个解释变量,因此对斜率系数的T检验等价于对方程的整 体性检验。 233、错误 应该是解释变量之间高度相关引起的。 34、错误 虽然秩条件是充要条件,但在对联立方程进行识别时,还应该结合阶条件 判断是过度识别,还是恰好识别。 35、错 参数一经估计,建立了样本回归模型,还需要对模型进行检验,包括经济意义检验、统计检验、计量经济专门检验等。 36、错 是否引入两个虚拟变量,应取决于模型中是否有截距项。如果有截距项则引入一个虚拟变量;如果模型中无截距项,则可引入两个虚拟变量。 37、正确 要求最好能够写出一元线性回归中,F统计量与T统计量的关系,即F?t2的来 历;或者说明一元线性回归仅有一个解释变量,因此对斜率系数的T检验等价于对方程的整体性检验。 38、错 随机扰动项的方差反映总体的波动情况,对一个特定的总体而言,是一个确 定的值。 在最小二乘估计中,由于总体方差在大多数情况下并不知道,所以用样本数据去估计 ?2是?2线性无偏估?:???ei2/(n?k)。其中n为样本数,k为待估参数的个数。?2 ?2计,为一个随机变量。 39、错 即使经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估 ?2)?E(?2?计量仍然是无偏的。因为E(??K?)??ii2,该表达式成立与否与正态性无 关。 40、错误 可决系数是对模型拟合优度的综合度量,其值越大,说明在Y的总变差中由模型作出了解释的部分占的比重越大,模型的拟合优度越高,模型总体线性关系的显著性越强。反之亦然。斜率系数的t检验是对回归方程中的解释变量的显著性的检验。在简单线性回归中,由于解释变量只有一个,当t检验显示解释变量的影响显著时,必然会有该回归模型的可决系数大,拟合优度高。 41、正确 异方差的出现总是与模型中某个解释变量的变化有关。… 自相关性是各回归模型的随机误差项之间具有相关关系。…… 42、错误 模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”; 模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。 43、错误 阶条件只是一个必要条件,即满足阶条件的的方程也可能是不可识别的。 44、错误 库依克模型、自适应预期模型与局部调整模型的最终形式是相同的,其最终形式都是一阶自回归模型。 45、错误 半对数模型的参数?1的含义是当X的相对变化时,绝对量发生变化, 引起因变量Y的平均值绝对量的变动。 46、错误 有必要进行检验。首先,因为我们在设定模型时,对所研究的经济现象的规律性可能认识并不充分,所依据的得经济理论对研究对象也许还不能做出正确的解释和说明。或者虽然经济理论是正确的,但可能我们对问题的认识只是从某些局部出发,或者只是考察了某些特殊的样本,以局部去说明全局的变化规律,必然会导致偏差。其次,我们用以及参数的统计数据或其他信息可能并不十分可靠,或者较多采用了经济突变时期的数据,不能真实代表所研究的经济关系,也可能由于样本太小,所估计的参数只是抽样的某些偶然结果。另外,我们所建立的模型,所用的方法,所用的统计数据,还可能违反计量经济的基本假定,这是也会导致错误的结论。 47、错误 即使经典线性回归模型(CLRM)中的干扰项不服从正态分布的,OLS估 ?2)?E(?2?计量仍然是无偏的。因为E(??K?)??ii2,该表达式成立与否与正态性无 关。 48、错误 表示第i个方程过度识别 49、正确 随机误差项ui=Yi-E(Y/Xi)。当把总体回归函数表示成Yi?Yi?ei时,其中的ei就是残差。它是用Yi估计Yi时带来的误差ei?Yi?Yi,是对随机误差项ui的估计。 四、计算分析题答案 1、1)解:该检验为Goldfeld-Quandt检验 因为 F=4334.937>4.28,所以模型存在异方差 2)解:该检验为ARCH检验 由Obs*R-squared=10.1498>7.81,表明模型存在异方差。 ???2、1)因为DW=0.68<1.106,所以模型中的随机误差存在正的自相关。 ?=0.66(??=1-d/2)2)由DW=0.68,计算得?,所以广义差分表达式为: yt?.66yt?1?0.34?1??2(xt?0.66xt?1)?ut?0.66ut?1 3、⑴ 模型关系错误。直接线性模型表示投入要素之间完全可以替代,与实际生产活动不符。 ⑵ 估计方法错误。该问题存在明显的序列相关性,不能采用OLS方法估计。 ⑶ 样本选择违反一致性。行业生产方程不能选择企业作为样本。 ⑷ 样本数据违反可比性。固定资产原值用资产形成年当年价计算的价值量,不具备可比性。 ⑸ 变量间可能不存在长期均衡关系。变量中有流量和存量,可能存在1个高阶单整的序列。应该首先进行单位根检验和协整检验。 4、答:发生完全多重共线性问题,参数不能用最小二乘法进行估计。 5、答:(1)这是异方差检验,使用的是样本分段拟和(Goldfeld-Quant),F?4334.937?4.28,因此拒绝原假设,表明模型中存在异方差。 (2)这是异方差ARCH检验,(n?p)R?18*0.5659?10.1862?7.81,所以拒绝原假设,表明模型中存在异方差。 (3)这两种方法都是用于检验异方差。但二者适用条件不同: A、Goldfeld-Quant 要求大样本;扰动项正态分布;可用于截面数据和时间序列数据。 B、ARCH检验仅适宜于时间序列数据,无其他条件。 6、解:(1)由lnX?1?X?2.7183,也就是说,人均收入每增加1.7183倍,平均意义上各国的期望寿命会增加9.39岁。若当为富国时,Di?1,则平均意义上,富国的人均收入每增加1.7183倍,其期望寿命就会减少3.36岁,但其截距项的水平会增加23.52,达到21.12的水平。但从统计检验结果看,对数人均收入lnX对期望寿命Y的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。 (2)若Di?1代表富国,则引入Di?lnXi?7?的原因是想从截距和斜率两个方面考证富国的影响,其中,富国的截距为??2.40?3.36?7?21.12?,斜率为?9.39?3.36?6.03?,因此,当富国的人均收入每增加1.7183倍,其期望寿命会增加6.03岁。 2?1若为贫穷国(3)对于贫穷国,设定Di??,则引入的虚拟解释变量的形式为 ?0若为富国(Di(7?lnXi));对于富国,回归模型形式不变。 7、解:(1)每小时通过该百货店的汽车增加10辆,该店的每日收入就会平均增加10美元。该区域居民人均收入每增加1美元,该店每日收入就会平均增加1美元。 (2) 最后一个系数与期望的符号不一致,应该为负数,即该区竞争的店面越多,该店收入越低。其余符号符合期望。 (3) 用t检验。t=0.1/0.02=5,有t>t0.025(25)?2.06知道,该变量显著。 8、解:(1)根据回归结果,认为最后一个回归模型(第四个)最佳,即将NX(净出口)对汇率、DGDP(GDP的一阶差分)回归的模型最好。因为其各个变量t检验显著,模型的 F检验显著,拟合优度最高。 而其他三个:第一个NX对E的回归拟合优度太低,第二个NX对GDP回归拟合优 度也较低,而第三个将NX对E、GDP的回归有多重共线性存在。 (2)所选模型的经济意义是:影响净出口的主要因素是汇率和GDP的增长量。汇率每提高一个单位,净出口就会增加8.781248个单位(亿元),DGDP每增加一个单位(亿元),则净出口增加0.03682亿元。 9、答:存在严重多重共线性。因为方程整体非常显著,表明三次产业GDP对财政收入的解释能力非常强,但是每个个别解释变量均不显著,且存在负系数,与理论矛盾,原因是存在严重共线性。 10、解:(1)由模型可知,价格和可变成本之间的弹性为0.56。假设改进产品,则可变成本增加10%,价格的变化率为0.56*10%=5.6%,可见价格增加的幅度不如可变成本增加的幅度。 (2)利润增量为5.6%*P-10%*V,只要利润增量大于0,就应该选择改进。 (3)易得,只要当P/V>(10/5.6),就有利润大于0。而目前成本只占价格的20%,远小于10/5.6,所以应该选择改进。 11、答:(1)每小时通过该百货店的汽车增加10辆,该店的每日收入就会平均增加10美元。该区域居民人均收入每增加1美元,该店每日收入就会平均增加1美元。 (2) 最后一个系数与期望的符号不一致,应该为负数,即该区竞争的店面越多,该店收入越低。其余符号符合期望。 (3) 用t检验。t=0.1/0.02=5,有t>t0.025(25)?2.06知道,该变量显著。 12、解:(1)没有违背无自相关假定;第一、残差与残差滞后一期没有明显的相关性;第二、根据D-W值应该接受原假设;(写出详细步骤) (2)存在异方差(注意显著性水平是0.1);(写出详细步骤) (3)说出一种修正思路即可。 ??319.086?4.185X 13、解:(1)利用OLS法估计样本回归直线为:Yii(2)参数的经济意义:当广告费用每增加1万元,公司的销售额平均增加4.185万元。 (3) t???1?)Var(?1?3.79?t0.025(10),广告费用对销售额的影响是显著的。 ??14、2、解:将自适应预期假设写成Xt?1?(1?r)Xt?rXt ?原模型Yt??0??1Xt?1?ut ① 将①滞后一期并乘以(1?r),有 (1?r)Yt?1??0(1?r)??1(1?r)Xt??(1?r)ut?1 ② ①式减去②式,整理后得到 Yt?r?0?r?1Xt?(1?r)Yt?1?vt 式中:vt?ut?(1?r)ut?1 15、解:地方预算内财政收入(Y)和GDP的关系近似直线关系,可建立线性回归模型: Yt??1??2GDPt?ut ???3.611151?0.134582GDP 即 Ytt (4.16179) (0.003867) t=(-0.867692) (34.80013) 2 R=0.99181 F=1211.049 2 R=0.99181,说明GDP解释了地方财政收入变动的99%,模型拟合程度较好。 模型说明当GDP 每增长1亿元,平均说来地方财政收入将增长0.134582亿元。 当2005年GDP 为3600亿元时,地方财政收入的点预测值为: ???3.611151?0.134582?3600?480.884(亿元) Y2005区间预测: 222x??(n?1)?587.2686?(12?1)?3793728.494 ?ix22 (Xf1?X)?(3600?917.5874)?7195337.357 取??0.05,Yf平均值置信度95%的预测区间为: Yf^t?2?^21(Xf?X)? 2nx?iGDP2005?3600时 480.8842.228?7.5325?17195337.357??480.88425.2735(亿元) 123293728.494Yf个别值置信度95%的预测区间为: Yf^21(Xf?X)t?2?1?? 2n?xi^即 =480.8842.228?7.5325?1?17195337.357? 123293728.494 ?480.88430.3381(亿元) 16、解:(1)给定??0.05和自由度为2下,查卡方分布表,得临界值??5.9915, 2222而White统计量nR?5.2125,有nR??0.05(2),则不拒绝原假设,说明模型中不存在异 方差。 (2)因为对如下函数形式 e??2X?? 得样本估计式 ??6.4435Xe (4.5658) R2?0.2482由此,可以看出模型中随机误差项有可能存在异方差。 (3)对异方差的修正。可取权数为w?1/X。 17、解:(1)由lnX?1?X?2.7183,也就是说,人均收入每增加1.7183倍,平均意义上各国的期望寿命会增加9.39岁。若当为富国时,Di?1,则平均意义上,富国的人均收入每增加1.7183倍,其期望寿命就会减少3.36岁,但其截距项的水平会增加23.52,达到21.12的水平。但从统计检验结果看,对数人均收入lnX对期望寿命Y的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。 (2)若Di?1代表富国,则引入Di?lnXi?7?的原因是想从截距和斜率两个方面考证富国的影响,其中,富国的截距为??2.40?3.36?7?21.12?,斜率为?9.39?3.36?6.03?,因此,当富国的人均收入每增加1.7183倍,其期望寿命会增加6.03岁。 ?1若为贫穷国(3)对于贫穷国,设定Di??,则引入的虚拟解释变量的形式为 0若为富国?(Di(7?lnXi));对于富国,回归模型形式不变。 18、答: (1)选择第二个模型。因为不同的性别,身高与体重的关系是不同的,并且从模型的估计结果看出,性别虚拟变量统计上是显著的。 (2)如果选择了堤一个模型,会发生异方差问题。 (3)D的系数23.8238说明当学生身高每增加1英寸时,男生比女生的体重平均多23.8238磅。 19、解:描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程: Yi??1??2Xi?ui ??6.017832?0.070414X 即 Yii (1.052260)(0.014176) t=(5.718961) (-4.967254) 2 R=0.778996 F=24.67361 这说明当航班正点到达比率每提高1个百分点, 平均说来每10万名乘客投诉次数将下降0.07次。 如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数为 ??6.017832?0.070414?80?0.384712(次) Yi220、解:(1)因为f(Xi)?X2i,所以取W2i?1,用Wi乘给定模型两端,得 X2i YiXu1??1??2??33i?i X2iX2iX2iX2i上述模型的随机误差项的方差为一固定常数,即 Var(ui1)?2Var(ui)??2 X2iX2i(2)根据加权最小二乘法,可得修正异方差后的参数估计式为 ??Y*???X*???X* ?12233? ?2??W?2i**2****yi*x2i???W2ix3i????W2iyix3i???W2ix2ix3i???W*22i2ix???W*22i3ix????W**22i2i3ixx? ??其中 3W???***2****yxWx?WyxWx?????????2ii3i2i2i2ii2i2i2ix3i? ??W2i2i*2*2**2ix2i???W2ix3i????W2ix2ix3i?2 X*2WX???W2i,X*3WX???W2i2i3i,Y*WY???W2i2ii ** x2i?X2i?X2**x3?X?Xi3i3y*?Yi?Y* 21、解:(1)给定模型的简化式为 ?10??20u?u2t?22?Yt?1?1t1??11??211??11??211??11??21???21?10??11?20?u??21u1t?u1t?11?22 Ct?10 ?Yt?1?112t1??11??211??11??211??11??21???11?20??21?10?22??11?22?u??11u2t?u2tIt?20?Yt?1?211t1??11??211??11??211??11??21Yt?由模型的结构型,M=3,K=2。下面只对结构型模型中的第一个方程和第二个方程判断其识别 性。 首先用阶条件判断。第一个方程,已知m1?2,k1?0,因为 K?k1?2?0?2?m1?1?2?1?1, 所以该方程有可能为过度识别。 第二个方程,已知m2?2,k2?1,因为 K?k2?2?1?1?m2?1?2?1?1 所以该方程有可能恰好识别。第三个方程为定义式,故可不判断其识别性。 其次用秩条件判断。写出结构型方程组的参数矩阵 ???1010??1100??? ???2001??11??220? ?0?1?1101???对于第一个方程,划去该方程所在的行和该方程中非零系数所在的列,得 ?B0?1??220??0???? ?101??由上述矩阵可得到三个非零行列式,根据阶条件,该方程为过度识别。事实上,所得到的矩 阵的秩为2,则表明该方程是可识别,再结合阶条件,所以该方程为过度识别。同理,可判断第二个方程为恰好识别。 (2)根据上述判断的结果,对第一个方程可用两段最小二乘发估计参数;对第二个方程可用间接最小二乘法估计参数。 22、解:(1)建立中国1978年-1997年的财政收入Y和国内生产总值X的线性回归方程 Yt??1??2Xt?ut 利用1978年-1997年的数据估计其参数,结果为 ??857.8375?0.100036X Yii (12.77955)(46.04910) t=(12.77955) (46.04910) 2 R=0.991593 F=24.67361 GDP增加1亿元,平均说来财政收入将增加0.1亿元。 (2) r2?ESS?0.991593,模型的拟合程度较高。TSS??0??0H0:?H1:?22??2t?~t(18)??SE(?)2 t?46.0491?t0.025(18),拒绝H0说明,国内生产总值对财政收入有显著影响。 (3)若是1998年的国内生产总值为78017.8亿元,确定1998年财政收入的点预测值 为 ??857.8375?0.100036?78017.8?8662.426141(亿元) Yt1998年财政收入平均值预测区间(??0.05)为: 222x??(n?1)?22024.60?(20?1)?9216577098 ?ix(Xf?X)2?(78017.8?22225.13)2?3112822026 Yft?2?^^21(Xf?X)? 2nx?i8662.4262.101?208.5553?19216577098? 203112822026?8662.426760.3111(亿元) 23、解:从模型拟合结果可知,样本观测个数为27,消费模型的判定系数R?0.95,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。 依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值: 2t0?8.1331.0590.4520.121?0.91,t1??6.10,t2??0.69,t3??0.11 8.920.170.661.09除t1外,其余的tj值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元, 消费支出的增长平均将超过一美元,这与经济理论和常识不符。 另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。 24、答:第一个模型回归,结果如下: ???215.2202?1.007PDI PCEttt?(?6.3123) (?64.2447) R2?0.9961 DW=1.302 第二个模型进行回归,结果如下: ???231.233?0.9759PDI?0.043PCE PCEttt?1t?(?4.7831) (6.3840) (0.2751) R2?0.996196 DW=1.4542 (2)从模型一得到MPC=1.0070;从模型二得到,短期MPC=0.9759,长期 MPC=0.9759+(-0.043)=0.9329 25、答:(1)由模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。 (2)取??0.05,查表得t0.025(31?3)?2.048 因为3个参数t统计量的绝对值均大于t0.025(31?3)?2.048,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。 取??0.05,查表得F0.05(2,28)?3.34,由于F?199.1894?F0.05(2,28)?3.34,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。 26、答:在局部调整假定和自适应假定下,上述二模型最终都转化为一阶自回归模型。为此,先估计如下形式的一阶自回归模型: *Yt??*??0Xt??1*Yt?1?ut* 即为Eviews给出结果,从结果看,t值F值都很显著,R2不是很高。 ****(1)根据局部调整模型的参数关系,有????,?0???,?1?1??,?t???t,将上述 估计结果代入得到: ??0.9853,??0.1037,??1.9249 故局部调整模型为: Yt*?1.9249?0.1037Xt??t 意义:为了达到全省工业总产值的计划值,寻求一个未来预期新增固定资产的最佳量。全省工业总产值每计划增加1(亿元),则未来预期最佳新增固定资产量为0.1037亿元。 (2)根据自适应模型的参数关系,有 ?*???,?0*???,?1*?1??,?t*??t?(1??)?t?1,代入得到: ??0.9853,??0.1037,??1.9249 故局部调整模型为: Yt?1.9249?0.1037X*t??t 意义:新增固定资产的变化取决于全省工业总产值的预期值。全省工业总产值每预期增加增加1(亿元),当期新增固定资产量为0.1037(亿元)。 (3)局部调整模型和自适应模型的区别在于:局部调整模型是对应变量的局部调整而得到的;而自适应模型是由解释变量的自适应过程而得到的。由回归结果可见,Y滞后一期的回归系数并不显著,说明两个模型的设定都不合理。 27、答:该方程组有M=3,K=2。 (前定变量有:Mt Mt Yt) (1)需求函数,用阶条件判断,有K?k1?2?2?0?m1?1?2?1?1,所以该方程为不可识别。 (2)供给函数,用阶条件判断,再结合零系数原则,该方程为过度识别。 (3)用两段最小二乘法估计供给函数。 ds