第一章 绪论
1.1 试列出计量经济分析的主要步骤。
1.2 计量经济模型中为何要包括扰动项?
1.3 什么是时间序列和横截面数据? 试举例说明二者的区别。
1.4 估计量和估计值有何区别?
第二章 计量经济分析的统计学基础
2.1 名词解释 随机变量
概率密度函数 抽样分布 样本均值 样本方差 协方差 相关系数 标准差 标准误差 显著性水平 置信区间 无偏性 有效性
一致估计量 接受域 拒绝域
第I 类错误
2.2 请用例2.2 中的数据求北京男生平均身高的99%置信区间。
2.3 25 个雇员的随机样本的平均周薪为130 元,试问此样本是否取自一个均值 为120 元、标准差为10 元的正态总体?
2.4 某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500 元, 在下一个月份中,取出16 个这种食品店的一个样本,其月平均销售额为2600 元, 销售额的标准差为480 元。试问能否得出结论,从上次调查以来,平均月销售额 已经发生了变化?
第三章 双变量线性回归模型
3.1 判断题(判断对错;如果错误,说明理由) (1)OLS 法是使残差平方和最小化的估计方法。
(2)计算OLS 估计值无需古典线性回归模型的基本假定。
(3)若线性回归模型满足假设条件(1)~(4),但扰动项不服从正态分布,则尽管OLS 估计量不再是BLUE,但仍为无偏估计量。 (4)最小二乘斜率系数的假设检验所依据的是t 分布,要求b? 的抽样分布是正 态分布。
(5)R2=TSS/ESS。
(6)若回归模型中无截距项,则? 1 0 t e 。 (7)若原假设未被拒绝,则它为真。
(8)在双变量回归中, s 2的值越大,斜率系数的方差越大。
3.2 设YX b? 和XY b? 分别表示Y 对X 和X 对Y 的OLS 回归中的斜率,证明 YX b?
XY b? = r 2
r 为X 和Y 的相关系数。 3.3 证明:
(1)Y 的真实值与OLS 拟合值有共同的均值,即 Y n Y n Y = = ? ? ? ;
(2)OLS 残差与拟合值不相关,即 ? ? = 0 t t Y e 。 3.4 证明本章中(3.18)和(3.19)两式: (1) ? ? = 2 2 2 ( ? )
t t n x X Var s a
(2) ? = - 2 2
( ?, ? )
t x X Cov s
a b
3.5 考虑下列双变量模型:
模型1: i i i Y = + X + u 1 2 b b
模型2: i i i Y = + (X - X ) + u 1 2 a a
(1)b1 和a1 的OLS 估计量相同吗?它们的方差相等吗? (2)b2 和a2 的OLS 估计量相同吗?它们的方差相等吗?
3.6 有人使用1980-1994 年度数据,研究汇率和相对价格的关系,得到如下结 果:
: (1.22) (1.333)
? 6.682 4.318 2 0.528
Se Y X R t t = - =
其中,Y=马克对美元的汇率
X=美、德两国消费者价格指数(CPI)之比,代表两国的相对价格 (1)请解释回归系数的含义;
(2)Xt 的系数为负值有经济意义吗?
(3)如果我们重新定义X 为德国CPI 与美国CPI 之比,X 的符号会变化吗? 为什么?
3.7 随机调查200 位男性的身高和体重,并用体重对身高进行回归,结果如下: : (2.15) (0.31) ? 76.26 1.31 2 0.81
Se Weight = - + Height R =
其中Weight 的单位是磅(lb),Height 的单位是厘米(cm)。
(1)当身高分别为177.67cm、164.98cm、187.82cm 时,对应的体重的拟合 值为多少?
(2)假设在一年中某人身高增高了3.81cm,此人体重增加了多少? 3.8 设有10 名工人的数据如下: X 10 7 10 5 8 8 6 7 9 10 Y 11 10 12 6 10 7 9 10 11 10 其中 X=劳动工时, Y=产量
(1)试估计Y=α+βX + u(要求列出计算表格); (2)提供回归结果(按标准格式)并适当说明; (3)检验原假设β=1.0。
3.9 用12 对观测值估计出的消费函数为Y=10.0+0.90X,且已知s? 2 =0.01, C=200,?C2 =4000,试预测当X0=250 时Y0 的值,并求Y0 的95%置信区间。 3.10 设有某变量(Y)和变量(X)1995—1999 年的数据如下: X 6 11 17 8 13 Y 1 3 5 2 4
(1) 试用OLS 法估计 Yt = α + βXt + ut(要求列出计算表格); (2) 求s? 2和R2;
(3) 试预测X0=10 时Y0 的值,并求Y0 的95%置信区间。
3.11 根据上题的数据及回归结果,现有一对新观测值X0 =20,Y0 =7.62,试 问它们是否可能来自产生样本数据的同一总体?
3.12 有人估计消费函数i i i C = a + b Y + u ,得到如下结果(括号中数字为t 值):
i C? = 15 + 0.81 i Y R2=0.98 (2.7) (6.5) n=19
(1) 检验原假设:b =0(取显著性水平为5%) (2) 计算参数估计值的标准误差;
(3) 求b 的95%置信区间,这个区间包括0 吗?
3.13 试用中国1985—2003 年实际数据估计消费函数: t C =α+β t Y + ut
其中:C 代表消费,Y 代表收入。原始数据如下表所示,表中: Cr=农村居民人均消费支出(元) Cu=城镇居民人均消费支出(元) Y=国内居民家庭人均纯收入(元) Yr=农村居民家庭人均纯收入(元) Yu=城镇居民家庭人均可支配收入(元) Rpop=农村人口比重(%) pop=历年年底我国人口总数(亿人) P=居民消费价格指数(1985=100)
Pr=农村居民消费价格指数(1985=100) Pu=城镇居民消费价格指数(1985=100) 年份 Cr Cu Yr Yu Rpop Pop P Pr Pu
1985 317.42 673.20 397.60 739.10 76.29 10.59 100.00 100.0 100.0 1986 356.95 798.96 423.80 899.60 75.48 10.75 106.50 106.1 107.0 1987 398.29 884.40 462.60 1002.20 74.68 10.93 114.30 112.7 116.4 1988 476.66 1103.98 544.90 1181.40 74.19 11.10 135.80 132.4 140.5 1989 535.37 1210.95 601.50 1375.70 73.79 11.27 160.20 157.9 163.3 1990 584.63 1278.89 686.30 1510.20 73.59 11.43 165.20 165.1 165.4 1991 619.79 1453.81 708.60 1700.60 73.63 11.58 170.80 168.9 173.8 1992 659.21 1671.73 784.00 2026.60 72.37 11.72 181.70 176.8 188.8 1993 769.65 2110.81 921.60 2577.40 71.86 11.85 208.40 201.0 219.2 1994 1016.81 2851.34 1221.00 3496.20 71.38 11.99 258.60 248.0 274.1 1995 1310.36 3537.57 1577.70 4283.00 70.96 12.11 302.80 291.4 320.1 1996 1572.08 3919.47 1926.10 4838.90 70.63 12.24 327.90 314.4 348.3 1997 1617.15 4185.64 2090.10 5160.30 69.52 12.36 337.10 322.3 359.1 1998 1590.33 4331.61 2162.00 5425.10 68.09 12.48 334.40 319.1 356.9 1999 1577.42 4614.91 2210.30 5854.00 66.65 12.59 329.70 314.3 352.3 2000 1670.13 4998.00 2253.40 6280.00 65.22 12.67 331.00 314.0 355.1 2001 1741.09 5309.01 2366.40 6859.60 63.78 12.76 333.30 316.5 357.6 2002 1834.31 6029.88 2475.60 7702.80 62.34 12.85 330.60 315.2 354.0 2003 1943.30 6510.94 2622.20 8472.20 60.91 12.92 334.60 320.2 357.2 数据来源:《中国统计年鉴2004》
使用计量经济软件,用国内居民人均消费、农村居民人均消费和城镇居民人均 消费分别对各自的人均收入进行回归,给出标准格式回归结果;并由回归结果分 析我国城乡居民消费行为有何不同。
第四章 多元线性回归模型
4.1 某经济学家试图解释某一变量Y 的变动。他收集了Y 和5 个可能的解释变 量1 C ~ 5 C 的观测值(共10 组),然后分别作三个回归,结果如下(括号中数字
为t 统计量):
(1) t U ) = 51.5 + 3.21 1t C R 2 =0.63 (3.45) (5.21)
(2) t U ) = 33.43 + 3.67 1t C + 4.62 2t C + 1.21 3t C R 2 =0.75 (3.61) (2.56) (0.81) (0.22)
(3) t U ) = 23.21 + 3.82 1t C + 2.32 2t C + 0.82 3t C + 4.10 4t C + 1.21 5t C
(2.21) (2.83) (0.62) (0.12) (2.10) (1.11) R 2 =0.80
你认为应采用哪一个结果?为什么? 4.2 为研究旅馆的投资问题,我们收集了某地的1987-1995 年的数据来估计收益 生产函数R=ALαKβeμ,其中R=旅馆年净收益(万年),L=土地投入,K=资金 投入,e 为自然对数的底。设回归结果如下(括号内数字为标准误差): R?
ln = -0.9175 + 0.273lnL + 0.733lnK R2 =0.94 (0.212) (0.135) (0.125)
(1) 请对回归结果作必要说明; (2)分别检验α和β的显著性; (3)检验原假设:α=β= 0;
4.3 我们有某地1970-1987 年间人均储蓄和收入的数据,用以研究1970-1978 和1978 年以后储蓄和收入之间的关系是否发生显著变化。引入虚拟变量后,估 计结果如下(括号内数据为标准差):
t U ) = -1.7502 + 1.4839D + 0.1504 t C - 0.1034D· t C R2 =0.9425 (0.3319) (0.4704) (0.0163) (0.0332) 其中:Y=人均储蓄,X=人均收入,D= 0, 1970 1978 1, 1979 1987 - ìí ? - 年 年
请检验两时期是否有显著的结构性变化。
4.4 说明下列模型中变量是否呈线性,系数是否呈线性,并将能线性化的模型 线性化。
(1) 0 1 2 2 1 1
y u x x = b + b + b + (2) 1 0 y x u = b b +
(3) ( 0 1 ) 1
1 x u y e - b +b + = +
4.5 有学者根据某国19 年的数据得到下面的回归结果: 2 1 2
? 58.9 0.20 0.10 0.96 : (0.0092) (0.084)
t t t Y X X R Se = - + - =
其中:Y=进口量(百万美元),X1 =个人消费支出(百万美元), X2 =进口价格/国内价格。
(1)解释截距项以及X1 和X2 系数的意义;
(2)Y 的总变差中被回归方程解释的部分、未被回归方程解释的部分各是多 少?
(3)进行回归方程的显著性检验,并解释检验结果;
(4)对“斜率”系数进行显著性检验,并解释检验结果。
4.6 由美国46 个州1992 年的数据,Baltagi 得到如下回归结果: : (0.91) (0.32) (0.20)
log 4.30 1.34log 0.17log 2 0.27
Se c = - p + Y R =
其中,C=香烟消费(包/人年),P=每包香烟的实际价格 Y=人均实际可支配收入
(1)香烟需求的价格弹性是多少?它是否统计上显著?若是,它是否统计上异 于-1? (2)香烟需求的收入弹性是多少?它是否统计上显著?若不显著,原因是什么? (3)求出R2。
4.7 有学者从209 个公司的样本,得到如下回归结果(括号中数字为标准误差): log( ? ) 4.32 0.280log( ) 0.0174 0.00024 2 0.283 (0.32) (0.035) (0.0041) (0.00054) Salary = + sales + roe + ros R =
其中,Salary=CEO 的薪金 Sales=公司年销售额 roe=股本收益率(%) ros=公司股票收益 请分析回归结果。
4.8 为了研究某国1970-1992 期间的人口增长率,某研究小组估计了下列模型: : (781.25)(54.71) 1 ln( ) 4.73 0.024
t pop t t 模型: = +
: (2477.92) (34.01) ( 17.03) (25.54)
2 ln( ) 4.77 0.015 0.075 0.011( ) -
= + - +
t pop t D D t t t t 模型:
其中:Pop=人口(百万人),t=趋势变量, ? í ì =
年以前 年及以后 0 1978 1 1978 D 。
(1)在模型1 中,样本期该地的人口增长率是多少?
(2)人口增长率在1978 年前后是否显著不同?如果不同,那么1972-1977 和 1978-1992 两时期中,人口增长率各是多少?
4.9 设回归方程为Y=β0+β1X1+β2X2+β3X3+ u, 试说明你将如何检验联合假 设:β1= β2 和β3 = 1 。
4.10 下列情况应引入几个虚拟变量,如何表示? (1) 企业规模:大型企业、中型企业、小型企业; (2) 学历:小学、初中、高中、大学、研究生。 4.11 在经济发展发生转折时期,可以通过引入虚拟变量来表示这种变化。例如, 研究进口消费品的数量Y 与国民收入X 的关系时,数据散点图显示1979 年前后 明显不同。请写出引入虚拟变量的进口消费品线性回归方程。 4.12 柯布-道格拉斯生产函数 a bu Y = AK L 其中:GDP=地区国内生产总值(亿元) K=资本形成总额(亿元) L=就业人数(万人) P=商品零售价格指数(上年=100)
试根据中国2003 年各省数据估计此函数并分析结果。数据如下表所示。 地区 gdp K L P 地区 gdp K L P
北京 3663.10 2293.93 858.6 98.2 湖北 5401.71 2141.90 2537.3 101.2 天津 2447.66 1320.47 419.7 97.4 湖南 4638.73 1738.27 3515.9 100.6 河北 7098.56 3128.80 3389.5 100.2 广东 13625.87 5259.48 4119.5 100.0 山西 2456.59 1230.34 1469.5 100.3 广西 2735.13 1030.40 2601.4 100.2 内蒙古 2150.41 1299.27 1005.2 99.6 海南 670.93 315.66 353.8 100.4 辽宁 6002.54 2333.67 1861.3 98.9 重庆 2250.56 1314.20 1659.5 99.5 吉林 2522.62 1102.87 1044.6 100.5 四川 5456.32 2295.26 4449.6 100.1 黑龙江 4430.00 1307.86 1622.4 99.7 贵州 1356.11 759.63 2118.4 100.0 上海 6250.81 2957.20 771.5 99.0 云南 2465.29 1147.12 2349.6 99.9 江苏 12460.83 6182.38 3610.3 99.8 西藏 184.50 104.58 130.7 99.4 浙江 9395.00 4639.06 2961.9 99.6 陕西 2398.58 1447.73 1911.3 100.5 安徽 3972.38 1455.21 3416.0 101.3 甘肃 1304.60 610.83 1304.0 100.2 福建 5232.17 2396.91 1756.7 99.1 青海 390.21 294.25 254.3 100.8 江西 2830.46 1354.99 1972.3 100.1 宁夏 385.34 320.43 290.6 99.5
山东 12435.93 5788.53 4850.6 100.2 新疆 1877.61 1119.21 721.3 99.2 河南 7048.59 2874.67 5535.7 101.3
第五章 模型的建立与估计中的问题及对策
5.1 判断题(判断对错;如果错误,说明理由)
(1)尽管存在严重多重共线性,普通最小二乘估计量仍然是最佳线性无偏估计 量(BLUE)。
(2)如果分析的目的仅仅是为了预测,则多重共线性并无妨碍。
(3)如果解释变量两两之间的相关系数都低,则一定不存在多重共线性。 (4)如果存在异方差性,通常用的t 检验和F 检验是无效的。 (5)当存在自相关时,OLS 估计量既不是无偏的,又不是有效的。 (6)消除一阶自相关的一阶差分变换法假定自相关系数必须等于1。
(7)模型中包含无关的解释变量,参数估计量会有偏,并且会增大估计量的方 差,即增大误差。
(8)多元回归中,如果全部“斜率”系数各自经t 检验都不显著,则R2 值也高 不了。
(9)存在异方差的情况下,OLS 法总是高估系数估计量的标准误差。
(10)如果一个具有非常数方差的解释变量被(不正确地)忽略了,那么OLS 残差将呈异方差性。
5.2 考虑带有随机扰动项的复利增长模型: (1 ) , 0 t t t Y = Y + r u Y 表示GDP,Y0
是Y 的基期值,r 是样本期内的年均增长率,t 表示年份,t=1978,?,2003。 试问应如何估计GDP 在样本期内的年均增长率? 5.3 检验下列情况下是否存在扰动项的自相关。 (1) DW=0.81,n=21,k=3 (2) DW=2.25,n=15,k=2 (3) DW=1.56,n=30,k=5
5.4 有人建立了一个回归模型来研究我国县一级的教育支出: Y=β0+β1X1+β2X2+β3X3+u
其中:Y,X1,X2 和X3 分别为所研究县份的教育支出、居民人均收入、学龄儿 童人数和可以利用的各级政府教育拨款。
他打算用遍布我国各省、市、自治区的100 个县的数据来估计上述模型。 (1)所用数据是什么类型的数据?
(2)能否采用OLS 法进行估计?为什么?
(3)如不能采用OLS 法,你认为应采用什么方法? 5.5 试从下列回归结果分析存在问题及解决方法:
(1) i U? = 24.7747 + 0.9415 2i C - 0.0424 3i C R2 =0.9635 SE: (6.7525) (0.8229) (0.0807) 其中:Y=消费,X2=收入,X3=财产,且n=5000 (2) t Y? = 0.4529 - 0.0041t R2 =0.5284 t: (-3.9606) DW=0.8252
其中Y=劳动在增加值中的份额,t=时间
该估计结果是使用1949-1964 年度数据得到的。
5.6 工资模型:wi=b0+b1Si+b2Ei+b3Ai+b4Ui+ui
其中Wi=工资,Si=学校教育年限,Ei=工作年限,Ai=年龄,Ui=是否参加 工会。
在估计上述模型时,你觉得会出现什么问题?如何解决?
5.7 你想研究某行业中公司的销售量与其广告宣传费用之间的关系。你很清楚 地知道该行业中有一半的公司比另一半公司大,你关心的是这种情况下,什么估 计方法比较合理。假定大公司的扰动项方差是小公司扰动项方差的两倍。
(1)若采用普通最小二乘法估计销售量对广告宣传费用的回归方程(假设广告 宣传费是与误差项不相关的自变量),系数的估计量会是无偏的吗?是一致的 吗?是有效的吗?
(2)你会怎样修改你的估计方法以解决你的问题? (3)能否对原扰动项方差假设的正确性进行检验? 5.8 考虑下面的模型
t t t t t t GNP = + M + M + M - M + u - ( - ) 0 1 2 1 3 1 b b b b 其中GNP=国民生产总值,M=货币供给。
(1)假设你有估计此模型的数据,你能成功地估计出模型的所有系数吗?说明 理由。
(2)如果不能,哪些系数可以估计?
(3)如果从模型中去掉2 t-1 b M 这一项,你对(1)中问题的答案会改变吗? (4)如果从模型中去掉t M 1 b 这一项,你对(1)中问题的答案会改变吗? 5.9 采用美国制造业1899-1922 年数据,Dougherty 得到如下两个回归结果: ln ? 2.81 0.53ln 0.91ln 0.47 2 0.97 189.8 : (1.38) (0.34) (0.14) (0.021)
Y K L t R F Se = - + + = = (1)
ln( ? / ) 0.11 0.11ln( / ) 0.006 2 0.65 19.5 : (0.03) (0.15) (0.002)
Y L K L t R F Se = - + + = = (2)
其中:Y=实际产出指数,K=实际资本投入指数, L=实际劳动力投入指数,t=时间趋势
(1)回归式(1)中是否存在多重共线性?你是如何得知的? (2)回归式(1)中,logK 系数的预期符号是什么?回归结果符合先验预期吗? 为什么会这样?
(3)回归式(1)中,趋势变量在其中起什么作用? (4)估计回归式(2)背后的逻辑是什么?
(5)如果(1)中存在多重共线性,那么(2)式是否减轻这个问题?你如何得 知?
(6)两个回归的R2 可比吗?说明理由。 5.10 有人估计了下面的模型:
(1) t 1 2 t 3 t t C =b + b GNP + b D + u 其中:C=私人消费支出,GNP=国民生产总值,D=国防支出 假定2 2 2 ( ) t t s =s GNP ,将(1)式转换成下式:
/ (1/ ) ( / ) / (2) t t 1 t 2 3 t t t t C GNP =b GNP + b + b D GNP + u GNP 使用1946-1975 数据估计(1)、(2)两式,得到如下回归结果(括号中数字 为标准误差):
(2.73) (0.006) (0.0736)
C? = 26.19 + 0.6248GNP - 0.4398D R2 = 0.999 t t t (2.22) (0.0068) (0.0597)
C? /GNP =25.92(1/GNP ) + 0.6246 - 0.4315(D /GNP ) R2 = 0.875 t t t t (1)关于异方差,模型估计者做出了什么样的假定?你认为他的依据是什么? (2)比较两个回归结果。模型转换是否改进了结果?也就是说,是否减小了估 计标准误差?说明理由。 5.11 设有下列数据: RSS1=55,K=4,n1=30 RSS3=140,K=4,n3=30
请依据上述数据,用戈德佛尔德-匡特检验法进行异方差性检验(5%显著 性水平)。 5.12 考虑模型 0 1
1 1 2 2
t t t t t t t Y X u u u u b b
r r e - - = + + = + + (1)
也就是说,扰动项服从AR(2)模式,其中t e
是白噪声。请概述估计此模型所 要采取的步骤。
5.13 对第3 章练习题3.13 所建立的三个消费模型的结果进行分析: 是否存在序列相关问题?如果有,应如何解决?
5.14 为了研究中国农业总产值与有效灌溉面积、化肥施用量、农作物总播种面 积、受灾面积的相互关系,选31 个省市2003 年的数据资料,如下表所示: 地区 y X1 X2 X23 X3 X4
北 京 88.75 178.90 14.32 30.91 308.83 59.00 天 津 88.20 354.09 17.80 23.66 501.46 143.00
河 北 958.30 4403.99 283.31 21.86 8638.50 2998.00 山 西 249.45 1095.25 89.91 16.17 3707.95 828.80 内蒙古 335.96 2568.54 93.19 10.80 5752.75 3227.00 辽 宁 497.33 1512.83 112.62 20.19 3719.13 1169.00 吉 林 438.34 1545.52 122.26 17.28 4716.75 1905.00 黑龙江 502.93 2111.53 125.70 8.55 9802.67 6659.00 上 海 98.16 257.31 15.87 25.24 419.19 1.10
江 苏 981.25 3840.98 334.67 29.05 7681.49 2863.70 浙 江 529.44 1403.80 90.38 21.26 2834.39 612.80 安 徽 617.92 3285.38 281.28 20.55 9124.69 3747.40 福 建 466.75 939.95 120.29 31.84 2518.92 1097.00 江 西 383.71 1873.16 110.98 14.81 4997.35 1823.00 山 东 1599.32 4760.79 432.65 26.50 10885.28 2632.00 河 南 1137.74 4792.22 467.89 22.79 13684.36 4965.00 湖 北 733.36 2043.69 270.32 25.25 7138.26 3099.00 湖 南 671.66 2675.34 188.33 16.24 7731.24 2741.00 广 东 851.72 1315.93 199.61 27.25 4883.39 1194.30 广 西 500.82 1516.67 183.69 19.50 6279.07 1831.00 海 南 152.71 177.27 33.92 24.94 906.74 277.00 重 庆 270.12 649.69 71.60 14.18 3365.81 959.00 四 川 804.70 2503.15 208.39 14.80 9384.46 2743.00 贵 州 275.47 682.71 74.92 10.78 4634.23 1060.10 云 南 433.91 1457.00 129.22 14.97 5756.00 1493.00 西 藏 25.27 156.32 3.19 9.10 233.66 4.00
陕 西 334.35 1271.86 142.73 23.46 4055.78 2136.00 甘 肃 275.82 994.44 69.57 12.81 3620.92 1051.00 青 海 29.74 181.73 6.85 9.78 466.80 174.00 宁 夏 54.13 413.19 25.36 14.97 1129.48 245.40 新 疆 482.76 3051.00 90.74 17.11 3535.02 767.70 表中:
Y=农业总产值(亿元,不包括林牧渔)
X1=有效灌溉面积(千公顷) X2=化肥施用量(万吨) X23=化肥施用量(公斤/亩)
X3=农作物总播种面积(千公顷) X4=受灾面积(千公顷) (1)回归并根据计算机输出结果写出标准格式的回归结果;
(2)模型是否存在问题?如果存在问题,是什么问题?如何解决?
第六章 动态经济模型:自回归模型和分布滞后模型
6.1 判断题(判断对错;如果错误,说明理由) (1)所有计量经济模型实质上都是动态模型。
(2)如果分布滞后系数中,有的为正有的为负,则科克模型将没有多大用处。 (3)若适应预期模型用OLS 估计,则估计量将有偏,但一致。 (4)对于小样本,部分调整模型的OLS 估计量是有偏的。 (5)若回归方程中既包含随机解释变量,扰动项又自相关,则采用工具变量法, 将产生无偏且一致的估计量。
(6)解释变量中包括滞后因变量的情况下,用德宾-沃森d 统计量来检测自相 关是没有实际用处的。
6.2 用OLS 对科克模型、部分调整模型和适应预期模型分别进行回归时,得到 的OLS 估计量会有什么样的性质?
6.3 简述科克分布和阿尔蒙多项式分布的区别。 6.4 考虑模型
t t t t t Y =a + b X + b X + b Y +u 1 1 2 2 3 -1
假设t t Y 和u -1 相关。要解决这个问题,我们采用以下工具变量法:首先用t Y 对t X1
和t X2 回归,得到t Y 的估计值t Y? ,然后回归
t t t t t Y =a + b X + b X + b Y +u 1 1 2 2 3 -1 ?
其中t Y? 是第一步回归( t Y 对t X1 和t X2 回归)中得到的。 (1)这个方法如何消除原模型中t t Y 和u -1 的相关? (2)与利维顿采用的方法相比,此方法有何优点? 6.5 设
t t t t M = + Y + R + u * * 1 2 a b b
其中:M=对实际现金余额的需求,Y*=预期实际收入, R*=预期通货膨胀率
假设这些预期服从适应预期机制: * - * * - * = + - = + - 2 2 1 1 1 1 (1 ) (1 )
t t t t t t R R R Y Y Y g g g g
其中1 g 和2 g 是调整系数,均位于0 和1 之间。 (1)请将Mt 用可观测量表示; (2)你预计会有什么估计问题? 6.6 考虑分布滞后模型
t t t t t t t Y = + X + X + X + X + X + u 0 1 -1 2 -2 3 -3 4 -4 a b b b b b
假设可用二阶多项式表示诸i b 如下: 2
0 1 2i i i b =a +a +a
若施加约束0 b = 4 b =0,你将如何估计诸系数( i b ,i=0,1,...,4)
6.7 为了研究设备利用对于通货膨胀的影响,T. A.吉延斯根据1971 年到1988 年
的美国数据获得如下回归结果: : ( 6.27) (2.60) (4.26) ? 30.12 0.141 0.236 2 0.727 1 -
= - + + = -
t Y X X R t t t 其中:Y=通货膨胀率(根据GNP 平减指数计算) Xt=制造业设备利用率
Xt-1=滞后一年的设备利用率
(1)设备利用对于通货膨胀的短期影响是什么?长期影响又是什么? (2)每个斜率系数是统计显著的吗?
(3)你是否会拒绝两个斜率系数同时为零的原假设?将利用何种检验? 6.8 考虑下面的模型:
Yt = α+β(W0Xt+ W1Xt-1 + W2Xt-2 + W3Xt-3)+u t
请说明如何用阿尔蒙滞后方法来估计上述模型(设用二次多项式来近似)。 6.9 下面的模型是一个将部分调整和适应预期假说结合在一起的模型: Yt
* = βXt+1 e
Yt-Yt-1 = δ(Yt * - Yt-1) + u t Xt+1 e - Xt
e = (1-λ)( Xt - Xt e);t=1,2,?,n
式中Yt
*是理想值,Xt+1 e 和Xt
e 是预期值。试推导出一个只包含可观测变量的方 程,并说明该方程参数估计方面的问题。
第七章 时间序列分析
7.1 单项选择题
(1)某一时间序列经一次差分变换成平稳时间序列,此时间序列称为( )的。 A.1 阶单整 B.2 阶单整
C.K 阶单整 D.以上答案均不正确
(2)如果两个变量都是一阶单整的,则( )。
A.这两个变量一定存在协整关系 B.这两个变量一定不存在协整关系 C.相应的误差修正模型一定成立 D.还需对误差项进行检验
(3)如果同阶单整的线性组合是平稳时间序列,则这些变量之间关系是( ) 。 A.伪回归关系 B.协整关系
C.短期均衡关系 D.短期非均衡关系
(4).若一个时间序列呈上升趋势,则这个时间序列是 ( )。 A.平稳时间序列 B.非平稳时间序列 C.一阶单整序列 D.一阶协整序列
7.2 请说出平稳时间序列和非平稳时间序列的区别,并解释为什么在实证分析中 确定经济时间序列的性质是十分必要的。 7.3 什么是单位根?
7.4 Dickey-Fuller(DF)检验和Engle-Granger(EG)检验是检验什么的? 7.5 什么是伪回归?在回归中使用非均衡时间序列时是否必定会造成伪回归? 7.6 由1948-1984 英国私人部门住宅开工数(X)数据,某学者得到下列回归结 果:
( :) : ( 2.35) : (12.50) (0.08) 31.03 0.188 1 -
D = - - t t
Se X Xt t 注:5%临界值t 值为-2.95,10%临界值t 值为-2.60。 (1)根据这一结果,检验住宅开工数时间序列是否平稳。
(2)如果你打算使用t 检验,则观测的t 值是否统计显著?据此你是否得出该序
列平稳的结论?
(3)现考虑下面的回归结果: D = - D + D - - t t
Se X X Xt t t 请判断住宅开工数的平稳性。
7.7 由1971-I 到1988-IV 加拿大的数据,得到如下回归结果; A.
0.9463, 0.3254
: ( 12.9422) (25.8865)
ln 1 10.2571 1.5975ln 2 = = - = - +
R DW t M GDPt t B.
0.0885, 1.7399
: (2.4957) (1.8958) ln 1 0.0095 0.5833 ln 2 = = D = + D
R DW t M GDPt t C.
0.1118, 1.4767 ( ) : ( 2.2521) 0.1958 2 1 = = -
D = - -
R DW t e et t t
其中,M1=货币供给,GDP=国内生产总值,et=残差(回归A) (1) 你怀疑回归A 是伪回归吗?为什么? (2) 回归B 是伪回归吗?请说明理由。
(3) 从回归C 的结果,你是否改变(1)中的结论,为什么? (4) 现考虑以下回归: 0.1066, 1.6697
: (2.0496) (2.0636) ( 0.8537) ln 1 0.0084 0.734 ln 0.0811 2 1 = = -
D = + D - -
R DW t M GDP et t t 这个回归结果告诉你什么?这个结果是否对你决定回归A 是否伪回归有帮 助?
7.8 检验我国人口时间序列的平稳性,数据区间为1949-2003 年。单位:万人 年份 POP 年份 POP 年份 POP
1949 54167 1968 78534 1986 107507 1950 55196 1969 80671 1987 109300 1951 56300 1970 82992 1988 111026 1952 57482 1971 85229 1989 112704 1953 58796 1972 87177 1990 114333 1954 60266 1973 89211 1991 115823 1955 61465 1974 90859 1992 117171 1956 62828 1975 92420 1993 118517 1957 64653 1976 93717 1994 119850 1958 65994 1977 94974 1995 121121 1959 67207 1978 96259 1996 122389 1960 66207 1979 97542 1997 123626 1961 65859 1980 98705 1998 124761 1962 67295 1981 100072 1999 125786 1963 69172 1982 101590 2000 126743 1964 70499 1983 102764 2001 127627 1965 72538 1984 103876 2002 128453 1966 74542 1985 105851 2003 129227 1967 76368
7.9 对中国进出口贸易进行协整分析,如果存在协整关系,则建立ECM 模型。 1951-2003 年中国进口(im)、出口(ex)和物价指数(pt,商品零售物价 指数)时间序列数据见下表。因为该期间物价变化大,特别是改革开放以后变化 更为激烈,所以物价指数也作为一个解释变量加入模型中。为消除物价变动对进 出口数据的影响以及消除进出口数据中存在的异方差,定义三个变量如下: 自然对数的商品价格指数)
自然对数的进口额,不变价, = 自然对数的出口额,不变价, = ln ln( )(
ln ln( / )( 1990 1) ln ln( / )( 1990 1)
pt price im im price ex ex price = = =
year lnex lnim lnpt year lnex lnim lnpt
1951 4.108 4.485 -0.921 1978 5.851 5.963 -0.730 1952 4.226 4.551 -0.926 1979 6.067 6.204 -0.711
1953 4.441 4.772 -0.892 1980 6.255 6.352 -0.652 1954 4.559 4.670 -0.870 1981 6.536 6.537 -0.629 1955 4.746 4.973 -0.860 1982 6.636 6.490 -0.611 1956 4.880 4.831 -0.860 1983 6.679 6.641 -0.596 1957 4.842 4.756 -0.844 1984 6.931 6.998 -0.567 1958 5.046 4.964 -0.842 1985 7.179 7.620 -0.483 1959 5.190 5.098 -0.832 1986 7.411 7.737 -0.425 1960 4.949 4.977 -0.801 1987 7.647 7.740 -0.354 1961 4.517 4.413 -0.652 1988 7.662 7.813 -0.185 1962 4.467 4.135 -0.614 1989 7.600 7.717 -0.021 1963 4.587 4.251 -0.675 1990 8.002 7.853 0.000 1964 4.728 4.453 -0.713 1991 8.222 8.103 0.028 1965 4.885 4.753 -0.740 1992 8.369 8.318 0.081 1966 4.932 4.855 -0.742 1993 8.368 8.492 0.205 1967 4.825 4.729 -0.751 1994 8.851 8.805 0.401 1968 4.864 4.681 -0.751 1995 8.891 8.771 0.539 1969 4.850 4.614 -0.759 1996 8.841 8.757 0.598 1970 4.803 4.791 -0.764 1997 9.020 8.770 0.606 1971 4.999 4.731 -0.772 1998 9.051 8.781 0.580 1972 5.192 4.933 -0.774 1999 9.141 8.978 0.549 1973 5.529 5.408 -0.768 2000 9.400 9.299 0.534 1974 5.699 5.791 -0.761 2001 9.474 9.385 0.526 1975 5.724 5.755 -0.761 2002 9.688 9.590 0.513 1976 5.661 5.619 -0.757 2003 9.987 9.927 0.512 1977 5.678 5.627 -0.738
第八章 联立方程模型
8.1 判断题(判断对错;如果错误,说明理由)
(1)OLS 法适用于估计联立方程模型中的结构方程。 (2)2SLS 法不能用于不可识别方程。
(3)估计联立方程模型的2SLS 法和其它方法只有在大样本的情况下,才能具 有我们期望的统计性质。
(4)联立方程模型作为一个整体,不存在类似R2 这样的拟合优度测度。
(5)如果要估计的方程扰动项自相关或存在跨方程的相关,则2SLS 法和其它 估计结构方程的方法都不能用。
(6)如果一个方程恰好识别,则ILS 和2SLS 给出相同结果。 8.2 单项选择题
(1) 结构式模型中的方程称为结构方程。在结构方程中,解释变量可以是前定 变量,也可以是( )。
A.外生变量 B.滞后变量 C.内生变量 D.外生变量和内生变量 (2)前定变量是( )的合称。
A.外生变量和滞后内生变量 B.内生变量和外生变量 C.外生变量和虚拟变量 D.解释变量和被解释变量 (3) 如果联立方程模型中某个结构方程包含了模型中所有的变量,则这个方程 ( )。
A.恰好识别 B.不可识别 C.过度识别 D.不确定 (4) 下面说法正确的是( )。
A.内生变量是非随机变量 B.前定变量是随机变量 C.外生变量是随机变量 D.外生变量是非随机变量
(5)当一个结构式方程为恰好识别时,这个方程中内生解释变量的个数( )。 A.与被排除在外的前定变量个数正好相等 B.小于被排除在外的前定变量个数 C.大于被排除在外的前定变量个数 D.以上三种情况都有可能发生
(6) 简化式模型就是把结构式模型中的内生变量表示为( )。 A.外生变量和内生变量的函数关系 B.前定变量和随机误差项的模型 C.滞后变量和随机误差项的模型 D.外生变量和随机误差项的模型 (7) 对联立方程模型进行参数估计的方法可以分两类,即:( )。 A.间接最小二乘法和系统估计方法 B.单方程估计法和系统估计方法 C.单方程估计法和二阶段最小二乘法 D.工具变量法和间接最小二乘法 (8) 在某个结构方程过度识别的条件下,不适用的估计方法是( )。 A.间接最小二乘法 B.工具变量法
C.二阶段最小二乘法 D.有限信息极大似然估计法 8.3 行为方程和恒等式有什么区别?
8.4 如何确定模型中的外生变量和内生变量? 8.5 考虑下述模型: Ct = α + βDt +u t It = γ + δDt-1 + νt
Dt = Ct + It + Zt; t=1,2,?,n
其中C = 消费支出,D= 收入,I = 投资,Z = 自发支出。
C、I 和D 是内生变量。试写出消费支出的简化型方程,并研究各方程的识别 问题。
8.6 考虑下述模型: Yt = Ct + It +Gt +Xt
Ct = β0 + β1D t + β2C t-1 + u t Dt = Yt – Tt
It = α0 + α1Yt + α2R t-1 +νt
模型中各方程是正规化方程,ut、νt 为扰动项。
(1)请指出模型中的内生变量、外生变量和前定变量。
(2)写出用2SLS 法进行估计时,每个阶段中要估计的方程。 8.7 下面是一个简单的美国宏观经济模型( 1960 - 1999 ) 0 1 2 1 1 0 1 2 3 1 2 0 1 2 3 4 1 3
t t t t t t t t t t t t t t t t t t t C Y C u I Y R I u R Y M P R u Y C I G a a a b b b b l l l l l - - -
= + + + = + + + + = + + + + + = + +
其中C=实际私人消费,I=实际私人总投资,G=实际政府支出,Y=实际GDP, M=当年价M2,R=长期利率;P=消费价格指数。 内生变量:C,I,R,Y
前定变量:Ct-1,It-1,Mt-1,Pt,Rt-1 和Gt。 (1) 应用识别的阶条件,决定各方程的识别状态; (2) 你打算用什么方法来估计可识别行为方程? 8.8 假设有如下计量经济模型: 0 1 1 2 1 0 1 2 2 0 1 2 1 3 3 0 1 1 2 4
t t t t t t t t t t t t t t t t t Y Y I u I Y Q u C Y C P u Q Q R u a a a b b b g g g g d d d - - -
= + + + = + + + = + + + + = + + +
其中,Y=国民收入,I=净资本形成,C=个人消费, Q =利润, P=生活费用指数,R=工业劳动生产率 (1)写出模型的内生变量、外生变量和前定变量; (2)用识别的阶条件确定各方程的识别状态;
(3)此模型中是否有可以用ILS 法估计的方程?如有,请指出; (4)写出用2SLS 法进行估计时,每个阶段中要估计的方程。 8.9 考虑下述模型:
消费方程:Ct =α0 +α1Y t +α2Ct-1 + u1t ① 投资方程:It =β0 +β1Yt +β2It –1+ u2t ② 进口方程:Mt =g0 + g 1Y t + u3t ③ Yt = Ct+ It + Gt + Xt - Mt
模型中各方程是正规化方程,u 1t,?u3t 为扰动项。 (1)请指出模型中的内生变量、外生变量和前定变量。 (2)利用阶条件识别各行为方程。 (3)写出用3SLS 进行估计时的步骤。 8.10 考察下述国民经济的简单模型 ?? ?í ì = + = + + = + +
(国民收入恒等式) (投资方程) 消费方程)
t t t t t t t Y C I I a a R u C Y u 0 1 2
0 1 1 b b (
式中,C 为消费,Y 为国民收入,I 为投资,R 为利率。 设样本容量n 为20,已算得中间结果为: ? ?
R R C Y R C C R R Y Y R R t t t t t ( ) , , , ,
(1) 判别模型中消费方程的识别状态;
(2) 用间接最小二乘法求消费方程结构式系数;
(3) 将采用哪种方法估计投资方程?为什么?(不必计算) 8.11 由联立方程模型;
t t t t t t t t Y Y X Y Y X 2 20 21 1 22 2 2 1 10 12 2 11 1 1 b b g m b b g m = + + + = + + +
得到其简化式如下:
t t t t t t t t Y X X v Y X X w = + + + = + + +
2 20 21 1 22 2 1 10 11 1 12 2 p p p p p p
(1) 两结构方程可识别吗?
(2) 如果知道0 11 g = ,识别情况有何变化? (3) 若对简化式进行估计,结果如下:
t t t t t t Y X X Y X X 1 2 ^ 2 1 2 ^ 1
2 6 10 4 3 8 = + + = + +
试求出结构参数的值,并说明如何检验原假设0 11 g = 。