第一讲作业题
为分析不同州的公共教育支出花费在学生身上的教育经费,估计了如下的回归方程:
式中,S代表第i个州花费在每个公立学校学生身上的教育经费;Y代表第i个州的资本收入;G代表第i个州公立学校学生的增长率。 1A 说明变量Y与变量G的参数估计值的经济意义。
作业题2
1B 你预期变量Y和G的参数符号各是什么?请说明理由。估计结果与你的预期一致吗?
作业题3
1C 变量G是用小数来衡量的,因此,当一个州的招生人数增加了10%时,G等于0.1。如果变量G用百分比的形式来衡量,那么当一个州的招生人数增加
了10%时,G等于10。此时,方程的参数估计值会如何变化?(文字说明即可)
作业题4
Jaime Diaz发表在《体育画报》上的一篇论文研究了美国职业高尔夫球协会
(PGA)巡回赛中不同距离的推杆次数。论文中建立了推杆进洞次数百分比(P)关于推杆距离(L,英尺)的关系式。推杆距离越长,进洞的可能性越小。可以预测,L的参数估计值为负。回归方程如下:
2A 说明L的参数估计值的经济意义。
作业题5
2B 利用该方程估计一个PGA高尔夫球员10英尺推杆进球的次数百分比。再分别估计1英尺和25英尺的情况。结果是否符合现实?
作业题6
2C 上一题的答案说明回归分析时存在什么问题? 第二讲作业题
作业题1
1 查尔斯·拉弗(Charles Lave)发表了一篇驾驶员交通事故率的研究报告。他的总体结论是驾驶速度的方差(同一公路上汽车驾驶速度差异的程度)是交通事故率的重要决定因素。在他的分析中,采用两年的全美数据分别估计,得出的回归方程为:
第一年:第二年:
式中,代表第i个州州际公路上的交通事故数量(单位:车辆每行驶一亿英
代表一个不确定的估计截距;
代表第i个州的驾驶速
代表第i个州内
里的交通事故数);度的方差;
代表第i个州每名驾驶员的平均罚单数量;
每平方英里医院的数量。
1a.考察变量
作业题2
的理论依据,给出其参数符号的预期。
1b.这两年的参数估计的差异是否值得重视?请说出你的理由。在什么情况下,应该关注这些差异呢?
作业题3
1c.通过比较两个方程的调整的判定系数,哪一个方程具有更高的判定系数
?调整的判定系数越高,回归方程越好吗?为什么?
作业题4
假定你决定建一个离你学校最近的冷冻酸奶商店的销售量模型。店主很乐意帮助收集数据,因为她相信你们学校的学生是她的主要顾客。经过长时间的数据收集以及无限量的冷冻酸奶供给之后,你估计得到以下回归方程:
式中,代表第t个两周内冷冻酸奶的销售总量;代表t期的平均温度(单
代表反
位:华氏温度);代表t期该商店冷冻酸奶价格(单位:美元);
映是否在学校报纸发布广告的虚拟变量(1=店主在学校报纸上做了广告);代表反映是否为学校学期时间的虚拟变量(1=t期是学校学期时间,即9月初到12月初、1月初到5月底)。
2a.为什么要假定“无限量的冷冻酸奶供给”?(提示:考虑模型是否满足经典假设)
作业题5
2b.说明变量和变量的参数估计值的经济含义。
作业题6
2c.你和店主对变量C的参数符号都很惊讶。你能解释为什么吗? 第三讲作业题
作业题1 假想现在要估计一个关于房价的模型,来推断面朝海滩的环境对房屋价值的影响。由于一系列理论和数据的可获得性等方面的原因,所以,经过一番研究,决定使用地皮的面积而不是房屋本身的面积作为其中一个变量。分析结果如下(括号内的数值为标准误):
式中,代表第i幢房子的价格(单位:1000万美元);代表第i幢房子代所占地皮面积(单位:1000万平方米);表第i幢房子里的房间数目;代表第i幢房子的已建年限;代表虚拟变量,若第i幢房子有壁炉则为1,否则为0;自由度 24 25 代表虚拟变量,若第i幢房子朝向海滩则为1,否则为0。 单侧:10% 1.318 1.316 5% 1.711 1.708 2.5% 2.064 2.060 1a. 对变量LOT、BED的参数建立适当的假设,并在5%的显著性水平下进行检验。 作业题2 1b.壁炉可能增加房屋的价值,但你的一个朋友说壁炉太脏不利于保持室内整洁,使你不能确定它的参数符号。请建立适当的假设,并在5%的显著性水平下进行检验。 作业题3 1c. 回归结果是否出现与预期不符的情形?(提示:考虑参数的显著性) 作业题4 1d. 请写出关于方程总体显著性的F检验的原假设和备择假设。
作业题5
为研究医生建议病人减少饮酒对个人饮酒量的作用,建立回归模型,选取500个观察值作为样本,估计结果如下(括号中的数值为标准误): 式中,DRINKS代表第i个人过去两周的饮酒量;ADVICE代表虚拟变量,医生建议第i个人减少饮酒则为1,否则为0;EDUC代表第i个人受教育的年限;DIVSEP代表虚拟变量,第i个人离婚或者分居则为1,否则为0;UNEMP代表虚拟变量,第i个人失业则为1,否则为0。 自由度 120 单侧:10% 1.289 5% 1.658 0.5% 2.617 2a. 变量DIVSEP和UNEMP的参数按常理来说应为正。建立变量DIVSEP和UNEMP的参数的适当假设,并在5%的显著性水平下进行检验(提示:使用自由度为120下的t统计量临界值)。 作业题6 2b. 对变量EDUC的参数建立以0为中心的双侧假设,在1%显著性水平下进行检验。为何这个参数适合采用双侧检验? 作业题7 2c. 大多数医生希望经过他们的劝说,病人能够减少饮酒量,这也是经过劝说之后病人们通常会做的(假定方程中其他因素是固定的)。建立适当的假设,并在10%的显著性水平下进行检验。 作业题8 2d. 若变量ADVICE的参数符号不符合预期,是否应该改变你的预期?为什么? 第四讲作业题
作业题1
1.假设你已经被提升为“Amish”公司速溶麦片粥的产品经理,你的首项任务是决定下一年度是否要提价。(速溶麦片粥是一种用热水冲泡之后就可以作为谷类早餐的很好选择,比普通麦片冲泡时间短。)为了保持你作为Amish Oats公司计量经济学家的声誉,你决定建立关于销售价格对销售量影响的模型,并且估计了如下假设方程(括号内的数值为标准误):
式中,OAT代表第t年Amish公司速溶麦片粥在美国的销售量;PR代表第t年Amish公司速溶麦片粥在美国的销售价格;PRCOMP代表第t年作为竞争品的速溶燕麦粥在美国的价格;ADS代表第t年Amish公司速溶麦片粥的广告投入;YD代表第t年美国的可支配收入。 自由度 24 单侧:5% 1.711 2.5% 2.064 1a.建立PR 的斜率参数的适当假设,并在5% 的显著性水平下进行检验。 作业题2 1b. 这个方程是否存在计量经济学问题?是否能看出有变量被遗漏的迹象?有没有迹象表明该方程有不相干变量? 作业题3 1c.如果可以给方程中加入一个变量,你建议加入什么变量? 作业题4 什么样的汽车加速最快?大多数人都会回答,高功率的、轻型的、流线型的汽车加速最快。为检验这种说法是否正确,利用2009年模型车数据估计了如下方程: 式中,TIME 代表第i辆车的速度从0加速到每小时60英里所需要的时间(单位:秒);TOP代表虚拟变量,如果第i辆车是手动挡则为1,否则为0;WEIGHT代表第i辆车的重量(单位:磅);HP代表第i辆车的马力。 2a. 假设你的邻居是物理学专业的,他告诉你马力可以表示为:。其中,M表示质量,D表示距离,A表示加速度。那么,你认为方程存在怎样的计量经济学问题? 作业题5 2b. 你决定将TIME和HP之间的函数形式改为反函数形式。新方程的回归结果如下:
你认为哪一个方程更恰当?为什么? 作业题6
2c. 既然这两个方程选用的是两种不同的函数形式,那么,它们的调整的判定系数可以用来比较吗?为什么?
第五讲作业题
作业题1 你受雇于学生辅导办公室,帮助减少调皮学生对宿舍的破坏。你要做的第一步就是建立一个截面模型,该模型把上学期每个宿舍的破坏损失作为宿舍成员特征的函数(括号中的数值为标准误): 式中,D代表上学期第i个宿舍的破坏损失(单位:美元);F代表在第i个宿舍中大一新生的入住百分比;S代表第i个宿舍的学生人数;A代表上学期第i个宿舍向学生辅导办公室报告的涉及酗酒事件的次数。 自由度 29 30 单侧:5% 1.699 1.697 2.5% 2.045 2.042 a. 针对变量S的参数做出适当假设,并在5%的显著性水平下进行检验。 作业题2 b. 该方程存在什么问题(从遗漏变量、不相干变量或多重共线性中选择)?为什么? 作业题3 c. 假定你现在得知,变量S和A之间的简单相关系数为0.94,这会改变你在b中的答案吗?如果改变的话,怎样改变的? 作业题4 d. 参数估计值的符号与预期不一致,这可能是由多重共线性引起的吗?为什么? 第六讲作业题
第一讲回归分析概述测试题
问题1 判断题 (1分)
计量经济学可用于描述商品需求曲线,即需求量与价格的关系。
问题2 判断题 (1分)
计量经济学只能做定量研究,不能做定性研究,如个人的职业选择。
问题3 判断题 (1分)
回归分析考察的是解释变量与被解释变量之间的函数关系。
问题4 判断题 (1分)
回归方程中,被解释变量等于其估计值与随机误差项之和。
问题5 判断题 (1分)
残差指的是被解释变量的真实值与估计值之差。
问题6 判断题 (1分)
数据不准确可能导致回归分析的结论存在偏误。
问题7 单选 (2分)
回归分析中关于解释变量X和被解释变量Y的说法正确的是:
问题8 单选 (2分)
以下模型属于线性回归模型的是:
问题9 单选 (2分)
在回归方程中,G代表性别虚拟变量,男性则
为1,否则为0。若G的定义改变为女性为1,否则为0,则回归方程应为:
问题10 多选 (3分)
以下关于计量经济学用途的说法正确的有: 第二讲普通最小二乘法测试题
问题1 单选 (2分)
讨论回归结果时不用花费太多时间去分析常数项的估计值,这主要依据的假设是: A 误差项总体均值为0。(√) B所有解释变量与误差项都不相关。 C误差项与观测值互不相关 。
D误差项具有同方差。 E模型设定无误。 问题2 判断题 (1分)
最小二乘法的目标是误差项之和最小。
问题3 判断题 (1分)
若所有解释变量对被解释变量没有影响,回归方程的判定系数
问题4 判断题 (1分)
若某解释变量在理论上对被解释变量没有影响,该解释变量的参数估计值一定为0.
问题5 多选 (3分)
以下关于最小二乘法的说法正确的有: A 最小二乘法的目标是残差平方和最小。(√) B所估计的对象是方程中的参数。(√) C最小二乘法的目标是残差之和最小。 D判定系数E判定系数
可以为负数 越大,模型越好。
一定为0。
问题6 单选 (2分) 在关于身高和体重的模型下说法错误的是:
A 身高的参数估计值可能发生变化。 B判定系数
可能减小。。(√)
可能减小。
中,新增QQ号码
这个变量后,以
C调整的判定系数
D QQ号码的参数估计值一定为0. (√) E常数项的估计值可能发生变化。 问题7 判断题 (1分)
若采用两组样本估计同一回归方程,参数估计值的差异体现了数据的随机性。
问题8 判断题 (1分)
若解释变量之间存在完全多重共线性,则参数估计值无法获得。
问题9 单选 (2分) 一元回归方程
的样本回归线必然通过的点为:
对 对
问题10 判断题 (1分)
随机误差项的总体均值为0以及随机误差项与解释变量不相关保证了参数估计量的无偏性。
问题11 判断题 (1分)
若随机误差项服从t分布,则OLS估计量不再具有BLUE性质。
问题12 多选 (3分)
建立玉米产量Y对施肥密度F和降雨量R的回归方程,估计结果为
。则以下说法正确的有:
1常数项-120意味着玉米产量可能为负。
2若变量F的参数真实值为0.20,则参数估计值-0.10表明OLS估计量是有偏的。 3变量F的参数估计值的符号不符合预期,并不影响OLS估计量的BLUE性质。(√) 4若方程不满足所有古典假设,变量R的参数真实值也可能等于5.33。(√) 第十讲预测
1一个预测方程在样本内拟合得很好,但并不能保证在样本外也可以进行准确的预测 2预测是对被解释变量样本外的观测值的估计
3平稳时间序列和非平稳时间序列均可采用ARMA模型预测 4计量模型的预测既可以进行均值预测,又可以进行区间预测 5时间序列分析体现了“让数据自己说话”的思想