0 =(- )- - U2; 因为2,我们可以重新排列,并划分得到简化形式。
(iii)于供给和需求的例子,是非常合理的。如果第一个方程是电源的功能,但我们一般预期,如果是第二个方程需求函数,。减少的形式存在,即使在供给函数的情况下,是不是向上倾斜的需求函数为向下倾斜,但我们可能会质疑这类车型的实用性。
16.2使用简单的经济,必须是第一个等式功能的需求,因为它依赖于收入,这是一种常见的行列式的需求。第二个公式包含一个变量,雨量充沛,影响作物产量,因此玉米供应。
16.3号在这个例子中,我们感兴趣的估算睡眠和工作,控制了其他一些因素之间的权衡。 OLS是非常适合对于这一点,我们已经能够控制所有其他相关因素。虽然这是假设真正的个人最佳地分配自己的时间约束条件,这不会导致系统中的联立方程组。如果我们写下这样的系统,是没有意义的,其中每个方程可以站在自己的,也将有一个有趣的其他条件不变的解释。此外,我们不能估计要么方程,因为经济推理,让我们没有办法排除外生变量,无论从方程。见例16.2类似的讨论。
16.4,我们可以很容易地看到,秩条件确定第二个方程不成立:有没有在第二个方程,是不是也出现在第一个方程的外生变量。确定第一个方程(并且我们假定)。这给了我们一个外生变量,日志(价格),可用于酒精的IV估计第一个方程2SLS(这仅仅是在这种情况下,IV标准)。
16.5(i)其他条件相同的情况,使用安全套率较高,应减少性传播疾病(性病)的速度。因此,。
(ii)若学生发生性行为的行为合理,使用安全套防止性病,然后使用安全套应增加的速率会增加感染。
(三)如果我们插入到conuse infrate结构方程,我们看到,conuse取决于U1。因为,conuse是正相关的U1。事实上,如果是不相关的结构误差(U2)在conuse方程与u1,冠状病毒(conuse,U1)(U1)> 0。如果我们忽略了其他解释变量在infrate方程,我们可以用公式(5.4),以获得偏差的方向:,因为COV(U1 conuse)> 0,其中表示,OLS估计。既然我们认为,OLS是偏向零。换句话说,如果我们使用的OLS上infrate公式,我们可能低估了使用安全套的重要性,减少性病。 (请记住,越负,更有效的是使用安全套)。
(iv)我们假设,CONDIS不会出现,除了conuse,在公式infrate。这似乎是合理的,因为它直接影响性病是使用,而不是仅仅有一个分配方案。但是,我们也必须承担CONDIS是外生的在infrate中:它不能与不可观测的因素(U1?),也影响infrate的。 我们还必须假定有一些局部的影响CONDIS在conuse,东西可以测试形式conuse估计减少。这很可能是这一要求的IV - 见公式(15.30)(15.31) - 满意。
16.6(我),这可能是某些阶层工人组织工会的决定是关系到一个企业如何对待自己的员工。虽然时机可能不是同时代,与快照一个单一的交叉部分,我们不妨假定,它是。
(ii)一个可能性是收集信息是否属于工会的工人的父母,并构建一个变量,是谁的父母在工会(例如,perpar)的工人比例。这可能是(部分)与%属于工会的工人。
(三)我们将不得不认为是外生的percpar退休金方程。我们可以测试是否的部分与perunion perpar估计减少的形式为perunion和在做测试perpar的。
16.7(一)出席女篮可能会增长方式是无关的因素,我们可以观察和控制。女篮的味道随着时间的推移,可能会增加,这将被捕获的时间趋势。
(II)号的大学套价格,它可能会改变价格的基础上出席明年的预期,如果大学使用的因素,我们无法观察到的,这是一定的误差项UT。因此,即使供应是固定的,它并不意味着价格影响需求的不可观测无关。
(三)如果人们只关心今年的团队在做,SEASPERCt 1可以排除从方程,一旦WINPERCt已控制。当然,这是不是一个很好的假设所有的游戏,为出席在赛季初可能与团队如何做去年。我们还需要检查该1PRICEt部分相关与SEASPERCt 1的通过为1PRICEt估计减少的形式。
(四)做的意义,包括男子篮球门票价格衡量,出席一个妇女的篮球比赛是一种代替出席一个男人的游戏。预计将对1MPRICEt系数是正面的:增加男人的门票的价格应该增加妇女票的需求。男队的胜率是妇女的需求方程的解释变量的另一个很好的候选人。
(五)首先使用日志的差异,这是那么的增长率可能会更好。然后,我们将删除在每个赛季的第一场比赛的观察。
(六)如果一个游戏售罄,我们不能观察那场比赛的真实需求。我们只知道所需的上座率一定数量以上容量。如果我们刚刚插上的能力,我们低估了门票的实际需求。 (第17章讨论了在这种情况下,可用于审查的回归方法)。
16.8我们必须首先消除未观测到的效果,AI1。如果我们的差异,我们有
的的的
的中的,
t = 2,3时。 这里的两年中,表示不同的拦截。关键假设是(日志)国家分配的变化,
,在这个等式是外生的。当然,是(部分)与
的,因为地方财政支出至少在一定程度上依赖国家补贴。在1994年的政策变化意味着应该有显着的变化的,至少在1994年到1996年的变化。因此,我们可以汇集2SLS估计这个方程,用为的IV,当然,这是假设方程中的其他解释变量是外生的。 (我们当然可以质疑外生性的政策和物业税变量)在不改变政策,
的可能会变化充分横跨I或T。
第17章
17.1(我)让M0的数字表示(%)正确地预测当yi = 0(这样的预测也为零),并让M1是多少正确预测当yi = 1。然后,正确预测的比例是(M0 + M1)/ N,其中n是样本大小。通过简单的代数运算,我们可以写为(N0 / N)(m0/n0)+(N1 / N)(m1/n1)=()(M?0/n0)+(m1/n1),其中我们已经使用了一个事实,即数= n1 /正(义= 1的样品的比例)和时/正(与义= 0的样品的比例)。但m0/n0正确的比例是预测当yi = 0,m1/n1的比例是正确预测当yi = 1。因此,我们必须
(M0 + M1)/ N =()(m0/n0)+(m1/n1)。
如果我们将通过100我们得到
=()
在这里我们使用一个事实,即,根据定义,= 100 [(M0 + M1)/ N],= 100(m0/n0),= 100(m1/n1)。
(ii)我们只是使用公式(i)部分:= .30(80)+ .70(40)= 52。因此,整体而言,我们正确预测的结果只有52%的。这是因为,我们正确预测的时间,而80%的Y = 0,苡= 0的结果只有30%的账目。更多的权重(0.70)YI = 1时的预言,而我们做的要差得多预测结果(得到它的权利,只有40%的时间)。
17.2,我们需要计算概率的估计在hsGPA = 3.0 = 1200,SAT,研究= 10,减去这从概率的估计与hsGPA = 3.0,SAT = 1200,和研究= 5。要获得第一的概率,我们开始计算的线性函数里面():(3.0)+ 0.00058(1,200)+ .073(10)= .376。下一步,我们将其插入罗吉功能:EXP(.376)/ [1 + EXP(.376).593。这是概率的估计给定特性在五年内的毕业生,学生运动员。
对于学生运动员参加自习五个小时,一个星期,我们计算-1.77 + 0.24(3.0)+ 0.00058(1,200)+ .073(5)= 0.011。在这个值给出评价罗吉功能EXP(.011)/ [1 + EXP(.011)] .503。因此,估计概率差异,或者只是在0.10以下。 [注意如何将为期不远计算,如果我们简单地使用研究,得出这样的结论概率的差异(10 - 5)= .073 .365的系数。]
17.3(i)我们使用链式法则和公式(17.23)。尤其是,让日志(Z1)。然后,由链规则,
在这里我们使用该衍生物的日志(Z1)1/z1的的这一事实。当我们插入(17.23)
(Y | Y> 0,X)的,我们得到了答案。
(ii)由于(i)部分,我们使用的链式法则,这是目前较为复杂的:
其中X1 = Z1和x2 =。但是(Y | Y> 0,X)()()]},
(Y |? > 0)()()]},,的2倍。堵塞这些和重新排列到第一个公式中给出了答案。
17.4由于日志()是增函数 - 也就是阳性w1和w2,W1> W2日志(W1)>日志(w2)的 - 当且仅当,对每个i,mvpi> minwagei如果只有当日志(mvpi)>日志(minwagei)。因此,日志(wagei)= [日志(mvpi),日志(minwagei)]。
17.5(I)的专利是一个计数变量,,所以泊松回归模型是合适的。
(二)由于日志(销售)的系数,是销售专利的弹性。 (更准确地说,是销售专利|销售E(RD)的弹性。)
(三)使用链规则获得地契的偏导数(销售)二路尊重RD:
=()(销售)二路。
更简单的方法来解释这个模型是采取日志,然后就到RD区分:这给,这表明就到RD半弹性的专利是100()。
17.6(I)OLS将是公正的,因为我们选择的样本的基础上的外生解释变量。为SAV的总体回归函数是在> 25岁的亚群与回归函数一样。
(ii)假设,婚姻状况和子女数的影响只有通过节约家庭大小(hhsize),这是外源性样本选择另一个例子。但是,在亚结婚的人没有孩子,hhsize = 2。因为没有任何在亚群hhsize变化,我们将不能够估计,有效,亚群中的截距变得,这就是我们可以估算。但是,假设有变化的公司,EDUC,已婚无子女的人之间的年龄(从这个亚群,我们有足够多样的样品),我们仍然可以估算,,。
(三)这将选择样本的基础上,因变量,这会导致偏见和OLS估计的人口模型不一致。相反,我们应该使用截断回归模型。
17.7对于确定的变量解释是否接受申请人选择参加的直接目的,不存在样本选择问题。人口的利益,是由特定的大学录取的申请人,你必须从这一人群的随机抽样。因此,它是完全合适的,指定一个模型这一组中,可能是一个线性概率模型,概率模型,或Logit模型,并利用手头上的数据来估计模型。 OLS或最大似然估计会产生一致,渐近正常估计。这是一个很好的例子,许多数据分析师的下意识反应可能是得出结论,有一个样本选择的问题,这就是为什么它重要的是要非常精确的分析目的,这需要一个清楚说明人口的利益。 如果大学希望在不久的将来改变申请人池,然后是一个潜在的样本选择的问题:目前大学生适用不同的学生有可能适用于未来可能是系统。的申请人池的性质是不太可能发生巨大的变化超过一年,样本选择的问题可以得到缓解,如果没有完全消除,更新后的分析每类第一年已招收。