第6章
6.1一般性是没有必要的。 t统计roe2只有约?.30,这表明的roe2是非常统计学意义。此外,平方项只有很小的影响在斜坡上,甚至鱼子大值。 (大致坡0.0215?.00016鱼子,甚至当净资产收益率= 25 - 约一个标准差以上样本中的平均净资产收益率 - 坡度为0.211,较净资产收益率= 0 .215)。
6.2定义的OLS回归c0yi的上c1xi1,ckxik,I = 2,N,解决
我们取得这些从方程(3.13),我们将在规模依赖和独立的变量。]我们现在表明,如果=,=,J = 1,...,K,那么这k + 1阶条件感到满意,这证明的结果,因为我们知道,OLS估计是方便旗(一旦我们排除在独立变量完全共线性)的独特的解决方案。堵在这些猜测给出了表达式
对于j = 1,2,...,K。我们可以写简单的取消显示这些方程 和
或分解出常数, 和
,J = 1,2,
但相同乘以c0和c0cj的是由第一阶条件为零,因为根据定义,他们获得XI1易建联的回归,XIK,I = 1,2,...,?。因此,我们已经表明,= C0 =(c0/cj),J = 1,,K解决所需的一阶条件。
6.3(I)/(2周转点| |),或0.0003 /(0.000000014)21,428.57,请记住,这是在数百万美元的销售。
(二)可能。其t统计量为-1.89,这是重大反对片面替代H0:<0在5%的水平用df = 29)(CV -1.70。事实上,p值约为0.036。
(三)由于销售被除以1000获得salesbil,得到相应的系数乘以1000:(1,000)(0.00030)= 0.30。标准的错误被乘以相同的因素。诚如心领神会,salesbil2 =销售额/ 1,000,000,所以系数二次被乘以一百万(1,000,000)(0.0000000070)= 0.0070;其标准错误也被乘以一百万。什么也没有发生的的截距(因为尚未重新调整rdintens)或R2:
= 2.613 + .30 salesbil的 - 0.0070 salesbil2 (0.429)(0.14)(.0037) N = 32,R2 = 0.1484。
(iv)该方程部分(iii)为更容易阅读,因为它包含较少的零到小数点右边的。当然两个方程的解释是相同的,不同规模的一次入账。
6.4(一)持有所有其他因素固定的,我们有
两边除以Δeduc给出结果。的迹象并不明显,虽然> 0,如果我们认为一个孩子得到更多的教育又是一年更多受过良好教育的孩子的父母。
(ii)我们使用值pareduc = 32和pareduc = 24来解释的系数EDUC pareduc的。估计教育回报的差异是0.00078(32 - 24)= 0.0062,或约0.62个百分点。
(ⅲ)当我们添加pareduc的本身,交互项的系数是负的。在EDUC pareduc的t统计量为-1.33,这是不是在10%的水平对一个双面的替代显着。需要注意的是对pareduc系数对一个双面的替代在5%的水平是显着的。这提供了一个很好的例子,省略了水平效应(在这种情况pareduc)如何可以导致有偏估计的相互作用效果。
6.5这将使意义不大。数学和科学考试的表演是教育过程的产出的措施,而我们想知道的各种教育投入和办学特色如何影响数学和科学成绩。例如,如果员工与学生的比例有两种考试成绩的影响,为什么我们要保持固定的科学测试上的表现,同时研究人员的影响,数学合格率?这将是一个例子,在回归方程控制的因素太多。变量scill可能是一个因变量,在一个相同的回归方程。
6.6扩展模型具有DF = 680 - 10 = 671,和我们测试两个限制。因此,F = [(.232 - .229)/(1 - .232)](671/2)1.31,这是远低于10%的临界值2和?DF:CV = 2.30 F分布。因此,atndrte2和ACT atndrte的联合不显着。因为添加这些条款复杂的模型,没有统计的理由,我们不会包括他们在最后的模型。
6.7第二个等式显然是优选的,作为其调整R平方是显着大于在其他两个方程。第二个等式中包含相同数目的估计参数为第一,减少了一个比第三。第二个方程也比第三更容易解释。
6.8(I)的答案是不是整个明显,但是我们必须在这两种情况下,正确地解释酒精系数。如果我们包括参加,然后我们测量大学GPA的酒精消费量的效果,拿着考勤固定。因为上座率可能是一个重要的机制,通过饮用会影响性能,我们可能不希望持有它固定在分析。如果我们这样做,包括参加,那么我们的估计解释作为那些的影响colGPA不因上课。 (例如,我们可以测量饮酒对学习时间的影响。)为了得到一个总的酒精消费量的影响,我们将离开参加了。
(二)我们会想包括SAT和hsGPA,作为对照组,这些衡量学生的能力和动机。可以在大
学的饮酒行为与在高中的表现,并在标准化考试。其他因素,如家庭背景,也将是很好的控制。
第7章
7.1(一)男性的系数是87.75,所以估计一个人睡差不多一个半小时,每星期比一个可比的女人。此外,tmale = 87.75/34.33?2.56,这是接近1%的临界值对一个双面替代(约2.58)。因此,性别差异的证据是相当强的。
(ii)本totwrk t统计.163/.018???9.06,这是非常统计学意义。系数意味着,一个小时的工作时间(60分钟)0.163(60)相关联?9.8分钟的睡眠。
(三)取得,限制回归的R平方,我们需要对模型进行估计没有年龄和AGE2的。当年龄和AGE2两个模型中,年龄有没有效果,只有在两个方面上的参数是零。
7.2(i)若?CIGS = 10 =?.0044(10)=?0.044,这意味着约4.4%,低出生体重。
(ii)一个白色的孩子估计重约5.5%,其他因素固定的第一个方程。另外,twhite?4.23,这是远高于任何常用的临界值。因此,白人和非白人的婴儿之间的差异也是显着性。
(三)如果母亲有一年以上的教育,孩子的出生体重估计要高出0.3%。这是一个巨大的效果,t统计量只有一个,所以它不是统计学意义。
(四)两个回归使用两套不同的观察。第二个回归使用较少的观测,因为motheduc或fatheduc中缺少的一些意见。使用相同的观测,用于判断第二个方程,我们将不得不重新估计第一个方程(取得的R-平方)。
7.3(I)的t统计hsize2是超过四绝对值,所以有非常有力的证据,它属于在方程。我们获得这个找到折返点,这是hsize的最大化的价值(其他东西固定):19.3 /(2.19)?4.41。 hsize的数百毕业班的最佳大小是441左右。
(二)这是由女性的系数(自黑= 0):非黑人女性SAT分数低于非黑人男性约45点。 t统计量是约-10.51,所以统计学差异非常显着的。 (非常大的样本大小一定的统计意义)。
(三)由于女性= 0时,在黑色的系数意味着一个黑人男性的估计SAT成绩近170点,低于可比的非黑人男性。 t统计量绝对值超过13,所以我们很容易拒绝假设,有没有其他条件不变差。
(iv)我们插上黑色= 1,女= 1的黑人女性和黑= 0,女= 1,非黑人女性。因此,不同的是-169.81 + 62.31 =?107.50。因为估计取决于两个系数,我们不能构建统计给出的信息。最简单的方法是定义虚拟变量三个四个种族/性别类别,选择非黑人女性为基数组。然后,我们可以得到我们要作为黑人女哑变量系数的t统计。
7.4(i)本大致差异仅仅是关于实用程序100倍系数,或-28.3%。的t统计量是?.283/.099??2.86,这是非常统计学意义。
(ⅱ)100 [EXP(?0.283) - 1)??24.7%,因此估计的幅度要小一些。
(iii)本比例差异为0.181?0.158 = .023,或约2.3%。一个方程,可估计为取得这种差异的标准误差是
登录(工资)= +日志(销售)+鱼子+ consprod +实用+反+ U,
反为运输行业是一个虚拟变量。现在,基地组是金融,系数直接测量的消费品和金融业之间的差异,我们可以使用t统计量consprod。
7.5(一)按照提示,= +(1 - NOPC)+ hsGPA + ACT =(+)?NOPC + hsGPA + ACT。对于具体的估计公式(7.6)= 1.26 = .157,所以新的截距是1.26 + .157 = 1.417。对NOPC系数为 - .157。
(二)什么也没有发生,R平方。使用NOPC代替PC是一种不同的方式,包括在PC拥有相同的信息。
(三)这是没有意义包括两个哑变量的回归,我们不能持有NOPC固定的,而改变PC。我们只有两个组PC保有量的基础上,除了整体拦截,我们只需要包括一个虚拟变量。如果我们试图拦截随着包括我们有完善的多重共线性(虚拟变量陷阱)。
在3.3节 - 特别是在周边的讨论表3.2 - 7.6,我们讨论了如何确定偏差的方向时,一个重要的变量(能力,在这种情况下)的OLS估计省略了回归。我们有讨论,表3.2严格持有一个单一的解释变量包括在回归,但我们往往忽视其他独立变量的存在,并根据此表作为一个粗略的指南。 (或者,我们可以使用一个更精确的分析问题3.10的结果。)如果能力稍逊的工人更有可能接受培训,然后火车和u负相关。如果我们忽略存在EDUC EXPER的,或至少认为火车和u后的净额EDUC EXPER的负相关关系,那么我们就可以使用表3.2:OLS估计(误差项的能力)有一个向下偏见。因为我们认为?0,我们不太可能得出这样的结论的训练计划是有效的。直观地说,这是有道理的:如果没有选择培训接受了培训,他们会降低工资,平均比对照组。
7.7(一)写的人口模型相关(7.29)
inlf = + nwifeinc + EDUC + EXPER + exper2 +年龄 + kidsage6 + U + kidslt6
插上inlf = 1 - outlf的,并重新排列:
1 - outlf + nwifeinc + EDUC + EXPER + exper2 +年龄 + kidsage6 + U + kidslt6 或