2.
3.什么是总体回归函数和样本回归函数?它们之间的区别是什么? 答:以简单线性回归模型为例,总体回归函数是总体因变量的条件期望表现为自变量的函数:
E?YXi??f?Xi?????Xi,或Yi????Xi?ui。总体回归函数是确定的和未知的,
是回归分析所估计的对象。样本回归函数是根据样本数据所估计出的因变量与自变量之间的
?x?e。回归分析的目的是用样本回归函数来估计总?x或y?????????i??函数关系:yiiii体回归函数。它们的区别在于,总体回归函数是未知但是确定的,而样本回归函数是随样本
?是随机变量;?,?波动而变化;总体回归函数的参数?,?是确定的,而样本回归函数的系数?总体回归函数中的误差项ui不可观察的,而样本回归函数中的残差项ei是可以观察的。
4.什么是随机误差项和残差?它们之间的区别是什么?
答:随机误差项ui表示自变量之外其他变量的对因变量产生的影响,是不可观察的,通常要对其给出一定的假设。残差项ei指因变量实际观察值与样本回归函数计算的估计值之间的偏差,是可以观测的。它们的区别在于,反映的含义是不同且可观察性也不同,它们的联系可有下式:
垐?x?u 垐??????ei?yi????xi?????xi?ui?????xi?????ii
5.为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定?
答:最小二乘法只是寻找估计量的一种方法,其寻找到的估计量是否具有良好的性质则依赖模型的一些基本的假定。只有在一系列的经典假定下,最小二乘估计量才是BLUE。 6. 7. 8. 9. 10. 11. 12.
??????13. 14.
15.为什么在多元回归中要对可决系数进行修正?
答:在样本容量一定下,随着模型中自变量个数的增加,可决系数R2会随之增加,模型的拟合程度上升,但自由度会损失,从而降低推断的精度,因此需要用自由度来修正可决系数,用修正的可决系数来判断增加自变量的合适性。
16.在多元线性回归中,对参数作了t检验后为什么还要作方差分析和F检验?
答:t检验仅是对单个系数的显著性进行检验,由于自变量之间存在着较为复杂的关系,因此有必要对回归系数进行整体检验,方差分析和F检验就是对回归方程的整体统计显著性进行的检验方法。 17. 18. 19.
练习题:
1.解:设简单线性回归方程为:y??1??2x??
??(1) 采用OLS估计:?2??x?x??y?y??334229.09?0.786
425053.73??x?x?ii2i??y???x?549.8?0.786*647.88?40.566 ?11回归系数经济意义:销售收入每增加1万元,销售成本会增加0.786万元。
??xi?x??yi?y??334229.092???2(2) 可决系数为:R???0.9998 22??xi?x???yi?y?425053.73*262855.25SSE???回归标准误:?n?22?1?R???y?y?2i212?2?0.0002*262855.25?2.29
102??2(3) 检验统计量为:t???Se?2?/?????2??x?x?i?0.786?223.76
2.29/425053.73所以?2是显著不为零
????x?40.566?0.786*800?669.366 ?f??(4) 预测:y12f95%的预测区间为:
11?800?647.88??f?1.96*??1??y?669.366?1.96*2.291?? 2n??xi?x?12425053.73即( 664.579 ,674.153)
2.美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下: 航空公司名称 航班正点率(%) 投诉率(次/10万名乘客) 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 81.8 76.6 76.6 75.7 73.8 72.2 71.2 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 ?xf?x?22美国西部(Americawest)航空公司 70.8 环球(TWA)航空公司 68.5 1.25 (1)画出这些数据的散点图; (2)根据散点图。表明二变量之间存在什么关系?
(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程; (4)对估计的回归方程的斜率作出解释;
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少? 解:(1)利用EXCEL制作数据散点图:
将已知表格的后两列复制到Excel中,选择该表格后,点击:图表向导→XY 散点图→确定,即得散点图如下:
投诉率(次/10万名乘客)1.41.210.80.60.40.20657075航班正点率(%)8085
(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,说明航班整点率与投诉率两者之间,存在着一定的负相关关系。
[利用Excel的统计函数“CORREL”计算得到相关系数r= -0.88261,属于高度负相关] (3)求投诉率依赖航班正点率的估计的回归方程
设投诉率为Y,航班正点率为X
建立回归方程 Yi??1??2Xi
解法一:应用Excel函数计算:
应用统计函数“SLOPE”计算直线斜率为:?2=-0.07041
应用统计函数“INTERCEPT”计算直线与y轴的截距为:?1= 6.017832
解法二:应用Excel列表计算:
作出Excel运算表格如下: 航班正点率投诉率(次(%) /10万名乘2x 客) x 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 环球(TWA)航空公司 合 计 得回归系数为: β2?81.8 76.6 76.6 75.7 73.8 72.2 71.2 68.5 667.2 y 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 7.18
6691.24 5867.56 5867.56 5730.49 5446.44 5212.84 5069.44 5012.64 4692.25 17.178 44.428 65.11 51.476 54.612 67.146 51.264 86.376 85.625 航空公司名称 xy 美国西部(Americawest)航空公司 70.8 49590.46 523.215 n?xy??x?yn?x2???x)29?523.215?667.2?7.18 29?49590.46?(667.2)?81.561 = = —0.0704144
1158.3 ? 初始值 β1?y?β2x= = 于是得回归方程为
Yi?6.0178?0.07Xi
(4)参数的经济意义是:航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降7.0414*0.01≈0.07次。
(5)航班按时到达的正点率为80%时,估计每10万名乘客投诉的次数可能为:
^?y?β?x
n2n7.18667.2=6.01783 ?0.0704144?99??6.0178?0.07?80?0.4187(次/10万) Yi
3.表中是1992年亚洲各国人均寿命(y)、按购买力平价计算的人均GDP(
x1)
、成人识字