高中数学人教版选修2-3专用同步作业解析(含答案)
第三章 统计案例
[学习目标]
1.随机误差、残差、残差图的概念. 2.分析残差判断线性回归模型的拟合效果. 3.建立线性回归模型的步骤.
知识点一 回归直线方程
1.回归分析
(1)函数关系:函数关系是一种确定性的关系.例如正方形的周长C=4a,周长C与边长a之间就是一种确定性关系,对于自变量(边长)的每一个确定的值,都有唯一确定的周长与之相对应.
(2)相关关系:当自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫作相关关系.相关关系是一种非确定性关系.
回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法叫作回归分析. 2.回归直线方程
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),?,(xn,yn),回归直线y=bx+a的斜
^
率和截距的最小二乘估计公式分别为b=
i=1
? ?xi-x??yi-y??xiyi-nx y
i=1
nn
=i=1
? ?xi-x?
n
2
i=1
?x2i-nx
n
^^
,a=y-bx,
2
其中(x,y)称为样本点的中心.
思考1 确定回归直线方程,只需得出哪两个量? 答案 确定回归直线方程,只需确定a,b两个量即可.
思考2 回归分析中,利用线性回归方程求出的函数值一定是真实值吗?
高中数学人教版选修2-3专用同步作业解析(含答案)
答案 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等. 知识点二 线性相关系数
对于变量X与Y随机抽取到的n对数据(x1,y1),(x2,y2),?,(xn,yn),利用相关系数r来衡量两个变量之间线性相关程度,线性相关系数具体的计算公式为
i=1
? ?xi-x??yi-y?
. i=1
n
r=
n
2ni=1
? ?xi-x?? ?yi-y?2
当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关.
|r|越接近于1,表明两个变量的线性相关性越强; |r|接近于0,表明两个变量之间几乎不存在线性相关关系.
通常,当|r|大于0.75时,我们认为两个变量存在着很强的线性相关关系. 知识点三 残差的概念
对于样本点(x1,y1),(x2,y2),?,(xn,yn)而言,它们的随机误差为ei=yi-bxi-a,i=^^^^^
1,2,?,n,其估计值为ei=yi-yi=yi-bxi-a,i=1,2,?,n,ei称为相应于点(xi,yi)的残差.
知识点四 刻画回归效果的方式 1.残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高. 2.残差平方和法
^
残差平方和? (yi-yi)2,残差平方和越小,模型拟合效果越好.
i=1n
3.利用R2刻画回归效果
i=1
? ?yi-yi?2
;R2表示解释变量对于预报变量变化的贡献率.R2越接近于1,表示回
n
^
R=1-
2
i=1
? ?yi-y?2
n
归的效果越好.
高