第九章 统计与统计案例 Page 33 of 55 秦
第六组获奖率为
2
60×20
26=
13=9.
所以第六组获奖率较高.
12.(13分)随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.
图9-2-20
(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差;
(3)现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm的同学被抽中的概率.
【解】 (1)乙班的平均身高较高.(可由茎叶图判断或计算得出) 110(2)因为甲班的平均身高为x=10∑i= 1xi=170(cm), 所以甲班的样本方差 110s=10∑i= 1 (xi-x)2
2
1
=10[2×122+2×92+2×22+12+72+82+02] =57.2.
(3)从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,共有10种不同的取法:
(173,176),(173,178),(173,179),(173,181),(176,178),(176,179),(176,181),(178,179),(178,181),(179,181).
设A表示随机事件“抽到身高为176 cm的同学”,则A中的基本事件有四个:(173,176),(176,178),(176,179),(176,181).
42故所求概率为P(A)=10=5.
第九章 统计与统计案例 Page 34 of 55 秦
第三节 变量间的相关关系、统计案例
[考情展望] 1.考查独立性检验的基本思想,两个临界值的理解及应用.2.考查回归分样的基本思想及回归直线方程的计算应用.3.多以选择题、填空题形式进行考查.
一、两个变量的线性相关
1.在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
2.在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
3.如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
二、回归方程
1.最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.
2.回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,^x+a^,则 y2),?,(xn,yn).其回归方程为^y=b
???
^=y-b^x.??a
三、残差分析
∑ ?xi-x??yi-y?i∑xiyi-nxy=1i=1^b==n,n222
∑ ?xi-x?∑x-nxi=1i=1i
nn
其中(x,y)称为样本点的中心.
1.残差:对于样本点(x1,y1),(x2,y2),?,(xn,yn),它们的随机误差为^x-a^,i=1,2,?,
ei=yi-bxi-a,i=1,2,?,n,其估计值为^ei=yi-^yi=yi-bin.^ei称为相应于点(xi,yi)的残差.
第九章 统计与统计案例 Page 35 of 55 秦
^2
2.残差平方和为∑ (y-yi). ii=1
yi?2? ?yi-^
nn
n
i=1
3.相关指数:R=1-
2
. i=1
? ?yi-y?2
四、独立性检验
1.利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
2.列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
x1 x2 总计 2
y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d n?ad-bc?2构造一个随机变量K=,其中n=a+b+c+d为
?a+b??c+d??a+c??b+d?样本容量.
1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.^y=-10x+200 B.^y=10x+200 C.^y=-10x-200
D.^y=10x-200
【解析】 由题意回归方程斜率应为负,故排除B,D,又销售量应为正值,故C不正确,故选A.
【答案】 A
第九章 统计与统计案例 Page 36 of 55 秦
2.下面是2×2列联表:
x1 x2 合计 则表中a,b的值分别为( ) A.94,72 C.52,74
B.52,50 D.74,52 b 46 120 y1 a 22 y2 21 25 合计 73 47 【解析】 ∵a+21=73,∴a=52. 又a+22=b,∴b=74. 【答案】 C
3.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:^y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【解析】 由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 【答案】 0.254
4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填有关或无关).
【解析】 ∵k=27.63>6.635,
∴有99%的把握认为“打鼾与患心脏病有关”. 【答案】 有关
5.(2013·湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且^y=2.347x-6.423;②y与x负相关且^y=-3.476x+5.648;