(2)质量指标值的样本平均数 =80×0.08+90×0.22+100×0.37+110×0.28+120×0.05=100, 所以估计这种面包质量指标值的平均数为100.
(3)质量指标值不低于85的频率为0.22+0.37+0.28+0.05=0.92>0.9,
故可以认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包的90%”的规定.
变式题 (1)B (2)100 [解析] (1)分数在130~140的频率为
1-10×(0.01+0.025+0.045+0.015)=0.05,根据对应关系得分数在100~120的人数为
. .
×2=28,故选
.
B.
(2)支出在[30,40)的频率为0.38,频数为0.38n,支出在[10,20)的频率为0.12,频数为0.12n,依题意得0.38n-0.12n=26,解得n=100.
例2 [思路点拨] (1)利用中位数的定义,即可求出答案;(2)通过读茎叶图求出评分高于90的频率,用频率估计概率;(3)可以从评分的中位数、平均数(茎叶图的中心),数据的集中程度等方面给出合理的解释. 解:(1)由所给茎叶图知,将50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本的中位数为75,所以该市的市民对甲部门评分的中位数是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本的中位数为该市的市民对乙部门评分的中位数是67.
(2)由所给茎叶图知,50位市民对甲、乙两部门的评分高于90的频率分别为=0.1,=0.16,故该市的市民对甲、乙两部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.)
=67,所以 变式题 (1)D (2)C [解析] (1)依题意得88+91+90+x>89+92+93,解得x>5,又x的可能结果有0,1,2,…,9,共10种,其中x>5的结果有4种,则所求概率P==,故选D.
(2)由
=82,可得
x=6.由
=77,可得 y=2,所以x-y=6-2=4,故选C.
例3 [思路点拨] (1)利用平均值、方差(标准差)公式可求出结果;(2)用频率估计概率,进而计算参加复赛的人数.
解:(1)平均值 =×(4×6+5×15+6×21+7×12+8×3+9×3)=6,
方差s2=×[6×(4-6)2+15×(5-6)2+21×(6-6)2+12×(7-6)2+3×(8-6)2+3×(9-6)2]=1.5, 则标准差s≈1.22,故样本的平均值为6,标准差约为1.22.
(2)在60名学生中,有12+3+3=18(名)学生的预赛成绩在7分或7分以上,所以210名学生中约有
×210=63(名)学生的预赛成绩在
7分或7分以上,故估计有63名学生可以参加复赛.
例4 [思路点拨] (1)将频率作为概率计算可得;(2)①利用频率分布直方图算出样本数据的平均数,②用分层抽样的方法抽出个体,列举求出概率.
解:(1)由频率分布直方图可知,样本中数据落在[80,100]的频率为0.2+0.1=0.3, 则估计全校这次考试中优秀生人数为2000×0.3=600. (2)①设样本数据的平均数为 ,
则 =45×0.05+55×0.15+65×0.2+75×0.3+85×0.2+95×0.1=72.5, 则估计这次参加考试的学生的平均成绩为72.5分.
②由分层抽样知识可知,从成绩在[70,80),[80,90),[90,100]内的学生中分别抽取了3人、2人、1人.记成绩在[70,80)内的3人为a,b,c,成绩在[80,90)内的2人为d,e,成绩在[90,100]内的1人为f,记恰好抽中2名优秀生为事件A,则从这6人中抽取3人的所有可能结果有
(a,b,c),(a,b,d),(a,b,e),(a,b,f),(a,c,d),(a,c,e),(a,c,f),(a,d,e),(a,d,f),(a,e,f),(b,c,d),(b,c,e),(b,c,f),(b,d,e),(b,d,f),(b,e,f),(c,d,e),(c,d,f),(c,e,f),(d,e,f),共20种, 其中恰好抽中2名优秀生的结果有
(a,d,e),(b,d,e),(c,d,e),(a,d,f),(b,d,f),(c,d,f),(a,e,f),(b,e,f),(c,e,f),共9种,则P(A)=.
变式题 (1)A (2)D [解析] (1)根据平均值与方差的定义可以确定:当 = 时,去掉的那个数就是 ,那么就有A=[(x1- )2+(x2- )2+(x3- )2+(x4- )2],B=[(x1- )2+(x2- )2+(x3- )3+(x4- )2],所以可以得到A
(2)估计该班学生成绩的众数为
=115.设中位数为
x,由题意可得10×(0.005 0+0.015 0+0.020
0)+(x-110)×0.030 0=0.5,解得x≈113.3.故选D.
【备选理由】 例1考查茎叶图,通过练习使学生加深对茎叶图的理解,是对听课正文例2的有效补充;例2是计算样本的数字特征问题,是对听课正文例3的有效补充.
例1 [配例2使用] [2018·合肥三调] 近期“共享单车”在全国多个城市持续升温,某移动互联网机
构通过对使用者的调查得出,现在市场上常见的八个品牌的“共享单车”的满意度指数如图所示:
(1)求出这组数据的平均值和中位数;
(2)某用户从满意度指数超过80的品牌中随机选择两个品牌使用,求所选两个品牌的满意度指数均超过85的概率. 解:(1)平均值 = -
=83.
将8个数据按从小到大的顺序排列为73,77,79,82,84,86,90,93,则这组数据的中位数为
=83.
(2)满意度指数超过80的品牌有五个,从中任选两个有10种结果,其中所选两个品牌的满意度指数均超过85的结果有3种,故所选两个品牌的满意度指数均超过85的概率为.
例2 [配例3使用]某篮球运动员在最近5场比赛中所得分数分别为12,a,8,15,23,其中a>0,若该运
动员在这5场比赛中得分的中位数为12,则得分的平均数不可能为 ( ) ...A.
B.
C.
D. 14
[解析] C 若中位数为12,则a≤12,平均数为故选C.
≤14,结合选项知得分的平均数不可能为.
第58讲 变量间的相关关系、统计案例
考试说明 1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).
3.通过典型案例了解回归分析的思想、方法、并能初步应用回归分析的思想、方法解决一些简单的实际问题. 4.通过典型案例了解独立性检验的思想、方法并能初步应用独立性检验的思想、方法解决一些简单的实际问题.
【课前双基巩固】 知识聚焦
1.(1)相关关系 相关关系 (2)正相关 负相关 2.(1)线性 回归直线 (2)最小
3.(1)相关关系 (2)( , ) (3)正相关 负相关 对点演练
1.② [解析] 对于①,正方形的边长与面积之间的关系是函数关系,不是相关关系;对于②,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;对于③,人的身高与眼睛近视的度数之间的关系既不是函数关系也不是相关关系;对于④,哥哥的数学成绩与弟弟的数学成绩之间既不是函数关系也不是相关关系.
2.52 74 [解析] ∵a+21=73,∴a=52.又a+22=b,∴b=74.
3.95 [解析] 根据表格发现3.855>3.841,3.841对应的是0.05,所以根据独立性检验原理可知,有95%的把握认为“长时间使用电脑与视力下降有关系”.
4.② [解析] 散点图呈现上升趋势,故人体脂肪含量与年龄正相关.因为中间两个数据介于15%到20%之间,所以脂肪含量的中位数小于20%.
5. [解析] 由散点图知用y=c1 拟合比用 = x+ 拟合的效果要好,则 > .
6.④ [解析] 由于线性回归方程中x的系数为0.85,所以y与x呈正相关,故①中说法正确;回归直线必过样本点的中心( , ),因此②中说法正确;由线性回归方程中x的系数的意义知,身高每增加1 cm,体重约增加0.85 kg,故③中说法正确;当某女生的身高为170 cm时,其体重的估计值是58.79 kg,因此④中说法不正确.
7.③ [解析] 由已知数据可得,有(1-0.05)×100%=95%的把握认为“患肺病与吸烟有关”. 【课堂考点探究】
例1 [思路点拨] 计算出利润的中位数,观察数据知y随着x的增大而增大,即可求出答案. B [解析] 利润的中位数为
=17,随着 x增大,y也增大,所以x与y正相关,故选B.
变式题 E [解析] 散点图中的点越集中在一条直线的附近,数据的相关系数的绝对值越大,图中E点是偏离回归直线最远的点,故去掉E点后相关系数的绝对值最大.
例2 [思路点拨] (1)利用公式计算相关系数r,由此说明y与x,z与x的相关程度;