第三节 统计图表、用样本估计总体
[最新考纲] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.
1.常用统计图表 (1)频率分布表的画法:
极差
第一步:求极差,决定组数和组距,组距=;
组数
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示率.各小矩形的面积和为1.
(3)频率分布折线图和总体密度曲线
①频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(4)茎叶图的画法步骤:
第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的右(左)侧. 2.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
频率
,每个小矩形的面积表示样本数据落在该组内的频组距
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把x=
x1+x2+…+xn称为x1,x2,…,xn这n个数的平均数.
n(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x,则这组数据的标准差和方差分别是
s=
1
1[
nx1-x2
+x2-x2
+…+xn-x2
];
s2=[(x1-x)2+(x2-x)2+…+(xn-x)2].
n[常用结论]
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是
mx+a.
(2)数据x1,x2,…,xn的方差为s.
①数据x1+a,x2+a,…,xn+a的方差也为s; ②数据ax1,ax2,…,axn的方差为as.
一、思考辨析(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中. ( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
[答案] (1)√ (2)× (3)√ (4)× 二、教材改编
22
2
2
1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A.4 C.12
B [设频数为n,则=0.25,
321
∴n=32×=8.]
4
2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 C.91和91.5
B.91.5和92 D.92和92 B.8 D.16
n91+92A [∵这组数据为87,89,90,91,92,93,94,96,∴中位数是=91.5,
287+89+90+91+92+93+94+96
平均数x==91.5.]
8
3.甲、乙两位运动员在5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分--
别为x甲,x乙,则下列判断正确的是( )
--
A.x甲>x乙;甲比乙成绩稳定 --
B.x甲>x乙;乙比甲成绩稳定 --
C.x甲 D.x甲 -16+17+28+30+34---15+28+28+26+33 D [∵x甲==25,x乙==26,∴x甲 55112222222 ∴s甲=[(16-25)+(17-25)+(28-25)+(30-25)+(34-25)]=52,s乙=[(15 55-26)+(28-26)+(26-26)+(28-26)+(33-26)]=35.6, ∴s甲>s乙,所以乙成绩稳定,故选D.] 4.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有________人. 2 2 2 2 2 2 2 25 [0.5×0.5×100=25.] 考点1 样本的数字特征的计算与应用 利用样本的数字特征解决决策问题的依据 (1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定. (2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征. 1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定 该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( ) A.中位数 C.方差 B.平均数 D.极差 A [设9位评委评分按从小到大排列为x1 中位数仍为x5,∴A正确.] 2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( ) 甲 乙 A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差 C [根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况