第四章 数据的概括性度量 下载本文

第四章 数据的概括性度量

【重点】掌握各类统计指标的计算方法和应用原则,并进行初步的分析。 【难点】结合实例准确进行集中趋势和离散程度的测度及分析。

思考题

4.1 偏度和峰度是描述频数分布的哪些特征的方法? 4.2

一组数据的分布特征可以从哪几个方面进行侧度?

4.3 简述众数、中位数和均值的特点及应用场合。

4.4 简述异众比率、四分位差、方差或标准差的适用场合。 4.5 4.6

标准分数有哪些用途? 为什么要计算离散系数?

练习题

一、单项选择题

1、一组数据排序后处于25%和75%位置上的值称为( )

A、众数 B、中位数 C、四分位数 D、均值 2、如果一个数据的标准分数是–2,表明该数据( )

A、比平均数高出2个标准差 B、比平均数低2个标准差 C、等于2倍的平均数 D、等于2倍的标准差

3、经验法则表明,当一组数据对称分布时,在均值加减1个标准差的范围内大约有( )

A、68%的数据 B、95%的数据 C、99%的数据 D、100%的数据 4、离散系数的主要用途是( )

A、反映一组数据的离散程度 B、反映一组数据的平均水平 C、比较多组数据的离散程度 D、比较多组数据的平均水平 5、离散系数( )

A、只能消除一组数据的水平对标准差的影响

B、只能消除一组数据的计量单位对标准差的影响

C、可以同时消除数据的水平和计量单位对标准差的影响 D、可以准确反映一组数据的离散程度

6、峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值( )

A、等于0 B、大于0 C、小于0 D、等于1 7、如果峰态系数K>0,表明该组数据是( )

A、尖峰分布 B、扁平分布 C、左偏分布 D、右偏分布

8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是( )

A、1200 B、经济管理学院 C、200 D、理学院

9、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。描述该组数据的集中趋势宜采用( )

A、众数 B、中位数 C、四分位数 D、均值

10、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用( )

A、众数 B、中位数 C、四分位数 D、均值 11、对于分类数据,测度其离散程度使用的统计量主要是( )

A、众数 B、异众比率 C、标准差 D、均值

12、甲、乙两组工人的平均日产量分别为18件和15件。若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量( )

A、上升 B、下降 C、不变 D、可能上升,也可能下降 13、权数对平均数的影响作用取决于( )

A、各组标志值的大小 B、各组的次数多少 C、各组次数在总体单位总量中的比重 D、总体单位总量 14、当各个变量值的频数相等时,该变量的( )

A、众数不存在 B、众数等于均值

C、众数等于中位数 D、众数等于最大的数据值

15、有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位

数为( )

A、24 B、23 C、22 D、21

16、下列数列平均数都是50,在平均数附近散布程度最小的数列是( )

A、0 20 40 50 60 80 100 B、0 48 49 50 51 52 100 C、0 1 2 50 98 99 100 D、0 47 49 50 51 53 100

17、下列各项中,应采用加权算术平均法计算的有( )

A、已知计划完成百分比和实际产值,求平均计划完成百分比 B、已知计划完成百分比和计划产值,求平均计划完成百分比 C、已知各企业劳动生产率和各企业产值,求平均劳动生产率

D、已知生产同一产品的各企业产品单位成本和总成本,求平均单位成本

18、如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?( )

A、算术平均数 B、几何平均数 C、中位数 D、众数

19、假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用( )

A、算术平均数 B、几何平均数 C、众数 D、调和平均数

20、某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是( )

A、众数>中位数>均值 B、均值>中位数>众数 C、中位数>众数>均值 D、中位数>均值>众数

二、多项选择题

1、变量数列中,各组变量值与频数的关系是( )

A、各组变量值作用的大小由各组频数的多少反映 B、各组变量值作用的大小由各组变量值的大小反映 C、频数越大的变量值对总体一般水平的影响也越大 D、频数越大的变量值对总体一般水平的影响越小 E、频数越大,变量值也越大

2、应该用加权算术平均法计算平均数的有( ) A、已知各组职工工资水平和各组职工人数,求平均工资 B、已知各组职工工资水平和各组工资总额,求平均工资

C、已知各组计划完成百分数和各组计划产值,求平均计划完成百分数 D、已知各组计划完成百分数和各组实际产值,求平均计划完成百分数 E、已知各组职工的劳动生产率和各组职工人数,求平均劳动生产率 3、下列应该用几何平均法计算的有( )

A、生产同种产品的三个车间的平均合格率 B、平均发展速度 C、前后工序的三个车间的平均合格率 D、平均劳动生产率 E、以复利支付利息的年平均利率 4、下列说法那些是正确的?( )

A、应该用均值来分析和描述地区间工资水平 B、宜用众数来描述流行的服装颜色

C、考试成绩中位数的含义是有一半考生的成绩超过此数

D、在数据组高度偏态时,宜用中位数而不是用众数来作为平均数 E、一般常用算术平均法来计算年平均增长率

三、填空题

1、某班的经济学成绩如下表所示: 43 77 84

55 77 86

56 78 87

56 79 88

59 80 88

60 81 89

67 82 90

69 83 90

73 83 95

75 83 97

该班经济学成绩的平均数为 ,众数为 ,中位数为 ,上四分位数为 ,下四分位数为 ,四分位差为 ,离散系数为 。从成绩分布上看,它属于 ,你觉得用 描述它的集中趋势比较好,理由 。

2、在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200~300元的家庭占24%,人均月收入在300~400元的家庭占26%,在400~500元的家庭占29%,在500~600元的家庭占10%,在600~700元的家庭占7%,在700元以上的占4%。从此数据分布状况可以判断:

(1)该城市收入数据分布形状属 (左偏还是右偏)。

(2)你觉得用均值、中位数、众数中的 ,来描述该城市人均收入状况较好。

理由是 。

(3)从收入分布的形状上判断,我们可以得出中位数和均值中 数值较大。上四分

位数所在区间为 ,下四分位数所在区间为 。

四、判断分析题(判断正误,并简要说明理由)

1、 并非任意一个变量数列都可以计算其算术平均数、中位数和众数。( ) 2、 某企业某年各季度销售额和利润资料如下:

季度 销售额(百万元) 利润率(%) 1 150 30 2 180 32 3 200 35 4 210 36 则该年各季度平均利润率为(30%+32%+35%+36%)/4=33.25%。( )

3、某企业计划劳动生产率比上年提高10%,实际只提高了5%,表明劳动生产率计划只完成了一半。( )

4、若数据组的均值是450,则所有的观察值都在450周围。( )

五、简答题

1、简述众数、中位数和均值特点及应用场合。

2、某公司下属两个企业生产同一种产品,其产量和成本资料如下:

基期 单位成本(元) 甲企业 乙企业 合计 600 700 660 产量(吨) 1200 1800 300 报告期 单位成本(元) 600 700 640 产量(吨) 2400 1600 4000 试问:报告期与基期相比,该公司下属各企业单位成本都没有变化,但该公司总平均成本却下降了20元,这是为什么?

3、一项民意测验询问了2050个成年人,“你对今天的生活状况满意程度如何?”回答分类为满意、不满意和说不清。

(1)这一调查的样本规模有多大?

(2)回答的答案是属于品质型还是数量型?

(3)使用平均数或百分比作为对这一问题的数据的汇总,哪一个更有意义? (4)回答中,8%的人说他们对今天的生活状况不满意,作出这种回答的人是多少?

六、计算题

1、下表中的数据反映的是1992年到2001年我国职工工资和居民消费价格增长指数:

年份 职工工资增长指数(%) 居民消费价格指数(%)

106.4 114.7 124.1 117.1 108.3 102.8 99.2

98.6

100.4 100.7

118.5 124.8 135.4 121.7 112.1 103.6 100.2 106.2 107.9 111.0 1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

试根据上表数据比较我国1992年到2001年间职工工资平均增长指数与平均居民消费价格指数的大小。

2、下面是甲地区空气质量指数(0~50表示良好,50~100表示适中)的一组数据:28,42,58,48,45,55,60,49,50。

(1)计算全距、方差和标准差;

(2)已知同期观察到的乙地区空气质量指数的平均数为48.5,标准差为11.66,试对两地区的空气质量作出比较。

3、 某一牧场主每年饲养600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。饲养原品种牛和改良品种牛的利润如下:

原品种牛 净利润(元/头) 频数 –200 0 200 400 合计 36 12 185 367 600 频率(%) 6 2 31 61 100 频率(%) 1 2 57 40 100 改良品种牛 (1)牧场主应该选择哪一种品种?为什么?

(2)改良品种牛的利润和频率可能与上表的计算值有差异。当饲养改良品种牛的利润

有什么变化时,牧场主会改变他在(1)中所做的选择?