(2)年龄分布的特点:自学考试人员年龄的分布为右偏。
7.下面是A、B两个班学生的数学考试成绩数据: A班:
44 66 73 76 85 B班:
35 55 61 71 85
39 56 62 73 90
40 56 63 74 91
44 57 64 74 91
44 57 66 79 94
48 57 68 81 95
51 58 68 82 96
52 59 70 83 100
52 60 70 83 100
54 61 71 84 100
57 66 74 77 85
59 67 74 77 86
60 69 74 77 86
61 70 75 78 90
61 70 75 78 92
62 71 75 79 92
63 72 75 80 92
63 73 75 80 93
65 73 76 82 96
(1) 将两个班的考试成绩用一个公共的茎制成茎叶图; (2) 比较两个班考试成绩分布的特点。 解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下: A班 数据个数 0 1 2 11 23 7 6 0 树 叶 4 97 97665332110 98877766555554443332100 6655200 632220 树茎 3 4 5 6 7 8 9 10 B班 树叶 59 0448 122456677789 011234688 00113449 123345 011456 000 数据个数 2 4 12 9 8 6 6 3 (2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。
8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。
月份 北京 长春 南京 郑州 武汉 广州 成都 昆明 兰州 西安 1 2 3 4 5 6 7 8 9 10 11 12 49 41 47 50 55 57 69 74 68 47 66 56 70 68 50 39 56 54 70 79 66 59 59 57 76 71 77 72 68 73 82 82 71 75 82 82 57 57 68 67 63 57 74 71 67 53 77 65 77 75 81 75 71 74 81 73 71 72 78 82 72 80 80 84 83 87 86 84 81 80 72 75 79 83 81 79 75 82 84 78 75 78 78 82 65 65 58 61 58 72 84 74 77 76 71 71 51 41 49 46 41 43 58 57 55 45 53 52 67 67 74 70 58 42 62 55 65 65 73 72 资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。 解:箱线图如下:(特征请读者自己分析) 各城市相对湿度箱线图958575655545Min-Max3525%-75%北京长春南京郑州武汉广州成都昆明兰州西安Median value
9.某百货公司6月份各天的销售额数据如下(单位:万元):
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295
(1)计算该百货公司日销售额的均值、中位数和四分位数; (2)计算日销售额的标准差。 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223, 于是得该百货公司日销售额的均值:(见Excel练习题2.9)
8223 x=n=30=274.1(万元)
或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:
?xA30”,回车,得到均值也为274.1。
在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:
272?2732Me==272.5(万元)
由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中
间位置(第8位)靠上四分之一的位置上,
由重新排序后的Excel表中第8位是261,第15位是272,从而:
273?2724QL=261+=261.25(万元)
同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的
位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:
273?2724QU=291-=290.75(万元)。
(2)未分组数据的标准差计算公式为:
?(x?x)ii?1302 s=n?1 利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算30个数据的离差平方,
并将其求和,()再代入公式计算其结果:得s=21.1742。(见Excel练习题2.9) 我们可以利用Excel表直接计算标准差:
点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV” →“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。于是:
s?21.17(万元)。(见Excel练习题2.9)
10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:
产品 名称 A B C 单位成本 (元) 15 20 30 总成本(元) 甲企业 2100 3000 1500 乙企业 3255 1500 1500 比较哪个企业的总平均成本高?并分析其原因。
解:设产品单位成本为 x,产量为f,则总成本为xf,
?xff由于:平均成本x=?总成本=总产量,而已知数据中缺产量f 的数据,
该产品成本xf又因个别产品产量f =该产品单位成本=x 从而 x=
?xfxf?x,于是得:
甲企业平均成本=
?xfxf?x?xfxf?x2100?3000?1500210030001500??2030=19.41(元)=15, 3255?1500?1500325515001500??152030=18.29(元)=,
乙企业平均成本=
对比可见,甲企业的总平均成本较高。
原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
11.在某地区抽取的120家企业按利润额进行分组,结果如下:
按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合计
企业数(个) 19 30 42 18 11 120
计算120家企业利润额的均值和标准差。
解:设各组平均利润为 x,企业数为f,则组总利润为xf,
由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:
按利润额分组(万元) 200~300 300~400 400~500 500~600 600以上 合计
于是,120家企业平均利润为:
组中值
企业数(个)
总利润
x 250 350 450 550 650 —
f 19 30 42 18 11 120
xf 4750 10500 18900 9900 7150 51200
?xff x=?51200=120= 426.67(万元);
分组数据的标准差计算公式为: