《应用统计学》习题解答
第一章 绪 论
【1.1】指出下列变量的类型:
(1)汽车销售量; (2)产品等级;
(3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别;
(6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量
(2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量
【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求:
(1)描述总体和样本。 (2)指出参数和统计量。
(3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平
统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平
【1.3】下面是社会经济生活中常用的统计指标:
①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。
在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标? 【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧
数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。
【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题:
(1) 这一研究的总体是什么?
(2) 月收入是分类变量、顺序变量还是数值型变量? (3) 对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。
- 1 -
(2)月收入是数值型变量
(3)对居住环境的满意程度是顺序变量。
第二章 统计数据的搜集
【2.1】从统计调查对象包括的范围、调查登记时间是否连续、搜集资料的方法是否相同等方面,对以下统计调查实例分类,并指出各属于那种统计调查方式。
(1) 2004年,对我国的工业企业从业人数进行调查,各企业按上级部门要求填报统计表;
(2) 2004年,对全国所有第二、第三产业活动单位进行基本情况摸底调查,以2004年12月31日为标准时点,调查2004年度的资料;
(3) 对进口的一批产品,抽检其中少部分以对整批产品质量进行评价;
(4) 要了解全国粮食产量的基本情况,只要对全国几个重点粮食产区进行调查,就能及时地对全国粮食产量的基本情况进行推断;
(5) 为了探讨一项新改革措施实施的效果,推广其成功的经验,对已采取改革措施并产生明显效果的代表性单位进行调查。 【解】(1)的调查方式是统计报表制度 (2)的调查方式是普查 (3)的调查方式是抽样调查 (4)的调查方式是重点调查 (5)的调查方式是典型调查
【2.2】某调查机构从某小区随机地抽取了50位居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答下列的问题:
(1)这里用到什么调查方式?
(2)这里涉及的数据有哪些?哪些是截面数据,哪些是动态数据? 【解】(1)这里用到的调查方式是抽样调查。
(2)这里涉及的数据主要有:居民对居住环境的态度、月收入,这些数据都是截面数据。
第三章 统计数据的整理与显示
【3.1】已知40名消费者购买5种不同款式的手机,分别是:A.诺基亚 B.摩托罗拉 C.波导 D.联想 E.西门子。他们购买的情况如下表所示:
A B C D E B A E A C D B E C A B E D A C E D B A C B A E D B C A B E A D E A B C 要求:
(1)指出上面的数据属于什么类型? (2)用Excel制作一张频数分布表。
(3)绘制一张条形图和一张饼图,反映各类别的频数分布情况。 【解】(1)上面数据属于分类型数据 (2)频数分布表如下表所示:
类别 A
频数 10
- 2 -
比例 0.25
百分比(%)
25
B C D E (3)条形图如下所示9 7 6 8 0.225 0.175 0.15 0.20 22.5 17.5 15 20 ED类别CB系列1A0246频数81012 饼图如下图所示 E20% D 15% C 18% 【3.2】已知40份用于购买汽车的个人贷款数据:
930 514 456 974 2235 957 1100 554 256
A24?CDEB2303 1240 1280 2550 585 783 720 872 638 660 1377 861 328 1640 1217 1590 655 1423 747 592 2111 445 3005 346 1190 340 1620 1525 1200 1780 935 - 3 -
要求:(1)利用Excel的FREQUENCY函数进行统计分组整理,编制频数分布表,并计算出
累积频数和累积频率。 (2)利用SPSS绘制直方图。 【解】(1)Excel中得到的频数分布表 贷款数据 0~500 500~1000 1000~1500 1500~2000 2000~2500 2500以上 合计
频数 6 16 8 6 2 2 40
频率(%)
15 40 20 15 5 5 100
向上累积 频数 6 22 30 36 38 40 –
频率(%) 15 55 75 90 95 100 –
向下累积 频数 40 34 18 10 4 2 –
频率(%) 100 85 45 25 10 5 –
(2)SPSS中绘制的直方图
【3.3】下表列出了最近某年5月15日美国30个城市的最低温度。要求做出 最低温度数据的茎叶图。 城 市 奥尔巴尼 安克雷奇 亚特兰大 奥斯丁
最低 温度 39 47 46 66 城 市 哥伦比亚 哥伦布 达拉斯 底特律 - 4 -
最低 温度 47 40 68 43 城 市 洛杉矶 孟菲斯 纽约城 菲克尼斯 最低 温度 61 51 50 74 伯明翰 波士顿 布法罗 卡斯帕 芝加哥 克利夫兰 42 53 44 51 45 40 韦恩堡 格林贝 檀香山 休斯顿 杰克逊维尔 拉斯维加斯 37 38 65 67 50 63 波特兰 旧金山 西雅图 锡拉拉丘兹 坦帕 华盛顿 53 55 50 43 59 52 【解】最低温度的茎叶图
最低温度 Stem-and-Leaf Plot Frequency Stem & Leaf 3.00 3 . 789 6.00 4 . 002334 4.00 4 . 5677 8.00 5 . 00011233 2.00 5 . 59 2.00 6 . 13 4.00 6 . 5678 1.00 7 . 4 Stem width: 10
Each leaf: 1 case(s)
第四章 统计描述
【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=即产量超额完成12.5%。
成本的计划完成程=即成本超额完成3.16%。
劳动生产率计划完=
实际产量45?100%??100%?112.5%
计划产量401-实际降低百分比1-8%?100%??100%?96.84%
1-计划降低百分比1-5%1?实际提高百分比1?10%?100%??100%?101.85%
1?计划提高百分比1?8%即劳动生产率超额完成1.85%。
【4.2】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的0.1%,在五年中,该矿实际开采原煤情况如下(单位:万吨)
年份 实际开采量 累计开采量 1991年 156 1992年 230 1993年 540 1994年 上半年 279 下半年 325 1995年 上半年 470 下半年 535 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。
- 5 -
【解】本题采用累计法:
计划期间实际完成累计数?100%(1)该煤矿原煤开采量五年计划完成=计划期间计划规定累计 数2535?104?126.75% =72?10即:该煤矿原煤开采量的五年计划超额完成26.75%。
(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【4.3】我国1991年和1994年工业总产值资料如下表:
1991年 轻工业总产值 重工业总产值 工业总产值 要求:
(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)?
(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 【解】(1)
1991年 轻工业总产值 重工业总产值 工业总产值 (2)是比例相对数;
数值(亿元) 13800.9 14447.1 28248 比重(%) 48.86% 51.14% —— 1994年 数值(亿元) 21670.6 29682.4 51353 比重(%) 42.20% 57.8% —— 数值(亿元) 13800.9 14447.1 28248 比重(%) 1994年 数值(亿元) 21670.6 29682.4 51353 比重(%) 13800.9?0.96;
14447.121670.6?0.73 1994年轻工业与重工业之间的比例=
29682.41991年轻工业与重工业之间的比例=(3)
51353?1?25.37%
28248(1?45%)即,94年实际比计划增长25.37%。
【4.4】某乡三个村2000年小麦播种面积与亩产量资料如下表:
- 6 -
村 名 甲 乙 丙 合计 亩产量 (斤) 700 820 650 亩数(亩) 120 150 130 播种面积 所占比重(%) 要求:(1)填上表中所缺数字;
(2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。 【解】(1) 村 名 甲 乙 丙 合计 亩产量 (斤) 700 820 650 —— i播种面积 亩数(亩) 120 150 130 400 所占比重(%) 30% 37.5% 32.5% 100% (2)x??xi?1ki?1kfi?i?f700?120?820?150?650?130?728.75(斤)
400(3)
x??xi?1ki?1kifii?f??xi?i?1kfi?fi?1k?700?30%?820?37.5%?650?32.5%?728.75(斤)
i【4.5】两种不同品种的玉米分别在五块地上试种,产量资料如下:
甲品种 田块面积(亩) 0.8 0.9 1 1.1 1.2 5 总产量(斤) 840 810 1100 1040 1200 4990 0.9 1 1.3 1.3 1.5 6 乙品种 田块面积(亩) 总产量(斤) 630 1200 1170 1300 1680 5980 - 7 -
已知生产条件相同,对这两种玉米品种进行分析比较,试计算并说明哪一种品种的亩产量更稳定一些?
【解】平均亩产量?总产量
田块总面积即: 由于是总体数据,所以计算总体均值:
?X甲??m?fi?i4990?998(斤) 5X乙计算表格
m???fi?i5980?996.67(斤) 6 亩产量Xi 1050 900 1100 945.45 1000 — 亩产量Xi 700 1200 900 1000 1120 — 甲品种 田块面积(亩)fi 0.8 0.9 1 1.1 1.2 总计: 5 乙品种 田块面积(亩)fi 0.9 1 1.3 1.3 1.5 总计: 6 总产量(斤)mi 630 1200 1170 1300 1680 5980 总产量(斤)mi 840 810 1100 1040 1200 4990 下面分别求两块田地亩产量的标准差:
?甲??(Xi?1Ki?X甲)2fiN?24253.25?69.65(斤) 5?乙??(Xi?1Ki?X乙)2fiN?155533.33?161(斤)
6要比较两种不同玉米的亩产量的代表性,需要计算离散系数:
- 8 -
v?甲??甲X甲?69.65?0.07 998161?0.16
996.67v?乙??乙X乙??v?甲?v?乙,?甲品种的亩产量更稳定一些。
【4.6】两家企业生产相同的产品,每批产品的单位成本及产量比重资料如下: 甲企业 批次 第一批 第二批 第三批 合计 乙企业 批次 第一批 第二批 第三批 合计 单位产品成本(元/台) 产量比重(%) 100 110 120 —— 33 33 34 100 单位产品成本(元/台) 产量比重(%) 100 110 120 —— 10 20 70 100 试比较两个企业哪个企业的产品平均单位成本低,为什么? 【解】
X甲??xi?1ki?1kifii?fi??xi?i?1kfi?fi?1k?100?10%?110?20%?120?70%?116(元)
iX乙??xi?1ki?1kfii?f??xi?i?1kfi?fi?1k?100?33%?110?33%?120?34%?110.1(元)
i?X乙?X甲
?乙企业的产品平均单位成本更低。
【4.7】某粮食储备库收购稻米的价格、数量及收购额资料如下:
- 9 -
等级 一级品 二级品 三级品 单价(元/斤) 收购量(万斤) 收购额(万元) 1.2 1.05 0.9 2000 3000 4000 2400 3150 3600 要求:(1)按加权算术平均数公式计算稻米的平均收购价格;
(2)按加权调和平均数公式计算稻米的平均收购价格。
k【解】(1)x??xi?1ki?1ifi?i?f9150?1.02(元) 9000(2)xHm??m?x?2400?3150?36009150??1.02(元)
2000?3000?40009000【4.8】已知我国1995年—1999年末总人口及人口增长率资料:
年份 年末总人口(万人) 人口增长率(‰) 1994 119850 11.6 1995 121121 10.47 1996 122389 10.11 1997 123626 10.1 1998 124810 9.58 1999 125909 8.81 试计算该期间我国人口平均增长率。 【解】计算过程如下: 年份 年末总人口(万人) 年内总人口数(万人) 1994 119850 —— 1995 121121 120486 1996 122389 121755 1997 123626 123008 1998 124810 124218 1999 125909 125360 按照平均增长率的公式可知:平均增长率?平均发展速度-1
所以,1995年—1999年期间我国人口平均增长率=4125360-1?9.96‰
120486【4.9】某单位职工按月工资额分组资料如下: 按月工资额分组(元) 4000元以下 4000-5000 5000-6000 6000-7000 7000以上
职工人数(人) 25 37 134 30 10 - 10 -
人数所占比重(%) 10.59 15.68 56.78 12.71 4.24 总计 根据资料回答问题并计算: (1)它是一个什么数列?
236 100.00 (2)计算工资额的众数和中位数;
(3)分别用职工人数和人数所占比重计算平均工资。结果一样吗? (4)分别计算工资的平均差和标准差。 【解】(1)是等距分组数列 (2)下限公式:M0?L?fm?fm?1?d
(fm?fm?1)?(fm?fm?1)M0?L?即:?5000?fm?fm?1?d(fm?fm?1)?(fm?fm?1)134?37?1000
(134?37)?(134?30)?5482.59(注:用上限公式算出的结果与上述结果相同)
n?Sm?1下限公式:Me?L?2?d
fmn?Sm?1Me?L?2?dfm118?62?1000
134?5417.91?5000?(注:用上限公式算出的结果与上述结果相同)
(3)
x??xi?1ki?1kifi?i?f3500?25?4500?37?5500?134?6500?30?7500?10?5343.22(元)236 - 11 -
x??xi?1ki?1kifii?f??xi?i?1kfi?fi?1k?3500?10.59%?4500?15.68%?5500?56.78%?6500?12.71%i ?7500?4.24%?5343.(元)2两者结果一样。(忽略小数点位数的保留对结果造成的影响)
(4)平均差 Md??xi?1ki?xfi?654.92
i?fi?1k标准差 ???(Xi?1Ki?X)2fiN?923.33
【4.10】某市甲、乙两商店把售货员按其人均年销售额分组,具体资料如下:
甲商场 乙商场 按销售额分组(万元) 20-30 30-40 40-50 50-60 60以上 合计 售货员人数(人) 30 110 90 60 10 300 按销售额分组(万元) 30-40 40-50 50-60 60-70 70以上 合计 售货员人数(人) 20 80 55 40 5 200 要求:(1)分别计算这两个商场售货员的人均销售额; (2)通过计算说明哪个商场人均销售额的代表性大?
【解】(1) X甲??xi?1ki?1kifi?i?fki12600?42 300X乙??xi?1ki?1fi?i?f10300?51.5 200 - 12 -
(2)?甲??(Xi?1Ki?X甲)2fiN?30300?10.05 300?乙?v?甲??(Xi?1Ki?X乙)2fiN?19550?9.89 200?甲X甲?10.05?0.24 429.89?0.19 51.5v?乙??乙X乙??v?甲?v?乙,
?乙商场销售额的代表性大。
第五章 统计抽样
【5.1】袋中装有5只同样大小的球,编号为1,2,3,4,5,从中同时取出3只球,求取出的最大号X的分布律及其分布函数并画出其图形。
【解】先求X的分布律:由题知,X的可能取值为3,4,5,且
3P{X?3}?1/C5?1/10,
23P{X?4}?C/C?3/10, 35
23P{X?5}?C/C?6/10, 45
45??3??1/103/106/10???, ?X的分布律为:?F(x)?P{X?xi}??pi由
xi?x得:
x?3?0?1/103?x?4?F(x)???2/54?x?5?x?5 ?1【5.2】设X的密度函数为
- 13 -
?c(3?2x),2?x?4 f(x)??0,其它?求: (1)常数c;
(2)X的分布函数F(x); (3)P{1?X?3}。 【解】(1)1??????f(x)dx??0dx??c(3?2x)dx??0dx?18c
??2424???c?1/18
(2)当x?2时,F(x)??x??0dt?0;
当2?x?4时,F(x)??x??f(t)dt??0dt????211(3?2t)dt?(x2?3x?10) 21818x 当x?4时,F(x)?故分布函数
?x??f(t)dt??0dt????2x1(3?2t)dt??0dt?1. 21844x?2?0,?1?F(x)??(x2?3x?10),2?x?4
?18x?4??1,(3)P{1?X?3}=F(3)?F(1)?12(3?3?3?10)?0?4/9 18【5.3】随机变量X,Y相互独立,又XP(2),Y1B(8,),试求E(X?2Y)和
4D(X?2Y)。
【解】E(X?2Y)?E(X)?2E(Y)?2?2?2??2
D(X?2Y)?D(X)?4D(Y)?2?4?3?8 2【5.4】一本书排版后一校时出现错误处数X服从正态分布N(200,400), 求: (1)出现错误处数不超过230的概率;
(2)出现错误处数在190~210的概率。
- 14 -
【解】
XN(200,400)
X?200230?200?) 202032(1)?P(X?230)?P( ?P(Z?)??()??(1.5)?0.9332
32(2) ?P(190?X?210)?P(190?200X?200210?200??)
202020 ?P(?111?Z?)?2?()?1?2?0.6915?1?0.3830 222【5.5】某地区职工家庭的人均年收入平均为12000元,标准差为2000元。若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,问出现样本均值等于或超过12500元的可能性有多大? 【解】
对总体而言,XN(12000,20002)
?样本均值x20002N(12000,)
25x?1200012500?12000?)
40040055)?1?P(Z?) 44P(x?12500)?P( ?P(Z? ?1??(1.25)?1?0.8944?0.1056
【5.6】某商场推销一种洗发水。据统计,本年度购买此种洗发水的有10万人,其中3万6千人是女性。如果按重复抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大? 【解】总体比例??3.6万=36%?p10万N(?,?(1??)n)即pN(0.36,0.0482)
P(p?50%)?P(p?0.360.5?0.36?)
0.0480.0480.140.14)?1?P(Z?) 0.0480.048?P(Z? - 15 -
?1??(35)?1??(2.92)?1?0.9982?0.0018 12第六章 统计推断
【6.1】采取重复抽样的方法,从某总体中抽取样本容量为250的一组样本,已知样本成数(比例)p=0.38,试计算样本成数(比例)的估计误差及抽样标准差。 【解】样本比例的估计误差为:
D?z?2?p(1?p)0.38?0.62?1.96??6% n250抽样标准差为:
D?p(1?p)0.38?0.62??3% n250【6.2】抽取一个样本容量为100的随机样本,其均值为36,标准差为7。试求总体均值95%
的置信区间。
【解】因为是大样本,总体方差未知, 所以总体均值95%的置信区间为:
?ss??77??x?z?,x?z????36?1.96?,36?1.96???2?2?????(34.628,37.372)nn??100100??【6.3】随机抽取一个由360名教师组成的样本,让每个人对一些说法表明自己的态度。第
一种说法是“年龄偏大的学生对班上的讨论比年龄小的学生更积极”。态度按5分制来衡量:1=非常同意;2=同意;3=没有意见 ;4=不同意;5=很不同意。对这一看法,样本的平均态度得分为2.08 ,标准差为0.95。试用98%的置信度估计教师对这一看法的平均态度得分的置信区间。
【解】因为是大样本,总体方差未知, 所以总体均值的98%的置信区间为:
?ss??0.950.95??x?z?,x?z????2.08?2.326?,2.08?2.326???2?2?????(1.96,2.20)nn??360360??【6.4】税务管理官员认为,大多数企业都有偷税漏税行为。在对由750个企业构成的随机
样本的检查中,发现有121个企业有偷税漏税行为。试以90%的置信度估计偷税漏税企业比例的置信区间。
【解】因为满足大样本,且样本比例为:p?121?0.16 750所以,偷税漏税企业比例90%的置信区间为:
??p?z?2???p(1?p),p?z?2?np(1?p)????n?(0.16?1.645?0.16?(1?0.16)0.16?(1?0.16),0.16?1.645?)?(13.80%,18.2%)750750- 16 -
【6.5】为估计自考学生的平均年龄,随机抽取一个样本容量为64的样本,其中平均年龄为26.5岁,标准差为4岁,试求自考学生总体平均年龄的99%的置信区间。 【解】因为是大样本,总体方差未知, 所以总体均值95%的置信区间为:
?ss??44??x?z?,x?z????26.5?2.58?,26.5?2.58???2?2?????(25.21,27.79)nn??6464??【6.6】销售公司要求销售人员与顾客经常保持联系。一项由60名销售人员组成的随机样本
表明:销售人员每周与顾客保持联系的平均次数为21.5次,样本标准差 为4次。试求销售人员每周与顾客保持联系的总平均次数95%的置信区间。 【解】因为是大样本,总体方差未知, 所以总体均值95%的置信区间为:
?ss??44??x?z?,x?z????21.5?1.96?,21.5?1.96???2?2?????(20.49,22.51)nn??6060??【6.7】某地区调查下岗职工中女性的比例,随机抽取了49名下岗职工,其中25人为女性,
现以90%的置信度估计该地区下岗职工中女性比例的置信区间。 【解】因为满足大样本,且样本比例为:p?25?0.51 49所以,该地区下岗职工中女性比例的90%的置信区间为:
??p?z?2???p(1?p),p?z?2?np(1?p)????n?
(0.51?1.645?0.51?(1?0.51)0.51?(1?0.51),0.51?1.645??(39.25%,62.75%)4949【6.8】某健康机构想估计现代白领员工平均每天参加体育锻炼的时间。从16家公司中随机
抽取25名白领员工,得知:其平均每天锻炼的时间为54分钟,标准差为30分钟。假设白领员工每天参加体育锻炼的时间服从正态分布。试求在95%的置信度下白领员工平均每天参加体育锻炼时间的置信区间。
【解】因为是正态总体、小样本、方差未知
所以,白领员工平均每天参加体育锻炼时间的95%的置信区间为:
?ss??x?t(n?1)?,x?t(n?1)???2?2??nn?? 3030?(54?2.0639?,54?2.0639?)?(41.62,66.38)2525【6.9】某县城妇联要估计该地区职业女性平均每天的家务劳动时间,根据以往数据显示,
该地区职业女性平均每天家务劳动时间的标准差为2小时。已知该地区的职业女性共有5000名,要求估计误差不超过1.5小时,假设采取不重复抽样,问:在95%的置信度下应该抽取多大的样本?
【解】不重复抽样条件下,关于均值的样本量确定公式为: 2N?2(z?2)25000?4?1.96 n???6122222ND??(z?2)5000?0.5?4?1.96
- 17 -
(注:将题目中的估计误差1.5小时改为0.5小时)
【6.10】某省进行人口出生率的调查,根据以往的资料,该省的人口出生率约为10‰。若要求估计误差不超过5%,置信度为95%,在重复抽样条件下,应该抽取多大的样本? 【解】重复抽样条件下,关于比例的样本量确定公式为:
n?(z?2)2p(1?p)D21.962?0.01?0.99??1522
0.0052(注:将题目中的估计误差5%改为5‰)
?,从过去较长一段时间的生产情【6.11】设某厂生产的一种灯管的寿命X~N??,40000况来看,灯管的平均寿命?0?1500小时,现在采用新工艺后,在所生产的灯管中抽取36只,测得平均寿命x?1675小时,问采用新工艺后,灯管寿命是否有显著提高?(??0.05) 【解】根据题意,要检验采用新工艺后,灯管寿命是否有显著提高,因此采用单侧检验。建
立的假设为:
H0:??1500 H1:??1500
已知
?0?1500,?2?40000,n?36,x?1675,??0.05,因为是大样本,所以采
x??01675?1500175??5.25200/6200/36
用Z检验统计量。
z??/n???0.05,?z??1.645
因为
z?z?,所以拒绝原假设H0,即采用新工艺后,灯管寿命有显著提高。
【6.12】已知普通成年人安静时的心率服从正态分布,其平均数是72次/min。现从某体院随机抽测64名男生,测得安静时心率平均数为68次/min,标准差为6.4次/min,试问某体院男生安静时心率与普通成年人的心率有无差异?(??0.01)
【解】根据题意,要检验体院男生安静时心率与普通成年人的心率有无差异,即平均数是否
达到72次/min,因此采用双侧检验。建立的假设为:
H0:??72 H1:??72
已知
?0?72,n?64,x?68,s?6.4,??0.01,因为是大样本,所以采用Z检验统
计量。
- 18 -
z?x??0s/n?68?72??56.4/64
??0.01,?z?/2?2.58
因为
z?z?/2,所以拒绝原假设
H0,即体院男生安静时心率与普通成年人的心率有差异。
【6.13】某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布。当机器正常时, 其均值为0.5千克, 标准差为0.015千克.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): 0.498 0.508 0.518 0.524 0.499 0.513 0.521 0.515 0.512, 问机器是否正常? (??0.05) 【解】根据题意,要检验机器是否正常工作,即袋装糖重是否为0.5千克,因此采用双侧检
验。建立的假设为:
H0:??0.5 H1:??0.5
x??0.512??0.5??0.015n?9n0已知,,,,因为是小样本,?已知,所以采
用Z检验统计量。
?xi?1niz?
x??0?/n?0.512?0.5?2.40.015/9
??0.05,?z?/2?1.96
因为
z?z?/2,所以拒绝原假设
H0,即机器工作不正常。
【6.14】四步助跑摸高成绩服从正态分布。我国女子优秀跳高运动员平均成绩为3.10米,某省6名女运动员的平均成绩为2.95米,标准差0.36米,问该省运动员的成绩是否低于我国优秀运动员?
【解】根据题意,要检验该省运动员的成绩是否低于我国优秀运动员,因此采用单侧检验。建立的假设为:
H0:??3.10 H1:??3.10
- 19 -
已知
?0?3.10,x?2.95,s?0.36,n?9,??0.05,因为是小样本,?未知,所以
采用t检验统计量。
t?
x??0s/n?2.95?3.10??1.250.36/9
??0.05,??t?(n?1)??t0.05(8)??1.8595
因为
t??t?,H即该省运动员的成绩不低于我国优秀运动员的成绩。所以不能拒绝原假设0,
【6.15】某厂家向一百货商店长期供应某种货物,双方根据厂家的传统生产水平,定出质量标准,即若次品率超过3%,则百货商店拒收该批货物。今有一批货物,随机抽43件检验,发现有次品2件,问应如何处理这批货物?
【解】根据题意,要决定如何处理这批货物,也就是该百货商店要不要收这批货物,由次品率是否超过3%来决定,因此采用单侧检验。建立的假设为:
H0:??3% H1:??3%
已知
?0?3%,
z?p?2?5@,??0.05,采用z检验统计量。
p??0??0(1??0)n5%?3%?0.743%(1?3%)40
因为
??0.05,?z??1.645
z?z?,所以不能拒绝原假设H0,即百货商店可以接受这批货物。
2【6.16】某厂生产的某种型号电池,其寿命长期以来服从方差??5000的正态分布。今
有一批这种电池,从它的生产情况来看,寿命波动性比较大。为判断这种想法是否合乎实际,随机抽取了26只电池,测出其寿命的样本方差为S?9200。问根据这个数据能否判定这批电池的波动性较以往的有显著的变化(取??0.05)?
【解】根据题意,要判定这批电池的波动性较以往是否有显著的变化,就是要检验这批电池的方差是否为5000,因为采用双侧检验。建立的假设为:
2 - 20 -
H0:?2?5000
2H:??5000 1222??5000?n?26??0.05s?92000已知,,,,采用检验统计量。
??2(n?1)s2?02?(26?1)?9200?465000
??0.05,
?2?/2(n?1)??20.025(25)?40.6465,?21??/2(n?1)??20.975(25)?13.1197
22????/2,所以拒绝原假设H0,即这批电池的波动性较以往是有显著的变化。 因为
第七章 方差分析
(以下均为Excel输出结果)
【7.1】有某种型号的电池,他们分别为甲、乙、丙三个工厂所生产的。为评比其质量,各随机抽取5只电池为样本,经试验测得其寿命(单位:小时)如下:
试验号 1 2 3 4 5 甲 49 50 39 40 43 电池生产企业 乙 28 32 30 26 34 丙 38 40 45 42 48 要求:检验三个工厂的电池平均寿命有无显著的差异?(?【解】方差分析表 差异源 组间 组内 总计
SS 604.9333
206
810.9333
df
2 12
MS
F
?0.05)
P-value
F crit
302.4667 17.61942 0.000269 3.885294 17.16667 14
由于P-value=0.000269<0.05,说明拒绝原假设,表明三个工厂的电池平均寿命有显著差异。 【7.2】某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了20名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的
- 21 -
产品数进行方差分析得到下表的结果。 差异源 组间 组内 总计 SS 1904 df 19 MS 435 F P-value 0.0325 F crit 3.592 要求:完成上面的方差分析表,并检验三种方法组装的产品数量之间是否有显著差异?(??0.05)
SS df MS 435 F P-value 0.0325 F crit 3.592 【解】 差异源 组间 组内 总计 870 1904 2 17 19 3.8118 114.118 由于P-value=0.0325<0.05,说明拒绝原假设,表明三种方法组装的产品数量之间有显著差异。
【7.3】为比较四种不同品牌的汽车使用相同类型汽油时的耗油量,在相同的行驶条件下,不同品牌汽车测得每加仑汽油所行使的里程数如下表:
品牌1 15 12 14 15 12 要求:分析四种不同品牌的车耗油量是否有显著差异?(?【解】方差分析表 差异源 组间 组内 总计
SS 53.50098 32.61667
86.11765
df
3 13
MS
F
P-value
F crit
17.83366 7.107948 0.004523 3.410534 2.508974 16 品牌2 11 12 13 9 品牌3 14 13 11 品牌4 17 18 16 14 15 ?0.05)
由于P-value=0.004523<0.05,说明拒绝原假设,表明四种不同品牌的车耗油量之间有显著差异。
- 22 -
【7.4】有4种不同的种子和5种不同施肥方案,在20块同样面积的土地上,分别用4种不同的种子和5种不同施肥方案搭配进行试验,取得的收获量数据见下表:
品牌 1 2 3 4 1 12.0 13.7 14.3 14.2 2 13.0 9.5 11.5 12.3 施肥方案 3 10.4 12.4 11.3 12.5 4 9.7 9.6 11.1 12.0 5 11.4 12.5 10.9 9.8 要求:检验种子的不同品种对收获量的影响是否有显著差异?不同的施肥量方案对收获量的影响是否有显著差异?(?【解】方差分析表 差异源 行 列 误差 总计
SS 2.0575 19.812 18.98
40.8495
df
MS
F
P-value
F crit 3.490295 3.259167
3 0.685833 0.433614 0.732851 4 4.953 3.131507 0.055759 12 1.581667
19
?0.05)
由于行因素的P-value=0.732851>0.05,说明不能拒绝原假设,表明没有证据证明不同品种的种子对收获量有显著的影响;由于列因素的P-value=0.055759>0.05,说明不能拒绝原假设,表明没有证据证明不同施肥量方案对收获量有显著的影响。
【7.5】某金属材料生产过程中,为提高其强度,需要进行热处理。热处理的温度和时间是影响该材料强度的两个主要因素。现取三个温度水平和四个时间水平,各个不同水平的每一组合都进行了二次试验,测得该材料在各种热处理方式下的强度数据如下表。试分析温度、时间两个因素各自以及两个因素的交互作用对材料强度是否显著地影响。(? B1 温 度 A A2 A1 53 56 71 68 B2 69 71 77 78 时间B B3 63 64 69 70 B4 56 59 58 59 ?0.05)
- 23 -
A3 75 76 72 71 68 66 56 58 【解】方差分析 差异源 样本 列 交互 内部 总计
SS 256.0833 714.7917 313.5833
22.5
1306.958
df
2 3 6 12
MS
F
P-value
F crit
128.0417 68.28889 2.78E-07 3.885294 238.2639 127.0741 2.34E-09 3.490295 52.26389 27.87407 2.24E-06 2.99612 1.875 23
由于行因素的P-value=2.78E-07<0.05,说明拒绝原假设,表明温度因素对材料强度有
显著的影响;由于列因素的P-value=2.34E-09<0.05,说明拒绝原假设,表明时间因素对材料强度有显著的影响;交互作用的P-value=2.24E-06<0.05,说明拒绝原假设,表明温度和时间两个因素的交互作用对材料的强度有显著影响。
第八章 相关分析和回归分析*
【8.1】某店主分析其店面的经营情况时,收集了连续10天的访问量数据(单位:天)和当天营业额数据(单位:元)如下。 编号 1 2 3 4 5 访问量 74 66 88 69 91 营业额 130 100 130 110 160 编号 6 7 8 9 10 访问量 73 66 96 58 73 营业额 90 70 140 50 100 对以上访问量和营业额数据作相关分析。 【解】相关分析
(1)画访问量和营业额数据的散点图,如下所示
图表标题180160140120100806040200020406080100120访问量
从图上可以看出,访问量和营业额数据是简单线性正的不完全相关。 (2)计算相关系数
计算访问量和营业额的简单线性相关系数为0.871508,大于0.8,说明访问量和营业额之间存在较高的线性关系。
【8.2】某饮料广告费投入为x,产品销售数量为y,根据收集2年的月度数据 资料,计算得到以下结果:
- 24 -
?(x?x)i2?6546,?(yi?y)2?5641
x?375,y?498,?(xi?x)(yi?y)?6054
(1)计算相关系数,并初步判断x与y之间的关系; (2)用最小二乘法估计模型回归系数,并写出模型结果; (3)说明所计算的回归系数的经济意义;
(4)计算模型可决系数,并用其说明模型的拟合效果。 【解】最小二乘法的计算(一元)
(1)计算相关系数,并初步判断x与y之间的关系;
计算x与y相关系数为r=0.996268,说明两者的简单线性相关程度非常高,因此可以初步判断x与y呈现线性关系。
(2)用最小二乘法估计模型回归系数,并写出模型结果;
????x,??0.92484,?i??记模型为:y得到?101i将以上结果代入最小二乘法的计算公式,??151.1852。 ?0?i?151.1852?0.92484因此,产品销售数量为y对广告费投入为x的模型为yxi
(3)说明所计算的回归系数的经济意义;
??0.92484表示当广告费投入每增加1个单位,产品销售数量会增加0.92484个单位。 ?1(4)计算模型可决系数,并用其说明模型的拟合效果。
由于模型为一元线性回归模型,根据一元线性回归模型中可决系数为模型因变量和自变
2
2
2
量简单线性相关系数的平方的关系,可得模型的可决系数R=(r)=(0.996268)=0.99255。可决系数接近1,说明模型拟合的非常好。
【8.3】人们的收入期望往往受其教育程度和工作经验的影响,随机抽取了50名25-40岁之间的社会工作人员,收集了他们的月工资(单位:元)、受教育年限(单位:年,从小学开始计算,到最高学历为止,并扣除中间间断的时间)和工作年限(单位:年,按照毕业之后,开始工作时计算起)的数据,进行计算得到方差分析表和参数估计的结果如下所示。
方差分析表 误差来源 回归分析 残差 总计 变量 受教育年限 工作年限 常数项 df 系数 339.57 127.29 1278.78 SS 6703 6745 MS —— F —— —— t统计量 15.29 13.79 55.52 Significance F —— —— —— Prob. 0.0000 0.0000 0.0000 参数估计表 标准误差 22.20 9.23 23.03 要求:
(1)根据参数估计表,说明收入期望与受教育程度和工作经验的关系;
(2)根据参数估计表,说明受教育程度和工作经验对收入期望是否有显著影响; (2)完成以上方差分析表,对模型进行F检验;
- 25 -
(3)计算模型的多重可决系数,并进行修正,说明模型的拟合效果。 【解】最小二乘法的计算(多元)
(1)根据参数估计表,说明收入期望与受教育程度和工作经验的关系;
从参数估计表可以看出,收入期望(y)与受教育程度(x1)和工作经验(x2)模型为:
?i?339.57x1?127.29x2?1278y.78
该模型表示在受教育程度不变时,工作经验每增加1个单位,收入的期望会增加339.57个单位;在工作经验不变时,受教育程度每增加1个单位,收入的期望会增加127.29个单位。
(2)根据参数估计表,说明受教育程度和工作经验对收入期望是否有显著影响;
从参数估计表可以看出,受教育程度和工作经验的t统计量都大于2,说明受教育程度和工作经验对收入期望都是显著的。
(2)完成以上方差分析表,对模型进行F检验;
误差来源 回归分析 残差 总计 df 2 47 49 SS 6703 42 6745 MS 3351.5 0.8936 —— F 3750.488 —— —— Significance F —— —— —— 给定显著性水平??0.05查F统计量的表,F0.05(2,47)?3.195056,从方差分析表可以看出,F为3750.488,远远大于临界值,说明模型通过检验,认为模型整体是显著的,受教育程度和工作经验对收入期望有显著影响。
(3)计算模型的多重可决系数,并进行修正,说明模型的拟合效果。
从方差分析表中看出,模型解释的变差SSR=6703,模型的总变差SST=6745,所以模型的多重可决系数R?2SSR6703?=0.993773。 SST674522根据修正的多重可决系数R?1?(1?R)n?1=0.993508。模型多重可决系数和修
n?k?1正的多重可决系数均接近于1,说明模型拟合效果非常好。
【8.4】国家财政收入来源于国民总收入。分析财政收入如何受国民总收入变化的影响,可以预测国家财政收入的规模,为国家的经济发展作规划。
收集我国1990年到2010年的财政收入和国民总收入数据,如下表所示。 我国1990年到2010年的财政收入和国民总收入数据表 单位:亿元
年份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
国民总收入X 财政收入Y 18718.32 21826.20 26937.28 35260.02 48108.46 59810.53 70142.49 78060.85 83024.28 88479.15 98000.45 2937.10 3149.48 3483.37 4348.95 5218.10 6242.20 7407.99 8651.14 9875.95 11444.08 13395.23 - 26 -
年份 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 —— 国民总收入X 财政收入Y 108068.22 119095.69 135173.98 159586.77 183618.51 215883.95 266411.02 315274.71 341401.48 403259.96 —— 16386.04 18903.64 21715.25 26396.47 31649.29 38760.20 51321.78 61330.35 68518.30 83101.51 —— 资料来源:《中国统计年鉴2011》
试通过建立财政收入对国民总收入的一元线性回归模型来分析财政收入和国民总收入之间的关系。
【解】一元线性回归模型
(1)设定模型:记财政收入为y,国民总收入为x,设定财政收入对国民总收入的一元线性
????x。 ?i??回归模型为y01i(2)使用Excel,根据最小二乘法得到以下估计的结果。
根据以上结果,得到财政收入对国民总收入的一元线性回归模型为
?i??5497y.585828?0.211980373xi
(3)模型检验
根据Excel输出的结果,可以看到模型可决系数为0.991116098,非常接近于1,说明模型拟合很好。
回归系数的t值分别为-6.821029和46.040199,绝对值都超过临界值,说明t检验通过,认为模型自变量对因变量的影响是显著的。
-21
模型的F值为211.6999,对应的p值为5.89*10,小于0.05,说明F检验通过,认为模型整体是显著的。 (4)模型应用
国民总收入X的回归系数为0.211980373,说明当国民总收入每增加1个单位,财政收入会增加0.211980373个单位。
【8.5】消费问题是一个与我们的日常生活密切相关、大众普遍关注的问题。影响消费的因素有很多,主要的有收入和价格两大因素,分析消费受收入和价格影响的关系,是研究消费问题的基础。
现研究某城镇居民耐用品的消费,收集其人均全年耐用消费品支出、人均年可支配收入和耐用消费品价格指数的统计资料如下表所示。
年份 2000 2001 2002 2003
人均耐用消费品支出 Y(元) 137.16 124.56 107.91 102.96 人均年可支配收入 X1(元) 1181.4 1375.7 1501.2 1700.6 - 27 -
耐用消费品价格指数 X2(2000年=100) 115.96 133.35 128.21 124.85 2004 2005 2006 2007 2008 2009 2010 125.24 162.45 217.43 253.42 251.07 285.85 327.26 2026.6 2577.4 3496.2 4283 4838.9 5160.3 5425.1 122.49 129.86 139.52 140.44 139.12 133.35 126.39 利用表中数据,建立该城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型,进行回归分析。并检验人均年可支配收入及耐用消费品价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。 【解】多元线性回归模型
(1)设定模型:设定人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指
????x???x。 ?i??数的二元线性回归模型为y011i22i(2)使用Excel,根据最小二乘法得到以下估计的结果。
根据以上结果,得到人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的二元线性回归模型为
?i?158.5398?0.0494x1i?0.9117x2i y(3)模型t检验
模型自变量X1的t值为10.5479,对应的p值为0.000,小于0.05,说明t检验通过,认为人均年可支配收入对人均全年耐用消费品支出的影响是显著的。
自变量X2的t值为-0.9213,对应的p值为0.3838,大于0.05,说明t检验不通过,认为耐用消费品价格对人均全年耐用消费品支出的影响是不显著的。这与实际是吻合的。 【8.6】经济学家菲利普斯在研究通货膨胀和就业问题时,发现经济体的通膨胀率和失业率往往存在一种交替关系的曲线:通货膨胀率高时,失业率低;通货膨胀率低时,失业率高。这就是著名的“菲利普斯曲线”。
收集了某国物价上涨率P和失业率U的数据如下表所示。 年份 物价上涨率P(%) 失业率U(%) 年份 物价上涨率P(%) 失业率U(%) 1986 1987 1988
0.6 0.1 0.7 2.8 2.8 2.5 1991 1992 1993 - 28 -
3.3 1.6 1.3 2.1 2.2 2.5 1989 1990 2.3 3.1 2.3 2.1 1994 1995 0.7 -0.1 2.9 3.2 根据以上数据,结合实际理论,建立P和U的回归模型,并进行检验分析。 【解】非线性回归模型
(1)画P和U的散点图,如下所示:
P3.532.521.510.500-0.50.511.522.533.5U
结合以上散点图和经济学理论,可以看出,P与U成反向关系。 因此,设定P与U的模型为:P?a?b。 U(2)将U的数据做倒数变换,使用Excel,结合最小二乘法,得到模型的估计结果为:
即P与U的模型为:P?19.13379714?6.3190095
U(3)模型检验
根据Excel输出的结果,可以看到模型可决系数为0.85542,大于0.8,说明模型拟合很好。
回归系数的t值分别为-5.60915和6.879876,对应的P值都小于0.05,说明t检验通过,认为模型自变量对因变量的影响是显著的。
模型的F值为47.33269,对应的p值为0.000127,小于0.05,说明F检验通过,认为模型整体是显著的。
- 29 -
第九章 统计指数
【9.1】某市2008年第一季度社会商品零售额为36200万元,第四季度为35650万元,零售物价下跌0.5%。试计算该市社会商品零售额指数、零售价格指数和零售量指数以及由于零售物价下跌而使居民少支出的金额。 【解】显然,零售额指数Kqp
q? =
?q1p1p0?035650?98.48%;
36200而零售价格指数Kp=100%-0.5%=99.5%;
则零售量指数Kq= Kqp /Kp=98.48%/99.5%=98.98%;
q? 又因K=
1p00p0q??1p036200?98.98%,
所以,
?qp10?36200?98.98%?35829(万元),
从而,由于零售物价下跌而使居民少支出的近额为:
?q0p0??q1p0?36200?35829?317(万元)。
价 格(元) 基 期 p0 1.60 2.00 1.00 2.40 — 报告期 销 售 额(元) 基 期 q0p0 880 440 320 588 2 228 假 定 q1p0 q0p1 960 600 350 480 2 390 990 418 288 735 2 431 报告期 【9.2】某市场上四种蔬菜的销售资料如下:
销 量(公斤) 品种 白菜 土豆 萝卜 番茄 合计 基 期 q0 550 220 320 245 1 335 报告期 q1 600 300 350 200 1 450 p1 1.80 1.90 0.90 3.00 — q1p1 1 080 570 315 600 2 565 (1) 根据综合指数编制规则,将上表所缺空格填齐; (2) 用拉氏公式编制四种蔬菜的销量总指数和价格总指数; (3) 用帕氏公式编制四种蔬菜的销量总指数和价格总指数; (4) 建立适当的指数体系,对蔬菜销售额的变动进行因素分析。 【解】 (2)拉氏: Lq??3?帕氏: Pq?4??qp?2390?107.27% L??qp?2431?109.11%
?qp2228?qp2228?qp?2565?105.51% P??qp?2565?107.32% ??qp2431?qp23901001p000011011p110 建立指数体系:?256523902565??? 222822282390??2565?2228??2390?2228???2565?2390?? - 30 -
?115.12%?107.27%?107.32即 ?
?337?162?175?元?计算表明: 四种蔬菜的销量增长了 7.27%,使销售额增加了 162元;
四种蔬菜的价格上长了 7.32%,使销售额增加了175元;
两因素共同影响,使销售额增长了15.12%, 销售额增加了337元。 结论:
指 数 (%) 增 幅 (%) 增减额 (元) 产品 A B C 计量单位 件 个 公斤 销售额 115.12 15.12 337 出厂价格(元) 基期 8 10 6 报告期 8.5 11 5 基期 13500 11000 4000 销售量 107.27 7.27 162 销售价格 107.32 7.32 175 产量 报告期 15000 10200 4800 【9.3】某厂三种产品的产量情况如下表: 试分析出厂价格和产量的变动对总产值的影响。 【解】第一步:计算三个总产值:
?q0(万元); p0?13500?8?11000?10?4000?6?242000?qp10; ?15000?8?10200?10?4800?6?250800(万元)
?qp11(万元); ?15000?8.5?10200?11?4800?5?263700第二步:建立指标体系
?q1p1?q1p0?q1p1???? ??q0p0?q0p0?q1p0?qp?qp?(qp?qp)?(qp?qp)?11?10??11?00?10?00263700250800263700????即? 242000242000250800?)?(263700?250800)?263700?242000?(250800?242000 - 31 -
?108.97%?103.64%?105.14% ??21700?8800?12900? 第三步:分析结论。计算结果表明:由于出厂价上涨了3.64%,使总产值增加了8800元;由于产量提高了5.14%,使总产值增加了12900元;两因素共同作用,使总产值上升了8.97%,增加了21700元。
【9.4】若给出【9.2】题中四种蔬菜的资料如下:
个体价格指数 品种 白菜 土豆 萝卜 番茄 合计 % 基 期 销 售 额(元) 假 定 报告期 p1p0 112.50 95.00 90.00 125.00 — q0p0 880 440 320 588 2 228 q1p1?p1p0??q1p0 q0p0??p1p0??q0p1 10801.125?960 600 350 480 2 390 880?1.125?990 q1p1 1080 570 315 600 2 565 418 288 735 2 431 (1) 编制四种蔬菜的算术平均指数; (2) 编制四种蔬菜的调和平均指数;
(3) 把它们与上题计算的拉氏指数和帕氏指数进行比较,看看有何种关系?什么条
件下才会有这种关系的呢?
【解】(1)
Aq??k?qp???qp?qp?qpq001000P0000000?2390?107.27"28?2431?109.11% 2228
AP?(2)
?k?qp???qp?qp?qp010 Hq??qp??qp1?k?qp??qp11110q11110111111?2565?105.51% 2390
Hq??qp??qp1?k?qp??qpp?2565?107.32% 2431(3) 算术平均指数的结果与拉氏指数相等——以基期的总值指标为权数。 调和平均指数的结果与帕氏指数相等——以报告期的总值指标为权数。
【9.5】某地区2005年农副产品收购总额为1 360亿元,2006年比上年的收购总额增长了
12%,农副产品价格指数为105%;试考虑:2006年与2005年相比较
- 32 -
(1) 农副产品收购总额增长了百分之几?农民共增加多少收入? (2) 农副产品收购量增加了百分之几?农民增加了多少收入? (3) 由于农副产品收购价格提高了5%,农民又增加了多少收入? (4) 验证以上三者之间有何等关系? 【解】已知:
? ?q0p0?1360 ?亿元? ? ?q1p1qp??12%?100%?112% ?105% ?qp?qp1523.2?1360?112%?1523.2 ?亿元? ?qp?105%?1450.7 ?亿元?
?qp?1450.7?106.67% 有: ?qp1360?qp??qp?1523.2?1360?163.2 ?亿元??qp??qp?1450.7?1360?90.7 ?亿元? ?qp??qp?1523.2?1450.7?72.5 ?亿元?q1p1011010101000110000001111
农民交售农副产品增加收入163.2亿元, 与去年相比增长幅度为12%;
农副产品收购数量增长 6.67%, 农民增加收入 农副产品收购价格上涨 5.00%, 农民增加收入
90.7亿元; 72.5亿元。
?112.00%?106.67%?105.00%显然,有:?
?163.2?90.7?72.5(亿元)可见,分析结论是协调一致的。
【9.6】某公司下属三个生产某种产品的情况如下表:
工厂类别 单位产品成本(元) 上月 一厂 二厂 三厂 960 1010 1120 本月 952 1015 1080 上月 4650 3000 1650 产量(吨) 本月 4930 3200 2000 根据上表数据计算可变构成指数、固定构成指数和结构影响指数,并分析单位成本水平和产量结构变动对总成本的影响。 【解】(一)资料处理:计算五个指标——
?f工厂类别 0?f1?f00x?fx10?fx11:
计算结果见下表最后一行(红色数字):
单位产品 成本(元) 上月x0 本月x1 产量 (吨) 上月f0 本月f1 基期f0 x0 假定f1 x0 报告期f1 x1 总成本(万元) - 33 -
一厂 二厂 三厂 Σ 960 1010 1120 —— 952 1015 1080 —— 4650 3000 1650 9300 4930 3200 2000 10030 446.0 303.0 184.8 933.8 473.28 323.20 224.00 1020.48 469.36 324.80 216.00 1010.16 (二)计算三个指数:
可变构成指数I可变固定构成指数
fx???f111?fx?f000?1010.1610030933.80.1007??1.0030; 93000.1004I固定fx???f111?fx?f110?1010.161020.480.1007??0.9899;
10030100300.1017结构影响指数I结构??fx?f110?fx?f000?1020.48933.80.1017??1.0134
1003093000.10040.10070.10170.1007??I可变?I结构?I固定,即??(三)建立指数体系:?0.10040.10040.1017,
?(0.1017-0.1004)?(0.1007-0.1017)?0.1007-0.1004??1.0030?1.0134?0.9899即:?
0.0003?0.0013?(-0.0010)?(四)分析结论:计算结果表明,由于单位成本水平下降了1.01%(=1-98.99%),使得总成本减少了10元;由于产量结构改变了1.34%(=101.34%-1),使得总成本增加了13元;两个因素共同影响,使总成本上升了0.3%(=1003.0%-1),增加了3元。 【9.7】某企业生产的三种产品的有关资料如下:
产量增长率 产 品 甲 乙 丙 合 计 % q1q0?1 25 40 40 — 产量个体指数 % q1q0 125 140 140 — 基 期 q0p0 20.0 45.0 35.0 100.0 总 成 本(万元) 假 定 q1p0??q0p0??q1q0 25?20?1.25 报告期 q1p1 24.0 48.5 48.0 120.5 63 49 137 (1) 根据上表资料计算相关指标填入上表(见绿色区域数字); (2) 计算产品产量总指数及由于产量增长而增加的总成本; (3) 计算单位成本总指数及由于单位成本变动而增减的总成本。 【解】 建立指数体系:
- 34 -
?120.5137120.5?120.50%?137.00%?87.96%??? ??10010013737???16.5??万元??20.5??????120.5?100?137?100?120.5?137?结论:
指 数 (%) 增 幅 (%) 增减额 (万元) 总 成 本 120.50 20.50 20.5 产品产量 137.00 37.00 37.0 单 位 成 本 87.96 -12.04 -16.5 计算结果表明:由于产量总指数增加了37%(=137%-1),而使总成本增加了37元,由于单位成本总指数下降了12.04%(=87.96%-1),使总成本减少了16.5元。两个因素共同影响使总成本上升了20.5%,增加了20.5元。 【9.8】某商场的销售资料如下:
价格降低率 商品 甲 乙 丙 合计 % 价格个体指数 % 销 售 额(万元) 基 期 q0p0 117 150 187 454 假 定 报告期 q1p1 110 130 160 400 1?p1p0 10 5 15 — p1p0 90 95 85 — q1p0?q1p1?p1p0? 122.22?1100.90 136.84 188.24 447.30 (1) 根据上表资料计算相关指标填入上表(见绿色区域数字); (2) 计算商品销售量总指数及由于销量变化而增减的销售额; (3) 计算商品价格总指数及由于价格变动而增减的销售额。 【解】建立指数体系:
?400447.3400?88.11%?98.52%?89.43%??? ??454454447.3??54??6.7???47.3??万元??????400?454?447.3?454?400?447.3? 指 数 (%) 增 幅 (%) 增减额 (万元) 销 售 额 88.11 ?11.89 销 售 量 98.52 ?1.48 销售价格 89.43 ?10.57 ?54 ?6.7 ?47.3 计算结果表明:由于商品销量总指数下降了1.48%(=1-98.52%),而使销售额减少了6.7万元,由于商品价格总指数下降了10.57%(=1-89.43%),使销售额减少了47.3万元。两个因素共同影响使销售总额下降了11.89%(=1-88.11%),减少了54万元。 【9.9】某城市三个市场上同一商品的有关资料如下: 市场
销售量(公斤) 价 格(元) - 35 -
销 售 额(元) 基 期 f0 A B C 合计 740 670 550 1 960 报告期 f1 560 710 820 2 090 基 期 x0 2.50 2.40 2.20 — 报告期 x1 3.00 2.80 2.40 — 基 期 f0x0 1 850 1 608 1 210 4 668 假 定 f1x0 1 400 1 704 1 804 4 908 报告期 f1x1 1 680 1 988 1 968 5 636 (1) 编制该商品平均价格的可变构成指数、结构影响指数和固定构成指数; (2) 建立指数体系,从相对数的角度进行平均价格变动的因素分析。 (3) 进一步,综合分析销售量变动和价格变动对该商品销售额的影响。
5 636【解】 (1) 因为 x0?4 668?2.38163?2.38 ?元? x1??2.69665?2.70 ?元?
1 9602 0904 908x假??2.34833?2.35 ?元?
2 090 所以,可变构成指数: I可变? 结构影响指数: I结构 固定构成指数: I固定x12.70 ??113.23%;x02.38x2.35 ?假??98.60%;x02.38x2.70?1??114.83% x假2.35(2)指数体系:
2.696652.348332.69665 ?? 113.23%?98.60%?114.83%
2.381632.381632.34833计算表明: 由于商品销售结构的变化,使得其平均价格下降了1.4%(=1-98.60%);由于各商品市场价格水平的变化,使得其平均价格上涨了14.83%(=114.83%-1)
(3)综合分析销售总额的变动影响:
?f1x1f1x1?????因为:? fxf?00?0x0?fx???11?f0x0?(?f1??f0)x0??f1(x1?x0)5 6362 0902.696 65? ? ? ?即 ? 4 6681 9602.381 63???5636?4688??2090?1960??2.38163?2090??2.69665?2.38163即 ??120.74%?106.63%?113.23%
?968.00?309.61?658.39(元) 所以,计算结果表明:由于销售量上升了6.63%(=106.63%-1),使得销售额增加了309.61元;由于价格水平上涨了13.23%(=113.23%-1),使得销售额增加了658.39元;两个因素共同影响,是销售总额上升了20.74%,增加了968元。
【9.10】某乡力图通过推广良种和改善田间耕作管理来提高粮食生产水平,有关生产情况如下表所示:
- 36 -
粮食 品种 A B C 播种面积(亩) 基 期 f0 报告期 f1 亩产(公斤/亩) 基 期 x0 420 395 343 — 报告期 总 产 量(万公斤) 基 期 f0x0 1 596.0 1 817.0 1 234.8 4 647.8 假 定 f1x0 2 898.0 1 659.0 308.7 4 865.7 报告期 f1x1 2 980.8 1 671.6 321.3 4 973.7 x1 432 398 357 — 38 000 69 000 46 000 42 000 36 000 9 000 合计 120 000 120 000 (1) 该乡粮食平均亩产提高了百分之几?由此增产粮食多少吨? (2) 改善田间耕作管理使平均亩产提高多少?增产粮食多少吨? (3) 推广良种使平均亩产提高多少?增产粮食多少吨?
【解】计算的相关数据(f0x0域数字;
从而有:
f1x0f1x1?fx?fx?fx)见上表中绿色区
001011x0??fx?f000?46 748 000?f1x1?49 737 000?417.48 ?公斤亩??387.32 ?公斤亩?x1?120 000?f1120 000
?f1x0?48 657 000?405.48 ?公斤亩?x假??f1120 000?x1x假x1???建立指数体系: ? x0x0x假?x1?x0?(x-x0)?(x1?x)假假?
即
417.48405.48417.48??? ? ?387.32387.32405.48? 000??48 657 000?46 478 000???49 737 000?48 657 000??49 737 000?46 478 107.01%?104.69% ? 102.22%?即 ?
?? 3 259 000?2 179 000?1 080 000 公斤?
分析结论: 计算结果表明
(1)该乡粮食平均亩产提高了7.01%(=107.01%-1),由此增产粮食3 259吨; (2)由于改善田间管理,使平均亩产提高了4.69%,粮食增产2 179吨; (3)由于推广优良品种,使平均亩产提高了2.22%,粮食增产1 080吨。
第十章 时间序列分析
【10.1】某公司2009年末有职工250人,10月上旬的人数变动情况是:10月4日新招聘
12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年职工应征入伍,同日又有3名职工辞职离岗,9日招聘7名销售人员上岗。试计算该公司10月上旬的平均在岗人数。 【解】
- 37 -
fx?x??fiii250?3?(250?12)?2?(262?4)?2?(262?4?3?3)?1?(262?4?3?3?7)?23?2?2?1?2750?524?516?252?5182560???256(人)1010?答:该公司10月上旬的平均在岗人数为256人。
【10.2】某银行2009年部分月份的现金库存额资料如下: 日期 库存额(万元) 1月1日 2月1日 3月1日 4月1日 5月1日 6月1日 7月1日 500 480 450 520 550 600 580 要求:(1)该时间序列属于哪一种时间序列?.
(2)分别计算该银行该年第一、二季度和上半年的平均现金库存额。 【解】(1) 该时间序列属于动态时点时间序列; (2) 第一季度平均现金库存额:
x1x500520?x2?x3?4?480?450?2?22?1440?480(万元); x?24?133第二季度平均现金库存额:
x4x520580?x2?x3?7?550?600?2?22?1700?567(万元); x?24?133上半年平均现金库存额:
x1x500580?x2?...?7?480?450?520?550?600?2?22?3140?523(万元)x?27?166【10.3】某企业08年上半年的产量和单位成本资料如下: 月份 产量(件) 单位成本(元) 【解】
1 2000 73 2 3000 72 3 4000 71 4 3000 73 5 4000 69 6 5000 68 试计算该企业08年上半年的产品平均单位成本。
fx?x??fiii2000?73?3000?72?4000?71?3000?73?4000?69?5000?68
2000?3000?4000?3000?4000?5000146000?216000?284000?219000?276000?3400001481000???70.5(元)2100021000?答:该企业08年上半年的产品平均单位成本为70.5元。
【10.4】某企业有关资料如下,计算该企业一季度人均月销售额。
月 份
一 - 38 -
二 三 四 销售额(万元) 月初职工数(人) 100 100 150 120 120 110 140 116 【解】 该企业一季度月平均销售额:
a?a1?a2?a3100?150?120??123.33(万元);
33该企业一季度月平均职工人数:
b1b100116?b2?b3?4?120?110?2?22?113(人); b?233a123.33??1.091(万元/人)。 该企业一季度人均月销售额:c?113b【10.5】填写下表,保留到整数: 年 份 2001 2002 2003 2004 2005 2006 产 量 (万吨) 7 142 累积增长量 定基发展速度 (万吨) (%) — 3 528 — 环比发展速度 (%) — 增长1%绝对值 (百吨) — 10770?1? 12985?2? 13669?3? 14527?4? 15428?4? 150.80?8? 181.81 150.80?12? 120.57?13? 105.27 106.28 7142?15? 10770?16? 5843?5? 6527?6? 7385?7? 8 286 191.37?9? 203.40?10? 216.02?11? 12958?17? 13669?18? 14527?19? 106.20?14? 【解】根据已知数据条件,分别利用累积增长量、定基发展速度、环比发展速度和增长1%绝对值等计算公式计算相应数据填写上表(见表中绿色区域数字) 【10.6】某市2001~2005年的地区生产总值如下表:
年 份 GDP(亿元) 2001 993 2002 1 123 2003 1 270 2004 1 437 2005 1626 (1) 按平均发展速度估计2002~2004年的地区生产总值。 (2) 按此5年的平均发展速度预测2008年和2010年的GDP。
【解】(1)2002~2006年泉州市地区生产总值的平均发展速度为:
v?41626?113.12%; 9932按平均发展速度估计2002~2004年的地区生产总值分别为:
993?113.12%?1123993?(113.12%)?1270993?(113.12%)?114373 (将计算结果填入上表绿色区域内);
(2)按此5年的平均发展速度预测2008年和2010年的GDP分别为:
2008年地区GDP预测值?1626?1.1312?2354(亿元); 2010年地区GDP预测值?1626?1.1312?3011.7(亿元)。
- 39 -
53【10.7】我国某地区2001年~ 2006年税收总额如下:
年 份 税收收入(亿元) 试计算:
(1)环比发展速度和定基发展速度; (2)环比增长速度和定基增长速度; (3)增长1%绝对值;
(4)用水平法计算平均增长速度;
(5)分析表中所列资料反映的趋势特征,拟配合适的趋势模型,并预测2007年该地区的税收收入。
【解】(1)~(3)相关计算结果填入下表(见绿色区域数字):
年 份 税收收入(亿元) 发展速度 环 比 (%) 定 基 增长速度 环 比 (%) 定 基 增长1%的绝对值 (百万元) 2001 2 821 — — — — — 2002 2 990 105.99 105.99 5.99 5.99 2 821 2003 3 296 110.23 116.84 10.23 16.84 2 990 2004 4 255 129.10 150.83 29.10 50.83 3 296 2005 5 126 120.47 180.71 20.47 80.71 4 255 2006 6 038 117.79 214.04 17.79 114.02 5 126 2001 2821 2002 2990 2003 3296 2004 4255 2005 5126 2006 6038 (4) 用水平法计算平均发展速度和平均增长速度:
平均发展速度v?560385?2.1404?1.1644?116.44%; 2821则平均增长速度?v?1?116.44%?1?16.44%;
(5)分析表中所列资料反映的趋势特征,拟配合适的趋势模型,并预测2007年该地区的税收收入。 年份 2001 2002 2003 2004 2005 2006 合计 时 间 税收收入 yc 2412.5 3082.6 3752.7 4422.7 5092.8 5762.9 24526 t -5 -3 -1 1 3 5 0 y 2 821 2 990 3 296 4 255 5 126 6 038 24 526 t 25 9 1 1 9 25 70 2t?y -14 105 -8 970 -3 296 4 255 15 378 30 190 23 452 ?y —— 196 306 959 971 912 —— 根据上表时间数列的各项数据计算其逐期增长量Δу,由于从04年开始Δу基本在910至970亿元之间波动,因此,其发展趋势是直线型,故应建立直线趋势方程式。
采用简捷法求解a、b参数,将表中相关数据代入计算公式计算得:
- 40 -
a??y?24526?4087.7 ;b??ty?23452?335.03
70n6?t2得趋势直线方程:yc?4087.7?335.03t。
该方程反映了该地区2001——2006年税收收入的发展趋势。依次将表中的年序号t值代入上述方程,可求得各年的趋势值yc(见表中最后一列数字) 所以,2007年该地区税收收入的预测值为:
y2007?4087。 .7?335.03?7?4087.7?2345.2?6432.9(亿元)由上表可以看出,各年税收收入实际值(y)总和与趋势值(yc)总和是相等的。
即:
?y??yc。
- 41 -