统计学导论第二版习题详解(1) 下载本文

统计学导论(第二版)习题详解

第一章

一、判断题

一、 判断题

1.统计学是数学的一个分支。

答:错。统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。。从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法,而统计的方法,本质上是归纳的方法。统计学家特别是应用统计学家则需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识,才能得到有意义的成果。从成果评价标准看,数学注意方法推导的严谨性和正确性。统计学则更加注意方法的适用性和可操作性。

2.统计学是一门独立的社会科学。

答:错。统计学是跨社会科学领域和自然科学领域的多学科性的科学。 3. 统计学是一门实质性科学。

答:错。实质性的科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供数量分析的方法。 4.统计学是一门方法论科学。

答:对。统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以帮助人们正确认识客观世界数量规律的方法论科学。

5.描述统计是用文字和图表对客观世界进行描述。

答:错。描述统计是对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用信息。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。

6.对于有限总体不必应用推断统计方法。

答:错。一些有限总体,由于各种原因,并不一定都能采用全面调查的方法。例如,某一批电视机是有限总体,要检验其显像管的寿命。不可能每一台都去进行观察和实验,只能应用抽样调查方法。

7.经济社会统计问题都属于有限总体的问题。

答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。

8. 理论统计学与应用统计学是两类性质不同的统计学。

答:对。理论统计具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科有着非常密切

1

的联系,具有复合型学科和边缘学科的性质。 二、单项选择题

1.社会经济统计学的研究对象是( A )。 A.社会经济现象的数量方面 B.统计工作 C.社会经济的内在规律 D.统计方法

2.考察全国的工业企业的情况时,以下标志中属于不变标志的有( A )。 A.产业分类 B.职工人数 C.劳动生产率 D.所有制 3.要考察全国居民的人均住房面积,其统计总体是(A )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户

4.最早使用统计学这一学术用语的是( B)。

A.政治算术学派 B.国势学派 C.社会统计学派 D.数理统计学派 三、分析问答题

1.试分析以下几种统计数据所采用的计量尺度属于何种计量尺度:人口、民族、信教人数、进出口总额、经济增长率。

答:定类尺度的数学特征是“=”或“?”,所以只可用来分类,民族就是定类尺度数据,它可以区分为汉、藏、回等民族。定序尺度的数学特征是“>”或“<”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度属于定序尺度。定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,所以,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“?”或“?”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。

2.请举一个实例说明品质标志、数量标志、质量指标、数量指标之间有怎样的区别与联系。 答:例如考察全国人口的情况,全国所有的人为统计总体,而每个人就是总体单位,每个人都有许多属性和特征,比如民族、性别、文化程度、年龄、身高、体重等,这些就是标志,标志可以分为品质标志和数量标志,性别、民族和文化程度都是品质标志,年龄、身高、体重等则是数量标志;而指标是说明统计总体数量特征的,用以说明全国人口的规模如人口总数等指标就是数量指标,而用以说明全国人口某一方面相对水平的相对量指标和平均量指标如死亡率、出生率等指标就是质量指标,质量指标通常是在数量指标的派生指标。

3.请举一个实例说明统计总体、样本、单位的含义,并说明三者之间的联系。

答:例如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。

2

第二章

一、单项选择题

1. 统计调查对象是(C)。

A. 总体各单位标志值 B. 总体单位 C. 现象总体 D. 统计指标 2. 我国统计调查体系中,作为“主体”的是(A)。

A. 经常性抽样调查 B. 必要的统计报表 C. 重点调查及估计推算等 D. 周期性普查

3. 要对某企业的生产设备的实际生产能力进行调查,则该企业的“生产设备”是(A)。 A. 调查对象 B. 调查单位 C. 调查项目 D. 报告单位

二、多项选择题

1. 下面哪些现象适宜采用非全面调查? (A.B.C.D)

A. 企业经营管理中出现的新问题 B. 某型号日光灯耐用时数检查 C. 平均预期寿命 D. 某地区森林的木材积蓄量 2. 抽样调查(A.D)。

A. 是一种非全面调查 B. 是一种不连续性的调查 C. 可以消除抽样误差 D. 概率抽样应遵循随机原则 3. 洛伦茨曲线(A.B.C)。

A. 是一种累计曲线 B. 可用于反映财富分布的曲线 C. 用以衡量收入分配公平与否 D. 越接近对角线基尼系数越大

三、分析判断题

1. 有人说抽样调查“以样本资料推断总体数量特征”肯定比全面调查的误差大,你认为呢? 答:这种说法不对。

从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差。无论是全面调查还是抽样调查都会存在登记误差。而代表性误差和推算误差则是抽样调查所固有的。这样,从表面来看,似乎全面调查的准确性一定会高于统计估算。但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和规范化的场合,后者的误差也有可能小于前者。我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很有说服力的事例。

2. 过去统计报表在我国统计调查体系中占据统治地位多年,为什么现在要缩小其使用范围? 答:经济体制改革以前,统计报表制度是我国统计调查最主要的方式,它在我国统计调查体系中占据统治

3

地位多年。近年来,随着社会主义市场经济的发展,统计调查单位变动频繁,再加上决策主体和利益主体的多层次化,各方面对统计报表数字真实性的干扰明显增加,从而不仅给报表调查带来不少困难,同时也影响了统计数据的准确性,统计报表的局限性日渐暴露。所以,为适应社会主义市场经济日新月异发展变化的需要,提高统计数据的准确性和时效性,现行的统计调查体系以抽样调查为主体,也就缩小了统计报表制度的使用范围。

3. 对足球赛观众按男、女、老、少分为四组以分析观众的结构,这种分组方法合适吗?

答:这种分组方法不合适。统计分组应该遵循“互斥性原则”,本题所示的分组方式违反了“互斥性原则”,例如,一观众是少女,若按以上分组,她既可被分在女组,又可被分在少组。

4. 以一实例说明统计分组应遵循的原则。

答:统计分组必须遵循两个原则:穷尽原则和互斥原则。穷尽原则要求总体中的每一个单位都应有组可归,互斥原则要求总体中的任何一个单位只能归属于某一组,而不能同时归属于几个组。

例如,把从业人员按文化程度分组,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么,文盲或识字不多的以及大学以上的学历者则无组可归,这就不符合穷尽原则。应该分为文盲或识字不多、小学毕业、中学毕业(含中专)和大专、大学以及研究生毕业四组,才符合穷尽原则。

又如,商场把鞋子分为男鞋、女鞋和童鞋,这就不符合互斥原则,因为童鞋也有男、女鞋之分,一双女童鞋既可归属于童鞋组,又可属于女鞋。可以先按男鞋、女鞋分组,再分别对男鞋、女鞋分为成人鞋和童鞋,形成复合分组,这才符合互斥原则。

四、计算题

抽样调查某地区50户居民的月人均可支配收入(单位:元)数据资料如下:

886

928

999 978 954 800 895

946 816 890 938 967

950

864

1050 927 1040 854 900 863 821

999 981 924

949

852

1027 928 866 893 946

要求:(可利用Excel)

905 900 926

1000 918 1006 926 864 921

919 978

1100 900 886 916 651

1120 818 850

(1)试根据上述资料编制次(频)数分布和频率分布数列。 (2)编制向上和向下累计频数、频率数列。

(3)绘制直方图、折线图、曲线图和向上、向下累计图。 (4)根据图形说明居民月人均可支配收入分布的特征。

解:(1)编制次(频)数分布和频率分布数列。

4

次数分布表

居民户月消费品支出额(元) 800以下 800~850 8509~00 900~950 950~1 000 1 000~1 050 1 050~1 100 1 100以上 合计

(2)编制向上和向下累计频数、频率数列。

(3)绘制直方图、折线图、曲线图和向上、向下累计图。 主要操作步骤:

①次数和频率分布数列输入到Excel。

②选定分布数列所在区域,并进入图表向导,在向导第1步中选定“簇状柱形图”类型,单击“完成”,即可绘制出次数和频率的柱形图。

③将频率柱形图绘制在次坐标轴上,并将其改成折线图。

主要操作步骤:在“直方图和折线图”基础上,将频率折线图改为“平滑线散点图”即可。 主要操作步骤:

①将下表数据输入到Excel。

组限 750 800 850 900 950 1000 向上累计 0 1 5 17 35 43 向下累计 50 49 45 33 15 7 次(频)数 1 4 12 18 8 4 1 2 50 频率(%) 2 8 24 36 16 8 2 4 100.00 5

1050 1100 1150

47 48 50 3 2 0 ②选定所输入的数据,并进入图表向导,在向导第1步中选定“无数据点平滑线散点图”类型,单击“完成”,即可绘制出累计曲线图。

(4)曲线图说明居民月人均可支配收入分布呈钟型分布。

五、案例分析

收集有关统计数据,对我国近年来居民收入分配的状况进行统计分析。 答:略

第三章

一、 单项选择题

1. 由变量数列计算加权算术平均数时,直接体现权数的实质的是( D )。 A 总体单位数的多少 B 各组单位数的多少 C各组变量值的大小 D各组频率的大小

2. 若你正在筹划一次聚会,想知道该准备多少瓶饮料,你最希望得到所有客人需要饮料数量的( A )。 A 均值 B中位数 C众数 D四分位数

3.2004年某地区甲、乙两类职工的月平均收入分别为1060和3350元,标准差分别为230和680元,则职工平均收入的代表性( B )。 A甲类较大 B 乙类较大

6

C两类相同 D 在两类之间缺乏可比性

4.假如学生测验成绩记录为优、良、及格和不及格,为了说明全班同学测验成绩的水平高低,其集中趋势的测度( B )。

A可以采用算术平均数 B 可以采用众数或中位数 C只能采用众数 D 只能采用四分位数

5.一组数据呈微偏分布,且知其均值为510,中位数为516,则可推算众数为( A )。 A 528 B 526 C 513 D 512 6.当分布曲线的峰度系数小于0时,该分布曲线称为( C )。 A 正态曲线 B尖顶曲线 C平顶曲线 D. U型曲线

二、判断分析题

1.有人调查了456位足球运动员某年的收入,发现他们的年收入以24.7万元为分布中心,但超过24.7万元的只有121人。试问,这里的24.7万元指的是哪一种集中趋势指标?你认为球员收入分布呈什么形状?为什么?

答:均值。呈右偏分布。由于存在极大值,使均值高于中位数和众数,而只有较少的数据高于均值。 2.任意一个变量数列都可以计算其算术平均数、中位数和众数,并用以衡量变量的集中趋势吗? 答:不是。每个变量数列都可以计算其算术平均数和中位数,但众数的计算和应用是有前提条件的,存在极端值时,用算术平均数测度数据的集中趋势也有局限性。

3.设一组数据的均值为100,标准差系数为10%,四阶中心矩为34800,是否可认为该组数据的分布为正态分布?

答:峰度系数K?m4?4?3?34800?3?0.48,属于尖顶分布。 4(100?10%)4.某段时间内三类股票投资基金的年平均收益和标准差数据如下表:

股票类别 A B C 平均收益率(%) 5.63 6.94 8.23 标准差(%) 2.71 4.65 9.07 根据上表中平均收益和标准差的信息可以得出什么结论?假如你是一个稳健型的投资者,你倾向于购买哪一类投资基金?为什么?

答:高收益往往伴随着高风险。稳健型的投资者应倾向于购买A类投资基金,因为其标准差最小,也就是风险最小。

5.一般说来,一个城市的住房价格是高度偏态分布的,为了了解房屋价格变化的走势,应该选择住房价格的平均数还是中位数?如果为了确定交易税率,估计相应税收总额,又应该做何种选择?

7

答:为了了解房屋价格变化的走势,宜选择住房价格的中位数来观察,因为均值受极端值影响;如果为了确定交易税率,估计相应税收总额,应利用均值,因为均值才能推算总体有关的总量。

6.某企业员工的月薪在1000到4000元之间。现董事会决定给企业全体员工加薪。如果给每个员工增加200元,则:

(1)全体员工薪金的均值、中位数和众数将分别增加多少?

(2)用极差、四分位差、平均差和方差、标准差分别来衡量员工薪金的差异程度,加薪前后各个变异指标的数值会有什么变化?

(3)加薪前后员工薪金分布的偏度和峰度会有无变化?

(4)如果每个员工加薪的幅度是各自薪金的5%,则上述三个问题的答案又有什么不同?

答:(1)都是增加200元。(2)都不变。(3)均无变化。

(4)如果每个员工加薪的幅度是各自薪金的5%,则均值、中位数和众数都将增加5%;极差、四分位差、平均差和标准差也会相应增加5%,方差将增加10.25%;偏度和峰度都不变。

三、计算题

1.某公司下属两个企业生产同一种产品,其产量和成本资料如下:

基期 单位成本(元) 产量(吨) 甲企业 乙企业 600 700 1200 1800 单位成本(元) 产量(吨) 600 700 2400 1600 报告期 试分别计算报告期和基期该公司生产这种产品的总平均成本,并从上述数据说明总平均成本变化的原因。

解:基期总平均成本=

600?1200?700?1800=660

1200?1800600?2400?700?1600报告期总平均成本==640

2400?1600总平均成本下降的原因是该公司产品的生产结构发生了变化,即成本较低的甲企业产量占比上升而成本较高的乙企业产量占比相应下降所致。

2.设某校某专业的学生分为甲、乙两个班,各班学生的数学成绩如下: 甲60,79,48,76,67,58,65,78,64,75,76,78,84,48,25,90,98,70,77,78,68,74,95,85,68,80,92, 班 88,73,65,72,74,99,69,72,74,85,67,33,94,57,60,61,78,83,66,77,82,94,55,76,75,80,61 乙91,74,62,72,90,94,76,83,92,85,94,83,77,82,84,60,60,51,60,78,78,80,70,93,84,81,81,82, 班 85,78,80,72,64,41,75,78,61,42,53,92,75,81,81,62,88,79,98,95,60,71,99,53,54,90,60,93 要求:(1)分别计算描述两个班成绩分布特征的各种统计指标,并进行比较分析;(2) 分别绘制两个班成绩分布的箱线图。

解:利用EXCEL的“描述统计”可得两个班及全体学生的成绩分布特征的各种统计指标如下表(注:其中方差、标准差、峰度和偏度都是样本统计量)。

8

平均 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数 甲班 72.704 74.5 78 14.681 215.53 1.6636 -0.83 74 25 99 3926 54 乙班 76.018 78.5 60 14.257 203.25 -0.305 -0.59 58 41 99 4257 56 全部 74.391 76.5 78 14.496 210.13 0.685 -0.699 74 25 99 8183 110 3. 根据第2小题的数据,试求该专业全部学生的总平均成绩和方差,并利用本题数据验证:分组条件下,总体平均数与各组平均数的关系,以及总体方差与各组方差、组间方差的关系。 n解:根据总体方差的计算公式?2?i?12(xi?x)?n可得:

11423.259311178.9821?211.5418;?2乙??199.6247

545622904.1932全部学生成绩的方差?全部??208.2199

k1102??ini211.5418?54?199.6247?56?2?i?1k??205.4749 k1102ix)nni(72.7037?74.3909)2?54?(76.0179?74.3909)2?56?(xi?i??12=2.745 ???i?1k110?n?2甲?B总体方差(208.2199)=组内方差平均数(205.4749)+组间方差(2.745)

4. 根据第2小题的数据,分别编制两个班成绩的组距数列(组距为10),然后由组距数列计算反映数据分布特征的各个指标,并观察与第2题所得到的计算结果是否相同?为什么?

解:两个班成绩的组距数列如下表所示:

成绩 40以下 40-50 50-60 60-70 70-80 80-90 90以上 甲班人数(人) 乙班人数(人) 2 2 3 13 19 8 7 0 2 4 9 14 15 12 i?1i 9

合计 54 56 由上述组距数列计算的主要分布特征指标如下表所示:

甲班 乙班 平均成绩 72.963 77.857 方差 207.614 186.895 标准差 14.409 13.671 与第2题所得到的两个班的平均数都不相同,这是因为由组距数列计算时,用组中值代替组平均数,假定组内变量值均匀分布或对称分布,与实际分布情况有出入,所以计算结果是近似值。方差和标准差也与第2~3题所得到的计算结果不相同,这主要是因为由组距数列计算时,用组中值代替组内各变量值,忽略了组内差异,只考虑了组间差异;此外第2题利用EXCEL的“描述统计”得到的方差、标准差是样本统计量,与总体方差、标准差的计算公式有差异。

5.某商贸公司从产地收购一批水果,分等级的收购价格和收购金额如下表,试求这批水果的平均收购价格。

收购单价 水果等级 甲 乙 丙 合计 解: X?(元/千克) 2.00 1.60 1.30 收购额(元) 12700 16640 8320 37660 12700?16640?8320 ?1.6268(元)k(Xf)12700166408320ii???2.001.601.30i?1Xi6.某中学校正在准备给一年级新生定制校服。男生校服分小号、中号和大号三种规格,分别适合于身

i?1收购总额?收购总量?(Xifi)k—— ?高在160 cm以下、160~168cm之间和168cm以上的男生。已知一年级新生中有1200名男生,估计他们身高的平均数为164cm,标准差为4cm。试由此粗略估算三种规格男生校服应该分别准备多少套(按每人1套计算)?

解:身高分布通常为钟形分布,按经验法则近似估计结果如下:

规格 小号 中号 大号 合计

7.平均数和方差一般只能对数值型变量进行计算。但若将是非变量(也称为是非标志)的两种情况分别用1和0来表示,则对是非变量也可以计算其平均数和对应的方差、标准差。试写出有关计算公式。

身高 160以下 160-168 168以上 —— 分布范围 均值±1*标准差 —— 比重 数量(套) 0.1585 190.2≈190 0.6830 819.6≈820 0.1585 190.2≈190 1.0000 1200 10

解:用1代表“是”(即具有某种特征),0代表“非”(即不具有某种特征)。设总次数为N,1出现次数为N1,频率(N1/N)记为P。由加权公式来不难得出:是非变量的均值=P;方差=P(1-P);标准差=

P(1?P)。

11

第五章

一、选择题(可选多项)

1.以下属于概率抽样的有( B、C )。

A.网民自由参加的网上调查 B.体育彩票摇奖 C.按随机原则组织的农产量调查 D.街头随意的采访

2.样本统计量的标准差与抽样极限误差间的关系是(D )。 A.样本统计量的标准差大于极限误差 B.样本统计量的标准差等于极限误差 C.样本统计量的标准差小于极限误差

D.样本统计量的标准差可能大于、等于或小于极限误差

3.在其它条件不变的情况下,如果重复抽样的极限误差缩小为原来的二分之一,则样本容量( A )。 A.扩大为原来的4倍 B. 扩大为原来的2倍 C.缩小为原来的二分之一 D. 缩小为原来的四分之一

4.当样本单位数充分大时,样本估计量充分地靠近总体指标的可能性趋于1,称为抽样估计的( B )。 A.无偏性 B.一致性 C.有效性 D.充分性 5.抽样估计的误差( A、C )。

A.是不可避免要产生的 B.是可以通过改进调查方法消除的 C.是可以事先计算的 D.只有调查结束之后才能计算

二、计算题

1.根据长期实验,飞机的最大飞行速度服从正态分布。现对某新型飞机进行了15次试飞,测得各次试飞时的最大飞行速度(米/秒)为:

422.2 417.2 425.6 425.8 423.1 418.7 428.2 438.3 434.0 412.3 431.5 413.5 441.3 423.0 420.3

试对该飞机最大飞行速度的数学期望值进行区间估计(置信概率0.95)。 解:

样本平均数

X=425

S8.488SX=?2.1916 =15n(15?1)t0.05/2?2.1448 S=2.1448×2.1916=4.7005 ?==t?/2(n-1)n12

所求μ的置信区间为:425-4.7005<μ<425+4.7005,即(420.2995,429.7005)。

2.自动车床加工某种零件,零件的长度服从正态分布。现在加工过程中抽取16件,测得长度值(单位:毫米)为:

12.14 12.12 12.01 12.28 12.09 12.16 12.03 12.01 12.06 12.13 12.07 12.11 12.08 12.01 12.03 12.06 试对该车床加工该种零件长度值的数学期望进行区间估计(置信概率0.95)。 解:因为零件长度服从正态分布, 95%置信区间为:

SS??t?/2?n?1?,X?t?/2?n?1?? ?X?nn??其中 X?12.08687, s?0.07068416,n?1?15,t0.025?15??2.1315

0.070684160.07068416???2.1315,12.08687??2.1315? 即:?12.08687?44????12.04913,12.12454?

3.用同样方式掷某骰子600次,各种点数出现频数如下: 点 数 1 出现频数 60 2 100 3 150 4 80 5 90 6 120 合 计 600 试对一次投掷中发生1点的概率进行区间估计(置信概率0.95)。 解:

n=600,p=0.1,n P=60≥5,可以认为n充分大,α=0.05,z?0.1?0.9?0.0122 ??1.96600因此,一次投掷中发生1点的概率的置信区间为

2?z0.025?1.96。

0.1-0.0122

4.若在5.2题中,零件长度的技术标准为12.10毫米,公差范围规定为12.10±0.05毫米。试根据样本数据对该车床加工该种零件发生长度不合格的概率进行区间估计(置信概率0.95)。 解:

222H0:?2??0, H1:???0

标准差的2倍=0.05, 标准差为0.025,16个数据的样本方差是var(X)= 0.00499625 在H02:?2??0下

2?n?1?S~?2?n?1? ?2?215*var(X)/(0.025^2)= 119.91,落在95%置信区间(6.26,27.49)之外。 拒绝零假设。

?0 13

5.某微波炉生产厂家想要了解微波炉进入居民家庭生活的深度。他们从某地区已购买了微波炉的2200个居民户中用简单随机不还原抽样方法以户为单位抽取了30户,询问每户一个月中使用微波炉的时间。调查结果依次为(分钟):

300 520 750 580 360

450 600 550 650 370

900 340 20 430 560

50 280 1100 460 610

700 380 440 450 710

400 800 460 400 200

试估计该地区已购买了微波炉的居民户平均一户一个月使用微波炉的时间。 解:

根据已知条件可以计算得:

估计量

?y?14820 ?yii?1i?1nn2i?8858600

估计量的估计方差

11n??y??yi=*14820= 494(分钟)

ni?13030s2n11537520v(?)?v(y)?(1?)=*)=1743.1653 *(1?2nnnN29220030?211?22?? 其中 s?yi-y?y-ny??i??n1-1i?1n-1?i?12?*8858600?30*494 =

30?11537520????=

29

6. 某大学有本科学生4000名,从中用简单随机抽样方法抽出80人,询问各人是否有上因特网经历。调查结果为,其中有8人无此经历。试估计全校本科学生中无上网经历的学生所占比率。

解: ①计算样本数据

n=80 a=8 p= a / n =8 / 80=0.1

②估计量

??p?0.1 P③估计量的估计方差

v?p??

p(1?p)?n?0.1?0.9?80??1????1???0.001116

n?1?N?80?1?4000?7. 某中学老师想要考察该校学生英语考试成绩的离散程度,先随机抽取了41位考生,并求出它们成绩的标准差S=12.设全校学生英语成绩服从正态分布。试根据上述资料,对全校学生英语考试成绩的离散程度即总体方差进行置信度为95%的区间估计。

解:

2(40)2(40)?0.975?24.433,?0.025?59.342,置信度为0.95的置信区间为:

14

?(n?1)S2(n?1)S2??40?12240?122?,?= ?,??(97.064,235.747) ??2?2?n?1??21??2?n?1??????59.34224.433?8.某城市有非农业居民210万户,从中用简单随机抽样方法抽取出623户调查他们住宅装修的意向。调查结果表明,其中有350户已经装修完毕,近期不再有新的装修意向;有78户未装修也不打算装修;其余的有近期装修的意向。试估计该城市非农业居民中打算在近期进行住宅装修的居民户数。

解:

①计算样本数据

n=623 a=623-350-78=195 p= a / n =8195/ 623=0.3130

②估计量

??Np?2100000?0.3130?657303(户) A③估计量的估计方差

n?623?20.3130?(1?0.3130)???N2p(1?p)?vA?1???2100000??1???1524124413 n?1?N?623?1?2100000?9.一个市场分析人员想了解某一地区看过某一电视广告的家庭所占的比率。该地区共有居民1500户,分析人员希望以95%的置信度对总体比率进行估计,并要求估计的误差不超过5个百分点。另外,根据先前所做的一个调查,有25%的家庭看过该广告。试根据上述资料,计算要进行总体比率的区间估计,应当抽取的样本单位数。

解:

??1500?1.962?0.25?(1?0.25) n??2222N?P?z?P?1?P?1500?0.05?1.96?0.25?(1?0.25) ?241.695 22Nz?2P?1?P?应抽取242户进行调查。

第六章

一、单项选择题

某种电子元件的使用者要求,一批元件的废品率不能超过2‰,否则拒收。 1.使用者在决定是否接收而进行抽样检验时,提出的原假设是( B )。 A.H0:P≥2‰ B.H0:P≤2‰

C.H0:P=2‰ D.其他

2.对上述检验问题,标准正态检验统计量的取值区域分成拒绝域和接受域两部分。拒绝域位于接受域之( B )。

A.左侧 B.右侧

C.两侧 D.前三种可能性都存在

3.在上述检验中,0.05显著性水平对应的标准正态分布临界值是( A )。 A.1.645 B. ±1.96

15

C. -1.645 D. ±1.645

4.若算得检验统计量的样本值为1.50,电子元件的实际废品率是3.5‰,则会出现( D )。 A.接受了正确的假设 B.拒绝了错误的假设 C.弃真错误 D.取伪错误

5.使用者偏重于担心出现取伪错误而造成的损失。那么他宁可把显著性水平定得(A )。 A.大 B.小

C.大或小都可以 D. 先决条件不足,无法决定 二、问答题

1.某县要了解该县小学六年级学生语文理解程度是否达到及格水平(60分)。为此,从全体六年级学生中用简单随机放还抽样方法抽取了400人进行测试,得到平均成绩61.6分,标准差14.4分。要根据样本数据对总体参数的论断值(语文理解程度的期望值60分)作显著性检验,显著水平先后按α=0.05和

α=0.01考虑。请就上面的工作任务回答下列问题:

(1)指出由样本数据观测到何种差异; (2)指出出现这种差异的两种可能的原因;

(3)针对这两种可能的原因提出相应的两种假设(原假设和备择假设),指出所提出的假设对应着单侧检验还是双侧检验,说明为什么要用单侧检验或者双侧检验;

(4)仿照式(6.7)构造检验统计量(如在那里说明过的:这个检验统计量服从t–分布。不过,由于我们在这里所使用的是一个400人的足够大的样本,因而可以用标准正态分布作为t–分布的近似); (5)计算检验统计量的样本值;

(6)根据上述样本值查表确定观测到的显著性水平;

(7)用观测到的显著性水平与检验所用的显著性水平标准比较(注意:如果是单侧检验,这个标准用?值,如果是双侧检验,这个标准用?/2值),并说明,通过比较,你是否认为得到了足以反对“观测到的差异纯属机会变异”这一论断(或是足以反对原假设)的足够的证据?为什么?

(8)根据提出的显著性水平建立检验规则,然后用检验统计量的样本值与检验规则比较,重新回答上条的问题;

(9)根据上面所做的工作,针对本题的研究任务给出结论性的表述。 答:

(1)由样本数据观察到的差异

样本平均数61.6分,不同于对总体平均值的猜想(60分)。 (2)出现这种差异的两种可能的原因

第一种可能:总体平均值的确为60分,样本平均数与60分的差异纯属于抽样所产生的机会变异。 第二种可能:总体平均值不是60分,样本平均数与60分的差异反映了总体平均值不同于60分的这种真实存在的差异。

16

(3)建立假设

①若想了解学生的语文理解程度是否为60分(后来通知学生改为这样写)

H0:??60 等价于真实情况为第一种情况

H1:??60 等价于真实情况为第二种情况

上述一组假设对应着双尾检验。

用双尾检验的理由是:我们所关心的仅仅是,?是否等于60(将?=60设为原假设)。若检验统计量的样本值落在检验统计量的概率分布曲线的左尾部(这意味着?<60)或右尾部(这意味着?>60),都属于我们所关心的情况的对立情况,都需要拒绝原假设。因而要把拒绝域同时放在左、右两个尾部,即,进行双尾检验。

②若想了解学生的语文理解程度是否达到或超过60分(教材中原来只写“是否达到”,在理解上容易产生歧义,应加上“或超过”)

H0:??60 其中的等于60等价于真实情况为第一种情况,其中的大于60

等价于真实情况为第二种情况

H1:??60 等价于真实情况为第二种情况

上述一组假设对应着左单尾检验。

用左单尾检验的理由是:我们所关心的是,?是否大于或等于60(将?≥60设为原假设)。若检验统计量的样本值落在检验统计量的概率分布曲线的左尾部(这意味着?<60),这属于我们所关心的情况的对立情况,需要拒绝原假设;至于检验统计量的样本值落在右尾部(这意味着?>60)时,这属于我们所关心的情况,不需要拒绝原假设。因而只把拒绝域放在左尾部,即,进行左单尾检验。

(4)构造检验统计量 在原假设H0:??60成立的条件下,有下列检验统计量服从自由度为n–1=400–1

t?y?60~t(400?1) snn=400 y=61.6 s=14.4 y?6061.6?60t???2.22

s14.4的t?分布。由

于自由度相当大,故这个分布同标准正态分布非常接近。

(5)计算检验统计量的样本值

(6)观察到的显著水平(P-值)

n400查标准正态分布表,z=2.22时阴影面积值为0.4868。故

右尾P-值=P(2.22z>–∞)=0.5+0.4868=0.9868

(7)用P-值检验规则做检验

①学生的语文理解程度是否为60分(H0:?=60 ;H1:?≠60)——双尾检验 ⅰ)若规定?=0.05

检验用的显著水平标准为?/ 2=0.05 / 2=0.025

17

由于右尾P-值=0.0132<0.025,故拒绝原假设。 ⅱ)若规定?=0.01

检验用的显著水平标准为?/ 2=0.01 / 2=0.005 由于右尾P-值=0.0132>0.025,故不能拒绝原假设。

②学生的语文理解程度是否达到或超过60分(H0:?≥60 ;H1:?<60)——左单尾检验 ⅰ)若规定?=0.05

检验用的显著水平标准为?=0.05

由于左尾P-值=0.9868>0.05,故不能拒绝原假设。 ⅱ)若规定?=0.01

检验用的显著水平标准为?=0.01

由于左尾P-值=0.9868>0.01,故不能拒绝原假设。 (8)用临界值值检验规则做检验

①学生的语文理解程度是否为60分(H0:?=60 ;H1:?≠60)——双尾检验 ⅰ)若规定?=0.05

查标准正态分布表,z?域为??1.96,1.96?。

由于z=2.22>1.96,检验统计量的样本值落在拒绝域,故拒绝原假设。 ⅱ)若规定?=0.01

查标准正态分布表,z?受域为??2.575,2.575?。

由于z=2.22<2.575,检验统计量的样本值落在接受域,故不能拒绝原假设。

②学生的语文理解程度是否达到或超过60分(H0:?≥60 ;H1:?<60)——左单尾检验 ⅰ)若规定?=0.05

查标准正态分布表,在左尾部有z?= z0.05 =–1.645,故,拒绝域为???,?1.645?,接受域为

/ 2= z0.01 / 2 = z0.005 =2.575,故,拒绝域为/ 2= z0.05 / 2 = z0.025 =1.96,故,拒绝域为

???,?1.96?和?1.96,??,接受

???,?2.575?和?2.575,??,接

??1.645,??。

由于z=2.22>–1.645,检验统计量的样本值落在接受域,故不能拒绝原假设。 ⅱ)若规定?=0.01

查标准正态分布表,在左尾部有z?= z0.01 =–2.325,故,拒绝域为???,?2.325?,接受域为

??2.325,??。

由于z=2.22>–2.325,检验统计量的样本值落在接受域,故不能拒绝原假设。 (9)检验结论

①学生的语文理解程度是否为60分 ⅰ)若规定?=0.05

样本数据显著地表明,学生的语文理解程度并非恰好为60分。上述结论的双尾显著水平为0.05。

18

ⅱ)若规定?=0.01

样本数据提供的证据不足以推翻学生的语文理解程度恰好为60分的假设,也就是说,学生的语文

理解程度有可能恰好为60分。上述结论的双尾显著水平为0.01。

②学生的语文理解程度是否达到或超过60分 ⅰ)若规定?=0.05

样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过60分的假设,也就是

说,可以认为学生的语文理解程度达到或超过了60分。上述结论的单尾显著水平为0.05。

ⅱ)若规定?=0.01

样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过60分的假设,也就是说,可以认为学生的语文理解程度达到或超过了60分。上述结论的单尾显著水平为0.01。

2. 是否?+?=1?(这里的?是犯弃真错误的概率,?是犯取伪错误的概率)请说明为什么是或为什么不是?

答:

?是在H0成立的总体中检验统计量分布的概率密度曲线属于拒绝域的尾部(一个或两个)面积;?是H0不成立的另外某个总体中与前述检验统计量相对应的另外一个统计量分布的概率密度曲线伸入接受域

的尾部面积。由于?和?二者分别属于两个概率密度曲线,因此不会存在二者之和等于1的必然规律。

人们熟知的必然关系是:在H0成立的总体的检验统计量分布的概率密度曲线下,有?+(1–?)=1。这里,?和(1–?)是上述同一概率密度曲线下分别属于拒绝域和接受域的两个部分的面积。

(说明:拒绝域和接受域是实数轴的两个部分,而不是概率密度曲线下的这一部分面积或那一部分面积)

3. 据一个汽车制造厂家称,某种新型小汽车耗用每加仑汽油至少能行驶25公里,一个消费者研究小组对此感兴趣并进行检验。检验时的前提条件是已知生产此种小汽车的单位燃料行驶里程技术性能指标服从正态分布,总体方差为4。试回答下列问题:

(1)对于由16辆小汽车所组成的一个简单随机样本,取显著性水平为0.01,则检验中根据x来确定是否拒绝制造家的宣称时,其依据是什么(即,检验规则是什么)?

(2)按上述检验规则,当样本均值为每加仑23、24、25.5公里时,犯第一类错误的概率是多少?

答:

(1)拒绝域(??,?2.33];(2)样本均值为23,24,25.5时,犯第一类错误的概率都是0.01。 三、计算题 1.一台自动机床加工零件的直径X服从正态分布,加工要求为E(X)=5cm。现从一天的产品中抽取50个,分别测量直径后算得x?4.8cm,标准差0.6cm。试在显著性水平0.05的要求下检验这天的产品直径

19

平均值是否处在控制状态(用临界值规则)?

解: (1)提出假设

H0:??5

H1:??5

(2)构造检验统计量并计算样本观测值

在H0:??5成立条件下:

?4.8?5??2.357

22s0.6(3)确定临界值和拒绝域 n50Z0.025?1.96

Z?x??∴拒绝域为

???,?1.96???1.96,???

(4)做出检验决策

∵Z?2.357?Z0.025?1.96

检验统计量的样本观测值落在拒绝域。

∴拒绝原假设H0,接受H1假设,认为生产控制水平不正常。

2.已知初婚年龄服从正态分布。根据9个人的调查结果,样本均值x?23.5岁,样本标准差(以9-1作为分母计算)s?3岁。问是否可以认为该地区初婚年龄数学期望值已经超过20岁(?界值规则)?

解:

(1)提出假设

?0.05,用临

H0:??20

H1:??20

在H0(2)构造检验统计量并计算样本观测值

:??20成立条件下 x??23.5?20 t???3.5

22s3(3)确定临界值和拒绝域 n9 t0.05(8)?1.86

拒绝域为

?1.86,???

(4)做出检验决策

∵t?3.5?1.86 检验统计量的样本观测值落入拒绝域

∴拒绝H0,接受H1,即可以认为该地区初婚年龄数学期望值已经超过20岁。

3.从某县小学六年级男学生中用简单随机抽样方式抽取400名,测量他们的体重,算得平均值为61.6

20

公斤,标准差是14.4公斤。如果不知六年级男生体重随机变量服从何种分布,可否用上述样本均值猜测该随机变量的数学期望值为60公斤?按显著性水平0.05和0.01分别进行检验(用临界值规则)。

解:??0.05时

(1)提出假设

H0:??60H1:??60在H0

(2)构造检验统计量并计算样本观测值

:??60成立条件下:

x??61.6?60Z???2.222

22s14.4(3)确定临界值和拒绝域 n400Z0.025?1.96

∴拒绝域为

???,?1.96???1.96,???

(4)做出检验决策

∵Z?2.222?Z0.025?1.96

检验统计量的样本观测值落在拒绝域。

∴拒绝原假设H0,接受H1,认为该县六年级男生体重的数学期望不等于60公斤。

??0.01时

(1)提出假设

H0:??60H1:??60在H0

(2)构造检验统计量并计算样本观测值

:??60成立条件下: x??61.6?60Z???2.222

22s14.4(3)确定临界值和拒绝域 n400Z0.005?2.575

∴拒绝域为

???,?2.575???2.575,???

(4)做出检验决策

∵Z?2.222?Z0.005?2.575 检验统计量的样本观测值落在接受域。

∴不能拒绝H0,即没有显著证据表明该县六年级男生体重的数学期望不等于60公斤。

4.某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,有笔误的发票占20%以上。随机抽取400张发票,检查后发现其中有笔误的占18%,这是否可以证明负责人的判断正确?(??0.05,用临界值规则)

21

解:

(1)提出假设

H0:??20%

H1:??20%

在H0成立条件下:

(2)构造检验统计量并计算样本观测值

p??18%?20%???1

?(1??)20%?80%(3)确定临界值和拒绝域 n400 Z0.05?1.645

Z?拒绝域为

?1.645,??)

(4)做出检验决策

Z?1?1.645 检验统计量的样本观测值落在接受域

∴接受H0,即不能证明负责人的判断正确。

5. 从某地区劳动者有限总体中用简单随机放回的方式抽取一个4900人的样本,其中具有大学毕业文化程度的为600人。我们猜测,在该地区劳动者随机试验中任意一人具有大学毕业文化程度的概率是11%。要求检验上述猜测(?=0.05,用临界值规则)。

解: (1)提出假设

H0:??11%H1:??11%在H0

(2)构造检验统计量并计算样本观测值

:??11%成立条件下:

600?12.2% 样本比例??p??49000.122?0.11Z???2.68

??1???0.11?0.89(3)确定临界值和拒绝域 n4900Z0.025?1.96

∴拒绝域为

???,?1.96???1.96,???

(4)做出检验决策

∵Z?2.68?Z0.025?1.96

检验统计量的样本观测值落在拒绝域。

∴拒绝原假设H0,接受H1假设,即能够推翻所作的猜测。

6.从某市已办理购房贷款的全体居民中用简单随机不放回方式抽取了342户,其中,月收入5000元

22

以下的有137户,户均借款额7.4635万元,各户借款额之间的方差24.999;月收入5000元及以上的有205户,户借款额8.9756万元,各户借款额之间的方差28.541。可见,在申请贷款的居民中,收入较高者,申请数额也较大。试问,收入水平不同的居民之间申请贷款水平的这种差别是一种必然规律,还是纯属偶然?(??0.05,用P-值规则和临界值规则)

解:

2?24.999;S2n1?137;n2?205; X?7.4635;Y?8.9756;S12?28.541

(1)H0和H1

222H0:?12??2,H1:?1??2

检验统计量:

由于 24.999/28.541=0.8758978 落在 95%置信区间(0.7314319,1.354116)之内。 不能拒绝零假设。 (2)假设两个总体方差未知,但相等。

2S12/S2~F?n1?1,n2?1? 22?1/?2H0:?1??2; H1:?1??2

在H0下,有

Sw其中

11?nn22??n?1?S211?S?n?2122 Sw?1n?n?2136?24.999?2204?28.5411?X?Y???????~t?n?n1212?2?

136?.97562047.4635?8?27.1242

小于0.05, 即落在单边拒绝域

27.1242???2.631032单边p-值:pt?

?之内。拒绝H0(不属偶然)。

?1?1371????0.004450087,340205???2.631032

???,?1.649348? 7.用不放回简单随机抽样方法分别从甲、乙二地各抽取200名六年级学生进行数学测试,平均成绩分别为62分、67分,标准差分别为25分、20分,试以0.05的显著水平检验两地六年级数学教学水平是否显著地有差异。

解:

(1)提出假设

H0:?1??2H1:?1??2

(2)构造检验统计量并计算样本观测值

在H0成立条件下:

ss2520??(3)确定临界值和拒绝域 n1n2200200Z0.025?1.96

Z?y1?y22122?67?6222?2.209

23

∴拒绝域为

(4)做出检验决策

∵Z???,?1.96???1.96,???

?2.209?Z0.025?1.96

检验统计量的样本观测值落在拒绝域。

∴拒绝原假设H0,接受H1,即两地的教育水平有差异。

8.从成年居民有限总体中简单随机不放回地抽取228人,经调查登记知其中男性100人,女性128人。就企业的促销活动(如折扣销售,抽奖销售,买几赠几,等等)是否会激发本人购买欲望这一问题请他(她)们发表意见。男性中有40%的人、女性中有43%的人回答说促销活动对自己影响不大或没有影响。试问,促销活动对不同性别的人购买欲望的影响是否有差别?(?解:

?0.10,用临界值规则)

H0:男女无差别 H1:男女有差别

?1?0.4,n1?100,p?2?0.43,n1?128 p?1-p?2?-0.03, p?1-p?2||p0.03??0.1698692<1.96

?1(1?p?1)p?2(1?p?2)0.1766065p?不能拒绝H0。

n1n2两个比例的差的

9.从甲、乙两地区居民中用不放回简单随机抽样方法以户为单位从甲地抽取400户,从乙地抽取600户居民,询问对某电视节目的态度。询问结果,表示喜欢的分别为40户、30户。试以单侧0.05(双侧0.10)的显著水平检验甲、乙两地区居民对该电视节目的偏好是否显著地有差异。(用临界值规则)

解:

(1)提出假设

H0:?1??2 H1:?1??2

(2)构造检验统计量并计算样本观测值

在H0成立条件下:

??Z?n1?1?n2?2400?0.1?600?0.05??0.07n1?n2400?600?2??10.05?0.1?1?n?11??n2??0.07*0.93(11?)400600

??3.036

(3)确定临界值和拒绝域??1???? ?Z0.05?1.645

∴拒绝域为(4)做出检验决策

???,?1.645???1.645,???

Z?3.036?Z0.05?1.645

24

检验统计量的样本观测值落在拒绝域。

∴拒绝原假设H0,接受H1,即甲乙两地居民对该电视节目的偏好有差异。

10.某企业为了扩大市场占有率,为开展产品促销活动,拟研究三种广告宣传形式即街头标牌广告、公交车广告和随报刊邮递广告对促销的效果,为此选择了三个人口规模和经济发展水平以及该企业产品过去的销售量类似的地区,然后随机地将三种广告宣传形式分别安排在其中一个地区进行试验,共试验了6周,各周销售量如下表。各种广告宣传方式的效果是否显著地有差异?(??0.05,用P-值规则和临界值规则) 三种广告宣传方式的销售量 单位:箱 观测序号(周) 地区和广告方式 1 甲地区:街头标牌广告 乙地区:公交车广告 丙地区:随报刊邮递广告 解:

将对街头标牌广告宣传效果(销售量)观测结果Y1的数学期望值E(Y1)记为?1,将对公交车广告宣传效果(销售量)观测结果Y2的数学期望值E(Y2)记为?2,将对随报刊邮递广告宣传效果(销售量)观测结果Y3的数学期望值E(Y3)记为?3。

首先计算样本数据(样本内数据顺序号记作j)

样本量 组号i 1 2 3 合计 广告方式 ni 街头标牌广告 公交车广告 随报刊邮递广告 —— 6 6 6 18 53 61 50 2 52 46 40 3 66 55 45 4 62 49 55 5 51 54 40 6 58 56 42 ?yij j?1ni?yij2 j?1niyi? 57.00 53.50 45.33 —— yi2? 3249.00 2862.25 2055.11 —— niyi2? 19494.00 17173.50 12330.67 48998.17 342 321 272 935 m19678 17315 12514 49507 n??ni?18

1mni935y?????yij??51.94

mnimn18i?1j?i222SSR????yi??y?????niyi2??ny???48998.17?18?51.94?438.43 SSE????yij?yi?????y??niyi2??49507?48998.17?508.83

22iji?1j?1i?1j?1i?1mnii?1j?1mni?1im组数m?3

i?1下面进行检验 ①建立假设

H0:?1??2??3 H1:?1、?2、?3不全相等

②构造检验统计量并计算检验统计量的样本值

25

假若Y1、Y2、Y3为正态随机变量,它们的方差V(Y1)、V(Y2)、V(Y3) 相等(题中并未给定上述条件,这里只能假定它们近似成立),则在H0服从分子自由度为(m?1)样本值为

:?1??2??3成立的条件下,有检验统计量F??3?1?2,分母自由度为(n?m)?18?3?15的F?分布。检验统计量的

SSR/(m?1)SSE/(n?m)438.43SSR/(m?1)F??3?1?6.46

SSE/(n?m)508.83③建立检验规则

18?3本题要求??0.05。查F?分布表得到F0.05(2,15)?3.68。拒绝域为?3.68,??,接受域为

④进行检验并做出检验结论 由于F?0,3.68?。

?6.46?F0.05(2,15)?3.68,检验统计量的样本值落在拒绝域,所以拒绝原假设H0。样

本证据显著地表明,三种不同的广告宣传方式的效果有差异。

11.从本市高考考生中简单随机抽取50人,登记个人的考试成绩、性别、父母文化程度(按父母中较高者,文化程度记作:A——大专以上,B——高中,C——初中,D小学以下)。数据如下: (500,女,A)(498,男,A)(540,男,A)(530,女,A)(450,女,A) (400,女,A)(560,男,A)(460,男,A)(510,男,A)(520,女,A) (524,男,A)(450,男,B)(490,女,B)(430,男,B)(520,男,B) (540,女,B)(410,男,B)(390,男,B)(580,女,B)(320,男,B) (430,男,B)(400,女,B)(550,女,B)(370,女,B)(380,男,B) (470,男,B)(570,女,C)(320,女,C)(350,女,C)(420,男,C) (450,男,C)(480,女,C)(530,女,C)(540,男,C)(390,男,C) (410,女,C)(310,女,C)(300,男,C)(540,女,D)(560,女,D) (290,女,D)(310,男,D)(300,男,D)(340,男,D)(490,男,D) (280,男,D)(310,女,D)(320,女,D)(405,女,D)(410,男,D)

(1)试检验学生的性别是否显著地影响考试成绩(显著性水平0.05,用P-值规则和临界值规则)

(2)试检验家长的文化程度是否显著地影响学生的考试成绩(显著性水平0.05,用P-值规则和临界值规则)

解: (一)

(1)提出假设

H0:?1??2 H1:?1??2性别i

(2)计算离差平方和

成绩j 26

510 男 310 410 430 380 490 498 430 390 470 420 540 300 280 410 540 560 524 520 450 390 300 460 450 320 340 500 女 550 570 540 310 530 540 370 320 480 410 560 320 450 490 350 530 310 290 405 400 520 400 580 m?2 n1?26 n2?24 n?50 ?y1?111222?y1??4930980 ?y2?10725

?

?y?21847??

?y2?m22?50084252 ?y??2?9939405组间变差 SSR?n1y1?ny2 ?22i?1?11122??10725??21847??26????24????50???

?26??24??50??9550383.73?9.545828.18

?4555.58

mni组内变差 SSE???y??niyi2iji?1j?1i?1m2

?9939405?9.550383.76 ?389021.24

(3)构造检验统计量并计算样本观测值

F?SSR/(m?1)4555.58/(2?1)??0.5621

SSE/(n?m)389021.24/(50?2)

(4)确定临界值和拒绝域

F0.05?1,48??4.048∴拒绝域为:(5)做出检验决策 临界值规则:

∵F?4.048,???

?0.5621?F0.05?1,48??4.048

检验统计量的样本观测值落在接受域。

∴不能拒绝H0,即没有显著证据表明性别对成绩有影响。

P-值规则:

根据算得的检验统计量的样本值(F值)算出P-值=0.457075。由于P-值=0.457075>显著水平标准

??0.05,所以不能拒绝H0,即没有得到足以表明性别对成绩有影响的显著证据。

(二)

(1)提出假设:

H0:?1??2??3??4 H1:?1、?2、?3、?4不全相等

(2)计算离差平方和

m?4 n1?11 n2?15 n3?12 n4?12 n?50

?y1?=5492 ?y2?=6730 ?y3?=5070 ?y4?=4555 ?y??=21847

27

22222?y?y1?y?y?y=2763280 =3098100 =2237900 =1840125 3??2?4???=9939405

组间变差 SSR=

?niyi?i?1m2-ny??

2=11*(54922+15*67302+12*50702+12*45552-50*218472

))()()()(5011151212=9632609.568-9545828.18

=86781.388

组内变差

SSE=

mni??yi?1j?12ij-

?niyi?i?1m2=9939405-9632609.568=306795.432

(3)构造检验统计量并计算样本观测值

F=

SSR/(m?1)86781.388/(4?1)==4.3372

SSE/(n?m)306795.432/(50?4)(4)确定临界值和拒绝域

F0.05(3,46)=2.816 ∴拒绝域为:(5)做出检验决策 临界值规则:

∵F=4.3372> F0.05(3,46)=2.816

检验统计量的样本观测值落在拒绝域。

∴拒绝原假设H0,接受H1,即父母文化程度对孩子的学习成绩有影响。

?2.816,???

P-值规则:

根据算得的检验统计量的样本值(F值)算出P-值=0.008973。由于P-值=0.008973<显著水平标准 ??0.05,所以拒绝H0,接受H1,即得到足以表明父母文化程度对孩子的学习成绩有影响的显著证据。

12.某金属材料生产过程中,为提高其强度,需要进行热处理。热处理的温度和时间是影响该材料强度的两个主要因素。现取温度三个水平和时间四个水平,各个不同水平的每一组合都进行了二次实验,测得该材料在各种热处理方式下的强度数据如下表。试分析温度,时间两个因素各自以及两个因素的交互作用对材料强度是否显著地有影响(α=0.01,用P-值规则和临界值规则)

某金属材料热处理后的强度

时间B B1 温A1 度 56 71 A2 68 78 70 59 71 77 64 69 59 58 53 B2 69 B3 63 B4 56 A 28

75 A3 76 解:

检验的假设如下:

72 71 68 66 56 58 A因子(温度)的三种处理方案影响作用是否相同

HA0:?1=?2=?3=0 HA1: ?1,?2,?3不全为0

B因子(时间)的四种处理方案影响作用是否相同

HB0:?1=?2=?3=?4=0 HB1:?1,?2,?3,?4不全为0

A因子和B因子的交互影响作用是否存在

HAB0:????ij?0HAB1:????ij(?i?1,2,3;(?i?1,2,3;j?1,2,3,4)

j?1,2,3,4)不全为0

使用Excel进行有交互作用的双因素方差分析。主要操作步骤如下。

(1)输入数据。B2:B3单元格存放的是在“A1”与“B1”因素水平共同作用下,进行2次试验所得的结果;C6:C7单元格存放的是在“A3”与“B2”因素水平共同作用下,进行2次试验所得的结果,其余类推。

(2)在“数据”选项卡,点击“数据分析”,在弹出的对话框中选择“方差分析:可重复双因素分析”,再点击“确定”,调出“方差分析:可重复双因素分析”对话框,按图所示填写。其中,“每一样本的行数”编辑框输入包含在每个样本中的行数。本题,在每种不同因素水平组合下,分别进行了2次试验,因此“每一样本的行数”为“2”。每个样本必须包含同样的行数。需要注意的是,输入区域必须包括因素水平标志(“A1”、“B2”等)所在的单元格区域,也即,输入区域为“$A$1:$E$7”,而不是只包括数据的单元格区域“$B$2:$E$7”。

(3)单击“确定”按钮,得到方差分析表。 差异源 样本 列 交互 内部 总计

1306.958 SS 256.0833 714.7917 313.5833

22.5

Df

2 3 6 12

23

MS 128.0417 238.2639 52.26389 1.875

F 68.28889 127.0741 27.87407

P-value 2.78E-07 2.34E-09 2.24E-06

F crit 6.926608 5.952545 4.820574

注意,Excel给出的原始的方差分析表中,差异源项目是:样本、列、交互、内部。本题的“样本”指

29

的就是A因素,即温度;“列”指的是B因素,即时间。

(4)根据输出结果得到检验结论 ①温度对材料强度的影响:

从方差分析表可得,FA?68.29,F0.01(2,12)=6.93。

拒绝域为?6.93,??,接受域为(0,6.93)。由于FA?68.29>F0.01(2,12)=6.93,检验统计量的样本值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所采用的三种不同的温度方案下,所发生的金属材料强度是不相同的。

上述结论的单尾显著水平为0.01。 ②时间对材料强度的影响: 从方差分析表可得,FB?127.07,F0.01(3,12)=5.95。

?127.07>F0.01(3,12)=5.95,检验统计量的样

拒绝域为?5.95,??,接受域为(0,5.95)。由于FB本值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所采用的四种不同的时间方案下,所发生的金属材料强度是不相同的。上述结论的单尾显著水平为0.01。

③温度、时间两个因素的交互作用对材料强度的影响: 从方差分析表可得,FAB?27.87,F0.01(6,12)=4.82。

?27.87>F0.01(6,12)=4.82,检验统计量的样

拒绝域为?4.82,??,接受域为(0,4.82)。由于FAB本值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所采用的三种不同的温度方案与四种不同的时间方案之间,对金属材料强度的影响存在着交互作用。上述结论的单尾显著水平为0.01。

上述检验基于临界值规则。若使用P值规则,上述三个检验统计量对应的P值(方差分析表中的P-Value列),均接近于0,远小于0.01,均拒绝原假设。

第七章

一、不定项选择题

1.变量之间的关系按相关程度分可分为( B、C、D )。 A.正相关; B. 不相关; C. 完全相关; D. 不完全相关 2.复相关系数的取值区间为( A )。 A.0?R?1 ; B. ?1?R?1;

R?1 ; D. ?1?R??

C. ???3.修正自由度的决定系数( A、B、C、D )。 A. R2?R2 ; B. 有时小于0 ; C. 0?R2?1;

2D. 比R更适合作为衡量回归方程拟合程度的指标 4.回归预测误差的大小与下列因素有关( A、B、C、D)。

30

A.样本容量 B.自变量预测值与自变量样本平均数的离差

C.自变量预测误差 D. 随机误差项的方差

二、判断分析题

1.产品的总成本随着产量增加而上升,这种现象属于函数关系。

答:错。应是相关关系。总成本会随着产量增加而增加,但一般来讲它们之间并不存在确定的数值对应关系。

2.相关系数为0表明两个变量之间不存在任何关系。

答:.错。相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。

3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。

4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:.错。两者是精确的函数关系。

5.样本回归函数中的回归系数的估计量是随机变量。 答:对。当抽取的样本不同时,其取值也有所不同。

6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。

答:对。因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。

三、证明题

?是标准一元线性回归模型中总体回归系数?的最优线性无偏估计量。 1. 试证明最小二乘估计量?22证明: (I)无偏性:

?)??证明略,可参见教材P170页,公式7.29式的证明。 E(?22(II)线性: 令kt(Xt?X)YtXt?X??????ktYt ,则?222(Xt?X)Xt????是一个线性由此可见,?2是Yt的一个线性函数。它是以kt为权重的Yt的一个加权平均,从而?2统计量。

(III)最小方差性 设?2~~??atYt为?2的任意线性无偏估计量,现讨论var(?2)的取值情况。

因为:

~E(?2)??atE(?1??2Xt?ut)??1?at??2?atXt??atE(ut)??2也即,作为

?2的任意线性无偏估计量,必须满足下列约束条件:

31

??[a??(2X,所以:又因为varYt? ?(X?X)?????2tt2t?at?0;且?tXt?1 Xa?X?2?[at?[?(Xt?X)2]2

~X项?2Xt?1X2式:由于Xt?var?(2)只能通过第一项分析此第二是常数,所以?2??[at?][]222(X(Xt?2X)?(XXX))t?Xt??Xt?t~2222var(?)?varaY?avarY??a(X?X)X?X?ttt??t tt222t2?Xt?X2]2t?X)?[a??(Xt?X)2]??]的处理使之最小化。 2(Xt?)XXX?22~1??2??[ata??tXt?X]??var(?明显,若令,可以取最小值,即: 222)t2(X?X)(X?X)?ttX?X)(~??1t2?) minvar(?2)???var(?22(Xt?X)??是标准一元线性回归模型中总体回归系数?的最优线性无偏估计量。 所以,?2?2

四、计算题

1.设销售收入X为自变量,销售成本Y为因变量。现已根据某百货公司12个月的有关资料计算出以下数据:(单位:万元)

?(X?X)= 425053.73 ; X = 647.88;

?(Y?Y) = 262855.25 ; Y = 549.8; ?(Y?Y)(X?X)= 334229.09

t2t2tt 试利用以上数据

(1) 拟合简单线性回归方程,并对回归系数的经济意义做出解释。 (2) 计算决定系数和回归估计的标准误差。 (3) 对β2进行显著水平为5%的显著性检验。

(4)假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为95%的预测区间。

解:

334229.09?0.7863

2425053.73(Xt?X)????1?Y??2X?549.8?0.7863*647.88?40.3720

?(2)r2???(1)?2[(Yt?Y)(Xt?X)(Y?Y)(X?X)]? ?(X334229?X).??092(Y?Y)??0.999834

tt2t2t222e?(1?r)(Y?Y)?43.6340 ?te2??t?2.0889

Se?n?2(3)H0:?2?0,H1:?2?0

2425053.73*262855.25S??22S??0.0032042t?/2(n?2)?t0.05(10)?2.228

t???2.0889???0.003204

2?425053.73?X)?2?(X0.t7863??245.4120

Se 32

t值远大于临界值2.228,故拒绝零假设,说明?2在5%的显著性水平下通过了显著性检验。 (4)Yf?40.3720?0.7863*800?669.41(万元)

(Xf?X)211(800?647.88)2Yf的置信度为95%Sef?S1???2.00891???2.1429 所以,2n12425053.73(Xt?X)的预测区间为:

?Yf?t?/2(n?2)Sef?669.41?2.228*1.0667?669.41?2.3767

所以,区间预测为:

664.64?Yf?674.18

2.对9位青少年的身高Y与体重X进行观测,并已得出以下数据:

?Y?13.54 ,?Yi2?22.9788,?X?XY?803.02

ii?472,

?Xi2?28158,

ii要求:

(1)以身高为因变量,体重为自变量,建立线性回归方程。 (2)计算残差平方和与决定系数。

(3)计算身高与体重的相关系数并进行显著性检验。(自由度为7,显著水平为0.05的t分布双侧检验临界值为2.365。)

(4)对回归系数β2进行显著性检验。 解:

?Xt?Yt

n?Xt??13.54(?Xt)9?803.02-472 =?0.027296

?2?(1)?22n?XtYt????t?????12n29?28158(-472)YXtn?X ?Y??2 =13.54/9-0.027296?472/9=0.072912 回归方程为:Y=0.072912+0.027296X (2)

?e??Y2t2t?Y?????1?t2?XtYtSSESST

=22.9788-0.07292?13.54-0.027296?803.02?0.072338

r2=

(3)r= t=

0.999979SSRSST=1-

=1-0.072338/(28158-(472)/9)=0.999979

2=0.999989

t统计量远大于临界值,表明身高与体重显著线性相关。 (4)S??=

2rn?20.999989?7==577.3441

1?r21-0.999979S

?(Xt?2???S??2?X)2*2 =

?et2n?2?

?x2t?(?xt)2/n

=0.101656/

28158-472*472/9=0.001742

t??=

2 =0.027296/0.001742=15.66656

T统计量远大于临界值,表明回归系数β2 显著不为0。

33

3. 我国历年的GDP和最终消费资料如下所示。

我国的国内生产总值与最终消费 单位:亿元

年份 国内 生产总值 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 3605.6 4074.0 4551.3 4901.4 5489.2 6076.3 7164.4 8792.1 10132.8 11784.0 14704.0 16466.0 2239.1 1990 2619.4 1991 2976.1 1992 3309.1 1993 3637.9 1994 4020.5 1995 4694.5 1996 5773.0 1997 6542.0 1998 7451.2 1999 9360.1 2000 10556.5 消费 年份 国内 生产总值 18319.5 21280.4 25863.6 34500.7 46690.7 58510.5 68330.4 74894.2 79003.3 82673.1 89112.5 11365.2 13145.9 15952.1 20182.1 26796.0 33635.0 40003.9 43579.4 46405.9 49722.7 54617.2 消费 资料来源:《中国统计年鉴》,中国统计出版社,2001年版。 试根据上表的资料利用Excel软件完成以下问题。 (1) 拟合以下形式的消费函数: Ct=β1+β2Yt+β3Ct-1+Ut

式中:Ct是t期的消费;Ct-1是t-1期的消费;Yt是t期的GDP。

(2) 计算随机误差项的方差估计值、修正自由度的决定系数、各回归系数的t统计量,并对整个回归方程进行显著性检验。

(3) 假设2001年的国内生产总值为95350亿元,试利用拟合的消费函数预测当年的消费总额,并给出置信度为95%的预测区间。

解:

(1)消费函数的拟合 步骤一:构造EXCEL工作表

步骤二:进行回归分析

在“数据”选项卡,点击“数据分析”,在弹出的对话框中选中“回归”分析工具,单击“确定”,调出“回归”分析对话框。

34

按图所示填写,最后点击“确定”,得到回归分析的输出结果见下表。

回归统计

Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析

回归分析 残差 总计

Intercept Yt Ct-1

df 2 19 21

SS 6447302985 3715553.88 6451018539

MS 3223651493 195555.4674

F

16484.58893 t Stat 3.353325287 15.66029688 4.938891517

Significance F 1.674E-31 P-value 0.003338688 2.57372E-12 9.11373E-05

下限 95.0% 175.4390449 0.387359846 0.152113807

上限 95.0% 758.1539251 0.506875902 0.375861302

0.999712 0.999424 0.999363 442.2165 22

Coefficients 466.796485 0.447117874 0.263987555

标准误差 139.2040572 0.028551047 0.05345077

因此回归方程为:

Ct?466.7965?0.4471Yt?0.2640Ct?1

(2)根据回归输出结果,可以得到 随机误差项的标准差估计值为:S=442.2165 修正自由度的决定系数:Adjusted R Squares=0.9994 各回归系数的t统计量为:

t???3.3533;t???15.6603;t???4.9389

123整个方程的显著性检验:F统计量为16484.6,远远大于临界值3.52,说明整个方程非常显著。 (3)预测

使用EXCEL进行区间估计步骤如下: 步骤一:构造工作表

其中,C2:E23存放的是自变量矩阵X,C25:E25存放的是矩阵Xf,G3:G5存放的是回归系数估计值矩

?,将这三个区域分别命名为X,Xf,B。G6存放的是估计标准误差。以上均为原始输入数据。G8:G13阵?存放的则是一些中间变量及最终计算结果。

步骤二:单元格区域的命名

先定义矩阵X。选定C2:E23,在“公式”选项卡,单击“定义名称”,在弹出对话框的“名称”框中输入“X”,再单击“确定”即可。参见下图。同样,对矩阵Xf和B进行命名。

35

步骤三:计算点预测值Cf

在H8中输入公式“=MMULT(Xf,B)”,按回车键即可。 步骤四:计算预测估计误差的估计值Se

f先计算

Xf(X?X)?1X?f,在H9中输入如下公式:

=MMULT(MMULT(Xf,MINVERSE(MMULT(TRANSPOSE(X),X))),TRANSPOSE(Xf)) 然后按Ctrl+Shift+Enter组合键即可,表示输入的是数组公式。 再计算Sef,在H10中输入公式“=H6*SQRT(1+H9)”。 步骤五:计算t临界值

在H11中输入公式“=T.INV.2T(1-0.95,22-3)”,按回车键即可。 步骤六:计算置信区间上下限

在H12、H13中分别输入公式“=H8-H11*H10”和“=H8+H11*H10”。结果为:

最终得出Cf的区间预测结果:56375.37?Cf?58658.07

第九章

一、选择题

1.下列时间序列中属于时期序列的是( c )。

A.某年各季度末的从业人数 B.历年年末居民储蓄存款余额 C.历年秋季高校招生人数 D.历年年初粮食库存量

2.某储蓄所今年9~12月月末居民储蓄存款余额分别为480,460,520和560万元。则第四季度居民储蓄存款的平均余额为( A )万元。

A .500 B. 513.3 C. 515 D. 520

3.若侧重于考察各期发展水平的总和,计算平均发展速度应采用( B )。 A.几何平均法 B.方程式法 C .算术平均数 D.移动平均法

4.某地区居民用电量呈逐年上升趋势,某月用电量的季节指数为120%,表明本月居民用电量( B )。 A.比上月增加20% B.比本月用电量趋势值高20% C.比上年同月增加20% D.比本年的月均用电量高20%

5.当时间序列的环比增长速度大体接近一个常数时,其趋势方程的形式为( C )。 A.直线 B.二次曲线 C.指数曲线 D.修正指数曲线

6.如果时间序列中循环变动的波动越小,则在乘法模型中,循环变动的测定值就越接近( D )。 A . -1 B. 0 C. 0.5 D . 1

36

二、判断分析题

1.一般说来,由时点序列计算平均发展水平时,时点间隔越短,计算结果就越准确。

答:正确。因为由时点序列计算平均发展水平时,假定现象在相邻时点之间的变动是均匀的,而实际情况总是不完全符合假定。一般说来,时点序列中相邻时点间隔越短,所计算的平均发展水平就越准确。

2.某企业产品的废品率逐月下降,一月份生产12500件,废品率为2.4%;二月份生产13800件,废品率为2.2%;三月份生产11200件,废品率为2%。则一季度的平均废品率为:(2.4%+2.2%+2%)/3 = 2.2%。

答:错误。计算相对数的序时平均数不能用简单算术平均法,而应该通过该相对数分子的序时平均数与分母的序时平均数对比而得,或以其分母指标为权数对相对数序列求加权算术平均数。所以,一季度的平均废品率应为:

2.4%?12500+2.2%?13800+2%?11200=2.21%。

12500+13800+112003.指数平滑法的平滑系数越大,对时间数列中数据变化的反应就越灵敏。

答:正确。因为平滑系数α越大,近期数据的权重就越大,指数平滑值受近期数据影响就越大,对数据变化的反应就越灵敏。

4. 对月度数据序列,用移动平均法测定其长期趋势值时,可采用四项或八项移动平均。 答:错误。因为对于存在周期性波动的时间序列,用移动平均法测定其长期趋势值时,移动平均的项数须等于周期长度或周期长度的整数倍。月度数据序列通常存在季节性周期波动,周期长度为一年(12个月),用移动平均法测定其长期趋势值时,须采用12(或12的整数倍)项移动平均。

5.某企业利润总额2006年比2000年增加了60%,2010年又比2006年增加了40%,因此平均来看,前后两段时间内该企业利润总额的增长速度相等,而且这10年间总的增长速度高达100%。

答:错误。前6年的平均增长速度为8.15%,后4年的平均增长速度为8.78%。这10年间总的增长速度为124%(即2010年比2000年增长124%)。 三、计算题

1.某商业企业某年第一季度的销售额、库存额及流通费用额资料如下:

销售额(万元) 月初库存额(万元) 流通费用额(万元) 1月 2880 1980 230 2月 2170 1310 195 3月 2340 1510 202 4月 —— 1560 —— 试计算第一季度的月平均商品流转次数和商品流通费用率(提示:商品流转次数=销售额÷平均库存额;商品流通费用率=流通费用额÷销售额)。

解:第一季度的月平均商品流转次数为:

37

第一季度的月平均销售额(2880?2170?2340)/32466.333???1.61 19801560第一季度的平均库存额1530(?1310?1510?)/(4?1)2 2第一季度的平均商品流通费用率为:

第一季度的月平均流通费用(230?195?202)/3209???8.48%

第一季度的月平均销售额(2880?2170?2340)/32466.3332.某企业产品销售量历年的增长速度如下:

第一年 第二年 第三年 第四年 第五年 15 6.6 30 39 环比增长速度(%) 7 定基增长速度(%) 7 试求五年间年平均增长速度,并指出增长最快的两年是哪两年?

解:平均增长速度=51.39?1?6.8078%,增长最快的是头两年。

环比增长速度(%) 定基增长速度(%)

3.某服装厂2010年服装生产量为100万件。试求:

(1)预计从2011年起,生产量每年递增10%,问到2015年该厂服装生产量可达到多少?

(2)若希望2015年生产量在2010年基础上翻一番,问2011年起每年应以多快的速度增长才能达到预定目标?平均每月递增的速度又该是多少?

解:(1)2015年该厂服装生产量=100?1.10=161.051(万件)

(2)年均递增速度=55第一年 7 7 第二年 7.48 15 第三年 6.6 22.59 第四年 6.1 30 第五年 6.9 39 2?1?14.87%;

月均递增速度=602?1?121.1487?1=1.162%

4.某地区2007~2010年各季度的LED电视机销售量数据如下表所示(单位:千台):

年度 季度 1 2 2007 3 4 1 2 2008 3 4 要求:

(1)汇总出各年度销售总量,并根据年度数据计算这几年间的:

68 74 60 65 58 52 2010 3 4 80 84 销售量 48 41 2009 3 4 1 2 75 78 63 59 年度 季度 1 2 销售量 60 56 38

a.年平均销售量、年平均增长量、年平均增长速度;

b.分别用所求年平均增长量和年平均增长速度预测2011年销售量。

(2)分别用同期平均法和移动平均趋势剔除法计算销售量的季节指数,并比较说明两种方法计算结果的差别及其原因。

解:(1)年平均销售量= (214+252+269+286)/4= 255.25

年平均增长量= (286-214)/3= 24

年平均增长速度=3286/214?1?10.15% 用所求年平均增长量预测2011年销售量=310(千台) 用所求年平均增长速度预测2011年销售量=315.03(千台)

(2)两种方法计算的各季度的季节指数(%)如下:

季度 同期平均法 趋势剔除法 1 89.72 93.07 2 81.49 83.64 3 110.87 109.15 4 117.92 114.14 由于存在上升趋势,同期平均法会将趋势变动混同于季节变动,从而低估前两个季度的季节指数、高估后两个季度的季节指数。

5.根据第4小题的数据,要求:

(1)用移动平均趋势剔除法计算的季节指数调整原时间序列,对调整后的序列用最小二乘法拟合线性趋势方程。

(2)根据季节指数和线性趋势方程,预测2011年各月及全年的销售量。

(3)试分别用直接法和剩余法测定循环变动,并说明销售量有无明显的循环波动规律。 (4)测定不规则波动。

?解:(1)线性趋势方程为T?51.08?1.474t (t=1,2,…,16)

(2)预测2011年各季度及全年的销售量为: 全季度 1 2 3 4 年 t 17 76.14 70.86 18 77.61 64.91 19 79.09 86.33 20 80.56 91.95 — — 314.05 ? 趋势预测值T??S) 销售量预测值(T (3)直接法所得的同比发展速度和间接法所得的CI的数值如下表所示: 年

季同比发展CI 年 39

季同比发展CI

度 度 速度(%) 1 2 (%) 98.14 90.73 度 度 1 2 速度(%) 103.45 107.69 110.29 105.41 105.00 105.36 106.67 107.69 (%) 100.19 101.73 102.10 99.37 96.37 98.36 100.14 98.57 2007 3 4 1 2 2008 3 4 113.33 101.46 113.85 103.12 99.04 99.95 120.83 106.62 126.83 103.75 2009 3 4 1 2 2010 3 4 (4)销售量有无明显的循环波动规律,上表中的CI可视为各期的不规则变动相对数。

6.我国1991-2010年的能源消费总量如下表(数据来源于《中国统计年鉴2010》和《2010年国民经济和社会发展统计公报》,单位:千万吨标准煤): 年 份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 能源消费总量 104 109 116 123 131 135 136 136 141 146 年 份 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 能源消费总量 150 159 184 213 236 259 281 291 307 325 要求:

(1)利用表中2001-2010年的数据计算平均增长量、年平均增长速度。 (2)分别按(1)所求的两个平均数预测2011和2015年我国的能源消费总量。

(3)利用表中全部数据绘制折线图,利用Excel的“添加趋势线”功能拟合二次曲线趋势方程,并据以预测2011和2015年我国的能源消费总量。

解:(1)平均增长量=(325-150)/9=19.444(千万吨标准煤)

年平均增长速度=9325/150?1?8.971%

(2)~(3)我国能源消费总量预测值(单位:千万吨标准煤)分别为: 按平均增长量预测 按平均增长速度预测 按二次曲线趋势预测 2011年 344.444 354.155 360.933 2015年 422.222 499.384 479.225 能源消费总量折线图及其拟合的二次曲线趋势如下图所示:

7.已知某地区近25年粮食单产依次如下表所示(单位:公斤/公顷)。

6240 6390 6975 6885 7755

8280 8505 8445 8505

40

8460 8340 8550 9120 9165 9360 8775 8640 9375

9510 9600 9630 9810 10155 9570 9180

试分别用加权移动平均法(取5项平均、权数依次为5,4,3,2,1)和指数平滑法(α=0.4)对该地区第26年的粮食单产进行预测。

解: 加权移动平均的预测值为:

9180?5?9570?4?10155?3?9810?2?9630?1?9593

5?4?3?2?1(2)(1)二次指数平滑的预测值为(E25=9507.288,E25=9588.399): ?26?y?26?a25?b25?1?9426.18?54.07?1?9372.1 y

8.根据第7小题的资料,利用预测误差来评价两种预测方法的优劣。

解:比较两种方法预测值的均方根误差RMSE,加权移动平均预测和二次指数平滑预测的均方根误差分别为512.97和422.04。

第十章

一、选择题

1.某企业计划要求本月每万元产值能源消耗率指标比去年同期下降5%,实际降低了2.5%,则该项计划的计划完成百分比为( D )。

A. 50.0% B 97.4% C. 97.6% D. 102.6% 2.下列指标中属于强度相对指标的是( A )。

A.产值利润率 B.基尼系数 C.恩格尔系数 D.人均消费支出 3. 下列指标中属于狭义指数的是( A )。 A.某地区本月社会商品零售量为上月的110% B.某地区本月能源消耗总量为上月的110% C.某地区本月居民收入总额为上月的110% D.某地区本月居民生活用水价格为上月的110%

4.若为了纯粹反映价格变化而不受销售量结构变动的影响,计算价格总指数时应该选择的计算公式是( A )。

A.拉氏指数 B.帕氏指数 C.马埃指数 D.理想指数

5. 与帕氏质量指标综合指数之间存在变形关系的调和平均指数的权数应是( B )。 A. q0p0 B. q1p1 C. q1p0 D. q0p1

41

6. 为了说明两个地区居民消费水平之间的差异程度,有关指数的计算最好采用( C )。 A.拉氏指数 B.帕氏指数 C.马埃指数 D.理想指数

7. 同样数量的货币,今年购买的商品数量比去年减少了4%,那么可推断物价指数为( D )。 A. 4.0% B. 104% C. 4.2% D. 104.2%

8.某公司报告期新职工人数比重大幅度上升,为了准确反映全公司职工劳动效率的真实变化,需要编制有关劳动生产率变化的( B )。 A.总平均数指数 B.组平均数指数 C.结构影响指数 D.数量指标综合指数

9.某地区报告年按可比价格计算的工业总产值为基年工业总产值的110%,这个指数是一个( C)。 A. 总产值指数 B.价格指数 C. 工业生产指数 D.静态指数

10.我国深证100指数将基期价格水平定为1000。若某周末收盘指数显示为1122,此前一周末收盘指数显示为1100,即表示此周末收盘时股价整体水平比一周前上涨了( A )。

A. 2% B. 22% C. 122点 D. 12.2% 二、判断分析题

1.报告期与基期相比,某城市居民消费价格指数为110%,居民可支配收入增加了20%,那么居民的实际收入水平提高了10%。请判断这种说法是否正确。

答:不正确。实际收入水平只提高了9.1%(=120%/110%-100%)。

2.某公司报告期能源消耗总额为28.8万元,与去年同期相比,所耗能源的价格平均上升了20%,按去年同期的能源价格计算,该公司报告期能源消耗总额应为多少?

答:24万元。

3.有人认为,定基发展速度等于相应环比发展速度连乘积,动态指数相当于发展速度,因此,定基指数也总是等于相应环比指数的连乘积。请判断这种说法是否正确。

答:不正确。对狭义指数而言,只有当各期指数的权数固定不变时,定基指数才等于相应环比指数的连乘积。

4.一般说来,根据同一资料计算的拉氏指数、理想指数与帕氏指数三者的数值之间存在什么样的关系?试解释说明出现这种关系的原因。

答:物量与物价通常是反方向变化的,所以一般说来根据同一资料计算的拉氏指数大于帕氏指数。

42

例如,计算价格指数,与用基期销售量作权数的拉氏指数相比,帕氏指数采用报告期销售量作权数,价格上涨幅度大的商品其权重降低,而价格下降或涨幅小的商品其权重提高,所以帕氏指数就会小于拉氏指数。理想指数是拉氏指数和帕氏指数的几何平均,所以其数值介于拉氏指数和帕氏指数之间。

5.编制综合指数时,同度量因素的选择与指数化指标有什么关系?同度量因素为什么又称为权数?它与平均指数中的权数是否一致?

答:同度量因素与指数化指标的乘积是一个同度量、可加总的总量。同度量因素具有权衡影响轻重的作用,故又称为权数。平均指数中的权数一般是基期和报告期总量(总值),或是固定的比重权数。

6.结构影响指数的数值越小,是否说明总体结构的变动程度越小?一般说来,当总体结构发生什么样的变动时,结构影响指数就会大于1?请结合具体事例来说明。

答:结构影响指数的数值越接近100%,说明总体结构的变动程度越小。一般说来,当总体中高水平组的比重上升而低水平组的比重相应下降时,结构影响指数就会大于1。

7.为什么在多因素指数分析中要强调各因素的排列顺序?“连锁替代法”是否适用于任一种排序的多因素分析?

答:将各因素合理排序,才便于确定各个因素固定的时期;便于指标的合并与细分;也便于大家都按统一的方法进行分析,以保证分析结果的规范性和可比性。“连锁替代法”适用于按“先数量指标、后质量指标”的原则对各个因素进行合理排序的情况。

8.某厂工人分为技术工和辅助工两类,技术工人的工资水平大大高于辅助工。最近,该厂一财务人员对全厂工人的平均工资变动情况进行了动态对比,他发现与上年相比,全厂工人的平均工资下降了5%。而另一人则通过分析认为,全厂工人的工资水平并没有下降,而实际上工人的工资平均提高了5%。你认为这两人的分析结论是否矛盾?为什么?

答:不矛盾。技术工和辅助工两类工人的工资水平(组平均数)平均提高了5%,而全厂工人的平均工资(总平均数)却下降了5%,这是由于工人人数结构变动所致(即辅助工比重增加而技术工比重下降)。 三、计算题

1. 某企业只生产甲、乙两种产品,有关的产量和出厂价格资料如下:

计产品 量单位 报告基期 期 期 期 基告产 量 出厂价格(元) 报 43

甲 乙 件 套 400 1000 500 1100 500 800 450 960 要求:分别用拉氏指数、帕氏指数、理想指数和马埃指数的公式计算该企业的产量总指数和出厂价格总指数,并比较各种计算结果的差异。

解:分别按不同公式计算产量指数和出厂价格指数,计算结果如下:

产量指数 出厂价格指数 拉氏指数 113.00% 114.00% 帕氏指数 112.37% 113.36% 理想指数 112.68% 113.68% 马埃指数 112.66% 113.66% 拉氏指数较大,帕氏指数较小,而理想指数和马埃指数都居中且二者很接近。

2. 现有某行业中甲乙两个企业同一年的如下数据,试从总量、结构、效益等方面对这两个企业的情况进行简要的比较分析。

指标名称 年平均职工人数(人) 其中:专业技术人员数(人) 增加值(万元) 产品销售收入(万元) 其中:新产品销售(万元) 能源消耗总量(吨标准煤) 甲企业 3500 1085 36500 115200 19600 8450 乙企业 2100 798 24500 72000 18000 5900 解:从职工人数、增加值、能源消耗总量等总量指标来看,甲企业的规模都大于乙企业;但从人员结构和产品结构(专业技术人员比重和新产品销售比重)来看,甲企业都不如乙企业;从劳动生产率和能源消耗总量等效率指标来看,甲企业也都不如乙企业。指标数值如下表:

指标名称 年平均职工人数(人) 其中:专业技术人员数(人) 专业技术人员比重% 增加值(万元) 产品销售收入(万元) 其中:新产品销售(万元) 新产品销售比重% 能源消耗总量(吨标准煤) 劳动生产率(人均增加值,万元/人) 能源消耗系数(吨/万元) 甲企业 3500 1085 31.00 36500 115200 19600 17.01 8450 乙企业 甲企业为乙企业的% 2100 798 38.00 24500 72000 18000 25.00 5900 166.7 136.0 81.6 149.0 160.0 108.9 68.1 143.2 89.4 96.1 10.429 11.667 0.232 0.241 44

3.某地区2010-2011年农产品的收购额及价格变动情况如下表:

收购金额(万元) 农产品 2010年 A B C 2011年 格上涨率(%) 收购价160 120 20 185 110 22 10 -5 2 试计算该地区的农产品收购价格总指数,并据以分析农产品收购价格变化对农民收入的影响。

?q1p1185?110?22317???103.75%

118511022305.54?q1P1??p1/p01.1011.46 (=317-305.54) 0.951.02农产品收购价格提高使农民收入增加万元。

解:Ip?4.某投资者的投资组合由四种股票组成,其有关资料如下:

每股买入价股票 (元) A B C D 15.50 18.50 26.75 42.25 (元) 17.00 20.25 26.00 45.50 量 500 200 500 300 现价股票数试计算该股票投资组合的价格指数,并解释这个指数的经济意义。

解:价格指数=39200/37500=104.53%,表示该投资组合的股票价格平均上涨 4.53%,也即该投资组合的收益率为4.53%。

5.某地区的全部工业企业分为四个部门,报告期与基期相比,这四个工业部门的生产量分别增加了8%,10%,14%和5%。已知在该地区基期工业增加值中,这四个部门所占的份额依次为30%,25%,18%和27%。试求该地区的工业发展速度。

解:已知各部门生产量增长率(从而可知类指数),可采用比重权数加权的算术平均指数公式计算工业生产指数,即:

1.08?30%?1.1?25%?1.14?18%?1.05?27%?108.77%。

6.2010年统计公报中提到“(2010)全年社会消费品零售总额达到156998亿元,比上年增长18.3%,

45

扣除物价上涨因素,实际增长14.8%。城市消费品零售额136123亿元,增长18.7%;乡村消费品零售额20875亿元,增长16.2%。”根据这段材料,要求(1)推算2010年我国消费品零售价格比2009年上涨了多少?(2)估计由于零售价格上涨使城乡居民消费支出增加的数额。

解:(1)消费品零售价格指数=118.3%/114.8%-100%=3.05% (2)由于消费品零售价格上涨使城乡居民消费支出分别增加:

(136123+20875)- (136123+20875)/103.05%=4646.7142(亿元)

7.某企业生产两种产品,其产量和成本资料如下:

计量单产品 位 A B 只 件 基期 1000 2200 报告期 1250 2300 基期 12 150 报告期 10 152 产 量 单位成本(元) 试从相对数和绝对数两个方面对该企业总成本变动进行因素分析。

解:先分别计算出基期总成本(?q0p0=342000)、报告期总成本(?q1p1=362100)和假定的总成本(?q1p0=360000)。 总成本指数:Iqp?362100?q1p1??105.88% 342000?q0p0总成本增加额:?q1p1??q0p0=362100-342000=20100(元) 产量指数:Iq?360000?q1p0??105.26% 342000?q0p0362100?q1p1??100.58% 360000?q1p0产量变动的影响额:?q1p0??q0p0=360000-342000=18000(元) 单位成本指数:Ip?单位成本的影响额:?q1p1??q1p0=362100-360000=2100(元) 三者的相对数关系和绝对数关系分别为:

105.88%=105.26%×100.58%,20100=18000+2100(元)

计算结果表示:两种产品的总成本增加了5.88%,即增加了20100元。其中,由于产量增加而使总成本增加5.26%,即增加了18000元;由于单位成本提高而使总成本增加了0.58%,即增加了2100元。

8. 某企业生产两种设备,其产量及其消耗原材料的有关资料如下:

46

原材料单耗 产量(台) 产品 基期 期 甲 乙 1000 500 1200 800 期 300 250 期 270 220 报告基(千克/台) 报告原材料价格 (元/千克) 基期 25 21 报告期 28 20 要求:根据表中数据分析各种因素对这两种产品的原材料消耗总额的变动的影响。

解:先分别计算出基期消耗总额(?q0m0p0=10125000)、报告期消耗总额(?q1m1p1=12592000)和假定的消耗总额 (?q1m0p0=13200000,?q1m1p0= 11796000)。

12592000?124.37%

10125000000消耗总额增加额:12592000?10125000?2467000(元)

?q1m0p0?13200000?130.37%

产量总指数Iq??q0m0p010125000由于产量增加而增加的消耗总额:13200000?10125000?3075000(元)

q1m1p011796000???89.36% 单耗量总指数Im?qmp13200000?100因单耗量变动而变动的消耗总额:11796000?13200000??1404000(元)

?q1m1p1?12592000?106.75%

价格总指数Ip??q1m1p011796000因价格上涨而增加的消耗总额:12592000?11796000?796000(元) 124.37%=130.37%×89.36%

消耗总额指数Iqmp111qmp???qmp?×106.75%

2467000=3075000-1404000+796000(元) 文字说明略。

9.某企业某种产品基期和报告期的销售情况如下:

单价(元/件) 产品等级 1 2 3 基期 30 25 15 报告期 35 28 15 销售量(百件) 基期 58 25 17 报告期 96 30 4 要求:对该产品平均价格的变动进行因素分析。并说明该企业产品质量变化对企业销售收入的影响。

47

解:先计算出基期总平均价格x0=26.2(元),报告期总平均价格x1=32.7692(元),假定的总平均价格

母的绝对数差额。详细计算过程和文字说明此不赘述。三者的相对数关系和绝对数关系分别为:125.07%=115.45%×108.34%,6.5692=4.3846+2.1846(元)。

?x0f1=28.3846(元)。再计算对总平均价格进行因素分析所需的三个指数以及这三个指数分子分?f1产品质量变化体现在产品的等级结构变化方面,因此,根据结构影响指数可知,质量变化使总平均价格上升8.34%,即提高了2.1846元,按报告期销售量计算,质量变化使总收入增加了28400(元),即:

2.1846(元)×130(百件)=284 (百元)=28400(元)

48