统计学答案 下载本文

第一章 绪论

3.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。

答:(1)该家大型油漆销售商向客户所供应的油漆罐。 (2)每个油漆罐的质量。

(3)最近一个集装箱里被抽查到的50罐油漆。

(4)计算出这50罐油漆的平均质量,如果平均质量低于4.536kg,可以认为该供货商的油罐分量不足,将其退回;如果平均质量不低于4.536kg,可以认为该供货商的油罐分量没有问题,接受供货。

4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对产品品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中那个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。

答:(1)“可口可乐”与“百事可乐”的消费者。 (2)消费者对两种品牌口味更好的认同情况。 (3)匿名性质品尝试验中被选中的1000名消费者。

(4)可以事先假定“可口可乐”为A品牌,“百事可乐”为B品牌,1000名消费者在品尝试验中如果认同A品牌的多于B品牌,则可认为市场上消费者对“可口可乐”更偏爱些;反之,对“百事可乐”更受欢迎。

第二章 统计数据的描述

练习题(重点要求会在SPSS软件下做表和绘图;考试时,手工计算并绘制)

2.1 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:

B D A B C D B

E A D A B A E

C C B C C C C

C B C D E B C

A C C E D C A

D D A A B D D

C E E B C E C

B C D D C C B

A E C D B E A

E E B C C B E

B A C

A D B

C B C

D C E

E C D

A A B

B E C

D D C

D C B

C B C

(1) 用Excel制作一张频数分布表;

(2) 绘制一张条形图,反映评价等级的分布。 答:(1)服务质量等级评价的频数分布

服务质量等级

A B C D E 合计

家庭数(频率)

14 21 32 18 15 100

频率% 14 21 32 18 15 100

2.2 某行业管理局所属40个企业2008年的产品销售收入数据如下(单位:万元):

152

124

129

116

100

103

92

95

127

104

105 119 114 115 87 103 118 142 135 125

117 108 105 110 107 137 120 136 117 108

97 88 123 115 119 138 112 146 113 126

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;依据

40个企业按产品销售收入分组表

按销售收入分组 (万元) 100以下 100~110 110~120 120~130 130~140 140以上 企业数 (个) 5 9 12 7 4 3 频率 (%) 12.5 22.5 30.0 17.5 10.0 7.5 2K向上累积 ?n向下累积 企业数 40 35 26 14 7 3 频率 100.0 87.5 65.0 35.0 17.5 7.5 企业数 5 14 26 33 37 40 频率 12.5 35.0 65.0 82.5 92.5 100.0 合计

40 100.0 — — — — (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

某管理局下属40个企分组表

按销售收入分组(万元)

企业数(个)

频率(%)

先进企业 良好企业 一般企业 落后企业 合计

11 11 9 9 40

27.5 27.5 22.5 22.5 100.0

2.3 某百货公司连续40天的商品销售额如下(单位:万元):

41 46 35 42

25 36 28 36

29 45 46 37

47 37 34 37

38 37 30 49

34 36 37 39

30 45 44 42

38 43 26 32

43 33 38 36

40 44 44 35

根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

答:频数分布表如下:

某百货公司日商品销售额分组表

按销售额分组(万元)

频数(天)

频率(%)

25~30 30~35 35~40 40~45 45~50

4 6 15 9 6

10.0 15.0 37.5 22.5 15.0

合计 40 100.0

2.4 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:

700 706 708 668 706 694 688 701 693 713

716 715 729 710 692 690 689 671 697 699

728 712 694 693 691 736 683 718 664 725

719 722 681 697 747 689 685 707 681 726

685 691 695 674 699 696 702 683 721 704

709 708 685 658 682 651 741 717 720 729

691 690 706 698 698 673 698 733 677 703

684 692 661 666 700 749 713 712 679 696

705 707 735 696 710 708 676 683 695 717

718 701 665 698 722 727 702 692 691 688

(1)利用计算机对上面的数据进行排序;

(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;

100只灯泡使用寿命非频数分布

按使用寿命分组(小时)

灯泡个数(只)

频率(%)

650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计

2 5 6 14 26 18 13 10 3 3 100

2 5 6 14 26 18 13 10 3 3 100

(3)绘制茎叶图,并与直方图作比较。(计算机的结果是扩展的茎叶图)

茎叶图如下:(手工绘制)

65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

2.5 下面是北方某城市1~2月份各天气温的记录数据:

-3 -14

2 -18

-4 -15

-7 -9

-11 -6

-1 -1

7 0

8 5

9 -4

-6 -9

-7 -3

-6 -8 -12 -16 -19 -15 -22 -25 -24 -19 -21

-8 -6 -15 -11 -12 -19 -25 -24 -18 -17 -24

-14 -22 -13 -9 -6 0 -1 5 -4 -9 -3

-3 2 -4 -4 -16 -1 7 5 -6 -5

(1) 指出上面的数据属于什么类型; 答:属于数值型数据。

(2) 对上面的数据进行适当的分组;

分组 -25~-20 -20~-15 -15~-10 -10~-5 -5~0 0~5 5~10

天数(天)

8 8 10 14 14 4 7

合计

(3) 绘制直方图,说明该城市气温分布的特点。

65

__

说明:该城市一二月份气温较低,零度以上的天数只有11天,多数时间集中在-15度到0度之间。 2.6 下面是某考试管理中心对2007年参加成人自学考试的12000名学生的年龄分组数据:

年龄 18~19 21~21 22~24 25~29 30~34 35~39 40~44 45~59 % 1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2 (1) 对这年龄分布作直方图;

(2) 从直方图分析成人自学考试人员年龄分布的特点。 答:自学考试人员年龄的分布为右偏。

2.7 下面是A、B两个班学生的数学考试成绩数据:

A班: 44 66 73 76 85 B班: 35 55 61 71

39 56 62 73

40 56 63 74

44 57 64 74

44 57 66 79

48 57 68 81

51 58 68 82

52 59 70 83

52 60 70 83

54 61 71 84

57 66 74 77 85

59 67 74 77 86

60 69 74 77 86

61 70 75 78 90

61 70 75 78 92

62 71 75 79 92

63 72 75 80 92

63 73 75 80 93

65 73 76 82 96

85 90 91 91 94 95 96 100 100 100

(1) 将两个班的考试成绩用一个公共的茎制成茎叶图;

A班 数据个数 0 1 2 11 23 7 6 0

(2) 比较两个班考试成绩分布的特点。

答:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。

2.8 1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度

的分布特征。

月份 1 2 3 4 5 6 7 8 9 10 11 12 北京 49 41 47 50 55 57 69 74 68 47 66 56 长春 70 68 50 39 56 54 70 79 66 59 59 57 南京 76 71 77 72 68 73 82 82 71 75 82 82 郑州 57 57 68 67 63 57 74 71 67 53 77 65 武汉 77 75 81 75 71 74 81 73 71 72 78 82 广州 72 80 80 84 83 87 86 84 81 80 72 75 成都 79 83 81 79 75 82 84 78 75 78 78 82 昆明 65 65 58 61 58 72 84 74 77 76 71 71 兰州 51 41 49 46 41 43 58 57 55 45 53 52 西安 67 67 74 70 58 42 62 55 65 65 73 72 树 叶 4 97 97665332110 98877766555554443332100 6655200 632220 3 4 5 6 7 8 9 10 59 0448 122456677789 011234688 00113449 123345 011456 000 树茎 树叶 数据个数 2 4 12 9 8 6 6 3 B班 资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。(探索性分析中绘制)

2.9 某百货公司6月份各天的销售额数据如下(单位:万元):

257

276

297

252

238

310

240

236

265

278

271 292 261 281 301 274 267 280 291 258

272 284 268 303 273 263 322 249 269 295

(1)计算该百货公司日销售额的均值、中位数和四分位数;

(1)X?274.1(万元);Me?272.5(万元) ;QL?260.25(万元);QU?291.25(万元)。(在探索性分析与描述分析中分别求解) (2)计算日销售额的标准差。

(2)s?21.17(万元)。(SPSS中计算)

产品名称 A B C 总

总成本

单位成本(元)

甲企业

2100 3000 1500 6600

乙企业

3255 1500 1500 6255

甲产品个数

140 150 50 340

乙产品个数

15 20 30 65

217 19.41176 75 18.28947 50 342

2.10 甲乙两个企业生产三种产品的单位成本和总成本资料如下:

产品 名称 单位成本 (元) 甲企业 A B C 15 20 30 2100 3000 1500 乙企业 3255 1500 1500 总成本(元) 比较哪个企业的总平均成本高?并分析其原因。 答:甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业生产同一种产品的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

2.11 在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元)

企业数(个)

200~300 300~400 400~500 500~600 600以上 合计 19 30 42 18 11 120 计算120家企业利润额的均值和标准差。

答:

X?426.67(万元),

s?115.9981(万元)

2.12 一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为

50公斤,标准差为5公斤。请回答下面的问题:

(1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。

(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?

(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?

答:(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。

s?11(磅);

女生:X=110(磅),s?11(磅);

(2) 男生:X=132(磅),

(3)68%;(4)95%。

p(55?x?65)

p(40?x?60)166

169

172

2.13 对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:

成年组

177

180

170

172

174

168

173

幼儿组 68 69 68 70 71 73 72 73 74 75

(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么? 答:离散系数,因为它消除了不同组数据水平高地的影响。

(2)比较分析哪一组的身高差异大?

答:成年组身高的离散系数:

172.12.5v??0.035

幼儿组身高的离散系数:;s71.3

Descriptive Statistics 成年组 幼儿组 Valid N (listwise)

N 10 10 10 Minimum 166 68 Maximum 180 75 vs?4.2?0.024;

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

Mean 172.10 71.30 Std. Deviation 4.202 2.497 2.14 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让

他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):

方法A 164 167 168 165 170 165 164 168 164 162 163 166 167 166 165

方法B 129 130 129 130 131 130 129 127 128 128 127 128 128 125 132

方法C 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125

(1)你准备采用什么方法来评价组装方法的优劣?

(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。

方法A 平均 中位数 众数 标准偏差 极差 最小值 最大值

Descriptive Statistics 方法A 方法B 方法C Valid N (listwise) N 15 15 15 15 Range 8 7 12 Minimum 162 125 116 Maximum 170 132 128 Mean 165.60 128.73 125.53 Std. Deviation Variance 2.131 1.751 2.774 4.543 3.067 7.695 165.6 165 164 2.13 8 162 170 方法B 平均 中位数 众数 标准偏差 极差 最小值 最大值 128.73 129 128 1.75 7 125 132 方法C 平均 中位数 众数 标准偏差 极差 最小值 最大值 125.53 126 126 2.77 12 116 128

答:(1)为了具有可比性,选择离散系数并结合其他统计量分析。 方法A的离散系数:0.01286 方法B的离散系数:0.01359 方法C的离散系数:0.02206

(2)选择A方法,因为方法A的离散系数最小,说明该组工人水平平均,且平均水平较高,极差与标准差值也不大。

2.15 在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,

投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。

(1)你认为该用什么样的统计测度值来反映投资的风险?

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?

(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?

答:(1)方差或标准差;(2)商业类股票;(3)如果:我钱很多,我就会都投资(不把鸡蛋放一个篮子里);如果:我钱一般多,我就投科技股(冒险一搏);不过,投资商业股票也不错,(多鸟在林,不如一鸟在手啊);如果:我钱特别少,我还是吃了吧,投资自己吧,总不能饿死啊!!!!呵呵!

第四章

练习题

1.(1)已知??5,得?x?参数估计课后答案

?n?540?0.79

(2)??0.05,E?z??2n?1.96?0.79?1.55

3.

4.解:已知n=8,x?10,s?3.46 置信区间为?x?t0.025(7)??s8,x?t0.025(7)s???(7.1039,12.8961) 8?

6.

p?0.23,n?200,z0.05?1.645,z0.025?1.96置信区间分别为(p?z0.05(p?z0.025p(1?p)np(1?p)n)?(18.1%,27.9%);

)?(17.2%,28.8%)

13.

已知,??2%,E=4%,z0.025?1.96故,n?1.96?0.02?0.980.0422

?47.059?48

练习题答案:

5.1某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高并想寻找证据予以支持。在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?为什么?

答案:研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:

5.2 一条产品生产线用于生产玻璃纸,正常状态下要求玻璃纸的横向延伸率为65,质量控制监督人员需要定期进行抽检,如果证实玻璃纸的横向延伸率不符合规格,该生产线就必须立即停产调整。监控人员应该怎样提出原假设和备择假设,来达到判断该生产线是否运转正常的目的?

答案:0,H1:??65。

5.3 一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60克一袋的那种土豆片的重量不符。店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(克)?进行检验,假设陈述如下:

如果有证据可以拒绝原假设,店方就拒收这批炸土豆片并向供应商提出投诉。 (1)与这一假设检验问题相关联的第一类错误是什么?

(2)与这一假设检验问题相关联的第二类错误是什么?

(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而供应商会将哪类错误看得较为严重? 答案:(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;

(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;

(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。

5.4 某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。

(1) 选择检验统计量并说明其抽样分布是什么样的? (2) 检验的拒绝规则是什么?

(3) 计算检验统计量的值,你的结论是什么?

H:??65z?答案:(1)检验统计量(2)如果

x??s/H0n,在大样本情形下近似服从标准正态分布;

z?z0.05,就拒绝

(3)检验统计量z=2.94>1.645,所以应该拒绝0。

5.5 一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。据报道,10年前每天每个家庭看电视的平均时间是6.70个小时,取显著性水平?=0.01,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”?

答案:z=3.11,拒绝0。

5.6 一个视频录像设备(VCR)的平均使用寿命为6年,标准差为0.75年,而抽选了由30台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。试构造一个假设检验,能够帮助判定电视的使用寿命

HH的方差是否显著大于视频录像设备的使用寿命的标准差。并在?=0.05的显著性水平下做出结论。

H答案:?=103.11,拒绝0。

5.7 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下资料:

操作A

操作B

2n1=100 x1=14.8分钟 s1=0.8分钟

对?=0.02,检验平均装配时间之差是否等于5分钟。 答案:z=-5.145,拒绝

n2=50 x2=10.4分钟 s2=0.6分钟

H0。

5.8 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对?=0.05的显著性水平,用下列数据检验该假设,并对该广告给予评价。 个体 1 2 3 4 购买力得分 看后 6 6 7 4 看前 5 4 7 3 个体 5 6 7 8 购买力得分 看后 3 9 7 6 看前 5 8 5 6 答案:t=1.36,不拒绝0。

5.9 在旅游业中,特定目的地的旅游文化由旅游手册提供,这种小册子由旅游管理当局向有需要的旅游者免费提供。有人曾进行过一项研究,内容是调查信息的追求者(即需要旅游手册者)与非追求者之间在种种旅游消费方面的差别。两个独立随机样本分别由288名信息追求者和367名非信息追求者组成。对样本成员就他们最近一次离家两天或两天以上的愉快旅行或度假提出若干问题。问题之一是:“你这次度假是积极的(即主要包括一些富有挑战性的事件或教育活动),还是消极的(即主要是休息和放松)?”每个样本中消极休假的人数列于下表,试问:这些数据是否提供了充分证据,说明信息追求者消极度假的可能性比非信息追求者小?显著性水平?=0.10。

被调查人数 消极度假人数

信息追求者

288 197

非信息追求者

367 301

H答案:z=-4.05,拒绝0。

5.10 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量的数据(单位为克)如下,请进行检验以确定这两部机器生产的袋茶重量的方差是否存在显著差异。取?=0.05。

机器1 机器2

2.95 3.16 3.20 3.12 3.22

3.45 3.20 3.22 3.30

3.50 3.22 2.98 3.34

3.75 3.38 3.45 3.28

3.48 3.90 3.70 3.29

3.26 3.36 3.34 3.25

3.33 3.25 3.18 3.30

3.20 3.28 3.35 3.27

H

3.38 3.30

3.34 3.28

3.35 3.30

3.19 3.20

3.35 3.16

3.05 3.33

3.36

3.28

答案:F=8.28,拒绝0。

5.11 为比较新旧两种肥料对产量的影响,一边决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:

旧肥料 109 98 103 97 101 98 88 105 97 94 108 102 98 99 102 104 100 104 106 101 105 113 106 110 109 111 117 111 新肥料 110 111 99 103 118 99 107 110 109 112 119 119 H 取显著性水平??0.05用Excel检验:

(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:

a) 两种肥料产量的方差未但相等,即?1??2222;

22b) 两种肥料产量的方差未且不相等,即?1??⑵ 两种肥料产量的方差是否有显著差异?

答案:(1)检验结果如下:

t-检验: 双样本等方差假设

平均 方差 观测值 合并方差 假设平均差

变量 1 100.7 24.11578947

20 28.73684211

0 38 -5.427106029 1.73712E-06 1.685953066 3.47424E-06 2.024394234

变量 2 109.9 33.35789474

20

df t Stat P(T≤t) 单尾 t 单尾临界 P(T≤t) 双尾 t 双尾临界

t-检验: 双样本异方差假设

平均 方差 观测值 假设平均差

变量 1 100.7 24.11578947

20 0 37 -5.427106029 1.87355E-06 1.687094482 3.74709E-06

变量 2 109.9 33.35789474

20

df t Stat P(T≤t) 单尾 t 单尾临界 P(T≤t) 双尾

t 双尾临界

2.026190487

(2)方差检验结果如下:

F-检验 双样本方差分析

平均 方差 观测值

变量 1 100.7 24.11578947

20 19 0.722940991 0.243109655 0.395811384

变量 2 109.9 33.35789474

20 19

df F P(F≤f) 单尾 F 单尾临界

第六章

1. 2.

F?4.6574?F0.01?8.0215

(或P?value?0.0409???0.01),不能拒绝原假设。 (或P?value?0.0003???0.05),拒绝原假设。

,拒绝原假设; ,不能拒绝原假设; ,拒绝原假设。

F?17.0684?F0.05?3.8853xA?xB?44.4?30?14.4?LSD?5.85xA?xC?44.4?42.6?1.8?LSD?5.85xB?xC?30?42.6?12.6?LSD?5.853.

方差分析表中所缺的数值如下表: 差异源 组间 组内 总计 SS 420 3836 df 2 27 29 MS 210 F 1.478 — — P值 0.245946 — — F 临界值 3.354131 — — 142.07 — 4256 F?1.478?F0.05?3.554131(或P?value?0.245946???0.05),不能拒绝原假设。

4. 有5种不同品种的种子和4种不同的施肥方案,在20快同样面积的土地上,分别采用5种种子和4

种施肥方案搭配进行试验,取得的收获量数据如下表:

F种子?7.2397?F0.05?3.2592(或P?value?0.0033???0.05),拒绝原假设。

(或P?value?0.0019???0.05),拒绝原假设。 (或P?value?0.9311???0.05),不能拒绝原假设。

(或P?value?0.1522???0.05),不能拒绝原

? . F施肥方案 2047 > F

9

5.

0 . 05

? 3 . 4903

F地区?0.0727?F0.05?6.9443F包装方法?3.1273?F0.05?6.9443假设。

6.

F广告方案?10.75?F0.05?5.1432F广告媒体?3?F0.05?5.9874(或P?value?0.0104???0.05),拒绝原假设。

(或P?value?0.1340???0.05),不能拒绝原假设。 (或P?value?0.2519???0.05),不能拒绝原假设。 相关与回归分析课后参考答案

F交互作用?1.75?F0.05?5.1432

第7章

2.(1)

(2)负相关关系; (3)

Coefficientsa Standardized Unstandardized Coefficients Model 1 (Constant) 航班正点率 B 6.018 -7.041 Std. Error 1.052 1.418 -.883 Coefficients Beta t 5.719 -4.967 Sig. .001 .002 a. Dependent Variable: 投诉率 回归方程如下:

??6.018?7x y(4)估计的斜率系数为-7,表示航班的正点率每提高1%,10乘客的投诉次数会下降: 7*0.01=0.07次。 (5)如果xf?0.8,则yf?6.018?7?0.8?0.418次。 3. 由SPSS回归输出的结果可以看出: (1)回归结果为

^

Yi?32.99309?0.071619X2i?0.168727X3i?0.179042X3i

(2)由Excel的计算结果已知:3.663731 ,其绝对值均大于临界值 由F=58.20479, 大于临界值

?1,?2,?3,?4对应的 t 统计量分别为10.51206、4.853871、4.222811、

,所以各个自变量都对Y有明显影响。 ,说明模型在整体上是显著的。

t0.025(22?4)?2.101F0.05(4?1,22?4)?3.164.(1)假定该线性回归方程为:yt????xt??t

Model Summary Adjusted R Model 1 R .996a R Square .991 Square .991 Std. Error of the Estimate 3137.800667 a. Predictors: (Constant), 国民总收入x Coefficientsa Standardized Unstandardized Coefficients odel 1 (Constant) 国民总收入x B 2427.030 .546 Std. Error 809.886 .010 .996 Coefficients Beta t 2.997 55.082 Sig. .006 .000 a. Dependent Variable: 最终消费y ??0.546 ??2427.03,?参数估计值:?(2)可决系数= R Square=0.991,回归估计的标准误差= Std. Error of the Estimate=3137.800667,可判断回归方程拟合优良。

(3)因为p-value=sig=0<0.05,或因为t=55.082>t0.025=2.0484,故通过显著性检验,回归系数显著不为0。 (4)点预测即可。

如果xf?236000,则yf?2427.03?0.546?236000?131283亿元。

6. (1)用SPSS输入Y和X数据,生成X和X的数据,用Y对X、X、X回归,估计参数结

^2323果为

Yi??1726.73?7.879646874Xi?0.00895X222?3.71249E?06X3

t=(-1.9213) (2.462897) (-2.55934) (3.118062) R?0.973669 R?0.963764

t(12?4)?2.306 (2)检验参数的显著性:当取??0.05时,查t分布表得0.025,与t统计量对

比,除了截距项外,各回归系数对应的t统计量的绝对值均大于临界值,表明在这样的显著性水平下,回归系数显著不为0。

(3)检验整个回归方程的显著性:模型的R?0.973669,R22?0.963794,说明可决系数较高,

对样本数据拟合较好。由于F=98.60668,而当取??0.05时,查F分布表得F0.05(4?1,12?4)?4.0723,因为F=98.60668>4.07,应拒绝

2H0:?2??3??4?0,说明X、

X、X联合起来对Y确有显著影响。

(4)计算总成本对产量的非线性相关系数:因为R?0.973669因此总成本对产量的非线性相关系数为R?0.973669或R=0.9867466

(5)评价:虽然经t检验各个系数均是显著的,但与临界值都十分接近,说明t检验只是勉强通过,

2t(12?4)?3.3554其把握并不大。如果取??0.01,则查t分布表得0.005,这时各个参数对应的H:?t统计量的绝对值均小于临界值,则在??0.01的显著性水平下都应接受07. (1)该回归分析中样本容量是14+1=15; (2)计算RSS=66042-65965=77;

ESS的自由度为k-1=2,RSS的自由度 n-k=15-3=12;

(3)计算:可决系数 R?65965/66042?0.9988

2j?0的原假设。

R?1?修正的可决系数

215?115?3?(1?0.9988)?0.9986

(4)检验X2和X3对Y是否有显著影响

F?ESS/(k?1)RSS/(n?k)?65965/277/12?329826.4166?5140.11

(5) F统计量远比F临界值大,说明X2和X3联合起来对Y有显著影响,但并不能确定X2和X3各自对Y的贡献为多少。 第八章

8.1 某汽车制造厂2005年产量为30万辆。

(1)若规定2006—2008年年递增率不低于6%,其后年递增率不低于5%,2010年该厂汽车产量将达到多

少?

(2)若规定2015年汽车产量在2005年的基础上翻一番,而2006年的增长速度可望达到7.8%,问以后9

年应以怎样的速度增长才能达到预定目标?

(3)若规定2015年汽车产量在2005年的基础上翻一番,并要求每年保持7.4%的增长速度,问能提前多少时间达到预定目标?

8.2 某地区社会商品零售额1993—1997年期间(1992年为基期)每年平均增长10%,1998—2002年期间每年平均增长8.2%,2003—2008年期间每年平均增长6.8%。问2008年与1982年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若2002年社会商品零售额为30亿元,按此平均增长速度,2009年的社会商品零售额应为多少? 8.3某地区国内生产总值在1998—2000年平均每年递增12%,2001--2004年平均每年递增10%,2005--2007年平均每年递增8%。试计算:

(1)该地区国内生产总值在这10年间的发展总速度和平均增长速度;

(2)若2007年的国内生产总值为500亿元,以后平均每年增长6%,到2009年可达多少?

(3)若2009年的国内生产总值的计划任务为570亿元,一季度的季节比率为105%,则2009年一季度的计划任务应为多少?

8.4 某公司近10年间股票的每股收益如下(单位:元):

0.64,0.73,0.94,1.14,1.33,1.53,1.67,1.68,2.10,2.50 (1)分别用移动平均法和趋势方程预测该公司下一年的收益;

(2)通过时间序列的数据和发展趋势判断,是否是该公司应选择的合适投资方向? 8.5某县2000—2003年各季度鲜蛋销售量数据如下(单位:万公斤)

年份 2000 2001 2002 2003 一季度 13.1 10.8 14.6 18.4 二季度 13.9 11.5 17.5 20.0 三季度 7.9 9.7 16.0 16.9 四季度 8.6 11.0 18.2 18.0 (1)用移动平均法消除季节变动; (2)拟合线性模型测定长期趋势; (3)预测2004年各季度鲜蛋销售量。

8.6某地区2000—2003年各月度工业增加值的数据如下(单位:亿元) 年份 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 2000 4.78 3.97 5.07 5.12 5.27 5.45 4.95 5.03 5.37 5.34 5.54 5.44 2001 5.18 4.61 5.69 5.71 5.90 6.05 5.65 5.76 6.14 6.14 6.47 6.55 2002 6.46 5.62 6.96 7.12 7.23 7.43 6.78 6.76 7.03 6.85 7.03 7.22 2003 6.82 5.68 7.38 7.40 7.60 7.95 7.19 7.35 7.76 7.83 8.17 8.47 (1)用原始资料平均法计算季节比率; (2)用移动平均法分析其长期趋势。

8.7运用练习题9.7中国各月工业总产值的数据,作以下分析:

(1)分析其长期趋势;

(2)剔除长期趋势后分析其季节变动情况,并与练习题9.7的分析结果对比说明有何不同、为什么? (3)分析是否存在循环变动。 答案

8.1(1)30× 1.06×1.05= 30×1.3131 = 39.393(万辆)

32(30?2)/(30?1.078)?1?(2)992/1.078?1?7.11%

(3)设按7.4%的增长速度n年可翻一番 则有 1.074?60/30?2

所以 n = log2 / log1.074 = 9.71(年)

故能提前0.29年达到翻一番的预定目标。

8.2(1)以1992年为基期,2008年与1992年相比该地区社会商品零售额共增长: (1?10%)?(1?8.2%)?(1?6.8%)(2)年平均增长速度为

1555555n?1?3.3186?1?2.3186?231.86%

5(1?10%)?(1?8.2%)?(1?6.8%)7?1=0.0833=8.33%

(3) 2009年的社会商品零售额应为

30?(1?0.0833)?52.509(亿元)

8.3(1)发展总速度(1?12%)?(1?10%)?(1?8%)平均增长速度=

10343?259.12%

259.12%?1?9.9892%

2 (2)500?(1?6%)?561.8(亿元)

y?(3)平均数

144?j?1yj?5704?142.5(亿元),

2009年一季度的计划任务:105%?142.5?149.625(亿元)。

^8.4 (1)用每股收益与年份序号回归得

Yt?0.365?0.19t3。预测下一年(第11年)的每股收益为

??0.365?0.193?11?2.488Y11元

(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。是一个较为适合的投资方向。

8.5(1)移动平均法消除季节变动计算表 年别 2000年 2001年 2002年 2003年 季别 一季度 二季度 三季度 四季度 一季度 二季度 三季度 四季度 一季度 二季度 三季度 四季度 一季度 鲜蛋销售量 13.1 13.9 7.9 8.6 10.8 11.5 9.7 11 14.6 17.5 16 18.2 18.4 四项移动平均值 10.875 10.3 9.7 10.15 10.75 11.7 13.2 14.775 16.575 17.525 18.15 18.375 ?)移正平均值(T — — 10.5875 10 9.925 10.45 11.225 12.45 13.9875 15.675 17.05 17.8375 18.2625 二季度 三季度 四季度 20 16.9 18 18.325 18.35 (2)t (3)趋势剔出法季节比例计算表(一) 年别 2000年 2001年 2002年 2003年 季别 一季度 二季度 三季度 四季度 一季度 二季度 三季度 四季度 一季度 二季度 三季度 四季度 一季度 二季度 三季度 四季度 时间序列号t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 鲜蛋销售量 13.1 13.9 7.9 8.6 10.8 11.5 9.7 11 14.6 17.5 16 18.2 18.4 20 16.9 18 预测 鲜蛋销售量 9.332352941 9.972205882 10.61205882 11.25191176 11.89176471 12.53161765 13.17147059 13.81132353 14.45117647 15.09102941 15.73088235 16.37073529 17.01058824 17.65044118 18.29029412 18.93014706 趋势剔除值 1.403718878 1.39387415 0.74443613 0.764314561 0.908191531 0.917678812 0.736440167 0.796447927 1.010298368 1.159629308 1.0171076 1.111739923 1.081679231 1.133116153 0.923987329 0.950864245 ??8.9625?0.63995?tT上表中,其趋势拟合为直线方程 季度 年度 2000年 2001年 2002年 2003年 平 均 季节比率% ??8.9625?0.63995?tTt。

趋势剔出法季节比例计算表(二)

一季度 1.403719 0.908192 1.010298 1.081679 1.100972 1.097301 二季度 1.393874 0.917679 1.159629 1.133116 1.151075 1.147237 三季度 0.744436 0.73644 1.017108 0.923987 0.855493 0.852641 四季度 0.764315 0.796448 1.11174 0.950864 0.905842 0.902822 — — — — 4.013381 4.00000 根据上表计算的季节比率,按照公式

2004年第一季度预测值:

???T??SYttt?KL计算可得:

??(8.9625?0.63995?17)?1.097301?21.7723??T??SY171712004年第二季度预测值:

??(8.9625?0.63995?18)?1.147237?23.49725??T??SY181822004年第三季度预测值:

??(8.9625?0.63995?19)?0.852641?18.009??T??SY191932004年第四季度预测值:

??(8.9625?0.63995?20)?0.902822?19.6468??T??SY202048.6 (1)用原始资料法计算的各月季节比率为:

月份 季节比率 月份 季节比率 1月 0.9195 7月 0.9722 2月 0.7868 8月 0.9851 3月 0.9931 9月 1.0407 4月 1.0029 10月 1.0350 5月 1.0288 11月 1.0765 6月 1.0637 12月 1.0958

平均法计算季节比率表: 年别 月份 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 平均 2000年 4.78 3.97 5.07 5.12 5.27 5.45 4.95 5.03 5.37 5.34 5.54 5.44 2001年 5.18 4.61 5.69 5.71 5.90 6.05 5.65 5.76 6.14 6.14 6.47 6.55 2002年 6.46 5.62 6.96 7.12 7.23 7.43 6.78 6.76 7.03 6.85 7.03 7.22 2003年 6.82 5.68 7.38 7.40 7.60 7.95 7.19 7.35 7.76 7.83 8.17 8.47 平均 5.80875 4.97025 6.2735 6.33575 6.49925 6.7195 6.1415 6.223 6.574 6.53825 6.80025 6.9225 6.317208 季节比率% 0.9195 0.7868 0.9931 1.0029 1.0288 1.0637 0.9722 0.9851 1.0407 1.0350 1.0765 1.0958 1.0000 季节比率的图形如下:

1.201.000.800.600.400.200.00123456789101112季节比率

(2)用移动平均法分析其长期趋势

年月 序号 工业总产值(亿元) Jan-00 Feb-00 Mar-00 Apr-00 May-00 Jun-00 1 2 3 4 5 6 4.78 3.97 5.07 5.12 5.27 5.45 5.13 移动平均 移正平均 Jul-00 Aug-00 Sep-00 Oct-00 Nov-00 Dec-00 Jan-01 Feb-01 Mar-01 Apr-01 May-01 Jun-01 Jul-01 Aug-01 Sep-01 Oct-01 Nov-01 Dec-01 Jan-02 Feb-02 Mar-02 Apr-02 May-02 Jun-02 Jul-02 Aug-02 Sep-02 Oct-02 Nov-02 Dec-02 Jan-03 Feb-03 Mar-03 Apr-03 May-03 Jun-03 Jul-03 Aug-03 Sep-03 Oct-03 Nov-03 Dec-03 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 4.95 5.03 5.37 5.34 5.54 5.44 5.18 4.61 5.69 5.71 5.90 6.05 5.65 5.76 6.14 6.14 6.47 6.55 6.46 5.62 6.96 7.12 7.23 7.43 6.78 6.76 7.03 6.85 7.03 7.22 6.82 5.68 7.38 7.40 7.60 7.95 7.19 7.35 7.76 7.83 8.17 8.47 5.11 5.14 5.20 5.25 5.30 5.35 5.40 5.46 5.52 5.58 5.65 5.73 5.82 5.93 6.01 6.12 6.23 6.35 6.46 6.55 6.64 6.71 6.77 6.82 6.88 6.91 6.91 6.94 6.97 7.00 7.04 7.08 7.12 7.19 7.27 7.36 7.46 5.17 5.22 5.27 5.32 5.37 5.43 5.49 5.55 5.62 5.69 5.77 5.87 5.97 6.06 6.18 6.29 6.40 6.51 6.60 6.68 6.74 6.80 6.85 6.89 6.91 6.93 6.96 6.98 7.02 7.06 7.10 7.15 7.23 7.31 7.41 原时间序列与移动平均的趋势如下图所示:

8.007.006.005.004.003.002.001.000.001471013161922252831移动平均原时间序列34

8.7(1)采用线性趋势方程法:

年月 Jan-83 Feb-83 Mar-83 Apr-83 May-83 Jun-83 Jul-83 Aug-83 Sep-83 Oct-83 Nov-83 Dec-83 Jan-84 Feb-84 Mar-84 Apr-84 May-84 Jun-84 Jul-84 Aug-84 Sep-84 Oct-84 Nov-84 Dec-84 Jan-85 Feb-85 Mar-85 Apr-85 ??460.0607?7.0065tTi剔除其长期趋势。

趋势分析法剔除长期趋势表 工业总产值(亿元) 477.9 397.2 507.3 512.2 527 545 494.7 502.5 536.5 533.5 553.6 543.9 518 460.9 568.7 570.5 590 604.8 564.9 575.9 613.9 614 646.7 655.3 645.7 562.4 695.7 712 长期趋势值 467.0672 474.0737 481.0802 488.0867 495.0932 502.0997 509.1062 516.1127 523.1192 530.1257 537.1322 544.1387 551.1452 558.1517 565.1582 572.1647 579.1712 586.1777 593.1842 600.1907 607.1972 614.2037 621.2102 628.2167 635.2232 642.2297 649.2362 656.2427 剔除长期趋势 1.023193 0.837844 1.054502 1.049404 1.064446 1.085442 0.971703 0.973625 1.025579 1.006365 1.030659 0.999561 0.939861 0.825761 1.006267 0.997091 1.018697 1.031769 0.952318 0.959528 1.011039 0.999668 1.041032 1.043111 1.016493 0.875699 1.071567 1.084964 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 May-85 Jun-85 Jul-85 Aug-85 Sep-85 Oct-85 Nov-85 Dec-85 Jan-86 Feb-86 Mar-86 Apr-86 May-86 Jun-86 Jul-86 Aug-86 Sep-86 Oct-86 Nov-86 Dec-86

29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 723.1 743.2 678 676 703 685.3 703.3 722.4 681.9 567.6 737.7 739.6 759.6 794.8 719 734.8 776.2 782.5 816.5 847.4 663.2492 670.2557 677.2622 684.2687 691.2752 698.2817 705.2882 712.2947 719.3012 726.3077 733.3142 740.3207 747.3272 754.3337 761.3402 768.3467 775.3532 782.3597 789.3662 796.3727 1.090239 1.108831 1.001089 0.987916 1.016961 0.981409 0.997181 1.014187 0.948003 0.781487 1.005981 0.999027 1.016422 1.053645 0.944387 0.956339 1.001092 1.000179 1.034374 1.064075 剔除长期趋势后分析其季节变动情况表

年份 月份 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 (3)运用分解法可得到循环因素如下图:

1983年 1.023193 0.837844 1.054502 1.049404 1.064446 1.085442 0.971703 0.973625 1.025579 1.006365 1.030659 0.999561 1984年 0.939861 0.825761 1.006267 0.997091 1.018697 1.031769 0.952318 0.959528 1.011039 0.999668 1.041032 1.043111 1985年 1.016493 0.875699 1.071567 1.084964 1.090239 1.108831 1.001089 0.987916 1.016961 0.981409 0.997181 1.014187 1986年 0.948003 0.781487 1.005981 0.999027 1.016422 1.053645 0.944387 0.956339 1.001092 1.000179 1.034374 1.064075 季节比率% 0.981888 0.830198 1.034579 1.032622 1.047451 1.069922 0.967374 0.969352 1.013668 0.996905 1.025812 1.030234 1.151.11.0510.950.90.850.8111621263136414616