统计分析作业解答 下载本文

第一讲作业只要在计算机完成即可,不要写在作业本。

第二讲 作业

1、欲研究不同收入的群体对某种特定的商品是否有相同的购买习惯,市场研究人员调查了四个收入的组的消费者共527人,购买习惯分为:经常购买、不购买、有时购买。调查结果如下: 购买习惯 低收入组 偏低收入组 偏高收入组 高收入组 经常购买 25 40 47 46 不购买 69 51 74 57 有时购买 36 26 19 37 试分别绘制简单条图、分组条图和堆积图来分析不同收入组的购买习惯。 2、对第一讲作业中学生消费调查的数据文件,利用描述统计过程分析这31名学生消费的分布情况。

(1)计算平均月生活费、月平均衣物消费的方差、标准差、全距、最大值、最小值、中位数、众数、偏度与峰度等指标; (2)列出频数分布表;

(3)画出带有正态曲线的频数直方图;

(4)将平均月生活费范围从400以下、400到600、600到800、800以上进行分组,再做频数分布。

3、案例分析:亚太地区25所知名商学院有关情况 一、案例背景

寻求工商管理专业较高的学历已是一种世界趋势。有调查表明,越来越多的亚洲人选择就读工商管理硕士(MBA)学位,将它当作通往成功的道路。在近一年来,亚太地区的学院里申请MBA的人数增长了30%。根据亚太地区的74所商学院的报道,1997年共有170000申请者竞争1999年的11000个全日制MBA

学位。

在整个亚太地区,成千上万的人对于暂时搁置自己的工作并花两年的时间来接受工商管理系统教育,显示了日益增长的热情。这些工商管理课程显然十分繁重,包括经济学、金融学、市场营销学、行为科学、劳工关系学、决策论、运筹学、经济法等。

下表是Asia公司提供的数据,显示了亚太地区25所知名商学院的情况,许多人希望了解诸如本国学生学费和外国学生学费的比较;毕业后的薪金等情况。

二、案例资料

本国

商学院名称

录取名额

学生学费($)

墨尔本商学院

新南威尔士大学(悉尼) 印度管理学院(阿默达巴得) 香港大学 日本国际大学

亚洲管理学院(马尼拉) 印度管理学院(班加罗尔) 新加坡国立大学

印度管理学院(加尔格达) 澳大利亚国立大学(堪培拉) 南洋理工大学(新加坡) 昆士兰大学(布里斯本) 香港理工大学

麦夸里商学院(悉尼) Chulalongkorn大学(曼谷) Monash Mt.Eliza商学院(墨尔本) 亚洲管理学院(曼谷) 阿德莱德大学

梅西大学(新西兰,北帕默斯顿) 墨尔本皇家工商学院

Jamnalal Bajaj管理学院(孟买) 柯廷理工学院(珀思) 拉合尔管理科学院

马来西亚Sains大学(槟城) De La Salle大学(马尼拉)

200 228 392 90 126 389 380 147 463 42 50 138 60 12 200 350 300 20 30 30 240 98 70 30 44

24420 19993 4300 11140 33060 7562 3935 6146 2880 20300 8500 16000 11513 17172 17355 16200 18200 16426 13106 13880 1000 9475 11250 2260 3300

外国学生学费($) 29600 32582 4300 11140 33060 9000 16000 7170 16000 20300 8500 22800 11513 19778 17355 22500 18200 23100 21625 17765 1000 19097 26300 2260 3600

28 29 22 29 28 25 23 29 23 30 32 32 26 34 25 30 29 30 37 32 24 29 23 32 28 年龄

国外学生比例(%)

47 28 0 10 60 50 1 51 0 80 20 26 37 27 6 30 90 10 35 30 0 43 2.5 15 3.5

是否要求

GMAT

是否要求英语测试 否 否 否 否 是 否 否 是 否 是 否 否 否 否 否 是 是 否 是 是 否 否 否 是 否

是否要求工作经验 是 是 否 否 否 是 否 是 否 是 是 是 是 是 是 是 是 是 是 是 是 是 否 是 是

71400 65200 7100 31000 87000 22800 7500 43300 7400 46600 49300 49600 34000 60100 17600 52500 25000 66000 41400 48900 7000 55000 7500 16000 13100 起薪($)

是 是 否 是 是 是 是 是 否 是 是 否 是 否 是 是 否 否 否 否 否 是 否 否 是

资料来源∶《商务与经济统计》 戴维.R. 安德森等著 机械工业出版社

三、案例分析

1、对录取名额、年龄和起薪等变量数据用频数分析,求出最大值、最小值、平均数以及适当的分位数进行评价和解释;通过这些描述统计量,你对亚太地区的商学院有何看法或发现?并讨论你的结论;

2、对外国学生的比例进行描述分析; 3、对本国学生学费和外国学生学费进行比较;

4、对要求或不要求工作经验的学校学生的起薪进行比较;

5、对要求或不要求英语测试的学校学生的起薪进行比较; 6、对要求或不要求GMAT和工作经验进行列联表分析; 请通过以上数据与图表的分析写出管理报告。

第二讲作业的第一题也在计算机完成。 第二题解答为: (1)

? 平均月生活费:500,方差为54298.851、标准差为233.021、全距为700、 ? 最大值为1000、最小值为300、中位数为500、众数500、偏度为0.458(右偏)、峰度为-0.976

? 月平均衣物支出:150 方差为9397.385、标准差为96.940、

? 全距为320、最大值为350、最小值为30、中位数为150、众数为150、 ? 偏度为0.599(右偏)、峰度为-0.709 (2)(3)不要写在作业本 (4)

解:将平均月生活费范围从400以下、400到600、600到800、800以上进行分组,频数分布为:

范围 频数 频率 累积频率 400元以下 7 23.3% 23.3%

400元到600元 12 40% 60.23% 600元到800元 6 20% 80.23% 800元以上 5 16.7% 100% 第三题解答

1、对录取名额、年龄和起薪等变量数据用频数分析,求出最大值、最小值、平均数以及适当的分位数进行评价和解释。

录取名额、年龄和起薪的平均数分别为165.16、28.36、37292,最大值分别为463、37、87000,最小值分别为12、22、7000,在四分位数中,各院校录取年龄25岁以下为25%、31岁以上也有25%,而由录取名额为43名以下25%,270名以上也有25%,毕业后起薪为14550美元以下为25%,53750美元以上也有25%。

2、对外国学生的比例进行描述分析

亚太地区的商学院国外学生最高比例达到90%如亚洲管理学院(曼谷),但最低比例却也有0%,如印度管理学院(阿默达巴得)、印度管理学院(班加罗尔)很少或者说基本上不招收外国学生,其余大部分学校的外国留学生比例都维持在20%——30%左右。由此可知,外国学生在亚太区商学院的比例存在较大的差别。 3、对本国学生学费和外国学生学费进行比较

本国学生学费的均值12374.9,低于外国学生学费均值16581.80,却外国学生学费的标准差高于本国学生学费的标准差,另外,本国学生学费是一定的偏右分布,偏度统计量为0.622,尖峰分布为0.506,而外国学生的学费是偏左分布,由此可见本国学生的大部分人的学费低于平均水平,而外国学生中的大部分人的学费高于平均水平。

4、对要求或不要求工作经验的学校学生的起薪进行比较

要求工作经验学生起薪的平均值为41305.26,要高于不要求工作经验的均值24583.33,要求工作经验起薪分布是偏左分布,而不要求工作经验的起薪是偏右分布(统计量分别为-0.2972.0417),可见,有工作经验的的学生起薪一般高于没有工作经验的。

5、对要求或不要求英语测试的学校学生的起薪进行比较

要求英语测试的学生起薪的最大值最小值和均值都高于不要求英语测试的起薪,且两者的分布均呈现偏右分布,由此可见,大部分学生起薪都低于平均水平,但是英语水平高的学生起薪要高于英语水平低的学生起薪。 6、对要求或不要求GMAT和工作经验进行列联表分析

(1)对是否要求GMAT进行分析,在要求GMAT中,要求工作经验的比例为78.6%,大于不要求工作经验的比例21.4%。在不要求GMAT中,要求工作经验的比例为72.7%,大于不要求工作经验的27.3%。可见是否要求GMAT对是否要求工作经验影响不大。

(2)对是否要求工作经验进行分析,在要求工作经验中,要求GMAT的比例为78.6%,大于不要求GMAT的比例72.7%。但两者相差不大,在不要求工作经验中,要求GMAT的比例为21.4%,小于不要求GMAT的比例24%,但两者相差不大,可见是否有工作经验对是否要求GMAT影响较大。

(3)卡方的频率P-值为0.734,大于显著性水平0.05,因此不能拒绝原假设,认为是否要求GMAT对是否要求工作的看法是一致的。

案例分析每个人的解答不必完全相同,可根据自已的思路和题目要求进行。

第三讲作业

1、由10名学生组成一个随机样本,让他们分别采用A、B不同的两份试题进行测试,得分结果如下表:

试求两种试题平均分数之差的95%的置信区间。

2、糖厂用自动打包机打包,每包标准重量是0.5kg。每天开工后需要检查一次打包机工作是否正常,某日开工后测得9包重量(单位:kg)如下:0.497 0.506 0.518 0.524 0.488 0.511 0.510 0.515 0.512 ,已知包重服

2

从正态分布N(O.5,0.012),试检验该日打包机工作是否正常。(??0.05) 3、某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下:

159 280 101 212 224 379 179 264

222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命显著地大于225小时?(??0.01) 4、装配一个部件时可以采用不同的方法,所关心的问题是那一个方法效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下:

31 34 29 32 35 38 34 30 29 32 31 26 26 24 28 29 30 29 32 31 29 32 28 26

两总体为正态总体,且方差相等。问两种方法的装配时间有无显著差别?(??0.05)

5、 案例分析:爱华公司

爱华公司是一家专门从事减肥的妇女健美沙龙。为了吸引更多的顾客参加,爱华公司市场推广部张经理收集了一个由历时12周的引导性减肥项目之前与之后的30名客户样本体重,如下表,张经理希望能向顾客提供一份报告阐述公司执行引导性减肥项目的有效性,报告包括以下几个问题:

1、 将客户参加执行引导性减肥项目之前与之后的样本体重数据进行描述性统计总结; 2、 客户参加执行引导性减肥项目前、后体重总体均值95%的置信区间是多少?两总体均值

之差的95%的置信区间是多少?

3、 公司引导性减肥项目是否有效?还可以通过什么检验及数据进一步得出结论?

第一题解答

解:这题为配对样本,题目只求两种试题平均分数之差的95%的置信区间。 所以两种试题平均分数之差的95%的置信区间为(6 .372, 15.673)

若题目要问两份试题是否有显著差异,还要做假设检验,自已完成假设检验。 第二题解答:

解:这是单个总体均值的双尾检验问题。

设H0:?=0.5 H1: ? ? 0.5

T统计量T=2.471,相应P=0.038<0.05,故拒绝原假设。认为打包机的工作时不正常的。 第三题解答:

解 这是单个总体均值的右尾检验问题。

设H0:? ? 225 H1: ? > 225

T统计量T=0.669,相应 P=0.514/2=0.257>0.01,故接受H0,即在??0.01的显著性水平上没有理由认为元件的平均寿命显著地大于225小时。 第四题解答:

解 这是两个独立总体均值之差的检验问题。

设H0:?1 - ?2 =0 H1: ?1 - ?2 ? 0

因为两总体为正态总体,且方差相等

所以t统计量为2.648,相应P值为0.015<0.05,则拒绝。则两种方法的装配时间有显著差别。 第五题解答:

(1)客户参加执行引导性减肥项目之前与之后的样本体重数据的描述性统计总结,按下表的结果,简单写出一些统计量即可。

(2)客户参加执行引导性减肥项目前体重总体均值95%的置信区间为(179.0301,214.5032),客户参加执行引导性减肥项目后体重总体均值95%的置信区间为(157.4756,174.8577),两总体均值之差的95%的置信区间是(16.2476,44.9524)。

(3)分析:

A、减肥前与减肥样本体重数据发生明显变化,减肥前体重最高为300斤,最低为132斤,平均体重为196.76斤,体重在181斤以上的占50%,其中有25%在229斤以上。而减肥后体重最高为219斤,最低为130斤,平均体重为166.1667斤,体重在155斤以上的占50%,其中有25%在183斤以上。从样本数据比较中初步可知公司执行引导性减肥项目有一定疗效。

B、有95%把握推断客户参加引导性减肥项目之前及之后的平均体重分别为179-214斤之间和154—174斤之间;有95%把握推断客户参加引导性减肥项目之前及之后的平均体重之差分别在16.24—44.95斤之间。

通过以上的分析,可以认为客户参加引导性减肥项目之前之后的体重有明显差异,表明公司执行引导性减肥项目对客户体重减轻有一定疗效。

第四讲作业

1、为了研究学生学习数学的成绩是否受教师教学水平的影响,现将一个数学提高班的学生分成三个小班,分别由甲、乙、丙三位教师任教。三个班部分学生的最终成绩见下表。假定三个班学生的最终成绩服从正态分布,试问三个班学生的最终成绩是否有在显著的差异?如果有显著差异,用LSD方法检验哪个老师之间有差异,应推举哪位教师担任此班教学使教学效果更好?(α=0.05)

2、为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项试

验,考察三种广告方案和两种广告媒体,获得的销售量数据见下表, 检验广告方案、广告媒体或其交互作用对销售量的影响是否显著? (?=0.05)

A 广告方案 B C 广告媒体 报纸 电视 8 12 12 8 22 26 14 30 10 18 18 14 第一题

(1)解答: 设 ? ? 2 , ? 3 分别为甲、乙、丙老师所教班级学生的学习平均1,成绩。

H0:?1??2??3

H1:?1,?2,?3不全相等

F统计量为6.382.在?=0.05的显著性水平下,P值=0.013 <0.05,拒绝原假设,则认为三个班学生的最终成绩存在显著差异

(2)解答:用LSD方法检验可知,甲乙老师之间和甲丙老师之间的P值分别0.025和0.005,小于显著水平0.05,因此认为甲乙老师之间和甲丙老师之间存在显著差异。

而丙老师与乙老师不存在显著差异。 由描述统计表格中可知,甲乙丙老师所教学生成绩的均值分别为63,81,85,乙丙老师的学生成绩高于甲老师学生的成绩,而丙老师学生的成绩高于乙老师学生的成绩。所以选择丙老师担任此班教学效果更好。 第二题

? 解答:设广告方案A、B、C的平均销售量为a1、a2、a3,广告媒体的平均销售量为b1、b2

? 又设

H0:a1?a2?a31H0:b1?b2H02:无交互作用? 由上表可知,在?=0.05的显著性水平下,广告方案的P值=0.010<0.05,广告媒体的P值=0.134>0.05,广告方案*广告媒体的P值=0.252>0.05,则可

认为,广告方案对销售量的影响显著,广告媒体及广告方案和广告媒体的交互作用对销售量的影响不显著。

第五讲 作业

1、7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据见

表5-1,求:

(1) 人均GDP作自变量,人均消费水平作因变量,绘制散点图,并

说明二者之间的关系形态。

(2) 计算两个变量之间的线性相关系数,说明两个变量之间的关系

强度。

(3) 利用最小二乘法求出估计的回归方程,并解释回归系数的实际

意义。

(4) 计算判定系数,并解释其意义。

(5) 检验回归方程线性关系的显著性 (?=0.05)

(6) 如果某地区的人均GDP为5000元,预测其人均消费水平。 (7) 求人均GDP为5000元时,人均消费水平95%的置信区间和预测

区间。

表5-1

地区 北京 辽宁 上海 江西 河南 贵州 陕西

人均GDP(元) 人均消费水平

(元)

22460 7326 11226 4490 34547 11546 4851 2396 5444 2208 2662 1608 4549 2035

2、一家房地产评估公司想对某城市房地产销售价格y与地产的评估价格x1、房

产的评估价值x2和使用面积x3建立一个模型,以便对销售价格做出合理的预测。为此,收集了20栋住宅的房地产评估数据,如表5-2。

要求:(取α=0.05) (1)、建立房地产评估多元回归模型。

(2)、检验回归方程的线性关系是否显著。 (3)、检验各回归系数是否显著。 (4)、若地产的评估价格x1=1500(万元),房产的评估价值x2=4200(万元),使用面积x3=21000(m2),试预测销售价格y的值及销售价格95%的预测区间。

第一题解答:

(1) 从散点图可知,人均消费水平与人均GDP近似线性关系

(2)变量y与GDP的相关系数r=0.998,双侧检验P=0.00<0.05,故变量y与人均GDP之间显著相关。 (3)一元线性回归方程为:

?

y?734.693?0.309GDP

?0.000?P值?0.003?,

?P?0.000?R2?0.996,F?1331

经济意义为:我国国内生产总值GDP的系数为0.309为正数,符合经济意义,并表示每增加一百元GDP,人均消费水平增加30.9元。

(4)拟合优度检验:由判定系数R2=0.996,大于0.7,说明模型对数据的拟合程度较高。即解释变量可以解释模型解释的部分达到99.6%.

(5)F检验: 由F=1331.692,检验P=0.000<0.05,即可认为回归模型具有显著意义。这说明原先的线性模型假设是对的。

t检验:对于t检验,先检验GDP,因为GDP的t统计量为5.265,检验P=0.003<0.05,故GDP为y的自变量,再检验常数项,因为常数项的t统计量为36.492,检验P=0.000<0.05 ,所以常数项的t检验通过。

(6)如果某地区的人均GDP为5000元,预测其人均消费水平得Y=2279.693 。 (7)人均GDP为5000元时,人均消费水平95%的置信区间为(1990.74915 2565.46399)和预测区间为(1580.46315 2975.74999)。

第二题解答:

(1)房地产评估多元回归模型为:

y?148.7?0.815x1?0.821x2?0.135x3

T值 (0.259)(1.591) (3.888) (2.050) P值(0.799)(0.131) (0.001) (0.057) R2=0.897 F=46.697(P=0.000)

(2)因为F=46.697,p=0.0000〈0.05,所以回归方程的线性关系显著。 (3)从t检验的P值:其中x2回归系数的P=0.001<0.05,x3回归系数的P=0.057>0.05,x1回归系数的P=0.131>0.05,所以y与x2的线性关系显著,而y与x1、x3的线性关系不显著。

(4)若公司计划在未来的某个销售周期中,地产的评估价格x1=1500(万元),房产的评估价值x2=4200(万元),使用面积x3=21000(m2)则该房地产销售价格y的预测值为7616.60(元 / 平方米),预测区间为:(6770 8539.4)。

复习还有曲线估计的内容,可复习课本的例子及上课举的例子。聚类分析与因子分析不考,考试可看书,题型与作业相同。