5、 案例分析:爱华公司
爱华公司是一家专门从事减肥的妇女健美沙龙。为了吸引更多的顾客参加,爱华公司市场推广部张经理收集了一个由历时12周的引导性减肥项目之前与之后的30名客户样本体重,如下表,张经理希望能向顾客提供一份报告阐述公司执行引导性减肥项目的有效性,报告包括以下几个问题:
1、 将客户参加执行引导性减肥项目之前与之后的样本体重数据进行描述性统计总结; 2、 客户参加执行引导性减肥项目前、后体重总体均值95%的置信区间是多少?两总体均值
之差的95%的置信区间是多少?
3、 公司引导性减肥项目是否有效?还可以通过什么检验及数据进一步得出结论?
第一题解答
解:这题为配对样本,题目只求两种试题平均分数之差的95%的置信区间。 所以两种试题平均分数之差的95%的置信区间为(6 .372, 15.673)
若题目要问两份试题是否有显著差异,还要做假设检验,自已完成假设检验。 第二题解答:
解:这是单个总体均值的双尾检验问题。
设H0:?=0.5 H1: ? ? 0.5
T统计量T=2.471,相应P=0.038<0.05,故拒绝原假设。认为打包机的工作时不正常的。 第三题解答:
解 这是单个总体均值的右尾检验问题。
设H0:? ? 225 H1: ? > 225
T统计量T=0.669,相应 P=0.514/2=0.257>0.01,故接受H0,即在??0.01的显著性水平上没有理由认为元件的平均寿命显著地大于225小时。 第四题解答:
解 这是两个独立总体均值之差的检验问题。
设H0:?1 - ?2 =0 H1: ?1 - ?2 ? 0
因为两总体为正态总体,且方差相等
所以t统计量为2.648,相应P值为0.015<0.05,则拒绝。则两种方法的装配时间有显著差别。 第五题解答:
(1)客户参加执行引导性减肥项目之前与之后的样本体重数据的描述性统计总结,按下表的结果,简单写出一些统计量即可。
(2)客户参加执行引导性减肥项目前体重总体均值95%的置信区间为(179.0301,214.5032),客户参加执行引导性减肥项目后体重总体均值95%的置信区间为(157.4756,174.8577),两总体均值之差的95%的置信区间是(16.2476,44.9524)。
(3)分析:
A、减肥前与减肥样本体重数据发生明显变化,减肥前体重最高为300斤,最低为132斤,平均体重为196.76斤,体重在181斤以上的占50%,其中有25%在229斤以上。而减肥后体重最高为219斤,最低为130斤,平均体重为166.1667斤,体重在155斤以上的占50%,其中有25%在183斤以上。从样本数据比较中初步可知公司执行引导性减肥项目有一定疗效。
B、有95%把握推断客户参加引导性减肥项目之前及之后的平均体重分别为179-214斤之间和154—174斤之间;有95%把握推断客户参加引导性减肥项目之前及之后的平均体重之差分别在16.24—44.95斤之间。
通过以上的分析,可以认为客户参加引导性减肥项目之前之后的体重有明显差异,表明公司执行引导性减肥项目对客户体重减轻有一定疗效。
第四讲作业
1、为了研究学生学习数学的成绩是否受教师教学水平的影响,现将一个数学提高班的学生分成三个小班,分别由甲、乙、丙三位教师任教。三个班部分学生的最终成绩见下表。假定三个班学生的最终成绩服从正态分布,试问三个班学生的最终成绩是否有在显著的差异?如果有显著差异,用LSD方法检验哪个老师之间有差异,应推举哪位教师担任此班教学使教学效果更好?(α=0.05)
2、为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项试
验,考察三种广告方案和两种广告媒体,获得的销售量数据见下表, 检验广告方案、广告媒体或其交互作用对销售量的影响是否显著? (?=0.05)
A 广告方案 B C 广告媒体 报纸 电视 8 12 12 8 22 26 14 30 10 18 18 14 第一题
(1)解答: 设 ? ? 2 , ? 3 分别为甲、乙、丙老师所教班级学生的学习平均1,成绩。
H0:?1??2??3
H1:?1,?2,?3不全相等
F统计量为6.382.在?=0.05的显著性水平下,P值=0.013 <0.05,拒绝原假设,则认为三个班学生的最终成绩存在显著差异
(2)解答:用LSD方法检验可知,甲乙老师之间和甲丙老师之间的P值分别0.025和0.005,小于显著水平0.05,因此认为甲乙老师之间和甲丙老师之间存在显著差异。
而丙老师与乙老师不存在显著差异。 由描述统计表格中可知,甲乙丙老师所教学生成绩的均值分别为63,81,85,乙丙老师的学生成绩高于甲老师学生的成绩,而丙老师学生的成绩高于乙老师学生的成绩。所以选择丙老师担任此班教学效果更好。 第二题
? 解答:设广告方案A、B、C的平均销售量为a1、a2、a3,广告媒体的平均销售量为b1、b2
? 又设
H0:a1?a2?a31H0:b1?b2H02:无交互作用? 由上表可知,在?=0.05的显著性水平下,广告方案的P值=0.010<0.05,广告媒体的P值=0.134>0.05,广告方案*广告媒体的P值=0.252>0.05,则可
认为,广告方案对销售量的影响显著,广告媒体及广告方案和广告媒体的交互作用对销售量的影响不显著。
第五讲 作业
1、7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据见
表5-1,求:
(1) 人均GDP作自变量,人均消费水平作因变量,绘制散点图,并
说明二者之间的关系形态。
(2) 计算两个变量之间的线性相关系数,说明两个变量之间的关系
强度。
(3) 利用最小二乘法求出估计的回归方程,并解释回归系数的实际
意义。
(4) 计算判定系数,并解释其意义。
(5) 检验回归方程线性关系的显著性 (?=0.05)
(6) 如果某地区的人均GDP为5000元,预测其人均消费水平。 (7) 求人均GDP为5000元时,人均消费水平95%的置信区间和预测
区间。
表5-1
地区 北京 辽宁 上海 江西 河南 贵州 陕西
人均GDP(元) 人均消费水平
(元)
22460 7326 11226 4490 34547 11546 4851 2396 5444 2208 2662 1608 4549 2035
2、一家房地产评估公司想对某城市房地产销售价格y与地产的评估价格x1、房
产的评估价值x2和使用面积x3建立一个模型,以便对销售价格做出合理的预测。为此,收集了20栋住宅的房地产评估数据,如表5-2。
要求:(取α=0.05) (1)、建立房地产评估多元回归模型。
(2)、检验回归方程的线性关系是否显著。 (3)、检验各回归系数是否显著。 (4)、若地产的评估价格x1=1500(万元),房产的评估价值x2=4200(万元),使用面积x3=21000(m2),试预测销售价格y的值及销售价格95%的预测区间。
第一题解答:
(1) 从散点图可知,人均消费水平与人均GDP近似线性关系
(2)变量y与GDP的相关系数r=0.998,双侧检验P=0.00<0.05,故变量y与人均GDP之间显著相关。 (3)一元线性回归方程为:
?
y?734.693?0.309GDP
?0.000?P值?0.003?,
?P?0.000?R2?0.996,F?1331
经济意义为:我国国内生产总值GDP的系数为0.309为正数,符合经济意义,并表示每增加一百元GDP,人均消费水平增加30.9元。
(4)拟合优度检验:由判定系数R2=0.996,大于0.7,说明模型对数据的拟合程度较高。即解释变量可以解释模型解释的部分达到99.6%.
(5)F检验: 由F=1331.692,检验P=0.000<0.05,即可认为回归模型具有显著意义。这说明原先的线性模型假设是对的。
t检验:对于t检验,先检验GDP,因为GDP的t统计量为5.265,检验P=0.003<0.05,故GDP为y的自变量,再检验常数项,因为常数项的t统计量为36.492,检验P=0.000<0.05 ,所以常数项的t检验通过。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平得Y=2279.693 。 (7)人均GDP为5000元时,人均消费水平95%的置信区间为(1990.74915 2565.46399)和预测区间为(1580.46315 2975.74999)。
第二题解答:
(1)房地产评估多元回归模型为:
y?148.7?0.815x1?0.821x2?0.135x3
T值 (0.259)(1.591) (3.888) (2.050) P值(0.799)(0.131) (0.001) (0.057) R2=0.897 F=46.697(P=0.000)
(2)因为F=46.697,p=0.0000〈0.05,所以回归方程的线性关系显著。 (3)从t检验的P值:其中x2回归系数的P=0.001<0.05,x3回归系数的P=0.057>0.05,x1回归系数的P=0.131>0.05,所以y与x2的线性关系显著,而y与x1、x3的线性关系不显著。
(4)若公司计划在未来的某个销售周期中,地产的评估价格x1=1500(万元),房产的评估价值x2=4200(万元),使用面积x3=21000(m2)则该房地产销售价格y的预测值为7616.60(元 / 平方米),预测区间为:(6770 8539.4)。
复习还有曲线估计的内容,可复习课本的例子及上课举的例子。聚类分析与因子分析不考,考试可看书,题型与作业相同。