方差与回归分析作业
题目:(三因素方差分析)某集团为了研究商品销售点所在的地理位置、销售点处的广告和销售点的装潢这三个因素对商品的影响程度,选了三个位置(如市中心黄金地段、非中心的地段、城乡结合部),两种广告形式,两种装潢档次在四个城市进行了搭配试验。表15是销售量的数据,试在显著水平0.05下,检验不同地理位置、不同广告、不同装潢下的销售量是否有显著差异
由上表易知sig.b=0.03<0.05,即不同地理环境下的销量有显著差异;同理,由sig.c=0.04<0.05可知不同广告的销量也有显著差异;而从sig.d=0.717>0.05易知不同装潢下的销量没有有显著差异。
sig.a*b=0.027<0.05,即不同地理环境和不同广告对销量有显著交互影响;相反的,由sig.a*c=0.301>0.05可知不同广告和不同装潢下的销量对销量没有显著交互影响;同理,由sig.a*d、sig.b*d等均大于0.05,易知它们对应的两个变量对销量没有显著交互影响。
回归分析
1. 某人记录了21天每天使用空调器的时间和使用烘干器的次数,并监视电表以计算出每天的耗电量,数据见表6,试研究耗电量(KWH)与空调器使用的小时数(AC)和烘干器使用次数(DRYER)之间的关系,建立并检验回归模型,诊断是否有异常点。 图1 系数a 非标准化系数 模型 1 (常量) AC DRYER a. 因变量: KWH B 8.105 5.466 13.217 标准 误差 2.481 .281 .856 标准系数 试用版 t 3.267 .783 .621 19.469 15.436 Sig. .004 .000 .000 B 的 95.0% 置信区间 下限 2.893 4.876 11.418 上限 13.317 6.056 15.015 图2 残差统计量a 预测值 残差 标准 预测值 标准 残差 a. 因变量: KWH 极小值 19.0372 -7.90080 -2.125 -2.008 极大值 95.1117 6.46714 1.403 1.643 均值 64.8571 .00000 .000 .000 标准 偏差 21.56363 3.73343 1.000 .949 N 21 21 21 21 Anovab 模型 1 回归 残差 总计 平方和 9299.802 278.770 9578.571 df 2 18 20 均方 4649.901 15.487 F 300.241 Sig. .000a a. 预测变量: (常量), DRYER, AC。 b. 因变量: KWH
如图所示:由图1知,此组数据进行回归分析后可知满足线性回归关系,其中常量为8.105,对应的p=0.004<0.05,关系显著,变量AC对应的系数为5.466,变量DRYER对应的系数为13.217,两个变量对应的p均为0,即可令耗电量KWH以y代替,AC与DRYER分别以变量x与x2代替,得到方程:
y=5.466x1+13.217x2+8.105
由图2知残差相差不是很大
3. 一矿脉有13个相邻样本点,人为地设定一原点,现测得各样本点对原点的距离x ,与该样本点处某种金属含量y 的一组数据如下,画出散点图观测二者的关系,试建立合适的回归模型,如二次曲线、双曲线、对数曲线等。 Anovab 模型 1 回归 残差 总计 平方和 13.391 7.367 20.758 df 1 11 12 均方 13.391 .670 F 19.996 Sig. .001a a. 预测变量: (常量), VAR00001。 b. 因变量: VAR00002 系数a 非标准化系数 模型 1 (常量) VAR00001 a. 因变量: VAR00002 B 108.254 .181 标准 误差 .469 .040 标准系数 试用版 t 230.773 .803 4.472 Sig. .000 .001
如图所示:此题所提供的数据进行回归分析后可知满足线性关系,常量为108.254,p为0关系显著,变量的系数为0.181,p=0.001<0.005关系亦显著,可得线性方程
y=0.181x+108.254