的是一个分类自变量对一个数值型因变量的影响,而双因素涉及两个分类型自变量。 10.4 方差分析中有哪些基本假定? 答:(1)每个总体都应服从正态分布 (2)各个总体的方差 (3)观测值是独立的 10.5 简述方差分析的基本思想
答:它是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量
对因变量是否有显著影响。 10.6 解释因子和处理的含义
答:在方差分析中,所要检验的对象称为因素或因子,因素的不同表现称为水平或处理。 10.7 解释组内误差和组间误差的含义
答:组内平均值误差的误差(SSE)是指每个水平或组的各个样本数据与其组平均值误
差平方和,反映了每个样本个观测值的离散状况;组间误差(SSA)是指各组平均值与总平均值的误差平方和,反映了各样本均值之间的差异程度。 10.8 解释组内方差和组间方差的含义
答:组内方差指因素的同一个水平下样本数据的方差;组间方差指因素的不同水平下各
个样本之间的方差。 10.9 简述方差分析的基本步骤 答:(1)提出假设 (2)构造检验统计量 (3)统计决策
10.10 方差分析中多重比较的作用是什么?
答:通过对总体均值之间的配对比较来进一步检验哪些均值之间存在差异。
必须相同
二、练习题
10.1 解: 方差分析
差异源 组间 组内 总计 相同
10.2 解: 方差分析 差异源 组间 组内 总计
SS
df
MS
F
P-value
93.76812 4 23.44203 15.82337 1.02431E-05 26.66667 18 1.481481 120.4348 22
SS 618.9167
598 1216.917
df
MS
F
P-value
2 309.4583 4.6574 0.04087724 9 66.44444 11
不相同 10.3 解:
ANOVA
每桶容量(L) 组间 组内 总数
不相同。 10.4 解:
方差分析
差异源 组间 组内 总计
有显著性差异。 10.5 解:
方差分析
差异源 组间 组内 总计 有显著差异。
LSD检验:计算得xA?44.4,xB?30,xC?42.6,有因为nA?nB?nc?5,则
SS 615.6 216.4 832
df 2 12
14
MS
307.8 18.03333
F 17.06839
P-value
0.00031
SS 29.60952 18.89048
48.5
df 2 15
17
MS
14.80476 1.259365
F 11.75573
P-value 0.000849
平方和
0.007 0.004 0.011
df
3 15 18
均方
0.002 0.000
F 8.721
显著性 0.001
?11??11?LSD?t?2MSE????2.093?18.03333?????5.62
?nn??55???决策:(1)xA?xB?44.4?30?14.4?5.62,所以A生产企业生产的电池与B生产企业生产的电池平均寿命有显著差异;(2)xA?xC?44.4?42.6?1.8?5.62,所以不能认为A生产企业生产的电池与C生产企业生产的电池平均寿命有显著差异;(3)所以B生产企业生产的电池与C生产企业生产的电xB?xC?30?42.6?12.6?5.62,池平均寿命有显著差异。
10.6 解: 方差分析 差异源 组间 组内 总计
SS 5.349156 7.434306 12.78346
df
MS
F
P-value
2 2.674578 8.274518 0.001962 23 0.323231 25
有显著性差异 10.7
(1) 方差分析表 差异源 组间 组内 总计 SS 420 3836 4256 Df 2 27 29 MS 210 142.0740741 — F 1.47810219 — — P-value 0.245946 — — F crit 3.354131 — — (2)若显著性水平a=0.05,检验三种方法组装的产品数量之间是否有显著差异?
P=0.025>a=0.05,没有显著差异。 10.8 解: 方差分析 差异源 行 列 误差 总计
SS 1.549333 3.484 0.142667 5.176
df
MS
F
P-value
F crit
4 0.387333 21.71963 0.000236 7.006077 2 1.742 97.68224 2.39E-06 8.649111 8 0.017833 14
(1)FR?21.71963?F??7.006077或p=0.000236?0.01,所以不同车速对磨损程度有显著性差异;
(2) FC?97.68224?F??8.649111或p=2.39E-06?0.01,所以不同供应商生产的轮胎的磨损程度有显著性差异。
10.9 解: 方差分析 差异源 行 列 误差 总计
SS 19.067 18.1815 7.901 45.1495
df
MS
F
P-value
F crit
4 4.76675 7.239716 0.003315 3.259167 3 6.0605 9.204658 0.001949 3.490295 12 0.658417 19
结果表明施肥方法和品种都对收获量有显著影响。
10.10 解: 方差分析 差异源 行 列 误差 总计
SS 22.22222 955.5556 611.1111 1588.889
df
2 2 4 8
MS
F
P-value
F crit
11.11111 0.072727 0.931056 6.944272 477.7778 3.127273 0.152155 6.944272 152.7778
(1)FR?0.072727?F??6.944272或p=0.931056>??0.05,所以不同销售地区对食品的销售量无显著性差异;
(2) FC?3.127273?F??6.944292或p=0.152>??0.05,所以不同包装对食品的销售量无显著性差异。
10.11 解:
方差分析 差异源 样本 列 交互 内部 总计
SS 1752 798 182.6667
324 3056.667
df
MS
F
P-value
F crit
2 876 48.66667 5.49E-08 6.012905 2 399 22.16667 1.4E-05 6.012905 4 45.66667 2.537037 0.075902 4.579036 18 18 26
(1) 竞争者的数量对销售额有显著影响 (2) 超市位置对销售额有显著影响 (3) 无交互作用 10.12 解: 方差分析 差异源 样本
列 交互 内部 总计
SS 344 48 56 96 544
df
2 1 2 6
11
MS
F
P-value
F crit
172 10.75 0.010386 5.143253 48 3 0.133975 5.987378 28 1.75 0.251932 5.143253 16
(1) 广告方案对销售量有显著影响 (2) 广告媒体形式对销售量无显著影响 (3) 无交互作用
第11章 一元线性回归
一、思考题
11.1.变量之间存在的互相依存的不确定的数量关系,称为相关关系。相关关系的特点:
⑴变量之间确实存在着数量上的依存关系;⑵变量之间数量上的关系是不确定、不严格的依存关系。
11.2.相关分析通过对两个变量之间的线性关系的描述与度量,主要解决的问题包括:⑴变量之间是否存在关系?⑵如果存在关系,它们之间是什么样的关系?⑶变量之间的关系强度如何?⑷样本所反映的变量之间的关系能否代表总体变量之间的关系?
11.3.在进行相关分析时,对总体主要有以下两个假定:⑴两个变量之间是线性关系;⑵两个变量都是随机变量。
11.4.相关系数的性质:⑴r的取值范围是[-1,1],r为正表示正相关,r为负表示负相关,r绝对值的大小表示相关程度的高低;⑵对称性:X与Y的相关系数rxy和Y与X之间的相关系数ryx相等;⑶相关系数与原点和尺度无关;⑷相关系数是线性关联或线性相依