n0???ni??k?1??1?ni?? n?i??2单因素试验资料的方差分析,不论是固定还是随机模型,F值的计算方法是一致的。
2、交叉分组试验资料方差分析的期望均方
(1) 二因素交叉分组单独观测值时
表6-43 两因素交叉分组单独观测值的期望均方与F检验
变异
来源 A因素 B因素 误差 总变异
自由度
(a?1) (b?1)
ab?1固定模型
F 期望均方
MS/MS bk+?
MS/MS ak+?
2A2Ae2B2Be(a?1)(b?1)
2?
随机模型 A固定、B随机
F F 期望均方 期望均方 MS/MS MS/MS bk+? b?+?
MS/MS MS/MS a?+? a?+?
?
2222AAeAAe2222BBeBBe2由表6-43中可以看出,对两因素交叉分组单独观测值试验资料的方差分析,不论是固定、随机还是混合模型,F检验分母项都是误差均方MSe,此时无法求得?(2)两因素交叉分组有重复观测值时
2A?B。
表6-44 两因素交叉分组有重复观测值的期望均方与F检验
变异
来源 A因素 B因素 A×B 误差 总变异
自由度
(a?1)固定模型
F 期望均方
bnk2A随机模型 期望均方
eF
MSAA随机、B固定
F 期望均方
A?B
+?
2MSA/MS
(b?1)ank22B+?
22MSMSB/MSe(a?1)(b?1) ab(n?1) abn?1
nkA?B+? ?
2A?B/MSe
+ +? n?an?+
+? n?+? n??
bn?A2A?B22/MS
bn?A2+?
2MSA/MSe
2BMS2A?B22B/MSA?BankB2+ n?22A?B+?
22MSB/MSA?B2A?BMSA?B/MSe
n?A?B2
+? ?
2MSA?B/MSe
由表6-44可知,两因素交叉分组有重复观测值试验资料的方差分析,对主效应和互作进行F检验随模型不同而异。对于固定模型,均用MSe作分母;对于随机模型,检验H0:?22AB2A?B
=0时,用MSe作分母,而检验H0: ?=0和?=0时都用MSA×B作分母;对于混合模型(A随机、B固定),检验H0: ?=0和?2A2A?B=0都用MSe作分母,而检验H0:K2B=0时,则以MSA×B
作分母。(A固定、B随机时,与此类似)。
3、系统分组资料方差分析的期望均方
表6-45 二因素系统分组次级样本含量相等的期望均方与F检验
115
变异来源
一级因素(A) 一级因素内二级因素B(A)
误差C(B) 总变异 F检验 一级因素
自由度
(a?1)a(b?1)
固定模型 bnk??
22A期望均方 随机模型
bn?2AA固定、B随机
2?n?2B(A)2B(A)??2
bnk2A?n?2B(A)2B(A)??22
nkB(A)??2?
22
n???
n???
ab(n?1) abn?1
MSMS2? 2?
A
e
e/MS
MSA/MSB(A)MSA/MSB(A)/MSe
一级因素内二级因素
B(A)/MSeMSB(A)/MS
MSB(A)A固定、B随机时的F检验与随机模型同;A随机、B固定时的F检验与固定模型同。 在随机模型下,当次级样本含量不等时,各项均方的期望值与F检验如下。
表6-46 二因素系统分组次级样本含量不等的期望均方与F检验
变异来源 一级因素A 一级因素内二级因素B(A) 误差C(B) 总变异
自由度
(a?1)a平方和
SSA SSB(A)均方
MSA期望均方(随机模型)
dn0?2AF
2
?n'0?2B(A)2B(A)2??
MSMSA/MSB(A)
?bii?1?aa
MSB(A)n0???
B(A)/MSeN??bii?1SSe
MSe
2?
2B(A)N?1
2
表6-45、6-46中,σ是二级因素内观测值间的方差,即误差方差;?2A是一级因素
水平内二级因素水平效应方差;?是一级因素水平效应方差;n和n'都是每个二级因素水
00平下的平均重复数(即平均观测值个数),其中n是一级因素水平内每个二级因素水平下平
0均重复数;n'是一级因素水平间每个二级因素水平的平均重复数;dn0是每个一级因素水平
0的平均重复数。n0、n'0及dn的计算公式如下:
0?nN?n0?2ij?i(jdni)dfB(A) (6-39)
2ij?n?(n'0?ij2ij?n)?A2i,jdnidfN (6-40)
Ndn0??(dni)?NdfA (6-41)
式中:N—全部观测值个数;
nij——
一级因素Ai水平内二级因素Bij水平的重复数;
Ai水平的重复数;
dni—一级因素dfB(A)—一级因素内二级因素的自由度;
dfA—一级因素的自由度。
三、方差组分的估计
116
上面我们分别介绍了单因素试验,交叉分组、系统分组多因素试验资料的方差分析中各种均方在不同模型下的期望值。了解期望均方的组成,不仅有助于正确进行F检验,而且也有助于参数估计。最常见的就是估计方差组分,又称方差分量分析。方差组分,亦即方差分量(variance components),是指方差的组成成分。根据资料模型和期望均方的组成,就可估计出所需要的方差组分。
方差组分的估计主要是指对随机模型的方差组分估计。因为在这种模型下,我们研究的目的就在于从总体上了解各因素对试验指标所产生的效应方差。
在研究数量性状的遗传变异时,对一些遗传参数的估计,如重复率、遗传力和性状间的遗传相关的估计都是在随机模型方差组分估计的基础上进行的。
下面结合实例说明方差组分的估计。
如果将【例6.8】中3头公猪、与配母猪及它们所生仔猪的断奶重资料,看作是从该品种总体中随机抽取的样本,则公猪及其与配母猪对所产仔猪断奶重影响的效应是随机的,因而该资料属随机模型。方差组分估计如下: 因次级样体含量不等,由表6-46可知: 公猪间均方 E?MS???A2?n'0?22B(A)?dn0?2A
公猪内母猪间均方 E?MSB(A)???2?n0?2B(A)
母猪内仔猪间均方 E?MS???
e?2因而 ?2?MSe
B(A)?B(A)?(MS???2A?MSe)/n0e
?(MSA?MS?B(A))/dn0?n'0?在方差分量分析中,当次级样本含量不相等时,需依公式(6-39)、(6-40)、(6-41)求三
个相应的加权平均数。本例各公、母猪的仔猪数不等,故先算三个加权平均数如下:
因为
?n?ii,j2ij(2ijjdni)?9?7162222?8?7?924222222?8?7?82322222?13016?19424?17723?23.9040?nN?i9?7?8?7?9?8?7?86322?130?194?17763?7.9524
?(dn)N?162?242?23263?21.6032代入公式(6-39)、(6-40)、(6-41)得
n0?(63?23.9040)/5?7.8192n'0?(23.9040?7.9524)/2?7.9758dn0?(63?21.6032)/2?20.6984
将n0、n'0、dn0及【例6-8】算出的有关均方值代入上面各方差组分计算式得:
117
??22?MSe?1.0356B(A)?B(A)?(MS??MSe)/n0?(16.2957?1.0356)/7.8192?1.9516?A?(MS?2A
?MSe2?B?n'0?(A))/dn0?(5.5118?1.0356?7.9758?1.9516)/20.6984??0.5358这里应当注意,公猪效应方差的估计值为-0.5358,这是不合理的。这主要是由于母猪间方差组分(?2B(A)2)过大所致(一般MSB(A)>MSA时,??A就是负值)。在这种情况下,可将原
资料中二级因素(母猪)去掉,仅就公猪因素作随机模型下的各处理重复数不等的单因素方差分析,进而重新估计公猪间方差组分。过程如下:
MSA不变,仍为5.5118
SSe?SST?SSA=149.4600-11.0235=138.4365
MSe?SSe/(N?a)=138.4365/(63-3)=2.3073
由表6-42可知:
E?MS2故 ??2=MS ??A=(MSeA??n0?2A??2 E?MS???
2ea?MSe)/n0 00再先由下式计算n,〔注意,这里的n不同于由公式(6-39)求得的n〕。
0n0???dni??a?1??1??dni?dni2?1??3?1??22?16?24?23?(16?24?23)?16?24?23??2????
1?1361??63???20.69842?63?0这实际就是由公式(6-41)求得的dn。于是:
????22A?MSe?2.3073A
?(MS?MSe)/n0?(5.5118?2.3073)/20.6984?0.1548第五节 数据转换
前面介绍的几种试验资料的方差分析法,尽管其数学模型的具体表达式有所不同,但以下三点却是共同的。
1、效应的可加性 我们据以进行方差分析的模型均为线性可加模型。这个模型明确
提出了处理效应与误差效应应该是“可加的”,正是由于这一“可加性”,才有了样本平方和的“可加性”,亦即有了试验观测值总平方和的“可剖分”性。如果试验资料不具备这一性质,那么变量的总变异依据变异原因的剖分将失去根据,方差分析不能正确进行。
2、分布的正态性 是指所有试验误差是相互独立的,且都服从正态分布N(0,σ2)。
只有在这样的条件下才能进行F检验。
3、方差的同质性 即各个处理观测值总体方差σ2应是相等的。只有这样,才有理
由以各个处理均方的合并均方作为检验各处理差异显著性的共同的误差均方。
上述三点是进行方差分析的基本前提或基本假定。如果在分差分析前发现有某些异常的观测值、处理或单位组,只要不属于研究对象本身的原因,在不影响分析正确性的条件下应加以删除。但是,有些资料就其性质来说就不符合方差分析的基本假定。其中最常见的一种
118