第二节 样本平均数与总体平均数差异显著性检验
【例5.1】母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异? 根据题意,本例应进行双侧t检验。 1.提出无效假设与备择假设2、计算值
经计算得:=114.5,S=1.581
:
=114,
:
≠114
所以==10-1=9
==1.000
3、查临界值,作出统计推断由|t|<
,P>0.05,故不能否定
=9,查值表(附表3)得:
=2.262,因为
=114,表明样本平均数与总体平均数差
异不显著,可以认为该样本取自母猪怀孕期为114天的总体。
【例5.2】按饲料配方规定,每1000kg某种饲料中维生素C不得少于246g,现从工厂的产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素C含量服从正态分布,问此产品是否符合规定要求? 按题意,此例应采用单侧检验。 1、提出无效假设与备择假设经计算得:=252,S=9.115
:
=246,
:
>246、计算值
所以==12-1=11
==2.281
3、查临界值,作出统计推断因为单侧(11),P<0.05,否定
:
=246,接受
=双侧=1.796,|t|>单侧t0.05
:>246,表明样本平均数与总体
平均数差异显著,可以认为该批饲料维生素C含量符合规定要求。
第三节 两个样本平均数的差异显著性检验
【例5.3】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表5-3所示。设两品种后备种猪90kg时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg时的背膘厚度有无显著差异? 表5-3长白与蓝塘后备种猪背膘厚度
品种 数 长白 2 蓝塘 1 11头背膘厚度(cm) 1.20、1.32、1.10、1.28、1.35、1.08、1.18、1.25、1.30、1.12、1.19、1.05 2.00、1.85、1.60、1.78、1.96、1.88、1.82、1.70、1.68、1.92、1.80 :
=
,
:
≠
=0.0998、
=0.1096,
1、提出无效假设与备择假设2、计算值此例=1.817、、
=12、
=11,经计算得=1.202、=0.1508
=0.123、
分别为两样本离均差平方和。
===0.0465
=
**
=(12-1)+(11-1)=21
3.查临界t值,作出统计推断当df=21时,查临界值得:|t|>2.831,P<0.01,否定
:
=
,接受
:
≠
=2.831,,表明长白后备种猪
与蓝塘后备种猪90kg背膘厚度差异极显著,这里表现为长白后备种猪的背膘厚度极显著地低于蓝塘后备种猪的背膘厚度。
【例5.4】某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重结果如表5-4,问两种饲料对粤黄鸡的增重效果有无显著差异? 表5-4粤黄鸡饲养试验增重
饲料 8 8 增重(g) 720、710、735、680、690、705、700、705 680、695、700、715、708、685、698、688 A B 此例=138.125
,经计算得=705.625、=288.839,=696.125、
1、提出无效假设与备择假设2、计算值, 因为
:=,:≠
=7.306
于是==1.300
=(8-1)+(8-1)=14
3.查临界值,作出统计推断当df=14时,查临界值得:|t|<2.145,P>0.05,故不能否定无效假设
:
=
=2.145,
,表明两种饲料饲喂粤黄
鸡的增重效果差异不显著,可以认为两种饲料的质量是相同的。
【例8.3】 探讨白血病患者血清SIL-2R(可溶性白细胞介素Ⅱ受体)的变化对白血病的诊断意义,试检验两组方差是否相等
对照组:179.21 180.22 183.30 160.17 187.23 185.26 165.31 185.21 178.33 191.36 181.32 白血病组:630.21 602.13 589.27 869.23 638.17 592.30 690.11
723.33 653.26 523.17 516.33 613.37 638.39
22解: H0:?12??2 H1:?12??2 ??0.05 已知 S?90.41, n?13; S?9.28, n?11 2112 F?90.419.2822?95.00 ?1?13?1?12,??0.052?11?1?10?0.05 F=95.00>F0.05/2,(12,10) =3.62, P 认为两总体方差不齐。 ,在?下拒绝H0, 配对资料的假设检验-t检验
【例5.5】 用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表5-6。设体温服从正态分布,问注射前后体温有无显著差异?
表5-6 10只家兔注射前后的体温 兔号 1 2 3 4 5 6 7 8 9 10 注射前体温 37.8 38.2 38.0 37.6 注射后体温 37.9 39.0 38.9 38.4 37.9 38.1 38.2 37.9 39.0 39.5 0 -0.9 -1.3 37.5 38.5 37.9 38.6 38.8 39.0 -1.1 -0.3 -1.1 d?x1?x2 -0.1 -0.8 -0.9 -0.8 1、提出无效假设与备择假设 H0:HA?d=0,即假定注射前后体温无差异 ?d≠0,即假定注射前后体温有差异 n?0.44510?0.141 :2、计算t值 经过计算得d=-0.73,Sd?Sd故 t?dSd??0.730.141??5.177 且 df?n?1=10-1=9 3、查临界t值,作出统计推断 由df=9,查t值表得:t0.01(9)=3.250,|t|>t0.01(9),P<0.01,否定H0:?d=0,接受HA:?d≠0,表明家兔注射该批注射液前后体温差异极显著,注射该批注射液可使体温极显著升高。
【例5.6】 现从8窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间30天,试验结果见表5-7。问两种饲料喂饲仔猪增重有无显著差异?
表5-7 仔猪饲料对比试验 单位:kg 窝号 1 2 11.2 10.6 0.6 3 11.0 9.0 2.0 4 12.1 10.5 1.6 5 10.5 9.6 0.9 6 9.8 9.0 0.8 7 11.5 10.8 0.7 8 10.8 9.8 1.0 甲饲料(x1) 10.0 乙饲料(x2) 9.8 d?x1?x2 0.2
二项分布的显著性检验
【例5.7】据往年调查某地区的乳牛隐性乳房炎一般为30%,现对某牛场500头乳牛进行检测,结果有175头乳牛凝集反应阳性,问该牛场的隐性乳房炎是否比往年严重? 此例总体百分数
=30%,样本百分数=175/500=35%,因为
=150>30,不须进行连续性矫正。
1、提出无效假设与备择假设2、计算u值 因为
=
,
于是=
=35%与总
3、作出统计推断因为1.96
=30%差异显著,该奶牛场的隐性乳房炎比往年严重。
【例5.8】 某养猪场第一年饲养杜长大商品仔猪9800头,死亡980头; 第二年饲养杜长大商品仔猪10000头,死亡950头,试检验第一年仔猪死亡率与第二年仔猪死亡率是否有显著差异? 此例,两样本死亡率分别为:
?1?px1n1?9809800?10%?2?px1?x2n1?n2x2n2?95010000?9.5%合并的样本死亡率为: p??980?9509800?10000?9.747%因为 n1p?9800?9.747%?955.206
n1q?n1(1?p)?9800?(1?9.747%)?8844.794n2p?10000?9.747%?974n2q?n2(1?p)?10000?(1?9.747%)?9026即 、 可利用二项分布的显著性检验---un1p、n1q、n2pn2q均大于10,检验法,不需作连续矫正。检验基本步骤 是:
1、提出无效假设与备择假设 2、计算u值 因为
1n11n2H0:P1?P2HA:P1?P2Sp?1?p?2?p(1?p)(?)?9.747%?(1?9.747%)?(19800?110000)=0.00422
?1?p?2pu?于是 = 10%?9.5%?1.185Sp?1?p?20.004223、作出统计推断 由于u<1.96,p>0.05,不能否定 ,表明第H0:P1?P2一年仔猪死亡率与第二年仔猪死亡率差异不显著。 第六章:参数估计 一、正态总体平均数
的置信区间
【例5.9】某品种猪10头仔猪的初生重为1.5、1.2、1.3、1.4、1.8、0.9、1.0、1.1、1.6、1.2(kg),求该品种猪仔猪初生重总体平均数的置信区间。 经计算得
,,因此
95%置信半径为95%置信下限为95%置信上限为
,由
,查值表得
,
所以该品种仔猪初生重总体平均数的95%置信区间为
又因为 99%置信半径为99%置信下限为99%置信上限为
所以该品种仔猪初生重总体平均数的99%置信区间为
二、二项总体百分数P的置信区间
【例5.10】调查某地1500头奶牛,患结核病的有150头,求该地区奶牛结核病患病率的95%、99%置信区间。 由于
>1000,
>1%,采用正态分布近似法求置信区间。
因为
=
=0.0077
所以该地区奶牛结核病患病率P的95%、99%置信区间为:
即
第一节 方差分析的基本原理与步骤
【例6.1】某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。
表6-2饲喂不同饲料的鱼的增重(单位:10g) 饲料 鱼的增重(xij) 31.9 24.8 22.1 27.0 27.9 25.7 23.6 30.8 31.8 26.8 27.3 29.0 28.4 27.9 24.9 24.5 =550.8 这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下: 矫正数总平方和
35.9 26.2 25.8 28.5 155.9 8 131.4 8 123.7 4 139.8 6 合计 31.126.224.727.9平均A1 A2 A3 A4 合计
处理间平方和处理内平方和总自由度处理间自由度处理内自由度
用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方MSe。
因为F=MSt/MSe=38.09/5.34=7.13**;根据df1=dft=3,df2=dfe=16查附表4,得F>F0.01(3,16)=5.29,P<0.01,表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是不同的。
在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表,见表6-3。
表6-3表6-2资料方差分析表 变异来源 处理间 处理内 总变异 平方和 114.27 85.40 199.67 自由度 3 16 19 均方 38.09 5.34 F值 7.13** 表中的F值应与相应的被检验因素齐行。因为经F检验差异极显著,故在F值7.13右上方标记“**”。 各处理的多重比较如表6-4所示。
表6-4四种饲料平均增重的多重比较表(LSD法) 处理 平均数 31.18 27.96 -24.74 6.44** 3.22* -26.28 4.90** 1.68ns -27.96 3.22* A1 A4 A2 A3 26.28 24.74 1.54ns 注:表中A4与A3的差数3.22用q检验法与新复极差法时,在α=0.05的水平上不显著。 因为,
;查t值表得:
t0.05(dfe)=t0.05(16)=2.120, t0.01(dfe)=t0.01(16)=2.921
所以,显著水平为0.05与0.01的最小显著差数为
将表6-4中的6个差数与
,
比较:小于
与
者不显著,在差数的右之间者显著,在差数的右
上方标记“ns”,或不标记符号;介于上方标记“*”;大于
者极显著,在差数的右上方标记“**”。检验结果
除差数1.68、1.54不显著、3.22显著外,其余两个差数6.44、4.90极显著。表明A1饲料对鱼的增重效果极显著高于A2和A3,显著高于A4;A4饲料对鱼的增重效果极显著高于A3饲料;A4与A2、A2与A3的增重效果差异不显著,以A1饲料对鱼的增重效果最佳。
现根据表6-4所表示的多重比较结果用字母标记如表6-7所示(用新复极差法检验,表6-4中A4与A3的差数3.22在α=0.05的水平上不显著,其余的与LSD法同)。
表6-7表6-4多重比较结果的字母标记(SSR法) 处理 平均数 31.18 27.96 26.28 24.74 α=0.05 α=0.01 A1 A4 A2 A3 a b b b A AB B B 在表6-7中,先将各处理平均数由大到小自上而下排列。当显著水平α=0.05时,先在平均数31.18行上标记字母;由于31.18与27.96之差为3.22,在α=0.05水平上显著,所以在平均数27.96行上标记字母b;然后以标记字母b的平均数
27.96与其下方的平均数26.28比较,差数为1.68,在α=0.05水平上不显著,所以在平均数26.28行上标记字母b;再将平均数27.96与平均数24.74比较,差数为3.22,在α=0.05水平上不显著,所以在平均数24.74行上标记字母b。类似地,可以在α=0.01将各处理平均数标记上字母,结果见表6-7。q检验结果与SSR法检验结果相同。
由表6-7看到,A1饲料对鱼的平均增重极显著地高于A2和A3饲料,显著高于
A4饲料;A4、A2、A3三种饲料对鱼的平均增重差异不显著。四种饲料其中以A1饲料对鱼的增重效果最好
第二节 单因素试验资料的方差分析
一、各处理重复数相等的方差分析
【例6.3】抽测5个不同品种的若干头母猪的窝产仔数,结果见表6-12,试检验不同品种母猪平均窝产仔数的差异是否显著。
表6-12五个不同品种母猪的窝产仔数 品种号 1 2 3 4 5 合计 观察值xij(头/窝) 8 7 13 13 12 13 8 14 9 11 12 10 10 8 15 9 9 11 8 14 9 7 12 10 13 65 xi. 51 41 60 48 65 10.2 8.2 12 9.6 13 x..=2这是一个单因素试验,k=5,n=5。现对此试验结果进行方差分析如下: 1、计算各项平方和与自由度
2、列出方差分析表,进行F检验
表6-13不同品种母猪的窝产仔数的方差分析表 变异来源 品种间 误差 总变异 平方和 73.20 62.80 136.00 自由度 4 20 24 均方 18.30 3.14 F值 5.83** 根据df1=dft=4,df2=dfe=20查临界F值得:
F0.05(4,20)=2.87,F0.05(4,20)=4.43,因为F>F0.01(4,20),即P<0.01,表明品种间产仔数的差异达到1%显著水平。
3、多重比较采用新复极差法,各处理平均数多重比较表见表6-14。
表6-14不同品种母猪的平均窝产仔数多重比较表(SSR法) 品种 5 3 1 4 2 13.0 12.0 10.2 9.6 8.2 4.8** 3.8** 2.0 1.4 3.4* 2.4 0.6 平均数-8.2 -9.6 -10.2 2.8* 1.8 -12.0 1.0 因为MSe=3.14,n=5,所以为:
根据dfe=20,秩次距k=2,3,4,5由附表6查出α=0.05和α=0.01的各临界SSR值,乘以
=0.7925,即得各最小显著极差,所得结果列于表6-15。
表6-15SSR值及LSR值 秩次距k dfe SSR0.05 SSR0.01 LSR0.05 LSR0.01 2 20 3 4 5 2.95 3.10 3.18 3.25 4.02 4.22 4.33 4.40 2.339 2.458 2.522 2.577 3.188 3.346 3.434 3.489 将表6-14中的差数与表6-15中相应的最小显著极差比较并标记检验结果。检验结果表明:5号品种母猪的平均窝产仔数极显著高于2号品种母猪,显著高于4号和1号品种,但与3号品种差异不显著;3号品种母猪的平均窝产仔数极显著高于2号品种,与1号和4号品种差异不显著;1号、4号、2号品种母猪的平均窝产仔数间差异均不显著。五个品种中以5号品种母猪的窝产仔数最高,3号品种次之,2号品种母猪的窝产仔数最低。
二、各处理重复数不等的方差分析
这种情况下方差分析步骤与各处理重复数相等的情况相同,只是在有关计算公式上略有差异。
设处理数为k;各处理重复数为n1,n2,?,nk;试验观测值总数为N=Σni。则
(6-28)
【例6.4】5个不同品种猪的育肥试验,后期30天增重(kg)如表6-16所示。试比较品种间增重有无差异。
表6-165个品种猪30天增重 品种 增重(kg) 21.5 16.5 19.5 21.5 15.0 18.0 18.0 17.0 17.0 19.0 16 18.0 20.0 2019.0 17.5 18.0 20.0 15.0 1722.0 20.0 18.0 1620ni . 6 6 5 4 4 1.0 xi12.2 10 2017.2 18.3 19.6 16.6 B1 B2 B3 B4 B5 .5 .0 .0 .0 .5 3.0 91.5 78.5 66.5 合计 25 0.5 46 此例处理数k=5,各处理重复数不等。现对此试验结果进行方差分析如下: 1、计算各项平方和与自由度 利用公式(6-28)计算
2、列
出方差分析表,进行F检验
临界F值为:F0.05(4,20)=2.87,F0.01(4,20)=4.43,因为品种间的F值5.99>
F0.01(4,20),P<0.01,表明品种间差异极显著。
表6-175个品种育肥猪增重方差分析表 变异来源 品种间 品种内(误差) 总变异 平方和 46.50 38.84 85.34 自由度 4 20 24 均方 11.63 1.94 F值 5.99** 3、多重比较采用新复极差法,各处理平均数多重比较表见表6-18。 因为各处理重复数不等,应先由公式(6-25)计算出平均重复次数n0来代替标准误
中的n,此例
于是,标准误
为:
表6-185个品种育肥猪平均增重多重比较表(SSR法)
品种 平均数-16.6 20.2 19.6 18.3 17.2 16.6 3.6** 3.0** 1.7 0.6 -17.2 3.0** 2.4* 1.1 -18.3 1.9 1.3 -19.6 0.6 B1 B4 B3 B2 B5 根据dfe=20,秩次距k=2,3,4,5,从附表6中查出α=0.05与α=0.01的临界SSR值,乘以
=0.63,即得各最小显极差,所得结果列于表6-19。
表6-19SSR值及LSR值表 秩次距(k) 2 20 3 4 5 dfe SSR0.05 2.95 3.10 3.18 3.25 SSR0.01 4.02 4.22 4.33 4.40 LSR0.05 1.844 1.938 1.988 2.031 LSR0.01 2.513 2.638 2.706 2.750 将表6-18中的各个差数与表6-19中相应的最小显著极差比较,作出推断。检验结果已标记在表6-18中。
多重比较结果表明B1、B4品种的平均增重极显著或显著高于B2、B5品种的平均增重,其余不同品种之间差异不显著。可以认为B1、B4品种增重最快,B2、B5品种增重较差,B3品种居中。
单因素试验只能解决一个因素各水平之间的比较问题。如上述研究几个品种猪的育肥试验,只能比较几个品种的增重快慢。而影响增重的其它因素,如饲料中能量的高低、蛋白质含量的多少、饲喂方式及环境温度的变化等就无法得以研究。实际上,往往对这些因素有必要同时考察。只有这样才能作出更加符合客观实际的科学结论,才有更大的应用价值。这就要求进行两因素或多因素试验。下面介绍两因素试验资料的方差分析法。
七、方差分析的基本步骤
在本节中,结合单因素试验结果方差分析的实例,较详细地
介绍了方差分析的基本原理和步骤。关于方差分析的基本步骤现归纳如下:
(一)计算各项平方和与自由度。 (二)列出方差分析表,进行F检验。
(三)若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。
此外,若有一些特殊重要的问题需要回答,多重比较又无法或不能很好地回答这些问题时,则应考虑单一自由度正交比较法。对这些特殊问题正确而有效的回答,依赖于正确的试验设计和单一自由度正交比较法的正确应用。
第二节 单因素试验资料的方差分析
在方差分析中,根据所研究试验因素的多少,可分为单因素、两因素和多因素试验资料的方差分析。单因素试验资料的方差分析是其中最简单的一种,目的在于正确判断该试验因素各水平的优劣。根据各处理内重复数是否相等,单因素方差分析又分为重复数相等和重复数不等两种情况。上节讨论的是重复数相等的情况。当重复数不等时,各项平方和与自由度的计算,多重比较中标准误的计算略有不同。本节各举一例予以说明。
一、各处理重复数相等的方差分析
【例6.3】抽测5个不同品种的若干株的玉米颗数,结果见表6-12,试检验不同品种玉米生长颗数的差异是否显著。
表6-12 五个不同品种玉米生长颗数
品种号 1 2 3 4 5 合计
这是一个单因素试验,k=5,n=5。现对此试验结果进行方差分析如下:
1、计算各项平方和与自由度 C?x../kn?26522观 察 值xij (颗/株) 8 7 13 13 12
13 8 14 9 11
12 10 10 8 15
9 9 11 8 14
9 7 12 10 13
xi. 51 41 60 48 65 x.. =265
xi.
10.2 8.2 12 9.6 13
/(5?5)?2809.00
SST???1nxij?C?(8?13222???142?13)?2809.002?2945.00?2809.00?136.00SSt??2xi.?C?15(512?412?602?482?65)?2809.002?2882.20?2809.00?73.20
SSe?SST?SSt?136.00?73.20?62.80
dfT?kn?1?5?5?1?24,dft?k?1?5?1?4,dfe?dfT?dft?24?4?20
2、列出方差分析表,进行F检验
表6-13 不同品种玉米生长颗数的方差分析表
变异来源 品种间 误差 总变异
根据df1=dft=4,df2=dfe=20查临界F值得:F0.05(4,20) =2.87,F0.01(4,20) =4.43,因为F>F0.01(4,20),即P<0.01,表明品种间产颗数的差
平方和 73.20 62.80 136.00
自由度 4 20 24
均方 18.30 3.14
F值 5.83**
异达到1%显著水平。
3、多重比较 采用新复极差法,各处理平均数多重比较表见表6-14。
表6-14 不同品种玉米平均生长颗数多重比较表
(SSR法又称Duncan法) 平均数
品种
xi.
xi.-8.2
xi.-9.6
xi.-10.2 2.8* 1.8
xi.-12.0 1.0
5 3 1 4 2
13.0 12.0 10.2 9.6 8.2
4.8** 3.8** 2.0 1.4
3.4* 2.4 0.6
因为MSe=3.14,n=5,所以S为:
xSx?MSe/n?3.14/5?0.793
根据dfe=20,秩次距k=2,3,4,5由附表6查出α=0.05和α=0.01的各临界SSR值,乘以S=0.7925,即得各最小显著极差,
x所得结果列于表6-15。
表6-15 SSR值及LSR值
dfe
秩次距
SSR0.05
SSR0.01
LSR0.05
LSR0.01
k 2 3
20
4 5
将表6-14中的差数与表6-15中相应的最小显著极差比较并标记检验结果。检验结果表明:5号品种玉米的平均生产颗数极显著高于2号品种玉米,显著高于4号和1号品种,但与3号品种差异不显著;3号品种玉米的平均生产颗数极显著高于2号品种,与1号和4号品种差异不显著;1号、4号、2号品种玉米的平均生产颗数间差异均不显著。五个品种中以5号品种玉米的生产颗数最高,3号品种次之,2号品种玉米的生产颗数最低。
二、各处理重复数不等的方差分析
这种情况下方差分析步骤与各处理重复数相等的情况相同,只是在有关计算公式上略有差异。
设处理数为k;各处理重复数为n1, n2,?, nk;试验观测值总数为N=Σni。则
C?x../NSST?22.95 3.10 3.18 3.25
4.02 4.22 4.33 4.40
2.339 2.458 2.522 2.577
3.188 3.346 3.434 3.489
??xij?C,SSt?2?xi./ni?C,SSe?SST?SSt2
dfT?N?1,dft?k?1,dfe?dfT?dft(6-28)
【例6.4】 5个不同品种番茄的生长试验,后期15天生长(cm)如表6-16所示。试比较品种间生长有无差异。
表6-16 5个品种番茄15天生长
品种
生 长 (cm)
ni 6
xi. 121.0 6 5 4 4 25
103.0
xi.
B1 21.5 19.5 20.0 22.0 18.0 20.0 20.2
B2 16.0 18.5 17.0 15.5 20.0 16.0 B3 19.0 17.5 20.0 18.0 17.0 B4 21.0 18.5 19.0 20.0 B5 15.5 18.0 17.0 16.0 合计
17.2
91.5 18.3 78.5 19.6 66.5 16.6 460.5
此例处理数k=5,各处理重复数不等。现对此试验结果进行方差分析如下:
1、计算各项平方和与自由度 利用公式(6-28)计算
C?2x../N?460.5/25?8482.41
2SST?SSt??SSe?dfT?dft?dfe???xij22?C?(21.5?19.5???17.0?16.0)?8482.41?(121.0/6?103.0/6?91.5/5?78.8/4?66.5/4)?8482.41222222222?8567.75?8482.41?85.34?xi./ni?C8528.91?8482.41?46.50SST?SSt?85.34?46.50?38.84N?1?25?1?24k?1?5?1?4dfT?dft?24?4?20 2、列出方差分析表,进行F检验
临界F值为:F0.05(4,20) =2.87,F0.01(4,20) =4.43,因为品种间的F值5.99>F0.01(4,20),P<0.01,表明品种间差异极显著。
表6-17 5个品种番茄生长方差分析表
变异来源 品种间 品种内(误差) 总变异
3、多重比较 采用新复极差法,各处理平均数多重比较表见表6-18。
因为各处理重复数不等,应先由公式(6-25)计算出平均重复次数n0来代替标准误Sn0???ni??k?1??1x平方和 46.50 38.84 85.34
自由度 4 20 24
均方 11.63 1.94
F值 5.99**
?2MSe/n中的n,此例
22222?6?6?5?4?4??25???4.9625?????ni?ni?1???5?1?
于是,标准误
Sx为:
Sx?
MSe/n0?1.94/4.96?0.625
表6-18 5个品种番茄平均生长多重比较表(SSR法)
品种 平均数x
i.xi.-16.6 xi.-17.2 xi.-18.3 xi.-19.6
B1 B4 B3 B2 B5
20.2 19.6 18.3 17.2 16.6
3.6** 3.0** 1.7 0.6
3.0** 2.4* 1.1
1.9 1.3
0.6
根据dfe=20,秩次距k=2,3,4,5,从附表6中查出α=0.05与α=0.01的临界SSR值,乘以S=0.63,即得各最小显极差,所
x得结果列于表6-19。
表6-19 SSR值及LSR值表 秩次距
dfe
(k)
SSR0.05
SSR0.01
LSR0.05
LSR0.01
2
20
3 4 5
2.95 3.10 3.18 3.25
4.02 4.22 4.33 4.40
1.844 1.938 1.988 2.031
2.513 2.638 2.706 2.750
将表6-18中的各个差数与表6-19中相应的最小显著极差比较,作出推断。检验结果已标记在表6-18中。
多重比较结果表明B1、B4品种的平均生长极显著或显著高于B2、B5品种的平均生长,其余不同品种之间差异不显著。可以认为B1、B4品种生长最快,B2、B5品种生长较差,B3品种居中。 单因素试验只能解决一个因素各水平之间的比较问题。如上述研究几个品种番茄的生长试验,只能比较几个品种的生长快慢。而影响生长的其它因素,如肥料中营养成分的高低、蛋白质含量的多少、施肥方式及环境温度的变化等就无法得以研究。实际上,往往对这些因素有必要同时考察。只有这样才能作出更加符合客观实际的科学结论,才有更大的应用价值。这就要求进行两因素或多因素试验。下面介绍两因素试验资料的方差分析法。
第三节 两因素试验资料的方差分析
【例6.5】为研究雌激素对子宫发育的影响,现有4窝不同品系未成年的大白鼠,每窝3只,随机分别注射不同剂量的雌激素,然后在相同条件下试验,并称得它们的子宫重量,见表6-21,试作方差分析。
表6-21各品系大白鼠不同剂量雌激素的子宫重量(g) 品系(A) A1 A2 A3 A4 合计x.j 平均 雌激素注射剂量(mg/100g)(B) B1(0.2) B2(0.4) B3(0.8) 106 116 145 42 68 115 70 111 133 42 63 87 260 358 480 65.0 89.5 120.0 合计xi. 367 225 314 192 1098 平均 122.3 75.0 104.7 64.0 这是一个两因素单独观测值试验结果。A因素(品系)有4个水平,即=4;B因素(雌激素注射剂量)有3个水平,即b=3,共有×b=3×4=12个观测值。方差分析如下:
1、计算各项平方和与自由度 根据公式(6-31)有:
2、列出方差分析表,进行F检验
表6-22表6-21资料的方差分析表
变异来源 A因素(品系) B因素(剂量) 误差 总变异 平方和 6457.6667 6074.0000 543.3333 13075.0000 自由度 3 2 6 11 均方 2152.5556 3037.0000 90.5556 F值 23.77** 33.54** 根据df1=dfA=3,df2=dfe=6查临界F值,F0.01(3,6)=9.78;根据df1=dfB=2,df2=dfe=6查临界F值,F0.01(2,6)=10.92。
因为A因素的F值23.77>F0.01(3,6),P<0.01,差异极显著;B因素的F值
33.54>F0.01(2,6),P<0.01,差异极显著。说明不同品系和不同雌激素剂量对大白鼠子宫的发育均有极显著影响,有必要进一步对A、B两因素不同水平的平均测定结果进行多重比较。 3、多重比较
(1)不同品系的子宫平均重量比较各品系平均数多重比较表见表6-23。
表6-23各品系子宫平均重量多重比较(q法)
品系 平均数122.3 104.7 75.0 64.0 -64.0 58.3** 40.7** 11.0 -75.0 47.3** 29.7** -104.7 17.6 A1 A3 A2 A4 在两因素单独观测值试验情况下,因为A因素(本例为品系)每一水平的重复数恰为B因素的水平数b,故A因素的标准误故
根据dfe=6,秩次距k=2,3,4从附表5中查出α=0.05和α=0.01的临界q值,与标准误
相乘,计算出最小显著极差LSR,结果见表6-24。
表6-24q值及LSR值 秩次距k 6 2 3 4 ,此例b=3,MSe=90.5556,
dfe q0.05 3.46 4.34 4.90 q0.01 5.24 6.33 7.03 LSR0.05 19.01 23.84 26.92 LSR0.01 28.79 34.78 38.62 将表6-23中各差数与表6-24中相应最小显著极差比较,作出推断。检验结果已标记在表6-23中。结果表明,A1、A3品系与A2、A4品系的子宫平均重量均有极显著的差异;但A1与A3及A2与A4品系间差异不显著。
(2)不同激素剂量的子宫平均重量比较B因素各剂量水平平均数比较表见表6-25。
表6-25不同雌激素剂量的子宫平均重量多重比较(q法)
雌激素剂量 B3(0.8) 平均数120.0 -65.0 55.0** -89.5 30.5** B2(0.4) B1(0.2) 89.5 65.0 24.5* 在两因素单独观测值试验情况下,B因素(本例为雌激素剂量)每一水平的重复数恰为A因素的水平数a,故B因素的标准误故
根据dfe=6,秩次距k=2,3查临界q值并与表6-26。
表6-26q值与LSR值 秩次距 6 2 3 相乘,求得最小显著极差LSR,见
,此例=4,MSe=90.5556。
dfe q0.05 3.46 4.34 q0.01 5.24 6.33 LSR0.05 16.46 20.65 LSR0.01 24.93 30.12 将表6-25各差数与表6-26相应最小显著极差比较,作出推断,比较结果已标记在表6-25中。结果表明,注射雌激素剂量为0.8mg的大白鼠子宫重量极显著大于注射剂量为0.4mg和0.2mg的子宫重量,而后两种注射剂量的子宫重量间也有显著差异。
【例6.5】 为研究IBA激素对银杏生长发育的影响,现有4个不同品系银杏根系,各种3株,随机分别施用不同剂量的激素,然后在相同条件下试验,并测得它们根系的生长量,见表6-21,试作方差分析。
表6-21 各品系银杏不同剂量激素的根系生长量(cm) 品系(A) A1
IBA激素剂量(mg/100g)(B) B1(0.2) 106
B2(0.4) 116
B3(0.8) 145
合计xi. 367
平均x
i.122.3
A2 A3 A4 合计x.j 平均x
.j42 70 42 260 65.0
68 111 63 358 89.5
115 133 87 480 120.0
225 314 192 1098
75.0 104.7 64.0
这是一个两因素单独观测值试验结果。A因素(品系)有4个水平,即a=4;B因素(IBA激素剂量)有3个水平,即b=3,共有
a×b=3×4=12个观测值。方差分析如下: 1、计算各项平方和与自由度 根据公式(6-31)有:
C?x../ab?109822/(4?3)?100467.00002
2SST???xij2?C?(106?1162???63?87)?100467.00002SSASSB?113542?100467.0000?13075.00001122222??xi.?C?(367?225?314?192)?100467.0000b3?106924.6667?100467.0000?6457.6667112222??x.j?C?(260?358?480)?100467.0000a4?106541.0000?100467.0000?6074.0000
SSe?SST?SSA?SSB?13075.0000?6457.6667?6070000dfT?ab?1?4?3?1?11,dfA?a?1?4?1?3dfB?b?1?3?1?2,dfe?dfT?dfA?dfB?11?3?2?6?543.3333
2、列出方差分析表,进行F检验
表6-22 表6-21资料的方差分析表
变异来源 A因素(品
平方和 6457.6667
自由度 3
均方 2152.5556
F值 23.77**
系) B因素(剂量) 误差 总变异
根据df1=dfA=3,df2=dfe=6查临界F值,F0.01(3,6)=9.78;根据df1=dfB=2,df2=dfe=6查临界F值,F0.01(2,6)=10.92。
因为A因素的F值23.77>F0.01(3,6),P<0.01,差异极显著;B因素的F值33.54>F0.01(2,6),P<0.01,差异极显著。说明不同品系和不同IBA激素剂量对银杏根系的发育均有极显著影响,有必要进一步对A、B两因素不同水平的平均测定结果进行多重比较。
3、多重比较
(1)不同品系的根系平均生长量比较 各品系平均数多重比较表见表6-23。
表6-23 各品系根系平均生长量多重比较(q法) 品系 A1 A3 A2 A4
平均数x
i.6074.0000 543.3333 13075.0000
2 6 11
3037.0000 90.5556
33.54**
xi.-64.0
xi.-75.0
xi.-104.7 17.6
122.3 104.7 75.0 64.0
58.3** 40.7** 11.0
47.3** 29.7**
在两因素单独观测值试验情况下,因为A因素(本例为品系)每一水平的重复数恰为B因素的水平数b,故A因素的标准误
Sx?i.MSe/b,此例b=3,MSe=90.5556,故
Sx?i.MSe/b?90.5556/3?5.4941
根据dfe=6,秩次距k=2,3,4从附表5中查出α=0.05和α=0.01的临界q值,与标准误
Sx?5.4941i.相乘,计算出最小显著极差LSR,结果见表6-24。
表6-24 q值及LSR值
dfe 秩次距k
2
q0.05 3.46 4.34 4.90
q0.01 5.24 6.33 7.03
LSR0.05 19.01 23.84 26.92
LSR0.01 28.79 34.78 38.62
6 3 4
将表6-23中各差数与表6-24中相应最小显著极差比较,作出推断。检验结果已标记在表6-23中。结果表明,A1、A 3品系与A2、A 4品系的根系平均生长量均有极显著的差异;但A1与A 3及A2与A4品系间差异不显著。
(2)不同IBA激素剂量的根系平均生长比较 B因素各剂量水平平均数比较表见表6-25。
表6-25 不同IBA激素剂量的根系平均生长量多重比较(q法)
IBA激素剂量
B3(0.8) B2(0.4) B1(0.2)
平均数x
.jx.j-65.0
x.j-89.5
120.0 89.5 65.0
55.0** 24.5*
30.5**
在两因素单独观测值试验情况下,B因素(本例为IBA激素剂量)每一水平的重复数恰为A因素的水平数a,故B因素的标准误Sx.j?MSe/a,此例a=4,MSe=90.5556。故
Sx.j?MSe/a?90.5556/4?4.7580
x.j根据dfe=6,秩次距k=2,3查临界q值并与S相乘,求得最小显著极差LSR,见表6-26。
表6-26 q值与LSR值
dfe 6
将表6-25各差数与表6-26相应最小显著极差比较,作出推断,比较结果已标记在表6-25中。结果表明,施用IBA激素剂量为0.8 mg的根系生长量极显著大于剂量为0.4 mg和0.2mg的根系生长量,而后两种剂量的根系生长量间也有显著差异。
秩次距 2 3
q0.05 3.46 4.34
q0.01 5.24 6.33
LSR0.05 16.46 20.65
LSR0.01 24.93 30.12
【例6.6】为了研究饲料中钙磷含量对幼猪生长发育的影响,将钙(A)、磷(B)在饲料中的含量各分4个水平进行交叉分组试验。先用品种、性别、日龄相同,初始体重基本一致的幼猪48头,随机分成16组,每组3头,用能量、蛋白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪,经两月试验,幼猪增重结果(kg)列于表6-29,试分析钙磷对幼猪生长发育的影响。
本例A因素钙的含量分4个水平,即=4;B因素磷的含量分4个水平,即b=4;共有
=4×4=16个水平组合;每个组合重复数n=3;全试验共有
=4×4×3=48个观测值。现对本例资料进行方差分析如下:
表6-29不同钙磷用量(%)的试验猪增重结果(kg)
B1(0.8) B2(0.6) B3(0.4) B4(0.2) x1j1 22.0 26.5 24.4 72.9 24.3 23.5 25.8 27.0 76.3 25.4 30.5 26.8 25.5 82.8 27.6 34.5 31.4 29.3 95.2 31.7 327.2 27.3 30.0 27.5 26.0 83.5 27.8 33.2 28.5 30.1 91.8 30.6 36.5 34.0 33.5 104.0 34.7 29.0 27.5 28.0 84.5 28.2 363.8 30.3 32.4 26.5 27.0 85.9 28.6 38.0 35.5 33.0 106.5 35.5 28.0 30.5 24.6 83.1 27.7 27.5 26.3 28.5 82.3 27.4 357.8 29.8 Ai合计Ai平均xi.. A1(1.0) x1jl 30.5 27.0 324.9 27.1 25.1 82.6 27.5 x2jl A2(0.8) x2j. 26.5 24.0 350.1 29.2 25.0 75.5 25.2 x3jl A3(0.6) x3j. 20.5 22.5 332.4 27.7 19.5 62.5 20.8 x4jl A4(0.4) x4j. 18.5 20.0 319.5 26.6 19.0 57.5 19.2 278.1 23.2 1326.9 27.6 Bj合计x.j. Bj平均 1、计算各项平方和与自由度
2、列出方差分析表,进行F检验
表6-30不同钙磷用量方差分析表
变异来源 钙(A) 磷(B) 互作(A×B) 误差 总变异 平方和 44.5106 383.7356 406.6586 147.4133 982.3181 自由度 3 3 9 32 47 均方 14.8367 127.9119 45.1843 4.6067 F值 3.22* 27.77** 9.81** 查临界F值:F0.05(3,32)=2.90,F0.01(3,32)=4.47,F0.01(9,32)=3.02。因为,FA>F0.05(3,32);FB>F0.01(3,32);FA×B>F0.01(9,32),表明钙、磷及其互作对幼猪的生长发育均有显著或极显著影响。因此,应进一步进行钙各水平平均数间、磷各水平平均数间、钙与磷水平组合平均数间的多重比较和进行简单效应的检验。 3、多重比较
(1)钙含量(A)各水平平均数间的比较不同钙含量平均数多重比较表见表6-31。
表6-31不同钙含量平均数比较表(q法)
钙含量(%) A2(0.8) A3(0.6) A1(1.0) A4(0.4) 平均数29.2 27.7 27.1 26.6 -26.6 2.6* 1.1 0.5 ? -27.1 2.1 0.6 ? -27.7 1.5 因为A因素各水平的重复数为bn,故A因素各水平的标准误(记为
式为:此例,
)的计算公
由dfe=32,秩次距k=2,3,4,从附表5中查出α=0.05与α=0.01的临界q值,
乘以
=0.6196,即得各LSR值,所得结果列于表6-32。
表6-32q值与LSR值表
秩次距k 2 3 4 dfe 32 q0.05 2.88 3.47 3.83 q0.01 3.88 4.43 4.78 LSR0.05 1.78 2.15 2.37 LSR0.01 2.40 2.74 2.96 检验结果标记在表6-33中。
(2)磷含量(B)各水平平均数间的比较不同磷含量平均数多重比较表见表6-33。
表6-33不同磷含量平均数比较表(q法)
磷含量(%) B2(0.6) B3(0.4) B1(0.8) B4(0.2) 平均数30.3 29.8 27.3 23.2 -23.2 7.1** 6.6** 4.1** -27.3 3.0** 2.5** -29.8 0.5 因B因素各水平的重复数为为:
,故B因素各水平的标准误(记为)的计算公式
在本例,由于A、B两因素水平数相等,即=b=4,故。因而,A、
B两因素各水平比较的LSR值是一样的,所以用表6-32的LSR值去检验B因素各水平平均数间差数的显著性,结果见表6-33。
以上所进行的两项多重比较,实际上是A、B两因素主效应的检验。结果表明,钙的含量以占饲料量的0.8%(A2)增重效果最好;磷的含量以占饲料量的0.6%(B2)增重效果最好。若A、B因素交互作用不显著,则可从主效应检验中分别选出A、
B因素的最优水平相组合,得到最优水平组合;若A、B因素交互作用显著,则应进行水平组合平均数间的多重比较,以选出最优水平组合,同时可进行简单效应的检验。
【例8.1】在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。
表8-1 四川白鹅重与70日龄重测定结果 (单位:g) 编号 雏鹅重(x) 80 86 98 90 120 102 95 83 113 105 110 100 70日龄重2350 2400 2720 2500 3150 2680 2630 2400 3080 2920 2960 2860 (y) 1 2 3 4 5 6 7 8 9 10 11 12
1、作散点图 以雏鹅重(x)为横坐标,70日龄重(y)为纵坐标作散点图,见图8-3。由图形可见四川白鹅的70日龄重与雏鹅重间存在直线关系,70日龄重随雏鹅重的增大而增大。 2、计算回归截距a,回归系数b,建立直线回归方程 首先根据实际观测值计算出下列数据:
进而计算出b、a:
得到四川白鹅的70日龄重y对雏鹅重x的直线回归方程为:
从回归系数可知,雏鹅重每增加1g,70日龄平均重增加21.7122g。 根据直线回归方程可作出回归直线,见图8-3。从图8-3可看出,尽管
是该资料最恰当的回归方程,但是并不是所有
的散点都恰好落在回归直线上,这说明用去估计y是有偏差的。 2、回归关系显著性检验—F检验 对于【例8.1】资料,有
,
,
而
归关系显著性检验。
表8-2 四川白鹅70日龄重与雏鹅重回归关系方差分析
变异来源 回归 离回归 总变异 因为
存在显著的直线关系。
3、回归系数的显著性检验—t检验
1 10 11 794339.60 794339.60 213.81** 37152.07 831491.67 3715.21 4.96 10.04 。于是可以列出方差分析表进行回
df SS MS F值 F0.05 F0.01 ,表明四川白鹅70日龄重与雏鹅重间
对于【例8.1】资料,已计算得
当
,否定
,查t值表,得:β=0,接受
,
,故有
。因 ,
:β≠0,即四川白鹅70日龄重(y)
与雏鹅重(x)的直线回归系数b=21.7122是极显著的,表明四川白鹅70日龄重与雏鹅重间存在极显著的直线关系,可用所建立的直线回归方程来进行预测和控制。
1、总体回归截距a的置信区间
统计学已证明服从自由度为n-2的t分布。其中,叫做样
本回归截距标准误,计算公式为:
容易导出α的95%、99%置信区间为:
【例8.2】 试计算【例8.1】资料回归截距α的95%和99%置信区间。 对于【例8.1】资料,因为
,
所以,
,
,
,
,
于是总体回归截距α的95%和99%置信区间分别为: [582.1816-2.228×147.3153, 582.1816+2.228×147.3153] [582.1816-3.169×147.3153, 582.1816+3.169×147.3153] 即[253.9631, 910.40]和[115.3394, 1049.0238]。
这说明在研究雏鹅重与70日龄重的关系时,总体回归截距α在[253.9631,910.40]区间内,其可靠度为95%;在[115.3394, 1049.0238]区间内,其可靠度为99%。
2、总体回归系数β的置信区间
统计学已证明服从自由度为n-2的t公布,其中,叫做
样本回归系数标准误,由(8-15)式计算。可以导出β的95%、99%置信区间为:
(8-16) (8-17)
【例8.3】 求出【例8.1】资料总体回归系数β的95%和99%置信区间。
对于【例8.1】资料,因为
,
,
,
所以总体回归系数β的95%和99%置信区间分别为:
[21.7122-2.228×1.4849, 21.7122+2.228×1.4849] [21.7122-3.169×1.4849, 21.7122+3.169×1.4849] 即[18.4038, 25.0206]和[17.0066, 26.4178]。
这说明雏鹅重和70日龄重的总体回归系数β在[18.4038, 25.0206]区间内,其可靠度为95%;在[17.0066, 26.4178]区间内,其可靠度为99%。
3、总体平均数α+βx的置信区间
统计学已证明服从自由度为n-2的t分布。其中叫回
归估计标准误,计算公式为:
(8-18)
于是可以导出α+βx的95%、99%置信区间为:
(8-19) (8-20)
【例8.4】 求出【例8.1】资料当x=98时y总体平均数α+βx的95%和99%置信区间。
对于【例8.1】资料,当x=98时,=582.1816+21.7122×98=2709.9772, 而
,
均数的95%和99%置信区间分别为:
。所以当x=98时,y总体平
[2709.9772-2.228×17.6111, 2709.9772+2.228×17.6111] [2709.9772-3.169×17.6111, 2709.9772+3.169×17.6111] 即[2670.7397,2749.2147]和[2654, 2765.7868]。 这说明雏鹅重为98克时,70日龄总体平均重在
[2670.7397,2749.2147]区间内,其可靠度为95%;在[2654, 2765.7868]区间内,其可靠度为99%。
4、单个y值的置信区间
有时需要估计当x取某一数值时,相应y总体的一个y值的置信区间。因为
服从自由度为n-2的t分布,其中,为单个y值的估计标准误,计算公式为:
(8-21)
当x取某一数值时,单个y值的95%、99%置信区间为:
(8-22) (8-23)
【例8.5】 求出【例8.1】资料当x=98时单个y值的95%和99%置信区间。
对于【例8.1】资料,当x=98时,=2709.9772,且
,
的95%和99%置信区间分别为:
。所以当x=98时,某一y值
[2709.9772-2.228×63.4457, 2709.9772+2.228×63.4457] [2709.9772-3.169×63.4457, 2709.9772+3.169×63.4457] 即[2568.6202,2851.3342]和[2508.9178, 2911.0366]。 这说明雏鹅重为98克时,就一只白鹅而言,70日龄重在
[2568.6202,2851.3342]区间内,其可靠度为95%;在[2508.9178, 2911.0366] 区间内,其可靠度为99%。
从计算的(8-18)式和的(8-21)式可以看出:和
随
的绝对值增大而增大,随n和SSx的增大而减少。这表明,愈靠近,对y总体平均值或单个y的估计值就愈精确,而增大样本含量,扩大
x的取值范围亦可提高精确度。