2015学年第1学期《试验统计学》期末考试题型与范围 (附全部答案,包括计算题、简答题。吐血整理,请下载支持)
Ⅰ、试题型与范围
一、试范围与分数比例 章 节 (1)绪论 (2)常用的试验设计 (3)试验数据的整理 (4)概率论与数理统计学基础知识 (5)参数区间估计 (6)统计假设测验 (7)方差分析 (8)常用试验设计资料的方差分析 (9)直线相关和回归 二、考试题型与分数比例
题 型 一、术语解释 二、选择题 三、填空题 四、计算题 五、问答题 教学大纲中规定的比例 10% 20% 20% 30% 20% 教学大纲中规定的比例 0~5% 5~10% 10% 0~10% 0~5% 15~25% 10~15% 10~15% 10~15% 1
2
三、总评成绩构成
项目 期末考试 平时成绩
50 50 比例(%) Ⅱ、复习题 一、术语解释
P3试验指标:用于衡量试验效果的量。 P3因素:在试验中对试验指标有影响的条件。 P3水平:考察因素的不同数量级别和不同质量状态。
P3处理(组合):单因素的水平或多因素的不同水平的组合。 P3唯一差异原则:除了考察因子要分为不同水平,以供考察之外,其余的因素都应保持一致、不分水平。
P4准确性:观察值与其理论值真值之间的符合程度。 P4精确性:重复观察值之间的符合程度。
P5随机误差(偶然误差) :由不可控因素引起的误差。 P5系统误差:由非考察的可控因素引起的误差。
P8单因素试验:在同一试验中只研究某一个因素的若干个水平的试验。 P8多因素试验:同时考察两个或两个以上因素的试验。
P8简单效应:同一因素两个水平的试验指标值之差称为简单效应。 P9主效(平均效应、主要效应):一个因素内各简单效应的平均数。 P9交互作用效应:在多因素试验中,两个因素简单效应间的平均差异称为
3
因素间的交互作用效应,简称互作。
P12(狭义的)试验方案:全部处理规定了整个研究的内容和范围。 P15(狭义的)试验设计:农业和生物学试验中常常将排除系统误差和控制偶然误差的试验设置成为试验设计。
P16局部控制:指的是通过对试验小区(或试验单元)的合理安排,对一些非考察的可控因素实行控制,使它们对不同处理的影响尽可能一致的手段和方法。
P16随机排列:指不加入人为的主观偏见,完全由机会决定,使每一试验处理都有平等机会设置在任何一个小区的安排方法。 P26总体:指根据研究目的而确定的,符合指定条件(即具有某种共同性质)的全部观察对象的集合。
P26全面调查:对总体的所有成员进行调查。
P27抽样调查:从总体中抽取一定数量的个体进行观察。 P27样本:在抽样调查中观察的所有个体集合。 P27样本容量:样本中的个体数。
P27数量性状资料:指那些用计数方法或测量方法取得的数据资料。 P28质量性状资料:指能观察但不能计量的资料。
P28次数分布:从一个总体随机抽取n个个体进行调查,得到n个观察值,不同数值(或区间)的个体数目不尽相同,这些次数将会按一定规律分配给不同的数值(或区间),这种分布情况叫次数分布。 P29极差:资料中的最大值与最小值之差。
P32平均数(算术平均数):是一组数据所有观察值之和除以观察值总数
4
所得的商。
P32中数:将资料所有观察值按大小排序后,当观察值总数为奇数时,居于中间位置的那个观察值;当观察值总数为偶数时,居中间位置的那两个观察值之和的一半。
P33众数:一组资料中出现得最多的一个观察值。
P33几何平均数:将一组资料中所有n个观察值相乘后开n次方。 P33调和平均数:资料中所有观察值倒数的算术平均数的倒数。 P34加权平均数:将资料中全部观察值分组处理,用各组观察值乘以各组中观察值的次数并求和,再除以观察值总数。 P35平方和(离均差平方和):离均差平方之和。 P36方差(均方):离均差平方和的平均数。
P37自由度:计算某一统计量时,取值不受限制的变量个数。 P37标准(偏)差:方差开平方根。 P38变异系数 :资料的标准差与平均数之比。
P44随机事件(偶然事件):在同一条件组实现的情况下可能发生也可能不发生的事件。
P44互斥事件:两件不可能同时发生的事件。
P45对立事件:两件不可能同时发生,但必定有一个发生的事件。 P45概率:某一随机事件发生的可能性的数字表示。
P45概率(古典定义):如果一个试验有n个可能出现的情况并且每个情况都是互不相容并且发生的可能性相等,其中恰好有m个情况具有性质A(其中0≤m≤n)。则A的概率为m/n,即为P(A) = m/n。这就是概率的古
5
典定义。
P45概率(统计定义):在相似的条件下重复进行同一类试验或调查,事件A发生的次数a与试验总次数n的比数(a/n)称为频率。如果在试验总次数n逐渐增大时,事件A的频率越来越稳定地接近定值p,就定义事件A的概率(即发生的可能性)为p。并记为P(A) =p。这就是概率的统计定义。 P46小概率原理:概率小的事件在一次试验中是不至于会发生的。 P46独立事件:发生概率不受其他事件影响的事件。 P46复置抽样:将抽得的个体放回总体继续参加抽样。
P48概率分布:试验的全部可能结果及各种可能结果发生的概率。 P53标准正态分布:u=0,σ =1的正态分布。 P55置信度:衡量估计把握性大小的概率。
P55显著水准:用100%减去置信度得到的互补概率。
P58抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布。
P66标准误(差):平均数抽样总体的标准差。
P70总体参数的置信区间(置信区间):具有一定概率保证的总体参数的估计区间。
P83统计假设测验:先对要研究的参数作一个假设,然后去测验这个假设是否正确。
P85第I类错误:H0本来是正确的,但我们却否定了它。 P85第II类错误:H0本来是错误的,但我们却接受了它。
P96适合性测验:比较观察次数与理论次数是否相符合的假设测验。
6
P103独立性测验:如果所研究的计数资料可以根据两种不同的属性进行分组,可以利用卡方测验来检验两种属性之间是否有密切联系,如果两种属性之间没有联系,就说它们是相互独立的,因此这种测验称为独立性测验。 P110线性可加模型:每个观察值可以被视为若干个线性组成部分之和。 P110误差平方和:亚总体的组内离均差平方和相加,得到整个试验的组内平方和,称为误差平方和。 P114方差分析的基本假定:
(1)方差分析是建立在一定的线性可加模型的基础上的,所谓线性可加模型是指每个观察值可以视为若干线性组成部分之和(或称数据具有“可加性”);
(2)如果试验误差εij是随机的、彼此独立的,而且服从平均数为0的正态分布,那么就可以用F测验来比较组间方差与误差方差是否相等(或称误差具有“随机、独立、正态性”);
(3)如果k个亚总体的方差相等,计算试验误差时就可以将这k个亚总体的组内平方和合并成整个试验的误差平方和(或称误差方差具有“同质性”)。
P121单向分类资料:指那些只含有一个可控因素的资料。 P125两向分类资料:指那些含有两个可控因素的资料。 P141倒数转换、对数转换、反正弦转换、平方根转换 P173离均差乘积和:X变量和Y变量离均差的乘积之和。 P173协方差、总体协方差、样本协方差
P174总体(样本)简单相关系数:只考虑总体(样本)中两个变量的相互
7
关系时,将协方差除以两个变量的标准差即为总体(样本)简单相关系数。 P174决定系数 :相关系数的平方值。
P178回归方程、自变量、因变量、回归截距、回归系数、正规方程 P180回归平方和、误差平方和
P181回归估计标准误差:误差均方的平方根。
二、选择题
1.__C__是指那些用计数方法或者测量方法取得的数据资料。
A、可量资料 B、可数资料 C、数量性状资料 D、质量性状资料
2.__D__是指能观察但不能计量的资料。例如玫瑰花的颜色、学生的性别、人类的血型?等等,都可以归入这类性状。
A、可量资料 B、可数资料 C、数量性状资料 D、质量性状资料
3.按某种质量性状的表现分为若干类,然后将所有观察对象归属到各类之中,统计各类中的个体数。这类资料叫做___C___。
A、可量资料 B、可数资料 C、属性资料 D、不可计量的资料
4.当一种性状只具有两种可能的表现时,可以用一种只可以取0、1两种数值的变量来表示。这种变量叫___B___变量。这种变量也属于离散型随机变量。
A、连续型随机变量 B、指示变量 C、属性资料 D、离散型随机变量
5.按某种质量的表现分为若干类,然后将所有观察对象归属到各类之中,统计各类中的个体数。这类资料叫做属性资料。每个类别中的个体数称为___D___。因此这种数据也称为______资料。
8
A、属性、属性 B、属性、次数 C、次数、属性 D、次数、次数
6.当某种性状的不同质量表现具有程度差异时,可以对它们进行分级打分。例如小麦种皮的颜色,可以分为:最深红、深红、中深红、中红、浅红、白等。这类型资料可以按照___B___资料的方法进行处理。
A、可量 B、可数
C、属性 D、连续型随机变量的
7.对于___A___随机变量的资料,若变量可取值数目不多时,可以通过按自然单位进行分组的方法编制次数分布表。
A、离散型 B、可数 C、属性 D、连续型
8.由于___D___随机变量的可取值有无限多种,它们就只能采用按区间分组的办法进行整理,而不能按自然单位进行分组的方法编制次数分布表。
A、离散型 B、可数 C、属性 D、连续型
9.方柱形图适用于表示___D____型随机变量的资料。
A、离散型 B、可数 C、属性 D、连续型
10.多边形图适用于表示___D___型随机变量的资料。
A、离散型 B、可数 C、属性 D、连续型
11.条形图适用于表示___A___型随机变量的资料。
A、离散型 B、可数 C、属性 D、连续型
9
12.饼图适用于表示___A___型随机变量资料和_______资料。
A、离散型、属性 B、连续型、可数 C、属性、离散型 D、连续型、可数
13.总体平均数常记为?,其计算公式是____A_____。
1N1nA、???Xi B、???Xi
Ni?1ni?11n1NC、??D、??Xi ??Xin?1N?1i?1i?1
14.样本平均数常记为x,其计算公式是_____B_____。
11Nxi A、x??Xi B、x?Ni?1ni?1?n1n1NC、x?D、x?Xi ??Xin?1N?1i?1i?1
15.离均差平方和简称平方和,记为SS,其计算公式为:___C___
A、SS??x2 B、SS?C、SS??x2?(?x)2/n
1(x?x)2?n
D、SS?1(x?x)2 ?n?116.样本方差又称为均方,记为s2或MS,其计算公式为:___D___
A、s2??x2 B、s2?C、s2??x2?(?x)2/n
D、s2?1(x?x)2?n
1(x?x)2 ?n?117.样本方差又称为均方,记为s2或MS,其计算公式为:___D___
A、s2??x2 B、s2?C、s2??x2?(?x)2/n
1(x?x)2?n
D、s2?1(x?x)2 ?n?118.离均差平方和的计算公式为SS??x2?C.T.。其中C.T.称为(对平均数的)矫正项,其计算公式为:___D___
10
A、C.T.??x2 B、C.T.?x2/n
D、C.T . =全部观察值之和的平方/观察值总数目
C、C.T.?(?x)/n
19.如果一个试验有n个可能出现的情况并且每个情况都是互不相容并且发生的可能性相等,其中恰好有m个情况具有性质A(其中0≤m≤n)。则A的概率为___B___,即为P(A) = ________。这就是概率的古典定义。
A、n/m,n/m B、m/n,m/n C、1/n, 1/n D、1/m,1/m
20.如果一个试验有n个可能出现的情况并且每个情况都是互不相容并且发生的可能性相等,其中恰好有m个情况具有性质A(其中0≤m≤n)。则A的概率为m/n,即为P(A) =m/n。这就是概率的___A___定义。
A、古典 B、统计 C、普通 D、精确
21.在相似的条件下重复进行同一类试验或调查,事件A发生的次数a与试验总次数n的比数(a/n)称为频率。如果在试验总次数n逐渐增大时,事件A的频率越来越稳定地接近定值p,就定义事件A的概率(即发生的可能性)为p。并记为P(A) =p。这就是概率的___B___定义。
A、古典 B、统计 C、普通 D、精确
22.如果在总体中抽取了一个个体并对它进行了观察纪录之后,还把这个个体放回总体中去,下一次抽样还有可能抽到这个个体。这样的一种抽样方法称为__B___抽样。
A、复制 B、复置
11
C、非复置 D、不复置
23.在复置抽样中每次抽样的结果是___B___的。但是,在非复置抽样中每次抽样的结果则________的。
A、相互独立,也是相互独立 B、相互独立,不是相互独立 C、不是相互独立,相互独立 D、不是相互独立,相互独立 24如果随机变量X只可以取0和1两种数值,并且X取值为1的概率为p,X取值为0的概率为q=1-p,那么,总体中所有观察值所构成的总体,或者说随机变量X所构成的总体称为___C___总体。
A、无限 B、有限 C、二项 D、多项
?25.在应用中,常常将在n次试验中某事件出现x次的结果用百分数p=X/n来表示。这个通常被称为二项资料百分率的统计量是样本观察值总和X与观察值总数n的比率,因此实质上也是___C___。
A、样本方差 B、样本标准差 C、样本平均数 D、样本总和数
26.当n很大,p(或q)很小时,二项分布逼近为____B____分布。
A、正态分布 B、泊松分布 C、卡方分布 D、二项分布
27.当n很大,p(或q)接近0.5时,二项分布逼近为____A___分布。
A、正态分布 B、泊松分布 C、卡方分布 D、二项分布
28.如果样本容量为n,那么样本统计量t?x??xs/n将服从自由度为df
=n-1的t分布。统计量t的分母常称为___A___。
A、标准误 B、标准差 C、标准离差 D、标准数
12
29.在对某个总体参数进行区间估计时,衡量估计把握性大小的概率称为___B___,用100%减去它得到的互补概率称为显著水准,显著水准常记为?。
A、置信区间 B、置信度 C、显著水平 D、显著水准
30.在对某个总体参数进行区间估计时,衡量估计把握性大小的概率称为置信度,用100%减去置信度得到的互补概率称为____D____,常将它记为?。
A、置信区间 B、置信度 C、显著概率 D、显著水准
31.测验某批种子的发芽率是否等于 95%, 使用公式___C___。
A、u???p0ppqn B、??2(n?1)s22?0
C、t?x??0s/n D、t?dsd/n
32.20辆汽车,每辆两个前轮分别由A和B两配方制成,考察其耐磨性能,得20对数据。测验两配方的耐磨性能是否一样, 用公式___D___。
A、u???p0ppqnx??0s/n B、??2(n?1)s2?d20
C、t? D、t?sd/n
33.两独立样本,?12和?22的数值未知,但可认为?12=?22,现欲比较两样本所来自的两个总体的平均数? 1与? 2是否相等,应使用公式___C____。
13
(E?O)2A、???
E2s12B、F?2 其中:df1?n1?1,df2?n2?1
s2C、t?x1?x2SS1+SS211(?)n1?n2?2n1n2其中df?n1?n2?2
k1?k?2D、???(?dfi)lnSp??(dfilnSi2)?
C?i?1i?1?234.测验k个样本所来自的总体的方差是否都相等,应使用公式__D____。
(E?O)2A、???
E2s12B、F?2 其中:df1?n1?1,df2?n2?1
s2C、t?x1?x2SS1+SS211(?)n1?n2?2n1n2其中df?n1?n2?2
k1?k?2D、???(?dfi)lnSp??(dfilnSi2)?
C?i?1i?1?235.测验两独立样本的方差是否相等,应使用公式___B____。
(E?O)2A、???
E2s12B、F?2 其中:df1?n1?1,df2?n2?1
s2C、t?x1?x2SS1+SS211(?)n1?n2?2n1n2其中df?n1?n2?2
k1?k?2D、???(?dfi)lnSp??(dfilnSi2)?
C?i?1i?1?236.如果问题是?与?0“是否相等”。即不论???0还是???0,都要推
14
翻H0。,那么,这时的测验称为___D__测验。
A、单尾; B、大端一尾; C、小端一尾; D、两尾
37.公式
2SPxySSxSSy称为 _____A______。
A、决定系数 B、相关系数 C、回归系数; D、变异系数。
38.统计假设中的第I类错误是指:H0本来是___D___的,但我们却____了它。
A、错误,否定 B、错误,接受 C、正确,接受 D、正确,否定
39.统计假设中的第II类错误是指:H0本来是___B___的,但我们却____了它。
A、错误,否定 B、错误,接受 C、正确,接受 D、正确,否定
40.在统计假设测验中犯第I类错误的概率为___B___,犯第II类错误的概率为______。
A、?,? B、?,? C、?,? D、?,?
41.在统计假设测验中,当计算出的统计量落在___D___区域内,就接受H0;反之,当计算出的统计量落在接受区域以外,就_______H0。
A、否定,否定 B、否定,接受 C、接受,接受 D、接受,否定
42.在统计假设测验中,当计算出的统计量落在接受区域内,就___D____H0;反之,当计算出的统计量落在接受区域以外,就_______H0。
15
A、否定,否定 B、否定,接受 C、接受,接受 D、接受,否定
43.当资料不近似服从正态分布或资料不接近于加性模型时,宜采用___C___转换。
A、平方根 B、反正弦 C、对数 D、倒数
44.服从泊松分布的资料在进行方差分析之前宜采用____A____转换。通常认为计数资料,如每一个显微镜视野中的细菌数、每土方中的昆虫幼蛹数等,都服从泊松分布。
A、平方根 B、反正弦 C、对数 D、倒数
45.服从二项分布的百分数在进行方差分析之前宜采用___B____变换。例如昆虫死亡率、产品合格率、种子发芽率等都属于这种资料。
A、平方根 B、反正弦 C、对数 D、倒数
46.两变量(x,y)之间的离均差乘积和计算公式为____A____。
A、SP??(x?x)(y?y) B、sxy?Cov(x,y)?SPxy/(n?1) C、rxy?SPxySSxSSy D、b??(x?x)(y?y)?(x?x)2?SPxySSx
47.两变量(x,y)之间的样本协方差计算公式为____B____。
A、SP??(x?x)(y?y) B、sxy?Cov(x,y)?SPxy/(n?1) C、rxy?SPxySSxSSy(x?x)(y?y)SP?? D、b?SS(x?x)?2xyx
48.两变量(x,y)之间的样本相关系数计算公式为_____C_____。
A、SP??(x?x)(y?y) B、sxy?Cov(x,y)?SPxy/(n?1)
16
C、rxy?SPxySSxSSy(x?x)(y?y)SP?? D、b?SS(x?x)?2xyx
?i?a?bxi,那么,回归系数的计49.变量y在变量x上的回归方程为y算公式为_____D_____。
A、SP??(x?x)(y?y) B、a = y - bx C、rxy?SPxySSxSSy(x?x)(y?y)SP?? D、b?SS?(x?x)2xyx
50.对相关关系显著性测验的统计假设为H0:? = 0 vs HA:? ≠ 0,使用的公式为____B_____。
??y)2=b2?(x?x)2A、F =MSr/MSe 其中MSr=U/dfr=?(y
MSe=Q/dfe=(SSy-U)/(n-2),dfr=1,dfr=n-2
B、|t|?|r|/sr 其中sr?(1?r2)/(n?2),dfr=n-2 C、t?b 其中sb?sy|x/SSx,sy|x=MSe,df=n-2 sb(x?x)(y?y)D、b??
?(x?x)2?SPxySSx
51.在试验中采用 K 措施能同时降低统计假设测验犯两类错误的概率。
A、①②③; B、③④⑤; C、②③④; D、①②④; E、①④⑤; F、②③⑤ ; G、②④⑤; H、①③⑤; I、①②⑤; J、①③④; K、②③; L、①②。 其中:①提高显著水平,即减小α的值;②增大样本容量;
③采用合理的试验设计技术,降低试验误差; ④降低显著水平,即增大α的值;⑤增加处理数目。
17
52.方差分析的基本假定是 H 。
A、①②③; B、③④⑤; C、②③④; D、①②④; E、①④⑤; F、②③⑤; G、②④⑤; H、①③⑤; I、①②⑤; J、①③④
其中:①试验效应的可加性假定:每个观察值都可视为若干个线性组成部分之和;
②试验中各个处理的样本容量相等;
③试验中所有处理的误差方差是同质的,即各个处理的
亚总体误差方差相等;
④试验中各个处理的亚总体平均数相等;
⑤试验误差是随机的、彼此独立的,而且服从平均数为
0的正态分布。
53、一组资料的标准差与平均数之比称为 D ,该统计量用于两组平均数相差很大或数据单位(量纲)不同时资料变异程度的比较或两组资料变异程度不同时平均数代表性大小的比较。
A、相关系数; B、回归系数; C、标准误; D、变异系数。
254、独立地从两正态总体N1(?1,?12)和N2(?2,?2)中进行抽样,样本容量
分别为n1和n2,所得平均数分别为x1和x2,则两平均数的差值x1?x2将服从 ① D 分布,其方差为② 。
A、①二项; ②C、①正态; ②
?12n1?2?2n22?2 ; B、①泊松; ② ; D、①正态; ②
?12n1?2?2n22?2 ; ;
?12n1??12n1n2?n255、测量大豆的蛋白质含量、甘蔗中的糖含量等所得指标值,通常用百分数表示,这些资料的数据一般服从____A____分布。
A、正态分布 B、泊松分布 C、卡方分布 D、二项分布
18
E、F分布 F、均匀分布 G、Γ分布
56、试验设计中随机排列的作用是 D 。
A、提高试验的精确度 B、扩大试验代表性
C、减小误差 D、正确地估计误差(无偏地估计误差)
57、如果一个单因素试验的外部环境条件、试验材料和试验过程中的管理、操作等都比较均匀一致,不存在系统误差,则应采用 A 设计。
A、完全随机 B、随机区组 C、拉丁方 D、裂区 E、条区
58、如果一个试验的外部环境条件、试验材料或试验过程中的管理、操作等存在一个方向上的系统误差,则应采用 B 设计。
A、完全随机 B、随机区组 C、拉丁方 D、裂区 E、条区
59、一品种比较试验,参试品种8个,分别为:对照品种1个,新育成品种5个,外地新引进品种2个,则该试验中品种效应为 B 。 A、随机模型 B、固定模型
C、混合模型 D、生长模型
60、 n个观察值的倒数的算术平均数的倒数称为 B 。
A、算术平均数 B、调和平均数 C、众数 D、几何平均数 E、中数 F、变异系数
61、 n个观察值的乘积的开n次方根值称为 D 。
A、算术平均数 B、调和平均数 C、众数 D、几何平均数 E、中数 F、变异系数
19
62、试验设计中重复的作用是 E 。
A、①②③ B、①②④ C、①②⑤ D、①③④ E、①③⑤ F、②③④ G、②③⑤ H、③④⑤ 其中:
① 估计误差;②使各处理的方差同质;③扩大试验的代表性; ④正确地估计试验误差,即提供无偏的试验误差估值;⑤减少误差;
63、试验误差主要来源于 B 。
A、①②③ B、①②④ C、①②⑤ D、①③④ E、①③⑤ F、②③④ G、②③⑤ H、③④⑤ 其中:
① 实验材料固有的差异;②试验中外部环境条件引起的差异; ③试验因素不同水平引起的差异;④试验操作和管理技术不一致引起的差异;⑤不同处理其效应不同引起的差异。
64、一个二因素试验,A因素为水稻品种,12个水平;B因素为复合肥,5个水平。若采用裂区设计,为了操作上的方便,则应把A因素设置为①__B___,安排在②_____:B因素设置为③_______,安排在④_________。
A、①主处理;②主区;③副处理;④副区; B、①副处理;②副区;③主处理;④主区; C、①主处理;②副区;③副处理;④主区; D、①副处理;②主区;③主处理;④副区。
20
65、在农业和生物科学试验中,常将为了排除系统误差、控制偶然误差和对试验误差进行无偏估计而进行的试验设置(试验单元在空间上或时间上的排布)称为____D___。
A、试验方案;B、局部控制;C、唯一差异原则;D、狭义的试验设计。
三、填空题
1、 科学试验是指人类为检验科学理论或假设而从事的专门实践
活动。用于衡量试验效果的量称为试验_指标_。
2、 按能否通过人为手段进行控制,可以将因素分为可控因素和_不可控_因素。
3、 按是否试验考察的对象可以将因素分考察因素和_非考察_因
素。
4、 为了对因素进行考察,常把考察因素按数量分为不同的级别
或者按质量分为不同的状态。这些级别或状态称为因素的不同_水平_。
5、 为了对因素进行考察,常把考察因素按_数_量分为不同的级别或者按_质_量分为不同的状态。这些级别或状态称为因素的不同水平。
6、 除了考察因子要分为不同水平,以供考察之外,其余的因素
都应保持一致、不分水平,这在试验设计上称为__“唯一差异原则”__。
7、 对农业科学试验提出一些基本的要求是:㈠ 试验的目的应明
确;㈡ 试验的条件要有_代表_性;㈢ 试验的结果要_可靠_;㈣ 试验的结果应能够重演。
8、 对农业科学试验提出一些基本的要求是:㈠ 试验的目的应_明确_;㈡ 试验的条件要有代表性;㈢ 试验的结果要可靠;
21
㈣ 试验的结果应能够_重演_。
9、 由一些非考察的可控因素引起的误差称为_系统_误差,它们是由一定的已知原因引起的,也称为偏差。
10、 由不可控因素引起的、只可以减少而不可能完全避免的误差
称为_偶然_误差或_随机_误差,它们是完全偶然性的,找不出确切原因。
11、 系统误差影响试验的_准确_性,随机误差影响试验的_精确_性。
12、 _系统_误差影响试验的准确性,_随机_误差影响试验的精确
性。
13、 _准确_性是指观察值与其理论真值之间的符合程度,它衡量
了试验观察结果与真实情况偏离的程度,这种偏离常常是由一些非考察的可控因素引起的,属于_系统_误差。
14、 _精确性_性是指重复观察值之间的符合程度,对同一对象进
行多次观察,重复观察值之间的差异常常是由不可控因素引起的,属于_随机_误差。
15、 从原理上说,试验误差由两个方面的来源:由非考察的可控
因素引起的_系统_误差和由不可控因素引起的_随机_误差。
16、 在操作上,在农业和生物学领域的科学试验中,尤其是在田
间试验中,试验误差的来源主要有以下三个方面:1、试验_材料_固有的差异2、试验操作和管理技术不一致所引起的差异:3、试验中_外部环境条件_的差异。
17、 广义地说,试验_方案_指的是包括实施步骤在内的整个试验
计划。但狭义地说,试验_方案_指的是全部处理规定了整个研究的内容和范围。
22
18、 在同一试验中只研究某一个因素的若干个水平的试验称为
__单因素_试验。由于它只考察一个因素的不同水平对试验指标的不同影响,因此每个_水平_又称为一个处理。
19、 单因素试验的作用主要在于比较该因素的_效应_。所谓_效应_是指试验因素对试验指标所起的增加或减少的作用。
20、 同一因素两个水平的试验指标值之差称为_简单_效应;一个
因素内各简单效应的平均数称为_平均_效应。
21、 在多因素试验的基础上,找出若干个有希望的处理组合,作
进一步的综合考察,便构成了_综合_性试验。
22、 在多因素试验中,不同因素的水平相互结合构成不同的_处理组合_,简称_处理_。因此,处理数=不同因子水平数的乘积。
23、 在多因素试验中,同一因素水平相同,另一个因素不同水平
的试验指标值之差称为这两因素间的_简单效应_,简称____。
24、 试验设计的三项基本原则是:1、重复;2、_随机排列_;3、
_局部控制_。
25、 每个处理在试验中所占的试验单元(或小区)数称为试验的_
重复_数。
26、 试验中设置重复的作用是
1、估计误差;2、_减少误差_;3、
_扩大实验代表性_。
27、 试验中设置重复的作用是
1、_估计误差_;2、_减少误差_;
3、扩大试验的代表性。
28、 在试验中,通过对试验小区(或试验单元)的合理安排,对一
些非考察的可控因素实行控制,使它们对不同处理的影响尽可能一致的手段和方法称为_局部控制_。
23
29、 局部控制的作用是_进一步减小_误差。
30、 在试验中安排试验时,不加入人为的主观偏见,完全由机会
决定,使每一试验处理都有均等机会设置在任何一个小区的安排方法称为_随机排列_。
31、 随机排列的作用是_正确的估计_误差。
32、 成对法是一种最简单有效的试验设计方案。但它只包含_两个处理,因此只适用于将一种待测处理与一种常规处理作比较时使用。试验分为若干重复,每重复区分两小区,重复区内两处理安排在哪个小区,应由_随机_方法确定。
33、 完全随机设计是一种最简单的试验设计方案。因为它没有实
行_局部控制_,只适用于环境条件比较_均一_的试验中。
34、 随机区组设计对_一_个方向的环境变化实行了_局部控制_,
完全符合试验设计的三项基本原则,是实践中应用的最多的一种试验设计方案。
35、 实行了随机排列的重复区常称为_区组_。这样的重复区内要
求环境条件同质,不同重复区允许环境条件异质。
36、 用拉丁字母代表处理名称而排列成的、能保证试验地的直
行、横行都是随机区组的方形图称为_拉丁方_;在拉丁方试验中,处理数=_直_行数=_横_行数。
37、 根据研究目的而确定的,符合指定条件(即具有某种共同性
质)的全部观察对象的集合称为_总体_。
38、 在定义域内可以取任意实数值的变量称为_连续_型随机变
量。通常用度量衡方法得到的数据都属于这种随机变量。
39、 在定义域内只可以取一些不连续实数值的变量称为_离散_型随机变量。通常用计数方法得到的数据和一些只有次序关
24
系而没有明确数量关系的性状所转化得到的数据均可视为这种随机变量。
40、 抛掷一粒骰子,可能有六种不同的结果,可以用一个_离散_型随机变量(如X)来表示这些结果。
41、 研究一群学生的体高,可能有无数多种可能的结果,可以用
一个_连续_型随机变量(如X)来表示这些结果。
42、 对总体的所有成员进行调查,称“_全面_调查”。 43、 根据总体全体观察值算出的总体特征数称为总体_参_数,常
用希腊字母表示这种特征数。
44、 当不能进行全面调查时,只好从总体中抽取一定数量的个体
进行观察。这样的调查方式称为“_抽样_调查”。
45、 在抽样调查中观察的所有个体的集合称为_样本_。 46、 样本中的个体数称为样本_大小_或样本容量。
47、 根据样本观察值算出的样本特征数称为样本_统计_量。这些
样本统计量常用英文字母表示。
48、 按某个质量性状的表现分为若干类,然后将所有观察对象归
属到各类之中,统计各类中的个体数。这类资料叫做_属性_资料。
49、 当一种性状只具有两种可能的表现时,可以用一种只可以取
0、1两种数值的变量来表示。这种变量叫_指示_变量。指示变量也属于离散型随机变量。
50、 对于离散型随机变量的资料,若变量可取值数目_不多_时,
可以通过按自然单位进行分组的方法编制次数分布表。
51、 _平均_数指出了一组数据的中心位置,告诉人们这组数据的
一般水平,同时可以作为一组资料的代表值,与其他资料进
25
行比较。
52、 资料中每一个观察值与该资料的算术平均数之间的差称为_
离均差_。
53、 一组资料中,全部观察值的离均差之和为_0_。 54、 如果常数
a不等于资料的平均数,那么,资料中所有观察值
与a之差的平方之和必定_大于_于离均差的平方之和。
55、 一组资料中,全部观察值的离均差的平方之和称为_离均差平方和_,简称为_平方和_,并记为SS。
56、 样本方差的分母
n-1称为样本方差的_自由度_,简记为df。
1k57、 公式??其中各?fiXi称为总体平均数的加权平均数公式。Ni?1组次数f i又称为X i的_权_数,它衡量了在计算平均数时X i所占的比重。
1k58、 公式x??fixi称为样本平均数的加权平均数公式。其中各
ni?1组次数f i又称为X i的_权_数,它衡量了在计算平均数时X i所占的比重。
59、 _变异系数_系数(CV)是资料的标准差与平均数之比。它衡量
了标准差占平均数的比例,是一个没有单位的数值,常用百分数表示。
60、 资料中的最大值与最小值之间的差数称为_极差_,常记为
R
= Max(x)-Min(x)。它有时也被称为资料的范围。
61、 样本资料的离均差平方和与自由度(df?n?1)之比值称为样
本_方差_。记为s2?SS/df?SS/(n?1)。
62、 总体_方差_的计算公式为??SS?N2?(x??)N2?x?2?(?x)2/NN,它
的平方根值称为总体_标准差_。
26
63、 样本_方差_的计算公式为s?SS?n?12?(x?x)n?12?x?2?(?x)2/nn?1,它
的平方根值称为样本_标准差_。
64、 某一随机事件发生的可能性的数值表示称为_概率_。 65、 “小概率的事件在一次试验中是不至于会发生的”,这叫做
统计试验中的“_小概率_原理”。
66、 如果某连续型随机变量
X的密度函数为
f(X?x)??1e2??(x??)22?2,则称随机变量X服从具有参数_?_和_?2_的正态分布。并记为X~ N(?,?2)。
67、 标准正态分布曲线与横轴之间在区间(μ-1.96σ,μ+1.96σ)的
面积占总面积的_95_%。
68、 标准正态分布曲线与横轴之间在区间(μ-2.58σ, μ+2.58σ)的
面积占总面积的_99_%。
69、 总体平均数? =_0_、总体标准差? =_1_的正态分布称为标
准正态分布。
70、 当
df→∞时,t分布逼近于标准_正态_分布,t分布曲线与标
准_正态_分布曲线重合。
71、 卡平方变量的定义域为? 2
≥_0_,所以整个图形都在第_一_
象限。
72、 如果某随机变量
X可以取得X=0, 1, 2, …, n等数值。取X=
x时的概率为P(X?x)?f(x)?Cnxpxqn?x,则称随机变量X服从具有参数n和p的_二项_分布,并记为X~B (n, p)。
73、 二项分布随机变量
X的总体平均数? =_np_和总体方差? 2
=_npq_。
74、 当
n很大,p(或q)很小时,二项分布逼近为_泊松_分布。
27
75、 若已知随机变量
2X~N(?x,?x),并从X总体中抽取样本容量
为n的样本,那么,样本平均数将服从总体平均数为?x=?x,
222?方差为?=______xn的正态分布。即x~N(?x,?x)?N(?x,?x/n)。
2x76、 中心极限定理证明:如果从一个总体平均数为?x、方差为?x2的非正态总体X抽样,那么,只要样本容量n足够大,其样本平均数x也将服从总体平均数?x=?x,总体方差?x2=
2?n的_正态_分布。即x~N(?,?2)?N(?,?2/n)。 x______xxxx77、 如果从一个方差为?12的正态总体中随机抽取一个大小为n1
的样本,得到的样本方差为s12;又独立地从一个方差为?22的正态总体中随机抽取一个大小为n2的样本,得到的样本方差
s12/?12为s。那么,比值F?22将服从第1自由度为n1-1,第2
s2/?222自由度为_ n2-1_的_F_分布。
78、 这种具有一定概率保证的未知参数的估计区间称为_置信_区间,区间的最小值称为“下限”,区间的最大值称为“上限”。
79、 统计上称那种“所施加的处理没有效果的”假设为_无效_假
设,记为HO。而称另一种“当HO不正确时供选用的假设”为_备择_假设,并记它为HA。
80、 先对要研究的参数作一个假设,然后去测验这个假设是否正
确的方法称为统计假设的_测验_。
81、 如果问题是?与?0“是否相等”。即不论???0还是???0,
都要推翻HO。那么,这时的测验称为_两尾_测验;如果问题是?“是否大于”?0。即只有当???0时才能推翻,那么,这时的测验称为_单尾_测验。
82、 统计测验的第_Ⅰ_类错误是指:HO本来是正确的,但我们
28
却否定了它。
83、 统计测验的第_Ⅱ_类错误是指:HO本来是错误的,但我们
却接受了它;
84、 在统计假设中犯第
I类错误的概率为显著水准,常记为_α_。
85、 方差分析是建立在一定的_线性可加_模型的基础上的,这种
模型是指每个观察值可以划分为若干个线性组成部分,它是平方和和自由度分解的理论依据。
86、 如果要对一个分为
k组、每组含n个观察值的单向分类资料
进行方差分析,那么,在方差分析表中的总自由度为_nk-1_,组间自由度为k-1,误差自由度为_ k(n-1)_。
87、 如果要对一个有
k个处理、n个区组,每组合只有一个观察
值的两向分类资料进行方差分析,那么,在方差分析表中的总自由度为_ nk-1_,处理间自由度为k-1,区组间自由度为n-1,误差自由度为_(k-1)(n-1)_。
88、 完全随机排列试验的资料宜采用_单项分组资料_方法进行
分析;随机区组的试验资料宜采用_两项分组资料_方法进行分析。
89、 对某随机区组试验资料进行分析后,发现区组项的
F 测验
不显著,这说明该试验的环境条件颇为_接近_。在这种情况下,如果把资料当作单向分组数据进行分析,将会_使整个测验的精确度提高_。
90、 用
LSD 法和 Q 法进行多重比较,其结果是不同的,LSD 法
较易犯第_Ⅰ_类错误,Q 法较易犯第_Ⅱ_类错误。所以 LSD 法比 Q 法更_容易_达显著。
91、 用
Duncan法进行多重比较时,公式S.E.?se2/n中的 se2
29
是方差分析表中的_误差_项,n 则是_计算每个平均数所用到的观察值个数_。
92、 若方差分析表中某一项的
F值为F=MSt/MSe,那么,查 F
表时,df1应是_MSt_项的自由度,df2 应是_ MSe _项的自由度。
93、 服从泊松(Poisson)分布的资料在进行方差分析之前宜采用_
平方根_转换。通常认为计数资料,如每一个显微镜视野中的细菌数、每土方中的昆虫幼蛹数等,都服从泊松分布。
94、 服从二项分布的百分数在进行方差分析之前宜采用_反正弦_变换。例如昆虫死亡率、产品合格率、种子发芽率等都属于这种资料。
95、 当资料不近似服从正态分布或资料不接近于加性模型时,在
进行方差分析之前宜采用_对数_转换。
96、 两变量(x,y)之间的_离均差乘积和_的计算公式为
SP??(x?x)(y?y)。
97、 两变量(x,y)之间的_协方差_的计算公式为
Cov(x,y)??(x?x)(y?y)/(n?1)。
98、 两变量(x,y)之间的_相关系数_的计算公式为
Cov(x,y)rxy??sxsySPxySSxSSy 。
99、 两变量(x,y)之间的_回归系数_的计算公式为
b??(x?x)(y?y)?SPSS?(x?x)2xyx 。
100、
?=a+bx中,a=y?bx 称为_回变数y依x的直线回归方程y归截距_, b=SPxy/SSx 称为_回归系数_。 其中 SPxy 是变量x
30
和y之间的_离均差乘积和_;SSx 则是_X的平方和_。
101、
在中国将近13亿人的群体里,随机抽样调查10人,出现 5
510人是男性、5人是女性的概率为 C 10 * ?0.5 ? 。
102、
一块番薯地里有6000株番薯,其中有2000株开白花,2000
株红花,2000株开紫花,现采用复置抽样方式随机抽样调查3株,恰好出现“1株开白花、1株开红花、1株开紫花”的概率为 2/9 。
103、
正态分布曲线主体部分在横轴上的位置是由 平均数 决定的,而正态分布曲线的形状是由 方差 决定的。
104、
正态分布的取值区间为 (-∞,+∞) ;t分布的取值区间为 (-∞,+∞) ;?2分布的取值区间为 [0,+∞) ;F分布的取值区间为 [0,+∞) 。
105、
有一随机区组设计的试验,8个处理,3次重复,那么,在
方差分析表中的总自由度为_23_,区组间自由度为 2 ,处理间自由度为 7 ,误差自由度为_14_。
106、
有一完全随机设计的试验,8个处理,3次重复,那么,在
方差分析表中的总自由度为_23_,处理间自由度为 7 ,误差自由度为_16_。
107、
一拉丁方设计试验资料,共有6个处理,则误差项自由度
为 20 。
108、
试验设计中重复的作用是 估计误差 、减少误差和扩大试验的代表性。
109、
从平均数??1200的总体中进行抽样,若样本容量n=60,则
样本平均数总体的平均数?x? 1200 。
110、
从方差?2?900的总体中进行抽样,若样本容量n=60,则样
31
本平均数总体的方差?x2? 15 。
111、
从一正态总体中进行抽样,若样本容量n=60,则样本平均
数将服从 正态 分布。
112、
由非考察的可控因素引起的误差称为 系统误差 ,它会影
响试验的准确性。
113、
在多因素试验中,一个因素内各简单效应的平均数称 平均效应 。
114、
在多因素试验中,两个因素简单效应间的平均差异称为因
素间的 交互作用效应 。
115、
一品种比较试验,共有36个参试品种,采用完全随机化设
计,重复3次,以小区为单位计产,那么,在方差分析表中的总自由度为 107 。
116、
一品种比较试验,共有36个参试品种,采用完全随机化设
计,重复3次,以小区为单位计产,那么,在方差分析表中处理(品种)间自由度为 35 。
117、
一品种比较试验,共有36个参试品种,采用完全随机化设
计,重复3次,以小区为单位计产,那么,在方差分析表中误差项自由度为 72 。
118、 ?2分布的取值区间为 119、 120、 121、 122、 123、 124、
[0,+∞) 。
F分布的取值区间为 [0,+∞) 。 相关系数的取值区间为 [-1,1] 。 决定系数的取值区间为 [0,1] 。 标准正态分布的平均数为 0 。 标准正态分布的方差为 1 。 学生氏t分布的平均数为 0 。
32
125、 126、 127、 128、 129、
学生氏t分布的取值区间为 (-∞,+∞) 。 正态分布的取值区间为 (-∞,+∞) 。 回归系数取值区间为 (-∞,+∞) 。 回归截距取值区间为 (-∞,+∞) 。
为了对因素进行考察,常把考察因素按量分为不同的级别
或者按质分为不同的状态。这些级别或状态称为因素的不同 水平 。
130、
一试验有A和B两个试验因素,A因素效应为固定模型,
B素效应为随机模型, 其中A有a个水平,B有b个水平,共有ab个处理组合。每个处理组合含n个观察值,全部共有abn个观察值。下表是各个样本均方的期望均方。要检验A因素各水平间效应差异是否显著,F值的分子为MSA,F值的分母应为_MSAB_。
140. 一玉米品种比较试验,共有5种参试品种,采用随机区组设计,设3个区组,先计算每区组中各处理的平均数,再进行方差分析。方差分析结果表明,至少有两个品种的产量有显著差异,用Duncan氏新复极差法进行进行多比较,计算出LSR值和各品种的平均数如下,
33
试填上差异显著性标志字母:
平均数个数g 2 LSR0.05
品种平均数符号 品种平均数 3 4 5 3.912 4.068 4.164 4.224 xC 25 xD xA 24 a 22 ab xE xB 19 b 16 c 差异显著性标志字母 a 以上资料中:
⑴ xA与xB间的差异_显著_。 ⑵ xA与xC间的差异_不显著_。 ⑶ xA与xD间的差异_不显著_。 ⑷ xA与xE间的差异_不显著_。 ⑸xD与xE间的差异_显著_。
2141. 从两个正态总体N1(?1,?12)和N2(?2,?2样本容)进行抽样分布试验,
量分别为n1和n2,所得平均数分别为x1和x2,则样本平均数差数
22σ1σ2?(x1?x2)总体分布的方差为________n1n2。
142. 一组数据资料各观察值的离均差的总和为 0 。
四、计算题
⒈某水稻品种比较试验,按随机区组布置,产量资料如下表(单位:
34
kg),试比较品种间的差异。若品种间差异的F测验显著,请用Duncan法对其进行多重比较。
品 种 区 组 A Ⅰ Ⅱ Ⅲ Tj=?x 5 3 4 12 50 B 2 5 2 9 33 C 1 3 2 6 14 36 2 D 9 7 5 21 E 4 6 5 15 Ti=?x 21 24 18 63 329 2x? Ti2=(?x)2 xi??x/n 127 128 74 329 441 576 324 1341 4.2 4.8 3.6 ?x2 155 77 Tj2=(?x)2 xj??x/n 144 81 4 3 441 225 927 7 5 解: 变异来源区组间品种间误差总变异gSSR0.05LSR0.05自由度24814平方和3.644.416.464.4均方1.811.12.05F0.8785.415*F0.054.4593.838 SE=2.05/3=0.827,dfe=8; 多重比较结果 245品种名称DEA 33.263.393.473.52平均数7.005.004.00 2.702.802.872.91差异显著性标志字母aabb B3.00bC2.00c统计结论:
①品种D与品种A、品种B、品种C差异显著; ②品种C与品种E、品种A、品种B差异显著; ③其余各品种之间无显著差异。
35
36
⒉测得广州市1956年~1964年间3月份旬平均温度累积值(x,单位:旬·度)和相应年份一代三化螟蛾盛发期(y,以5 月1日为0)的关系数据于下表中,并计算出了分析所需的六个一级数据,要求: ⑴试配制回归方程,并对回归关系进行显著性测验以判断3月
份旬平均温度累积值能否用于预测一代三化螟蛾盛发期。
⑵若某年3月份旬平均温度累积值为40旬·度,则该年有95%
可靠度的一代三化螟蛾盛发期在何期间? 年份 56 X Y 57 58 59 60 61 62 63 64 35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2 12 16 9 2 7 3 13 9 -1 从上表计算得到六个一级数据如下:
n=9,Σx =333.7,Σx2 =12517.49,Σy =70,Σy2 =794,Σxy =2436.4 解:(1)
SSx=Σx2-(Σx)2/n=144.6356 SSy=Σy2 -(Σy)2/n=249.5556 SPxy=Σxy-ΣxΣy/n=-159.0444 b= SPxy/ SSx =-1.099622 a= y-bx=48.54931 求得直线回归方程为:
=48.54931-1.099622x
37
变异来源回归误差总变异自由度平方和均方1174.8886174.8886774.667010.66678249.5556F值F0.0516.3957*5.5915 F=16.3957>F0.05,判断数据中的y对x有显著的回归关系,即3月份旬平均温度累积值能否用于预测一代三化螟蛾盛发期。
(2)由题意,当x=40时, =48.54931-1.099622*40=4.564430 =10.6667*1?1/9??40-37.1?144.6356=3.5315883
2?? df=9,查t表得t=2.2622 对于0.05
所以预测值y的95%置信区间为:
(4.564430-2.2622*3.5315883,4.564430+2.2622*3.5315883) =(-3.4247290,12.5535891)
所以该年有95%可靠度的一代三化螟蛾盛发期在[-4,13]期间,即该年有95%可靠度的一代三化螟蛾盛发期在4月27至5月14日期间。
38
⒊调查种苗经过灭菌处理与未经灭菌处理,某果园青枯病的发生株数,得相依表如下,试分析种苗灭菌与否和青枯病发病株数多少是否有关?
处理项目 发病株数 种子灭菌 种子未灭菌 总和 26 184 200 384 210 250 460 未发病株数 50 总数 76 解:统计假设为H0:种苗灭菌与否和青枯病发病株数无关 vs
HA:种苗灭菌与否和青枯病发病株数有关
卡方独立性测验的计算过程
分组种子灭菌发病种子灭菌未发病种子未灭菌发病种子未灭菌未发病合计
O2650184200460E(O-E)2/E34.69572.179441.30431.8307175.30430.4313208.69570.36234604.80372 df=(2-1)(2-1)=1,当卡方自由度为df =1时,? 0.05 =3.84,现在
χ2=4.80>3.84,否定H0假设, 因此可以判断差异显著,即种苗灭菌与
否和青枯病发病株数有关。
39
⒋调查水稻10个单株的籽粒重量(g),得数据分别为 50,45,73,66,42,70,55,62,45,52。试
⑴写出样本大小; ⑵计算平均数; ⑶计算平方和; ⑷计算方差; ⑸计算标准差; ⑹计算变异系数; ⑺计算极差。
(8)计算95%的置信区间。
解:(1)样本大小n=10;(2)平均数x=56;(3)SS=1112; (4)s2=123.556;(5)s=11.115;(6)CV=19.85%;(7)R=31; (8)原总体的方差未知用样本方差s2代替总体方差? 2,用 t 分布估计区间:
t0.05,9=2.2622,S.E.= sn=3.515
95%=P(- t0.05,9≤t≤t0.05,9)
=P(-2.2622≤
x?μ≤2.2622) sn=P(56-2.2622*3.515≤?≤56+2.2622*3.515) = P(48.0483≤?≤63.9516)
40
⒌某水稻品种比较试验按完全随机排列,试验资料如下表,试比较各品种间的差异。若方差分析表明品种间差异显著,请用Duncan法对品种间的差异进行多重比较。 品 种 A B C D 解:
小 区 产 量 1 3 5 3 5 7 5 7 9 7 9 11 T=?x 9 15 21 27 T2=(?x)2 81 225 441 729 ?x2 x??x/n 3 5 7 9 35 83 155 251 变异来源品种间误差总变异SE=4/3=1.158,df=8;
自由度381123.263.76平方和60329233.393.91均方204 gSSR0.05LSR0.0543.474.01 标记字母法多重比较结果
品种名称DCBA平均数9.007.005.003.00差异显著性标志字母aabbc统计结论:
①品种D与品种A、品种B间差异显著; ②品种A与品种B、品种C间差异显著; ③其余各品种之间无显著差异。
41
⒍某农业技术推广站将引进的两个大豆新品种种在10个地点进行对比试验。对产量测定的结果如下表。⑴ 试测验两个大豆品种产量的方差之间是否有显著差异。⑵ 试测验这两个大豆品种的产量之间是否有显著差异。
地点号 品种A 品种B 解:(1) 2222=?B统计假设测验为:H0: ?A VS HA:?A??B
1 2 3 4 5 6 7 8 9 10 50 85 60 40 68 40 52 30 80 68 52 60 45 40 60 30 42 30 60 65 2s1F=2=327.1222/165.8222=1.9727
s2df1= df2=9,查得F0.025,9,9=4.026,求得F0.975,9,9=0.2484
因为F0.975,9,9≤F ≤F0.025,9,9,因而不能推翻H0,判断两个大豆品种产量的方差之间无显著差异。 (2)(试验资料为成对法资料)
统计假设测验为:H0: ?d?0 VS HA:?d?0
地点号123d-22515d=8.9,sd=9.0363 | t |=
dsdn?8.99.036310405867101080910203 =3.1145
当df=9时,t0.05=2.2622,现在| t |=3.1145> t0.05,否定H0假设,可以判断这两个大豆品种的产量之间有显著差异。
42
⒎已知某个水稻品种的亩产量X(单位:kg)服从正态分布N(1050,1202),现随机种植6个小区,并将小区平均产量折算为平均亩产。问:⑴ 有95%的把握说平均亩产落在什么(两尾)区间?⑵ 平均亩产高于1100kg的概率是多少?
解:(1)因为X~N(1050,1202),所以x~N(1050,1202/6),将x转换成标准正态离差: 95%=P(μx-1.96
?x?≤x≤μx+1.96x)
nn将μx =1050,?x=120代入,得:
P(1050-1.96*120/6≤x≤1050+1.96*120/6)= P(953.98≤x≤1146.02)
即平均亩产有95%可能落在(953.98kg,1146.02kg)之间。 (2)
P(﹣∞≤x≤1100)= P(﹣∞≤
x-?x?x1100-1050≤)
1206n≈ P(﹣∞≤U≤1.02)
从标准正态分布表查出Φ(U=1.02)=0.8461, 所以P(U≥1.02)=1-0.8461=0.1539 即平均亩产高于1100kg的概率为0.1539
43
⒏在一组盆栽柑桔中,选植株大小、生长势等等方面都比较一致的柑桔配成一对,共有10对。每对中,随机选一盆施用A肥料,另一盆施用B肥料,调查柑桔产量结果如下(单位:g),问两种肥料的效应有否显著差异? 配对号 1 2 369 392 3 324 316 8 4 365 382 -17 5 286 276 10 6 316 324 -8 7 256 276 8 282 296 9 378 376 2 10 328 338 -10 A肥料 256 B肥料 268 d 解: -12 -23 -20 -14 根据资料算得:n=10,d=-8.4,sd=11.4717
统计假设测验为:H0: ?d?0 VS HA:?d?0 | t |=
dsdn??8.411.471710=2.3155
当df=9时,t0.05=2.2622,现在| t |=2.3155> t0.05,否定H0假设,可以判断这两种肥料的效应有显著差异。
44
⒐研究矮壮素使玉米矮化的效果,在抽穗期测量喷矮壮素小区玉米(x1 )和对照小区玉米(x2 )各10株,得株高(cm)的测量结果如下表,试测验矮壮素是否对玉米的株高有明显的矮化效果? X1 162 168 176 182 158 163 166 176 172 169 Σx1 2Σx1 =1692 =286778 Σx2 Σx2 2X2 178 182 196 187 183 195 172 197 193 186 解:(试验资料为成组资料)
=1869 =349945 2
x1=169 cm,x2=186.9 cm,n1=n2=10,cm2,SS1=491.6cm ,SS2=628.9
s1=7.3907 cm,s2=8.3593 cm
2222统计假设测验为:H0: ?1??2 VS HA:?1??2
2s1F=2s2=0.7817,df1= df2=9,查得F0.025,9,9=4.026,求得F0.975,9,9=0.2484
22?1??2因为F0.975,9,9≤F≤F0.025,9,9,因而不能推翻H0,故可以认为:
统计假设测验:H0: ?1-?2?0 VS HA: ?1-?2?0
2seSS1?SS2?=62.25,于是有 ?n1?1???n2?1? t ??x1?x2???1??2?2?se???11????nn?12?=5.0730
当df =18时,单尾t0.05=1.7341,现在| t |=5.0730> t0.05,否定H0假设,可以判断矮壮素对玉米的株高有明显的矮化效果。
45
⒑如果豌豆种皮的颜色是黄是绿和种子形状是圆满还是皱缩分别由两对独立的完全显性基因控制的话,杂种F2代中黄圆∶黄皱∶绿圆∶绿皱的分离比例应该为9∶3∶3∶1。一次试验的结果如下表所示,试测验此结果是否符合自由组合的理论比率。 性状组合 观察数(O) 解:
统计假设为H0: 实际比例为9:3:3:1 VS HA:实际比例不是9:3:3:1
黄、圆 黄、皱 绿、圆 绿、皱 合计 368 118 128 38 652 性状组合黄、圆黄、皱绿、圆绿、皱合计2观察数(O)36811812838652理论数(E)366.75122.25122.2540.75(O?E)2E0.0040.1480.2700.1860.608当df =4-1=3时,?0.05=7.815,χ2=0.6080.05,接受H0假设,因此判断此结果是否符合自由组合的理论比率。
2 46
⒓测量两个品种的生猪的腰围尺寸(x)与体重(y)的数据资料如下表所示。试
⑴分别计算这两个品种生猪的腰围尺寸(x)与体重(y)之间的相关系数;
⑵分别测验这两个品种生猪的腰围尺寸(x)与体重(y)之间是否有显著的相关关系;
⑶测验这两个品种生猪腰围尺寸(x)与体重(y)的相关系数之间是否有显著的差异;若两相关系数差异不显著,将其合并。)
品种 A 观察值 x1 92 94 95 97 99 101 104 109 111 y1 67 68 70 72 74 79 B x2 81 83 84 88 90 92 y2 54 58 59 63 65 68 83 94 74 84 99 75 90 106 78 根据上表已计算得如下中间统计量:
n1?n2?n?9;?x1?902;?y1?687;?x2?817;?y2?594;
?x2122?90754;?y12?52959;?x2?74687;?y2?39764;
?xy11。?69273;?x2y2?54443
解:(1)在品种A中:
2-??x1?n=353.5556 SSx=?x122-??y1?n=518 SSy=?y12SPxy=?x1y1-?x1?y1n=420.3333
所以A品种生猪的腰围尺寸(x)与体重(y)之间的相关系数为
47
r1=
SPxySSxSSy=0.9822,
在品种B中:
2SSx=?x2-??x2?n=521.5556
22SSy=?y2-??y2?n=560
2SPxy=?x2y2-?x2?y2n=521
所以B品种生猪的腰围尺寸(x)与体重(y)之间的相关系数为: r2=
SPxySSxSSy=0.9640
(2)在品种A中:
sr=1-r12???n-2?=0.0710, t ? r 1sr=13.8346
当df =7时, t0.05=2.3646。现在| t |=13.8346> t0.05,因此判断A品种生猪的腰围尺寸(x)与体重(y)之间有显著的相关关系。
在品种B中: sr=1-r22???n-2?=0.1005, t ? r 2sr=9.5920
当df =7时,t0.05=2.3646。现在| t |=9.5920> t0.05,因此判断B品种生猪的腰围尺寸(x)与体重(y)之间有显著的相关关系。
1?1?r?(3)z1?thr1?ln???2.3564
2?1?r??11?1?r?z2?th?1r2?ln???1.9996
2?1?r?sz1?z2?11??0.5774
n1?3n2?3z1?z2 u ??0.6179< u0.05=1.96
sz1?z2
48
因此判断这两个品种生猪的腰围尺寸(x)与体重(y)之间没有显著的差异。
这两个品种生猪的腰围尺寸(x)与体重(y)平均的相关系数估计值为:
????SS?1??2?SPxy?SPxy?1?x?SSx?2???SS?1?y?SSy?2???0.9691
五、问答题
⒈试述生物科学试验中,试验设计(狭义)的必要性和重要性。 答:必要性:试验总会有误差,只有通过合理的试验设计才能达到排除系统误差,控制随机误差的目的。
重要性:它不仅能够节省人力、物力、财力和时间,更重要的是它能够减少试验误差,无偏估计误差,提高试验的精确度,取得真实可靠的试验资料,为统计分析得出正确的判断和结论打下基础。
⒉试述生物科学试验中,对试验结果进行统计分析的必要性和重要性。 答:实验的数据是各部分效应的综合体,要通过对试验结果进行统计分析分解效应,分为误差效应和处理间效应。统计分析将误差效应剥离出来,而能更加准确的观察处理间效应,进行方差分析可以对随机误差无偏的估计,通过F测验对误差变异项和处理间变异项进行显著性测验。 ⒊试验设计的三个基本原则及其作用是什么?怎样在试验设计中贯彻执行三个基本原则。
答:(1)重复,作用:估计误差、减少误差、扩大试验的代表性; (2)局部控制,作用:进一步减小误差;
49
(3)随机排列,作用:正确地估计误差。
⒋完全随机设计有什么特点?什么情况下适宜使用完全随机设计? 答:特点:使用了试验设计三个原则中的两个(重复、随机),能够得到无偏的误差估计值,但控制试验环境误差的能力不强。
适用范围:常用于试验环境因素相当均匀的场合,如实验室培养试验、网室温室的盆钵试验。
⒌随机区组设计有什么特点?什么情况下适宜使用随机区组设计? 答:特点:使用了田间试验设计三个原则,并根据 “局部控制” 的原则,将试验地按肥力程度划分为等于重复数的区组,一区组安排一重复,区组内各处理独立地随机排列。是田间试验最常用的设计。
适用范围:单因素、多因素以及综合性试验都能用。 ⒍拉丁方设计有什么特点?什么情况下适宜使用拉丁方设计?
答:特点:将处理从纵横两个方向排列成区组,具有双向控制土壤差异的能力,因而有较高的精确度。
适用范围:只限于4-8个处理,不能象随机区组那样区组可以分开,故在田间试验时要求有整块平坦的土地。
⒎ 裂区设计有什么特点?什么情况下适宜使用裂区设计?
答:特点:主处理分设在主区,副处理则分别设于一主区内的副区内。副区的数量比主区多,因而副处理的比较比主处理的比较更精确。
适用范围:(1)在一个因素的各种处理比另一因素的处理需要更大的面积时;(2)试验中某一因素的主效比另一因素的主效更为重要,或两个 因素间的互作比主效更为重要时,将要求更高精度的因素作为 副处理,另一
50