田间试验与统计分析-习题集及解答
1. 在种田间试验设计方法中,属于顺序排列的试验设计方法为:对比法设计、
间比法
2. 若要控制来自两个方面的系统误差,在试验处理少的情况下,可采用:拉丁
方设计
3. 如果处理内数据的标准差或全距与其平均数大体成比例,或者效应为相
乘性,则在进行方差分析之前,须作数据转换。其数据转换的方法宜采用:对数转换。
4. 对于百分数资料,如果资料的百分数有小于30%或大于70%的,则在进
行方差分析之前,须作数据转换。其数据转换的方法宜采用:反正弦转换(角度转换)。
5. 样本平均数显著性测验接受或否定假设的根据是:小概率事件实际不可能性
原理。
6. 对于同一资料来说,线性回归的显著性和线性相关的显著性:一定等价。 7. 为了由样本推论总体,样本应该是:从总体中随机地抽取的一部分
8. 测验回归和相关显著性的最简便的方法为:直接按自由度查相关系数显著
表。
9. 选择多重比较的方法时,如果试验是几个处理都只与一个对照相比较,则应
选择:LSD法。
10. 如要更精细地测定土壤差异程度,并为试验设计提供参考资料,则宜采用:
空白试验 11. 当总体方差为末知,且样本容量小于30,但可假设
=
=
(两样本
所属的总体方差同质)时,作平均数的假设测验宜用的方法为:t测验 12. 因素内不同水平使得试验指标如作物性状、特性发生的变化,称为:效应 13. 若算出简单相差系数大于1时,说明:计算中出现了差错。 14. 田间试验要求各处理小区作随机排列的主要作用是:获得无偏的误差估计值 15. 正态分布曲线与轴之间的总面积为:等于1。
16. 描述总体的特征数叫:参数,用希腊字母表示;描述样本的特征数叫:统计
数,用拉丁字母表示。
17. 确定分布偏斜度的参数为:自由度
18. 用最小显著差数法作多重比较时,当两处理平均数的差数大于LSD0.01时,
推断两处理间差异为:极显著 19. 要比较不同单位,或者单位相同但平均数大小相差较大的两个样本资料的变
异度宜采用:变异系数
20. 选择多重比较方法时,对于试验结论事关重大或有严格要求的试验,宜用:
q测验。
21. 顺序排列设计的主要缺点是:估计的试验误差有偏性
22. 田间试验贯彻以区组为单位的局部控制原则的主要作用是:更有效地降低试
验误差。
23. 拉丁方设计最主要的优点是:精确度高
24. 连续性变数资料制作次数分布表在确定组数和组距时应考虑:
(1)极差的大小;(2)观察值个数的多少;(3)便于计算;(4)能反映
出资料的真实面貌。
25. 某蔗糖自动打包机在正常工作状态时的每包蔗糖重量具N(100,2)。某日
抽查10包,得=101千克。问该打包机是否仍处于正常工作状态?此题采用:(1)两尾测验;(2)u测验
26. 下列田间试验设计方法中,仅能用作多因素试验的设计方法有:(1)裂区
设计;(2)再裂区设计。
27. 对于对比法和间比法设计的试验结果,要判断某处理的生产力确优于对照,
其相对生产力一般至少应超过对照:10%以上 28. 次数资料的统计分析方法有:(1)
法。 29. 算术平均数的重要特征是: (1)
测验法;(2)二项分布的正态接近=0;(2)
<∑
,
(a≠)。
30. 为了有效地做好试验,使试验结果能在提高农业生产和农业科学的水平上发
挥应有的作用,对田间试验的基本要求是:(1)试验的目的性要明确;(2)试验的结果要可靠;(3)试验条件要有代表性;(4)试验结果要能够重复。 31. 表示变异度的统计数最常用的有:(1)极差;(2)方差;(3)标准差;
(4)变异系数。
32. 试验某生长素对小麦苗发育的效果,调查得未用生长素处理和采用生长素处
理的苗高数据各10个。试测验施用生长素的苗高至少比未用生长素处理的苗高2cm的假设。此题应为:(1)测验;(2)一尾测验。
33. 确定试验重复次数的多少应根据:(1)试验地的面积及小区的大小;(2)
试验地土壤差异大小;(3)试验所要求的精确度;(4)试验材料种子的数量。
34. 对单因素拉丁方试验结果资料方差分析时,变异来源有:(1)总变异;(2)
行区组间变异;(3)列区组间变异;(4)处理间变异;(5)试验误差。 35. 在方差分析F测验中,当实得F小于F0.05,应接受Ho(无效假设),认为处理间差异不显著。
36. 某样本的方差越大,则其观察值之间的变异就越大。
37. 在试验中重复的主要作用是估计试验误差和降低试验误差。 38. 自由度的统计意义是指样本内能自由变动的观察值个数。
39. 数据 3、1、3、1、2、3、4、5 的算术平均数是 2.75 ,中数是 3 。
40. 一般而言,在一定范围内,增加试验小区的面积,试验误差将会降低。 41. 在=a+bx方程中,b的意义是x每增加一个单位,平均地将要增加或减少的单位数。
42. 田间试验可按因素的多少分为单因素试验和多因素试验。 43. 卡平方测验的连续性矫正的前提条件是自由度等于1。
44. 从总体中抽取的样本要具有代表性,必须是随机抽取的样本。
45. 从一个正态总体中随机抽取的样本平均数,理论上服从正态分布。
46. 在一定的概率保证下,估计参数可能出现的范围和区间,称为置信区间(置信距)。
47. 试验误差分为系统误差和随机误差。
48. 在拟定试验方案时,必须在所比较的处理之间应用唯一差异的原则。 49. 在多重比较中,当样本数大于等于3时,t测验,SSR测验、q测验的显著尺
度q测验最高,t测验最低。
50. 试验资料按所研究的性状、特性可以分为数量性状和质量性状资料。 51. 样本可根据样本容量的多少为:大样本、小样本。
52. 对比法、间比法试验,由于处理是作顺序排列,因而不能够无偏估计出试验的误差。
53. 小区的形状有长方形、正方形。一般采用长方形小区。
54. 在边际效应受重视的试验中,方形小区是有利的,因为就一定的小区面积来
讲,方形小区具有最小的周长,使受到影响的植株最少。 55. 完全随机设计应用了试验设计的重复和随机两个原则。 56. 试验设计的三个基本原则是重复、随机和局部控制。 57. 在田间试验中,设置区组的主要作用是进行局部控制。 58. 两个变数的相关系数为0.798,对其进行假设测验时,已知
=0.798,那
么在1%水平上这两个变数的相关极显著。
59. 随机区组设计应用了试验设计的重复、随机和局部控制三个原则。
60. 试验方案试验计时,一般要遵循以下原则: 明确的目的性 、 严密的可比性 和 试验的高效性 。
61. 试验误差分为系统误差和随机误差,一般所指的试验误差为随机误差。 62. 试验误差:使观察值偏离试验处理真值的偶然影响称为试验误差或误差。 63. 试验指标:衡量试验处理效果的标准称为试验指标(experimental index),
简称指标(index)。在田间试验中,用作衡量处理效果的具体的作物性状即为指标,例如产量、植株高等。
64. 准确性(accuracy)与精确性(precision) 统计工作是用样本的统计数来推断
总体参数的。我们用统计数接近参数真值的程度,来衡量统计数准确性的高低,用样本中的各个变量间变异程度的大小,来衡量该样本精确性的高低。因此,准确性不等于精确性。准确性是说明测定值对真值符合程度的大小,而精确性则是多次测定值的变异程度。
65. 标准差:统计学上把方差或均方的平方根取正根的值称为标准差(standard
deviation)。标准差,能度量资料的变异程度,反映平均数的代表性优劣。标准差(方差)大,说明资料变异大,平均数代表性差;反之,说明资料的变异小,平均数的代表性好。
66. 标准差为方差或均方的平方根,用以表示资料的变异度,其单位与观察值的度量单位相同。
67. 参数与统计数 参数:由总体的全部观察值计算得的总体特征为参数,它是
该总体真正的值,是固定不变的,总体参数不易获得,通常用统计数来估计参数。统计数:由标本观察值计算得到的样本特征数为统计数,它因样本不同常有变动。它是估计值,根据样本不同而不同。
68. 试验因素:试验因素(experimental factor)指试验中能够改变,并能引起试
验指标发生变化,而且在试验中需要加以考察的各种条件,简称因素或因子(factor)。
69. 因素水平(factor level): 对试验因素所设定的量的不同级别或质的不同
状态称为因素的水平,简称水平。
70. 试验处理(experimental treatment): 事先设计好的实施在试验单位上的
具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平,故对单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合,所以,在多因素试验时,试验因素的一个水平组合就是一个处理。
71. 试验小区(experimental plot): 安排一个试验处理的小块地段称为试验小
区,简称小区。
72. 试验单位(experimental unit):亦称试验单元,是指施加试验处理的材料
单位。这个单位可以是一个小区,也可以是一穴、一株、一穗、一个器官等。 73. 试验单位(experimental unit):亦称试验单元,是指施加试验处理的材料
单位。这个单位可以是一个小区,也可以是一穴、一株、一穗、一个器官等。 74. 总体(population):根据试验研究目的确定的研究对象的全体称为总体(po
pulation),其中的一个研究单位称为个体(individual)。个体是统计研究中的最基本单位,根据研究目的,它可以是一株植物,一个稻穗,也可以是一种作物,一个作物品种等。
75. 有限总体(finite population)与无限总体(infinite population):包含无穷
多个个体的总体称为无限总体;包含有限个个体的总体称为有限总体。 76. 样本(sample):从总体中抽取的一部分供观察测定的个体组成的集合,称
为样本。
77. 样本容量(sample size):样本所包含的个体数目称为样本容量,常记为n。
通常将样本容量n >30的样本称为大样本,将样本容量n≤30的样本称为小样本。 78. 观测值(observation) 对样本中各个体的某种性状、特性加以考察,如称量、
度量、计数或分析化验所得的结果称为观测值。
79. 处理效应(treatment effect):是处理因素作用于受试对象的反应,是研究
结果的最终体现。
80. 区组:将整个试验环境分成若干个最为一致的小环境,称为区组。
81. 回归: 回归(regression)是指由一个(或多个)变量的变异来估测另一个变
量的变异。
82. 相关: 相关(correlation)是指两个变量间有一定的关联,一个性状的变化必
然会引起另一性状的变化。 83. 无效假设与备择假设
无效假设:无效假设或零假设(null hypothesis),意味着,所要比较的两个总体平均数之间没有差异,记为H0:。所谓“无效”意指处理效应与总体参数之间没有真实的差异,试验结果中的差异乃误差所致,即假设处理没有效应。
备择假设:备择假设(alternative hypothesis)是在无效假设被否定时,准备接受的假设,记为HA:或。 84. 样本标准误
:样本标准误
是平均数抽样误差的估计值。
85. 唯一差异原则:为保证试验结果的严格可比性,在试验中进行处理间比较时,
除了处理因素设置不同的水平外,其余因素或其他所有条件均应保持一致,以排除非试验因素对试验结果的干扰,才能使处理间的比较结果可靠。 86. 小概率原理:在统计学上,把小概率事件在一次试验中看成是实际上不可能
发生的事件称为小概率事件实际上不可能性原理,亦秒为小概率原理。 87. 简述田间试验设计的基本原则和作用?
88. 随机区组设计的主要优点:(1)设计简单,容易掌握;(2)灵活性大,单
因素、多因素以及综合性试验都可以采用;(3)符合试验设计的三原则,能提供无偏的误差估计,能有效地减少单向的土壤肥力差异对试验的影响,降低试验误差,提高试验的精确度;(4)对试验地的形状和大小要求不严,必要时不同区组可以分散设置在不同的田块或地段上;(5)易于分析,当因某种偶然事故而损失某一处理或区组时,可以除去该处理或区组进行分析。
89. 标准差定义、意义及计算公式
统计学上把方差或均方的平方根取正根的值称为标准差(标准偏差)(standard deviation)。
用平均数作为样本的代表,其代表性的强弱受样本中各观测值变异程度的影响。如果各观测值变异小,则平均数的代表性强;如果各观测值变异大,则平均数代表性弱。
标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,其离均差也大,因而标准差也大,反之则小。所以,样本标准差(S)是反映样本中各观测值x1,x2,…,xn变异程度大小的一个指标,它的大小说明了平均数对该样本代表性的强弱。标准差小,说明观测值变异小,变量的分布比较密集在平均数附近,则平均数的代表性强;反之,标准差大,说明观测值变异大,变量的分布比较离散,则平均数的代表性弱。 90. 简述拉丁方设计的特点和优缺点
91. 试验误差有哪几方面的来源?控制试验误差的途径有哪些? 92. 田间试验的基本要求有哪些?
93. [例] 6个毛豆品种患茎癌肿病的病株百分率(已经过反正弦转换的结果)
如下表,试对这一随机区组试验的结果进行方差分析。
原始资料经反正弦转换后的θ值(度) 区 组 品 Tt 种 Ⅰ Ⅱ Ⅲ Ⅳ A 26.1 32.7 5.7 14.7 79.2 19.800 B 18.5 36.1 22.0 13.7 90.3 22.575 C 30.1 37.2 28.9 21.1 117.3 29.325 D 22.0 33.3 15.6 17.4 88.3 22.075 10.5 36.8 6.0 8.1 61.4 15.350 10.1 18.1 5.7 5.7 39.6 9.900 117.3 194.2 83.9 80.7 T=476.1 (一)自由度和平方和的分解 本资料,处理数k=6, 区组数r=4,全试验观测值个数rk=24,全试验观测值总和T=476.1 ① 自由度的分解
总的 dfT=rk-1=23 区组 dfr=r-1=3 处理 dft=k-1=5
误差 dfe=dfT-dft-dfr=(r-1)(k-1)=15 ② 平方和的分解
9444.63375
总的 SST=80458 品种(处理)
885.62375 误差 SSe=SST -SSr-SSt=36
-C=2641.57625 区组 SSr==1392.
E F Tr 3.14792
(二) 列方差分析表和F测验 F测验
区组
品种(处理)列方差分析表
变 异 来 源 区 组 间 品 种 间 误 差 总 变 异
DF 3 5 15 23 SS 1392.80458 885.62375 363.14792 2641.57625 MS 464.26819 177.12475 24.20986 F F0.05 F0.01 19.18 3.29 5.42 7.32 2.90 4.56 F测验说明:区组间F=19.18>F0.01=5.42差异显著,说明4个区组的环境是有极显著差异的。因此,在这个试验中,区组作为局部控制的一项手段,对于减少误差相当有效率。品种间F=7.32>F0.01=4.56,说明6个供试品种的总体病株百分率是有显著差异的。
94. [例]玉米乳酸菌饮料工艺研究中,进行了加酸量A比较试验,采用了5
种加酸量(k=5):A1(0.3),A2(0.4),A3(0.5),A4(0.6),A5(0.
7)5次重复(r=5)(分别由5个操作人员分别完成,以操作人员为区组),随机区组设计。试验的感官评分结果见下表。试进行方差分析。
区组
加酸量 Tt
Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ
A1 77 74 63 70 74 358.0 71.60 A2 81 80 82 81 79 403.0 80.60 A3 91 94 93 96 90 464.0 92.80 A4 85 81 86 83 82 417.0 83.40 A5 81 75 64 74 79 373.0 74.60 Tr 415.0 404.0 388.0 404.0 404.0 T=2015.0 经计算得下列方差分析表:
方差分析表 变 异 来 自由度临界临界平方和SS 均方MS F P概率 源 DF F0.05 F0.01 区组间 4 74.40000 18.60000 1.14 0.3735 3.01 4.77 处理间 4 1368.40000 342.10000 20.96 0.0001 3.01 4.77 误 差 16 261.20000 16.32500 总变异 24 1704.00000 F测验说明:
多重比较: 平均数标准误 最小显著极差
秩次距P SSR0.05 SSR0.01 LSR0.05 LSR0.01 新复极差测验的最小显著极差 2 3 4 3.00 3.14 3.24 4.13 4.31 4.42 =
dfe=16
5 3.30 4.51 处理 A3 A4 A2 A5 A1 试验结果表明:
94.题答案:
F测验说明:因区组间F=1.14<F0.05=3.01,P=0.3735>不显著。因处理间F=20.96>F0.01=4.77,P=0.0001<显著。
多重比较: 平均数标准误 最小显著极差
=
dfe=16
新复极差测验的最小显著极差 多重比较结果(新复极差法,SSR法) 差 异 显 著 性 均值() 5% 1% 92.8 83.4 80.6 74.6 71.6 ,故区组间差异
,故处理间差异极
1.8069311
秩次距P SSR0.05 SSR0.01 LSR0.05 LSR0.01 2 3 4 5 3.00 3.14 3.24 3.30 4.13 4.31 4.42 4.51 5.4208 5.6738 5.8545 5.9629 7.4626 7.7879 7.9866 8.1493 多重比较结果(新复极差法,SSR法) 差 异 显 著 性 均值() 处理 5% 1% A3 92.8 a A A4 83.4 b B A2 80.6 b BC A5 74.6 c CD A1 71.6 c D 试验结果表明: 处理A3的均值最高,极显著高于A4、A2、A5、A1;处理A4极显著高于A5、A1;处理A2极显著高于A1,显著高于A5;处理A4、A2间差异不显著;处理A5、A1间差异不显著。
95. 一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进县测定1956~1
964年间,3月下旬至4月中旬,旬平均温度累积值(x,单位:旬·度)和一代三化螟蛾盛发期(y,以5月10 日为0)的关系于下表。
累积温和一代三化螟蛾盛发期的关系
x(累积温) 35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2 y(盛发期) 12 16 9 2 7 3 13 9 -1 经计算得:
a=48.5493; b=-1.0996; r=-0.837
(1) 计算相关系数和决定系数,对相关系数进行检验,并说明相关系数的意义。(r0.01, 7=0.798)
(2) 若相关显著,试建立回归方程,并说明其实际意义。在应用回归方程进行预测时,给出x取值的限定区间。
95.题答案:
(1) 计算相关系数和决定系数,对相关系数进行检验,并说明相关系数的意义。(r0.01, 7=0.798)
r=-0.837,r2=0.7008 因实得>r0.01, 7=0.798,则相关极显著。 计算结果r=-0.837,说明当3月下旬的积温与一代三化螟盛发期间存在极显著的相关关系,即在x变数的取值区间[31.7,44.2]范围内随着积温的增加盛发期提早到来。
(2) 若相关显著,试建立回归方程,并说明其实际意义。在应用回归方程进行预测时,给出x取值的限定区间。
由于积温与盛发期相关极显著,说明直线回归关系也极显著,故可建立直线回归方程。
=48.5493-1.0996
方程的实际意义:说明当3月下旬的积温每提高1旬·度时一代三化螟蛾盛发期将提早1.1天到来,此规律只适于x变数的实际区间[31.7,44.2];若欲在x<31.7或x>44.2外延,则必须要有新的试验依据。
96. [例] 6个毛豆品种患茎癌肿病的病株百分率(已经过反正弦转换的结果)
如下表,试对这一随机区组试验的结果进行方差分析。
原始资料经反正弦转换后的θ值(度) 区 组 品 Tt 种 Ⅰ Ⅱ Ⅲ Ⅳ A 26.1 32.7 5.7 14.7 79.2 19.800 B 18.5 36.1 22.0 13.7 90.3 22.575 C 30.1 37.2 28.9 21.1 117.3 29.325 D 22.0 33.3 15.6 17.4 88.3 22.075 E 10.5 36.8 6.0 8.1 61.4 15.350 F 10.1 18.1 5.7 5.7 39.6 9.900 Tr 117.3 194.2 83.9 80.7 T=476.1
经计算得以下结果:
列方差分析表 变 异 来 源 区 组 间 品 种 间 误 差 总 变 异 DF 3 5 15 23 SS 1392.80458 885.62375 363.14792 2641.57625 MS 464.26819 177.12475 24.20986 F F0.05 F0.01 19.18 3.29 5.42 7.32 2.90 4.56 F测验说明:
多重比较: 平均数标准误最小显著极差
=
P SSR0.05 SSR0.01 LSR0.05 LSR0.01 dfe=16
品种新复极差测验的最小显著极差 2 3 4 5 3.01 3.16 3.25 3.31 4.17 4.37 4.50 4.58 6 3.36 4.64 品种 C B D A E 品种病株率的新复极差测验 差 异 显 著 性 病株百分率 5% 1% 29.325 22.575 22.075 19.800 15.350 F 9.900
多重比较结果表明: 96.题答案:
经计算得以下结果: 变 异 来 源 区 组 间 品 种 间 误 差 总 变 异 列方差分析表
DF 3 5 15 23 SS 1392.80458 885.62375 363.14792 2641.57625 MS 464.26819 177.12475 24.20986 F F0.05 F0.01 19.18 3.29 5.42 7.32 2.90 4.56 F测验说明:区组间F=19.18>F0.01=5.42差异显著,说明4个区组的环境是有极显著差异的。因此,在这个试验中,区组作为局部控制的一项手段,对于减少误差相当有效率。品种间F=7.32>F0.01=4.56,说明6个供试品种的总体病株百分率是有显著差异的。
多重比较: 平均数标准误最小显著极差
dfe=16
品种新复极差测验的最小显著极差 2 3 4 5 6 3.01 3.16 3.25 3.31 3.36 4.17 4.37 4.50 4.58 4.64 7.405 7.774 7.996 8.143 8.266 10.259 10.751 11.071 11.268 11.415
P SSR0.05 SSR0.01 LSR0.05 LSR0.01 品种 C B D A E F
多重比较结果表明:品种C的病株率最高,极显著高于E、F,显著高于A;品种B、D极显著高于F;品种A显著高于F;品种C、B、D间差异不显著;品种B、D、A、E间差异显著;品种E、F间差异不显著。
97、袋中有10只乒乓球,编号分别为1,2,… ,10,现从中随机地一次取3只,求:
(1)最小号码为5的概率; (2)最大号码为5的概率。
解:设事件A={最小号码为5}事件B={最大号码为5},则
1 1 2 2
3 3 4 4 5 5 6 6 7 7
8 8
9 9 10 10
品种病株率的新复极差测验 差 异 显 著 性 病株百分率 5% 1% 29.325 a A 22.575 ab AB 22.075 ab AB 19.800 b ABC 15.350 bc BC 9.900 c C
98. 有6件产品,其中有2件是次品,现从中抽取两次,每次取1件,在有返置抽样和不返置抽两种情况下,分别计算(参阅概率论与数理统计学习指南,孙国红P14):
(1)取到的2件产品都是正品的概率;
(2)取到的2件产品都是正品或者都是次品的概率; (3)取到的2件产品中有次品的概率。
分析:从产品中取产品两次,每次取1件,检验产品的质量,故基本事件数的计算用乘法原理。
解 记事件A={2件产品都是正品};记事件B={2件产品都是次品};记事件C={2件产品中有次品,即2件产品中至少有一件是次品}。
返置抽样 第一次有6件产品供抽取,第二也有6件产品供抽取。由组合法的乘法原理,共有6×6种取法。即样本空间中元素总数为6×6,对于事件A而
言,由于第一次有4件正品可供抽取,第二次也有4件正品可供抽取,由乘法原理共有4×4种取法,即A中包含4×4个元素。同理,B中包含2×2个元素。于是
,
由于
,即事件A与事件B的交事件为不可能事件,得
不返置抽样
这一随机事件的样本空间的基本事件总数为
事件A的基本事件数为事件B的基本事件数为
,所以
,
99、已知随机变量~(100, 0.1),求的总体平均数和标准差。
解:此题为二项分布B(n,p)的随机变量x之平均数、标准差的计算。
的总体平均数
的标准差
16、已知随机变量~(10, 0.6,求(1)P(2≤≤6;(2)P(≥7;
(3) P(<3。
解: (1)(2)(3)
,
100. 某种植物在某地区种植,染病的概率为0.3,现在该区种植30株该种植物,试求以下概率:
(1)恰有6株染病概率;(2)前24株未染病的概率;(3)未染病株数超过8株的概率。
解:(1)恰有6株染病概率
(2) 独立事件:事件A的发生与事件B的发生毫无关系,反之,事件B的发生也与事件A的发生毫无关系,则称事件A和事件B为独立事件,例如,播种玉米时,一穴中播种两粒,第一粒发芽为事件A,第二粒发芽为事件B,第一粒是否发芽不影响第二粒的发芽,第二粒是否发芽也不影响第一粒发芽,则事件A和事件B相互独立。
如果事件A和事件B为独立事件,则事件A与事件B同时发生的概率等于事件A和事件B各自概率的乘积。即:
P(A·B)=P(A)·P(B)
因第1株未染病的概率0.7;第2株未染病的概率0.7;第3株未染病的概率0.7;……第23株未染病的概率0.7;第24株未染病的概率0.7,且这些事件(24个事件)互为独立事件,故这些事件同时发生的概率为各自概率的乘积,即前24株未染病的概率=0.7×0.7×0.7×…×0.7×0.7=0.724=1.9158×10-4 (3)未染病株数超过8株的概率
101、假设每个人的血清中含有肝炎病毒的概率为0.4% ,混和100个人的血清,求此血清中含有肝炎病毒的概率。
解:100个人血清含有肝炎病毒的可能有101种情况,而混和100个人的血清不含肝炎病毒的概率为 则,混和100个人的血清,此血清中含有肝炎病毒的概率为
21、设~N(10,值的概率。
解:
),P(≥12=0.1056,试求在区间[6,16)内取
故
查附表1,得ui=1.25 即故
102. 某品种玉米在某地区种植的平均产量为350㎏/666.7㎡,标准差为70㎏/666.7㎡,问产量超过400㎏/666.7㎡的占百分之几?
,
,总体标准差
解:
x~N(350,702)
103、设~N(100,
),
是样本平均数和标准差,求
补充练习题一 已知随机变量~N(0,1)求: (1) P(u≤-1.45),(2) P (u≥1.45),(3) P (-1.20<u<0.5),(4) P(u≥2.58);并计算P(u≥u)和P(u≥u)=0.025的u值。;并作图表示。
解:
(1) P(u≤-1.45)=0.0735 查附表1
(2) P (u≥1.45)=1-P (u<1.45)=1-0.9265=0.0735 查附表1
(3) P (-1.20<u<0.5)=P(u<0.5)-P(u<-1.2)=0.6915-0.1151=0.5764 查附表1
(4) P(u≥2.58)=1-P(u<2.58 ) 查附表1
=1-0.9951
=0.0049
≈0.005 (5) ∵P(u≥u)=0.05
P(u<u)=1-0.05
=0.95
查附表1,u=1.64
(6) ∵P(u≥u)=0.025
∴P(u<u)=1-0.025 查附表1,u=1.96
补充练习题二 以知变量x 服从 N(12, 1.5),求: 解 :(1)
=
=3
P(10.5<x≤16.5)=P(-1<u≤3=P(u<3)-P(u≤-1) =0.9987-0.1587=0.84
(2)① P(x<L1)=0.025
P(u<u1)=0.025, 查附表1,u1=-1.96 u=
—1.96=
L1=12-1.96×1.5=9.06
② P(x>L2)=0.025 P(u>u2)=0.025 P(u≤u2)=1-0.025 =0.975 查附表1,u2=1.96 u=
1.96=
L2=12+1.96×1.5=14.94 查附表1
104. 规定某种果汁中的VC含量不得低于20g/L。现对某批产品随机抽取10个样品进行检测,得VC含量平均数19g/L,样本标准差3.69 g/L,问这批产品合格吗?(提示:采用一尾t检验, 解:采用一尾t检验 ① 提出假设
:=
,
:<
总体N(抽样 ,σ2) n=10 =19 :=,:<)
② 检验计算
样本平均数的标准误
df=n-1=10-1=9
(一尾)=(两尾)=1.833 ↑ 查附表2
=0.857<t0.05(一尾)=1.833,故P实得
>0.05
③ 统计推断 接受即不能认为
:
≤28,
大于28
105. 在前茬作物喷洒过含有机砷杀虫剂的麦田中随机采取14株植株测定砷的残留量,得7.6mg,2.17;又在前茬作物从未喷洒过含有机砷杀虫剂的麦田中随机采取13株植株测定砷的残留量,得5.3mg, 2.26。问在前茬作物喷洒过含有机砷杀虫剂后,是否会使后作植物体内的砷残留量显著提高?(提示:采用一尾t检验,)
解:提示:采用一尾t检验。用表示在前茬作物喷洒过含有机砷杀虫剂后的作植物体内的砷残留量样本所在的总体,
表示表示在前茬作物未喷洒过
含有机砷杀虫剂后的作植物体内的砷残留量样本所在的总体。
(1)提出假设
:=,即在前茬作物喷洒过含有机砷杀虫剂后与在前茬作物从未喷洒过含有机砷杀虫剂作植物体内的砷残留量相等。
:>,即在前茬作物喷洒过含有机砷杀虫剂后作植物体内的砷残留量高于在前茬作物从未喷洒过含有机砷杀虫剂作植物体内的砷残留量。
(2)计算t值
计算亲本的合并均方
计算样本均数差数标准误
计算t值
(3)统计推断
根据(两尾)=1.708,因计算得的:
=
,接受备择假设
:
>
,查附表3得:(一尾)=
,故p<0.05,否定无效假设
,即在前茬作物喷洒过含有机砷杀虫
剂后作植物体内的砷残留量高于在前茬作物从未喷洒过含有机砷杀虫剂作植物体内的砷残留量。
106. 某地区历年平均血吸虫发病率为1%,采取某种预防措施后,当年普查了1000人,发现8名患者,是否可认为预防措施有效?(提示:,)
解:提示:采用一尾检验 (1)提出假设
:=,即预防措施后与预防措施前血吸虫发病率相等,亦即采取
预防措施后没有什么效果。
:<,即预防措施后比预防措施前血吸虫发病率减少,即采取预防措施后有一定的效果。 (2)计算u值
由于
小于30,必须对u值进行连续性矫正。
(3)统计推断
计算所得的
,故p>0.05,接受:=,即预防
措施后与预防措施前血吸虫发病率无差异,亦即采取预防措施后没有明显效果。
107、 随机抽测5年生的杂交杨树50株,得平均树高9.36 m,样本标准差1.36 m。以95%的置信度计算这批杨树高度的置信区间
解:样本平均数的标准误
查附表3,当df=50-1=49,得,故95%置信区间为
说明置信度为95%时,这批杨树高度在8.97~9.74之间,即有95%的把握认为这批杨树高度在8.97~9.74之间。
108、 试验1000粒大豆种子,有620粒发芽,求发芽率在95%置信度下的置信区间。
解:
样本百分率的标准误 查附表2,得
,故95%置信区间为
说明置信度为95%时,这大豆种子发芽率在59%~65%之间,即有95%的把握认为这大豆种子发芽率在59%~65%之间。
109. 现有一小麦品种比较试验,供试品种(包括对照)6个,采用随机区组设计,重复4次,小区面积为20m2,各品种及小区产量整理如下(单位:kg)试作方差分析。并用小区产量进行比较。 (1) 试验数据的整理
小麦品种产量比较试验结果(kg) 各 重 复 小 区 产 量 品 种 Tt Ⅰ Ⅱ Ⅲ Ⅳ A 13.8 14.3 13.9 13.3 55.3 13.825 B C D(CK) E F 14.9 15.1 13.9 14.2 12.2 84.1 14.9 15.6 14.3 14.4 13.6 87.1 14.6 14.9 14.1 14.3 13.0 84.8 14.1 14.9 13.3 14.4 13.3 83.3 58.5 60.5 55.6 57.3 52.1 14.625 15.125 13.90 14.325 13.025 =14.1375
(2) 自由度和平方和的分解
本资料,处理数k=6,区组数n=4 ① 自由度的分解
总的 dfT=nk-1=24-1=23 区组 dfr=n-1=4-1=3 处理 dft=k-1=6-1=5
误差 dfe=dfT-dft-dfr=(n-1)(k-1)=(4-1)(6-1)=15
Tr T=339.3
② 平方和的分解
总的 SST=区组 SSr=品种(处理)
-C=13.49625
=1.3379166
误差 SSe=SST -SSr-SSt=1.5995833
(3) 列方差分析表和F测验 F测验
区组
品种(处理)
列方差分析表 变 异 来 源 区 组 间 品 种 间 误 差 总 变 异 DF 3 5 15 23 SS 1.3379167 10.55875 1.5995833 13.49625 MS 0.44597 2.1175 0.1066389 F 4.18* F0.05 F0.01 3.29 5.42 19.80** 2.90 4.56 F测验说明:区组间F=4.18>F0.05=3.29差异显著,说明4个区组的土
壤肥力是有显著差别的。因此,在这个试验中,区组作为局部控制的一项手段,对于减少误差相当有效率。品种间F=19.80>F0.01=4.56,说明6个供试品种的总体平均数是有显著差异的。
(4) 多重比较
SE==
小麦品种新复极差测验的最小显著极差 P 2 3 4 5 SSR0.05 3.01 3.16 3.25 3.31 SSR0.01 4.17 4.37 4.50 4.58 LSR0.05 0.491 0.516 0.531 0.540 LSR0.01 0.681 0.714 0.735 0.748 各小麦品种产量的新复极差测验 差 异 显 著 性 品种 小区平均产量 5% C 15.125 a B 14.625 b E 14.325 bc D(CK) 13.90 c A 13.825 c F 13.025 d 6 3.36 4.64 0.549 0.758 1% A AB BC C C D 试验结果表明:C品种产量最高,极显著高于E、D、A、F品种,显著高于B品种;B品种极显著高于D、A、F;E、D、A品种极显著高于F品种;B、E品种间差异不显著;品种E、D、A间差异不显著。
第七章 直线回归与相关
5、 研究某种有机氯农药的用量(,kg/666.7㎡)和施用于小麦后在籽粒中的残留量(,10-1mg/kg)的关系,结果列于下表,试作直线回归分析。
(kg/666.7㎡) 0.5
0.7
(10-1mg/kg)
1.0 1.1
1.5 1.4
2.0 1.8
2.5 2.0
解:
(1) 计算相关系数和决定系数,并对相关系数进行假设测验。(r0.01, 7=0.798) r=0.995,r2=0.990 df=n-2=5-2=3 因实得
>r0.01, 3=0.878,则相关极显著。
(2) 若相关显著,试建立回归方程,并说明其实际意义。 =0.41+0.66
说明:从=0.41+0.66回归方程式可知,某种有机氯农药的用量增加1个单位,则小麦后在籽粒中的残留量增加0.66个单位,即随着某种有机氯农药的用量(,kg/666.7㎡)增加,小麦后在籽粒中的残留量(,10-1mg/kg)随之增加。故在生产实践中应尽量减少农药残留量高的农药的使用。