数图可能会出现哪些情况。
解:应该分别做正态性检验。因为两组可能来自不同的正态分布,例如:两组 来自正态分布,但第一组资料所在的总体,其总体均数100,第二组资料所 在总体,其总体均数为120,在样本量较大的情况下,频数图可以分析,第 一组的频数图的峰在100 左右,第二组的频数图的峰在120 左右,两组资料 合并作频数图往往会出现两个峰:一个峰在100 左右,另一个峰在120 左右, 对于双峰的分布的资料一般会认为非正态分布,对这样两组合并,频数图呈 双峰的资料做正态性检验,其结果往往是非正态分布的结果,所以要分组分 别作正态分布。
6. 如果1 2 3 4 5 6 7 X , X , X , X , X , X , X 相互独立并且服从总体均数为 3 的 Poisson 分
布,问:能否认为样本均数X 近似服从正态分布?为什么?
解:因为X1, X2 , X3 , X4 , X5 , X6 , X7相互独立并且服从总体均数为 3 的 Poisson 分布,由 Poisson 分布的可加性可知:Y = X1 + X2 +",+ X7服从总体均数为 21 的Poisson 分布,对于总体均数>20 的Poisson 分布已经可以较好地近似 正态分布,既然Y 已经可以很好地近似正态分布,而除以一个非0 常数或乘 以一个非 0常数,其正态性不会改变,所以X = Y / 7同样很好地近似正态分 布。
第八章 一、是非题
1. 方差分析是双侧检验
答:是否为双侧检验是考察被选假设1 H :各个均数不等,所以方差分析是双侧检验。 2. 在样本量较大时,方差分析对资料的正态性要求可以忽略
答:对,当样本量大时,其样本均数近似正态分布,所以可以忽略资料对正态性的要求。 3. 在样本量较大时,方差分析对资料的方差齐性要求可以忽略 答:错。方差齐性与样本量大小没有直接。
4. 对于完全随机设计,总样本量不变的情况下,如果各组的样本量相同,则检验效能相对 较高
答:对。可以证明:在总样本量相同的情况下,当各组样本量相同时,检验效能最大。 5. 如果各组的样本标准差相差不超过0.1,则可以认为各组之间的方差是齐性的。
答:错。例如3 组样本标准差分别为0.1,0.01,0.05,每组样本量均为20,作方差齐性检验, 可以验证方差齐性的差异有统计学意义,所以需做方差齐性检验。 二、选择题
1. 完全随机设计资料的方差分析中,必然有( C )。 A. 组间SS > 组内SS B. 总 组间 组内 MS = MS + MS C. 总
ss =
组间
SS + 组内SS
D. 组间 组内 MS > MS
2. 多个样本定量资料比较,当不满足独立、正态、方差齐性等条件情况下应选择( D )。 A. 方差分析 B. t 检验 C. Z 检验 D. Kruskal-Wallis 检验
3.当组数等于2 时,对于同一资料的双侧检验,方差分析结果与t 检验结果( D )。 A.完全等价且F= t B.方差分析结果更准确 C.t 检验结果更准确 D.完全等价且t= F 4.方差分析结果,
0.05( 1 , 2 )
F F ν ν > ,则统计推论结论是( A )。
A. 各总体均数不全相等 B. 各总体均数都不相等 C. 各样本均数都不相等
D. 各样本均数间差别都有显著性
5.单因素方差分析中的组内均方是( A )的统计量。 A.表示平均的随机误差度量
B.表示某处理因素的效应作用度量
C.表示某处理因素的效应和随机误差两者综合影响的结果 D.表示N 个数据的离散程度
6. g 个组方差齐性检验拒绝0 H ,可认为( A )。 A. 2
1
? 、2 ? 、?、2 ? 不全相等
2
g
B.μ 1 、μ 2 、?、g
μ 不全相等
C.S1 、S2 、?、Sg 不全相等 D. X 1、X 2、?、X g 不全相等 三、简答和分析题
1.方差分析的基本思想和应用条件是什么?
答:方差分析的基本思想均是变异分解,通过比较各种成分的变异程度的大小,来确定各个 样本对应的总体均数是否相同。方差分析要求各组资料相互独立,方差齐性和每组资料服从 正态分布(样本较大时可忽略正态性要求)。 2.Kruskal-Wallis 检验的基本思想是什么?
答:Kruskal-Wallis 检验是一种类似于Wilcoxon 秩和检验的方法,可看作Wilcoxon 秩和检 验的拓广,用来检验多个样本所来自的总体分布是否相同。
Kruskal-Wallis 检验的基本思想是:先将各处理组数据混合在一起按小到大顺序进行编秩, 如果有相同数据则取平均秩次,记观测值ij Y 的秩为Rij ,对每一个处理组观测值的秩求和得 到
1 ni i ij j
R R
=
=Σ ,其中i =1,",,g是每一处理组的编号, 1, , i j = ", n 是每一处理组内部个体
值的编号。由Ri = Ri ni 计算每一处理组的平均秩次,如果无效假设( 0 H : g 个总体分布相
同)为真,各组资料来自同一总体,则秩应该在g 个处理组样本之间均匀分布,每个样本实 际的平均秩i R 与所有资料的平均秩R = (N +1) / 2的偏差应该很小或较小;如果被择假设 ( 1 H : g 个总体分布不全相同)为真,这些Ri之间的差异可能较大或很大,相应的( )2 i R ?
R
可能较大或很大。
3.为什么在拒绝H0、接受H1 之后,对多个样本均数的两两比较要用多重比较的方法? 答:因为比较g 个总体均数的方差分析的无效假设与备择假设分别为:
0
H :所有总体均数相等( 1 2 g μ = μ =",= μ ) : H 并非所有的总体均数 i μ 相等
1
只要有任意两个总体均数之间不相等,即1 H 成立。
4. 实验分为4 个组,每组例数分别为n1=5, n2=8, n3=4 及n4=8。已计算出F 统计量, F=4.77,如何评价这项实验结果?
答:F0.05(3,21)=3.07,F=4.77>3.07,P<0.05。
结论:按α = 0.05水准,拒绝 H0,接受 H1,即认为四个实验组总体均数不等或不全相等。 5. 24 名甲状腺功能低下的婴儿,按病情严重程度把他们分为3 个水平:轻度组9 名,
中度组8 名,重度组7 名。表8-14 列出了他们的血清甲状腺素含量(n mol/l)。试分析不同严 重程度的婴儿血清甲状腺素水平是否差异有统计学意义。分别用LSD 法和Bonferroni 法作 多重比较,对结果作出统计学和专业领域内的解释。
表8-14 24 名甲状腺功能低下的婴儿血清甲状腺素含量(n mol/l) 病情分类 例数 甲状腺素含量 轻度 9 34 45 49 55 58 59 60 72 86 中度 8 8 25 36 40 42 53 65 74 重度 7 5 8 18 32 45 47 65
答:对3 组资料分别作正态性检验,P 值分别为0.86,0.98 和0.66,方差齐性检验的P 值为 0.558,所以可以按方差齐性和正态分布资料进行单因素方差分析。 (1)建立检验假设:
H0:三个总体均数相等,即三个不同病情组的婴儿血清甲状腺素含量相等
H1:三个总体均数不全相等,即三个不同病情组的婴儿血清甲状腺素含量不全相等
α =0.05
(2)计算统计量:F=3.62,F0.05(2,21)=3.47,P<0.05。
(3)结论:拒绝H0,接受H1,可认为三个总体均数不全相等,即三个不同病情组的婴儿 血清甲状腺素含量不全相等。 (4)
两个样本均数之差 LSD P 值 Bonferroni P 值 mean1-mean2 14.680556 0.135482 0.406 mean1-mean3 26.126984 0.014519 0.044 mean2-mean3 11.446429 0.268553 0.806
经LSD 和Bonferroni 法作多重比较结果均提示:病情轻度组与重度组的总体均数差异有 统计学意义,说明病情轻度组与重度组的婴儿血清甲状腺素含量不相等。
6. 某地用四种药物杀灭钉螺,每次用200 只活钉螺,用药后清点每批钉螺的死亡率(%)
见表8-15,请分析这四种药物的效果有无差异。 表8-15 四种药物杀灭钉螺试验结果 试验组 试验次数 钉螺死亡率(%) 甲 6 46.5 39.5 40.5 32.5 49.5 30.0 乙 6 36.0 29.0 20.5 22.5 16.5 26.0 丙 4 24.0 8.5 9.2 6.5
丁 7 4.5 6.5 2.5 4.5 18.2 50.0 43.1
答:本题资料为百分率,不符合正态条件,现用Kruskal-Wallis 检验。 (1)建立检验假设:
H0:四种药物致钉螺死亡率的总体分布相同 H1:四种药物致钉螺死亡率的总体分布不全相同
α =0.05
(2)编秩,求秩和,计算检验统计量:
Kruskal-Wallis Test x2 =8.8188,ν = 2,P=0.0318。 (3)结论:
按α =0.05 拒绝H0,接受H1,认为四种药物致钉螺死亡率的总体分布不全相同,即四种药 物的效果有差异。 第九章 一、是非题
1. 成组设计的资料作配对 t 检验,不但合理,而且平均起来可以提高统计效率。
答:错。成组设计的资料不含有配对信息,所以无法作配对t 检验,即使勉强配对,也将时 期配对后随机分组,所以不可行。
2. 满足参数检验的配伍区组设计资料,如果采用非参数检验,会增大第Ⅰ类错误。 答:错,会增大第2 类错误。
3. 随机区组设计的方差分析通常需要从背景上排除了研究因素与区组因素的交互作用。 答:对。
4. 设配对设计资料的一对变量为(X1,X2),则相应配对符号秩检验的编秩方法是把X1、X2 的差数d = X1 ? X2从小到大进行编秩。
答:不对,按d 的绝对值从小到大进行编秩,然后按照d 的正负号赋予秩。
5. 对于配伍区组设计资料,只有在总的检验结论有统计学意义之后,才用两两比较的方法 来进一步确定哪二组之间有差别。 答:对。主要控制第一类错误。
6. 为分析某市2005 年不同区域大气中的氮化物含量,某研究者选取了8 个采样点,对每个 采样点的4 个不同时点进行监测与资料收集,则该资料属于配伍区组设计资料。
答:错,同一城市不同采样点之间的氮化物含量是不独立的,同样同一采样点的4 个不同时 点的氮化物含量也是不独立的,所以该资料不属于配伍区组设计资料。 二、选择题
1. 对于配对 t 检验,下列说法错误的是( B )
A. 对于配对设计的资料应作配对t 检验,如果作成组t 检验是无法控制犯第一类错误的概 率,所以配对设计资料作成组t 检验是错的。
B. 成组设计的资料作配对t 检验,不但合理,而且平均起来可以提高统计效率