生认为第4题是正确的。(见Statistical Science, 2005, 20(3):223-230.)
案例辨析 6个选择均不正确。 (1)可能犯Ⅰ类错误。
(2)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率。 (3)可能犯Ⅰ类错误。
(4)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率,而不是推论备择假设为真的概率是99%。
(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是P。
(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;1-?=99%是指无效假设成立的条件下不犯错误的概率是99%。
正确做法 “拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为
P。
案例5-2 某工厂生产的某医疗器械的合格率多年来一直是80.0%。最近从该厂一次抽取20个该器械检测,合格13个,计算得到合格率为65.0%;一周后又抽取15个器械检测,合格10个,计算得到合格率为66.7%,分别进行Z检验,得到两总体率相等的结论,表明合格率没下降,两个合格率的平均值为65.85%,进行Z检验,得到两总体率不等的结论,表明合格率下降了。请对这一结论发表你的意见。
案例辨析 不正确,因为分别用n=20和n=15的两个小样本计算的样本频率与总体概率80.0%比较,进行两次Z检验,样本量太小,检验功效太小,不能得到总体概率不等的结论。
正确做法 加大样本量,对样本频率所代表的总体概率与已知总体概率80.0%进行假设检验,具体方法从略。(样本量的估计见本书第15章样本含量估计)
第6章 两样本定量资料的比较
案例辨析及参考答案
案例6-1 为研究直肠癌患者手术前后血清CEA含量有无差异,作者收集了以下资料: 术 前(24例):31.5 30.0 28.6 39.7 45.2 20.3 37.3 24.0 36.2 20.5 23.1 29.0
33.1 35.2 28.9 26.4 25.9 23.8 30.4 31.6 27.9 33.0 34.0 32.7
术 后(12例): 2.0 3.2 2.3 3.1 1.9 2.2 1.5 1.8 3.2 3.0 2.8 2.1
(1)有人采用了两独立样本的t检验,结果t=15.92,?=34,P<0.05。从而得出结论:手术前后血清CEA含量有差异,术前CEA含量高于术后。
(2)也有人觉得上述分析方法不对,应该采用两独立样本的秩和检验,结果为:
Z??4.83,P<0.05。
(3)还有人认为应该采用校正t检验,结果:t?=22.51,P<0.05。
(4)有人将上述三种方法作一比较,认为既然三者结论是一致的,所以采用哪种分析方法都无所谓。对此你有何看法?
案例辨析
(1)属于盲目套用两独立样本的t检验,因为未检查定量资料是否满足参数检验的前提条件。
(2)若定量资料满足参数检验的前提条件,直接用秩和检验会降低检验功效。 (3)若定量资料不满足正态性要求,直接用校正的t检验也是不妥当的。
(4)应当采用哪种统计分析方法不应仅看结论是否一致,而应根据分析目的、设计类型、资料是否满足参数检验的前提条件等方面综合考虑,事先选定统计分析方法,不能等到计算结果出来了,再确定统计分析方法。
正确做法 此案例涉及完全随机设计两小样本资料的假设检验,统计方法的选择一定要结合数据特征。通过对两组数据进行正态性检验,发现两样本均来自正态总体,但方差齐性检验结果表明,两总体方差不齐,所以最好的办法就是t?检验,此种情况一般不主张采用秩和检验,因为检验功效会大大降低。
案例6-2 为研究不同药物对肥胖患者的疗效,将BMI≥28的肥胖患者随机分成两组,每组10人,测得他们服药前及服药2个月后体重的变化(教材表6-10)。试评价:①A、B两种药物对肥胖患者是否有效。②A、B两种药物的疗效有无差别。
教材表6-10 两组肥胖患者服药前后体重变化/kg
药 物 A
服药前 服药后
1 75.6 73.0
2 61.2 60.2
3 67.8 63.6
4 77.2 72.0
5 73.2 74.6
6 65.4 60.8
7 80.0 69.4
8 74.4 77.4
9 82.6 79.6
10 68.6 63.4
B
服药前 服药后
69.4 60.8
89.9 95.5
66.8 61.6
63.4 62.0
70.0 69.4
86.6 78.0
90.4 71.0
74.8 76.6
67.4 58.2
84.4 75.4
(1)假设数据服从正态分布,且总体方差齐,在评价A、B两种药物对肥胖患者是否有效时,作者对A、B两组患者分别采用了独立样本的 t 检验,结果:A 组患者服药前后比较 t =1.040,P=0.312; B组患者服药前后比较 t =1.125,P=0.275。从而得出结论,两种药物均无效。(2)有人认为这种方法不太好,他采用独立样本的t检验,首先比较服药前两组基线水平,结果 t =1.533,P=0.160,表明差异没有统计学意义,两组有可比性。进而,比较治疗后两组体重的差异,结果 t =0.346,P=0.734,从而得出结论:A、B两种药物的疗效差异无统计学意义。
请对以上两种作法发表你的看法。 案例辨析
(1)误用独立样本的t检验取代配对设计定量资料的t检验。
(2)本案例中采用独立样本的t检验单纯比较两组治疗后体重有无差异去推断两种药物的疗效差别是不正确的。因为两组肥胖患者治疗前体重可能不同,缺乏组间可比性。因为未充分发挥两组患者服药前的信息,使结论的可信度降低。
正确做法
(1)欲评价A、B两种药物对肥胖患者是否有效,应分别对A、B两组患者服药前后体重进行配对t检验,求得t值后与界值t(0.05,9)进行比较,从而得出药物治疗前后体重变化有无差异的推断。另外,即使在进行配对t检验时获得了一个较小的P值,拒绝了H0,下结论也一定要慎重。差异有统计学意义并不能说明药物就有效,药物是否有效以及疗效的好坏一方面要结合专业知识方可得出结论,另一方面服药前后肥胖患者的饮食习惯、运动情况等因素对体重都会有影响。因此,对同一个体处理前后某项指标进行比较,一定要保证非处理因素在处理前后保持不变,否则难以得出正确的结论。
(2)欲评价A、B两种药物的疗效有无差别,应分别计算出各组治疗前后体重的差值,然后作完全随机设计两样本比较的t检验,因为A、B两组样本是从同一总体中随机抽取的,肥胖病没有传染性,两组受试者间是相互独立的,由题中条件可知,定量资料满足正态性和方差齐性的前提条件。
总之,如果要分别评价A、B两种药物是否有效,可以首先按照自身对照设计资料,考虑采用配对t检验并结合专业与实际进行推断。另外,可以同时设定一个平行对照帮助推断。
如果欲评价A、B两种药物的疗效有无差别,可以采用以下两种方法之一:①分别计算出各组治疗前后体重的差值,然后作完全随机设计两样本比较的t检验;②以治疗前两组体重数据作为协变量的值,采用多重回归扣除治疗前体重的影响(参见本书第11章)。
案例6-3 为研究长跑运动对增强普通高校学生的心功能的效果,某学校随机抽取15名男生,进行5个月的长跑锻炼,5个月前后测得的晨脉数据如教材表6-11所示,问长跑锻炼前后的平均晨脉次数有无不同?
教材表6-11 某校15名学生5个月长跑锻炼前后的晨脉次数/(次·min1)
-
学生号 锻炼前锻炼后
1 70 48
2 76 54
3 56 60
4 63 64
5 63 48
6 56 55
7 58 54
8 60 45
9 67 50
10 65 48
11 75 56
12 66 48
13 56 62
14 59 49
15 72 50
作者认为该研究属于配对设计的定量资料,通过对差值进行正态性检验,发现差值不是来自正态总体( W 检验:P=0.041),所以用配对资料的符号秩和检验,结果为 T=10,查 T界值表,得双侧P<0.05。因此认为长跑后的平均晨脉次数低于长跑前的平均晨脉次数。
你认为上述分析是否合适?请说明理由。
案例辨析 “同一受试对象处理前后的比较”严格地说不是合格的配对设计,因为处理前的个体接受的是空白处理,而处理后的同一个体接受的是“处理(长跑)+时间(5个月)”,因此,即便长跑前后的晨脉次数有差别,也不能就判断是长跑的作用,因为有5个月的时间效应混杂在其中。
正确做法 处理此类问题的最好办法是加一个平行对照,使“时间效应”在两组比较时互相抵消,从而可以更真实地揭示“长跑与否”产生的效应之间的差别有无统计学意义。
第7章 多组定量资料的比较
案例辨析及参考答案
案例7-1 某医院妇产科测定几种卵巢功能异常患者血清中促黄体素的含量(U/L),结果如下:
卵巢发育不良 42.50 38.31 35.76 33.60 31.38
丘脑性闭经 6.71 3.32 4.59 1.67 10.51 2.96 11.82 3.86?8.26 2.63 2.20 垂体性闭经 4.50 2.75 11.14 5.98 1.90 5.43 11.05 22.03
研究者运用t检验进行两两比较,共比较了3次。结论是卵巢发育不良者血清中促黄体