28.00Textboxy0y127.0026.00Mean25.0024.0023.001.002.003.00time 案例图17-1 轮廓图 轮廓图表明,两组在基线的平均水平几乎没有差异,A组的BMI在开始时的平均下降幅度明显大于B组,但在第二个疗程中,A组几乎没有变化,而在第二个疗程结束时B组的BMI平均累积下降幅度明显大于A组。
案例17-2 为了研究某个化疗辅助药(简称辅助药)提升白细胞计数的疗效,采用2周治疗为一个疗程后停药1周作为一个治疗周期,共治疗两个周期。收集200名术后肿瘤患者,随机分成两组,第一组在第一治疗周期采用化疗药+辅助药,在第二治疗周期仅用化疗药,第二组在第一治疗周期仅用化疗药,在第二治疗周期采用化疗药+辅助药,两组在两个治疗周期所用的化疗药均是相同的,并且剂量相同。以血常规中的白细胞计数作为该辅助药的疗效评价指标,并且分别在治疗前、第一个治疗周期结束时和第二个治疗周期结束时化验受试者的白细胞计数,试分析该辅助药提升白细胞的疗效。
本例的数据文件名为example17-4.sav,数据格式为5列400行,变量seq、y、period、id和drug分别对应顺序变量(顺序1为1,顺序2为2)、两组两个治疗周期的白细胞计数、周期变量(第一周期为1,第二周期为2)、受试者编号和药物变量(用试验药为1,不用试验药为0)。
研究者对白细胞计数资料进行对数变换,然后分别对第一治疗周期和第二治疗周期白细
胞计数的对数资料用成组设计定量资料t检验,比较用试验药和不用试验药的平均水平差异,结果见教材表17-16。
教材表17-16 白细胞计数取对数后的统计描述Xln(Geometric mean)?S 组别 用试验药 未用试验药
第一治疗周期 8.415 4(4 516)?0.181 8 8.375 6(4 340)?0.181 4
第二治疗周期
8.340 3(4 189)?0.180 4 8.301 9(4 032)?0.194 0
t =1.547 0, P =0.123 5 t =1.446 9, P =0.149 5
基于所述统计结果,推断认为没有足够的证据可以推断该药物可以提升白细胞计数,即基于上述研究背景,能否认为该研究者用成组t检验进行统计分析是错误的?能否认为该研究者用成组t检验进行统计分析是合适的或最佳的?如果不合适或不是最佳的,则又该如何进行统计分析?
案例辨析 简单地用成组t检验进行统计分析是不够妥当的,破坏了原先的整体设计,未能合理地解释其他因素对观测结果的影响,其结论的可信度大打折扣。
正确做法 应选用与实验设计类型对应的统计分析方法处理,即选用交叉设计定量资料方差分析处理该资料,其方差分析结果如案例表17-1、案例表17-2所示。
案例表17-1 白细胞计数资料取对数后作交叉设计资料方差分析的结果 方差来源 处理效应
顺序效应 阶段效应 个体间变异
误差
合计
案例表17-2 白细胞计数取对数后的统计描述Xln(Geometric mean)?S 组别 用试验药 未用试验药
由案例表17-2的结果可知,用此试验药相对于不用此试验药疗效有提高,在第一阶段的疗效表现得更明显一些。
第一治疗阶段
8.415 4(4 516)?0.181 8 8.375 6(4 340)?0.181 4
第二治疗阶段
8.340 3(4 189)?0.180 4 8.301 9(4 032)?0.194 0
SS
df
MS
F
P 0.040 0.969 <0.001
0.152 1 0.000 048 5 1
0.553 1 6.452 198 7.025 198 14.183 499 399
0.152 4.293 0.000 048 5 0.001
0.553 15.600 0.033 0.035 0.035 547 617
第18章 Logistic回归 案例辨析及参考答案
案例18-1 一项前瞻性队列研究中,欲研究某疾病与甲、乙两因素的关系,数据见教材表18-13。
教材表18-13 某前瞻性队列研究中疾病与甲、乙两因素的关系 乙 因 素 (
X2甲 因 素 (
X1发 病 (Y=1) 150 250 400 200
未发病 (Y=0) 250 150 150 450
合计
) )
暴露(X1=1)
暴露(X2=1)
未暴露(X1=0) 暴露(X1=1)
未暴露(X2=0)
未暴露(X1=0)
400 400 550 650
疾病发病与否是因变量Y(发病赋值1,未发病赋值0),甲、乙两个因素为两个自变量X1和X2,采用logistic回归研究疾病与甲、乙两个因素的关系。
(1) 单变量模型 分析结果提示:疾病与甲因素有联系(回归系数Wald检验?=44.766,P<0.001);疾病与乙因素没有联系(回归系数Wald检验?=0.000,P=1.000)。
(2)主效应模型 将甲、乙两个因素同时纳入模型,拟合结果见教材表18-14。提示疾病与甲因素有联系,与乙因素的联系仍然没有统计学意义。与单变量拟合结果比较,纳入乙因素后,甲因素的优势比只有微小改变。研究者据此得出结论:疾病与甲因素有联系,疾病与乙因素没有联系,乙因素也不是混杂因素。
教材表18-14 按照模型logit???0??1X1??2X2拟合结果
变 量 X2 Constant
X122b 0.607 -0.026 -0.278
SE 0.091 0.092 0.072
Wald 44.838 0.077 15.076
df 1 1 1
P
<0.001 0.781 <0.001
exp(b) 1.835 0.975 0.757
(3)有交互效应的模型 根据专业知识判断,甲、乙两因素间可能存在交互效应,选用有交互效应的全模型,拟合结果见教材表18-15。结果提示:疾病与甲因素有联系,疾病与乙因素也有联系,甲、乙两因素间还有交互效应。甲、乙因素及其交互项的标准化回归系??=0.177,b3?=0.229,b2数分别为b1=0.546,因此,交互效应对疾病发生与否的影响程度
最强。
教材表18-15 按照模型logit???0??1X1??2X2??3X1*X拟合结果 变 量
b 1.792 1.322 -2.813 -0.811
SE 0.128 0.134 0.194 0.085
Wald 195.889 97.661 209.831 91.053
df 1 1 1 1
P
<0.001 <0.001 <0.001 <0.001
exp(b) 6.000 3.750 0.060 0.444
X1 X2 X1*X2
Constant
上述3种拟合模型,得出不完全一致的结论,你认为何者更合理?
案例辨析 三种做法所得结果不完全一致,这是很正常的,不能根据研究者的主观愿望去选择结果,应根据资料的实际情况、统计分析的结果及其与实际情况的吻合程度来决定应选取哪一种统计分析方法。
正确做法 欲研究某疾病与甲、乙两因素的关系,可以采用Logistic回归研究疾病的发生与否与甲、乙两个因素的关系。单变量模型分别将甲因素与乙因素引入Logistic回归模型,由于可能存在其他混杂因素,单变量模型分析的结果并不可靠。将甲、乙两个因素同时纳入模型,若根据专业知识判断,甲、乙两因素间不存在交互效应,则建立主效应模型;若甲、乙两因素间可能存在交互效应,则应选用有交互效应的全模型,但不宜用标准化回归系数比较主效应与交互效应对疾病发生的影响程度,因为交互效应除依赖于乘积项的系数外,还依赖于两个变量的乘积。
案例18-2 某感冒颗粒治疗小儿急性上呼吸道感染风热证的三期临床试验研究中,选择东中西5家三级甲等医院儿科为试验中心,根据试验方案,PP数据集样本共428例。因变量为疗效(有效赋值1,无效赋值0),影响疗效的可能因素有药物(服用某感冒颗粒赋值X1=1,服用对照药赋值X1=0)以及5个临床试验中心(X2),原始记录数据经汇总整理,试验组322例,对照组106例,5个分中心治疗病例数及治疗结局见教材表18-16。
教材表18-16 某感冒颗粒多中心临床治疗试验汇总结果
分中心 编号 1
有效 35
试验组
无效 27
有效 10
对照组
无效 10