生物医学研究的统计学方法 课后答案(案例分析)

2 3 4 5 47 63 26 46 18 21 22 17 15 18 9 14 7 9 6 8

药物上市前多中心临床试验中,特别关注中心变量与药物间是否存在交互效应,结合教材表18-16中数据,5个分中心变量为无序分类变量,按照哑变量设置方法,共设置4个哑变量D1,D2,D3,D4,以中心1为参照。运用SPSS软件计算时,将药物变量、中心变量以及中心与药物交互项均纳入SPSS软件Logistic回归界面的变量框,采用多种逐步法自动筛选变量并建立Logistic回归模型,回归分析最后一步结果见教材表18-17。研究者认为:药物变量、中心变量与药物变量的交互项均被剔除,模型最后只保留了中心变量。所以,交互效应不存在。

教材表18-17 SPSS软件自动逐步回归最后一步的分析结果

b

S.E. - 0.325 0.308 0.337 0.325 0.222

Wald 11.688 4.818 6.700 0.007 4.362 0.778

df 4 1 1 1 1 1

P 0.020 0.028 0.010 0.935 0.037 0.378

exp(b) - 2.039 2.220 1.028 1.973 1.216

D

- 0.713 0.798 0.027 0.680 0.196

D1 D2 D3

D4

Constant

试问,上述建模变量筛选方法以及中心变量与药物间无交互效应的解释是否恰当? 案例辨析 盲目运用变量筛选方法进行变量筛选是不妥当的。

正确做法 该研究关注中心变量与药物间是否存在交互效应。分析两变量的交互效应时,模型中必须包含相应两变量的主效应,运用SPSS软件计算时,将药物变量、中心变量以及中心与药物交互项均纳入SPSS软件logistic回归界面的变量框,而且三个变量均需作为强制引入变量,因此不能采用SPSS软件提供的逐步法自动筛选变量。

案例18-3 某医师研究某市成年人(≥18岁)抑郁症发生的危险因素。从该市成年人随机抽取294人的一个样本,其中有抑郁症50人,无抑郁症244人。3个可疑影响因素分别为性别X1(0为男,1为女)、年龄X2(年龄/10)、健康状况X3(1为很好,2为好,3为良,4为差)。该医师作了抑郁症发生和3个因素的logistic回归分析,结果见教材表18-18。

教材表18-18 成年人抑郁症危险因素分析

变量 常数

b

0.405 7 2.068 3 -1.389 0 1.379 1

SE

0.125 5 0.447 5 0.326 4 0.273 6

?2

10.450 21.362 18.109 25.407

P

<0.001 <0.001 <0.001 <0.001

OR*

1.500 4 7.911 4 0.249 3 3.971 3

标准化b - 1.045 7 -1.720 0 1.463 4

X1 X2 X3

*OR=exp(b)。 请问:

(1)该医师认为抑郁症的发生与性别、年龄和健康状况有关,其中女性、低年龄和健康状况差为抑郁症发生的危险因素,由OR可知,性别对抑郁症发生的作用最大,健康状况的作用次之,年龄的作用最小。该结论是否正确?为什么?

(2)该医师又认为,年龄每增加10岁,抑郁症发生的可能性降低约25%;年龄每增加20岁,抑郁症发生的可能性降低约50%。该结论是否正确?为什么?

案例辨析

(1)“女性、低年龄和健康状况差”分别是“性别、年龄和健康状况”这三个因素的一个水平,混淆了因素与水平的概念;当logistic回归方程中自变量单位不同时,不能直接通过回归系数或相应的OR值比较各自变量对因变量的影响程度。

(2)计算结果不正确。

正确做法

(1)需比较标准化回归系数。由标准化回归系数可知,年龄对抑郁症发生的作用最大,健康状况的作用次之,性别的作用最小。

(2)年龄每增加10岁,抑郁症发生的优势比为0.249 3,表示其他两因素取值固定,年龄每增加10岁,抑郁症发生的优势是增加前的24.93%,降低约75%;年龄每增加20岁,抑郁症发生的优势比为exp?2?(?1.389)?=0.062 2,表示其他两因素取值固定,年龄每增加20岁,抑郁症发生的优势是增加前的6.22%,降低约94%。

第19章 生存分析 案例辨析及参考答案

案例19-1 某医师收集30例肺癌术后患者的生存情况,有1例由于电话和地址错误无法

随访到患者,他设计了以下几种处理方法:① 把该病例去掉;② 把这例患者写入SPSS数据,但末次随访时间空白,让SPSS自动去分析;③ 因为某一天(比如2006年9月1日)想随访这例患者但是没有随访到,所以将末次随访时间写为随访当天的日期。另欲分析肺癌术后患者的中位生存期,计算结果为10个月,但是检查原始数据发现,生存时间为10个月的这个患者一直存活到随访结束,似乎与中位生存期的定义相矛盾。

请问:

(1)该医师对这例失访患者的处理是否恰当?为什么?正确的处理方法是什么? (2)另有1例患者死于脑梗死,生存分析时应如何处理? (3)该医师的发现是否与中位生存期的定义相矛盾?为什么? 案例辨析

(1)该医师对这例失访患者的三种处理都不恰当。 (2)死于脑梗死的病例同样应当作为删失病例。 (3)属于概念不清而产生的怀疑。 正确做法

(1)应作为删失病例,删失生存时间的计算为从手术切除到最后一次随访的时间。 (2)死于脑梗死的病例应当作删失病例,删失生存时间的计算为从手术切除到死于脑梗死的时间。

(3)该医师的发现与中位生存期的定义并不矛盾,中位生存期不能与个体生存时间相混淆。

案例19-2 评价A、B两种治疗方案对某病的治疗效果,A组(group=0)12人,B组(group=1)13人。患者分组后检查其肾功能(kidney),功能正常者记为0,异常者记为1。治疗后生存时间为time(天),生存结局status=0表示删失,status=1表示死亡。原始数据见教材表19-11。

教材表19-11 25例某病患者两种治疗方法的生存情况

No. 1 2 3 4

group 0 0 0 0

kidney 1 0 1 0

time 8 852 52 220

status 1 0 1 1

No. 14 15 16 17

group 1 1 1 1

kidney 0 0 0 0

time 632 2 240 195 76

status 1 0 1 1

5 6 7 8 9 10 11 12 13

0 0 0 0 0 0 0 0 1

1 0 0 0 0 1 0 0 0

63 8 1 976 1 296 1 460 63 1 328 365 180

1 1 0 0 0 1 0 0 1

18 19 20 21 22 23 24 25

1 1 1 1 1 1 1 1

0 1 1 0 0 0 1 0

70 13 23 1 296 210 700 18 1 990

1 1 1 1 1 1 1 0

甲医师以生存结局为观察指标,整理得A、B两组死亡情况(教材表19-12)。考虑到例数较少,采用Fisher确切概率法,得P=0.097,说明两种治疗方法疗效差别无统计学意义。

教材表19-12 两种治疗方法疗效比较

分组 A B 合计

死亡数 6 11 17

未死亡数

6 2 8

合计 12 13 25

死亡率(%)

50.0 84.6 68.0

乙医师以生存时间为观察指标,考虑到肾功能是否异常为可能混杂因素,采用多重线性回归进行校正混杂因素后的组间生存时间比较,结果见教材表19-13。说明校正肾功能是否异常后,两种治疗方法疗效差别无统计学意义,与甲医师的结论一致。

教材表19-13 25例某病患者多重线性回归分析结果

变量 constant group kidney

? ? 914.817

?) SE(?211.229 261.838 291.346

t

4.331

P

<0.000 1 0.605 0.010

-137.271 -821.701 -0.524 -2.820

请问:

(1)甲医师和乙医师所采用的统计分析方法是否恰当?为什么?

(2)针对原始数据和分析目的,指出正确的分析方法并说明理由。

案例辨析 甲医师和乙医师所采用的统计分析方法都不恰当。甲医师仅考虑生存结局,未考虑生存时间;乙医师仅考虑生存时间,未考虑生存结局,而且不该采用多重线性回归,因为生存时间并不服从正态分布。

正确做法 同时考虑生存结局和生存时间,采用Cox回归进行校正混杂因素后的组间比较。

案例19-3 将90例非手术治疗胃癌患者按随机化方法分配为单纯化疗组与联合治疗组(化疗+放疗),每组(各45例)患者的生存时间见教材表19-14,Kaplan-Meier生存曲线见教材图19-6。对该资料进行Cox回归分析,引入疗法指示变量,化疗组为0,化疗+放疗组为

?=0.267(标准误0.233)1,?,P=0.253 1,结果显示单纯化疗组与联合治疗组生存率差别无

联系客服:779662525#qq.com(#替换为@)