流行病学研究的选题和设计1.5 下载本文

第六章 流行病学研究的选题和设计

当两组样本含量相等时, Q1=Q2=0.5,代入公式(6-4),可算得:

N?[(z??z?)??]2(Q1?Q2)?[?1?1(1.96?0.842)5.02](0.5?1?0.5?1)?126

2.5n1?n2?2/N?63,即每组均需病例63例。

当A药组样本含量占整个样本含量的60%时,Q1= 0.6 ,Q2=0.4,代入公式(6-4),可算得:

N?[(z??z?)??]2(Q1?Q2)?[?1?1(1.96?0.842)5.02](0.6?1?0.4?1)?131

2.5则A药组样本含量n1=131×0.6=79, B药组样本含量n2=131×0.4=52。由上可见,当其它条件不变时,如果两组观察单位数相等,会节约样本含量。 (3)完全随机设计两样本频率检验

N?[z??c(1??c)(Q1?1?Q2)?z??1(1??1)/Q1??2(1??2)/Q2)?1?1??2]2 公式(6-5)

式中?1和?2为两样本来自的总体率(在队列研究和实验研究中,?1和?2分别指两组的发病率或阳性率,若总体率未知,也可用样本率代替;?c为两总体合计概率,

?c?Q1?1?Q2?2;其它指标含义同前。

【例6.6】 拟进行一项实验研究,研究某镇痛药的不同剂量镇痛效果有无差别。预实验中,2.5mg剂量组的有效率为55%,5.0mg剂量组的有效率为65%。若取?=0.05(单侧),

?=0.20,如果两组例数相等,问每组需要多少例?

已知?1=0.55,?2=0.65,?c=0.55×0.5+0.65×0.5=0.60

N?[z??c(1??c)(Q1?Q2)?z??1(1??1)/Q1??2(1??2)/Q2)?1?1?1??2]21.6450.60?0.40(0.5?1?0.5?1)?0.8420.55(1?0.55)/0.5?0.65(1?0.65)/0.52?[] 0.65?0.55?592 故每组各需296例。

病例对照研究设计样本含量的计算方法和队列研究及实验研究相同,只是由于病例对

17

第六章 流行病学研究的选题和设计

照研究不能计算发病率,而只能计算暴露率,因此?1和?2分别指病例组和对照组的暴露率,二者间有如下关系:?1=?2OR,?c为合计率。 1??2(OR?1)【例6.7】拟进行一项病例对照研究,研究吸烟与肺癌的关系。估计吸烟者的相对危险度为2.0,人群吸烟率为20%,设?=0.05(双侧),?=0.10(单侧)。估算当病例和对照比例为1:1,以及1:1.5时需要的样本含量。

已知?2=0.20,则?1=?2OR0.20?2==0.333, 1??2(OR?1)1?0.20?1?c=0.333×0.5 +0.20×0.5=0.267

N?[z??c(1??c)(Q1?1?Q2)?z??1(1??1)/Q1??2(1??2)/Q2)?1?1??2]2 1.960.267?0.733?4?1.2820.333?0.667/0.5?0.2?0.8/0.52=[]0.333?0.20?461即病例组和对照组各需调查231例。

将?c=0.333×0.4 +0.20×0.6=0.2532,Q1?0.4,Q2?0.6代入公式(6-5),得

N?[z??c(1??c)(Q1?1?Q2)?z??1(1??1)/Q1??2(1??2)/Q2)?1?1??2]21.960.2532?0.7468?4.166?1.2820.333?0.667/0.4?0.2?0.8/0.62=[] 0.333?0.20?477病例组n1?477?0.4?191 对照组n2?477?0.6?286 (4)配对设计两样本频率的比较

如病例和对照采用1:1匹配时,样本含量的计算可采用Schlesselman推荐的公式。

m?Z?/2?Z??(1??)/(??1/2)2 公式(6-6) 式中 ??OR/(1?OR),m为结果不一致的对子数。 则需要的总对子数为:

??2N?m/[?1(1??2)??2(1??1)] 公式(6-7)

18

第六章 流行病学研究的选题和设计

【例6.8】研究口服避孕药与先天性心脏病的关系,设?=0.05(双侧),?=0.10(单侧),对照组暴露比例?2=0.3,估计的OR=2,若采用病例和对照采用1:1匹配的方式,问需调查多少例。 已知?2=0.30,OR=2,则?1=?2OR0.30?2==0.46 1??2(OR?1)1?0.30?1??OR/(1?OR)=2/3=0.667 m?Z?/2?Z??(1??)/(??1/2)22??=?1.96/2?1.2820.667?0.333?/(0.667?0.5)22 ?90N?m/[?1(1??2)??2(1??1)]?90/[0.46?0.70?0.30?0.54] ?186即病例和对照各需调查186例。

五、研究变量的确定

根据因果联系的关系,在流行病学研究中的变量可分为两大类,即暴露变量(也称为自变量)和结局变量(也称为因变量)。暴露变量是指影响疾病的发生或健康状况的分布的变量,是原因变量;而疾病或健康状况的状态是结局变量,即结局变量是在暴露变量的作用下产生反应的变量。区别与明确研究的暴露变量和结局变量具有重要的流行病学与生物统计学意义,首先它有助于选择拟研究的变量,对调查问卷的设计具有指导作用。其次数据分析阶段可以指导正确选择数据分析方法及模型的建立。

在选择研究变量时首先需要考虑选择哪些暴露变量和结局变量,主要根据研究目的和具体的研究选题来选择,与研究目的有关的项目要详尽,不可遗漏,不要包括无关的变量。同时要充分考虑到暴露变量和结局变量之间关系的生物学及逻辑学的合理性。然后要对每个变量的定义和测量方法做出明确的规定,采用标准的问卷、规范的定义、国际或国内统一的诊断标准。

1.暴露变量的选择

常见的暴露变量包括研究对象人口统计学特征、行为危险因素、营养/膳食因素、体力活动、精神/心理因素、家族/遗传因素、职业/环境特殊暴露因素、社会经济因素、生理、生化和分子生物学标志物等。

19

第六章 流行病学研究的选题和设计

2.结局变量的选择

不同的研究课题和研究目的其结局变量不同,结局变量又可分为“硬”结局变量(hard outcome)和“软”结局变量(soft outcome),前者包括疾病的发生、死亡,也称为直接结局变量;后者是指病因和疾病发生之间的那些中间变量,例如,如果“硬”结局变量是冠心病的发生,那么血脂的各项测量指标、血压水平就是“软”结局变量,也称为间接结局变量。“硬”结局变量提供的证据级别高,但有时需要随访较长时间才可获得。如果不以得到直接结局变量,也可以应用间接结局变量。

六、 调查问卷的设计

调查问卷(questionnaire),是在正式调查前制作好的包括各调查项目的书面材料或电子文件材料,可以是简单的调查提纲,或包括很多调查项目的完整的调查问卷格,也可以是标准的量表,如艾森克人格问卷,SCL-90心理测定量表等。

(一)调查问卷的结构

一份完整的调查问卷主要包括标题、编码、说明、备查项目、分析项目5个部分。下面我们以这些内容在调查问卷中出现的先后顺序分别作一介绍。

1 标题:概括说明调查的主要内容,标题应简明扼要。如世界卫生组织(WHO)《健康和卫生系统反应性》量表,InterASIA中国部分-“中国心血管健康多中心合作研究”。

2 编码部分:包括抽样编码,调查员编码,资料录入人员编码(在资料录入时进行编码)等。设置调查员编码和资料录入人员编码的主要作用在于进行质量控制,此外一个大型的现场调查还应该设置有抽样编码,一方面便于进行现场质量控制,避免重复编码,另一方面便于对不同地区(或试验中心)进行独立分析。如InterASIA研究中采用了四阶段抽样的方式:

第一阶段:抽样单位是省市。分别从南部和北部各抽取5个城市,共抽得10个省。对这10个省市进行编码01~10,其中01代表北京。

第二阶段:抽样单位是县和城市。即从第一个阶段所选的省中随机抽取一个城区(编码01)和一个县(编码02),共抽得10个城区和10个县。

第三阶段:抽样单位是街道、镇或乡,从每个城区和县随机抽取1个街道(编码01)和1个镇或乡(编码02),共抽得10个街道和10个镇或乡。

第四阶段:抽样单位是个体。全体街道或镇的居民名单将作为样本来源(限年龄在35-74岁),每个现场抽得男(编码1)、女性(编码2)居民各400人。

20