流行病学资料整理

一般将治疗组的发病率用作分子或被减数,对照组作为分母或减数。 (1)相对危险度或率比

1.定义 相对危险度(relativerisk,RR)或率比(rate ratio)是指暴露组发病率(Ie)与非暴露组发病率(Io)之比,它反映了暴露与疾病的关联强度。 2.计算公式

3.RR的意义 RR说明暴露组的发病危险是非暴露组的多少倍。 4.RR的95%可信区间

相对危险度(RR)无单位,比值范围在0至∞之间。 RR=1--表明暴露与疾病无联系;

RR<1--表明存在负联系(提示暴露是保护因子); RR>1--表明两者存在正联系(提示暴露是危险因子)。

比值越大,联系越强。实际上,1与∞只是理论上存在的值,恰恰等于1也不多见。 (2) 率差RD

(归因危险度AR、特异危险度、绝对危险降低度

RD = Ie-I0

暴露者单纯由于暴露而增加的发病危险的绝对数。 (3)归因危险度百分比ARP (AR%)或病因分值(etiologic fraction,EF)

AR%是指暴露人群中由暴露因素引起的发病在所有发病中所占的百分比。

ARR)

ARP=AR%=

Ie?I0IeRR?1RR×100% ×100%= 当AR%>75%时,即可认为找到了主要病因。

(4) 相对危险度降低度RRR

RRR = (Ie-I0)/Ie = 1-RR

说明试疗与对照相比可以降低不良事件发生的百分数。 (5)优势比(比数比OR-odds ratio)

--相对危险度RR的估计值,指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。 OR = ad/bc

病例对照研究只能估计OR。

当其发生率比较低时(<10%),优势比大小和意义与RR相同 在临床试验里RRR=1-RR=1-OR (6)需治疗人数(NNT):

NNT=1/ARR

描述关于治疗效果的大小--为了避免1例不良事件或获得1例有益事件需要治疗的病人总数。

NNT值的大小与疗效大小成反比.

例.某吸烟与肺癌的队列研究获得以下资料,试计算上述各指标。

吸烟者肺癌年死亡率为Ie =0.96‰ 非吸烟组肺癌年死亡率为Io=0.07‰ 全人群中肺癌年死亡率为It=0.56‰ 则RR=Ie/Io=0.96‰/0.07‰=13.7, 表明吸烟组的肺癌死亡危险是非暴露组的13.7倍;

RD=AR=Ie-Io=0.96‰-0.07‰=0.89‰, 表明如果去除吸烟,则可使肺癌死亡率减少0.89‰;

AR%=(Ie-Io)/Ie×100%=92.7%,

表明吸烟人群中由吸烟引起的肺癌死亡在所有肺癌死亡中所占的百分比为92.7%; 六、估计可信区间

由于随机误差的存在,以上效应的点估计(X)不能代表效应的真实值,一般用95%可信区间表达。

真实效应有95%的可能落在这个区间内。

95%CI =X±1.96SE

七、识别和控制混杂

(一)控制混杂的必要性和原理

混杂是一种由于暴露因素对某疾病的作用与其他病因对同一疾病的作用在同一个研究里交织在一起所引起的在暴露效应估计上的误差。 混杂是一种偏倚,一种在暴露与结局关系上的偏倚, 混杂因素需具备三个条件

①是确定的危险因素:性别必须是肺癌的真病因;

②不是暴露和疾病关系之间的中间因素:性别不可能是吸烟和肺癌之间的中间因素

③与暴露因素有关(可切断):如男性吸烟比例高于女性。

混杂因素的不良后果:性别将会低估或高估吸烟对肺癌危险的作用。

在观察性研究里,混杂是普遍的。因此,观察性研究对混杂的控制是必要的。控制混杂因素是切断第三个条件。 控制混杂因素方法:

设计阶段—限制、匹配、随机分组;

分析阶段—直接标化法、分层分析、多元回归

①随机分组是最简单最有效的方法,只能用于干预性研究,不能用于病因研究。 其他控制混杂的方法主要适用于非随机分组的临床试验和观察性研究。 ②限制控制混杂的原理

在男性中研究吸烟和肺癌的关系,不会受到性别的混杂影响,因为吸烟组和非吸烟组都是男性

③匹配控制混杂的原理

两组纳入同样比例的男性和女性,使两组在性别上可比,从而消除了性别可能引起的混杂

观察性研究可以使用限制和匹配控制混杂,但在病例对照研究里只能提高统计分析的效率,不能起到控制混杂的作用,反而有可能引入偏倚。少用于前瞻性研究(操作复杂、降低效率)

绝大多数队列研究和病例对照研究只能在数据分析阶段依靠统计学方法控制混杂。

④标化法和分层分析:简单、直观、明了,容易理解和解释,但仅适用于一两个因素的控制标化法—去掉年龄构成的影响。分层分析—性别是肺癌的危险因素,按男女分层(组)分析

⑤多元回归分析(logistic回归):

可以同时控制多个混杂因素,是观察性研究识别和控制混杂最重要方法 第三节 常规临床流行病学数据分析 医院常规收集病人数据:

优点:种类多,数量大,有的很珍贵 缺点:总体不明,选择性高,代表性差,

资料不完整,测量不一致,混杂信息缺乏。

一、常规数据的特征

数据的时间特征和含有的变量特征是确定可能研究的问题的基础。 (一)数据的时间特征和分类 1. 有随访数据

类似队列研究的数据。可用于大多数临床问题的探索。

队列数据和现况数据的主要区别是:不同时间点或时间段检查的是否同一批人。 2.无随访的数据

属于现况数据,即所有的数据都是在一个时间点上。 只可用于--病人现况、服务状况和诊断准确性, 偶尔可用于初步探索病因、疗效和不良反应。 (二)变量的特征和分类

联系客服:779662525#qq.com(#替换为@)