生物医学研究的统计学方法 课后答案(案例分析) - 图文 下载本文

(3)本问题应选用的统计分析方法是什么?为什么要选择这样的方法?

案例辨析 分析目的为“比较观察组与对照组治疗新生儿缺氧缺血性脑病的疗效有无差异”;选用?2检验不能达到前述的分析目的,因为此检验法与疗效的有序性没有任何联系。

正确做法

(1)如果仅关心两个实验分组中的患者在三个疗效等级上的人数分布是否相同,此时,可以选用?2检验。

(2)本例的定性资料属于“结果变量为有序变量的单向有序的2?3列联表资料”,为了实现前述的统计分析目的,应选用秩和检验。本例采用秩和检验进行统计分析,

HC?2.8107,P=0.093 6。尚不能得出两组疗效之间的差异有统计学意义的结论。

案例8-3 某研究者欲比较食管癌TNM分期的某种基因蛋白阳性表达率有无差异,收集了食管癌Ⅱa期患者7例、Ⅱb期患者10例、Ⅲ期患者23例,检测了某种基因蛋白的阳性表达例数(X)分别为3、8和21例。研究者考虑食管癌的TNM分期是有序变量,因此运用秩和检验处理资料,结果HC=6.119 1,P=0.013 4(教材表8-16), 差异有统计学意义。

教材表8-16 食管癌TNM分期的阳性表达情况与秩和检验结果

食管癌 TNM分期

Ⅱa Ⅱb Ⅲ

n

7 10 23

X/n

3/7 8/10 21/23

HC

6.119 1

P 0.013 4

请大家对本案例讨论如下问题:

(1)原作者的分析目的是什么?在此目的下应选择的统计分析方法是什么? (2)在什么情况下可以选用秩和检验?

案例辨析 原作者盲目选择秩和检验处理了该资料。原作者的分析目的是“食管癌TNM分期在某种蛋白的阳性表达率方面有无差异”;为实现此分析目的,首先应弄清这是一个什么样的列联表资料。食管癌TNM分期这个有序变量是“原因变量”,不是“结果变量”,结果变量为“是否阳性”,故此定性资料可以被视为“双向无序的3?2列联表资料”。

正确做法 以采用一般?检验或Fisher精确检验(若小于5的理论频数的个数小于总格子数的1/5)处理资料为宜。可将教材表8-16整理成案例表8-1,因为有3个理论频数小于5,故采用Fisher精确概率法进行计算更合适,结果是:P=0.017 2,可以认为食管癌TNM不同分期某种蛋白的阳性表达率之间的差异有统计学意义。

案例表8-1 食管癌TNM分期的某种蛋白阳性表达情况

2食管癌 TNM分期

Ⅱa Ⅱb Ⅲ 合 计

阳性例数 3 8 21 32

阴性例数

4 2 2 8

合计 7 10 23 40

但当结果变量为多值有序变量,且希望比较各期患者在结果上的差别是否具有统计学意义时,需要选用秩和检验。本例,原作者对原因变量“赋值或打分”,采用秩和检验是没有意义的。

第9章 关联性分析 案例辨析及参考答案

案例9-1 有研究者以“正常血糖、糖耐量减低及2型糖尿病人群胰岛素抵抗与非酒精性脂肪肝的相关分析”为题,研究了非酒精性脂肪肝的患病率与糖尿病分级(即正常血糖、糖耐量减低和2型糖尿病三级)的关系。以正常血糖者、糖耐量减低者和2型糖尿病患者为研究对象,年龄、性别可比,无大量饮酒史、肝炎史,脂肪肝的诊断以影像学结果为准。指标以均数±标准差表示,统计分析采用两组独立样本比较的t检验。结果发现,三组血糖、胰岛素、血脂水平等和脂肪肝患病率差别有统计学意义(数据及统计结果见教材表9-7),糖耐量减低组与正常血糖组比较P<0.05,2型糖尿病组与糖耐量减低组比较P<0.05。结论,随着正常血糖向糖耐量减低及糖尿病发展,血糖、血脂、胰岛素抵抗指数及脂肪肝患病率等指标值皆升高并逐渐加重,差异有统计学意义,认为脂肪肝患病率与血糖水平、血胰岛素、血脂、胰岛素抵抗、糖耐量减低和2型糖尿病等成正相关。

教材表9-7 三种血糖水平人群的血生化及脂肪肝患病率

血糖

组别

/mmol?L 空腹

正常血糖 糖耐量减低 2型糖尿病

87 62 68

5.0±

0.5 6.5±0.5 8.3±2.6

餐后 5.6±1.0 8.2±1.3 12.5±3.4

?1胰岛素/mmol?L 空腹 7.4±1.8 11.4±2.7 16.8±3.2

餐后 24±8 134±58 114±44

?1总胆固醇

/mmol?L /mmol?L?1

/mmol?L?1

三酰甘油

?1胰胰素 抵抗指数

脂肪肝患病率/% 48.3 69.4 83.8

0.9±0.3 2.1±1.0 2.6±1.5

3.0±0.9 4.6±0.8 5.1±0.8

0.6±0.5 1.2±0.7 1.9±0.7

经t检验,糖耐量减低组与正常血糖组比较,以及2型糖尿病与正常血糖组比较,各指标比较的P值均<0.01;而2型糖尿病与糖耐量减低组比较,餐后胰岛素两组比较P<0.05,脂肪肝患病率比较P<0.05,其余各指标比较的P值均<0.01。

请问:该研究的目的与设计方法吻合吗?该研究设计属于何种类型?有无更好的设计方案?本设计最适合哪种统计分析法?本例的统计分析方法有何不妥?本例的统计分析结果能推出本例的结论吗?若否,则可以推出什么结论?本例的统计表达有何不妥吗?

案例辨析 这里,题目是“相关分析”,结果也得到了“相关”的结果,但仔细分析其研究内容与统计学方法,发现其测量了三组人群的血糖、血脂和脂肪肝患病率,这样的设计属于多组比较的设计,不能达到相关分析的目的,最多只能认为研究的结局指标与分组因素“有关”。

正确做法 欲进行相关分析,必须从特定人群(如正常人或糖耐量减低但未患糖尿病的人或2型糖尿病患者)中抽取一组随机样本,直接采用Pearson相关分析研究定量观测指标血糖、胰岛素、血脂水平等之间的相关关系;若希望研究以上三个人群之间血糖、胰岛素、血脂水平等与脂肪肝患病率之间的关系,应采用较复杂的统计分析方法(如多重logistic回归分析)处理,此处从略。

案例9-2 有研究者欲评价两种量表对某疾病的严重程度得分的一致性,评分者A用量表1,评分者B用量表2,对同一批患者(5人)进行了评分,结果见教材表9-8,研究者在Excel中采用Pearson函数计算了两次评分的相关系数,结果两者相关系数非常之高(r=0.866 3),因此认为,两种量表得分是一致的。

教材表9-8 两种量表评分的结果

量表 1 2

请问:该研究的目的与设计方法吻合吗?就本例的设计而言,存在任何不妥吗?本例可否采用Pearson相关系数进行计算?计算的结果正确吗?推论正确吗?

案例辨析 在本例中,突出的问题有两个。第一个问题是样本量太小,只有5人,难以得出有统计学意义的结论。查表得知,当样本量只有5时,自由度为3,此时在??0.05的水平要得到有统计学意义的相关系数值的最低界限是0.878,本例系数为0.86,尚未达到有统计学意义的临界值,原研究者必定是对相关系数未作假设检验而妄下断论。第二个问题是以“相关”推断“一致”。实际上,“相关”与“一致”有本质的区别。“相关”可以是不同指标间的相关,可以正相关,可以负相关,只表示变量间的联系,而“一致”则是同指标间

评分人 A B

患者1 86 45

患者2 90 47

患者3 73 39

患者4 88 42

患者5 78 40

?同方向且基本同值的概念。令Y?2X?5,则X,Y间相关系数为1,但它们并不一致,在

仪器未校正时与校正后的数据,两者相差一个系统误差,但相关系数为1。

不考虑截距项的前提下,X增加1倍,Y平均增加2倍。实际研究中也有这样的例子,如

正确做法 ①增加样本量。②将同一病人的两份量表评分总分视为X、Y两变量的取值,采用后面将要讲到的简单线性回归分析方法处理,进行回归参数假设检验时,应检验总体截距是否等于0、总体斜率是否等于1。③对两份量表的分级的符合性进行Kappa系数分析。

案例9-3 有研究者欲研究某药口服量与血药浓度关系,把口服药物设定为1, 2.5, 5, 7.5, 10, 15, 20, 30等档次,每档各取3只动物(共24只)进行试验,于服药后1 h抽血检验血药浓度(教材表9-9)。在SPSS中作散点图(教材图9-4),计算得口服药物量与血药浓度的

Pearson相关系数=0.979,经假设检验P<0.001,认为口服药物量与血药浓度呈线性正相关。

教材表9-9 不同口服量与相应血药浓度

口服量/mg

血药浓度/mmol?L?1 口服量/mg 血药浓度/mmol?L?1

1 0.3 10 2.8

1 0.4 10 3.0

1 0.3 10 3.0

2.5 0.6 15 4.5

2.5 0.6 15 4.5

2.5 0.7 15 4.3

5 1.0 20 8.3

5 5 7.5 7.5 7.5 1.0 1.1 1.8 1.9 2.0 20 20 30 30 30 8.0 7.8 15.2 14.2 13.8

教材图9-4 药物口服量与血药浓度关系的散点图

请问:本例的两个变量各有何特征?可以计算Pearson相关系数吗?若可以,则计算的方法与步骤有何不妥吗?计算结果正确吗?可以推出本例的结论吗?

案例辨析 本例的重要问题是,线性相关的条件不满足,即口服剂量是人为取定的,属于非随机变量,因此不宜作相关分析。其次,仅利用Pearson相关系数与假设检验值就认为两者呈线性正相关为时过早。分析本例的散点图,可发现散点呈曲线形,而非直线型,因此即使口服剂量是随机变量也不宜直接作线性相关分析。第三,研究者取的剂量范围为1~30,而结论认为口服药物量与血药浓度呈线性正相关,未限定浓度范围,也是不妥的。相关分析很重要的一条就是在多大范围作的研究就在多大范围下结论,因为超过范围很可能结论就不再成立。

正确做法 ①若要进行相关分析,则应将浓度随机化,不可定点;②认真分析散点图,看其散点分布趋势,因是曲线形,因此宜在适当变换(如对数变换等)后作线性相关分析。

第10章 简单线性回归分析 案例辨析及参考答案 案例10-1 年龄与身高预测研究。某地调查了4~18岁男孩与女孩身高,数据见教材表10-4,试描述男孩与女孩平均身高与年龄间的关系,并预测10.5岁、16.5岁、19岁与20岁男孩与女孩的身高。

教材表10-4 某地男孩与女孩平均身高与年龄的调查数据

年龄 平均身高 男孩 女孩 年龄 平均身高 男孩 女孩 年龄 平均身高 男孩 女孩