生物医学研究的统计学方法 课后答案(案例分析) - 图文 下载本文

60.055 50.541 37.388 44.754 47.273 51.855 49.156 38 44 45 45 47 54 49 81.87 73.03 87.66 66.45 79.15 83.12 81.42 8.63 10.13 14.03 11.12 10.60 10.33 8.95 48 45 56 51 47 50 44 170 168 186 176 162 166 180 186 168 192 176 164 170 185 39.203 45.790 50.545 48.673 47.920 47.467 54 51 57 49 48 52 91.63 73.71 59.08 76.32 61.24 82.78 12.88 10.47 9.93 9.40 11.50 10.50 44 59 49 56 52 53 168 186 148 186 170 170 172 188 155 188 176 172 资料来自:张家放主编.医用多元统计方法.武汉:华中科技大学出版社,2002。 该研究员采用后退法对自变量进行筛选,最后得到结果如教材表11-10所示。

教材表11-10 多重线性回归模型的参数估计 Table 11-10 Parameter estimation of regression model

Variable Intercept

Unstandardized Coefficients Standardized B 100.079 -0.213 -2.768 -0.339 0.255

Std. Error 11.577 0.091 0.331 0.116 0.132

Coefficients

-0.214

-0.721 -0.653 0.439

t

8.644 -2.337 -8.354 -2.939 1.936

P

0.000 0.027 0.000 0.007 0.064

X1

X3 X5 X6

2* F?34.90, P?0.001 R?0.843

对模型进行方差分析的结果认为模型有统计学意义(P<0.05),确定系数的数值(0.843)也说明模型拟合的效果较好。考察各个自变量的偏回归系数,研究者发现,X6的偏回归系数符号为正,认为最高心跳频率越大,人的吸氧效率就越高,这与专业结论相反。出现这种悖论的原因是什么呢?

案例辨析 我们先分析一下各个自变量之间的简单相关系数,结果发现X5和X6存在有较强的相关(r=0.930, P<0.001), 对回归模型进行共线性诊断,结果发现自变量X5的容忍度为0.122,方差膨胀因子等于8.188,自变量X6的容忍度为0.117,方差膨胀因子等于8.522,说明自变量之间存在多重共线性,所以出现了与专业结论相反的现象。

正确做法 在这里,我们可以把自变量X6从模型中删除以消除多重共线性的影响,应重新建立多重线性回归方程。最好多用几种筛选自变量的方法(如前进法、后退法、逐步回归分析、最优回归子集法等)筛选自变量,结合专业知识和统计学知识,综合分析和比较,从而得到比较优的多重回归方程。

案例11-2 医院住院人数的预测 石磊(1991)发表了其所在医院1970-1989年期间历年门诊人次X1、病床利用率X2、病床周转次数X3和住院人数Y的数据(教材表11-11),建立由X1、X2、X3预测Y的线性回归方程[中国卫生统计,1991,8(6)]。下面列出了多重线性回归分析的主要结果(教材表11-12)。

教材表11-11 重庆医科大学附属第二医院1970-1989年若干统计资料 年份 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989

教材表11-12 多重线性回归模型的参数估计

Table 11-12 Parameter estimation of regression model

Variable Intercept

Unstandardized Coefficients Standardized

B Std. Error Coefficients -3219.628 59.834 327.553

1505.165 15.780 85.725

0.512

0.515

住院人数

Y 6 349 6 519 5 952 5 230 5 411 5 277 3 772 3 846 3 866 5 142 7 724 8 167 8 107 7 998 7 331 6 447 4 869 5 506 5 741 5 568

门诊人数/万人

X1

49.8 38.1 36.6 36.0 32.3 37.8 34.1 42.2 38.1 39.5 55.8 63.0 65.2 66.1 65.4 60.1 56.9 57.7 53.4 48.7

病床利用率/%

X2

94.25 98.50 89.86 86.00 83.29 77.88 92.62 86.57 84.29 89.29 97.63 96.53 93.43 94.45 93.03 91.79 88.94 91.79 99.03 94.93

病床周转次数

X3

19.84 20.37 18.80 16.34 16.91 18.07 17.96 18.31 18.41 20.61 21.72 23.33 21.91 21.05 19.96 18.81 15.82 16.01 16.59 19.09

t

-2.139 3.792 3.821

P

0.047 0.001 0.001

X1 X3

2*F?24.39, P?0.001 R?0.861

作者采用逐步回归的方法建立了门诊人数和病床周转次数关于住院人数的多重回归方程,得到表11-12的结果,认为回归效果很好。但是,读者小明作了残差分析图(教材图11-4),认为回归效果不好。请仲裁一下,到底谁对谁错?

教材图11-4 残差分析图

案例辨析 作者采用逐步回归的方法建立了门诊人数和病床周转次数关于住院人数的多重回归方程。从结果中可以看出,整个方程是有统计学意义的,各个总体偏回归系数不为零,确定系数等于0.861,说明回归的效果也很好。但是,回头考虑资料是否适合进行多重线性回归分析,也就是资料是否满足多重回归分析的前提条件LINE?于是,对回归分析的结果进行残差分析,上面的残差图提示资料不满足方差齐性的要求。Durbin-Watson统计量等于0.580,结果提示资料不满足独立性的要求。其实,常识也认为同一医院不同年份之间的数据不是独立的。因此,可以认为本资料不满足多重线性回归分析的前提条件,不宜进行多重线性回归分析。

正确做法 由于各年数据前后可能存在关联性,即其取值与时间有关,故可以考虑采用时间序列等分析方法,此处从略。

第12章 实验设计 案例辨析及参考答案

案例12-1 某项研究欲观察E1A基因对裸鼠移植肿瘤生长的抑制和化学治疗的增敏作用,研究者进行了两个实验。一是裸鼠致瘤实验,在实验设计中,将4周龄裸鼠随意分为3组,每组5只,分别接受不同的处理。二是模拟E1A基因治疗临床应用的裸鼠实验,研究者取20只4周龄裸鼠,接种癌细胞系后,随意地分为4组。已知裸鼠的性别、体重等非实验因素对实验结果可造成不同的影响。请辨析该实验设计存在哪些差错?应当如何改进?

案例辨析 研究者在进行此项实验研究过程中,随机化观念淡漠,以随意代替随机,没

有认真遵循实验设计的“随机、均衡”的原则。在制定实验方案时,要非常重视非实验因素的干扰,应使用随机化方法使全部受试对象都有同等的机会被分入任何一个处理组中去,使各组具有可比性。在该研究中,研究者对裸鼠随意分组,显然没有考虑到裸鼠的“性别、体重、健康状况”等重要非实验因素对不同处理组中的实验结果所造成的非平衡影响。若研究者随意地从笼中抓取裸鼠,首先抓取5只作为第一组,再抓5只作为第2组,依此类推。可以想像,活泼健康的裸鼠直到最后才会被抓到,因此各组受试对象之间在健康状况等方面并没有达到均衡一致,各组之间也就不具有可比性。

正确做法 要想提高实验研究结果的可信度,应利用随机化方法尽量均衡重要非实验因素(如性别、体重、健康状况等)对不同处理组中的实验结果所造成的影响,才能使实验结果在各对比组间具有很好的可比性。

案例12-2 为了观察甲紫注入小型猪正常腮腺后组织病理变化情况,有人选择6个月龄、体重20?25 kg的中国实验用小型猪15只,雄性9只,雌性6只。每只动物任选一侧腮腺为实验组,另一侧作为正常对照组,以消除个体差异及增龄对实验结果的影响。按注入甲紫后1周、2周、1个月、3个月及6个月将15只动物随机分为5组,每组3只(每个组的3只动物分别随机注入0.6、1.0及4.0 ml 1%甲紫溶液),然后观察组织病理变化情况。请辨析该实验设计存在哪些差错?应当如何改进?

案例辨析 在该研究中共用了15只小型猪,乍看起来“15”这个数目不算太小,但仔细看一下不难发现,该实验中共涉及两个实验因素:第一个因素是“甲紫作用时间”,它有“1周、2周、1个月、3个月及6个月”5个水平;第二个实验因素是“甲紫剂量”,它有“0.6 ml、1.0 ml及4.0 ml”3个水平。这两种因素水平的全面组合共有15种情况,每种情况构成一个实验条件,这样在每个实验条件下只有1只动物。所以该实验各组的样本大小为n?1。这就违背了实验设计中的“重复原则”。因为生物体本身存在变异,只有在相同条件下进行多次独立重复实验,随机现象的变化规律才能正确地显露出来。

正确做法 究竟样本含量应取多大需要提供有关的基本信息,需要找到与相应实验设计类型对应的样本含量估计公式进行计算。不仅如此,此项实验研究所设立的正常对照组也是值得怀疑的,因为在动物的口腔内,一边用药而另一边不用药,怎能保证用药的那一边不会影响不用药的那一边呢?

案例 12-3 为了比较甲磺酸托烷司琼和盐酸托烷司琼控制由顺铂、多柔比星化疗所致胃