50~ 合计 10 109 11 43 23 53 5 14 49 219
45. 某医院为探讨流行性出血热临床发病情况和治疗原则之间的关系,得到了446例病情转化资料(下表),试分析早期分度与最后定型之间有无关联。
流行性出血热不同分度病情转化情况
早期分度 轻度 中度 重度 合计
轻型 111 5 0 116
最后定型 中型 21 163 1 185
重危型 1 20 124 145
合计 133 188 125 446
46.某医院在研究胎盘过早剥离者的出血情况时,将妊娠时间分为三个阶段,失血量分为三个等级,共调查了224例,结果见表。问失血量的多少与妊娠阶段之间有无关联?
妊娠各阶段胎盘过早剥离者的出血人数分布
妊娠阶段 早期 中期 晚期 合计
失 血 量
较少 23 47 51 121
中等 4 29 19 52
较多 6 23 22 51
合计 33 99 92 224
47.试用表资料分析\右下腹压痛\与\是否患了阑尾炎\之间有无关联? 201例就诊者有无右下腹压痛与手术证实是否患有阑尾炎之间的关系
有无右下腹压痛
有 无 合计
是否患有阑尾炎 是 93 15 108
否 27 66 93
合计 120 81 201
48.用如下数据计算相关系数,并检验其总体相关系数是否为零;计算回归系数,并检验其总体回归系数是否为零;解释相关系数与回归系数的含义、比较
13
并解释两个检验结果;计算总体回归系数的95%置信区间。
X Y
2 5
4 6
4 7
5 9
6 12
49.15个儿童的身高与肺死腔容积的观测数据如表所示. 儿童的身高与肺死腔容积的观测数据
对象号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
身高(cm) 110 116 124 129 131 138 142 150 153 155 156 159 164 168 174
肺死腔容积(ml),
Y 44 31 43 45 56 79 57 56 58 92 78 64 88 112 101
试用该资料进行相关与回归分析:
(1)计算基本统计量; (2)计算相关系数;
(3)进行相关系数等于零的假设检验; (4)计算样本回归方程的截距与回归系数; (5)进行回归系数等于零的假设检验; (6)验证是否存在tr?tb?F 的关系 ;
(7)估计回归系数?的95%置信区间;
50.研究者调查16个不同地区在某一固定时期内到中心医院的就诊率,同时测量了每一地区中心点到医院的距离,结果如表所示:
16个地区到中心医院的距离和就诊率
地区编号 1 2 3 4 5 6
距离(km)(X) 6.8 10.3 1.7 14.2 8.8 5.8
就诊率% (Y) 21 12 30 8 10 26
14
7 8 9 10 11 12 13 14 15 16 2.1 3.3 4.3 9.0 3.2 12.7 8.2 7.0 5.1 4.1 42 31 21 15 19 6 18 12 23 34
(1) 请用该数据进行回归分析。 (2) 求回归系数的95%置信区间。
51. 为何总体回归线置信带的上下缘是对称于回归线的两条弧形线,而不是平行线?
52. 为何个体值预测带的上下缘曲线要比回归线置信带的上下缘曲线离回归直线更远?
53. 什么是回归系数的标准误?什么是预测值的标准误?后者如何受前者影响?
(1)如果X的均数为20,Y的均数为50,X与Y的相关系数为r,试写出Y依X的回归方程。
(2)用如下年龄与血红蛋白的检测数据分别拟合简单线性、二次与三次多项式,并评价何种模型为优?
年龄
6
8
10
12
14
16
18
20
22
HB(克%) 10.41 10.80 10.85 10.36 10.31 10.68 10.82 11.04 11.20
(3)某一食品中不同维生素E含量(X)对小白鼠喂养三月后的增重(Y)数据如下,试问用何种回归模型最能描述其关系?
X Y
0.34 0.62
0.29 0.35
0.28 0.75
0.42 1.35
0.29 0.48
0.40 0.92
0.66 6.35
0.74 5.98
0.45 2.32
0.60 1.15
(4)观察某地破伤风预防接种率与发病率数据如下表所示,试问:何种回归模型最能综合表达该地破伤风发病率(Y)与预防接种率(X)的关系?
接种率X 0.00 发病率Y 8.70
0.10 7.80
0.20 5.59
0.32 3.53
0.50 2.18
0.66 1.98
0.72 1.85
0.78 1.50
1.00 1.35
54.给定R2=.44,N =50,k = 12,试计算调整确定系数Ra2。
15
55.在多重回归分析中,将某一自变量(Xi)的值乘以10,会对该自变量的回归系数产生何种影响?如果是对自变量值乘以10,又会对标准化回归系数产生何种影响?
56.考虑有四个与某疾病有关的因素与该病的患病率资料如表所示,试用该数据进行多重回归分析。
某疾病的患病率与四个影响变量
X1 17 4 8 11 7 11 4 2 1 25 2 12 10 7 1 12 4
X2 25 56 42 32 52 58 67 34 20 47 42 66 67 26 29 56 62
X3 14 24 12 9 7 10 15 20 18 6 24 12 9 6 15 9 37
X4 26 38 27 48 34 24 6 46 56 30 42 14 13 60 52 21 25
患病率(%)
Y 56.9 87.4 65.4 88.5 96.2 109.2 103.3 82 98.7 115.8 82.6 120.3 108.8 78.5 74.3 102.2 78.8
57.获得年龄与血红蛋白测量数据如下,试用该数据拟合简单线性、二次、三次多项式模型,并评价模型的拟合优度。
年龄中值 HB(g%)
6 8 10 12 14 16 18 20 22 10.41 10.80 10.85 10.36 10.31 10.68 10.82 11.04 11.20
58. 如表是随机抽取的11名儿童的智力测试数据,试以IQ为因变量拟合多重线性回归模型。并讨论本例应用回归分析所存在的问题。
儿童智力测试数据
常识
算术
理解
拼图
积木
译码
IQ
X1
14 10 12 7 13 19
X2
13 14 12 8 12 15
X3
28 15 19 7 24 23
X4
14 14 13 9 12 16
X5
22 34 24 20 26 24
X6
39 35 39 24 38 38
Y 54 37 28 19 36 28
16