代入公式(10-2)得:
由公式(10-1)计算相关系数
下面采用t检验法对相关系数进行检验。 (1) 建立检验假设
,即身高与体重之间不存在相关关系 , 即身高与体重之间存在相关关系
(2) 计算统计量
(3) 查界值表,得统计结论
查t界值表,得 , ,按 水准,拒绝H0,接受H1,可以认为女青年身高与体重之间存在正相关关系。
2. 某医师研究某种代乳粉价值时,用大白鼠做实验,得大白鼠进食量和体重增加量的资料如下,试问大白鼠的进食量与体重的增加量之间有无关系?能否用大白鼠的进食量来估计其体重的增加量?
大白鼠进食量和体重增加量的资料 动物编号 1 2 3 4 5 6 7 8 9 10 11
进食量(g) 820 780 720 867 690 787 934 679 639 820 780 增重量(g) 165 158 130 180 134 167 186 145 120 150 135 [参考答案]
进食量为X,增重量为Y。
由公式(10-2)计算可得:
由公式(10-1)计算相关系数:
下面用r检验法对相关系数进行检验: 由r=0.881,n=11,v=11-2=9
查r界值表,得r0.005/2,9=0.776,因r>r0.005/2,9,故P<0.005, 按 水准,拒绝H0,接受H1,可以认为大白鼠的进食量与体重增加量之间存在正相关关系。
我们根据上表得数据绘制散点图,见下图,可以看出大白鼠的进食量与增重量有明显的直线趋势,我们考虑建立二者之间的线性回归方程。 由上述计算
代入公式(10-5)和(10-6)得:
则回归方程为:
图 大白鼠的进食量与增重量之间关系散点图 最后我们采用方差分析法对回归方程作检验: (1) 建立假设检验: ,
(2) 由计算可得:
(3) 查界值表,得统计结论
查F界值表, , , P<0.01,拒绝H0, 接受H1,说明大白鼠的进食量与体重增加量之间存在线性回归关系,也就是说,可以用大白鼠的进食量来估计其体重的增加量。
3. 测得347名13岁健康男童的身高和体重,身高均数为146.4cm,标准差为8.61cm,体重均数为37.04kg,标准差为6.67kg。身高和体重的相关系数r=0.74,试计算由身高推体重的回归系数及由体重推身高的回归系数。 [参考答案]
身高为X,体重为Y。 由题意,
由身高推体重的回归系数为b1,则
由体重推身高的回归系数为b2,则
4. 某防治所作病因研究,对一些地区水质的平均碘含量(μg/l)与地方性甲状腺肿患病率进行了调查,结果如下表,试问甲状腺肿患病率与水质中碘的含量有无相关关系? 局部地区水质的平均碘含量(μg/l)与地方性甲状腺肿患病率 地区编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
患病率(%) 40.5 37.7 39.0 20.0 22.5 37.4 31.5 15.6 21.0 6.3 7.1 9.0 4.0 5.4 碘含量(μg/l) 1.0 2.0 2.5 3.5 3.5 4.0 4.4 4.5 4.6 7.7 8.0 8.0 8.3 8.5 [参考答案]
甲状腺肿患病率为Y,水质中碘含量为X。
① 将X,Y分别从小到大编秩,见下表(3)、(5)两栏; ② 计算差数d,见(6)栏; ③ 计算 ,见(7)栏, ; ④代入公式(10-18)计算rs
下面对rs进行检验 (1)建立假设检验
(2) 计算统计量 rs=-0.912 (3) 结论
当 时,查附表12中的等级相关系数rs界值表。
由于 ,拒绝H0,接受H1,可认为甲状腺肿患病率与水质中碘的含量存在负相关关系。 不同地区水质中碘含量( )与甲状腺肿患病率(%) 地区编号
(1) 水质中碘含量 甲状腺肿患病率 d (6) d2 (7) X
(2) 秩次 (3) Y (4) 秩次 (5)
1 1.0 1 40.5 14 -13 169 2 2.0 2 37.7 12 -10 100 3 2.5 3 39.0 13 -10 100 4 3.5 4.5 20.0 7 -2.5 6.25 5 3.5 4.5 22.5 9 -4.5 20.25 6 4.0 6 37.4 11 -5 25 7 4.4 7 31.5 10 -3 9 8 4.5 8 15.6 6 2 4 9 4.6 9 21.0 8 1 1 10 7.7 10 6.3 3 7 49
11 8.0 11.5 7.1 4 7.5 56.25 12 8.0 11.5 9.0 5 6.5 42.25 13 8.3 13 4.0 1 12 144 14 8.5 14 5.4 2 12 144 (闫岩)
第十一章 多元线性回归与多元逐步回归 练 习 题
一、单项选择题
1. 在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是 A.节省样本 B.提高分析效率
C.克服共线影响 D.减少异常值的影响 E.减少混杂的影响
2. 多元线性回归分析中,反映回归平方和在应变量 的总离均差平方和中所占比重的统计量是
A. 简单相关系数 B .复相关系数 C. 偏回归系数 D. 回归均方 E. 决定系数
3. 对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是
A.决定系数 B. 相关系数 C. 偏回归平方和 D. 校正决定系数 E. 复相关系数
4. 多元线性回归分析,对回归方程作方差分析,检验统计量F值反映的是 A.所有自变量与应变量间是否存在线性回归关系 B.部分自变量与应变量间是否存在线性回归关系 C.自变量与应变量间存在的线性回归关系是否较强 D.自变量之间是否存在共线 E. 回归方程的拟合优度
5. 在多元回归分析中,若对某个自变量的值都乘以一个常数 ( ),则 A. 偏回归系数不变、标准回归系数改变 B. 偏回归系数改变、标准回归系数不变 C.偏回归系数与标准回归系数均不改变 D.偏回归系数与标准回归系数均改变 E.偏回归系数和决定系数均改变 答案:E E D A B 二、计算与分析
?计算复相关系数与决定系数;?对回归方程作检验;?试建立年龄、身高与体重的二元回归方程;?1.某种特殊营养缺乏状态下,儿童年龄(岁)、身高(cm)与体重(kg)测定结果见下表, 计算年龄和身高的标准偏回归系数。
营养缺乏儿童年龄、身高、体重测定值 编号i 1 2 3 4 5 6 7 8 9 10 11 12
身高X1 145 150 124 157 129 127 140 122 107 107 155 148 年龄X2 8 10 6 11 8 7 10 9 10 6 12 9
体重Y 29 32 24 30 25 26 35 26 25 23 35 31 [参考答案] (1) 参数估计
模型 变量 偏回归系数 标准误 标准化偏回归系数 t P 1 常数 2.114 5.048 0.419 0.685
0.135 0.047 0.564 2.863 0.019
0.923 0.434 0.419 2.126 0.062 回归方程为: (2) 方差分析
变异来源 离均差平方和 自由度 均方差 F P 回归 150.884 2 75.442 16.154 0.001 误差 42.033 9 4.670 总变异 192.917 11
从上表可见,F = 16.154, P < 0.001, 此回归方程有统计学意义。