4.建立了回归方程,且回归系数b有统计意义,就可认为两变量间存在因果关系。
5.对于双变量正态分布资料,同一样本的相关系数及回归系数与0的差别的统计检验结论一致。( ) 二.选择题
1.同样性质研究工作的两组资料中,回归系数b1>b2时,第1组______。 A.样本相关系数r也较大
B.资料X的变化引起的Y变化幅度比第2组大 C.对样本回归系数作检验的t值也较大
D.资料中X的变化引起的Y变化(幅度)是否大于第2组还不一定 2.对样本相关系数作统计检验,结果r > r0. 05(ν),统计结论是 。 A.肯定两变量为直线关系 B.认为两变量有线性关系 C.两变量不相关 D.两变量无线性相关 3.若r1 > r0. 05(ν),则可认为 。 , r2 > r0. 01(ν)
A.第一组资料两变量关系密切 B.第二组资料两变量关系密切
C.难说哪一组资料中两变量关系更密切 D.两组资料中两变量关系密切程度不一样 4.若对样本回归系数作统计检验,P<0.05,则可认为 。 A.两变量间不存在回归关系 B.两变量间存在线性回归关系 C.两变量间不会是曲线关系 D.两变量间无线性相关 5.相关分析可以用于 有无关系的研究。 A.性别与体重 B.肺活量与胸围 C.职业与血型 D.国籍与智商 6.对X、Y两个变量作直线回归分析的条件之一是______。
A.要求X、Y呈双变量正态分布 B.只要求X服从等方差正态分布 C.只要求Y服从等方差正态分布 D.只要求X、Y是定量变量 7._______,回归方程拟合得愈好。
A.回归系数愈大 B.回归系数愈小
C.决定系数愈大 D.回归系数愈大,决定系数愈小 8.直线回归方程不能用于______
A.描述两个变量间的数量关系 B.对应变量Y进行预测
C.对应变量Y的控制提供信息 D.表示两个变量间关系的密切程度 9.如果直线相关系数r=1,则一定有_____
A.SS总=SS残 B.SS残=SS回 C.SS总=SS回 D.SS总> SS回
10.直线回归中,如果自变量X乘以一个不为0或1的常数,则有_____
A.截距改变 B.回归系数改变 C.两者都改变 D.两者都不改变
11.某环保科用甲乙两种方法同时测定污染水中溶解氧含量,在建立以容易测定的甲法结果推算乙法测定值的直线回归方程前,应首先_____
A.画出标准曲线 B.计算测定结果的均数
37
C.以测定值绘制散点图 D.以测定值输入计算机进行指标计算
12.某省调查了2万名高血压患者收缩压Y(kPa)与吸烟量X(支/日)情况,拟合直线回归方程
??12+0.004x,相关系数r=0.356 P<0.01,r2=0.1253,可认为______ yA.吸烟是导致收缩压增高的一个原因 B.收缩压增高是由于吸烟而引起的
C.收缩压高低与吸烟量大小密切相关 D.收缩压总变异中有12.53%可由吸烟量变化来解释
三、简答题
1.相关系数和回归系数的联系和区别? 2.直线回归分析时怎样确定自变量和因变量?
3.试总结从样本数据判断总体回归系数是否成立的统计方法有哪些?
4.某医师将|r|划分为三个等级0~,0.3~,0.7~分别表示低、中、高度相关,你是否同意这种划分,为什么?
四、分析计算题
1.某医师欲研究污染源距离与尘氟浓度的数量关系,测得离污染源距离与尘氟浓度数据见下表,请分析两者存在什么数量关系?
离污染源距离
(m) 尘氟浓度 (0.01 mg/m3)
2.某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量(g)和增加体重(g)的数据如下:
鼠号 进食量(g) 体重增加(g)
1 800 185
2 780 158
3 720 130
4 867 180
5 690 134
6 787 167
7 934 186
8 750 133
4.5
3.7
3.2
2.4
2.0
1.5
1.2
0.7
200
300
400
500
600
700
800
1000
(1)此资料有无可疑的异常点?
(2)求直线回归方程并对回归系数作假设检验。
(3)试估计进食量为900g时,大白鼠的体重平均增加多少,计算其95%的可信区间,并说明其含义。 (4)求进食量为900g时,个体Y值得95%允许区间,并解释其意义。 3.10例糖尿病病人血糖(mmol/L)与胰岛素水平(mu/L)的测定值如下表。
病例号 血糖Y 胰岛素X
1
2
3 7.88 19.8
4
5
6 6.44 25.1
7 10.16 22.0
8 8.49 23.2
9
10
12.21 12.27 15.2
11.9
10.43 19.59 17.0
5.9
11.38 12.49 16.8
13.7
(1)试以血糖为应变量Y,胰岛素为自变量X建立回归方程,并对回归方程进行假设检验。(2)现已知一糖尿病病人胰岛素水平为15(mu/L),试预测其血糖水平。(α=0.05)
(3)预将病人血糖水平控制在正常范围的上界,即6.66mmol/L以内时,血中胰岛素应维持在什么水平
38
上?(α=0.05)
4.某人研究以纸箱装的安瓿在空运后的损坏情况,某一种用于医学研究的药品,每次空运一纸箱(1000安瓿),下表三是10次运输后破损记录,其中X表示运输过程中纸箱转换飞机的次数,Y表示空运到达目的地后安瓿破损数量,假设一元线性回归方程是适用的。
运次
1
2
3 7.88 19.8
4
5
6 6.44 25.1
7 10.16 22.0
8 8.49 23.2
9
10
X Y
12.21 12.27 15.2
11.9
10.43 19.59 17.0
5.9
11.38 12.49 16.8
13.7
(1)求回归方程。并分析拟合线性回归方程好吗? (2)当转换次数X=1时,求安瓿破损期数的点估计值。
(3)如果纸箱两次转换飞机,估计安瓿破损的期望值比转换一次时增加了多少? (4)验证回归线通过(x,y)。
参考答案
二、选择题
1.D 2.B 3.C 4.B 5.B 6.C 7.C 8.D 9.C 10.B 11.C 12.D 四、分析计算题
1.SPSS主要输出结果如下:
相关分析结果:
Correlations 距离 尘氟浓度 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 距离 1 . 8 -.979(**) .000 8 尘氟浓度 -.979(**) .000 8 1 . 8 ** Correlation is significant at the 0.01 level (2-tailed).
??5.479?-0.979X(X为离污染源距离,Y为尘氟浓度) 求得直线方程Y经假设检验可以认为离污染源距离与尘氟浓度有直线关系。 2. SPSS主要输出结果 散点图: 相关分析结果:
Correlations 进食量
Pearson Correlation Sig. (2-tailed) N 进食量 1 . 8 39
体重增加 .854(**) .007 8 体重增加 Pearson Correlation Sig. (2-tailed) N .854(**) .007 8 1 . 8 ** Correlation is significant at the 0.01 level (2-tailed)
(1)由散点图及回归直线综合分析,点(800,185)可视为异常点。
??0.261?47.353X (2)求得直线方程Y经假设检验可以认为进食量与增重有直线关系。 (3)Y=187.574
???Y?的95%可信区间:(Y-t0.05,6SY?,Y+t0.05,6SY?)=(166.67,208.48)
即估计总体中,进食量为900克,大白鼠平均增加体重在187.574g,95%可信区间(166.67,208.48)。
??(4)Y值的95%的允许区间:(Y-t0.05,6SY,Y+t0.05,6SY)=(148.42,226.73)
即估计总体中,进食量为900克,有95%的大白鼠增加体重在148.42~226.73g。
3. SPSS主要输出结果 散点图: 相关分析结果:
Correlations 血糖 胰岛素 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 血糖 1 . 10 -.931(**) .000 10 胰岛素 -.931(**) .000 10 1 . 10 ** Correlation is significant at the 0.01 level (2-tailed).
??21.05?0.58X。 (1)回归方程 :Y(2)95%可信限:(8.95,15.72)。 (3)应控制胰岛素X≥30.34(mu/L)。
4.SPSS主要输出结果 散点图: 相关分析结果:
Correlations 换机次数
Pearson Correlation Sig. (2-tailed) N 换机次数 1 . 10 40
破损数量 -.931(**) .000 10