(2)求出回归系数 , ,写出回归方程,利用回归方程求出 ≥5.2时x的取值范围,进而解决问题. 解:(1)变量y与x的相关系数r≈
.
≈0.95,
. . 变量z与x的相关系数r'≈
.
≈0.99,
. . 可以看出TC指标值与BMI值,GLU指标值与BMI值都是高度正相关. (2)设y与x的线性回归方程是 = x+ , 根据所给的数据,计算得 = .
≈0.12, =6-0.12×33=2.04,
所以y与x的线性回归方程是 =0.12x+2.04. 令0.12x+2.04≥5.2,可得x≥26.33.
所以,据此模型分析当BMI值达到26.33时,需要注意监控总胆固醇偏高情况的出现. 变式题 解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 =-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为 =99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型 =99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. (以上给出了2种理由,答出其中任意一种或其他合理理由均可)
例3 [思路点拨] (1)由题得到2×2列联表,将列联表中的数据代入公式计算出K2的观测值k,即可判断是否有99%的把握认为“该企业生产的这种产品合格与设备改造有关”;(2)求出设备改造前后产品为合格品的频率,用频率估计概率,判断哪种设备性能更好;(3)用频率估计概率,计算1000件产品中合格品、不合格品大约有多少件,进而求出该企业获利的估计值. 解:(1)由题得到2×2列联表如下:
设备改造前 设备改造后 总计 合格品 不合格品 总计 172 28 200 192 8 200
364 36 400 则K的观测值
2
- -
k= =
≈12.21.
因为12.21>6.635,所以有99%的把握认为“该企业生产的这种产品合格与设备改造有关”. (2)由题可知,设备改造后产品的合格率约为
=96%,设备改造前产品的合格率约为=86%,即设备 改造后产品的合格率更高,因此,设备改造后性能更好.
(3)用频率估计概率,1000件产品中大约有960件合格品,40件不合格品, 因为180×960-100×40=168 800,所以该企业大约能获利168 800元.
变式题 A [解析] 由K2的观测值k≈7.8>6.635,得有99%以上的把握认为“选择过马路的方式与性别有关”.
【备选理由】 例1考查线性回归方程的求法;例2考查独立性检验.
例1 [配例2使用]如图是某地2011年至2017年年生活垃圾无害化处理量(单位:万吨)的折线图.
注:年份代码1~7分别对应年份2011~2017.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)求y关于t的线性回归方程(系数精确到0.01),并预测2019年该地生活垃圾无害化处理量. 附注:
参考数据: yi=9.32, tiyi=40.17,
- =0.55, ≈2.646.
参考公式:相关系数r= , - -
- -
回归直线 = + t中斜率和截距的最小二乘估计分别为:
- -
-
= , = - .
解:(1)由折线图中数据和附注中参考数据得
=4, (ti- )2=28, - =0.55,
(ti- )(yi- )= tiyi- yi=40.17-4×9.32=2.89,
则r= . .
≈≈0.99.
. . . 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度很高,所以可以用线性回归模型拟合y与t的关系.
- - . .
(2) =≈1.331, = = ≈0.103,
-
则 = - ≈1.331-0.103×4≈0.92.
所以,y关于t的线性回归方程为 =0.92+0.10t.
将2019年对应的年份代码t=9代入线性回归方程,得 =0.92+0.10×9=1.82, 所以预测2019年该地生活垃圾无害化处理量约为1.82万吨.
例2 [配例3使用] [2018·广东江门一模] 为探索课堂教学改革,江门某中学数学老师用传统教学和
“导学案”教学两种教学方式,分别在甲、乙两个平行班进行教学实验.为了解教学效果,期末考试后,分别从两个班级各随机抽取20名学生的成绩(单位:分)进行统计,得到如下茎叶图.记成绩不低于70分者为“成绩优良”.
(1)请大致判断哪种教学方式的教学效果更佳,并说明理由.
(2)构造一个教学方式与成绩是否优良的2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩是否优良与教学方式有关”?
附:K2
-
= ,其中
n=a+b+c+d是样本容量.
独立性检验临界值表:
P(K2≥k0) k0 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635
解:(1)乙班(“导学案”教学方式)教学效果更佳.
理由①:乙班学生的成绩大多在70分以上,甲班学生的成绩在70分以下的明显更多. 理由②:甲班样本的平均数为70.2,乙班样本的平均数为79.05. 理由③:甲班样本的中位数为(2)2×2列联表如下:
成绩优良 成绩不优良 总计 传统教学 10 10 20
=70,乙班样本的中位数为=77.5. “导学案”教学 16 4 20 总计 26 14 40 由上表可得K的观测值
2
-
k= ≈3.956>3.841,
所以能在犯错误的概率不超过0.05的前提下认为“成绩是否优良与教学方式有关”.