专题限时集训(七) 回归分析、独立性检验
(对应学生用书第91页)
(限时:40分钟)
题型1 回归分析 题型2 独立性检验 一、选择题 1.(2017·石家庄一模)下列说法错误的是( )
【导学号:07804050】
A.回归直线过样本点的中心(x,y)
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.对分类变量X与Y,随机变量K的观测值k越大,则判断“X与Y有关系”的把
握程度越小
^^
D.在回归直线方程y=+中,当解释变量x每增加1个单位时,预报变量y就增加个
单位
C [根据相关定义知选项A,B,D均正确;选项C中,对分类变量X与Y,随机变量
2
1,3,5,6,7,9,10,11,12,14 2,4,8,13 K2的观测值k越大,对判断“X与Y有关系”的把握程度越大,故C错误.选C.]
2.(2017·湖南名校联考)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过
查阅下表来确定“X和Y有关系”的可信度.如果k>,那么有把握认为“X和Y有关系”的百分比为
P(K2>k0) k0 % C.%
B.75% D.95%
D [由图表中数据可得,当k>时,有的几率说明这两个变量之间的关系是不可信的,即有1-=的几率,也就是有95%的把握认为变量之间有关系,故选D.]
3.(2017·湖北七市联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的
广告费x和销售额y进行统计,得到统计数据如下表(单位:万元):
广告费x 2 3 4 5 6 销售额y 29 41 50 59 71 ^^由上表可得回归方程为y=+a,据此模型,预测广告费为10万元时销售额约为( )
【导学号:07804051】
A.万元 C.万元
B.万元 D.万元
11C [根据统计数据表,可得x=×(2+3+4+5+6)=4,y=×(29+41+50+59
55^^^^
+71)=50,而回归直线y=+a经过样本点的中心(4,50),∴50=×4+a,解得a=,^^
∴回归方程为y=+,∴当x=10时,y=×10+=,故选C.]
4.(2017·佛山二模)现行普通高中学生在高一升高二时面临着选文理科的问题,学校抽取
了部分男、女学生意愿的一份样本,制作出如图7-7所示的两个等高堆积条形图.
图7-7
根据这两幅图中的信息,下列哪个统计结论是不正确的( ) A.样本中的女生数量多于男生数量
B.样本中有理科意愿的学生数量多于有文科意愿的学生数量 C.样本中的男生偏爱理科 D.样本中的女生偏爱文科
D [由图2知,样本中的女生数量多于男生数量,样本中的男生、女生均偏爱理科;由图1知,样本中有理科意愿的学生数量多于有文科意愿的学生数量,故选D.] 5.(2016·汕头模拟)对四组不同数据进行统计,分别获得以下散点图,如果对它们的相关
系数进行比较,下列结论中正确的是( )
图7-8(1)
图7-8(2)
图7-8(3)
图7-8(4)
A.r2<r4<0<r3<r1 C.r4<r2<0<r3<r1
B.r4<r2<0<r1<r3 D.r2<r4<0<r1<r3
A [由给出的四组数据的散点图可以看出,图(1)和图(3)是正相关,相关系数大于0,图(2)和图(4)是负相关,相关系数小于0,图(1)和图(2)的点相对更加集中,所以相关性要强,所有r1接近于1,r2接近于-1,由此可得r2<r4<r3<r1.故选A.] 6.(2017·南昌一模)设某中学的高中女生体重y(单位:kg)与身高x(单位:cm)具有线性相
关关系,根据样本数据(xi,yi)(i=1,2,3,…,n),用最小二乘法近似得到回归直线方^
程为y=-,则下列结论中不正确的是( ) A.y与x具有正线性相关关系 B.回归直线过样本点的中心(x,y)
C.若该中学某高中女生身高增加1 cm,则其体重约增加0.85 kg D.若该中学某高中女生身高为160 cm,则可断定其体重必为50.29 kg
^
D [因为回归直线方程y=-中x的系数为>0,因此y与x具有正线性相关关系,所以选项A正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(x,y),所以选项B正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,若该中学某高中女生身高增加1 cm,则其体重约增加0.85 kg,所以选项C正确,选项D不正确.]
7.在用线性回归方程研究四组数据的拟合效果中,分别作出下列四个关于四组数据的残差
图,则用线性回归模式拟合效果最佳的是( )
A
B
C
D
C [当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好,对比4个残差图,易知选