2018版高考数学二轮复习第1部分重点强化专题专题3概率与统计专题限时集训7回归分析独立性检验理 下载本文

项C的图对应的带状区域的宽度越窄.故选C.]

8.(2017·江西南城一中、高安中学第九校3月联考)随着国家二孩政策的全面放开,为了

调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.

愿生 不愿生 合计 由K=

2

非一线 45 13 58 一线 20 22 42 2

合计 65 35 100 2

a+bnad-bc2c+da+c100×45×22-20×13,得K=b+d65×35×58×42

≈.

参照下表,

P(K2≥k) k 正确的结论是( ) A.在犯错误的概率不超过%的前提下,认为“生育意愿与城市级别有关” B.在犯错误的概率不超过%的前提下,认为“生育意愿与城市级别无关” C.有99%以上的把握认为“生育意愿与城市级别有关” D.有99%以上的把握认为“生育意愿与城市级别无关” C [K≈>,

∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.] 二、填空题

9.(2017·汉中二模)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表

^

中的实验数据,计算得回归直线方程为y=-.由以上信息,可得表中c的值为________.

【导学号:07804052】

天数x 繁殖数量y(千个) 6 [x=

3 4 3 5 4 6 7 2

c 3+4+5+6+7=5,y=错误!=错误!,代入回归直线方程,得错误!=

5

×5-,解得c=6.]

10.(2017·安徽百校联盟二模)已知x、y的取值为:

x y 1 5 2 6 3 7 4 8 5 10 ^^

从散点图可知y与x呈线性相关关系,且回归直线方程为y=+a,则当x=20时,y的取值为________.

27.6 [由表格可知x=3,y=,所以这组数据的样本点的中心是(3,,根据样本点的中

^^^

心在回归直线上,得=a+×3,得a=,所以这组数据对应的回归直线方程是y=+,将

x=20代入,得y=×20+=.]

11.(2017·山西太原五中一模)某小卖部销售某品牌的饮料的零售价与销量间的关系统计如

下:

单价x(元) 销量y(瓶) 50 44 43 40 35 28 ^^^^已知x,y的关系符合回归方程y=bx+a,其中b=-20.若该品牌的饮料的进价为2元,为使利润最大,零售价应定为________元. 3.75 [x=,y=40,

^

∴a=40-(-20)×=110,

^

∴回归直线方程为:y=-20x+110,

利润L=(x-2)(-20x+110)=-20x+150x-220, 150

∴x==元时,利润最大,

40故答案为.]

12.(2017·哈尔滨三中二模)以模型y=ce(e为自然对数的底)去拟合一组数据时,为了求

出回归直线方程,设z=ln y,其变换后得到线性回归方程为z=+2,则c=________. e [∵y=ce,

∴两边取对数,可得ln y=ln(ce)=ln c+ln e=ln c+kx, 令z=ln y,可得z=ln c+kx, ∵z=+2, ∴ln c=2, ∴c=e.] 三、解答题

13.(2017·石家庄一模)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、

女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如图7-9所示的茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.

2

2

2

kxkxkxkx

图7-9

(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过的前提下认为此项血液指标与性别有关系?

(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望. 附:K=

2

a+bnad-bc2

c+da+c b+d,其中n=a+b+c+d.

P(K2≥k0) k0 [解] (1)由茎叶图可得2×2列联表: 男性 女性 合计 正常 16 12 28 偏高 4 8 12 40×16×8-4×12=b+d20×20×28×12

2合计 20 20 40 ≈<,

K=

2

a+bnad-bc2c+da+c所以不能在犯错误的概率不超过的前提下认为此项血液指标与性别有关系. 43

(2)由样本数据可知,男性正常的概率为,女性正常的概率为. 55此项血液指标为正常的人数X的可能取值为0,1,2,3,4,

24

32

4

????P(X=0)=?1-??1-?=,

?5??5?625

2

5?

5??

5?

2

4?4??3??4?13?3?44

P(X=1)=C1, 2?1-??1-?+?1-?C2·?1-?=

?5?5?5?625

223?4?4?

3

22169

1P(X=2)=???1-?+C1, 2?1-?·C2·?1-?+?1-???=

5??5?5?5?5?5??625?5??5?

?4??

?

3??4??3?2

4?

4??3?

2

1

P(X=3)=C1, 2?1-???+??C2·?1-?=

5?6255?5??5??5?5?

?4?3?3?264

22144

P(X=4)=????=,

?5??5?625

所以X的分布列为

?4??3?X P 0 4 6251 44 6252 169 6253 264 6254 144 625444169264144所以E(X)=0×+1×+2×+3×+4×=.

625625625625625

14.(2017·湖南三湘名校联盟三模)为了研究一种昆虫的产卵数y和温度x是否有关,现收

集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:y=C1x+C2与模型②:y=eC3x+C4作为产卵数y和温度x的回归方程来建立两个变量之间的关系.

温度x/℃ 产卵数y/个 20 6 400 22 10 484 24 21 576 26 24 676 28 64 784 30 113 900 32 322 1024 2

t=x2 z=ln y x 26 t 692 y 80 z 错误! 错误! 错误! 错误! n2

n 其中ti=xi,t=∑ti,zi=ln yi,z=∑zi,

i=1

i=1

^^^

附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=βu+α的斜率