12.(2019·长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
月份 广告投入量/万元 收益/万元 他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
x 7
y 30 1 2 14.21 2 4 20.31 3 6 31.8 4 8 31.18 5 10 37.83 6 12 44.67 ?xiyi i=16?x2i i=161 464.24 364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由. (2)残差绝对值大于2的数据被认为是异常数据,需要剔除:(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?
^^^
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距
? ?xi-x??yi-y??xiyi-nx y
^
的最小二乘估计分别为:b=
i=1
n
i=1
nn
=?2
? ?xi-x
i=1
?x2i-nx
i=1
n
^^
,a=y-bx.
2
B组
1.某地一商场记录了12月份某5天当中某商品的销售量y(单位:kg)与该地当日最高气温x(单位:℃)的相关数据,如下表:
x y 11 7 9 8 8 8 5 10 2 12 ^^^(1)试求y与x的回归方程y=bx+a;
(2)判断y与x之间是正相关还是负相关;若该地12月某日的最高气温是6 ℃,试用所求回归方程预测这天该商品的销售量;
(3)假定该地12月份的日最高气温X~N(μ,σ2),其中μ近似取样本平均数x,σ2近似取样本方差s2,试求P(3.8 附:参考公式和有关数据 ??xy-nx y? ?x-x??y-y??^b==,??x-nx? ?x-x??^^ ?a=y-bx, n n ii i i i=1 i=1 n 2i 2 n i 2 i=1 i=1 10≈3.2,3.2≈1.8,若X~N(μ,σ2),则P(μ-σ 2.电影公司随机收集了电影的有关数据,经分类整理得到下表: 电影类型 电影部数 好评率 第一类 140 0.4 第二类 50 0.2 第三类 300 0.15 第四类 200 0.25 第五类 800 0.2 第六类 510 0.1 好评率是指:一类电影中获得好评的部数与该类电影的部数的比值. 假设所有电影是否获得好评相互独立. (1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率. (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率. (3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“ξk=1”表示第k类电影得到人们喜欢,“ξk=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差D(ξ1),D(ξ2),D(ξ3),D(ξ4),D(ξ5),D(ξ6)的大小关系. 3.(2019·重庆市七校联合考试)“黄梅时节家家雨”“梅雨如烟暝村树”“梅雨暂收斜照明”……江南梅雨的点点滴滴都流润着浓烈的诗情.每年六、七月份,我国长江中下游地区进入持续25天左右的梅雨季节,如图是江南Q镇2009~2018年梅雨季节的降雨量(单位:mm)的频率分布直方图,试用样本频率估计总体概率,解答下列问题: (1)“梅实初黄暮雨深”,请用样本平均数估计Q镇明年梅雨季节的降雨量; (2)“江南梅雨无限愁”,Q镇的杨梅种植户老李也在犯愁,他过去种植的甲品种杨梅,亩产量受降雨量的影响较大(把握超过八成),而乙品种杨梅2009~2018年的亩产量(单位:kg)与降雨量的发生频数(年)如2×2列联表所示(部分数据缺失),请你帮助老李排解忧愁,他来年应该种植哪个品种的杨梅受降雨量影响更小?(完善列联表,并说明理由) 降雨量 亩产量 <600 ≥600 总计 附:K2= n?ad-bc?2 ,其中n=a+b+c+d. ?a+b??c+d??a+c??b+d?P(K2≥k0) k0 0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 [200,400) 2 [100,200)∪[400,500] 1 总计 10