^
^
^
假设根据上表数据所得线性回归方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
^
^
^
^
A.b>b′,a>a′
^
^
B.b>b′,a ^ ^ C.ba′ 答案 C 解析 b′=2,a′=-2, D.b ^ i=1 ? ?xi-x??yi-y? 求得 i=1 6 由公式b= ? ?xi-x?2 6 ^ 5^13571b=,a=y-bx=-×=-, 76723^ ^ ^ ∴ba′.选C. 三、考查线性回归直线方程的应用 例3 某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 需求量/万吨 ^ ^ ^ 2006 236 2008 246 2010 257 2012 276 2014 286 (1)利用所给数据求年需求量与年份之间的线性回归方程y=bx+a; (2)利用(1)中所求出的线性回归方程预测该地2018年的粮食需求量. 解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求线性回归方程,先将数据处理如下: 年份-2010 需求-257 对处理的数据,容易算得x=0,y=3.2, ?-4?×?-21?+?-2?×?-11?+2×19+4×29-5×0×3.2b= ?-4?2+?-2?2+22+42-5×02^^ 260 ==6.5,a=y-b x=3.2. 40^ -4 -21 -2 -11 0 0 2 19 4 29 由上述计算结果,知所求线性回归方程为 ^ y-257=6.5(x-2010)+3.2, ^ 即y=6.5(x-2010)+260.2. (2)利用所求得的线性回归方程,可预测2018年的粮食需求量大约为6.5×(2018-2010)+260.2=6.5×8+260.2=312.2(万吨). 3 巧解非线性回归问题 如果题目所给样本点的分布不呈带状分布,即两个变量不呈线性关系,那么,就不能直接利用线性回归方程建立两个变量之间的关系,这时我们可以把散点图和已经学过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出与这些散点拟合最好的函数,然后利用变量置换,把非线性回归方程问题转化为线性回归方程的问题来解决,这是解决此类问题的通法,体现了转化思想. 一、案例分析 例 一个昆虫的某项指标和温度有关,现收集了7组数据如下表: 温度x/℃ 某项指标y 试建立某项指标y关于温度x的回归模型,并判断你所建立的回归模型的拟合效果. 分析 根据表中的数据画出散点图,再由图设出相应的回归模型. 解 画出散点图如图所示,样本点并没有分布在某个带状区域内,而是分布在某一条二次函数曲线y=Bx2+A的周围. 2 5.790 3 6.810 4 8.199 5 10.001 6 12.190 7 14.790 8 17.801 令X=x2,则变换后的样本点应该分布在y=bX+a(b=B,a=A)的周围. 由已知数据可得变换后的样本数据表: X 某项指标y ^ 4 5.790 9 6.810 16 8.199 25 10.001 36 12.190 49 14.790 64 17.801 计算得到线性回归方程为y =0.199 94X+4.999 03. 用x替换X,得某项指标y关于温度x的回归方程y =0.199 94x2+4.999 03. 计算得R2≈0.999 997,几乎为1,说明回归模型的拟合效果非常好. 点评 本题是非线性回归分析问题,解决这类问题应该先画出散点图,把它与我们所学过的函数图象相对照,选择一种跟这些样本点拟合最好的函数,然后采用适当的变量变换转化为线性回归分析问题,使之得以解决. 2 ^ 二、知识拓展 常见的非线性函数转换方法: (1)幂型函数y=axm(a为正数,x,y取正值) 解决方案:对y=axm两边取常用对数,有lg y=lg a+mlg x,令u=lg y,v=lg x,则原式可变为u=mv+lg a,其中m,lg a为常数,该式表示u,v的线性函数. (2)指数型函数y=c·ax(a,c>0,且a≠1) 解决方案:对y=cax两边取常用对数,则有lg y=lg c+xlg a,令u=lg y,则原式可变为u=xlg a+lg c,其中lg a和lg c为常数,该式表示u,x的线性函数.与幂函数不同的是x保持不变,用y的对数lg y代替了y. k (3)反比例函数y=(k>0) x 1 解决方案:令u=,则y=ku,该式表示y,u的线性函数. x(4)二次函数y=ax2+c 解决方案:令u=x2,则原函数可变为y=au+c,该式表示y,u的线性函数. (5)对数型函数y=clogax 解决方案:令x=au,则原函数可变为y=cu,该式表示y,u的线性函数. 4 两个变量线性相关的判法汇总 一、由散点图判断两个变量线性相关 例1 “阿曼德披萨”是一个制作和外卖意大利披萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺某季度的销售额与店铺附近地区大学生人数的关系,随机抽取十个分店的样本,得到数据如下: 店铺编号 1 2 3 4 5 6 7 8 9 10 区内大学生数x(万人) 0.2 0.6 0.8 0.8 1.2 1.6 2 2 2.2 2.6 某季度销售额y(万元) 5.8 10.5 8.8 11.8 11.7 13.7 15.7 16.9 14.9 20.2 (1)画出散点图,并判断各店铺该季度的销售额y与店铺附近地区大学生人数x是否具有线性相关关系? (2)若具有线性相关关系,求回归方程,然后再进一步根据回归方程预测一个区内大学生有1万人的店铺的季度销售额. 分析 先根据表中的数据画出散点图,然后判断是否具有线性相关关系,若具有线性相关关系,再根据所给的数据求出线性回归方程,最后进行预测. 解 (1)散点图如图所示. 由散点图可以看出:这些点分布在一条直线的附近. 所以各店铺该季度的销售额y与店铺附近地区大学生人数x具有线性相关关系. (2)由表中数据可知x=1.4,y=13, x2i-10i=1 ? 10 x=5.68,?xiyi-10x y=28.4. i=1 2 10 ^ 28.4 所以b ==5,a=13-5×1.4=6. 5.68 ^ ^ 因此回归方程是y=5x+6. ^ 当x=1时,y=5×1+6=11,即区内大学生有1万人的店铺的季度销售额约为11万元. 评注 本题根据线性回归方程进行预测,这要求同学们具备一定的数据分析、推测能力.通过学习,体会数据收集、分析在现实生活中的作用. 二、由样本相关系数判断两个变量线性相关 例2 2010年4月14日青海省玉树县发生7.1级大地震,为了抗震救灾,某工厂需大批生产帐篷支援灾区,工厂为了规定工时定额,需要确定加工帐篷所花费的时间,为此进行了10次试验,测得的数据如下: 帐篷数x(顶) 加工时间Y(小时) 试问:(1)对x与Y进行相关性检验; (2)如果x与Y具有线性相关关系,求出回归方程. 10 62 20 68 30 75 40 81 50 89 60 95 70 102 80 108 90 115 100 122