高中数学人教版选修2-3专用同步作业解析(含答案)第3章 统计案例 改好56页

高中数学人教版选修2-3专用同步作业解析(含答案)

另一个是随机误差e. (3)回归方程的预报精度

判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方程的预报精度越高.

简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值. (4)回归模型的拟合效果

判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算相关指数R2的大小判断. 2.独立性检验的基本思想

独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量K2的观测值,最后由K2的观测值很大在一定程度上说明两个分类变量有关系.

进行独立性检验要注意理解以下三个问题: (1)独立性检验适用于两个分类变量. (2)两个分类变量是否有关系的直观判断:

一是根据2×2列联表计算|ad-bc|,值越大关系越强; 二是观察等高条形图,两个深色条的高度相差越大关系越强;

(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系. 二、两个重要参数 1.相关指数R2

相关指数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好. 2.随机变量K2

随机变量K2是用来判断两个分类变量在多大程度上相关的变量.独立性检验即计算K2的观测值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量在多大程度上相关. 三、两种重要图形 1.散点图

散点图是进行线性回归分析的主要手段,其作用如下:

一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;

高中数学人教版选修2-3专用同步作业解析(含答案)

二是判断样本中是否存在异常. 2.残差图

残差图可以用来判断模型的拟合效果,其作用如下:

一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.

二是确认样本点在采集中是否有人为的错误.

题型一 回归分析的思想及其应用

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为:通过散点图和经验选择回归方程的类型,然后通过一定的规则确定出相应的回归方程,通过一定的方法进行检验,最后应用于实际或对预报变量进行预测.

例1 某地搜集到的新房屋的销售价格(单位:万元)和房屋面积(单位:m2)的数据如下表:

房屋面积/m2 销售价格/万元 (1)画出数据对应的散点图; (2)求回归直线方程;

(3)根据(2)的结果,估计当房屋面积为150 m2时的销售价格.

解 (1)设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.

115 24.8 110 21.6 80 18.4 135 29.2 105 22

^^^

(2)由(1)知y与x具有线性相关关系,可设其回归方程为y=bx+a,依据题中的数据,应用科学计算器,可得出 15

x=?xi=109,

5i=1

i=1

? (xi-x)2=1 570,

15

y=?yi=23,2,

5i=1

5

高中数学人教版选修2-3专用同步作业解析(含答案)

? (xi-x)(yi-y)=308,

5

5

i=1

^∴b=

i=1

? ?xi-x??yi-y?

=i=1

? ?xi-x?2

5

308

≈0.196 2, 1 570

^^

a=y-b x≈23.2-0.196 2×109=1.814 2. ^

故所求的回归直线方程为y=0.196 2x+1.814 2.

^

(3)由(2)知当x=150时,销售价格的估计值为y=0.196 2×150+1.814 2=31.244 2(万元). 故当房屋面积为150 m2时,估计销售价格是31.244 2万元.

反思与感悟 解答此类问题,一般先根据散点图判断两个变量是否具有相关关系,然后求出回归方程,根据回归方程解决问题.

跟踪训练1 从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得?xi=80,?yi=20,?xiyi=184,?x2i=720.

i=1

i=1

i=1

i=1

10

10

10

10

^^^(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a; (2)判断变量x与y之间是正相关还是负相关;

(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.

^^^^

附:线性回归方程y=bx+a中,b=

i=1

?xiyi-n x y?x2i-n x

10

10

^^

,a=y-b x,其中x,y为样本平

2

i=1

均值.

1n80

解 (1)由题意知n=10,x=?xi==8,

ni=1101n20

y=?yi==2,

ni=110

22

又lxx=?x2i-n x=720-10×8=80,

i=1n

lxy=?xiyi-n x y=184-10×8×2=24,

i=1

n

高中数学人教版选修2-3专用同步作业解析(含答案)

^lxy24

由此得b===0.3,

lxx80

^^

a=y-b x=2-0.3×8=-0.4, ^

故所求回归方程为y=0.3x-0.4.

^

(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间正相关. (3)将x=7代入回归方程可以预测该家庭的月储蓄为 ^

y=0.3×7-0.4=1.7(千元). 题型二 独立性检验思想

独立性检验研究的问题是两个分类变量之间是否有关系.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高条形图能更直观地反映两个分类变量之间的情况.独立性检验的思想是:要判断两个分类变量是否有关系,可以先假设二者无关系,求随机变量K2的观测值k,若k大于临界值,则拒绝假设,否则,接受假设. 例2 考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:

黑穗病 无黑穗病 总计 种子灭菌 26 50 76 种子未灭菌 184 200 384 总计 210 250 460 试分析种子灭菌与小麦发生黑穗病是否有关. 解 由列联表的数据可求K2的观测值 460×?26×200-184×50?2k=≈4.804.

76×384×210×250而4.804>3.841,

所以在犯错误的概率不超过0.05的前提下,认为种子灭菌与小麦发生黑穗病有关系. 反思与感悟 在利用统计量K2进行独立性检验时,观测值的计算要准确,再把计算结果和临界值比较,从而得出判断的可信程度.

跟踪训练2 在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:

对照 新措施 合计 试问新措施对防治猪白痢是否有效? 解 由列联表可求K2的观测值,

存活率 114 132 246 死亡率 36 18 54 合计 150 150 300

联系客服:779662525#qq.com(#替换为@)