《统计学》(贾俊平,第五版)分章习题及答案 下载本文

很大,即相对应的P值很小,比如P≤a,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。

2.答:R?C表?检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。 3.答:

(1)条件百分表的方向。通常情况下,变量在列联表中的位置是任意的,但如果变量X与Y之间存在因果关系,则令X为自变量,通常放在列的位置,Y为因变量,通常放在行的位置。条件百分表也多按照变量的方向计算。

(2)?分布的期望频数准则。在对?分布进行独立性检验时,要求样本容量必须足够大,特别是每个单位中的期望频数不能过小,必须注意两个准则:

准则一:如果只有两个单元,每个单元的期望频数必须是5或5以上; 准则二:对于两个以上的单元,如果20%的单元期望频数些单元的方式解决。

4.(1)方差分析是通过检验各样本总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。涉及两个类型的变量,分类型的自变量和数值型因变量。它通过对数据误差来源的分析以判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。这种误差一方面来源于组内误差,主要是不同水平(或处理)内的样本随机性所造成的;另一方面来源于组间误差,主要体现为不同水平之间的数据误差,这可能是由于抽样本身随机误差形成的,也可能是不同水平间的系统性因素造成的系统误差。

(2)列联分析是利用列联表来分析变量之间关系的一种统计方法,主要是借助于?统计量对列联表中变量间的相关性进行检验,仅仅涉及到分类型变量以及相关的频数分布。主要是借助于真实频数和期望频数之间的差异情况来计算?统计量,与给定显著性水平下的?临界值比较,以判断各类型的分布之间是否存在差异性。 三、计算:

1.解:根据题意提出假设,

222222fe2?小于5,则不能应用检验。这可以采用合并一

H0:各数字出现的比例是一致的

H1:各数字出现的比例是不一致的

计算?统计量,

2f0 21 15 13 17 19 15

fe 100/6 100/6 100/6 100/6 100/6 100/6

(f0?fe)21.127 0.167 0.807 0.007 0.327 0.167

fe ?2 2.602

(f0?fe)2=2.602 ???fe22给定显著性水平??0.05,查自由度为5的?2分布表,得临界值?0.05(5)?11.071。

另一方法,就是利用Excel中的函数=CHIDIST(?,自由度)计算p-值为0.7614。

2由于?2??0.05(5)?11.071或p-值大于显著性水平,故不拒绝原假设,说明各数字出现的比例是一致的,这

2

37 / 45

也就说明此骰子是公平的,所出现的频数差异是由于投掷的随机性造成的。 2.根据题意提出假设,

H0:样本与期望比例一致(或,0.15,0.3,0.5,0.05是消费者的购买概率)

H1:样本与期望比例不一致(或,0.15,0.3,0.5,0.05不是消费者的购买概率)

计算?统计量,

2f0 120 320 500 60

2fe 150 300 500 50

(f0?fe)26 1.333 0 2

fe ?2 9.333

(f0?fe)2=9.333 ???fe2给定显著性水平??0.05,查自由度为3的?2分布表,得临界值?0另一方法,就是利用Excel.05(3)?7.815。

中的函数=CHIDIST(?,自由度)计算p-值为0.025。

2由于?2??0.05(3)?7.815或p-值小于显著性水平,故拒绝原假设,说明样本与期望分布不一致。

23.(1)根据题意提出假设,

H0:学生态度与所在年级无关,即各年级的态度比例一致;

H1:学生态度与所在年级有关,即各年级的态度比例不一致

2计算?统计量,??2.447。

2给定显著性水平??0.05,查自由度为3的?2分布表,得临界值?0.05(3)?7.815。

2另一方法,就是利用Excel中的函数=CHIDIST(?,自由度)计算p-值为0.4850

第10章 方差分析

2一、单选:1.D 2.A 3.C 4.C 二、多选:1.ACE 2.ABD 3.BE 4.AD 三、填空: 1.独立、方差

2.总变差平方和=组间变差平方和+组内变差平方和。 3.数量型变量,品质型变量,数量型变量。 4.正态总体均值 5.因子,水平或处理。 6.组间、组内 7.m-1, n-m。 四、计算题

1.解:

根据计算结果列出方差分析表 方差来源 组间 组内 总和 离差平方和 0.001053 0.000192 0.001245 自由度 2 12 14 均方差 0.00052661 0.00016 F值 32.92 因为 (2,12)=3.89<32.92,故拒绝 ,认为各台机器生产的薄板厚度有显著差异。

38 / 45

2.解:

根据计算结果列出方差分析表 方差来源 组间 组内 总和 离差平方和 14245.83 43950 58195.83 自由度 3 20 23 均方差 4748.61 2197.5 F值 2.16 因为 (3,20)=3.10>2.16,故接受 ,即四种配方的饲料对小鸡的增重没有显著的差异。 3.解:各总值均值间有显著差异。 4.解:差异不显著。

第11章 一元线性回归

一、单选: 1.D 2.A 3.B 4.A 5.C 6.A 7.B 8.C 9.B 10.C

11.A 12.A 13.B 14.A 15.C 16.A

二、多选: 1.ABD 2.AE。 三、判断:

1.×。这种正相关是因为二者同时受到疾病的严重程度的影响所致。

2.√。因为用最小平方法在现有资料范围内配合的最佳方程,推到资料范围外,就不一定是最佳方程。 四、简答:

1.答:变量之间存在的不确定的数量关系为相关关系,可能还会有其他很多较小因素影响;特点是一个变量

的取值不能由另一个变量唯一确定。

2.答:变量性质不同,相关分析不必区分自变量和因变量,而回归分析必须区分;作用不同,相关分析用于

测度现象之间有无相关关系、关系方向、形态及密切程度,而回归分析是要揭示变量之间的数量变化规律。 五、计算: 1.解:(1)

10年5薪0???024??x受教育年数6810 y?? (2)建立线性回归方程,根据最小二乘法得:01 ?1??1214n?xiyi??xi?yin?x?(?xi)2i2;?0?y??ni??1??xn?i

由此可得?1=0.732,?0=-2.01,则回归方程是y=-2.01+0.732x (3)当受教育年数为15年时,其年薪的点估计值为:

???y=-2.01+0.732×15=8.97(万元)

估计标准误差: Sy=

2(y?y)?ii?n?2=

SSE=MSE=0.538=0.733 n?2

39 / 45

? 置信区间为:y?t1(x0?x)2?/2Syn?n ?(x2i?x)i?1 =8.97±2.228×0.733×1(15?6.917)212?120.9167 =8.97±1.290 ? 预测区间为:y?t1?1(x0?x)2?/2Syn??n

(xi?x)2i?1 =8.97±2.228×0.733×1?1(15?6.917)212?120.9167 =8.97±2.081

2.解:(1)建立线性回归方程y????01???1x,根据最小二乘法得: ???n??1??xiyi??xi?yi ?n??x22i?(?xi)

????yi??xi??0??n??1n 由此可得????0=0.0093,?1=0.316,则回归方程是y=0.0093+0.316x (3)当GDP达到16时,其货币供应量的点估计值为:

?y=0.0093+0.316×16=5.065亿元

估计标准误差: SSSEy=

?(y?i?y2i)n?2=

n?2=MSE=0.09294=0.305 ? 置信区间为:y?t1(x0??/2Syn?x)2n ?(xi?x)2i?1 =5.065±2.228×0.305×1(16?11.711)212?135.21863 =5.065±0.318亿元 ? 预测区间为:y?t1?1(x0?x?/2Syn?)2?n

(xi?x)2i?1 =5.065±2.228×0.305×1?1(16?11.711)212?135.21863 =5.065±0.750亿元

第12章 多元线性回归

一、单选:1.D 2.B 3.C 4.B 5.C 6.C 7.D 8.C 9.C 10.D 11.C 12.A 13.D

40 / 45