《统计学》习题集及答案 下载本文

改良品种牛的利润总额=272×750=204000元; 所以应该选择改良品种牛。

若改良品种牛的平均利润少于235.2(176400÷750)元时,牧场主会选择原品种牛。

第5章 概率与概率分布

一、单选:1.A 2.D 3.B 4.C 5.D 二、多选:1.ABE 2.ABCE 三、判断:

1.×。当观察次数n很大时,随机事件发生的频率的稳定值就是概率,频率可作为概率的近似值。但是并不能认为概率就是频率的极限。因为当n很大时,频率稳定地在概率附近摆到,二者出现显著偏差的可能性极小,但并不意味着二者的偏差肯定越来越小。

2.×。中奖的概率为5?,意味着在试验次数非常多的情况下,平均每1000注彩票大约有5注会中奖。并不意味着每1000注彩票必然有5注中奖。 四、简答:

全概率公式:某一事件B的发生有各种可能的原因Ai(i=1,2,?,n),每一Ai都可能导致B发生,求B发生的概率。

逆概率公式:在事件B已发生的条件下,寻找导致A发生的每个原因Ai的概率。 五、计算: 1.(1)P{X<500}=Φ(

500?1050)=Φ(-2.75)

200=1-Φ(2.75)=1-0.99702=0.00298

(2)P{850≤X≤1450}=Φ(

1450?1050850?1050)- Φ()

200200=Φ(2)- Φ(-1)=0.97725-0.15865=0.8186

(3)由标准正态函数分布表可知,P{|Z|≤1.96}=0.95,即有:

P{|Z|=|

X?1050|≤1.96}= P{|X-1050|≤392}=0.95

200所以95%的灯管的使用寿命在均值左右392小时(658~1442小时)的范围内。

第6章 统计量及其抽样分布

一、单选:1.A 2.C 3.C 4.B 5.A 二、判断:1.√ 2.× 3.× 4.× 三、1.重复抽样:?x???1700(公斤);?x??n?200?63.25 10不重复抽样:?x???1700(公斤);?x?2.x~N(?,?nN?n200100?10??60.30 N?110100?1?n),即x~(90,27), 36p(x?100)?p(3.解:p~N(?,x?90100?90?)?1?p(z?2.2)?1?0.986097?0.013903 4.54.58%(1?8%)),即p~N(0.08,0.027)

n1000.07?0.080.09?0.08p(7%?p?9%)?p(?p?)0.0270.027?p(?0.37?p?0.37)?2(p?0.37)?1?2?0.644309?1?0.2886

)即p~N(8%,31 / 43

?(1??)

第7章 参数估计

一、单选:1.B 2.D 3.C 4.A 5.C 6.C 7.B 8.D 9.A 10.A 二、多选:1.ADE 2.ADE 3.BCE

三、填空:(1)简单随机抽样,(2)分层抽样,(3)整群抽样,(4)系统抽样,(5)多阶段抽样;(6)分层

抽样,(7)不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。 四、简答:

1.答:都要事先按某一标志对总体进行划分的随机抽样。不同在于:分层抽样的划分标志与调查标志有关,而整群抽样不是;分层抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。

2.答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这

时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。 五、计算:

1.解:n=10,小样本 (1)方差已知,由x±zα/2 (2)方差未知,由x±tα/2

?nsn得,(494.9,501.1) 得,(493.63,502.37)

22z?(1?p)1.6448?0.5?0.5/2?p? 2.解:n===1691 220.02?x 3.解:(1)x±tα/2

sn=6.75±2.131×

2.25 (2)边际误差E= tα/2

sn=2.131×

162.2516=(5.55,7.95) =1.2

22z?1.962?2.52/2?? n===17 22E1.2

第8章 假设检验

一、单选:1.C 2.C 3.B 4.A 5.B 二、多选:1.CD 2.CE 三、判断:

1.×。“拒绝原假设”只能说明统计上可判定总体均值不等于100,但并不能说明它与100之间的差距大。 2.×。要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P(或男孩所占的比例P*)所以原假设为:H0:P=3/4(或P≤3/4);H1:P>3/4。

也可以是:H0:P*=1/4(或P≥1/4);H1:P*<1/4。 四、简答:

(1)H0:x≥350;H1:x<350。

(2)针对上述假设,犯第一类错误时,表明新方法不能降低生产成本,但误认为其成本较低而被投入使用,所以此决策错误会增加成本。犯第二类错误时,表明新方法确能降低生产成本,但误认为其成本不低而未被投入使用,所以此决策错误将失去较低成本的机会。 五、计算:

1.(1)H0:μ=120;H1:μ≠12。

(2)检验统计量:Z=

32 / 43

x??0

?/n

。在α=0.05时,临界值zα/2=1.96,故拒绝域为|z|>1.96。

(3) 当x=12.25克时,Z=

x??0

?/n

x??0

12.25?120.6/2511.95?120.6/25=2.08。

由于|z|=2.08>1.96,拒绝H0:μ=120;应该对生产线停产检查。

(4) 当x=11.95克时,Z=

?/n

==-0.42。

由于|z|=-0.42<1.96,不能拒绝H0:μ=120;不应该对生产线停产检查。

第9章 分类数据分析

一、单选:1.C 2.A 3.B 4.D 5.A 6.A 7.D

8.(1)B (2)B (3)D (4)A (5)A (6)B (7)A (8)A (9)C 9.A 10.A 11.C 12.B

二、简答:

1.答:在?2检验的理论公式?2???A?T?T2中,A为实际频数,T为理论频数。根据检验假设H0:π1

=π2,若H0 成立,则四个格子的实际频数A与理论频数T相差不应很大,即?2统计量不应很大。若?2值很大,即相对应的P值很小,比如P≤a,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。

2.答:R?C表?2检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。 3.答:

(1)条件百分表的方向。通常情况下,变量在列联表中的位置是任意的,但如果变量X与Y之间存在因果关系,则令X为自变量,通常放在列的位置,Y为因变量,通常放在行的位置。条件百分表也多按照变量的方向计算。

(2)?分布的期望频数准则。在对?分布进行独立性检验时,要求样本容量必须足够大,特别是每个单位中的期望频数不能过小,必须注意两个准则:

准则一:如果只有两个单元,每个单元的期望频数必须是5或5以上;

2f?e准则二:对于两个以上的单元,如果20%的单元期望频数小于5,则不能应用检验。这可以采用合并一

22些单元的方式解决。

4.(1)方差分析是通过检验各样本总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。涉及两个类型的变量,分类型的自变量和数值型因变量。它通过对数据误差来源的分析以判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。这种误差一方面来源于组内误差,主要是不同水平(或处理)内的样本随机性所造成的;另一方面来源于组间误差,主要体现为不同水平之间的数据误差,这可能是由于抽样本身随机误差形成的,也可能是不同水平间的系统性因素造成的系统误差。

(2)列联分析是利用列联表来分析变量之间关系的一种统计方法,主要是借助于?统计量对列联表中变量间的相关性进行检验,仅仅涉及到分类型变量以及相关的频数分布。主要是借助于真实频数和期望频数之间的差异情况来计算?统计量,与给定显著性水平下的?临界值比较,以判断各类型的分布之间是否存在差异性。 三、计算:

1.解:根据题意提出假设,

222H0:各数字出现的比例是一致的 H1:各数字出现的比例是不一致的

33 / 43

计算?2统计量,

f0 21 15 13 17 19 15

fe 100/6 100/6 100/6 100/6 100/6 100/6

(f0?fe)21.127 0.167 0.807 0.007 0.327 0.167

fe ?2 2.602

(f0?fe)2=2.602 ???fe22给定显著性水平??0.05,查自由度为5的?2分布表,得临界值?0.05(5)?11.071。

另一方法,就是利用Excel中的函数=CHIDIST(?2,自由度)计算p-值为0.7614。

2由于?2??0.05(5)?11.071或p-值大于显著性水平,故不拒绝原假设,说明各数字出现的比例是一致的,这

也就说明此骰子是公平的,所出现的频数差异是由于投掷的随机性造成的。 2.根据题意提出假设,

H0:样本与期望比例一致(或,0.15,0.3,0.5,0.05是消费者的购买概率) H1:样本与期望比例不一致(或,0.15,0.3,0.5,0.05不是消费者的购买概率)

计算?2统计量,

f0 120 320 500 60

2fe 150 300 500 50

(f0?fe)26 1.333 0 2

fe ?2 9.333

(f0?fe)2=9.333 ???fe2给定显著性水平??0.05,查自由度为3的?2分布表,得临界值?0另一方法,就是利用Excel.05(3)?7.815。

中的函数=CHIDIST(?,自由度)计算p-值为0.025。

2由于?2??0.05(3)?7.815或p-值小于显著性水平,故拒绝原假设,说明样本与期望分布不一致。

23.(1)根据题意提出假设,

H0:学生态度与所在年级无关,即各年级的态度比例一致; H1:学生态度与所在年级有关,即各年级的态度比例不一致

计算?统计量,??2.447。

2给定显著性水平??0.05,查自由度为3的?2分布表,得临界值?0.05(3)?7.815。

22另一方法,就是利用Excel中的函数=CHIDIST(?,自由度)计算p-值为0.4850

第10章 方差分析

2一、单选:1.D 2.A 3.C 4.C 二、多选:1.ACE 2.ABD 3.BE 4.AD 三、填空: 1.独立、方差

34 / 43