统计学课后答案 下载本文

牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。 ⑴ 如果该生产过程仍旧正常,则x的样本分布为何?

⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,

样本均值x≤830牛顿的概率是多少?

⑶ 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现

状有何看法(即夹克级别均值是否仍为840牛顿)?

⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛

顿。在这种情况下x的抽样分布是什么?当x具有这种分布时,则x≤830牛顿的概率是多少?

解: a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06

26.在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。

一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。

通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选n?5块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值x描绘在下图中。假设这个过程是在统计控制中的,则x的分布将具有过程的均值?,标准差具有过程的标准差除以样本容量的平方根,?x??n。下面的控制图中水平线表示过程均值,两条线

称为控制极限度,位于?的上下3?x的位置。假如x落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。

当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从??2%和

??1%的近似的正态分布。

⑴ 假设n?4,则上下控制极限应距离?多么远?

⑵ 假如这个过程是在控制中,则x落在控制极限之外的概率是多少?

⑶ 假设抽取样本之前,过程均值移动到??3%,则由样本得出这个过程失控的(正

确的)结论的概率是多少?

解:(1). 0.015 (2). 0.0026 (3). 0.1587

27.参考第26题。肥皂公司决定设置比第26题中所述的3?x这一限度更为严格的控制极限。特别地,当加工过程在控制中时,公司愿意接受x落在控制极限外面的概率是0.10。

⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的

样本中使用n?4个观察值,则控制极限应该设定在哪里?

⑵ 假设(1)中的控制极限已付诸实施,但是公司不知道,?现在是3%(而不是2%)。若n?4,则x落在控制极限外面的概率是多少?若n?9呢? 解:(1). (0.012, 0.028) (2). 0.6553, 0.7278

第四章:参数估计

思考与练习

思考题:

1.简述评价估计量好坏的标准

?答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数?的估计量有?1???,称??是无偏估计量;如果??和??是无偏估计量,且D??小于?,如果E?和?112112?,则??比??更有效;如果当样本容量n??,????,则??是相合估计量。 D?21121

2.

3.说明区间估计的基本原理 答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。置信水平反映估计的可信度,而区间的长度反映估计的精确度。

4.解释置信水平的含义。

5.解释置信水平为95%的置信区间的含义

答:总体参数是固定的,未知的,置信区间是一个随机区间。置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。

6.简述样本容量与置信水平、总体方差、允许误差的关系

2z?/2??2?答:以估计总体均值时样本容量的确定公式为例:n?

??????E2样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。

练习题:

1.从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差σx等于多少?

(2) 在95%的置信水平下,允许误差是多少?

解:已知总体标准差σ=5,样本容量n=40,为大样本,样本均值x=25, (1)样本均值的抽样标准差σx=σ5==0.7906 n40(2)已知置信水平1-α=95%,得 Zα/2=1.96,

于是,允许误差是E =Zα/2σ=1.96×0.7906=1.5496。 n

2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差;

(5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 σx=σ15==2.1429 n49(2)已知置信水平1-α=95%,得 Zα/2=1.96,

于是,允许误差是E =Zα/2σ=1.96×2.1429=4.2000。 n(3)已知样本均值为x=120元,置信水平1-α=95%,得 Zα/2=1.96, 这时总体均值的置信区间为 x?Zα/2124.2σ=120±4.2=

115.8n可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。

3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):

3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。

解:⑴计算样本均值x:将上表数据复制到Excel表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x=3.316667,

⑵计算样本方差s:删除Excel表中的平均值,点击自动求值→其它函数→STDEV→选定计算数据列→确定→确定,得到s=1.6093

也可以利用Excel进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到:

2 (xi-x=90.65 )?再对总和除以n-1=35后,求平方根,即为样本方差的值

s=2(x-x)?in?1=90.65=1.6093。 35⑶计算样本均值的抽样标准误差: 已知样本容量 n=36,为大样本, 得样本均值的抽样标准误差为 σx=s1.6093==0.2682 36n⑷分别按三个置信水平计算总体均值的置信区间:

① 置信水平为90%时:

由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 Zα/2=1.64, 计算得此时总体均值的置信区间为

x?Zα/23.7565s=3.3167±1.64×0.2682=

2.8769n 可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)

小时;

② 置信水平为95%时:

由双侧正态分布的置信水平1-α=95%,得 Zα/2=1.96,

计算得此时总体均值的置信区间为

x?Zα/23.8423s=3.3167±1.96×0.2682=

2.7910n 可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)

小时;

③ 置信水平为99%时:

若双侧正态分布的置信水平1-α=99%,通过2β-1=0.99换算为单侧正态分布的置信水平β=0.995,查单侧正态分布表得 Zα/2=2.58, 计算得此时总体均值的置信区间为

x?Zα/24.0087s=3.3167±2.58×0.2682=

2.6247n 可知,当置信水平为99%时,该校大学生平均上网时间的置信区间为(2.62,4.01)