本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995, 即有X ~N(10,9.995)。相应的概率为:
P(X ≤10.5)=0.51995,P(X≤20.5)=0.853262。
可见误差比较大(这是由于P太小,二项分布偏斜太严重)。
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。
11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。
P(X?150)?P(Z?解:(1)
150?200)=P(Z??1.6667)30=0.04779
合格率为1-0.04779=0.95221或95.221%。
(2) 设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
P(|X?200|?K)?P{|Z|=P{Z?即:
|X?200|K?}?0.93030
K}?0.9530,K/30≥1.64485,故K≥49.3456。
12.某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,
而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?
解:设X =同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2) (1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1 (取整数)
P(X?2)?1?P(X?2)?1?(2)
k?0?C6k0.2k0.86?k
2=1-0.9011=0.0989
第4章 抽样与抽样分布——练习题(全免)
1. 一个具有n?64个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 ⑴ 给出x的抽样分布(重复抽样)的均值和标准差 ⑵ 描述x的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z统计量对应于x?15.5的值。 ⑷ 计算标准正态z统计量对应于x?23的值。 解: 已知 n=64,为大样本,μ=20,σ=16,
17
⑴在重复抽样情况下,x的抽样分布的均值为
a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。
⑴x<16; ⑵x>23; ⑶x>25; ⑷.x落在16和22之间; ⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013
3. 一个具有n?100个观察值的随机样本选自于??30、??16的总体。试求下列概率的近似值:
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699
4. 一个具有n?900个观察值的随机样本选自于??100和??10的总体。 ⑴ 你预计x的最大值和最小值是什么? ⑵ 你认为x至多偏离?多么远?
⑶ 为了回答b你必须要知道?吗?请解释。 解:a. 101, 99 b. 1 c. 不必
5. 考虑一个包含x的值等于0,1,2,…,97,98,99的总体。假设x的取值的可能性是相同的。则运用计算机对下面的每一个n值产生500个随机样本,并对于每一个样本计算x。对于每一个样本容量,构造x的500个值的相对频率直方图。当n值增加时在直方图上会发生什么变化?存在什么相似性?这里n?2,n?5,n?10,n?30和n?50。
解:趋向正态
6. 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 描述x(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x服从怎样的分布以及x的均值和方差是什么?证明你的回答;
对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之间的概率呢?
18
解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938
7. 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为??406克、标准差为??10.1克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量x。 (1)描述x的抽样分布,并给出
假设某一天技术人员观察到x?400.8,这是否意味着装袋过程出现问题了呢,为什么? 解: a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了
8. 在本章的统计实践中,某投资者考虑将1000美元投资于n?5种不同的股票。每一种股票月收益率的均值为??10%,标准差??4%。对于这五种股票的投资组合,投资者每月的收益率是
面临风险的一个度量。
假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的风险将会增加还是减少?请解释;
假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,并与只投资5种股票的情形进行比较。 解:a. 增加 b. 减少
9. 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。
如果该生产过程仍旧正常,则x的样本分布为何?
假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,样本均值
?x和?x的值,以及概率分布的形状;
r??ri2????3.2r5。n投资者的每月收益率的方差是,它是投资者所
2x≤830牛顿的概率是多少?
在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现状有何看
法(即夹克级别均值是否仍为840牛顿)? 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛顿。在这种情况下x的抽样分布是什么?当x具有这种分布时,则x≤830牛顿的概率是多少? 解: a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06
19
10. 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。
一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。 通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选n?5块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值x描绘在下图中。假设这个过程是在统计控制中的,则x的分布将具有过程的均值?,标准差具有过程的标准差除以样本容量的
平方根,
?x??n。下面的控制图中水平线表示过程均值,两条线称为控制极限度,位
于?的上下3
?x的位置。假如x落在界限的外面,则有充分的理由说明目前存在变化的特
殊原因,这个过程一定是失控的。
当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从??2%和
??1%的近似的正态分布。
假设n?4,则上下控制极限应距离?多么远?
假如这个过程是在控制中,则x落在控制极限之外的概率是多少?
假设抽取样本之前,过程均值移动到??3%,则由样本得出这个过程失控的(正确的)结论的概率是多少?
解:a. 0.015 b. 0.0026 c. 0.1587
11. 参考练习4.10。肥皂公司决定设置比练习4.10中所述的
3?x这一限度更为严格的控制极
限。特别地,当加工过程在控制中时,公司愿意接受x落在控制极限外面的概率是0.10。
20