一、 选择题 (每题2分,共2*5=10分)
1、从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( A ) A、简单随机抽样 B、分层抽样 C、系统抽样 D、整群抽样 2、 对平均值相差较大的两个总体比较其离散程度时,应采用( D )指标 A、全距 B、平均差 C、标准差 D、变异系数 3、若随机事件A,B互不相容,则P(A∪B) = ( A )
A、P(A)+P(B) B、P(A)+P(B)?P(A)P(B) C、P(A)P(B) D、P(A) ?P(B) 4、下面关于95%的置信度说法正确的是( C )
A、总体参数落在一个特定的样本所构造的区间内的概率为95% B、总体参数落在一个特定的样本所构造的区间内的概率为5%
C、对总体均值估计时,进行100次抽样(样本容量为n),由样本均值加减估计的允许误差所构造的100个置信区间中,平均有95个包含总体参数的真实值
D、对总体均值估计时,进行100次抽样(样本容量为n),由样本均值加减估计的允许误差所构造的100个置信区间中,平均有5个包含总体参数的真实值
5、假设检验中,分别用?,β表示犯第I类错误和第II类错误的概率,则当样本容量n一定时,下列说法中正确的是( A ) A、?是指原假设H0为真,但却拒绝了原假设的概率 B、?是指原假设H0为假,但却接受了原假设的概率 C、?减小时β也减小 D、?增大时β也增大
二、填空题 (每题3分,共3*10=30分)
1、在统计学的研究中,感兴趣的研究对象全体称为 总体 ;每个组成对象称为 个体 。
2、有10个人的年龄资料:10,20,15,20,25,30,15,20,30,25岁。由该资料确定的中位数为 20 ,众数为 20 ,极差为 20 。
3、射手独立地射击5次,每次命中目标的概率均为0.6。则刚好有3次命中的概率P?X?3?? 0.3456 。
4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率密
?1,a?x?ba?b(b?a)2?度函数为f(x)??b?a,则X的期望值为 ,方差为 。
212??0,其他5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,则E(2X+3Y)= 13 。 6、假设某地区成年男性的身高(单位: cm) X~N(170,7.692),则该地区成年男性的身高超过175cm的概率是 0.2578 。
(注:?(0.65)=0.7422,?(0.35)=0.6368,?(0.25)=0.5987)
7、设X1,X2,...,Xn是来自正态总体N(?,?2)的简单随机样本。总体方差未知,X为样本均值,S2为样本方差,n?30,则X??~ t(n-1) (分布)。 S/n8、设随机变量X服从自由度为n的t分布,且P?X?????,则P?X???? 1-α/2 。
9、在假设检验里,有双侧检验和单侧检验,单侧检验又分为 左 侧检验 和 右 侧检验。
10、在单因素方差分析中,因素总共有k个水平,样本容量为n,则检验时F统计量的分子SSB与分母SSE的自由度分别是 k-1 和 n-k 。
三、计算题(每小题15分,共15*4=60分)
以下题目可能用到的临界值有:z0,025?1.96, z0,05?1.65, t0.05(9)?2.262, t0.05(10)?2.228, F0.05(3,44)?2.82, F0.05(3,48)?2.80
1、某车间生产了同样规格的6箱产品,其中有3箱、2箱和1箱分别是由甲、乙和丙3个车床生产的,且3个车床的次品率依次为1/10、1/15、1/20。现从这6箱中任选一箱,再从选出的一箱中任取一件,试计算: (1)取得的一件是次品的概率;(8分)
(2)若已知取得的一件是次品,求所取得的产品是由丙车床生产的概率。(7分)
解:设A=“产品是甲车床生产”,B=“产品是乙车床生产”,
C=“产品是丙车床生产”,D=“产品是次品”。 (1)随机抽取一件产品是次品的概率
P(D)?P(A)P(DA)?P(B)P(DB)?P(C)P(DC)31211129????????0.081610615620360
(2)随机抽取一件,发现是次品,则该次品属于丙车床生产的概率为
11?P(CD)P(C)P(DC)6203P(CD)?????0.10329P(D)P(D)29360
答:(1)随机抽取一件是次品的概率8.1%;(2)随机抽取一件,发现是次品,则该次品属于工厂A的概率为10.3%.
2、从一批零件中抽取10个,测得直径(mm)分别为19.7、 20.1、 19.8、 19.9、 20.2、 20.0、 19.9、 20.2、 20.3。设零件直径服从正态分布N??,?2?。 求:(1)10个零件的均值和标准差;(6分)
(2)这批零件直径均值μ的置信水平为95%的置信区间。(9分) (注:结果保留三位小数)
解:(1)根据抽样结果计算得均值和标准差为: x??xi?1ninn?20.0502 s??(x?x)ii?1n?1?0.227(2)根据??0.05查t分布表t0.05(9)?2.262,所以这批直径的均值? 的置信区间为 x?t?(n?1)s0.227?20.05?2.262??(19.888,20.212)n10这批直径的均值?的置信区间为19.888~20.212.
3、某旅馆的经理认为其客人每天的平均消费至少为1200元。假如抽取了一组50张账单作为样本资料,样本平均数为1000元,且已知总体标准差为200元,试问在5%的显著性水平检验下,该样本能否否定该经理的说法。(15分)
解:H0:??1200检验统计量: z?x??0H1:??1200 ??0.05,n?50,z0.95??1.645
?1000?1200??7.07120050?n在??0.05的水平上拒绝H0,不能认为经理的说法正确。
4、某公司管理者想比较A、B、C、D四种培训方案的效果,随机抽取了48个工人随机分配到四种培训,将培训结束后每组工人每小时组织产品数进行方差分析,得到表1的结果:
表1 方差分析表
差异源 组间 组内 总计 SS 4866 DF MS 230 — F — — 求:(1)完成上面的方差分析表(要求写出计算过程);(9分)
(2)若在5%的显著性水平检验下,请问这四种培训方案效果是否显著性差
异。(6分)
解:?1?由已知得 dfB?4?1?3, dfE?48?4?44, dfT=48-1=47 SSB?MSB?dfB?230?3?690, MSE?SSE4866??110.59dfE44 SST?SSB?SSE?690?4866?5566 F? (2)H0:四种培训方案效果没有显著性差异 H1:四种培训方案效果有显著性差异 因为F0.05,(3,44)?2.82,F?2.08,则F?F0.05,(3,44) 故不能拒绝原假设,说明这四种培训方案效果没有显著性差异。MSB230??2.08MSE110.59