抽样调查word版 下载本文

6 7 8 9 10 58 42 66 40 56 12 8 13 8 11 3.83 5 3.85 4.88 5 14.88 5.14 4.31 6.13 11.8 要求估计上月每台机器平均的停工时间和由于停工引起的总时间损失,并计算相对标准差。

7. 某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下表所示:

每座高层建筑拥有的楼层数 高层建筑 楼层 A 12 B 12 C 16 D 15 E 10 F 16 G 10 H 18 I 16 J 20 用二阶段抽样方法抽出10个楼层进行调查,第一阶段抽样为放回的、按于每座建筑拥有的楼层数成比例的不等概率抽样抽取5座建筑,第二阶段按简单随机抽样对每座建筑抽取两个楼层。对10个楼层居民人数的调查结果如下,请对小区总居民数进行估计,并给出估计的精度。(95%的置信度)

被调查小区总居民数 一阶样本序号 居民数 1 18,12 2 15,18 3 19,13 4 16,10 5 16,11 8. 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200间,每间住6位同学。学生会的同学运用二阶段抽样设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取了3位同学分别进行单独访问,两个阶段的抽样都是简单随机抽样,调查的结果如下:

调查结果 样本宿舍 1 2 3 4 5 拍照人数 2 0 1 2 1 样本宿舍 6 7 8 9 10 拍照人数 1 0 1 1 0 试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。 9. 上题中,学生会对女生勤工俭学月收入的一项调查中,根据以往同类问题的调查,宿舍的标准差为s1=326元,宿舍内同学之间的标准差为s2=188元。以一位同学进行调查来计算,调查每个宿舍的时间c1为10分钟,调查每一学生的时间c2为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间是c0为4小时,如果总的时间控制在8个小时内,则最优的样本宿舍和样本学生数为多少?

10. 苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有N=50块地,先从中抽取10块地,再从每块抽中的地块中抽10%的树苗,对抽中的苗木测量其高度取得资料如下: 地块(i) 秧苗数(Mi) 抽样数(mi) 苗木高度yij 1 2 3 4 5 6 7 8 9 10 52 56 60 46 49 51 50 61 60 45 5 6 6 5 5 5 5 6 6 6 12,11,12,10,13 10,9,7,9,8,10 6,5,7,5,6,4 7,8,7,7,6 10,11,13,12,12 14,15,13,12,13 6,7,6,8,7, 9,10,8,9,9,10 7,10,8,9,9,10 12,11,12,13,12,,12 已知共有M0=2600株苗木

?(1)Nn?(1)若两阶抽样都是简单随机的,调查结果用加权平均数Y?Miyi来估计总M0ni?1体均值,求估计值Y?(1)

,并计算v(Y?(1));

??(2)1n??yi,求估计值并计算v(Y(2)) (2) 抽样方法同(1),但估计量不加权,即用Yni?1?(3)(3) 抽样方法不变,使用比估计,即Y??My?Miii,求估计值及其标准误差v(Y?(3))

(4) 讨论上述三种方法的适用条件

11. 省卫生部门对32个城市的饮食业采用二阶抽样方法检查卫生合格情况,第一阶抽样从32个城市中简单随机抽取4个城市,第二阶抽样在每个抽中的城市用同样方法抽取一半饮食店进行检查,检查结果如下: 样本城市 1 2 3 4 饮食店总数 25 10 18 16 样本店数 13 5 9 8 检查卫生不合格数 4 1 4 2 要求估计这32个城市不合卫生要求的饮食店所占的比例及95%的置信区间。

12. 某城市共有六家医院,欲估计住院病人中长期住院病人所占的比例。现从这六家医院根据病床的多少采用放回按规模大小成比例的抽样方法抽取3个医院,再从抽中的医院中用简单随机抽样抽取10%的病人,调查长期住院病人(住院一个月以上)所占的比例.其数据如下:

样本医院 1 2 3 总住院病人数 430 280 190 抽选病人数 43 28 19 住院在一个月以上的病人数 5 4 3 要求估计住院在一个月以上病人占总住院病人的比例及其95%的置信区间.

13. 为估计一本英语字典的总字条效.先从26个字母中用放回的PPS抽样方法抽出10个字母,在抽中的字母中又不放回地抽取2页进行计数,其样本数据如下:

样本字母 S C N S F J U P A D 总页数 131 97 21 131 43 7 18 85 49 54 样本页上数字 1 34 27 44 24 25 42 24 53 47 38 2 27 26 38 29 32 48 21 24 55 57 用汉森一赫维茨估计量估计该字典的总字数和它的相对标准差,并估计它的设计效应deff。

14. 估计一个地区的每一住户平均消费支出,拟采用二阶抽样设计,第一阶抽村,第二阶抽户,都采用简单随机抽样。为了设计这一调查先作了一试调查获得以下信息:

22(a)Y?50,(b)村与村之间的方差S1?85.5,(c)村内户与户之间的方差S2?36.5,(d)调

查每个村的费用c1?9元,(e)调查每一住户的费用c2?1元,(f)调查的组成管理费用为

c0?1000元。若总的调查费用CT=10000元。请计算最忧的样本村数和每村的样本住户数。

15. 某幼儿园共有三个班,其人数分别为 班级 人数 A 20 B 15 C 25 欲估计每个小孩每天平均吃糖果数。现采用PPS抽样方法抽选两个班,然后在抽中的班中每班抽选5个孩。.假设抽中的班级为B和C班.在B班中用简单随机抽样抽5个小孩,他们平均吃糖果数为3,5,4,5,3;在C班中抽选的5个孩子其吃糖果数为4,6,4,4,3。

要求:

(1) 估计全幼儿园平均每人每天吃糖果数; (2) 计算抽样标准误.

16. 假设总体初级单元的大小均为M。为了估计总体均值Y(按次级单元),采用如下的二阶抽样法,先随机地抽取n个初级单元,然后从每个初级单元中抽取一个次级单元。记 其中

NM11N222S?(Y?Y)S?(Y?Y) ???i2ijiN(M?1)i?1j?1N?1i?12S2S?S?

M2U21212试证:若Su?0,则上述简单随机样本比直接从全体次级单元中抽取的样本量为n的简单

随机样本更有效,如果n/N忽略不计,则两组样本同样有效。

17. 对于各级单元大小相等情形的三阶抽样,若每阶抽样都是简单随机的,根据9.5.1中的记号,证明

E(s1)?S1?221?f221?f32S2?S3 mmk2 E(s2)?S2?21?f32S3 k22 E(s3)?S3

四、简答题

1. 什么是多阶段抽样?多阶段抽样有哪些优点?

2. 能否举例说明多阶段抽样在实际生活中有哪些应用? 3. 多阶抽样与单阶抽样的关系;

4.二阶抽样与整群抽样和分层抽样的关系。 五、设计题

某学校欲调查学生每月的零用钱数量。假设该学校共有18个班级,每个班级都有60个学生。请你设计一个调查方案,并说明你是如何确定样本量的。