可编辑版
4.配额抽样 5.概率抽样
6. 不等概率抽样
7. πPS抽样的Brewer方法
8. 最优分配 9. 比率估计 四、计算题 1、(简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情况,该区共有N=1000户,调查了n=100户,得y=12.5吨,s=1252,有40
2户用水超过了规定的标准。
要求计算: ○1该住宅区总的用水量及95%的置信区间; ○2若要求估计的相对误差不超过10%,应抽多少户作为样本? ○3以95%的可靠性估计超过用水标准的户数; 2、(内曼分配和按比例分配的均值和比例估计)有下列数据 层 1 2 3 设n?1000
○1采用按比例分层抽样的方法估计Y和P并计算其标准误; ○2采用奈曼分配的方法估计Y和P并计算标准误;
3、(两阶段抽样)某市为了了解职工收入情况,从该市的630个企业中随机抽取了5个企业,在中选的企业中对职工再进行随机抽样,有关数据如下:
企业2yiMimis2i (元) 号 1 520 10 328 400.056 2 108 10 400 301.134 3 1400 20 310 1303.158 4 1200 20 370 1205.786 5 9000 100 420 4200.000 其中,
Mi
Wh yh sh ph 0.35 0.55 0.1 3.1 3.9 7.8 2 3.3 11.3 0.54 0.39 0.24 为企业职工数,
mi为样本量;
yi为样本均值,
2s2i为样本方差。
试估计该市职工平均收入及标准差。
4、(比率估计)某养兔场共有100只兔子,上月末称重一次对每只兔的重量作了纪录,并计算平均重量为3.1磅,一个月后随机抽取10只兔子标重如下:
Word完美格式
可编辑版
序1 2 3 4 5 6 7 8 9 10 号 上3.2 3 2.9 2.8 2.8 3.1 3 3.2 2.9 2.8 次 本4.1 4 4.1 3.9 3.7 4.1 4.2 4.1 3.9 3.9 次 ○1估计这批兔子较上月末增重的比率及其标准误差; ○2估计现有兔子的平均重量及其标准误差; ○3将比估计方法与均值估计法进行比较,哪一种方法效率高?分析其原因。 5、为调查某5443户城镇居民服装消费情况,采用简单随机不重复抽样调查了36户进行调查,得到平均消费支出y?649.72元,s2?304803试根据此估计: (1)该地区居民服装消费支出总额,并给出置信水平为95%的置信区间。 (2)如果希望服装平均消费支出的相对误差限不超过5%,则样本量至少应为多少?
6、某地区10000名群众,现欲估计在拥有本科学历及以上的群众所占的比例,随机不重复抽取了300名群众进行调查,得到p?0.25,试估计该地区群众拥有本科以上学历的比例,并以正态分布近似给出其95%的置信区间。
7、对某地区171 980户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和乡村将居民划为2层,每层按简单随机抽样抽取300户,经整理得如下数据: 层 城镇 乡村 Nh 23560 148420 yh 15180 9856 Wh 0.137 0.863 sh 2972 2546 试根据此估计:
(1)居民平均收入及其95%的置信区间。
(2)若是按比例分配和奈曼分配时,各层样本量分别应为多少?
8、某居民小区共有600个单元,每个单元均居住15户,现以单元为群进行整群抽样,随机抽取8个单元,调查每户每周的食品支出费用,调查结果经整理,各单元样本均值和标准差如下表所示: yi 205 219 202 218 212 217 208 220 si 30.61 32.14 29.62 28.36 25.84 33.59 34.20 26.84 试求: (1)该居民小区平均每户每周食品支出费用,并给出其置信水平为95%的置信区间。
(2)计算以单元为群的群内相关系数与设计效应 9、某县有300个村,小麦播种面积为23 434亩。全部村子按地势分为平原和山区两种类型,各按10%的抽样比抽样,调查亩产量,经整理得到下表结果,以大写字母表示总体数据,小写字母表示样本数据,Y代表调查变量,为今年的
Word完美格式
可编辑版
总产量,X代表辅助变量,为去年的总产量,相应的均值为平均亩产量。 类型 平原 山区 Nh 102 198 Wh 0.34 0.66 yh 583 290 xh 561 274 Xh 568 271 试分别对全县今年的平均亩产量构建分别比率估计量和联合比率估计量。
10、一个由N=1000个人构成的总体被划分为两层:第一层由N1?400名男性组成,第二层由N2?600名女性组成。从中抽取一个样本量为n=250的样本,将样本等比例地分配给各层,使得两层的抽样比都等于n/N=1/4。求各层的样本量分别是多少?
11、一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:
工人 技术人行政管理人员 员 N1?132 N2?92 N3?27 222?9 ?25 s3s1?36 s2若样本量n=30,试用奈曼分配确定各层的样本量。
12、某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下: 本地区 本省外地区 外省 N1?154 N2?93 2S12?2.25 S2?3.24 N3?53 S32?3.24 C1?9 C2?25 C3?36 若要求估计评价成绩均值的方差V(yst)?0.1,并且费用最省(假定费用为线性形式),求样本量n在各层的分配。
13、某林业局欲估计植树面积,该局共辖240个林场,按面积大小分为四层,用等比例抽取40个林场,取得下列资料(单位:公顷) 第一层 第二层 第三层 第四层 N1?86 n1?14 N2?72 n2?12 N3?52 n3?9 N4?30 n4?5 Word完美格式
可编辑版
y3i y4i 125 155 67 96 256 97 67 42 125 25 47 310 236 220 142 256 310 167 92 86 27 43 45 352 440 655 59 53 52 142 190 495 510 320 220 54396 196 0 780 试估计该林业局总的植树面积及95%的置信区间。 14. 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。 农场规模(英平均每一农场的玉米面积农场数Nh 标准差Sh 亩) Yh y1i y2i 0—40 394 5.4 8.3 41—80 461 16.3 13.3 81—120 391 24.3 15.1 121—160 334 34.5 19.8 161—200 169 42.1 24.5 201—240 113 50.1 26.0 148 63.8 35.2 ?241 总和或均值 2010 26.3 -- 现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:
(1)按比例分配时,各层的样本量为多少?
(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等)
15. 某县欲调查某种农作物的产量,由于平原、丘陵和山区的产量有差别,故拟划分为平原、丘陵和山区三层采用分层抽样。平原区共有150个村庄,丘陵区共有100个村庄,山区共有250个村庄。按照各种地形等比例各抽取5%样本,进行实割实测产量,结果计算如下表。 (1)在95.45%的概率保证程度下,试估计该县农作物平均每村产量的区间范围。 (2)若村庄的农作物产量低于150吨,县政府并将其归为低产量村,从而对其加强农业补贴政策。因此,试图在95.45%的概率保证程度下估计该县低产量村比例的区间范围。 地形 村庄总个数 样本村个数 样本平均产样本产量标样本低产量(吨) 准差 量村个数 平原 140 7 202.5 82.20 2 丘陵 100 5 147 36.84 1 山区 240 12 121.11 47.35 7 16.某城市居民小区的食品消费量调查,以每个楼层为群进行整群抽样,每个楼层都有8个住户。用简单随机抽样在N=510个楼层中抽取n=12个楼层,得
Word完美格式