抽样调查word版

B. 几个变量都适宜于分层，而要进行事先的多重交叉分层存在一定困难 C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道 D. 总体规模太大，事先分层太费事 E. 一般场合都可以适用（三）名词解释题

１、分层随机抽样：如果每层中的抽样都是独立地按照简单随机抽样进行的，那么这样的分层抽样称为分层随机抽样。

２、自加权：若总体总量（或总体均值）的一个无偏估计量可以表示成样本基本单元的变量值总量（或均值）的一个常数倍，即： ky (或 Y ? ，其中，ｙ为样本基本单元Y ?ky)的变量值总量；为样本基本单元的变量值均值。则称这种估计量为自加权（self-weighting）y的等加权（equi-weighting）。

3.最优分配：在分层随机抽样中，对于给定的费用，使估计量V(y st ) 的方差达到最小，或者对于给定的估计量方差V，使得总费用达到最小的各层样本量的分配称为最优分配。 (四)简答题

1. 简述分层随机抽样相对于简单随机抽样的优点.

2. 请列举出样本量在各层的三种分配方法，并说明各种方法的主要思想. （五）计算题

1.抽查一个城市的家庭，目的是评估平均每个住户很容易变换为现款的财产金额。住户分为高房租和低房租的两层。高房租这一层每家拥有的财产被看作是低房租层每家所拥有财

S 产的９倍，层的均值的平方根成正比。高房租层有4000个住户，低房租层有2000h与第h个住户。请问：

（1）包含1000个住户的样本应该如何在这两层中分配？

（2）若调查的目的是估计这两层平均每个住户拥有财产的差额，样本应如何分配（假定各层的单位调查费用相等）？

2.一个县内所有农场按规模大小分层，各层内平均每个年农场谷物（玉米）的英亩数列在下表中

NhYhSh

现要抽出一个包含100个农场的样本，目的是估计该县平均每个农场的玉米面积，请问：（1）按比例分配时，各层的样本量为多少？

（2）按最优分配时，各层的样本量为多少？（假定各层的单位调查费用相等）（3）分别将比例分配、最优分配的精度与简单随机抽样的精确度比较。

th? t h n3.设费用函数具有形式 C ? c 0 h ，其中 c 0 及均为已知数，请证22WSn明当总费用固定时，为了使 V ( y ) 达到最小值， h 必与 ( h h ) 2/3 成比例。

stth

并求出下述条件中，一个含量为1000的样本所对应的 n h 。

?WhShth

4.在一个商行内，62%的雇员是熟练的或不熟练的男性，31%是办事的女性，7%是管理人员。从商行内抽取由400人组成的一个样本，目的是估计使用某些娱乐设备的人所占的比例。按照粗略的猜测，这些设备40%到50%是由男性使用的，20%到30%是由女性使用的，5%到10%是由管理人员使用的。请问：

（1）你如何把样本单位分配在这三组人之间？（2）若真正使用者占的比例分别是48%，21%和4%，则估计比例的标准误是多少？（3）n=400的简单随机样本算得的p的标准误是多少？

5.为调查某个高血压发病地区青少年与成年人高血压患病率，对14岁以上的人分四个年龄组进行分层随机抽样，调查结果见下表。求总体高血压患病率P的估计及其标准差的估计。

高血压患病率调查数据

26.设计某一类商店销售额的调查，n=550，三层中的两层有以前调查的资料可用来得到S h

S 3 的的较好的估计值。第三层是一些新开设的商店和以前调查中没有销售额的商店，因此，

值只好加以猜测。若 S 3 的实际值是10，当被猜作（a）5， (b) 20时，请分别计算一下由奈曼分配所得的估计量的V ( y st ) 。并请证明在这两种情况下，与真正的最优值相比，方差中按比例的增量稍大于2%。

ShWhSh

7.调查某个地区的养牛头数，以村作为抽样单元。根据村的海拔高度和人口密度划分成四层，每层抽取10个村作为样本单元，经过调查获得下列数据：请估计该地区养牛总头数Y及其估计量的相对标准差 s ( Y ) / Y

8.一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同，故采用分层随机抽样。已知下列资料：若总样本量n=30，试用奈曼分配确定各层的样本量。

N1N22S2N3S12S32

9.上题中若实际调查了18个工人、10个技术人员、2个行政人员，其损失的工时数如下：试估计总的工时损失数并给出它的置信度为95%的置信区间。

10.某县欲调查某种农作物的产量，由于平原和山区的产量有差别，故拟划分为平原和山区

抽样调查word版

下载：抽样调查word版.doc

最近浏览

最新搜索

站内搜索