抽样调查word版 下载本文

B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难 C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道 D. 总体规模太大,事先分层太费事 E. 一般场合都可以适用 (三)名词解释题

1、分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随机抽样。

2、自加权:若总体总量(或总体均值)的一个无偏估计量可以表示成样本基本单元的变量值总量(或均值)的一个常数倍,即: ky (或 Y ? , 其中,y为样本基本单元Y ?ky)的变量值总量; 为样本基本单元的变量值均值。则称这种估计量为自加权(self-weighting)y的等加权(equi-weighting)。

3.最优分配:在分层随机抽样中,对于给定的费用,使估计量V(y st ) 的方差达到最小,或者对于给定的估计量方差V,使得总费用达到最小的各层样本量的分配称为最优分配。 (四)简答题

1. 简述分层随机抽样相对于简单随机抽样的优点.

2. 请列举出样本量在各层的三种分配方法,并说明各种方法的主要思想. (五)计算题

1.抽查一个城市的家庭,目的是评估平均每个住户很容易变换为现款的财产金额。住户分为高房租和低房租的两层。高房租这一层每家拥有的财产被看作是低房租层每家所拥有财

S 产的9倍, 层的均值的平方根成正比。高房租层有4000个住户,低房租层有2000h与第h个住户。请问:

(1)包含1000个住户的样本应该如何在这两层中分配?

(2)若调查的目的是估计这两层平均每个住户拥有财产的差额,样本应如何分配(假定各层的单位调查费用相等)?

2.一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中

NhYhSh

现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问: (1)按比例分配时,各层的样本量为多少?

(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等) (3)分别将比例分配、最优分配的精度与简单随机抽样的精确度比较。

th? t h n3.设费用函数具有形式 C ? c 0 h ,其中 c 0 及 均为已知数,请证22WSn明当总费用固定时,为了使 V ( y ) 达到最小值, h 必与 ( h h ) 2/3 成比例。

stth

并求出下述条件中,一个含量为1000的样本所对应的 n h 。

?WhShth

4.在一个商行内,62%的雇员是熟练的或不熟练的男性,31%是办事的女性,7%是管理人员。从商行内抽取由400人组成的一个样本,目的是估计使用某些娱乐设备的人所占的比例。按照粗略的猜测,这些设备40%到50%是由男性使用的,20%到30%是由女性使用的,5%到10%是由管理人员使用的。请问:

(1)你如何把样本单位分配在这三组人之间? (2)若真正使用者占的比例分别是48%,21%和4%,则估计比例的标准误是多少? (3)n=400的简单随机样本算得的p的标准误是多少?

5.为调查某个高血压发病地区青少年与成年人高血压患病率,对14岁以上的人分四个年龄组进行分层随机抽样,调查结果见下表。求总体高血压患病率P的估计及其标准差的估计。

高血压患病率调查数据

26.设计某一类商店销售额的调查,n=550,三层中的两层有以前调查的资料可用来得到S h

S 3 的的较好的估计值。第三层是一些新开设的商店和以前调查中没有销售额的商店,因此,

值只好加以猜测。若 S 3 的实际值是10,当被猜作(a)5, (b) 20时,请分别计算一下由奈曼分配所得的估计量的V ( y st ) 。并请证明在这两种情况下,与真正的最优值相比,方差中按比例的增量稍大于2%。

ShWhSh

7.调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层抽取10个村作为样本单元,经过调查获得下列数据: 请估计该地区养牛总头数Y及其估计量的相对标准差 s ( Y ) / Y

8.一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,故采用分层随机抽样。已知下列资料: 若总样本量n=30,试用奈曼分配确定各层的样本量。

N1N22S2N3S12S32

9.上题中若实际调查了18个工人、10个技术人员、2个行政人员,其损失的工时数如下: 试估计总的工时损失数并给出它的置信度为95%的置信区间。

10.某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分为平原和山区