统计习题 下载本文

考第17题的计算结果估算样本量。

20. 某市按地理位置划分成30个学区,每学区有4所小学。经一阶段整群抽样,抽得3个学区。对这3个学区的每一所学校调查了学生总数和色盲的人数,数据见下表:

3个学区各学校的学生总数和色盲人数

学区编号

1 8 17

学校编号

1 2 3 4 1 2 3 4 1 2 3 4

学生人数

430 610 630 510 360 510 420 490 370 530 430 220

色盲人数

7 12 12 20 8 17 4 3 16 10 3 3

试估计该市共有多少小学生,多少色盲小学生,以及小学生中色盲者所占百分比。

21. 视第20题为预试验,在此基础上估算正式作一阶段整群抽样调查所需的样本量。要求相对误差不低于30%,置信系数达到95%。

22. 第20题属于一阶段整群抽样,其中的“群”是什么?可否用分层随机抽样达到同一目的?这时的“层”是什么?

23. 围绕估计总体均数所需样本量的估算公式讨论,何时采用完全随机抽样?何时采用分层随机抽样?何时采用一阶段整群抽样?

24.甲、乙两地女性乳腺癌死亡率(1/10万)资料如下表所示。 (1)分别用以下标准人口通过直接法标准化比较两地女性乳腺癌死亡率,并讨论:①以甲地人口为标准人口。 ②以乙地人口为标准人口。

③以甲乙两地人口合计为标准人口。

(2)分别用以下标准死亡率死亡率间接法标准化比较两地女性乳腺癌死亡率,并讨论:①以甲地死亡率为标准死亡率。 ②以乙地死亡率为标准死亡率。

③以甲乙两地相同年龄组死亡数之和除以人口数之和求出两地合

并年龄别死亡率,以此为标准死亡率。

甲、乙两地女性乳腺癌死亡率(1/10万)资料

25

年龄组 (岁) 0~ 30~ 40~ 50~ 60~ 70~ 合计

甲 地

人口数 193740 55400 43500 38500 25400 12300 368840

人口分布 0.53 0.15 0.12 0.10 0.07 0.03 1.00

死亡数 2 6 12 14 9 4 47

死亡率 1.03 10.83 27.59 36.36 35.43 32.52 12.74

人口数 229800 65400 41000 29800 17300 11200 394500

乙 地 人口分布 0.58 0.17 0.10 0.08 0.04 0.03 1.00

死亡数 3 5 13 11 7 5 44

死亡率 1.31 7.65 31.71 36.91 40.46 44.64 11.15

25.甲、乙两地慢性阻塞性支气管炎患病率资料见下表:

(1)分别用以下标准人口通过直接法标准化来比较两地慢性阻塞性支气管炎患病率,并讨论:①以甲地人口为标准人口。 ②以乙地人口为标准人口。

③以甲乙两地人口合计为标准人口。

(2)分别用以下标准通过间接法标准化来比较两地慢性阻塞性支气管炎患病率,并讨论:①以甲地患病率为标准患病率。 ②以乙地患病率为标准患病率。

③以甲乙两地相同年龄组患病数之和除以人口数之和求出两地合

并年龄别患病率,以此为标准患病率。

甲、乙两地慢性阻塞性支气管炎患病率资料

年龄组 (岁) 0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 合计

人口数 12100 34200 83400 53400 49700 32100 28900 14300 308100

甲 地 人口分布% 3.93 11.10 27.07 17.33 16.13 10.42 9.38 4.64 100.00

患病人数 54 120 965 1284 5369 3864 4036 2785 18477

患病率% 0.45 0.35 1.16 2.40 10.80 12.04 13.97 19.48 5.99

人口数 12300 39800 96350 63200 58600 49320 36200 18300 374070

乙 地 人口分布% 3.29 10.64 25.76 16.90 15.67 13.18 9.68 4.89 100.00

患病人数 32 63 868 986 4621 4952 6351 5398 23271

患病率% 0.26 0.16 0.90 1.56 7.89 10.04 17.54 29.50 6.22

26. 设一配对设计的病例-对照研究资料,用非条件logistic回归作分析,对结果有什么影响?

27. 某人在分析疾病发生与X1和X2两变量关系时,单个引入X1或X2都有统计学意义,但两变量同时引入时却都没有统计学意义,为什么?

28. 在随访某工厂1000人的队列研究中,暴露于危险因素(苯)的900人

26

中有194人出现白细胞减少,非暴露人群100人中有21人出现该症状。再随访另一工厂1000人,暴露组100人中有6人出现白细胞减少,非暴露组900人中则有29人出现该症状。两工厂的资料合并得表。

两工厂资料的合并

D+ D- 合计

E+ 200 800 1000

E- 50 950 1000

合计 250 1750 2000

试用经典方法估计OR值并做?2检验,再用单因素logistic回归估计OR并做Wald检验,比较结果。进一步讨论各工厂分开分析与合并分析结果的差异及解决方法。

27