统计学习题

考核分为3部分:

1. 平时成绩,主要以到课情况为依据。一般占总成绩10%左右。

2. 上机SAS软件操作考试。一般占总成绩的20%~40%。 3. 期末卷面理论考核,占总成绩的50%~70%。

下面的统计学试题供同学们参考:

《卫生统计学》考试题库

目 录

第一章 绪论 第二章 定量资料的统计描述 第三章 正态分布

第四章 总体均数的估计和假设检验 第五章 方差分析

第六章 分类资料的统计描述

第七章 二项分布与Poisson分布及其应用 第八章 χ2检验 第九章 秩和检验 第十章 回归与相关 第十一章 常用统计图表 第十二章 实验设计 第十三章 调查设计

第十四章 医学人口统计与疾病统计常用指标 第十五章 寿命表

第十六章 随访资料的生存分析

附录:单项选择题参考答案

第一章 绪论

一、名词解释

1. 参数 (parameter) 2. 统计量 (statistic) 3. 总体 (population)

4. 样本 (sample) 5. 同质 (homogeneity) 6. 变异 (variation)

7. 概率 (probability) 8. 抽样误差 (sampling error) 二、单选题

1.在实际工作中,同质是指:

A.被研究指标的影响因素相同 B.研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小 E.以上都对

2. 变异是指:

A.各观察单位之间的差异 B.同质基础上,各观察单位之间的差异 C.各观察单位某测定值差异较大 D.各观察单位有关情况不同 E.以上都对

3.统计中所说的总体是指:

A.根据研究目的而确定的同质的个体之全部 B.根据地区划分的研究对象的全体

C.根据时间划分的研究对象的全体 D.随意想象的研究对象的全体

E.根据人群划分的研究对象的全体 4. 统计中所说的样本是指:

A.从总体中随意抽取一部分 B.有意识地选择总体中的典型部分

C.依照研究者的要求选取有意义的一部分 D.从总体中随机抽取有代表性的一部分

E.以上都不是

5.按随机方法抽取的样本特点是:

A.能消除系统误差 B.能消除随机测量误差 C.能消除抽样误差

D.能减少样本偏性 E.以上都对

6.统计学上的系统误差、测量误差、抽样误差在实际工作中:

A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免

E.只有抽样误差不可避免 7.统计工作的基本步骤是:

A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、搜集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对

8.统计工作的关键步骤是:

A.调查或实验设计 B.整理分组 C.收集资料 D.审核资料 E.分析资料 9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是:

A.这300名高血压患者 B.这300名高血压患者的血压值

C.所有的高血压患者 D.所有的高血压患者的血压值 E.这种药物 10.抽样误差是由:

A.计算引起 B.测量引起 C.抽样引起 D.采样结果不准引起 E.试剂、仪器未经校正引起 11.抽样误差指的是:

A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D.不同的总体参数之差 E.以上都不是

12.习惯上,下列属于小概率事件的为:

A. P=0.09 B. P=0. 10 C. P=0.15 D. P=0.03 E.以上都不是 13.治疗效果判定资料属于

A. 计量资料 B. 计数资料 C. 等级资料 D. 无序分类资料 E. 以上都不是 14.概率P的范围:

A. -1≤P≤1 B. 0

1、 统计学的基本步骤有哪些? 2、 总体与样本的区别与关系?

3、 抽样误差产生的原因有哪些?可以避免抽样误差吗? 4、 何为概率及小概率事件?

第二章 定量资料的统计描述

第三章 正态分布

一、名词解释

1. 正态分布 (normal distribution) 2. 中位数 (median) 3. 四分位数间距 (quartile interval) 4. 方差 (variance) 5. 正偏态分布 (positively skewed distribution) 6. 负偏态分布 (negatively skewed distribution) 7. 对数正态分布 (logarithmic normal distribution ) 8. 医学参考值范围 (medical reference range) 二、单选题

1. μ确定后,δ越大, 则正态曲线:

A.越陡峭 B. 形状不变 C. 越平缓 D.向左移动 E.向右移动

2. 平均数可用于分析下列哪种资料:

A.统计资料 B.等级资料 C.计数资料 D.计量资料 E.调查资料

3. 常用的平均数指标有:

A.样本均数、总体均数、中位数 B.算术均数、总体均数、几何均数 C.算术均数、几何均数、中位数 D.中位数、样本均数、几何均数 E.以上都不对

4. 描述一组正态或近似正态分布资料的平均水平用:

A.算术均数 B.几何均数 C.中位数 D.平均数 E.以上均是 5. 用

/n公式计算均数的方法称为:

A.加权法 B.简捷法 C.目测法 D.平均法 E.直接法 6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:

A.减一个组距 B.加一个组距 C.减半个组距 D.加半个组距 E.以上均不对

7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标: A.几何均数 B.中位数 C.平均数 D.均数 E.算术均数

8. 用频数表法计算均数时,组中值应为:

A.(本组段下限值+本组段上限值)/2 B.(本组下限值+下组下限值)/2 C.(本组下限值+下组上限值)/2 D.本组段的上限值 E.本组段的下限值

9. 原始数据加上一个不为0的常数后: A. D.

不变、CV变 B. 变、CV不变 E.

变或CV变 C. 、CV均改变

不变、CV不变

10. 对于对称分布的资料来说:

A.均数比中位数大 B.均数比中位数小 C.均数等于中位数 D.均数与中位数无法确定孰大孰小 E.以上说法均不准确 11. 血清学滴度资料最常计算_______以表示其平均水平。

A.均数 B.中位数 C.几何均数 D.全距 E.标准差 12. 利用频数表及公式 M=L+i/fn (n/2- fL )计算中位数时:

A.要求组距相等 B.不要求组距相等 C.要求数据呈对称分布

D.要求变量值都比较接近 E.要求数据呈对数正态分布

13. 对于同一份正偏态的资料, 求得的几何均数与算术均数:

A.几何均数大于算术均数 B.几何均数小于算术均数

C.几何均数等于算术均数 D.几何均数可以大于算术均数,也可以小于算术均数

E.以上说法都不对

14. 原始数据同时乘以一个既不等于零也不等于1的常数后: A. 变 D.

不变,M变(M为中位数) B.

与M都不变 C.

变、M不

与M都变 E.以上都不对

15. 表示变量值变异情况的指标最常用的是:

A.四分位数间距 B.全距 C.标准差 D.变异系数 E.方差 16. 一组计量资料中,每个变量值与均数之差的平方和、除以变量值的个数-1,

再开平方所得的值为: A.方差 B.全距 C.四分位数间距 D.变异系数 E.标准差 17. 标准差一定:

A.不比均数大 B.不比均数小 C.取决于均数 D.比标准误小 E.以上都不对

18. 变异系数CV的数值_________

A.一定小于1 B.一定大于1 C.可大于1;也可小于1 D.一定不会等于零 E.一定比S小

19. 比较身高和体重两组数据变异度大小宜采用:

A.全距 B.四分位数间距 C.方差 D.变异系数 E.标准差

20. 描述一组偏态分布资料的变异度,以______指标较好。 A. R B. S2 C. Q D. S E. CV

21. 当两组(或几组)资料均数相近、度量单位相同时,标准差大的那组资料:

A.均数的代表性最差 B.均数的代表性最好 C.无法据此判断出均数的代表性 D.均数也最大 E.以上都不对

22. 一组数据呈正态分布,其中小于

+2.58S的变量值有:

A. 5% B. 95% C. 97.5% D. 92.5% E. 99.5%

23. 若正常人血铅含量近似对数正态分布,拟用300名正常成人血铅确定99%正常值范围,最好采用下列哪个公式: A.

+2.58S B. lg-1 (

lgx +2.58slgx ) C.

±2.58S

lgx

D. P99 =L+i/f99 (300×99/100- fL ) E. lg-1 (+2.33Slgx )

24. 某市120名12岁男孩平均身高=143.10cm,S=5.67cm,则身高在128.24-157.96cm范围内的理论频数最接近下列哪个值?

A. 114 B. 119 C. 64 D. 72 E. 96 25. 若上海市健康女工744人血红蛋白含量的均数为12.239g%,标准差为0.998g%,则下列哪个最有理由认为是正常范围:

A. 11.24-11.3237 B. 9.654-14.814 C. 10.283-14.195 D. 10.592-13.886 E. 10.952-13.516 三、简答题

描述数值变量资料集中趋势的指标有哪些?其适用范围有何异同? 描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同?

医学中参考值范围的涵义是什么?确定的步骤和方法是什么? 四、计算分析题

1.某市100名7岁男童的坐高(cm)如下:

63.8 64.5 66.8 66.5 66.3 68.3 67.2 68.0 67.9 69.7 63.2 64.6 64.8 66.2 68.0 66.7 67.4 68.6 66.8 66.9 63.2 61.1 65.0 65.0 66.4 69.1 66.8 66.4 67.5 68.1 69.7 62.5 64.3 66.3 66.6 67.8 65.9 67.9 65.9 69.8 71.1 70.1 64.9 66.1 67.3 66.8 65.0 65.7 68.4 67.6 69.5 67.5 62.4 62.6 66.5 67.2 64.5 65.7 67.0 65.1 70.0 69.6 64.7 65.8 64.2 67.3 65.0 65.0 67.2 70.2 68.0 68.2 63.2 64.6 64.2 64.5 65.9 66.6 69.2 71.2 68.3 70.8 65.3 64.2 68.0 66.7 65.6 66.8 67.9 67.6 70.4 68.4 64.3 66.0 67.3 65.6 66.0 66.9 67.4 68.5

⑴ 编制其频数分布表并绘制直方图,简述其分布特征;

⑵ 计算中位数、均数、几何均数,并说明用其中哪一种来表示这组数据的集中趋势为好?

⑶ 计算极差、四分位数间距、标准差,并说明用其中哪一种来表示这组数据的离散趋势为好?

(4)计算坐高在64.0cm到68.0cm范围内的7岁男童比例。

(5)计算100名7岁男童中坐高在64.0cm到68.0cm范围内的人数。 2. 用玫瑰花结形成试验检查13 名流行性出血热患者的抗体滴度,结果如下,求平均滴度。

1:20 1:20 1:80 1:80 1:320 1:320 1:320 1:160 1:160 1:80 1:80 1:40 1:40

3. 调查某地145名正常人尿铅含量(mg/L)如下:

尿铅含量 0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 例 数 18 26 39 28 25 6 1 2

⑴求中位数; ⑵求正常人尿铅含量95%的正常值范围。

第四章 总体均数的估计和假设检验

第五章 方差分析

一、名词解释

1 标准误(standard error) 2 可信区间(confidence interval)

3 假设检验(hypothesis testing) 4 统计推断(statistical inference)

5 Ⅰ型错误(type I error) 6 Ⅱ型错误(type II error) 7 检验效能(power of test) 8 变量变换 (variable transformation) 二、单选题

1 ________小,表示用该样本均数估计总体均数的可靠性大。 A. CV B. S C.

D. R E. 四分位数间距

2 统计推断的内容是__________。

A. 用样本指标估计相应总体指标 B. 检验统计上的“假设” C. A,B均不是 D. A,B均是 E. 估计参考值范围 3 两样本均数比较时,分别取以下检验水准,以________所对应的第二类错

误最小。

A. 0.01 B. α=0.05 C. α=0.10 D. α=0.20 E. α=0.25

4 方差分析中,当P<0.05时,结果________。

A. 可认为各样本均数都不相等 B. 可认为各总体均数不等或不全等

C. 可认为总体均数都不相等 D) 证明总体均数不等或不全相等

E. 以上都不对

5 变量变换的目的是_______。

A. 方差齐性化 B. 曲线直线化 C. 变量正态化 D. A,B,C均对 E. A,B,C均不对

6 甲乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两

个样本,求得,则理论上_________。

A.

B. 作两样本均数的t检验,必然得出无差别的结论 C. 作两方差齐性的F检验,必然方差齐

D. 分别由甲、乙两样本求出的总体均数的95%可信区间,很可能有重叠 E. 以上均不是 7. 在相同自由度(

)及F值时,方差齐性检验与方差分析所得的P值_______。

A. 前者大 B. 前者小 C. 两者相等 D. 前者是后者的两倍 E. 后者是前者的两倍

8. 正态性检验中,按α=0.10水准,认为总体服从正态分布,此时若推断有错,此错误的概率为___________。 A. 大于0.10 B. 小于0.10 C. 等于0.10 D.β,而β未知

E. 1-β,而β未知

9. 在正态总体中随机抽样,A. 1.96σ B. 1.96E.

的概率为5%。

C. 2.58 D.

10. 成组设计的方差分析中,必然有_____________。 A. C.

E. 以上均不对

11. 配伍组设计的方差分析中,

等于__________。

B.

D.

A. B. C.

D.

12. 在相同自由度(

界值________。

E.

)及α水准时,方差分析的界值比方差齐性检验的

A. 大 B. 小 C. 相等 D. 前者是后者的两倍 E. 不一定

13. 下面可用来说明均数抽样误差大小的是________________。

A.

B.

C. S D. CV E. 四分位数间距

14. 对于一组样本来说,若标准差固定不变,可通过_______________来减少

抽样误差。

A. 增大样本含量 B. 增大样本均数 C. 减小变异系数 D. 减小几何均数 E. 以上都不对 15. 以下关于抽样误差,正确的是____________。

抽样误差仅是由个体变异产生的,抽样造成的样本统计量与总体参数的差异

A. 抽样研究中,抽样误差是可以避免的

B. 对于同一总体的若干样本统计量间,也存在抽样误差 C. 抽样误差的大小可用标准差来说明 D. 以上均不对

16. 以下关于t分布不正确的是________.

A. 在相同自由度时,|t|值越大,概率P越小

B. 在相同t值时,双尾概率P为单尾概率P的两倍 C. t分布曲线是一条曲线

D. t分布的极限分布是标准正态分布 E. 标准正态分布可看作是t分布的特例

17. 以下关于可信区间,正确的是_________。

A. 可信区间是包含未知总体参数的一个范围

B. 可信区间包含可信区间上下限两个值

C. 可信区间的确切含义是指有(1-α)的可能认为计算出的可信区间包含了总体参数 D. 可信区间的确切含义也可理解是总体参数落在该范围的可能性为1-α E. 以上说法均不对

18. 为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿n(<50)

人,测得其血红蛋白的平均数为,标准差为S,则该地1岁婴儿血红蛋

白的平均浓度的95%可信区间为__________。(总体标准差σ未知) A. C. E.

B. D.

19 当两总体确有差异,按规定的检验水准α所能发现该差异的能力的是

____________.

A. α B. β C. 1-α D. 1-β E. 以上都不对

20 设α为Ⅰ型错误的概率,β为Ⅱ型错误的概率,当两总体均数确定且抽

取的样本含量不变时,有_____________。

A. α增大,β减小 B. α增大,β增大 C. α减小,β减小 D. α的改变不影响β的大小 E. 以上均不对

21 在两个样本均数的假设检验中,若要同时减小Ⅰ型错误和Ⅱ型错误,则

必须_____________。

A. 增加样本含量 B. 减小容许误差 C. 减小总体标准差 D. A和C E. 以上都不对

22 关于假设检验,以下不对的是_______________。

A. 根据样本统计量作出的推断结论具有概率性,因此其结论有可能出现判断错误

B. 当根据样本作出的结论是拒绝H0时,只可能犯Ⅰ型错误,不可能犯Ⅱ型错误

C. 当根据样本作出的结论是接受H0时,只可能犯Ⅱ型错误,不可能犯Ⅰ型错误

D. 当两总体确有差异时,按规定的检验水准所发现该差异的能力是β E. 以上均不对

23. 关于可信区间和假设检验,不正确的是_____________。

A. 可信区间可回答假设检验的问题

B. 可信区间用于说明量的大小,假设检验用于推断质的不同 C. 可信区间比假设检验可提供更多的信息

D. 可信区间亦可回答假设检验的问题,但可信区间不可完全代替假设检

验 E. 以上结论均不对

24. 方差分析中对数据的要求是________。

A. 任何两个观察值之间均不相关 B. 每一水平下的观察值分别服从总体均数为C. 各总体的方差齐性 D. A,B和C均对 E. B和C对

25. 若假设检验结果为 |t|≥

,则说明_________________。

的正态分布

A. 差异由抽样误差所致的概率等于或小于0.05 B. 差异由抽样误差所致的概率大于0.05 C. 差异由抽样误差所致的概率等于或大于0.05

D. 差异是由于本质上有所不同所致的概率等于或小于0.05 E. 差异是由于本质上有所不同所致的概率等于0.05 26. 要比较的两组数值型资料呈明显偏态分布,

,此时宜采用哪种检验方法?

均小于30,且经统计检验

A. t检验 B. u检验 C. t′检验 D. 秩和检验 E. F检验

27. 成组资料方差分析中,若

A.

B.

,则____________。

C.

D. F≠1 E. 尚不能作结论

28. 统计推断中,可信度是指_____________。

A. α B. β C. 1- α D. 1-β E. 以上均不对 29. 两样本均数的比较,可用____________。

A. 方差分析 B. t检验 C. u检验 D. A,B,C均可 E. 仅A,B都可

30. 两小样本数值变量资料比较的假设检验,首先应考虑___________ 。

A. 用u检验 B. 用t检验 C. 用秩和检验 D. 资料符合秩和检验还是t检验的条件 E. 以上均不对

31. 两样本均数比较,经t检验,差别有显著性时,P越小,说明__________ .

A. 两总体均数差别越大 B. 两总体均数差别越小 C. 越有理由认为两总体均数不同 D. 越有理由认为两样本均数

不同

E. 以上均不对

32 对15名4~6月贫血儿童用拘橼酸铁铵+维生素C治疗前后侧的血色素含量(g%)见下表。

血色素含量 治疗前 1 2 ? 14 15 11.5 10.7 ? 9.5 10.0 治疗1月 10.4 11.0 ? 10.1 10.5 治疗2月 12.0 12.0 ? 12.1 11.3 治疗3月 12.0 13.0 ? 13.5 12.5 假定资料满足各种参数检验所要求的前提条件,那么,适合分析该资料的方法是 A.

检验 B. 单因素方差分析 C. t检验

D. 配伍组设计方差分析 E. 秩和检验 三、 简答题

1 假设检验的基本原理和步骤。 2 标准差和标准误的异同。

3 参考值范围和置信区间有何区别?

4 t检验和方差分析的基本思想各是什么?二者的区别是什么? 5 t检验和方差分析的应用条件有何异同?

6 以随机区组设计的两因素方差分析为例,简述方差分析的基本原

理。 7 可信区间和假设检验的区别和联系。

8 配对t检验与两样本t检验的基本原理有何不同。

四、计算分析题

1. 将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前与治疗后一个月的血沉( mm/ 小时)如下表。试问: (1)甲、乙两药是否均有效?

(2)甲、乙两药的疗效是否有无差别?

甲、乙两药治疗前后的血沉(mm/ 小时)

病人号 甲 药

1 2 3 4 5 6 17 14 6 16 15

7 18 12 7 20 18

8 18 15 8 21 12

9 15 13 9 20 17

10 19 13 10 20 14

治疗前 20 23 16 21 20 治疗后 16 19 13 20 20 病人号

1

2

3

4

5

治疗前 19 20 19 23 18 治疗后 16 13 15 13 13

乙 药

2. 胃溃疡患者12人在施行胃次全切除术的前后,测定体重(kg)如下,问手术前后体重有无变化? 患者 术前 术后

1

52.5 72.5

2

48 51.5

3

39

4

46

5 6 7

49 52

8

58 52

9 10 11 12

51 50.5

43 50

13 41

50 54

58.5 47.5 49

55

40 52.5

3. 某医师研究血清转铁蛋白测定对病毒性肝炎诊断的临床意义,测得11名正常人和13名病毒性肝炎患者血清转铁蛋白的含量(U/L),结果如下,问患者和健康人转铁蛋白含量是否有差异?

正常人(n1=11) 260.5 271.6 264.1 273.2 270.8 284.6 291.3 254.8 275.9

281.7 268.6

病毒性肝炎患者(n2=13) 221.7 218.8 233.8 230.9 240.7 256.9

253.0 224.4 260.7 215.4 251.8 224.7 228.3 4. 某地区1999年测定了30岁以上正常人与冠心病病人的血清总胆固醇含量,资料如下表。试检验正常人与冠心病病人血清总胆固醇含量的差别有无显著性。

正常人与冠心病病人血清总胆固醇(mmol/L)含量 测定人数 56 142

标准误 0.12 0.10

组 别 正常人 病人

均数 4.67 5.78

标准差 0.88 1.18

5. 为试验三种镇咳药,先以NH4OH 0.2ml对小白鼠喷雾,测定其发生咳嗽的时间,然后分别用药灌胃,在同样条件下再测定发生咳嗽的时间,并以“用药前时间减去用药后时间”为指标,计算延迟发生咳嗽的时间(秒),数据如下。试比较三种药的镇咳作用。

可 待 因 60 30 100 85 20 55 45 30 105

复方2号 50 20 45 55 20 15 80 10 75 10 60 45 40

30 复方1号 40 10 35 25 20 15 35 15 30 25 70 65 45

50 6. 经产科大量调查得知,某市婴儿出生体重均数为3.32kg,标准差为0.38kg,今随机测得36名难产儿的平均体重为3.43kg,问该市难产儿出生体重的均数是否比一般婴儿出生体重均数高?

7. 已知某地120名正常成人脉搏均数为73.2次/分,标准差为8.1次/分,试估计该地正常成人脉搏总体均数的95%可信区间。

8. 请根据所给基本数据完成下列方差分析表。

分 组 A B C D

n 8 6 5 8

S 3.543 5.329 5.431 7.463

24.375 32.00 22.00 21.00 方差分析表

变异来源 组间变异 组内变异 总变异

SS

ν

MS

F

第六章 分类资料的统计描述

一、名词解释

1.率(rate) 2.构成比(constituent ratio) 3.相对比(relative ratio) 4.标准化率(standardized rate) 5.标化发病比(standardized incidence ratio)

6.标化死亡比(standardized mortality ratio) 二、单选题

1.某医院的资料,计算了各种疾病所占的比例,该指标为: A.发病率 B.构成比 C.相对比 D.标化发病率 E.标化发病比

2.男性吸烟率是女性的10倍,该指标为:

A.相对比 B.流行率 C.构成比 D.罹患率 E.标化流行率 3.对两地的高血压患病率进行标准化,仅有两地各年龄组人口数和总患病率资料,

可采用的标准化方法为: A.直接法 B.间接法 C.倒求法 D.等比法 E.以上都不是

4.只有各年龄组的发病率资料,用 方法计算标化发病率。 A.直接法 B.间接法 C.倒求法 D.等比法 E.以上都不是

5.欲反映某种疾病对人群的威胁程度,计算 指标。 A.某病病死率 B.某病患病率 C.某病死亡率 D.某病构成比 E.以上都不是

6.各年龄组人口数和死亡率资料均有,最好用 方法计算标化死亡率。 A.直接法 B.间接法 C.倒求法 D.等比法 E.以上都不是

7.SMR为: A.实际死亡数/预期死亡数 B.预期死亡数/实际死亡数 C.实际发病数/预期发病数 D.预期发病数/实际发病数 E.以上都不是

8.SIR为: A.实际死亡数/预期死亡数 B.预期死亡数/实际死亡数 C.实际发病数/预期发病数 D.预期发病数/实际发病数 E.以上都不是

9.间接标准化法计算标化死亡率是: A. SIR?标准人口死亡率 B. SIR?标准人口总数 C. SMR?标准人口死亡率 D. SMR?标准人口总数

E. 以上都不是

10.间接标准化法计算标化发病率是: A. SIR?标准人口发病率 B. SIR?标准人口总数 C. SMR?标准人口死亡率 D. SMR?标准人口总数 E. 以上都不是

11.对甲乙两县的死亡率进行标准化,若两县均有各年龄组死亡率,最好选择 为 标准进行标化。

A.两县各年龄组人口数合并 B.甲县的人口构成资料

C.乙县的人口构成资料 D.全国或省人口普查所得的人口构成 E.以上都不是

12. 观察何种疾病死因是造成当地居民死亡的主要死因,用

A. 死亡率 B.死因构成比 C.疾病别死亡率 D. 某病病死率 E.生存率 13. 衡量爆发性疾病发病的频度用

A.发病率 B.罹患率 C.患病率 D.二代罹患率 E.感染率

14. 某厂男职工370人,女职工456人,慢性苯中毒人数男女分别为8和10人, (456/370)?100%为

A.率 B.构成比 C.相对比 D.平均率 E.标化患病比 三、简答题

1.某地1956年婴儿死亡人数中死于肺炎者占总死亡数的16%,1976年则占18%,某医师认为该地20年来对婴儿肺炎的防治效果不明显。你同意他的观点吗?为什么?

2.已知甲乙两矿总职工数分别为20856人和3911人,甲矿工龄<6年、6~9年、10年以上的职工数分别为14029、4285、2542人,乙矿三个工龄组的职工数分别为992、1905、1014人,甲乙两矿尘肺总人数分别为604人和127人。两矿的尘肺发病率能否直接比较?为什么?怎样才能得出正确结论?

3.某医师研究了两种疗法对糖尿病的治疗效果,甲疗法治疗了50例,好转30例,乙疗法治疗了10例,好转5例,计算两种疗法的平均好转率为55%,你认为正确吗?为什么?

4.某医师用自拟药方治疗肿瘤患者,治疗了5人,均有明显疗效,该医生报告

该配方的显效率为100%。你认为合适吗?为什么?怎样才能得出可靠的结论?

四、计算题

1.某研究组调查了城镇25岁以上居民高血压患病率,在北方城镇检查了8450人,其中976人被确诊为高血压,在南方城镇检查了10806人,有1052人被确诊为高血压,试计算南北方城镇的高血压患病率。

2.1995年某研究组对武汉市江汉区中学生的吸烟情况、吸烟原因进行了调查,共查1722人,男生839人,172人吸烟,女生883人,17人吸烟;抽烟的主要原因有解除烦恼(64人)、显示气派(45人)、帮助社交(43人)、帮助思考(16人)、显示富有(12人)和其它(9人),试计算:①男女生吸烟率,②男女生吸烟率之比,③计算各种吸烟原因所占的百分构成比,找出前三位的吸烟原因,并描述分析结果。

3.某医生欲研究甲乙两所大学35岁及以上的知识分子中高血压的患病情况,检查了两校35岁及以上的全部知识分子,得到如下资料。试对两校的患病情况进行比较,得出正确的结论。

甲乙两校35岁及以上知识分子的高血压患病率

年龄 甲校 乙校 (岁) 检查人数 病人数 患病率(%) 检查人数 病人数 患病率(%) 35~ 236 16 6.78 478 33 6.90 45~ 375 27 7.20 379 28 7.39 55~ 384 38 9.90 235 24 10.21 65~80 402 59 14.68 157 24 15.29 合计 1397 140 10.02 1249 109 8.73 4.某研究组欲研究经常在街头小餐点就餐(平均每天一次及以上)的中学生是否乙肝病毒的感染率较高。在某地随机抽取了200名中学生,询问他们是否经常在小餐点就餐,并检查乙肝病毒感染情况。结果发现经常在小餐点就餐者89人 ,乙肝感染率为6.74%,不经常者111人,感染率为4.50%,试计算两类中学生乙肝感染率的标准误及总体乙肝感染率95%的可信区间。

第七章 二项分布与Poisson分布及其应

第八章 χ检验

2

第九章 秩和检验

一、单选题

1.在以下检验方法中,________不属于非参数统计方法。 A. t检验 B. H检验 C. T检验 D.

检验 E. t检验和

检验

2.两数值变量资料的小样本比较的假设检验,首先应考虑

A.用t检验 B.用u检验 C.用秩和检验 D.t检验和秩和检验均可 E.资料是否符合t检验的条件 3.等级资料比较时应选用________ 。 A.t检验 B.t'检验 C.

检验 D.秩和检验 E.方差分析

4.在作两样本均数比较时,n1、n2均小于30、总体方差不齐且极度偏态的资料宜用________。

A. t'检验 B. t检验 C. u检验 D.秩和检验 E. t'检验、秩和检验均可

5.设有X、Y两组数据,求得,经统计学检验,在α=0.05水平上拒绝H0:β=0,则至少有95%的把握断言y与x之间在专业上有直线关系。这一结论 A.根据充分 B.很有科学性 C.脱离实际 D.略有问题 E.毫无根据 6.在针刺麻醉下对三组患者进行肺切除手术,效果分四级,资料见下表(表中的数字为例数)。试分析三组患者的差别有无显著性意义。 针麻效果 Ⅰ Ⅱ Ⅲ Ⅳ 合计 患者分组 肺化脓症组 肺结核组 24 48 41 65 33 36 7 8 105 157 肺癌组 10 17 19 4 50 合计 82 123 88 19 312 问最适合于分析该资料的方法是

A.

检验 B.Q检验 C.秩和检验 D. F检验 E. t检验

=25,试计算标准差s。

7.设x是一个服从泊松分布的随机变量,已知

A.25 B.5 C.25/n D.5/n E.n/25 8.当自由度趋向无穷大,且π不接近于0也不接近于1时,二项分布趋向于________。

A.

分布 B.F分布 C.正态分布 D.t分布 E.u分布

9.用大剂量Vit. E治疗产后缺乳,以安慰剂作对照。Vit. E组中有效者12例,无效者6例;安慰剂组中有效者3例,无效者9例。问Vit. E是否有效?为了回答这个问题,应选用 A.检验

检验 B. t检验 C. F检验 D. Fisher精确检验 E. Q

10.设有资料如下表(表中数字为各种血型的人数):

ABO血型 O A B AB MN血型 N 490 410 587 179 M 431 388 495 137 MN 902 800 950 32 问两种血型系统之间是否有联系,应选用的统计分析方法是 A. 秩和检验 B.差分析

检验 C. Ridit分析 D. Kappa检验 E.方

11.用非若洛治疗不同类型关节炎的结果如下: 组别 类风湿性关节炎 风湿性关节炎 骨性关节炎 有效例数 140 50 18 总例数 165 77 40 有效率(%) 84.85 64.94 45.00 判断该药治疗不同类型关节炎的疗效之间的差别有无显著性意义,应选用的统计分析方法是

A. 等级相关分析 B. Kappa检验 C.E. t检验

检验 D. 线形趋势检验

12.设事件A是一个稀有事件,在大量试验中,它发生x次的概率为

其中λ为事件A的平均发生次数。问x是一个服从什么分布的随机变量?

A. 正态分布 B. 二项分布 C. t分布 D. 泊松分布 E.布

13.设某事件在每次试验中成功的概率为p,失败的概率为q=1-p,在n次试验中,该事件成功k次的概率为:分布?

,问成功次数k服从什么

A. 泊松分布 B. 二项分布 C. 正态分布 D .F分布 E.布

14.设1000有名受试者,分别接受ABO血型系统和MN血型系统的检查,根据检查结果,按(O、A、B、AB)和(M、N、MN)的12种组合分别计数,得到一个4×3列联表。为检查两种血型系统之间是否独立,需要某种检验方法,其自由度应为:

A. 998 B. 6 C. 999 D. 11 E. 12

15.为观察药物A、B对某病治愈率的差异有无显著性意义,某医生将100例该病患者随机分成两组,其中一组40人,服用A药;另一组60人,服用B药。结果发现,服用A药的人中有30人治愈;服用B药的人中有11人治愈。应选用的统计学方法是:

A.回归分析 B. 加权差分析

检验 C.

检验 D. Kappa检验 E.方

16.为了解两种治疗方法对原发性肝癌的疗效,将病人随机分成两组,一组使用5-氟尿嘧啶+辅助疗法(简称5-氟组),另一组使用安慰剂+辅助疗法(简称安慰组)。治疗结果按缓解、死亡划分。5-氟组12人,其中7人缓解,5人死亡;安慰组11人,其中4人缓解,7人死亡。在分析两种疗法的疗效差异有无统计学意义时,应选用的统计学分析方法是

A.

检验 B. Fisher精确检验 C. logistic回归分析

D. Ridit分析 E.方差分析

17.某医院用三种方案治疗急性无黄疸型病毒性肝炎254例,观察结果见下表: 治疗方案 西药组 中药组 中西医结合组 合计 组别 显效 5 22 11 38 无效 49 45 15 109 好转 31 9 28 68 痊愈 15 4 20 39 合计 100 80 74 254 欲比较三组疗效之间的差异有无统计学意义,应选用

A.检验 B. Ridit分析 C. 方差分析

D. Fisher精确检验 E. Kappa检验

18.某医院为了探讨流行性出血热的临床发病情况与其治疗原则之间的关系,收集了446例病情转化资料(见下表),试选择适当的分析方法来研究早期分度与最后定型之间的关系。 早期分度 轻度 中度 重度 合计 A.

最后定型 中型 危重型 21 1 163 20 1 124 185 145 轻型 111 5 0 116 合计 133 188 125 446 检验 B. Ridit分析 C. Fisher精确检验 D. Kappa检验 E.

方差分析

19. 对于以下资料,要分析不同类型气管炎疗效间的差异是否有显著性意义,

应该选用什么统计分析方法? 类型 甲型 乙型 合计 A.

疗效 控制 65 42 107 显效 18 6 24 有效 30 23 53 无效 13 11 24 合计 126 82 208 检验 B.Ridit分析 C.Fisher精确检验 D.Kappa检验 E.

方差分析

20.用6.5Gy不均匀照射狗,照射后早期动物呕吐发生例数如下。要了解三组呕吐发生率之间的差异是否有显著性意义,应选用什么统计分析方法? A. 回归分析 B.Kappa检验

检验 C.方差分析 D. Fisher精确检验 E.

21.某医院三年间四种甲状腺疾病在四个季节中发病情况如下表。为了解四种甲状腺疾病在四个季节中发病人数分布之间的差异是否有显著性意义,应选用什么统计分析方法?

甲状腺疾病分类 季节 合计 甲亢 亚甲炎 甲低 甲状腺肿瘤 合计 A.

春 411 249 60 45 765 夏 秋 冬 451 294 284 1440 329 331 204 1113 61 59 52 232 50 46 40 181 891 730 580 2966 检验 B. Ridit分析 C. 秩和检验

D.线性趋势检验 E. Fisher精确检验 22.在四格表

检验中,若?2值为6.86,则

A. P>0.05 B. P<0.05 C. P=0.01 D. P<0.01 E. P>0.05 23.以下关于非参数检验的描述哪一项是错误的 A.非参数方法不依赖于总体分布类型

B.应用非参数检验时不考虑被研究对象的分布类型 C.非参数检验的效能低于参数检验

D.一般情况下非参数检验犯第二类错误的概率小于参数检验 E.非参数检验方法用于分布间的比较

24.对于满足参数检验条件的数值变量资料,如果采用秩和检验,则 A.第一类错误率增大 B.第二类错误率增大 C.第一类错误率减小 D.第二类错误率减小 E.两类错误率同时减小 25.两组或几组有序分类变量资料的比较宜用

A. t检验 B.回归分析 C.F检验 D.四格表?2检验 E.秩和检验或Ridit分析

26.在进行成组设计两样本秩和检验时,以下哪种检验假设是正确的 A.H0:两总体均数相等 H1:两总体均数不等 B.H0:两样本均数相等 H1:两样本均数不等

C.H0:两总体分布相同 H1:两总体分布不同 D.H0:两样本分布相同 H1:两样本分布不同 E.以上均不对

27.在进行Wilcoxon配对法秩和检验时,以下何种检验假设是正确的 A.H0:两样本对应的总体均数相同 B.H0:两样本均数相同

C.H0:两样本对应的总体分布相同 D.H0:两样本对应总体的中位数相同 E.H0:差值的总体中位数为0

28.进行两样本比较的假设检验时,应首先考虑选用

A.t检验 B.秩和检验 C.?2检验 D.任选一种检验方法 E.根据资料满足哪种检验的条件来决定 29.Ridit分析适用于:

A.偏态分布的数值变量资料的假设检验 B.方差不齐的几种正态分布资料的比较 C.有序分类变量资料的比较 D.多个样本率的比较 E.多组样本构成比的比较 30.Ridit分析属于:

A.参数检验 B.非参数检验 C.秩和检验 D.描述性分析 E.相关回归分析

31.设某地人群中糖尿病患病率为π,由该地随机抽查n人,则________。

A. n人中患糖尿病的人数x服从二项分布B(n,π) B. 样本患病率p=X/n服从B(n,π)

C. 患病人数与样本患病率均服从二项分布B(n,π) D. 患病人数与样本患病率均不服从二项分布B(n,π) E. 患病人数或样本患病率服从二项分布B(n,π)

32.设Xl,X2分别服从以μ1,μ2为均数的Poisson分布,且Xl与X2独立,则________服从以μ1+μ2为均数的Poisson分布。

A. X1十X2 B. X1一X2 C. Xl十X2与X1一X2均 D. X1十X2与X1—X2均不 E. X1十X2或X1一X2 33. ________的均数等于方差。

A. 正态分布 B. 对数正态分布 C. Poisson分布 D. 二项分布 E. 对称分布

34. ________时,二项分布B(n,n)近似正态分布。 A. n较大且π接近0 B. n较大且π接近1

C. n较大且π接近0或1 D. n较大且π接近0.5 E. π接近0.5 35. ________时,二项分布B(n,π)近似于以nπ为参数的Poisson分布。 A. n较大且π接近0 B. n较大且π接近1

C. n较大且π接近0或1 D. n较大且π接近0.5 E.π接近0.5 36.用二项分布直接计算概率法检验Ho:π=0.4 Hi:π>0.4。当随机样本含量n=10,阳性数X=6时,为作统计推断应将概率p=________与检验水准α比较。 A. p(X=6)

B. p(X=6)十p(X=7)十?十p(X=10) C. p (X=7)十p(X=8)十?十p (X=10)

D. p(X=6)十p(X=5)十?十p(X=0) E. p(X=5)十p(X=4)十?十p(X=0)

37.在样本率p与总体率π0比较时,用近似正态u检验的条件是________。 A. 样本含量n较大、总体率π0接近0.5 B. 样本含量n较大、总体率π0接近1 C. 样本含量n较大、样本率p接近0.5 D. 样本含量n较大、样本率p接近1 E. 样本率p不太小

38.从甲、乙两文中,查到同类研究的两个率比较的四格表资料,其χ2检验甲文χ2>χ20.01(1),乙文χ2>χ20.05(1),可认为________。

A. 两文结果有矛盾 B. 两文结果基本一致 C. 甲文结果更可信 D. 甲文结果不可信 E. 甲文说明总体的差别大 39.四个样本率作比较,χ2>χ

20.01(3)

,可认为________。

A. 各总体率不等或不全相等 B. 各总体率均不相等

C. 各样本率均不相等 D. 各样本率不等或不全相等 E.两个总体率相等

40.四格表的自由度________。

A. 不一定等于1 B. 一定等于1 C. 等于行数×列数 D. 等于样本含量减1 E. 以上都不对 41.χ2值的取值范围为________。

A.一∞<χ2<十∞ B. χ2≤1 C. 0≤χ2≤十∞ D.χ2≥1 E. —

2

∞≤χ≤0

42. 当自由度不变时,关于χ值与P值的关系,下列哪一项是正确的

2

A. χ2值越大,P值越大。 B. χ2值越大,P值越小。 C. χ2值变化时,P值不变。 D. χ2值变化时,P值变大或变小。

E. χ值变化时,P值可能变化也可能不变。 43.在χ2检验中,自由度的计算为

A. R×C B. n C. n-1 D.(R-1)×(C-1) E. R×C-2 44.作四格表χ2检验时,需进行连续性矫正的条件是

A. 1且n>40 B. b+c<40 C. T<1或n<40 D. T>5且n>40 E. b+c>40

45.检验计数资料的两种属性或特征之间有无关联时,常用的方法为

A. t检验 B. u检验 C. χ2检验 D. 秩和检验 E. 正态性检验 二、分析计算题

1.试就下表资料分析比较甲、乙两医院乳腺癌手术后的5年生存率(%)。

甲、乙两医院乳腺癌手术后的5年生存率(%)

腋下淋巴结转移 无 有 合计 甲医院 病例数 45 710 755 生存数 35 450 485 生存率 77.77 68.38 64.24 病例数 300 83 383 乙医院 生存数 215 42 257 生存率 71.67 50.60 67.10 2

2.已知某药的治愈率为60%。现欲研究在用此药的同时加用维生素C是否有增效作用,某医生抽取10名病人试用此药加用维生素C,结果8人治愈,请作统计推断。

3.欲了解A、B两地妇女的乳腺癌患病率是否相同,分别从两地抽样调查 1万妇女,结果A地患病人数为80人,B地102人。请作统计分析。若A地调查2万名妇女,160人患病,B地调查1万名妇女,102人患病,则统计结论是什么。

4.按国家规定平均每毫升饮用水中的细菌数不得超过100个,现从某饮用水随机抽取2毫升水测得细菌215个,问该水源是否符合饮用水的国家卫生标准。 5.按国家规定平均每升饮用水中的大肠菌数不得超过3个,现从某饮用水随机抽取1升水测得大肠菌4个,问该饮用水是否符合饮用水的国家卫生标准。 6.根据下表数据,试比较使用含氟牙膏与使用一般牙膏者的患龋率有无不同?

使用含氟牙膏与使用一般牙膏者的患龋率

牙膏类型 含氟牙膏 —般牙膏 合计 调查人数 200 100 300 患龋齿人数 70 50 120 患龋率(%) 35 50 40 7.某卫生防疫站在中小学观察三种矫正治疗近视眼措施的效果,近期疗效数据见下表。结论为“近期疗效以“夏天无”眼药水为最好,眼保健操次之,新医疗法最差”。试对此说法作出分析评价。

三种措施的近期有效率(%)

矫正方法 “夏天无”眼药水 新医疗法 眼保健操 观察例数 135 32 18 近期有效率(%) 37.78 18.75 27.78 8.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料整理如下。问两者之间是否存在一定的关系?

冠心病诊断结果与眼底动脉硬化级别的关系

眼底动脉硬化级别 0 Ⅰ Ⅱ Ⅲ 合计 冠心病诊断结果 正常 340 73 18 2 513 可疑 11 13 18 1 44 冠心病 6 6 133 6 31 合计 357 92 588 9.用两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致的检出率为35%,试问两种方法何者更优? 10.在某克山病区作中小学生心肌受损情况检查,277名男生中检出率为48.74%, 147名女生中检出率为57.10%,问男女生心肌受损率是否不同?

11.用某种化学物质进行诱发肿瘤试验,实验组15只小白鼠中4只发生癌变,对照组10只无一只发生癌变,问两组发癌率有无差别? 三、简答题

1. 二项分布、Poisson分布与正态分布间有何关系? 2. χ检验的应用条件有哪些? 3. χ检验用于解决哪些问题?

4. 四格表的u检验与χ2检验有何异同? 5. 请列举R×C表χ2检验的注意事项。

6. R×C行列表与R×C双向有序分类列联表χ2检验的区别是什么? 7.某医生观察某新药预防流感的效果,并用四格表专用公式计算出χ2=6.63,P=0.01。问:

(1)此表的四个基本数字a,b,c,d各等于多少? (2)你对此有何看法?

某新药预防流感的效果

分组 服药组 未服药组

观察人数 180 230

未发病 130 190

有效率(%)

72.2 82.6

22

第十章 回归与相关

一、名词解释

1、自变量(independent variable) 2、因变量(dependent variable)

3、简单相关分析(simple correlation analysis)

4、简单线性回归分析(simple linear regression analysis) 5、偏相关分析(partial correlation analysis)

6、多元线性回归分析(multivariate linear regression analysis ) 7、最小二乘法(least square method)

8、Pearson 相关分析(Pearson correlation analysis) 9、Spearman 相关分析(Spearman correlation analysis) 10、确定系数(determinant coefficient) 二、单选题

1、相关系数检验的无效假设H1是.__________

A. ρ>0, B. ρ=0, C. ρ=1, D. ρ≠0

2、由样本计算两个随机变量x和y之间的简单相关系数r的值近似等于零,经统计检验得到p=0.90。作结论时,正确的表述应该是__________.。

A. x与y之间呈直线关系

B. x与y之间呈曲线关系

D x与y之间毫无关系

C. x与y之间没有直线关系

3、线性回归分析的原理是对因变量Y的总体变异进行分解。它可能出现__________。

A. SS剩=SS回 C SS总=SS回

B. SS总> SS剩

E. 以上均可

D. SS剩< SS回

4、对变量X和Y同时进行简单相关分析和简单回归分析,其结果有___________。

A. r>0,b<0 C. r>0,b>0

B. r<0,b>0 D. r=b

E. r与b符号无关

5、 已知r=1,则一定有__________。

A. b=1

B. a=1

E. SS剩=SS回

C. SS剩=0 D. SS总=SS剩

6、含有常数项的直线回归系数假设检验,其自由度是________。

A. n C. n-2

B. n-1 D. 2n-1

E. 2n-2

7、适合分析糖尿病人的血糖水平与胰岛素水平之间关系的方法是________。

A. 配对比较的t检验 C. 相关分析或回归分析

B. 成组比较的t检验 D. χ2检验

8、对简单线性回归模型进行显著性检验的目的是对_________作出统计推断。

A. 样本斜率 B. 总体斜率 C. 样本均数

D. 总体均数

9、如果对简单线性回归模型进行显著性检验的结果是不能拒绝H0,这就意味着_____。

A. 该模型有应用价值 C. 该模型求错了

B. 该模型无应用价值 D. X与Y之间毫无关系

10、对两个数值变量同时进行了相关和回归分析,r有统计学意义(P<0.05),则

A. b无统计学意义

B. b有高度的统计学意义。 C. b有统计学意义

D. 不能确定b有无统计学意义。

E. 以上都不是

11、设有X、Y两组数据,求得

,经统计学检验,在α=0.05水平上拒

绝H0:β=0,则至少有95%的把握断言y与x之间在专业上有直线关系。这一结论()。

A. 根据充分 B. 很有科学性 C. 脱离实际 D. 略有问题 E. 毫无根据

12、在对两个变量x与y进行直线相关分析后发现,相关系数r约等于0,经检

验,得P>0.9。在下专业结论时,正确的表述应该是 A. x与y之间呈直线关系 B. x与y之间呈曲线关系 C. x与y之间呈没有关系

D. x与y之间有无关系尚未确定 E. x与y之间存在某种关系 13、 x1、x2分别代表给大鼠注射一定剂量的类毒素后侧得的大鼠红细胞与血红

蛋白含量。求得直线回归方程为:,n=19,r=0.82031,检验该直线回归方程是否有显著性意义的统计学结论应该为 A. P>0.05 B. 0.01

14、 求得y倚x变化的直线回归方程后,必须对回归方程作显著性检验,其目

的是为了对( )作出统计推断。 A. 样本斜率 B. 总体斜率 C. 样本均数 D. 总体均数 E. 样本分布

15、 在求出直线回归方程后,如果检验结果是接受无效假设,那就意味着

A. 此直线方程有应用价值 B. 此直线方程无应用价值

C. 此直线方程并非所求 D. x与y之间毫无关系 E. x与y之间呈直线关系

16、在求出y倚x变化的直线回归方程

点 的横坐标值代入方程所得的

后,发现将原始数据中的某一

,这说明

A. 此现象无法解释 B. 正常现象 C. 计算有错

D. x与y之间呈曲线关系 E. x与y之间呈直线关系 17、对同一个资料,根据最小平方法原则求出两个直线方程

,在一般情况下,它们之间的关系是

A. 重合 B. 垂直 C. 平行 D. 相交 E. 不确定 18、两因素之间有显著性的交互作用,意味着

A. 因素A的作用随因素B的作用增强而增强 B. 因素A的作用随因素B的作用减弱而减弱 C. 因素A的作用随因素B的作用变化而变化

D. 一个因素的各水平对实验结果的影响随另一个因素水平的改变而改变 E. 一个因素的各水平对实验结果的影响不随另一个因素水平的改变而改变 19、根据10对(x,y)的某资料算得y依x变化的直线回归方程为

。x与y之间的直线相关系数r=0.848915。现在

原始数据已丢失,问若提供以下的哪一项,就可准确判定上述直线回归方程是否具有显著性意义?

A. 至少8对(x,y)的值 B. F临界值表 C. D. r临界值表 E. t临界值表

20、有两组适合于作直线相关分析的试验资料(按专业知识都应取双侧检验),

第一组资料:n1=5,相关系数r1=0.857;第二组资料:n2=8,相关系数r2=0.712。在没有详细资料和各种统计用表的条件下,可作出什么统计推断? A. 因r1>r2,故r1有显著性意义 B. 因n1>n2,故r2有显著性意义 C. r1和r2都有显著性意义 D. r1和r2都没有显著性意义 E. 缺少作出明确推断的依据

临界值表

21、关于相关系数r与决定系数r2含义上的区别,下面哪一项表述最合适?

A. r值的大小反映两个变量之间是否有密切的关系

B. r2值的大小反映两个变量之间呈直线关系的密切程度和方向 C. r值接近于0表示两个变量之间没有任何关系 D. r值接近于0表示直线回归的贡献很小 E. r与r2在含义上没有区别

22、不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如下。为了通过测

定碘含量来预测地方性甲状腺肿的患病率,应选用

地区编号 2

1 碘含量(单位) 患病率(%) 10.0 40.5 2 2.0 37.5 3 2.5 39.0 4 3.5 20.0 ? ? ? 17 24.5 0.0 A. 相关分析 B. 回归分析 C. Ridit分析 D. 聚类分析 E. 因子分析

23、对含有两个随机变量的同一批资料,即作直线相关,又作直线回归分析。令

对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间存在什么关系?

A. tr>tb B. tr

检验,其无效假设应为: A. H0:r=0 B. H0:r≠0 C. H0:ρ=0 D. H0:ρ≠0 E. H0:ρ≤0

25、某人把若干只钉螺按同样条件同时埋入土中,每个一个月取出一部分,检测

其存活率,直至第12个月。分别用x、y表示埋螺月数和存活率,发现随x值逐渐增大,y值由开始的100%逐渐下降。此人用直线回归方程描述了y随x变化而变化的关系,经统计学检验,P<0.01,结论是此资料可用直线回归方程来描述。你对此有何评论?

A. 有统计学检验为依据,故此结论可信 B. 试验点太少,无法下结论 C. 数据未全部写出,无法判断 D. 没有散点图,单靠P值是不行的

E. 此资料应该用曲线回归方程而不是直线回归方程来描述

26、给10只中年大鼠注射类毒素后,测得每只大鼠的红细胞数x(×104/mm3)与

血红蛋白含量y(g/L)分别如下: 鼠号 1 X 654 Y 130 2 786 168 3 667 143 4 605 130 5 761 158 6 642 129 7 652 151 8 706 153 9 602 149 10 539 109 为了对两个变量x、y进行线性回归分析(设x为自变量,y为因变量),首先要从专业上考虑是否有理由研究它们之间的关系,然后应当做的事就是

A. 求出直线回归方程并检验 B. 求出相关系数并检验

C. 绘制散点图并分析散点的变化趋势 D. 应用回归方法解决实际问题 E. 求出回归系数并检验

27、某人测得20人的身高和体重数据,求出了二者之间的直线相关系数,查相关系数临界值表时,其自由度应为

A. 20 B. 19 C. 18 D. 17 E. 16

28、测的一组正常人的胆固醇值和血磷值,要对二者同时进行统计分析,可选用那种方法?

A. 配对设计计量资料的t检验 B.

检验 C. 相关回归分析

D. 多元方差分析 E. 单因素方差分析 29、若r>r0.05(?),则

A. P>0.05 B. P<0.05 C. P?0.05 D. P?0.05 E. P>0.01

30、对两个变量进行直线相关分析,r=0.39,P>0.05,说明两个变量之间

A.有相关关系 B.有数量关系 C.有因果关系 D.有伴随关系 E.无线性相关关系

31、对相关系数r进行显著性检验,当r>r0.05(?),则 。

A. 两变量之间关系密切

B. 两变量之间相关有统计学意义 C. 两变量之间关系不密切 D. 两变量之间相关无统计学意义 E. 以上都不是 三、简答题

1、简单相关分析与简单线性回归分析的联系和区别是什么? 2、Pearson相关分析和Spearman相关分析各有什么优缺点? 3、简单线性回归分析和多元线性回归分析对数据有什么要求?

4、简单线性回归模型中的回归系数和多元线性回归模型中的偏回归系数有什么异同点?

5、线性回归分析要求因变量是服从正态分布的随机变量。如果该条件不满足,会导致什么不良后果?说出一个解决这种问题的有效方法。 6、多元线性回归分析中要求自变量之间不存在多重共线性。如果该条件不满足,会导致什么不良后果?说出一个解决这种问题的有效方法。 7、多元线性回归分析模型中,标准偏回归系数和非标准偏回归系数的作用区别是什么?

8、在一个因变量Y关于自变量X的简单线性回归分析模型中,自变量X的回归系数估计值是b,并且经过统计检验,X的回归系数具有显著性统计意义。试解释b的统计意义。

9、在一个因变量Y关于子变量X1和X2的二元线性回归分析模型中,自变量X1和X2的回归系数估计值分别是b1和b2,并且经过统计检验,X1和X2的回归系数均具有显著性统计意义。试解释b1和b2的统计意义。 10、已知一个因变量Y关于子变量X1和X2的二元线性回归分析模型的复

2

确定系数R=0.85,试解释它的统计意义。 四、计算题

1、随机抽得10名20岁男性青年的身高和前臂长如下:

身高(cm) Y: 170,173,160,155,173,188,178,183,180,165

前臂长 (cm) X: 45, 42, 44, 41, 47, 50, 47, 46, 49, 43

a) 计算相关系数r,并对相关系数ρ进行检验;

b) 计算Y对X的回归方程,并对回归系数和总体模型进行统计检验。 2、已知随机变量X和Y的方差估计值分别是Var(X)=0.25和Var(Y)=0.16,且变量X

和Y之间的协方差估计值是Cov(X,Y)=0.1, 试估计变量X和Y之间的相关系数 r(X,Y)。

3、根据回归分析原理,填充下面回归分析结果表。 Source Model Residual Total

DF 2

Sum of squares Mean square

F-value

1.82 38.22

12

第十一章 常用统计图表 第十二章 实验设计 第十三章 调查设计

一、名词解释

1. 实验研究设计(experiment design) 2. 随机对照试验 (random-control trail)

3. 配对设计(Paired design) 4. 交叉设计(Cross-over design) 5. 盲法(blind-method) 6. 临床实验(clinical trial ) 7. 社区干预实验(community intervention trial)

8. 简单随机抽样(simple random sampling) 9. 样本量估计(sampling survey) 10. 整群抽样(cluster sampling) 11. 系统抽样(systematic sampling) 二、单选题

1、研究吸烟与肺癌的关系中年龄与性别常常与肺癌有关联,是肺癌的危险因素,因此在该项研究中,它们是______________。

A、处理因素 B、混杂因素 C、研究因素 D、观察因素 E、实

验因素

2、在实验设计研究中,随机化分组可以减少或控制_____________。

A.系统误差 B.测量误差 C.实验误差 D.随机误差 3、下列各种实验设计中,在相同条件下最节约样本含量的是________。 A.完全随机设计 B.配伍组设计 C.配对设计 D.交叉设计 4、设立对照应满足_____________原则,才能显示对照的作用。

A.随机化分组 B.重复 C.均衡 D.随机数字表 E.ABCD均不是

5、实验设计和调查设计的根本区别是_______。

A.实验设计以动物为对象 B.调查设计以人为对象

C. 实验设计可随机分组 D.实验设计可人为设置处理因素 E. 二者无区别

6、某医生在研究某药物治疗糖尿病的疗效时,试验组服用该药物,对照组服用淀粉,

这属于:

A.实验对照 B.历史对照 C.安慰剂对照 D.空白对照 E.标

准对照

7、下列哪种研究可以认为地设置各种处理因素:

A.调查研究 B.横断面研究 C.实验研究 D.病例对照研究

8、下列抽样方法,在相同条件下,抽样误差最大的为:

A.单纯随机抽样 B.系统抽样 C.整群抽样 D.分层抽样 E.分层随机抽样

9、有一组某地居民950~1968年伤寒与结核病死亡率(1/10万)资料,下列哪种统计

图可以形象化地反映两种疾病的死亡率随着时间推移的变化速度。 A.条图或圆图 B.直方图 C.散点图 D.普通线图 E.半对数线图 10、实验设计的基本原则是:

A.重复、随机、配对 B.随机、盲法、对照 C.对照、随机、重复

D.随机、盲法、配对 E.齐同、对照、随机

三、简答题

1、 实验设计的基本原则是什么?其各自目的何在? 2、 确定样本含量应该具备什么条件?

3、 请列举常见的实验设计方法,并简述其优缺点。 4、 常用的统计图有哪些?它们的适用条件是什么? 5、 实验误差有哪几类?如何控制实验误差? 6、 普通线图和半对数线图的主要区别是什么? 7、 请简述四种基本抽样方法的优缺点和适用条件。 8、 完全随机化设计与随机化区组设计各有什么优缺点? 9、 对照、随机化、均衡和重复各自的目的何在?请举例说明。 10、直方图、条图和百分条图有什么区别? 四、计算题

1. 某种心血管疾病的55岁以上男性患者的平均体重为90kg,标准差为20kg,现采用一种新的疗法,欲以α=0.05,检验效能为90%:①估计病人的体重能降至85kg ,

需多大的样本? ②估计病人的体重改变5kg,需多大的样本? 2. 已经知道某民族中HBsAg阳性率为12.45%,现欲抽样调查该民族HBsAg阳性率,

要求误差不超过2%,问需要调查多少人?

3. 在新生儿某种病毒爆发期间,某地区已发现1000名活产婴儿中有160名感染,

现经一段时间治疗,欲了解目前感染率是否降至0.10,取α=0.05,β=0.10,问需

要抽取多大的样本?

4. 欲了解某地菜农钩虫感染率是否高于粮农,估计两总体率约为60%、85%,今指定=0.05,=0.10,则每组要查多少人?

5. 为研究孕妇在怀孕期间实用某种试验饮食是否会增加新生儿出生时的体重,欲抽取两组孕妇,一为普通饮食组,一为试验饮食组。据以往经验,新生儿体重的标准差为500g,设α=0.05, β=0.20,检验效能为80%,检测出试验饮食会使新生儿体重增加100g,问需要多大的样本? 五、设计与分析题

1、 某地1960年和1995年三种死因别死亡率如下表,试将该资料绘制成

统计图,并作简要分析。

某地1960年和1995年三种死因别死亡率(1/10万) 死因 肺结核 心脏病 恶性肿瘤

1960年 165.2 72.5 53.6

1995年 20.1 87.1 124.9

2、 一次临床试验中需要100例病人,根据就诊先后顺序,将先就诊的50

名病人分入A组,后就诊的50名病人分入B组。你认为这种设计方案是否遵循了有关统计学原则?具体理由是什么?

3、 某单位研究菊花艾叶香预防感冒和空气消毒效果。对象为某幼儿园分

住三个楼的儿童。中间楼是中班儿童(160人), 东楼是小班儿童(110)

人,这两栋楼燃香;西楼是大班儿童(170人),作为对照组,不燃香。结论为菊花艾叶香无预防感冒效果,但有空气消毒作用(肉汤平板上菌落数较少)。请按调查设计和实验设计的原则对此加以评述。 4、 在生化实验中要评定A、B、C、D四种检验方法,操作者有甲、乙、

丙、丁四人,每人作四次实验,请设计这一实验。 5、某研究所开展一项新药临床试验,共收病例200名进入试验,如果将病例平分为新药组与对照组,请列举可能的几种设计方案,并分析其各自的特点。

第十四章 医学人口统计与疾病统计常用

指标

一. 名词解释

1. 负担系数 2. 人口金字塔

3. 总生育率(general fertility rate,GFR) 4. pearl怀孕率(pear pregnancy rate) 5. 婴儿死亡率(infant mortality rate,IMR) 6. 新生儿死亡率(neonatal mortality rate,NMR) 7. 围生儿死亡率(perinatal mortality) 8. 孕产妇死亡率(maternal mortality rate) 9. ICD(International Classification of Disease) 二. 选择题

1.为了对某种疾病进行研究出发,要获得某地人口总数,用什么方法比较好?

A.法定制 B.实际制 C.时点制 D. 实数制 2.下列说法,错误的是?

A.老年人口系数是构成比 B.少年儿童人口系数是构成比 C.负担系数是构成比 D.性别比是相对比 三. 简答题

1.简述医学人口统计资料的来源及特点。

2.简述反映生育水平的常用指标及其计算方法。 3.简述反映人口再生育的常用统计指标及其计算方法。 4.简述反映计划生育工作情况的常用统计指标及其计算方法。 5.测量死亡水平的常用指标有哪些?如何计算? 6.疾病统计的主要资料来源有哪些? 7.常用的疾病统计指标有哪些?如何计算? 8.患病率和发病率有什么区别?

第十五章 寿命表

一.名词解释

1.寿命表(life table)

2.现时寿命表(current life table) 3.定群寿命表(cohort life table)

4.年龄组死亡概率(age specific probability of dying) 5.去死因寿命表(cause eliminated life table) 6.平均预期寿命(life expectancy) 二.选择题

1.寿命表中所含有的指标可不包括:

A. 年龄 B. 年龄组死亡概率 C. 尚存人数 D. 生存人年数亡率

2.如要进行某种药物对肿瘤疗效的分析,应选用?

总死 E. A. 现时寿命表 B. 完全寿命表 C. 简略寿命表 D.定群寿命表 3.寿命表中的“年龄组死亡概率”实质上是一个: A. 条件概率 B. 频率 C. 构成比 D.相对比 4.以下关于寿命表的说法,错误的是: A. 预期寿命可能随着年龄的增加而增加

B. 可用校正婴儿死亡率作为0岁组死亡概率的估计值 C. x岁尚存者在今后n年内的生存概率为npx=1-nqx D. 两地平均寿命的比较应该考虑人口构成不同的问题 5.寿命表制作时的关键指标是:

A.年龄 B.年龄组死亡概率 C.尚存人数 D.生存人年数 E.平均预期寿命

6.研究某种疾病导致的死亡对居民生命的影响时,下列那种方法最好:

A.简略寿命表 B.现时寿命表 C.定群寿命表 D.去死因寿命表

7.各年龄的死亡水平发生改变都会影响平均寿命的大小,其中哪个年龄别的影响最大?

A. 65岁到70岁以前组 B.30岁到35岁以前组 C. 零岁到1岁以前组 D.25岁到30岁以前组

8.如果寿命表中死亡人数分布中婴幼儿峰度上升,老年峰位置前移是说明居民的健康水平:

A.提高 B.降低 C.没有变化 D.还不能下结论 三.简答题

1.平均死亡年龄和平均预期寿命是否相等,为什么?

2.简述寿命表制作需要哪些指标?如何求?(即寿命表制作的原理与方法)

联系客服:779662525#qq.com(#替换为@)