《医学统计学》习题册 下载本文

上海交通大学网络教育学院医学院分院

医学统计学 课程练习册

第一章 绪论

一、单选题

1. 小概率事件是指P ( ) B.P<0.05

2. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A总体中个体值存在差别

3. 调查中国放射科医生接触射线情况,全国放射科医生的全部组成为 A.研究总体

4. 若以舒张压90mmHg、收缩压130 mmHg为高血压阳性临界点,调查3000人中有300名血压超过临界值,这份资料属于:B. 分类资料 5. 下列属于统计量的指标是 C 样本标准差

6. 调查某地区高血压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是: C 定量资料 7. 下列属于参数的指标是 D总体标准差

8. 用样本做统计推断,样本应是 B. 总体中有代表性一部分 9. 统计推断的内容为 D. A和B均是

10. 随机调查社区2000人,得到平均体重为60公斤,则该资料属于 A. 计量资料 二、名词解释

1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。样本指标与总体指标的差异称为抽样误差。

2.总体:根据研究目的性质相同的观察单位的全体。

3. 分类变量:用定性方法测得,表现为互不相容的类别或属性,如性别等。

4. 数值变量:用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。

三、问答题

1.什么叫计量资料,它的统计分析方法有哪些(包括统计描述和统计推断)?

在科研中,用测量方法获得数据,对各观察单位用定量方法测定某项指标量的大小,这

1

类资料一般有度量衡单位。

计量资料的统计分析包括统计描述和统计推断:统计描述主要是统计图表、集中趋势和离散趋势的描述,集中趋势中可以计算算术均数、几何均数、中位数和众数,离散趋势可以计算极差、标准差、方差和变异系数。统计推断包括点估计、区间估计和假设检验。常用的假设检验方法包括:t检验、u检验、方差分析(F检验)和秩和检验。

2.举例说明总体与样本的关系。

总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。抽取样本的目的是用样本的信息推论总体特征。

第二章 定量数据的统计描述

一、单选题

1. 若资料为偏态分布,最好计算下列哪个指标来衡量集中程度 D 中位数

2. 若资料为正态分布,最好计算下列哪个指标来衡量集中程度 B 算术均数 3. 对数正态分布资料计算集中趋势应该用 A 几何均数 4. 抗体滴度资料通常使用哪个集中趋势指标 B 几何均数 5. 平均数指标体系中不包括 A 全距

6. 抽样调查了10名居民体重资料,请问平均体重该用哪个指标计算 C 算术均数

7. 样本标准差的的取值情况是 A 大于或等于零

8. 若资料为正态分布,最好计算下列哪个指标来衡量离散程度 C 标准差 9. 若资料为偏态分布,最好计算下列哪个指标来衡量离散程度 ( ) B 四分位间距

10. 若资料末端没有截尾值,最好计算下列哪个指标来衡量离散程度( ) D 四分位间距

11. 一组资料的例数等于25,方差等于16,标准差等于 A 4

12 一组资料的标准差等于5,变异系数等于10%,样本均数等于 B 50 13. 标准差与算术均数的使用条件 ( ) B 相同

14. 比较两组正态分布数据离散度大小的指标,如果单位不同该用 ( ) B 变异系数

2

15 可以反映个体离散程度的指标不包括 ( ) C 标准误

16 . ?表示 ( ) A 总体方差

17. 一组资料的例数等于25,均数为20,标准差等于5,则方差等于 ( ) B 25

18. 四分位间距的使用条件与哪个指标是一致的 ( ) A 中位数

19. 四分位间距是指 ( ) D P25-P75 二、名词解释

1.几何均数:常用符号G表示,适用于原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料。医学上的血清抗体滴度和血清凝集效价等适宜用几何均数描述其集中趋势。

2.中位数:一组观察值由小到大顺序排列,位次居中的数值,适用于偏态分布和分布末端无确切值的资料。

3.变异系数:变异系数(coefficient of variance)为标准差与均数之比,用百分数表示,CV越大,表示观察值的离散程度越大;CV越小,表示观察值的离散程度越小。

4.四分位间距:第75百分位数(P75)称为上四分位数QU, 第25百分位数(P25)称为下四分位数QL,则四分位数间距(quartile interval)Q=QU-QL。四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距。

三、计算题

1. 10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.0,122.5,140.0。求平均数。

1.

X?X?n?125.5?126?...?122.5?140?132.1102. 6份血清抗体滴度为:1:2,1:4,1:8,1:8,1:16,1:32,求平均数

2.

?lg2?lg4?lg8?lg8?lg16?lg32??1 ??8G?lg?1???lg?0.9031

?6?3. 某医院调查30个乙肝表面抗原阳性患者抗体水平,求平均抗体水平 抗体水平分布

抗体水平 1:10 1:100 1:1000 1:10000 1:100000

3

人数 4 5 10 9 2

3.

G?lg?1(?lg?1(?flgX)?flg10?4?lg100?5?lg1000?10?lg10000?9?lg100000?2)?100030平均抗体水平为1:1000

4. 107名正常人尿铅含量分布,求平均尿铅含量 尿铅(mg/l) 0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 例数f 14 22 29 18 15 6 1 2 累计频数ΣfL 14 36 65 83 98 104 105 107 累计频率(%) 13.1 33.6 60.7 77.6 91.6 97.1 98.1 100.0 4. i?nM?L??? f?2?4?107??fL??8???36??10.41(mg/L)29?2??

四、问答题

1.均数、几何均数和中位数的适用范围是什么?

(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。 2. 标准差用于计量资料中正态或者近似正态分布的统计描述 标准差的应用有四个方面:(1)表示个体变异的大小(2)用来结合均数计算医学参考值范围(3)计算变异系数(4)计算标准误

3. 变异系数与标准差的联系和区别是什么?

4

联系:变异系数与标准差都是用于正态分布资料的离散程度的指标,变异系数等于标准差除以均数后乘以100%得到。

区别:在比较离散程度大小时,用标准差一定要满足均数相近,单位一致的条件。而变异系数可以用在以上两个条件任意一个不能满足的情况。

第三章 正态分布与医学参考值范围 一、单选题

1. 正态分布条件理论上 D算术均数、中位数是一致的

2. 中位数特别适用于 D 严重偏态分布资料

3. 频数分布中,如果集中位置趋向于数据较小的一端,叫做 C 正偏态分布

4. 一组数据呈正态分布,其中大于X?1.96S的变量有: D 97.5%

5. 一组数据呈正态分布,其中大于X?1.96S的变量有: B 2.5%

6. 一组数据呈偏态分布,其双侧95%的参考值范围为: B P2..5-P97.5

7. 正态分布曲线的形态参数应该是 B 方差

8. 对于临床上计算尿铅的95%正常值可用哪个百分位数表示 A P0 — P95

9. 标准正态分布曲线下(-1,1)之间的面积约为: ( ) B 68.27%

10. 偏态资料的医学参考值范围估计方法是 B 百分位法

11.一组身高资料和一组体重资料比较其离散度大小应该用哪个指标D 变异系数

5

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

12. 标准差表示: ( ) B个体变异

13. 正态分布曲线下在均数加减一个标准差之间的面积大约占 ( ) B 68%

14. 标准正态分布曲线的位置参数和形态参数分别是 ( ) A 0和1

15. 评价一个个体指标是否正常可以用 ( ) A 医学参考值范围

二、名词解释

1.医学参考值范围:医学参考值是指正常人(或动物)的人体形态、机能和代谢产物等的各种生理及生化常数。由于个体指标的变异使其常数不仅因人而异,而且同一个体还会随机体内外环境的改变而改变,因此需要确定其波动的范围,即医学参考值范围。

三、问答题

1. 正态分布的特征是什么? 正态分布有如下特征:①正态分布曲线在在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布上有两个参数:均数μ和标准差σ,均数μ是位置参数,决定正态曲线的中心位置,μ越大,曲线越向右移动;μ越小,曲线越向左移动,标准差σ是形状参数,决定正态分布曲线的陡峭或扁平程度,σ越小,表示数据越集中,曲线越陡峭,σ越大,表示数据越分散,曲线越扁平;④正态分布曲线下的面积分布有一定的规律。

2.四分位数间距、标准差、变异系数各有何特点?

(1)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度。

(2)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度.

(3)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。

3.制定医学参考值范围的一般原则是什么? (1)抽取样本含量足够大的“正常人”。一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。(2)对抽取的正常人进行准确而统一的测定,控制测量误差。(3)判断是否需要分组制定参考值范围。(4)决定参考值范围的单侧或双侧界值。(5)选择适当的百分界值。(6)根据资料的分布类型选用恰当的方法估计参考值范围。

四、计算题

1. 已知正常人的体温水平符合正态分布,在某地调查了100名成年女子测得其

6

体温为36.8摄氏度,标准差为0.2摄氏度,问 如果该地有一女子自述体温异常就医,测得其体温为37.5摄氏度,请问该女子的体温水平是否正常?

1.

x?1.96s?36.8?1.96?0.2?(36.408,37.192)故体温收入的95%参考值范围为36.408-37.192摄氏度,该女子体温偏高

2. 调查某医院护士的年龄分布和收入状况,假设该人群的年龄和收入水平都呈正态分布。共调查了100名护士,平均年龄为24.5岁,标准差为3.6岁,平均年收入为3.6万元,标准差为1.0万元。

(1)请比较该医院护士年龄和收入水平的离散程度。

(2)如某护士年收入为1.8万元,请评价该收入水平是否属于正常范围。

2. (1) 3.61CV??100%?14.69%CV??100%?27.8%

24.53.6

故收入的变异大于年龄 (2)

x?1.96s?3.6?1.96?1?(1.64,4.56)95%参考值范围为 故护士收入的1.64-4.56万,该护士收入属于正常范围

3. 某地20岁男子100人,其身高均数为166.06cm,标准差为4.95cm,其体 均数为53.72kg,标准差为4.96kg。请比较何者变异度较大。

3.

CV?

4.95?100%?2.986.06CV?4.96?100%?9.23S.724.调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2 (g/L),试估计该地健康女性血红蛋白的95%医学参考值范围。

4.

x?1.96s?117.4?1.96?10.2?(97.41,137.39)

故该地健康女性血红蛋白的95%参考值范围为97.41-137.39g/L第四章 定性数据的统计描述

一、单选题

1.已知男性的肝癌发病率高于女性,今欲比较甲、乙地的肝癌发病率,但甲地中

7

女性多于男性,而乙地中男性多于女性,适当的比较方法是 ( ) D 对性别进行标准化后再比较

2.n足够大,样本率不接近于1或0,估计总体率95%的可信区间用( ) A p?1.96Sp

3.若仅知道样本率,估计率的抽样误差用哪个指标表示。 ( ) D S p

4.反映某一事物发生强度的指标应选 ( ) B 率

5.发病率和患病率中会超过100%的是 ( ) C 发病率

6.甲地老年人口比重比乙地大,标准化后的食管癌死亡率甲、乙两地相等, 那么 ( ) A 原食管癌死亡率是甲地高于乙地

7.下列指标不属于相对数的是 ( ) D百分位数

16. 某医师用新药治疗一组高血压病人23例,21例好转,估计该疗法好转率95%的可信区间,用 A p?1.96Sp

9.比较两地某疾病的严重程度,可用哪个指标。 ( ) D 发病率

二、名词解释

1. 相对比:相对比又称为对比指标,是指两个有关指标之比,通常以倍数或百分数表示。 2. 率:率又称为频率指标,它是用来说明某现象在一定条件下发生的频率大小或强度。通常是某现象实际发生的例数与可能发生某现象的总数之比。

3. 构成比:构成比又称为构成指标,它表示事物内部某组成部分占其全部的比重或分布,通常以100%作为比例基数,以百分比的形式表示。

三、问答题

1. 应用相对数的注意事项

应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性 (4)当比较两个总率时,若其内部构成不同,需要进行率的标准化。(5)两样本率比较时应进

8

行假设检验

2.简述率的标准化法的基本思想

当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。

3.率的标准化应注意的问题

(1)当各比较组内部构成(如年龄、性别、职业、民族等)不同,并足以影响总率的比较时,应对率进行标准化,然后再作比较。

(2)率的标准化的目的是采用统一的标准,消除混杂因素的影响,使其具有可比性。根据选用的标准不同,所计算的标准化率也不同。标准化率只表明各标化组率的相对水平,而不代表其实际水平。

(3)各年龄组对应的率出现明显交叉,如低年龄组死亡率甲地高于乙地,而高年龄组则甲地低于乙地,此时宜分别比较各年龄组死亡率,而不用标准化进行比较。 (4)如是抽样研究,两样本标准化率的比较也应作假设检验。

四、计算题

1. 请完成以下空白并进行描述性分析。 年龄

人口数

(岁) 0- 20- 40- 60- 合计

恶性肿

死亡总数 瘤死亡

恶性肿瘤死亡占总死亡的%

恶性肿瘤死亡率(1/10万)

年龄别死亡率(?)

82920 (138) 4 2.90 ( 46638 ) 63 ( 12 ) 19.05 28161 172 42 ( 24.42 ) ( 9371) ( 342 ) 32 ( 9.36 ) 167090

715

90

12.59

( 4.8 ) ( 1.66 )

25.73 ( 1.35 ) ( 149.4 ) ( 6.11 ) ( 341.5 ) ( 36.5 ) ( 53.86 )

( 4.28 )

第五章 统计表与统计图

一、单选题

1. 某病随着事件推移疾病发病率的变化可以作 ( ) B 线图

2. 比较某地两种疾病发病率差别可以作 ( ) C 直条图

3 连续性频数分布资料该作 ( )

9

A 直方图

4. 散点图通常用于 ( ) B 双变量资料

5. 统计表中线条要求只能有 ( ) A 横线

6. 关于统计表中说法错误的是: ( ) B 一都要有备注

7. 下列关于统计图表的说法,不正确的是: ( ) D 统计表均有备注附在表的下方

8. 用统计图表示某地三种死因别死亡率,可选用 ( ) C 直条图

9.流行性乙型脑炎发病率的高低与年龄有关,据调查,3—8岁儿童是发病的高峰。为反映患者年龄的频数分布规律,统计图应选用: ( ) B 直方图

10.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制

( )

D 半对数线图

11.拟以图示某市1990—1994年三种传染病发病率随时间的变化,宜采用( ) A 普通线图 二、问答题

1.统计表的基本结构要求是什么?

(1)标题 标题是统计表的总名称,应简明扼要说明内容,必要时注明资料的时间、地点。列在表的上端中央

(2)标目 标目是表格内的项目,分为横标目和纵标目。纵横标目的排列要得当,顺序应按时间顺序、事物的重要性、数字的大小等有规律地排列,并注明单位。一般横标目列在表的左侧,表示表中研究对象,纵标目列在表的上端,说明研究对象的各个统计指标。

(3)线条 力求简洁,主要有3条线:上面的顶线,下面的底线以及隔开纵标目与数字的横线。部分表格可用横线隔开合计,或用短横线分割多重纵标目。其他竖线和斜线均可省去。 (4)数字 表内数字必须准确,用阿拉伯数字表示。位数对齐,小数的位数要一致,不留空格,是“0”则填“0”,暂缺或未记录可用“-”或“?”表示。 (5)说明 文字不列入表内,特殊情况须用备注说明时,可用“*”号标出,写在表的下面。

2.统计图的制图通则是什么?

(1)根据资料性质和分析目的选用适当的图形。

10

(2)标题应扼要地说明图的内容,地点和时间,一般写在图的下端。有多张图时要将编号写在标题前面。

(3)有坐标的图形(条图、散点图、线图及半对数线图、直方图),应有纵横两轴的标目和标目单位。

(4)横轴尺度自左至右,纵轴尺度自下而上,数值一律由小到大,纵横比例一般为5:7(或7:5)。

(5)图中用不同线条、颜色代表不同事物时,需用图例说明。一般放在图的下方。

第六章 参数估计与假设检验

一、单选题 1.

?X的含义是 ( )

A 标准误的理论值

2. SX的含义是 ( ) C 标准误的估计值

3. t分布是 ( ) A 近似正态分布

4. 一组100个样本的资料均数等于5,变异系数等于20%,则标准误等于 ( ) C 0.1

5. 标准误反映 ( ) C 均数变异

6. t分布中,当自由度为无穷大,t分布逼近 ( ) C 标准正态分布

7. H0 :μ=μ0,H1:μ≠μ0属于 ( ) A 双侧检验

8. 下列属于单侧检验的是 ( ) C 已知A药疗效不会比B药差

9. 检验水准的符号是 ( ) D ?

10.已知A药对某病有效。现发明一种增效剂B,试图提高A药的疗效,想通过临床试验了解A+B的疗效是否显著地优于单用A药的疗效,应选用: ( ) D 双侧检验

11

11.下列哪个变量为标准正态变量 ( )

x?? D ?x

12.以一定概率由样本均数估计总体均数,宜采用 ( ) D 区间估计

13.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大 ( ) C 标准误 二、名词解释

1. 标准误:为了与前面所述的一般变量值与均数的离散程度的指标-标准差相区别,我们把样本均数的标准差称为标准误,用?X 表示。标准误愈大,样本均数的抽样误差愈大;标准误愈小,样本均数的抽样误差愈小。

2. 统计推断:在医学研究中,常常是采用抽样研究的方法,即从总体中用随机的方法抽取部分个体(样本)进行研究,目的是用样本的信息推论总体的特征,这在统计学上称为统计推断。

3. 检验水准: 检验水准也称显著性水准,符号为α,是假设检验时发生第一类错误的概率

三、问答题

1. 标准误的用途?

(1)可用于反映样本均数的可靠性。标准误小表示样本均数与总体均数较接近,用样本均数代表总体均数的可靠程度较大;反之标准误大,则表示用样本均数代表总体均数的可靠程度较小。

(2)可用于估计总体均数的可信区间。 (3)可用于均数的假设检验。 2. t分布的特征是什么?

t分布有以下特征:①以0为中心,左右对称 ;②t分布曲线形态与n(确切地说与自由度ν)大小有关。与标准正态分布曲线相比,自由度ν愈小,t分布曲线愈平坦,曲线中间愈低,曲线两侧尾部翘得愈高;自由度ν愈大,t分布曲线愈接近正态分布曲线,当自由度ν= ∞时,t分布曲线为标准正态分布曲线。 3. 标准差与标准误有何区别和联系?

标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。 4. 何谓假设检验?其一般步骤是什么?

所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。假设检验一般分为以下步骤: ① 建立假设:包括: H0,称

12

无效假设;H1: 称备择假设;② 确定检验水准:检验水准用α表示,α一般取0.05;③ 计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0, 差别有统计学意义。

四、计算题

1. 已知正常人的体温水平符合正态分布,在某地调查了100名成年女子测得其体温为36.8摄氏度,标准差为0.2摄氏度,请计算当地女子体温总体均数的95%可信区间。?

1.当地女子体温总体均数的95%可信区为

x?1.96SX?(36.8?1.96??(36.76,36.84)

0.2100,36.8?1.96?0.2100

)2. 某地100名3岁女孩平均身高为92.8cm,标准差为4.6cm,求其标准误。

2. SX?S?n4.6?0.46cm 1003.调查某地100名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2 (g/L),试估计该地健康女性血红蛋白总体均数95%的可信区间。

3. 该地健康女性血红蛋白总体均数95%的可信区间为

x?1.96SX?(117.4?1.96??(115.4,119.4)10.2100,117.4?1.96?10.2100

)1389. 总体均数的95%可信区间为:

x?1.96SX?(92.8?1.96?0.38,92.8?1.96?0.38)

即:(92.1,93.5) 即该地3岁女孩身高总体均数的95%可信区间为92.1~93.5cm。

第七章 t

检验

一、单选题

1.两样本比较作t检验,差别有显著性时,P值越小说明 ( ) C 越有理由认为两总体均数不同

2.两样本比较时,分别取以下检验水准,哪一个的犯Ⅱ类错误最小 ( )

13

D ?=0.20

3.当样本含量n固定时,选择下列哪个检验水准得到的检验功效最低 ( ) A ?=0.01

4.假设检验中的第二类错误是指 ( ) D 不拒绝实际上不成立的H0

5. I类错误指的是 ( ) B 真实的的H0被拒绝的可能性

6.两样本均数比较用t检验,其目的是检验 ( ) C两个总体均数是否相同

7.配对设计两样本均数间的差别的假设检验时,查t界值表的自由度为 ( ) A n-1

8.两样本均数的t检验对资料的要求是 ( ) A正态性、独立性、方差齐性 B资料具有代表性 C为定量资料 * D以上均对

9.两组独立样本t检验要求: ( ) C 两组数据总体方差相等 二、问答题

1. t检验、u检验的应用条件各是什么?

t检验的应用条件是:①σ未知而且n较小时,要求样本来自正态总体;②两小样本均数比较时,还要求两样本所属总体的方差相等。u检验的应用条件是:①σ已知;②σ未知但样本含量较大。

2.在医学研究中,常见的配对设计资料有哪些情况?

①配对的两个受试对象分别接受两种处理的数据;②同一受试对象两个部位的数据;③同一样品用两种方法(仪器等)检验的结果。此类设计的目的是推断两种处理(方法等)的结果有无差别。

三、计算题

1. 15例长期服用某种避孕药的妇女,其血清胆固醇含量的均数为6.5 mmol/L,标准差为0.7mmol/L,一般健康妇女血清胆固醇含量的均数为4.4 mmol/L,问长期服用该种避孕药的妇女其血清胆固醇含量的均数与一般健康妇女有无差别? (t0.05,14 =2.145)

1. (1)建立假设 H0 :μ=μ0 =4.4,H1:μ≠μ

14

0 α

=0.05

(2)计算t值

X=6.5,μ0 =4.4,S=0.7,n=15。代入公式(15.12)。

t?X??0X??06.5?4.4???11.667 SXSn0.715

(3)确定P值和作出推断结论。

t0.05,14 =2.145,本例t=11.667>t0.05,14 =2.145,所以,P<0.05。

因P<0.05,故在α=0.05水准上拒绝H0 ,接受H1 。可认为长期服用该种避孕药的妇女其血清胆固醇含量的均数与一般健康妇女的差别有统计学意义,前者较高。

2. 按性别相同、年龄相近、病情相近把16例某病患者配成8对,每对分别给予A药和B药治疗,现测得治疗后的血沉(mm/小时)结果如表,问不同药物治疗后病人血沉水平是否有差异?(t0.01,7 =3.499)

不同药物治疗后某病患者的血沉值/(mm/小时)

对子号 A药 B药 d d2 (1) (2) (3) (4)=(2)-(3) (5) 1 10 6 4 16 2 13 9 4 16 3 6 3 3 9 4 11 10 1 1 5 10 10 0 0 6 7 4 3 9 7 8 2 6 36 8 8 5 3 9 Σd=24 Σd2 =96

2. (1)建立假设 H0:μd=0 ,H1:μd≠ 0, α=0.05

2

(2) 计算t值 今n=8,∑d=24,∑d=96, d??d/n?24/8?3

?d2?(?d)2/n96?242/8 Sd???1.852

n?18?1 t?d?0d3???4.582 SdSdn1.8528(3)确定P值和推断作出结论

15

ν=n-1=8-1=7,查t界值表,t0.01,7 =3.499, 本例t=4.582>t0.01,7 =3.499,所以,P<0.01。

因P<0.01,故在α=0.05水准上拒绝H0 ,接受H1 ,可认为不同药物治疗后病人血沉水平不同。

3.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:磅)。 男婴x1 7.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 8.4 6.7 7.5 女婴x2 7.1 7.9 6.4 6.6 8.0 6.0 7.2 6.8 7.8 5.3 6.6 7.3 (1)该资料是数值变量资料还是分类资料?数值变量资料

(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?成组t检验

(3) 经过计算t值为2.16,已知自由度22时,双侧面积0.05对应的t界值为2.07,自由度11时,双侧面积0.05对应的t界值为2.20。试写出假设检验的全过程并下结论。

3.答:H0:白种人男婴与女婴的出生体重是相同的即μ1=μ2

H1:μ1≠μ2 α=0.05

t=2.16 ν=22 t>t0.05/2,22=2.07 p<0.05

在α=0.05水平上拒绝H0,认为白种人男婴与女婴的出生体重是不同的,男婴重于女婴。

第八章 方差分析

一、选择题:

答题说明: 每个考题下面都有A, B, C, D四个备选答案, 答题时只许从中选出一个最合适的答案,把这个答案前的编号字母圈出。 1.成组设计的方差分析中,必然有 。 D. SS总?SS组间?SS组内

2.配伍组设计的两因素方差分析有 。 A.SS总=SS处理+SS配伍+SS误差

3. 完全随机设计的方差分析中,若处理因素无作用,理论上应有 。

B. F=1

16

4.欲比较12名氟作业工人工前、工中,工后的尿氟浓度,采用两因素方差分析,处理组间与配伍组间自由度分别为 。 C. 2,11

5.方差分析的目的是检验 。

B. 两个或多个总体均数是否不全相同

6.多组均数的两两比较中,若不用q检验而用t检验,则 。 C. 会把一些无差别的总体判断为有差别的概率加大

7. 对满足方差齐性和正态分布的同一资料,当处理组数k=2时,单因素方差分析的结果与t检验的结果 。 B. 完全等价

8. 以下那条不属于完全随机设计的方差分析的应用条件? D. 各比较组样本方差相等

9. 在单因素方差分析中,组间变异反映的是 的影响。 B. 研究因素和随机误差 二、回答下列问题

1.试述方差分析的基本思想。

答:方差分析的基本思想为:将总的变异分解成若干部分,每一部分都与某种效应相对应;总的自由度也被分为相应的各个部分。将这些可能由某因素所致的变异与随机误差比较,了解该因素对结果有无影响。

第九章 χ2检验

一、选择题:

答题说明: 每个考题下面都有A, B, C, D四个备选答案, 答题时只许从中选出一个最合适的答案, 把这个答案前的编号字母圈出。

1.两组计数配对资料比较,当(b+c)<40,用 公式计算检验统计量来判断两组差异的来源。

D. (?b-c?-1)2/(b+c)

2.完全随机设计四格表资料,当n≥40,且有一个理论数1≤T<5, 计算检验统计量可用 公式。 B. ?(?A-T?-0.5)2/T

3.4行×2列表卡方检验的自由度为 。

17

B. 3

4.某医师用注射疗法治疗椎间盘突出,治疗26例12人治愈,用手术方法治疗27人,22人治愈,若进行?2检验,用 公式。 A. ?(A-T)2/T 5.某医师用电针灸加中药治疗抑郁症病人,治疗16例15人治愈,用西药治疗23人,21人治愈,若比较两组的治疗效果,用 公式。 D. 确切概率法 26.三个样本率作比较,?2??0.01(2),可认为 。

A.各总体率不同或不全相同

7.某医师用中西药结合法治疗腰肌病病人,治疗35例其中28人好转,用单纯中药治疗27人其中16人好转,用西药治疗22人,其中16人好转,若进行?2检验,自由度为 。 B.2

8. 关于卡方值,说法正确的是 。 D. 卡方值不可能小于零

二、计算题

1. 脑胶质瘤患者43人,28例采用手术方法治疗,其中22人发生脑功能损伤,15例采用放疗方法治疗,其中7人发生脑功能损伤,试比较两种方法治疗后脑功能损伤发生率有无差异。

表9-1 两种治疗方法后脑功能损伤率的比较

脑功能损伤

治疗方法

手术 放疗 合计

22 7 29

无 6 8 14

28 15 43 合计

1. H0:?1??2, H1:?1??2,??0.05 样本总数n=43>40,最小的理论频数为T22:T22?15?14?4.88 43 18

T22?5,故使用校正公式计算?2值。

(22?8?6?7?432)2?43???3.19,v?1

28?29?15?142?2??20.05(1)?3.84,故P>0.05,按??0.05的水准不拒绝H0,尚不能认为两种治

疗方法的脑功能损伤率不同。

2. 两种方法检查已确诊的乳腺癌患者120名,甲法的检出率为60%,乙法为50%,两方法一致检出率为35%,问两方法有无差别?

表9-2 两种方法的乳腺癌检出情况

乙法

甲法 + - 合计

合计

+ 42 18 60

- 30 30 60

72 48 120

2. H0:?1??2, H1:?1??2,??0.05

b+c =30+18﹥40,故使用配对卡方检验专用公式

?30?18??2?30?182?3,v?1

?2

出率无统计学差异。

第十章 非参数秩和检验

一、选择题:

答题说明: 每个考题下面都有A, B, C, D四个备选答案, 答题时只许从中选出一个最合适的答案, 把这个答案前的编号字母圈出。 1.以下检验方法中属于参数检验的是 。 A.t检验

2.等级资料比较宜用 。 C.秩和检验

19

3.在作两样本均数比较时,已知n1、n2均小于30、总体方差不齐且呈极度偏态的资料宜用 。 D.秩和检验

4.符合参数检验条件的数值变量资料如果采用非参数检验,则 。 B.第二类错误增大

5.配对秩和检验的基本思想是:若H0假设成立,对样本来说 。 D.正秩和与负秩和的绝对值不会相差很大

6.三组比较的秩和检验,样本例数均为5,确定P值时应查 。 B.H界值表

7. 完全随机设计两样本秩和检验中样本统计量T值应取 。 B.样本量小的一组的秩和

8.以下关于非参数检验说法错误的是 。 A.t检验也属于非参数检验

9. 多样本均数比较时,当分布类型不清时,应选 。 B. H检验

10. 完全随机多样本秩和检验中,当各组样本例数超过5时,需查 表,以确定P值的范围。 C.?2界值表

11. 在完全随机设计的两样本秩和检验中,当相同秩次出现的比例超过 时,需对u值进行校正。 C.25% 二、回答下列问题:

1.非参数检验的适用资料主要包括哪些?

答:非参数检验主要用于当参数检验的应用条件得不到满足时,具体主要包括以下资料:(1)总体分布为偏态或分布形式未知的资料;(2)等级资料;(3)个别数据偏大或数据的某一端无确定数值的资料;(4)各总体方差不齐的资料。 2.非参数检验的优缺点各有哪些?

2. 答:非参数检验优点是不受总体分布的限定,适用范围广;非参数检验的缺点是符合作参数检验的资料,若用非参数检验,检验效率低于参数检验,一般犯第二类错误的概率β比参数检验大。 3. 配对设计的秩和检验如何编秩?

3. 答:先求各对数值的差值,然后再进行编秩:(1)按差值的绝对值由小到大编秩 ,将秩次按差值的正负分两栏;(2)差值为0,则弃去不计,同时样本例数相应减1;

20

(3)遇差值的绝对值相等,符号相反应取平均秩次,符号相同顺次排列。

第十一章 线性回归与相关

一、选择题

答题说明: 每个考题下面都有A, B, C, D四个备选答案, 答题时只许从中选出一个最合适的答案, 把这个答案前的编号字母圈出。

1.进行直线相关分析时,如r?r0.05(n?2)时,可认为两变量X与Y间 。 B.有直线相关关系

2.已知r?1,则一定有 。 C.Sy.x?0

3.已知两样本,r1?r2,那么 。 D.两样本的决定系数相等

4.对直线相关系数的假设检验,其无效假设H0是 。 B.?=0

5.若r1= r2,下列表述正确的是 。D D. tb1=tr1

6.用样本求得R=0.9,则同一资料b值应 。 A. b>0 7.SY,X表示 。

?D.Y对Y的离散程度

8. 用最小二乘法确定直线回归方程的原则是各观察点距直线的 。 B. 纵向距离的平方和最小

9.计算直线相关系数要求 。 B.两变量均要求服从正态分布

10.直线回归系数的假设检验,其自由度为 。 C. n-2

11.回归系数的假设检验 。

21

A.能用同一资料的r的检验代替 B. 能用t检验 C.能用F检验 * D. 三者均可

12. 关于直线相关系数与回归系数的关系描述错误的是 。 A.r大,则b也一定大

13.对直线回归系数的假设检验,其无效假设H0是 。 D.?=0

14. 两组资料中,回归系数较大的一组 。 D.则r可能大也可能小

15. 计算直线回归系数要求 。 A. 只要应变量服从正态分布 二、解释下列名词:

1. 直线回归系数:回归系数b即为回归直线的斜率,其统计学意义是X每增加和减少一个单位,Y平均改变b个单位。b越大表示直线变化的趋势越陡。b>0,表示Y随X呈同向直线变化;b<0,表示Y随X呈反向直线变化;b=0,表示Y与X无线性回归关系。 2. 直线相关系数:两变量之间相关性的强度可用直线相关系数来描述,用r表示,相关系数r是个无单位的的数值,?1?r?1;r?0表示正相关,r?0表示负相关,r?0表示零相关;三、回答下列问题:

1.直线相关和直线回归分析有哪些区别和联系?

答:(1)区别:1)在资料要求上,回归要求因变量Y服从正态分布;X是可以精确测量和严格控制的变量,一般称为I型回归;2)在应用上,说明两变量间依存变化的数量关系用回归,说明变量间双向的相互关系时用相关。(2)联系:1)对一组数据若同时计算r与b,它们的正负号是一致的。r为正号说明两变量间的相互关系是同向变化的。b为正,说明X增(减)一个单位,Y平均增(或减)b个单位。2)r和b的假设检验是等价的,即对同一样本,二者的t值相等;3)回归与相关可互相解释。 四、完成以下计算:

1. 为研究中年女性体质指数和收缩压之间的关系,随机测量了某社区16名40岁以上女性的体质指数和收缩压(mmHg),结果见表11-1,试做直线相关与回归

22

r的大小描述双变量相关程度的大小,

r越接近于1则

相关性越好,反之接近于0,则相关性越差。

分析。

表11-1 16名40岁以上女性体质指数和收缩压(mmHg)的测量结果

编号 体质指数(X) 收缩压(Y) 1 23.62 135 2 25.87 142 3 26.19 150 4 23.16 132 5 22.01 120 6 21.45 126 7 28.33 161 8 27.72 164 9 26.88 144 10 29.01 152 11 26.27 145 12 25.70 157 13 28.94 155 14 29.15 170 15 23.53 149 16 27.21 158 合计 415.04 2360

1. 计算过程如下

?X=415.04,?X2=10861.00,

?Y=2360,?Y2=351010,61669.61,由上述公式可得:

lXX??(X?X)2??X2??X?2?n=94.86

lYY??(Y?Y)2??Y2???Y?2n=2910

l??(X?X)(Y?Y)??XY??X?YXYn=451.21

进一步可得到体质指数和收缩压的直线相关系数为:

r?lxy21l?451.xxlyy94.86?2910?0.8588

直线相关系数的假设检验:

H0:??0,H1:??0,??0.05

tr?0?rr??S?r1?r2?0.85881?0.85882?6.272

n?216?2 23

?XY=

自由度v = n-2=16-2=14,查t界值表,得双侧t0.05,14=2.145,由于∣tr∣﹥t0.05,14,故P<0.05,按??0.05水准拒绝H0,接受H1,可认为40岁以上女性体质指数和收缩压之间具有直线相关关系。

lXY451.21??4.756 b?lXX94.86由n=16, ?X=415.04, ?Y=2360,可得:

?X?415.04?25.94X? n16 Y2360 Y????147.5n16 a?Y?bX?147.5?4.756?25.94?24.119因此,拟合出的直线回归方程为: ?Y?24.119?4.756X由于同一资料已进行过直线相关系数的假设检验,且tb?tr,故该直线回归方程也有统计学意义。

第十四章 生存分析

一、选择题

答题说明: 每个考题下面都有A, B, C, D四个备选答案, 答题时只许从中选出一个最合适的答案, 把这个答案前的编号字母圈出。 1. 寿命表法计算生存率,下列正确的是 。 C.生存率不会出现后一年高于前一年

2.若以k代表要比较的组别数,在以下何种检验中,自由度为k-1。 D. Logrank检验

3.对两组或多组生存率曲线比较,可运用 。 D. Logrank检验 二、解释下列名词:

1. 中位生存时间:又称为半数生存期,即当累积生存率为0.5时所对应的生存时间,表示有且只有50%的个体可以活过这个时间。要注意中位生存时间通常不等于生存时间的中位数(除非在这个时间点之前没有删失值存在)。

2. 终点事件:指研究者所关心的特定结局,又称死亡事件、失效事件。

3. 生存时间:指从某起点事件开始到被观测对象出现终点事件所经历的时间,用t表示。 4. 死亡概率:记为q,是指在某段时间开始时存活的个体在该段时间内死亡的可

24

能性大小。 5. 生存概率:记为p,是指在某段时间开始时存活的个体至该时间结束时仍存活的可能性大小。

6. 生存率:用S(tk)表示,是指病人经历tk个单位时间后仍存活的概率。

三、完成以下计算:

1. 100例某肿瘤手术切除后随访状况如下,请完成表14-1并计算各年的累计生存率。

表14-1 100例某肿瘤患者生存资料

生存

时间(年) 0~ 1~ 2~

死亡 失访 人数 人数 5 0 10 6 18 5 期初 校正

人数 人数 5 0 10 6 18 5 死亡概率生存概累计生存

(%) 率(%) 率(%) 100 100.0 5.00 95 92.0 10.87 79 76.5 23.53

25