第一章 绪论 一、教学大纲
(一)教学目的和要求
1、掌握统计学的若干概念;
2、熟悉统计学与公共卫生互相推动的关系 3、了解统计学的学习方法与技能 (二) 教学内容
第一节:医学中统计思维的进化 第二节 统计学与公共卫生互相推动
(一)统计学是公共卫生专业人员的得力工具 (二)现代公共卫生领域对统计学的挑战 第三节 统计学的若干概念 (一)总体与样本
(二)同质与变异 (三)变量的类型 (四)参数与统计量 (五)设计与分析 (六)因果与联系 第四节 目标与方法
(一)基本概念、方法与技能 (二)教与学的方法
二、教学内容精要
1、重要名词和概念
总体( population)、样本( sample)、同质性(homogeneity)、变异(variation)、分类变量(categorical)、有序变量(ordinal variable)、定量变量、参数(parameter)、统计量(statistic)、概率、抽样误差 2、授课重点
1.总体与样本。 2.变量的类型。 3.统计推断的含义。
4.现代公共卫生领域对统计学的挑战。
三、复习题
(一) 名词解释
1. 总体 2. 样本 3. 定量变量 4. 分类变量 (二)单选题
1、 抽样误差是指
A. 不同样本指标之间的差别 B. 样本指标与总体指标之间由于抽样产生的差别 C. 样本中每个体之间的差别 D. 由于抽样产生的观察值之间的差别 E. 测量误差与过失误差的总称
2、 为了由样本推断总体, 样本应该是
A. 总体中任意的一部分 B. 总体中的典型部分 C. 总体中有意义的部分 D. 总体中有价值的部分 E. 总体中有代表性的部分
3、 随机样本的特点有
A. 能消除系统误差 B. 能消除测量误差 C. 能缩小抽样误差 D. 能消除样本偏差 E. 以上都不是 4、 搞好统计工作, 达到预期目标, 最重要的是
A. 原始资料要多 B. 原始资料要正确 C. 分析资料要先进 D. 整理资料要详细 E. 统计计算精度要高 5、 计数资料、计量资料和等级资料的关系是 A. 计量资料兼有计数资料和等级资料的一些性质 B. 计数资料兼有计量资料和等级资料的一些性质 C. 等级资料兼有计量资料和计数资料的一些性质 D. 计数资料有计量资料的一些性质 E. 以上都不是
6、 统计学中所说的总体是指
A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的个体 E.根据人群划分的研究对象的全体 7、 统计资料的类型包括
A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料
(三)填空题
1、统计工作的基本步骤包括 、 、 、 其中最关键的是 。
2、统计分析包括 和 。
3、误差可分为 、 和 , 其中 不可避免, 但可用抽样设计来控制。
4、概率是描述随机事件可能发生的量,用 表示。随机事件发生的概率在 和 之间 。
(四)是非题
1、卫生统计学研究的主要内容是社区医疗。
2、随机事件发生的概率小于0.05或0.01时,可认为在一次抽样中它不会发生。
(五)简答题
1、说出两种变量类型及其含义。试举例说明。 2、说出总体与样本的区别。试举例说明。
复习题参考答案
(一)名词解释
1. 总体(population):根据研究目的确定的同质的研究对象的全体(性质相同的所
有观察单位的某种变量值的集合)。
2. 样本:(sample):从总体中随机抽取一部分观察单位进行观察,这部分观察单位对
1
总体有代表性,称为样本。(总体中每一观察单位均有相同的机会被抽取到样本中去。
3. 定量变量:用定量方法对每个观察单位测定某项指标的所得的资料.一般有度量衡
单位(也称数值变量或计量资料measurement data)。
4. 分类变量:表现为互不相容的类别或属性。无序分类变量,即将观察单位按某种属
性或类别分组,再清点各组的观察单位数,和有序分类,即将观察单位按某种属性(或性质、标志)的不同程度分组,然后清点各组的数据所得的资料。
(二)单选题
1.B 2.E 3.D 4.B 5.C 6.B 7.E (三)填空题
1、设计、收集、整理、分析,设计。 2、统计描述、统计推断。
3、系统误差、随机测量误差、抽样误差、抽样误差。 4、P、0、1 。 (四)是非题 1、错 2、对 (五)简答题
1、说出两种变量类型及其含义。试举例说明。
见名词解释。举例略。
2、说出总体与样本的区别。试举例说明。
见名词解释。举例略。
第二章 定量资料的统计描述
一、教学大纲
(一)教学目的和要求
1、掌握描述定量变量资料集中趋势的统计指标和离散趋势的特征数; 2、熟悉频数分布特征和常用统计图表的绘制 3、了解描述分布形态的特征数 (二)教学内容
第一节 频数与频数分布
(一) 离散型定量变量的频数分布 (二) 连续型定量变量的频数分布 第二节 定量资料的特征数
(一)描述集中趋势的统计指标
(二)描述离散趋势的特征数 (三)描述分布形态的特征数 第三节 常用统计图表 (一)统计表
(二)统计图
二、教学内容精要
1、重要名词和概念
均数(mean)、几何均数( geometric mean)、中位数(median)、众数、百分位数、标准差(standard deviation)、方差(variance)、变异系数(coefficient of variation)、 2、授课重点
1.频数分布。
2
2.集中趋势统计指标。 3.离散趋势的特征数。
4.统计表的绘制。 5.常用统计图的绘制。
三、复习题
(一)名词解释
1.中位数 2.标准差 (二)单选题
1、 当数值变量分布末端无确切数据时, 平均数宜用
A. 均数 B. 几何均数 C. 中位数 D. 相对数 E. 四分位数 2、 计算某病的潜伏期长短,可用
A、 算术平均数 B、中位数 C、几何均数 B、 中位数+几何均数 E、算术平均数+几何均数 3、 反映一组呈负偏态分布资料平均水平的指标用:
A、 平均数 B、中位数 C、几何均数 D、均数 E、A+B+C 4、 下列有关中位数(M)的描述中,不正确的是 A、一组观察值中最大值与最小值之差
B、一组观察值从小到大排列后,位次居中的观察值
C、n为奇数时,M=X (n+1)/2 D、n为偶数时,M=[X(n/2)+X(n+1)/2]/2 E、M=P50 5、 下面哪一指标较小时, 可说明有样本均数的代表性较好
A. 变异系数 B. 标准差 C. 标准误 D. 极差 E. 四分位间距 6、 总体标准差描述的是
A. 所有个体值对总体均数的离散程度 B. 某样本均数对总体均数的离散程度 C. 所有样本均数对总体均数的离散程度 D. 某些样本均数对总体均数的离散程度 E. 所有某个含量相同的样本均数对总体均数的离散程度 7、 描述一组偏态分布资料的变异度,宜用
A、全距 B、标准差 C、变异系数 D、四分位数间距 E、方差 8、 变异系数越大,表示
A、相对变异程度越大 B、平均数越大 C、标准差越小 D、样本含量越大 E、标准差越大 9、 频数分布的两个重要特征是
A、统计量与参数 B、样本均数与总体均数
C、集中趋势与离散趋势 D、样本标准差与总体标准差 E、样本与总体 10、 频数分布的类型有
A、对称分布和偏态分布 B、对称分布和正偏态分布
C、对称分布和负偏态分布 D、正偏态分布和负偏态分布 E、正态分布和偏态分布 11、 数值变量资料频数表中,组中值的计算公式中错误的是 A、(本组段下限值-相邻下一组段下限值)/2 B、(本组下限值+本组段上限值)/2 C、(本组段下限值+本组段上限值)/2 D、本组段下限值+组距/2 E、本组段上限值-组距/2 12、 常用的平均数指标不包括
A、算术平均数 B、几何均数 C、均数 D、极差 E、中位数 13、 常用离散趋势指标不包括
A、方差 B、极差 C、标准差 D、P50 E、四分位数间距
3
14、 下列有关四分位数间距描述中不正确的是
A、四分位数间距=P75-P25 B、四分位数间距比极差稳定
C、四分位数间距即中间50%观察值的极差 D、可用于描述正态分布资料的变异度 E、四分位数间距越大,表示变异度越大 15、 有关离散度指标意义中,描述不正确的是
A、数值越大,说明个体差异越大 B、数值越大,说明观察值的变异度越大 C、数值越小,说明平均数据的代表性越好 D、数值越小,说明平均数的代表性越差 E、应与平均数结合起来进行分析 16、 比较10岁男童与18岁男青年身高的变异程度,宜用:
A.方差 B.极差 C.标准差 D.变异系数 E.四分位数间距如果X服从总体均数 17、 比较某地区某年3种疾病的发病率, 可绘制
A. 条图 B. 百分条图 C. 线图 D. 半对数线图 E. 直方图 18、 不同性质的统计资料, 常用不同的统计图加以表达, 一般来讲 A. 连续性资料宜用直条图 B. 连续性资料宜用园图或构成图
C. 按质分组的资料宜用线图 D. 按质分组的资料宜用直方图或多边图 E. 以上都不对 19、 为表达某地人群胆固醇含量的频数分布,宜选择
A、直方图 B、直条图 C、百分条图 D、线图 E、圆图 20、 统计分析表有简单表和复合表两种, 复合表是指
A、有主词和宾词 B、 主词分成2个或2个以上标志 C、宾词分成2个或2个以上标志 D、包含2张简单表 E、 包含2张或2张以上简单表 21、 统计表有广义与狭义两种,狭义统计表指:
A、统计分析表 B、调查表 C、统计报表 D、整理汇总表 E、计算工具表 22、 制统计图时要求
A、标题应说明图的主要内容,一般在图的上方 B、纵横两轴应有标目,一般不注单位 C、纵轴尺度必须从零开始 D、直条图和线图,其长宽比例一般取5:7 E、以上都不对 (三)填空题
1、频数分布可分为 和 。 2、频数分布的两个重要特征是 和 。
3、若频数分布明显呈偏态, 各观察值之间常呈倍数关系, 宜用 反映其平均增减倍数。 4、比较度量衡单位不同的各组资料的变异度, 宜用 指标。
5、几何均数是将原始变量值作 变换,可使其成为 分布,再按类似于算术均数计算公式作计算。
6、统计表由 、 、 和 构成。
7、绘制统计表要求线条不宜过多, 除有 线和 线以及 线以外, 其余如竖线、斜线均不宜有。
8、统计图除园图外, 长宽比例一般以 为宜, 标题一般标于 。 (四)是非题
1、变异系数越大表示标准差越大。
2、比较5所中学的近视患病率可绘制直条图。 3、正态分布的特点有算术均数等于中位数
4、如果有少数几个数据比大部分数据大几百倍,这组资料就不宜计算算术均数。
4
(五)简答题
1、均数、中位数和几何均数的适用范围有何异同? 2、列出离散程度的指标, 说出它们的应用条件。 3、列出常用统计图, 说出它们的应用条件。 (六)计算题 1、某防疫站对164名患某种沙门菌食物中毒病人进行调查, 发现潜伏期的资料如表, 作者据此资料分析人为, 此164人患沙门菌食物中毒的平均潜伏期?x=26.13h, 标准差s=26.13h。据此资料, 你是否同意作者选用的统计指标?为什么?请计算正确的平均数。
164人患某种沙门菌食物中毒潜伏期分布 潜伏期(h) 0? 6? 12? 18? 24? 30? 36? 42? 48? 54? 60? 66? 72?78 例数 5 20 25 33 24 16 13 10 7 5 3 2 1
复习题参考答案
(一)名词解释
1.中位数:是一组变量值按从小到大顺序排列后位次居正中间的那个数值。
2. 标准差:是最常用的衡量变量值间离散程度的变异指标,适合用来表达对称分布的离散程度。 (二)单选题
3.B 4.A 5.B 6. A 7. D 1. C 2.B 8.A 9.C 10.A
11.A 12.D 13.D 14.D 15.D 16.D 17.A 18.E 19.A 20.B
21.A 22.D
(三)填空题
1、对称分布、偏态分布。 2、集中趋势、离散趋势。 3、几何均数。 4、变异系数。
5.对数、对数正态。
6、标题、标目、线条、数字。 7、顶线、底线、纵标目下线。 8、5:7、下方。 (四)是非题
1、错 2、对 3、对 4、对 (五)简答题
1、均数、中位数和几何均数的适用范围有何异同?
算术均数:对称分布(特别是呈正态分布或近似正态分布)
几何均数:用于描述变量值呈等比数列, 或呈对数正态分布(log-normal distrbution)或近似对数正态分布资料。 中位数:多用于描述偏态分布资料,或一端或两端无确定数值的开资料的集中趋势,或频数分布不明资料
2、列出离散程度的指标, 说出它们的应用条件。
全距:常用于传染病、食物中毒的最长、最短潜伏期,资料普遍适用。 四分位间距:偏态分布资料,特别是N较大时,越接近分布的中间越稳定。 标准差:适合用来表达对称分布的离散程度。
5
变异系数:比较均数相差悬殊的几组资料的变异程度或比较单位不同的多组资料的变异度。 3、列出常用统计图, 说出它们的应用条件。
(1) 直条图(bar graph): 用相同宽度条形的长短.来表示资料数值大小比例关系, 适用于按性质分组,各个独立的、无连续关系的统计图。 (2) 百分条图: 适用于表达构成比的资料。
(3) 线图: 用线条的上升和下降来表示某事物( 或某现象 )因时间或条件而变化的趋势。适用于连续性的变量资料。
(4) 直方图: 用于表示连续变量的频数分布。常以横轴表示被观察现象, 纵轴表示频数或频率, 以各矩形( 宽度为组距 )的面积代表各组段的频数。 (5)其他:略 (六)计算题
1、不同意,因为该频数分布呈偏态,不对称,用均数不合适。应采用中位数计算, M=L+i/fm( n?50% - ??L )=18+(6/33)×(164/2-50)=18+5.82=23.82(h)
第三章 定性资料的统计描述
一、教学大纲
(一)教学目的和要求
1、掌握常用的相对数指标和应用注意的事项; 2、熟悉几个常用医学人口统计和疾病统计指标 3、了解动态数列及其分析指标 (二)教学内容
第一节 定性变量的分布特征
(一) 定性资料的频数分布 (二) 常用的相对数指标
第二节 医学人口统计常用指标 (一)医学人口统计资料的来源
(二)描述人口学特征的常用指标 (三)人口死亡统计
(四)有关生育的常用指标 第三节 疾病统计常用指标 (一)疾病统计资料的来源
(二)疾病和死因分类 (三)疾病统计指标
第四节 动态数列及其分析指标
二、教学内容精要
1、重要名词和概念
频率型指标、强度型指标、相对比型指标、构成比、老年人口系数、负担系数、婴儿死亡率(infant mortality, IMR)、粗死亡率、孕产妇死亡率(maternal mortality)、比例死亡率(proportionate mortality rate, PMR)、发病率(incidence rate, IR)、患病率(prevalence rate, PR) 2、授课重点
1.常用的相对数指标和应用注意的事项。 2.人口死亡统计。 3.疾病统计指标
6
三、复习题
(一)名词解释
1.发病率 2. 婴儿死亡率 3. 比例死亡率 4. 孕产妇死亡率 5. 患病率 (二)单选题
1、 计算某地某年粗死亡率的分母不能用:
A、年平均人口数 B、年中人口数 C、(年初人口数+年末人口数)/2 D、年中任意时刻人口数 E、该年7月1日零时人口数 2、 构成比的重要特点是各组成部分的百分比总和
A、 、必大于1 B、必小于1 C、必等于1 D、随着资料的变化而变化 E、随着构成部分大小改变
3、 说明某现象发生强度的指标为
A. 构成比 B. 相对比 C. 定基比 D. 环比 E. 率 4、 关于相对数,以下哪一项不正确
A、是计数资料统计描述指标 B、计算相对数的分母不宜过小 C、某医院的门诊人次与床位数之比为构成比
D、各部分的构成比总和为100% E、相对数间比较要具备可比性 5、 相对比所具有的特点是
A. 一定小于100% B. 一定大于100% C. 可大于也可小于100% D.几个相对比的和为100% E. 以上都正确
6、 根据相对数的定义,可认为变异系数(CV)属于
A、构成比 B、频率指标 C、相对比 D、动态数列 E、E、绝对数 7、 计算某年某病的发病率的分子是
A. 该年年初有该病人数 B. 该年年中有该病人数 C. 该年年末有该病人数 D. 该年平均患该病人数 E. 以上都不是
8、 一组1000名女性乳腺癌患者, 其中50例为孕妇, 据此可推断
A. 孕妇易患乳腺癌 B. 孕妇不易患乳腺癌 C. 妊娠可诱发患乳腺癌 D. 乳腺癌与妊娠无关 E. 该组乳腺癌患者中5.0%是孕妇 (三)填空题 1、常用的人口死亡统计描述的主要指标有 、 、 等。 2、构成比有两个特点: (1) , (2) 。 (四)是非题
1、患病率是强度型指标。
2、构成比可说明某种事物发生的可能性大小。 (五)简答题
1、列出常用相对数, 并解释其作用。 1、简述应用相对数应注意的问题。 (六)问题(包括计算题)
1、某地某年肿瘤普查资料整理如下表
某地某年肿瘤普查资料
年龄 0? 30? 40?
人口数 633000 570000 374000
肿瘤患者数 19
171 486
构成比( % ) ( ) ( ) ( )
患病率( 1/万 )
( ) ( ) ( )
7
50? 60? 合计
143000 30250 1750250
574 242
1492
( ) ( ) ( )
( ) ( ) ( )
据上述资料 (1) 填充。
(2) 分析讨论哪个年龄组最易患肿瘤? 哪个年龄组病人最多? 2、某医院研究海群生与吐酒石对丝虫病的疗效, 对81例不合并其它寄生虫的丝虫病患者采用海群生治疗, 对120例合并血吸虫的丝虫病患者用吐酒石治疗, 结果如表:
海群生与吐酒石治疗丝虫病的疗效比较 药物 海群生 吐酒石
病例数 81 120
治愈例数 52 25
治愈率(%) 64.2 20.8
据此表, 作者认为, 海群生疗效比吐酒石好, 你怎样评价?
3、据下述资料, “锑剂短程治疗血吸虫病病例的临床分析”一文认为“其中10?组死亡率最高, 其次为20?组”。(1)你是否同意该结论?请说明理由。(2)怎样判断各年龄组的死亡情况是否有区别。
锑剂治疗后死亡者年龄分布 性别 女 男 合计
0~ 3 3 6
10~ 11 7 10
20~ 4 6 10
30~ 5 3 8
40~ 1 2 3
50~ 5 1 6
合计 29 22 51
复习题参考答案
(一)名词解释
见教材 (二)单选题
3.B 4.C 5.C 6. C 7. E 1. D 2.C 8.E
(三)填空题
1、粗死亡率、婴儿死亡率、孕产妇死亡率等。
2、总和等于1、某一内部组成发生改变其余均发生改变。 (四)是非题 1、错 2、错 (五)简答题
1、列出常用相对数, 并解释其作用。
见教材
2、简述应用相对数应注意的问题。
见教材
(六)问题(包括计算题) 1、(1)构成比(%)=(各年龄肿瘤患者数/患者总数)×100%
患并率(1/万)=(各年龄肿瘤患者数/人口数)×10000/万 (2) 50-组病人最多,60-组最易患肿瘤。
2、两组患者不具备可比性,所以不能认为海群生疗效比吐酒石好
3、不同意,因为该组资料只能获得构成比,不能说明死亡率情况。应计算各年龄组死亡率。
8
第四章 常用概率分布
一、教学大纲
(一)教学目的和要求
1、掌握正态分布和二项分布的概念与特征,二项分布的正态分布近似;
2、熟悉正态分布面积规律和医学参考值范围的估计方法,熟悉二项分布概率计算方法 3、了解poisson分布的概念与特征 (二)教学内容
第一节 二项分布
(一) 二项分布的概念与特征 (二) 二项分布的应用
第二节 poisson分布的概念与特征 (一)poisson分布的概念
(二)poisson分布的特征 (三)poisson分布的应用 第三节 正态分布 (一)正态分布的概念
(二)正态分布下面积的分布规律 (三)正态分布的应用
二、教学内容精要
1、重要名词和概念
正态分布(normal distribution)、二项分布、医学参考值、标准正态分布 2、授课重点
1.正态分布的概念与特征。 2.正态分布下面积的分布规律。 3.正态分布的应用。
4.二项分布的概念与特征。 5.二项分布的应用
三、复习题
(一)名词解释
1.正态分布 2. 二项分布 (二)单选题
1、 如果X服从总体均数为?, 总体标准差为?的正态分布, 则作u = ( x - ? )/?变换后, A. u符合正态分布, 且均数不变 B. u符合正态分布, 且标准差不变 C. u符合正态分布, 且均数与标准差都不变 D. u符合正态分布, 且均数与标准差都改变 E. u不符合正态分布
2、 某人群的某个生理指标或生化指标的正常值范围一般指
A. 该指标在所有人中的波动范围 B. 该指标在所有正常人中的波动范围 C. 该指标在绝大部分正常人中的波动范围 D. 该指标在少部分正常人中的波动范围 E. 该指标在一个人不同时间的波动范围 3、 正态分布曲线下右侧5%对应的分位点为
A、μ+1.96σ B、μ-1.96σ C、μ+2.58σ D、μ+1.64σ E、μ-2.58σ 4、 求正常人某个指标的正常值范围在理论上要求
A、正态分布不能用均数标准差法 B、正态分布不能用百分位数法
9
C、偏态分布不能用均数标准差法 D、偏态分布不能用百分位数法 E、对称分布不能用百分位数法
5、 已知调查某地健康成年男子100名的脉搏数,平均值为70次/分。标准差为5.5次/分,估计该地健康成年男子的脉搏正常值为:
A.69—71 B.59—81 C.56—126 D.68—72 E.65—76 6、 横轴上, 正态曲线下从? - 1.96?到?的面积为
A. 95% B. 45% C. 97.5% D. 47.5% E. 49.5% 7、 计算样本率的抽样误差,准确的公式是: A、 π(1-π)
n B、 π(1-π) n-1 C、 P(1-P) P D、 P(1-P) N(1-N)
E、 π(1-π)
n(1-n)
8、 用正态近似法进行总体率的区间估计, 应满足
A. n足够大 B. p或( 1 - p )不太小 C. np或n( 1 - p )均大于5 D. 以上均要求 E. 以上均不要求 (三)填空
1、正态分布的特征有: ; ; 。
2.正常值指 。制定正常值范围的方法根据指标的 而判断, 可有 法和 。
3、某市159名15岁女生体重均数?X=46.8Kg , 标准差S=5.5Kg,估计本市15岁女生体重正常值应在 。 (四)是非
1、理论上,对于正态分布资料P5-P95和μ±1.96σ范围内都包含95%的变量值。 2、总体率越接近100%,样本率的分布越接近正态分布。 (五)简答
1、正态分布、标准正态分布与对数正态分布有何异同? 2、二项分布与正态分布的区别与联系 (六)计算
1、有100个健康成年男子, 用甲方法进行血钙值测定, 得平均数10mg/100ml, 标准差为1mg/100ml。现有一成年男子血钙值为9mg/100ml, 问此人血钙值是否落在95%正常值范围内?
复习题参考答案
(一)名词解释
见教材 (二)单选题
3.D 4.C 5.B 6. D 7. A 1. D 2.C 8.D
(三)填空
1、均数处最高; 以均数为中心, 左右对称; 有两个参数: ?和?。
2.指绝大多数正常人的各种生理常数。分布类型, 正态法、百分位数法。
10
3、36.02~57.58。 (四)是非 1、错 2、错 (五)简答
1、正态分布、标准正态分布与对数正态分布有何异同? 相同点:均符合正台分布特点,符合面积规律
不同点:标准正态分布:原始变量值须通过U变换;
对数正态分布:原始变量值须通过对数变换。
2、二项分布与正态分布的区别与联系
区别:二项分布用于非连续性资料(分类变量)、正态分布用于连续性资料(定量资料) 联系:二项分布可正态近似,条件略(见教材)。 (六)计算
1、10±1.96×1=8.04—11.96,落在95%正常值范围内
第五章 参数估计基础
一、教学大纲
(一)教学目的和要求
1、掌握样本均数和样本频率的抽样误差描述指标;掌握参数估计的概念和总体均数、总体概率置信估计方法;
2、熟悉t分布概念和t分布图形、t分布表 (二)教学内容
第一节 抽样分布与抽样误差
(一) 样本均数的抽样分布与抽样误差 (二) 样本频率的抽样分布与抽样误差 第二节 t分布
(一)t分布的概念
(二)t分布的图形和t分布表
第三节 总体均数及总体概率的估计 (一)参数估计的概念
(二)置信区间的计算
二、教学内容精要
1、重要名词和概念
标准误、t分布、置信区间 2、授课重点
1. 均数标准误的概念与计算。 2. 频率的标准误的概念与计算 3. t分布图形和t分布表 4. 总体均数的置信区间 5. 总体概率的置信区间
三、复习题
(一)名词解释
1.均数标准误 2. 置信区间 (二)单选题
11
1、 要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是
A、作身高差别的统计学检查 B、用该市5岁男孩身高的1-α正常值范围评价
C、用该市5岁男孩身高的均数来评价 D、用该市5岁男孩身高的1-α可信区间来评价 E、用该市5岁男孩身高的全距来评价 2、 t分布曲线与标准正态曲线比较:
A、中心位置左移 B、 中心位置右移 C、 分布曲线平坦一些 D、分布曲线陡峭一些 E、两尾部翘得低一些
3、 用样本推断正态总体均数的95%可信区间的公式为
A. ?X ? 1.96 S?X B. ?X ? 1.96s C. ?X ? t0.05,?s D.?X ? t0.05,? S?X E. 以上都不是 4、 S?X 表示的是
A、总体中各样本均数分布的离散情况 B、样本内实测值与总体均数之差
C、样本均数与样本均数之差 D、表示某随机样本的抽样误差 E、以上都不是 5、 t分布与正态分布存在如下哪一种关系
A、二者均以O为中心,左右对称 B、曲线下中间95%面积对应的分位点均为±1.96 C、当样本含量无限大时,二者分布一致
D、当样本含量无限大时,t分布与标准正态分布一致 E、当总体均数增大时,分布曲线的中心位置均向右移 6、 可信区间估计的可信度是指
A、α B、1-α C、β D、1-β E、估计误差的自由度
7、 当可信度1-α固定时,对某随机样本的总体均数可信区间作估计,按照公式?X ? k S?X 计算,则当样本含量加大时
A、k会接近Z值 B、k会趋近0 C、k会加大 D、k会趋近1.96 E、X有减小 8、 下列哪一变量服从t分布
X—μ X—μ A、 B、
σ σ
X—μ X—μ ? X—μ C、 D、 E、 σx S Sx 9、 以一定概率由样本均数估计总体均数,宜采用
A、抽样误差估计 B、点估计 C、参考值范围估计 D、区间估计 E、参数估计和假设检查 10、 用大样本估计总体率的95%可信区间的计算公式为 A、p ? 1.96sp B、p ? 1.96 S?X C、 p ? 1.96 S?X D、 p ? 1.96sp E、 p ? t0.05,?sp (三)填空
1、 1-α是指 。
2、 标准差的大小受 的影响,标准误的大小受 的影响。 3、 均数标准误是 的标准差, 与标准差的关系可用公式 表示。 4、 对于相同的?值, 越大, t?,? 值 , 当?= ?, t?,?= 。 5、 统计推断包括两个重要方面: 和 。 6、 率的标准误Sp = , 是描述 的统计指标。 (四)是非
1、随着样本含量的逐渐加大,标准误与标准差则逐渐变小。 2、标准误越大,说明样本均数的抽样误差越大。 (五)简答
1、说出标准差和标准误的联系和区别。
12
2、置信区间和正常值范围有何不同。 (六)计算
1、某医生抽样调查了49名健康男性的血清总胆固醇值, 得均数4.73mmol/L, 标准差为0.90mmol/L, 同时抽样调查了25名冠心病病人, 得均数7.98mmol/L, 标准差1.02mmol/L, 试判断(1)哪一组的变异程度较大并说明理由。(2)哪一组的均数较为可信并说明理由。(3)试估计健康男性血清总胆固醇值的总体可信区间。
2、为了了解某乡钩虫病感染情况,随机抽查150人,感染80人,若全乡人口为12,000人,若对该乡居民做驱钩虫治疗,至少需要按多少人准备药物?
复习题参考答案
(一)名词解释
见教材 (二)单选题
3.D 4.D 5.D 6. B 7. A 1. B 2.C 8.E 9.D 10.A
(三)填空 1、可信度
2、个体观察值,样本量 3、 样本均数, ?x=?/??n。 4、 样本量, 越小, uα 。 5、 参数估计、假设检验
6、 SP =?P( 1 - P )/n、样本率抽样误差 (四)是非 1、错 2、对 (五)简答
1、标准差与标准误的区别和联系
标准差 标准误
区别: 表示个体之间的变异度 表示样本均数之间的变异度
表示观察值与样本均值之间的离散度 表示样本均数与总体均数之间的离散度 可以衡量样本均数抽样误差的大小 联系: ?x=?/??n
2、可信区间和正常值范围有何不同。
置信区间:按一定可信度确定的包含总体参数的区间,可信度一般用95%,表示包含总体参数在内的可能性。用均数和均数的标准误估计。
正常值范围:指绝大多数(95%最常用)正常人的各种生理常数。用均数和标准差估计。 (六)计算 1、(1)CV:男=0.9/4.73=19.2%,女=1.02/7.98=12.8%; (2)标准误:男=0.9/7=0.128,女=1.02/5=0.204 (3)?X ? t0.05,? S?X =4.73?2.02*0.128
2、P=80/150=0.53 Sp=? 0.53(1-0.53)/150=0.04 95%可信区间: 0.53±1.96×0.04
下限为: 12000?(0.53-1.96?0.04)=5442(人)
第六章 假设检验基础
13
一、教学大纲
(一)教学目的和要求
1、掌握假设检验的基本步骤;掌握t检验的基本方法和应用条件; 2、熟悉二项分布资料的z检验;熟悉应用假设检验需注意的问题和假设检验的两类错误; 3、了解假设检验与区间估计的关系,假设检验的功效,poisson分布资料的z检验 (二)教学内容
第一节 假设检验的概念与原理
(一) 假设检验的思维逻辑 (二) 假设检验的基本步骤 第二节 t检验
(一) 一组样本资料的t检验
(二) 配对设计资料的t检验 (三) 两组独立样本资料的t检验
(四) 两组独立样本资料的方差齐性检验
第三节 二项分布与poisson分布资料的z检验 (一) 二项分布资料的z检验
(二) poisson分布资料的z检验 第四节 假设检验与区间估计的关系 第五节 假设检验的功效 (一) 假设检验的两类错误
(二) 应用假设检验需要注意的问题
二、教学内容精要
1、重要名词和概念 假设检验 2、授课重点
1.假设检验的基本步骤。 2. t检验。 3. z检验
4.假设检验的两类错误
5.应用假设检验需要注意的问题
三、复习题
(一)单选题
1、 两样本比较时,分别取以下检验水准,哪一个的第二类错误最小
A、α=0.05 B、α=0.01 C、α=0.10 D、α=0.20 E、α=0.02 2、 当样本含量n固定时,选择下列哪个检验水准得到的检验效能最高
A、α=0.01 B、α=0.10 C、α=0.05 D、α=0.20 E、α=0.02 3、 假设检验的一般步骤中不包括以下哪一条
A、选定检验方法和计算检验统计量 B、确定P值和作出推断性结论 C、对总体参数的范围作出估计 D、直接计算P值 E、建立假设和确定检验水准
4、 在假设检验中,P值与α的关系为
A、P值越大,α值就越大 B、P值越大,α值就越大 C、P值和α值均可由研究者事先设定 D、P值和α值均不可以由研究者事先设定
14
E、P值的大小与α值的大小无关
5、 假设检验过程中,下列哪一项不可以由研究者事先设定 A、所比较的总体参数 B、单侧或双侧检验 C、检验水准 D、P值 E、以上都不对
6、 若取α=0.05,当|t|≥t0.05,γ时,则P≤0.05,可认为: A、两样本均数相等 B、两样本均数不等 C、两总体均数相等的检验假设不能拒绝
D、两总体均数不等 E、以上都不对
7、 若取α=0.05,当|t|
8、 作假设检验时,若取α=0.05,P>0.05,不拒绝H0,可认为: A、两总体绝对没有差别 B、两总体绝对有差别 C、可能犯第一类错误 D、可能犯第二类错误 E、同时犯第一类、第二类错误
9、 在作假设检验时,若取α=0.05,P≤0.05,拒绝H0,可认为: A、两总体绝对没有差别 B、两总体绝对有差别 C、可能犯第一类错误 D、可能犯第二类错误 E、同时犯第一类、第二类错误 10、 关于假设检验与区间估计,我们可以认为
A、二者是完全相同的 B、假设检查可代替可信区间 C、假设检验可代替区间估计 D、二者都属统计推断问题 E、以上都不对 11、 在假设检验时,本应是双侧检验的问题而误用了单侧检验水准,当拒绝 H0时,则
A、增大了第一类错误 B、减小了第一类错误 C、增大了第二类错误 D、减小了第二类错误 E、以上都不正确 12、 在假设检验时,本应作单侧检验的问题误用了双侧检验,可导致 A、统计结论更准确 B、增加了第一类错误 C、增加了第二类错误 D、减小了可信度 E、增加了把握度 13、 由两样本均数的差别推断两总体均数的差别,得到此差别具有统计意义的结论是指 A、两样本均数差别有显著性 B、两总体均数差别有显著性 C、两样本均数和两总体均数的差别都有显著性
D、其中一个样本均数和它的总体均数差别有显著性 E、以上都不是 14、 在样本均数与总体均数差别的显著性检验中,结果为P<α而拒绝H0,接受H1,原因是
A、H0假设不成立的可能性小于α B、H1假设成立的可能性小于1-α C、H0假设成立的可能性小于α且H1成立的可能性大于1-α D、从H0成立的总体中抽样得到此样本的可能性小于α E、从H0不成立的总体中抽样得到此样本的可能性小于α
15
15、 假设检验中的可信度表示
A、拒绝实际上成立的H0的概率 B、不拒绝实际上成立的H0的概率
C、拒绝实际上不成立的H0的概率 D、不拒绝实际上不成立的H0的概率 E、1-β 16、 在假设检验中与是否拒绝H0无关的因素为 A、检验水准的高低 B、单侧或双侧检验
C、抽样误差的大小 D、被研究事物有无本质差异 E、所比较的总体参数 17、 两样本均数比较作t检验, 差别有显著性时, P值越小, 说明 A. 两样本均数差别越大 B. 两总体均数差别越大
C. 越有理由认为两总体均数不同 D. 越有理由认为两样本均数不同 E. 第一类错误越大 18、 假设检验亦称为显著性检验,作两均数比较时,所谓差别有显著性意义就是: A.两样本均数相同 B.两样本均数不等
C.两总体均数相等的检验假设不能拒绝 D.两总体均数不等 E.以上都不对 19、 α的概率是
A、H0错误的可能性 B、错误的H0被接受的可能性
C、正确的H0被拒绝的可能性 D、结论下错的可能性 E、都不正确 20、 显著性检验结果差异有显著性,表示
A、样本与总体相差很显著 B、样本之间相差很显著
C、比较的事物间来自不同的总体 D、检验假设被接受的可能性大于5% E、都不对 21、 甲、乙两人分别从随机数字表抽得30个(各取两位数字)随机数字,作为两个样本,求得 ?X1、S1;?X2、S2,则理论上
22
A、?X1??X2,S1? S2
B、作两样本均数的t检验,必然得到无差异的结论 C、作两方差的齐性的检验,必然方差齐
D、分别从甲、乙两样本求出总体均数的95%可信区间很可能有重叠 E、都不对 22、 两组样本均数进行检验,其自由度为: A、 n -1 C、(n (n (n -1) 1+n2 B、n 1+n2 1+n2)/4 D、1+n2)/2 E、1-1)+(n2 23、 若总例数相同, 则配对资料的t检验与成组资料的t检验相比 A. 成组t检验的效率高些 B、配对t检验的效率高些
B. 两者效率相等 D、两者效率相差不大 E、两者效率不可比 24、 关于显著性检验, 下列叙述哪项不正确
A、资料须符合随机抽样的原则 B、 资料须具有可比性 C、t检验条件必须两样本的方差不能相差太大 D、 相差有显著性说明比较的两样本来自不同总体 E、相差有显著性说明比较的两总体差别较大 (二)填空
1、假设检验的目的是推断 。 2.假设检验结果具有显著性意义, 是根据 而判定的, 结论具有 性。 3.两样本均数的比较 t检验的应用条件是 、 。 4两个或两个以上样本均数的比较, 可用 。应用时要求: (1) ;(2) ;(3) 。
5.假设检验时根据检验结果作出的判断, 可能发生两种错误, 第一类错误的概率为 , 第二类错误的概率为 , 同时减少两类错误的唯一方法是 。
16
6、两率比较z检验应用条件是 。 (三)是非
1、两组计量资料的假设检验是否采用t检验,主要取决于样本含量。
2、在假设检验中,本应是双侧检验的问题而误用了单侧检验水准,当拒绝H0时,则增大了第一类错误。
3、两个大样本(一般n>30例)均数的比较可用样本均数与总体均数差异的显著性检验。 4、假设检验的结论一定有实际意义 (四)简答
1、简述应用假设检验需注意的问题。 2、说出t检验、u检验的应用条件。 (五)计算
1、某地某年不同年龄组身高资料如下:
人数 年龄组 1-2月 5-6月 3-3.5岁 5-5.5岁
100 120 300 400
均数(cm) 56.3 66.5 96.1 107.8
标准差(cm) 2.1 2.2 3.1 3.3
问: (1) 上述资料是否表明6岁以下男童身高的均数和变异度随年龄增长而增加?
(2) 若以上各年龄组的身高均服从正态分布, 试估计上述300名3-3.5岁男童身高在 95.0-100.0 cm范围内有多少? 并确定3-3.5岁男童身高的正常值。 (3) 试估计3-3.5岁男童身高的总体均数可信区间。
(4) 若抽样调查100名某山区5-6月男童身高, 得均数60.2 cm , 标准差3.0 cm , 问山区5-6月男童身高是否与该地5-6月男童身高均数不同。 (5) 试将该组资料的均数绘制成相应的统计图。
复习题参考答案
(一) 单选题
2.D 3.C 4.E 5.D 6. D 7. C 1. D 8.D 9.C
11.A 12.C 13.A 14.D 15.B 16.D 17.C 18.D 19.C 21.D 22.E 23.B 24.D 25. 26. 27. 28. 29. (二)填空
1、不同样本是否来自同一总体。 2.P、相对性。 3.正态、方差齐
4方差分析、正态、方差齐、独立样本 5.α、β、n
6、n足够大、p或( 1 - p )不太小 、 np或n( 1 - p )均大于5两率比较 (三)是非
1、错 2、对 3、错 4、错 (四)简答 1、见教材。
2、说出t检验、u检验的应用条件。
t检验:正态、方差齐,一般用于小样本定量资料资料。
10.D 20.C 30.
17
u检验:可用于定量和分类资料。要求大样本资料,二项分布资料要求:n足够大、p或( 1 - p )不太小 、 np或n( 1 - p )均大于5两率比较,分布呈正态。 (五)计算
(1)计算CV:CV1=2.1/56.3=3.7%,余类推。
(2)u1=(95-96.1)/3.1= -0.35,u2=(100-96.1)/3.1=1.26 面积:0.8962-0.3632=0.533,300*0.533=160 (3)X ? 1.96 S?X (4)H0:μ1=μ2
H1:μ1≠μ2 α= 0.05
t = ( ?X1 - ?X2)/ sx1-x2 ? = n1 + n2 –2
判断:若 t ≥t?,? ,P≤?,拒绝H0,接受H1 t≤ t?,? P≥?,不拒绝H0
(5) 直条图
第七章 χ2检验 一、教学大纲
(一)教学目的和要求
222
1、掌握χ检验基本思想、用途和2x2列联表χ检验的条件及方法;掌握χ检验要注意的问题;
22
2、熟悉配对χ检验和多组频数分布的χ检验; 3、了解拟合优度检验、四格表确切概率法 (二)教学内容
2
第一节 完全随机设计下两组频数分布的χ检验
(一) 二分类情形 (二) 多分类情形
2
第二节 完全随机设计下多组频数分布的χ检验
2
第三节 配对设计下两组频数分布的χ检验
2
第四节 χ检验要注意的问题
2
第五节 χ分布和拟合优度检验 第六节 四格表确切概率法
二、教学内容精要
1、重要名词和概念 理论数 2、授课重点
2
1.χ检验基本思想、用途。
2
2.2x2列联表χ检验的条件及方法。
2
3.多组频数分布的χ检验。
2
4. 配对设计下两组频数分布的χ检验。
2
5.χ检验要注意的问题
三、复习题
(一)单选题
222
1、 设某四格表资料用X检验的基本公式算得统计量为X1,用专用公式得统计量X2,则
222222
A、X1=X2 B、X1>X2 C、X1 18 D、X1比X2准确 E、X2比X1准确 2 2、 行×列表X检验的计算公式为 2 (A-T) 2 A、X=Σ T 2 A 2 B、X=n(Σ -1) C、上述两项均可 NrNc 22 (b-c) (|b-c|-1) 22 D、X= 或 X= b+c b+c 2 (ab-bc)n 2 E、X= (a+b)(c+d)(a+c)(b+d) 2 3、 四格表X检验的校正公式应用条件为 A、n>40且T>5 B、n<40且T>5 C、n>40且1 2 4、 四格表资料的X检验应使用校正公式而未使用时,会导致 22 A、X增大,P值减小 B、X减小,P值也减小 22 C、X增大,P值也增大 D、X减小,P值增大 E、视数据不同而异 222 5、 作两个率比较x检验,若取α=0.05,当x≥x0..05,γ时,则P≤0.05,可认为: A、两样率相等 B、两样本率不等 C、两总体率相等的检验假设不能拒绝 D、两总体率不等 E、以上都不对 2 6、 行X列表X检验应注意 A、任一格理论数小于5则要用校正公式 B、任一格实际数小于5则要用校正公式 C、任一格理论数小于5则应将相应组合并 D、任一格实际数小于5则应将相应组合并 E、以上都不对 7、 R?C列联表?2检验的自由度为 A. R-1 B. C-1 C. R+C-1 D. R?C-1 E. (R-1)(C-1) 8、 ?2检验不适用于 A. 两个率差别的显著性检验 B. 两个率差别的显著性检验 C. 两组或多组构成比差别的显著性检验 D. 相对比差别的显著性检验 E. 频数分布拟和优度检验 22 9、 四个样本率作比较, ? > ?0.01,(3), 可认为 A. 各总体率不等或不全相等 B. 各总体率均不相等 C. 各总体率均相等 D. 各样本率均不相等 E. 各样本率不等或不全相等 (二)填空 2 1、?检验的基本思想是比较 和 的吻合程度, 其基本公式是 。 2 2、?的大小由 和 两方面因素决定。 2 3、四格表?检验的基本数据是两对 和两对 。 4、四格表资料卡方检验条件 、 。 2222 19 5、四格表?检验的基本条件是 , 当 时, 需用校正公式。 22 6、配对计数资料?检验的无效假设是 , ?检验的公式是 。 2 7、行X列表X检验应注意 ,否则,则应增大样本量, 或 。 22 8、三个样本率比较得到X> X0.05,v ,可认为 。 (三)是非 2 1、四格表资料只要有一格实际数为0,不可做X检验。 2 2、x值反映了实际数与理论数之吻合程度,如果假设成立,则A与T之差一般不会很大,因而P值也不会很大。 3、两样本比较,得P<0.05,此时一定可认为两总体率不同。 2 4、两行三列X检验,理论数不可小于5。 2 5、行×列表x检验,若1/5格子以上1 2 1、四格表资料与配对计数资料的?检验有何不同? 2 2、行?列表资料?检验应注意什么? 2 3、、四格表资料的U检验和?检验的应用条件有何异同? (五)计算 1、某市中心血站采集血清标本673例,检出乙肝核心抗体55例,其血型分布如下表。问不同血型的乙肝核心杭体阳性率有否差别? 乙肝核心抗体的阳性率与血型关系 血 型 A B O AB 合计 检测数 221 169 235 48 673 乙肝核心抗体阳性数 13 16 23 3 55 阳性率(%) 5.88 9.47 9.79 6.25 8.17 2 2、为比较槟榔煎剂和阿的平驱绦虫的效果, 对45名绦虫患者进行治疗, 其结果如下, 问两药疗效是否相同。 两药疗效比较 药物 槟榔煎剂 阿的平 合计 治疗人数 27 18 45 有效人数 22 12 34 3、用中药治疗296例冠心病住院病人, 一年后得结果为:治疗组199例中死亡9例, 对照组97例中死亡13例。 (1)列出四格表, 写出实际频数与理论频数。 (2)用四格表方法比较两组间的死亡率有无不同。 4、用两种方法检查已确诊的乳腺癌患者120名,甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致的检出率为35%。试问两种方法何者为优。 复习题参考答案 (一) 单选题 2.B 1. A (二)填空 3.C 4.A 5.D 6. E 7. E 8.D 9.A 20 1、实际数、理论数、Σ(A-T)/ T 2、(A-T)、自由度 3、实测阳性数、实测阴性数 4、n>40、T>1 5、n>40、T>1、 1 2 6、B=C,(b-c)/(b+c) 7、1/5以上格子理论数大于1小于5或任一格子T<1、合并或删除 8、各总体率不同或不全相同 (三)是非 1、错 2、对 3、错 4、错 5、对 (四)简答 2 1、四格表资料?检验:随机设计两样本率比较,用基本公式或专用公式,四格表(阳性和阴性数) 配对计数资料:配对设计,公式与四格表不同,列联表形式为每对的统计。 2、行×列表资料?2检验,要求理论频数不宜太小,否则将导致分析的偏性。一般认为行×列表资料不宜有1/5以上格子的理论数小于5,或有一个理论数小于1。对理论数太小有三种处理办法(1)增大样本含量(2)删去理论数太小的行和列(3)性质相近的组合并。多个样本率比较结论为拒绝H0,只能说明各总体率之间总的来说有差别,但不能认为它们彼此之间都有差别。等级资料的比较宜用秩和检验。 ?2检验只说明各处理组间在构成比上的差异。 2 3、相同点:四格表的U检验与X检验都用于分类资料(两个样本率)比较的假设检验。 不同点:四格表的U检验应用时,(1)需要n1和n2均较大,p1、(1-p1)、p2、(1-p2)均不太 2 小。(2)只能用于两个样本率比较,不能用于两个构成比之间的比较。四格表的X检验即可用于两个样本率比较,也可用于两个构成比之间的比较,对样本量要求不是很高。 (五)计算 1、H0:π1=π2=π3 H1: π1、π2、π3不等或不全相等 α= 0.05 2 (A-T) 2 A、X=Σ T 2 A 2 B、X=n(Σ -1)=(注意:A为乙肝核心抗体阳性数与阴性数) 两项公式均可 NrNc 判断:若 X2 ≥X2?,? ,P≤?,拒绝H0,接受H1 22 X ≤X?,? P≥?,不拒绝H0 2、 两药疗效比较 药物 槟榔煎剂 阿的平 合计 T12=18*11/45=4.5,校正公式 治疗人数 27 18 45 无效人数 5 6 11 有效人数 22 12 34 2 ??(a?b)(c?d)(a?c)(b?d) =0.607<3.84,P>?,不拒绝H 0 2(ad?bc?n/2)2n 21 3、? 2?(ad?bc)2n(a?b)(c?d)(a?c)(b?d)=0.025<3.84,P>?,不拒绝H0 中药治疗疗效 药物 治疗组 对照组 合计 4、 治疗人数 199 97 296 死亡人数 9(14.8) 13(7.2) 22 生存人数 190(184.2) 84(89.8) 274 两法检查结果统计表 甲法 + - 合计 乙法 + 42 18 60 - 30 30 60 合计 72 48 120 x2?b?c??b?c2?30?18??30?182?1442?3,x2?3?x0.05,1?3.84,P>0.05,按α=0.05水48准,不拒绝H0,认为二种方法检测效果无差别。 第八章 实验设计 一、教学大纲 (一)教学目的和要求 1、熟悉实验性研究与观察性研究的概念;熟悉实验设计的基本要素和基本原则 2、了解常用的实验设计方案 (二)教学内容 第一节 实验设计的基本要素 (一) 受试对象 (二) 处理因素 (三) 实验效应 第二节 实验设计的基本原则 (一) 对照原则 (二) 随机化原则 (三) 重复原则 第三节 常用的实验设计方案 二、教学内容精要 1、重要名词和概念 实验性研究、观察性研究 2、授课重点 1.实验设计的基本要素。 2.实验设计的基本原则 22 三、复习题 (一)单选题 1、用某新药治疗急性腹泻患者35例, 1周后痊愈25例, 由此可认为: A、该新药疗效好 B、该新药疗效一般 C、该新药只有近期疗效 D、因此治疗例数少, 尚不能说明新药的疗效如何 E、因无对比, 尚不能说明新药的疗效如何 2、实验设计原则中,最为重要的是:( ) A.随机性 B.对比 C. 资料正态性 D.足够的观察数 E.可靠性 (二)填空 1、实验设计的三个基本要素是 、 、 。 2、实验设计的基本原则是 、 、 。 复习题参考答案 (一)单选题 1.E 2.B (二)填空 1、受试对象、处理因素、实验效应 2、对照原则、随机化原则、重复原则 第九章 方差分析 一、教学大纲 (一)教学目的和要求 1、掌握方差分析的用途和完全随机设计资料的方差分析; 2、熟悉方差分析的基本思想、随机区组设计资料的方差分析、多个样本均数的两两比较; 3、了解析因设计资料的方差分析和重复测量资料的方差分析。 (二)教学内容 第一节 完全随机设计资料的方差分析 (一) 方差分析的基本思想 (二) 完全随机设计资料方差分析的基本步骤 第二节 随机区组设计资料的方差分析 (一) 离均差平方和与自由度的分解 (二) 随机区组设计资料方差分析的基本步骤 第三节 多个样本均数的两两比较 (一) SNK法 (二) Dunnett法 第四节 方差分析的前提条件 二、教学内容精要 1、重要名词和概念 组间变异、组内变异 2、授课重点 1.方差分析的用途。 23 2.方差分析的基本思想。 3.完全随机设计资料方差分析的基本步骤。 4.随机区组设计资料的方差分析离均差平方和与自由度的分解。 5.随机区组设计资料方差分析的基本步骤。 6.方差分析的前提条件 三、复习题 (一)单选题 1、成组设计方差分析中,若处理因素无作用,理论上应有 A、 F=0 B、F=1 C、F<1 D、F>1 E、F<1.96 2、成组设计组内变异反映的是 A、 测量误差 B、个体误差 C、随机误差 D、抽样误差 E、系统误差 3、成组设计组间变异反映的是 A、 测量误差 B、个体误差 C、随机误差 D、抽样误差 E、处理因素的作用 4、成组设计的方差分析中,必然有 .............................................................................. ( ) A、SS组内 1、方差分析的基本思想是 。 2、方差分析的前提条件是 、 、 。 (三)是非 1、方差分析总变异可分为组间变异和组内变异。 2、t检验可以代替方差分析。 3、两组以上样本均数的比较应用方差分析。 (四)简答 1、简述方差分析的基本思想。 2、简述随机区组设计资料的方差分析离均差平方和与自由度的分解 3、研究人员采用不同浓度的含铅饲料喂养大白鼠幼鼠,以观察铅污染对幼鼠脑铅含量的影响,资料如下: 不同铅浓度的饲料对幼鼠脑铅含量的影响 组 别 低剂量组 高剂量组 对照组 染毒剂量(mg/L) 10 30 0 N 脑铅 6 6 6 ±SD(10-4 5.226±0.627 6.418±0.772 4.778±0.579 ) 研究者用成组比较t检验对三组脑铅浓度做假设检验,结果表明:高剂量组与对照组差别有 统计学意义(P<0.05),而低剂量组与对照组差别无统计学意义(P>0.05)。你认为此分析方法是否合理,为什么?简述其理由,并请提出你认为合理的分析方法。 复习题参考答案 (一)单选题 24 1.B 2.C 3.E 4.D (二)填空 1、分解变异来源 2、独立随机样本、正态、方差齐。 (三)是非 1、对 2、错 3、对 (四)简答 1、将总变异分解为组间与组内部分,SS总=SS组间+SS组内,均方MS组间= SS组间/?组间, MS 组内 = SS 组间 /?组内,MS 组间 反映处理因素的作用,MS 组内 反映观察值的随机误差,如个体差异 和随机测量误差。如果各样本均数来自同一总体,即各组之间无差别(即无处理效应),则组间变异与组内变异均只反映随机误差,这时若计算组间均方与组内均方的比值, F=MS组间/ MS组内,F值应接近1,反之,若各样本均数不是来自同一总体,组间变异大,F值将明显大于1,当大到一定程度,F>F?,?,不能认为组间的变异仅反映随机误差,也就认为处理因素有作用。 2、见教材 3、该分析方法不合理,用两两比较t检验,犯第一类错误概率增高。用F检验。 H0:?1=?2=?3 ?=0.05 SS总 = SS组间 + SS组内 ?总 = n-1=18-1=17 ?组间 =3-1=2 ?组内=17-2=15 MS组间 = SS组间/?组间 MS组内 = SS组内/?组内 F= MS组间/ MS组内 若F?F0.05,? ,P?0.05,按?=0.05水准,拒绝H0,各剂量组不同或不全相同。需进一步做q检验。 若F〈F0.05,? ,P〉0.05,按?=0.05水准,不拒绝H0,各剂量组相同。 第十章 基于秩次的非参数检验 一、教学大纲 (一)教学目的和要求 1、掌握非参数概念及其优缺点; 2、熟悉配对设计和单样本资料的符号秩和检验、完全随机化设计两组独立样本秩和检验、完全随机化设计多组独立样本秩和检验的统计方法; 3、了解随机化区组设计资料的秩和检验及多重比较的统计方法。 (二)教学内容 第一节 配对设计和单样本资料的符号秩和检验 (一)配对设计资料的符号秩和检验 (二)一组样本资料的符号秩和检验 第二节完全随机化设计两组独立样本秩和检验 (一) 两组连续变量资料的秩和检验 (二) 两组有序变量资料的秩和检验 第三节 完全随机化设计多组独立样本秩和检验 (一) 多组连续变量资料的秩和检验 (二) 多组有序变量资料的秩和检验 二、教学内容精要 1、重要名词和概念 非参数检验 2、授课重点 25 1.非参数检验的概念和优缺点。 2.配对设计和单样本资料的符号秩和检验。 3.完全随机化设计两组独立样本秩和检验。 4.完全随机化设计多组独立样本秩和检验的统计方法。 三、复习题 (一)单选题 1、 作两均数比较,已知n1、n2均小于30,总体方差不齐且分布呈极度偏态,宜用 2 A、t检验 B、u检验 C、秩和检验 D、F检验 E、X检验 2、 某种疗效(治愈、显效、好转、无效)比较宜用: A. t检验 B. ?2检验 C. 秩和检验 D. F检验 E. u检验 3、 配对比较的秩和检验的基本思想是: 如果假设成立, 则对样本来说: A. 正秩和的绝对值大于负秩和的绝对值 B. 负秩和的绝对值大于正秩和的绝对值 C. 正秩和与负秩和的绝对值相等 D. 正秩和与负秩和的绝对值不会相差很大 E. 正秩和与负秩和的绝对值相差很大 4、 两组比较的秩和检验要求的条件是 A. 计量资料 B. 两总体都是正态分布 C. 两总体方差相等 D. 两样本例数要很大 E. 以上都不是 5、 在配对比较的差数秩和检验中, 如果有两个差数为0, 则: A. 对正秩和有0.5和1, 对负秩和有-0.5和-1 B. 对正秩和有2, 对负秩和有-2 C. 对正秩和3, 对负秩和-3 D. 0不考虑 E. 以上都不是 6、 秩和检验和t检验比较,秩和检验的优点是 A.检验的效率高 B.计算方法简便 C.不受分布限制 D.公式更合理 E.犯错误的概率减小 7、 两数值变量资料的小样本比较的假设检验,首先应考虑 A.用t 检验 B.用U检验 C.用秩和检验 D.用t检验和秩和检验均可 E.资料符合t检验还是秩和检验的条件 (二)简答 1、若资料可做参数检验,请将下表中各项秩和检验相对应的参数检验公式填写完全,并指出非参数检验与参数检验相比的优、缺点。 秩和检验 配对符号秩和检验 成组设计两样本比较的秩和检验 成组设计多个样本比较的秩和检验 参数检验(填写相应的假设检验公式) 复习题参考答案 (一)单选题 2.C 1. C (二)简答 秩和检验 配对符号秩和检验 成组设计两样本比较的秩和检验 3.D 4.E 5.D 6. C 7. E 参数检验(填写相应的假设检验公式) t=?d/sd t=(?x1-?x2)/s?x1-?x2 26 成组设计多个样本比较的秩和检验 F= MS组间/ MS组内 优点:对资料分布特征无特殊要求,适用范围广,对样本例数无特殊要求,且收集资料、统计分析方法简便。 缺点:检验效率低于参数检验,犯第二类错误概率较高,判断P值较为烦琐。 第十一章 两变量关联性分析 一、教学大纲 (一)教学目的和要求 1、掌握线性相关的概念及其描述指标; 2、熟悉相关系数的统计推断和线性相关应用中应注意的问题,熟悉分类变量的关联性分析;熟悉秩相关的描述指标 3、了解秩相关统计推断。 (二)教学内容 第一节 线性相关 (一) 线性相关的概念及其统计描述 (二) 相关系数的统计推断 (三) 线性相关应用中应注意的问题 第二节 秩相关 (一) 秩相关的概念及其统计描述 (二) 秩相关系数的统计推断 第三节 分类变量的关联性分析 (一) 交叉分类2x2表的关联分析 (二) 2x2配对资料的关联性分析 (三) RxC分类资料的关联性分析 二、教学内容精要 1、重要名词和概念 线性相关、相关系数(correlation coefficient) 2、授课重点 1.线性相关的概念及其描述指标。 2.相关系数的统计推断和线性相关应用中应注意的问题。 3.分类变量的关联性分析。 4.秩相关的描述指标。 三、复习题 (一)名词解释 1.相关系数 (二)单选题 1、 样本相关系数r=0时, p>0.05,说明: A、两变量( x,y )不存在任何关系 B、两变量存在相关关系的可能性很小 C、两变量的关系不能确定 D、两变量间必然存在某种曲线关系 E、两变量间不存在直线关系, 但不排除存在某种曲线关系 2、 散点密集于一条直线,且呈水平分布,则可初步判断两变量为 A、正相关关系 B、负相关关系 C、无相关关系 D、还不能确定 E、以上都不对 27 3、 散点呈直线趋势,当x增加y则减少,则可初步判断两变量为 A、正相关关系 B、负相关关系 C、无相关关系 D、还不能确定 E、以上都不对 4、 ∣r∣>r0.05,(n-2)时,可认为两变量x与y间 A、有一定关系 B、有正相关关系 C、一定有直线关系 D、有直线关系 E、以上都不对 5、 相关分析一般研究 A、两组观察单位的两个相同指标间的相互关系 B、两组观察单位的两个相同指标间的相互差别 C、两组观察单位的两个不同指标间的相互关系 D、一组观察单位的两个相同指标间的相互关系 E、一组观察单位的两个不同指标间的相互关系 6、 在分析相关系数时应注意 A、根据∣r∣大小可根据两变量关系分为低度、中度和高度相关 B、根据两组∣r∣的大小可直接比较相关密切程度 C、若r>0.5,则两变量间必存在直线相关 D、得r值后尚须作显著性检验才能确定x与y有无线性相关 E、以上都不对 7、 相关系数r的意义是: A、x与y的从属关系 B、两总体间的直线相关关系 C、表示两组资料的相关方向和关系的密切程度 D、表示x与y之间的直线相关关系的密切程度和方向 E、以上都不对 (三)是非 1、算得r=0.85,可认为两变量间相关密切 2、毫无关联的两个事物的数据也可算出一个相关系数,但毫无意义 3、rs计算简便,故一般资料应首选等级资料。 (四)简答 1、简述线性相关应用时应注意的问题。 2、简述Pearson相关系数与Spearman秩相关系数的适用范围。 复习题参考答案 (一)名词解释 见教材 (二)单选题 1. E 2.C 3.B 4.D 5.E 6. D 7.D (三)是非 1、错 2、对 3、错 (四)简答 1、见教材 2、Pearson相关系数:要求X与Y均服从正态分布。 与Spearman秩相关系数:对原变量分布不作要求。 28 第十二章 简单回归分析 一、教学大纲 (一)教学目的和要求 1、掌握简单线性回归的概念及统计描述指标; 2、熟悉回归系数的计算和统计推断,熟悉线性回归的应用; 3、了解非线性回归。 (二)教学内容 第一节 简单线性回归 (一) 线性回归的概念及其统计描述 (二) 回归模型的前提假设 (三) 回归参数的估计 (四) 总体回归系数β的统计推断 第二节 线性回归的应用 (一) 总统回归线的95%置信带 (二) 个体y预测值的区间估计 二、教学内容精要 1、重要名词和概念 简单线性回归模型(simple liner regression model)、回归系数 2、授课重点 1.线性回归的概念及其统计描述。 2.回归模型的前提假设。 3.回归参数的估计。 4.总体回归系数β的统计推断。 5. 线性回归的应用 三、复习题 (一)名词解释 1.回归系数 (二)单选题 1、 b的取值范围是: A、-1 A、要求各散点都落在该直线上的方程 B、要求各散点与该直线的纵向距离的平方和最小的直线方程 C、要求各散点与该直线的垂直距离的平方和最小的直线方程 D、b>0的直线方程 E、要求各散点尽量与该直线接近 3、 在双正态变量的相关和回归分析中: A.r值增加,b值增加 B. r值减小,b值减小 C.r>0时,b<0 D. r<0时,b>0 E. r=0时,b=0 4、 回归系数的假设检验 A.必须作t检验 B. 必须作F检验 C.r和b的检验必须同时做 29 D.可以用r的检验结果代替 E.可以查表 5、 在双正态变量的相关和回归分析中: A. | r |值愈大, 则| b |值愈小 B. | r |值愈大, 则| b |值愈大 C. | r |值愈大, 所描绘散点图愈靠近回归线 D. | r |值愈大, 所描绘散点图愈远离回归线 E. 以上都不是 (三)简答 1、直线相关与直线回归有哪些联系和区别。 2、简述回归模型的前提假设。 复习题参考答案 (一)名词解释 见教材 (二)单选题 2.B 3.E 4.D 5.C 1. B (三)简答 1、联系(1) 方向一致; (2) 假设检验等价;(3)用回归解释相关; 区别:(1)资料要求不同;(2)应用情况不同:相关描述变量间的关系,回归描述变量 间的依存比例关系 2、简述回归模型的前提假设。 见教材 第十三章 调查设计 一、教学大纲 (一)教学目的和要求 1、掌握调查研究的概念、特点与适用范围和分类; 2、熟悉调查设计的基本方法; 3、了解调查表的制定与考评。 (二)教学内容 第一节 调查研究概况 (一) 调查研究的概念、特点与适用范围 (二) 调查研究分类 第二节 调查设计 (一) 调查计划 (二) 整理计划 第三节 常用的抽样方法 二、教学内容精要 1、重要名词和概念 全面调查(overall survey)、抽样调查(sampling survey)、典型调查(typical survey) 2、授课重点 1.调查研究的概念、特点与适用范围。 2.调查研究分类。 3.拟订调查表。 30 4.常用抽样方法。 三、复习题 (一)单选题 1、 一个调查设计的指标是指 A. 调查表的调查项目 B. 调查表的备考项目 C. 调查表的调查项目和备考项目 D. 预期分析指标 E. 以上都不是 2、 已知某山区、丘陵、湖区婴幼儿体格发育有较大的差异, 现需制度该省婴幼儿体格发育 有关指标的正常值范围, 调查设计最好采用 A. 单纯随机抽样 B. 分层随机抽样 C. 整群抽样 D. 机械抽样 E. 以上都不是 (二)填空 1、按调查范围,可分为 和 ,后者又以 和 最为常用。 2、调查项目包括 和 ,前者直接用于 ,后者是为了 。 3、四种基本抽样方法的抽样误差大小顺序为 > > > 。其中 抽样误差最小 (三)简答 1、调查研究和实验研究的主要区别何在? 复习题参考答案 (一)单选题 1、D 2、B (二)填空 1、全面调查、非全面调查、抽样调查、典型调查 2、分析项目、备查项目、分析、核查 3、整群、单纯、系统、分层 (三)简答 1、不能完全随机地分组以及不能人为地施加处理因素是调查研究与实验研究的根本区别。 第十四章 横断面研究资料的统计分析 一、教学大纲 (一)教学目的和要求 1、掌握死亡率标准化的意义与思想; 2、熟悉标准死亡率的计算方法和注意事项,熟悉现时寿命表指标的分析; 3、了解现时寿命表的具体计算方法。 (二)教学内容 第一节 死亡率的标准化 (一) 死亡率标准化的意义与思想 (二) 标准死亡率的计算 (三) 标准死亡率的注意事项 第二节 现时寿命表 (一) 现时寿命表的编制原理和方法 (二) 现时寿命表指标的分析 31 二、教学内容精要 1、重要名词和概念 死亡率标准化、期望寿命 2、授课重点 1.死亡率标准化的意义与思想。 2.标准死亡率的计算方法和注意事项。 3.现时寿命表的编制原理和方法。 4.现时寿命表指标的分析。 三、复习题 (一)名词解释 1、标准化死亡率 2、期望寿命e0 (二)单选题 1、 已知男性的钩虫感染率高于女性, 今欲比较甲、乙两乡居民的钩虫感染率, 但甲乡人口 女多于男, 而乙乡男多于女, 适当的比较方法是 2 A. 分性别进行比较 B. 两个率比较的?检验 C. 对性别进行标准化后在比较 D. 不具可比性 E. 用秩和检验 2、 已知甲地人口中男性多,乙地人口中女性多,欲比较甲、乙两地钩虫病不同性别感染率 差别有无显著性意义,适用方法是 2 A.X检验 B.t检验 C.u 检验 D.不具备可比性 E.对性别作标准化处理,再作比较 3、 对于寿命表中某年龄组死亡概率的描述中,不正确的是 A.就是某年龄组的死亡率 B.与年龄组死亡率有函数关系 C.指x岁尚存者今后n年内死亡的可能性 D.常用婴儿死亡率作为0岁组的死亡概率 E.是寿命表的一个主要指标 4、 编制简略寿命表的关键指标是 A.年龄组死亡概率 B.尚存人数 C.生存人年数 D.年龄组死亡率 E. 平均预期寿命 (二)是非 1、预期寿命eX是评价居民健康状况的主要指标,出生时的预期寿命简称平均寿命,是各年龄组死亡率的综合反映,可概括的说明某人群的健康水平。 2、已知甲乙两地冠心病粗死亡率相等,若甲地老年人口比例大于乙地,经标准化后,甲地冠心病死亡率高于乙地 (三)简答 1、有人为研究饮酒与高血压的关系,普查了某地区得到如下资料: 男 女 合计 饮酒组 检查人数 1339 127 1466 患者 35 7 42 26.14 55.12 28.65 不饮酒组 发病率(/千) 检查人数 591 895 1486 患者 14 31 45 发病率(/千) 23.69 34.64 30.28 ① 请指出该资料中一个错误使用的概念,正确的名称应该是什么? 32 ② 能否据此认为“不饮酒”相对与“饮酒”来说更易于导致高血压,为什么?应该怎样做,最后的结论是什么(要求具体步骤及计算结果)? 2、标准化法的注意事项有哪些? 3、期望寿命与平均死亡年龄有什么区别? 复习题参考答案 (一)名词解释 见教材 (二)单选题 1、C 2、A 3、A 4、A (二)是非 1、对 2、错 (三)简答 1、不能,因为内部构成不同。 计算标准化率。 选取标准(任选一组或取各组之和作为标准内部构成) (1) 取饮酒组,得P2’=(1339×0.02369+127×0.03464)/1466=24.62% (2) 取不饮酒组,得P1’=(591×0.02614+895×0.05512)/1486=43.59% (3) 取两组之和,得P1’=(1930×0.02614+1022×0.05512)/2952=36.17% P2’=(1930×0.02369+1022×0.03464)/2922=45.03% 2、见教材 3、用寿命表方法计算的期望寿命的大小,仅取决于年龄别死亡率的高低,与年龄构成无关,两地的期望寿命可以直接比较。但平均死亡年龄的大小,不仅取决于年龄别死亡率的高低,也取决于人口的年龄构成,即使甲乙两地的年龄死亡率完全相同,若甲地人口中青壮年比重较大,而老年人比重较小,可导致甲地平均死亡年龄较低。因此,一般情况下,两地的平均死亡年龄不能直接比较。 第十五章 生存分析 一、教学大纲 (一)教学目的和要求 1、掌握生存率的概念和生存资料的特点; 2、熟悉生存率的计算方法和生存曲线及中位生存期; 3、了解生存曲线的比较。 (二)教学内容 第一节 生存资料的特点 (一) 起始事件与终点事件 (二) 生存时间 (三) 删失值 第二节 生存率的估计 (一) 生存率的点估计 (二) 总体生存率的区间估计 (三) 生存曲线及中位生存期 第三节 生存曲线的比较 33 二、教学内容精要 1、重要名词和概念 生存率、生存概率 2、授课重点 1.生存率的概念和生存资料的特点。 2.生存率的计算方法。 三、复习题 (一)名词解释 1、生存率 2、生存概率 (二)单选题 1、生存资料的基本要求包括 A、随机样本,并有足够数量 B、死亡例数不能太少 C、截尾比例不能太大 D、生存时间尽可能精确 E、以上都是 2、在有关生存分析几个基本概念描述中哪项不正确 A、生存时间指从随访观察起始时点到随访截止时点的时间 B、随访截止时全部观察单位必都发生某事件(如死亡) C、生存分析是同时考虑事件的观察结果和随访时间的一种统计分析方法D、观察对象中途失访或退出研究,其生存时间属截尾值或终检值 E、生存率指某观察对象生存过(或活者)t时点的概率 (三)简答 1、生存资料中产生右删失的原因有哪些? 复习题参考答案 (一)名词解释 见教材 (二)单选题 1、E 2、B (三)简答 1、随访对象失访;随访结束时对象仍存活;治疗措施改变。 34