研究设计:制定计划,对整个过程进行安排。是整个工作的关键。
搜集资料:根据计划取得可靠、完整的资料。收集资料的方法有三种:统计报表、日常性工作、专题调查。注重资料的真实性。
整理资料:原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析。可借助于计算机(常用软件:EPI、SPSS、SAS)。
分析资料:统计学的关键所在。运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。 总体与样本的区别与关系?
答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。 抽样误差产生的原因有哪些?可以避免抽样误差吗?
答:一,个体差异引起;二,抽样方法引起。抽样误差不能避免,但可以随着样本含量的增大而减小。 何为概率及小概率事件?
答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。小概率事件是指习惯上将P《=0.05或P《=0.01称为小概率事件,表示某事件发生的可能性很小。
研究资料的类型
定量变量、数值变量---计量资料 定性变量、分类变量---计数资料 顺序变量、有序分类变量-等级资料
第二章 定量资料的统计描述
频数分布表编制的步骤
1.找出最大值和最小值,计算极差。
2.按极差大小决定组段数、组段和组距。 3.列表划记,统计各组段频数。 4.计算频率与累计频率 频数分布的两个特征
集中趋势和离散趋势是频数分布的两个重要特征,测定其集中趋势和离散趋势就可较全面地分析所研究的事物。 对于一组近似正态分布的资料,除样本含量n外,还可计算 ,S和 ,问各说明什么? 答:三个指标分别说明:
(1) 为算术平均数,说明正态分布或近似正态分布资料的集中趋势; (2)S为标准差,说明正态分布或近似正态分布资料的离散趋势;
(3) 可估计正态指标的95%医学参考值范围,即此范围在理论上应包含总体的95%个体值。 说明频数分布表的用途。
答:频数分布表的用途是:(1)揭示资料的分布类型;(2)描述分布的集中趋势和离散趋势;(3)便于发现某些特大或特小的可疑值;(4)便于进一步计算指标和统计分析。 均数的两个重要特征
1、离均差的总和等于零,即各变量值与均数之差的代数和等于零。 2、各离均差的平方和小于各观察值X与任何数a之差的平方和(
)。
描述数值变量资料集中趋势的指标有哪些?其适用范围有哪些?
答:常见的包括算术均数、几何均数、中位数。
①均数:用来描述一组变量值的平均水平,具有代表性,因此变量值必须是同质的。适用于呈对称分布的资料,特别是正态分布或者近似正态分布的资料,因为这时均数位于分布的中心,最能反映分布的集中趋势。
②几何均数:常用来反映一组含多个数量级数据的集中位置。适用于可经对数转换为对称分布的资料,如等比级数资料和对数正态分布资料。
③中位数:适用于描述偏态分布或末端无确定数据时资料。
描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同? 答:常见的包括:极差、四分位间距、方差、标准差和变异系数。
①极差:只利用最大值和最小值的信息,易受样本含量的影响,很不稳定。极差大,说明资料的离散程度大
②四分位数间距:适用于各种分布的资料。适用于偏态分布、两端无确定值或分布不明确资料的离散程度。四分位数间距大,说明变异度大;反之,说明变异度小。
③方差和标准差:适用于对称分布,特别是正态分布的资料。全面反映了一组观察值的变异程度。 ④变异系数:常用于量纲不同时、或均数相差较大时变量间变异程度的比较。 简述频数表的主要用途。
答:(1)通过频数表了解数据的分布特征。①X值分布情况:偏态或正态分布;②取值情况:变量值取值范围;③集中趋势:变量值集中位置。
(2)便于发现资料中的可疑值。 (3)组段的频率作为概率的估计。 什么是百分位数?写出计算公式。
答:百分位数(percentile):是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有x%的观察值小于Px小,有(1-x%)的观察值大于Px。
计算定义:将一组变量值由小到大依次排列,为第x百分位数的秩次,其对应的变量值(x)为第x百分位数,记为Px。 百分位数计算公式: (1)直接法
将样本值由小到大排队,用nX%确定Px的位次和Px。 当nX%为带有小数位时用公式: 当nX%为带有小数位时用公式:
函数trunc(a):表示对数字取其整数。 (2)频数表法(例数较多) 用公式:
LX :第X%位数所在组段的下限值 iX :第X%位数所在组段的组距 fX :第X%位数所在组段的频数
∑fL :第X%位数所在组段上个组段的累计频数
第三章 定性资料的统计描述
请说明频率型指标与强度型指标的主要区别?
答:主要区别:指标的解释不同,频率型指标是表示事物内部某个组成部分所占的比重或分布,或指某现象发生的频率。强度型指标是指单位时间内某现象发生的频率。 构成比的特点
1 分子是分母的一部分,事物内部各组成部分的构成比之和为100%。 2 事物内部某一组分发生改变,其它部分的构成比也相应的发生变化。 常用的相对数有哪几种?简述各种相对数指标的含义,计算方法及特点。 答:有率、构成比、相对比三种。
率的含义:某现象实际发生的例数与可能发生的总例数之比,说明某现象发生的频率或强度。其特点为:说明某现象发生的强度。
构成比的含义:事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,通常以100为比例基数,又称百分比。其特点为:①一组构成比的总和应等于100%,即各个分子的总和等于分母;②各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响,其一是这个部分自身数值的变化,其二是受其它部分数值变化的影响。
相对比的含义:是两个有关指标之比,说明两指标间的比例关系。其特点为:两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。
率、构成比和相对比是非常相似的指标,但是,三者之间存在着本质的区别:
① 构成比表示事物内部各组成部分所占整体的比重或比例,而率表示某随机事件发生的频率或强度;
② 构成比的分子中的个体一定是分母的一部分,而相对比的分子中的个体不一定是分母的一部分;构成比是同一类事物的数值之比,相对比可以是性质相同或性质不同的数值之比。 应用相对数时的注意事项有哪些?
①计算相对数时的观察单位数不宜过小。一般说来,观察单位(即相对数的分母)越大,计算的相对数越稳定,越能真实可靠的反映事物的真实情况;反之,相对数的波动就大,不够稳定。
②正确区分、应用构成比和率。构成比是事物各组成部分所占的比重或分布,分子是分母的一部分;率说明某种事物
出现的强度或频率,分子是发生某种现象的例数。 ③正确的计算合计率(平均率)。
④对相对数进行比较时,应当注意资料的可比性。 ⑤比较两个或多个相对数时,应进行假设检验。 下列因素可能影响对比组之间的可比性
(1) 观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。
(2) 观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年龄别、同性别的小组率比较或对总率(合计率)进行标准化后再作比较。 (3)对比不同时期资料应注意客观条件是否相同 什么是两个样本之间的可比性?
答:可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 以实例说明为什么不能以构成比代替率?
答:例如某医生研究已婚育龄妇女在不同情况下放置避孕环与失败率的关系。总失败人数为126人,人工流产后失败人数为78,月经后失败人数为39,哺乳期失败人数为9.由此计算得到人工流产后失败人数的百分数为61.9%,月经后为31.0%,哺乳期为7.1%,三者比较得出人工流产后最容易发生避孕失败,这个结论是不对的。因为作者只考虑了失败人数,计算得到的指标是构成比,只能说明放置避孕环失败者各占的比例。若要了解失败率,一定要用失败人数除以放环人数。如人工流产后放环255例失败78例,失败率是30.6%;月经后放环87例失败39例,失败率是44.8%;哺乳期内放环17例失败9例,失败率是52.9%,正确结论应该是哺乳期内放环最容易发生避孕失败。 何为标准化法?标准化法的基本思想?简述直接标准化法与间接标准化法的区别。
答:采用某影响因素(如年龄、性别、工龄、病情轻重、病程长短等)的统一标准构成,然后计算标准化率的方法称为标准化法,其目的是消除原样本内部某影响因素构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。
采用统一标准构成以消除某因素的内部构成不同对总率的影响,使通过标准化后的标准化率具有可比性。
直接标准化法和间接标准化法的主要区别是:如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法,选择一个标准年龄人口构成直接计算标准化率;若只有总的死亡数和年龄别人口数而缺乏年龄别死亡率时,宜采用间接法,选择一个标准年龄别死亡率,先计算标准化死亡比(SMR),再用SMR乘以标准总死亡率得标准化死亡率。 标准化法的基本步骤
★选择方法:常用的计算标准化率的方法有直接法和间接法。直接法的使用条件是已知被观察人群中各年龄组(分组)的患病率(或发病率、死亡率等)资料;若缺乏各分组的率的资料,仅有各分组的观察单位数和总的率,则选用间接法。
★选择标准:一般原则是:①选择一个具有代表性的、内部构成相对稳定的较大人群作标准;②以要比较的两组资料内部各相应分组的观察单位数合并作标准;③以要比较的两组中任选一组的内部构成作标准。 ★计算标准化率
应用标准化率进行比较时要注意什么问题?
答:书:(1)标准化法只适用于因两组内部构成不同,并有可能影响两组总率比较的情况。对于因其它条件不同而产生的可比性问题,标准化法不能解决。
(2)由于选择的标准人口不同,算出的标准化率也不同。因此,当比较几个标准化率时,应采用同一标准人口。 (3)标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。 (4)两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,还应作假设检验。
老师课件:①由于选择的标准不同,算得的标准化率就不同,故而在比较几个标准化率时,应采用同一标准②各年龄组率间若出现明显交叉,则不用标准化法,而只能是比较年龄组率③两样本标准化率的比较亦应作假设检验。 人口金字塔分型
①增长型人口:人口金字塔呈上尖下宽,多为出生率大于死亡率,表示人口不断增长。
②静止型人口:除高龄组构成较小外,其它各年龄组构成相近,此类人口出生率基本等于死亡率,人口总数基本稳定。 ③缩减型人口:人口金字塔呈现上下两头小,中间大,一般多为死亡率大于出生率,人口总数不断减少。 粗出生率(CBR) 意义:
粗出生率的优点在于资料易获得,计算简单,因而几乎世界所有国家均用这个指标;其主要缺点是受人口年龄性别构成的影响大。若人口中生育年龄的女性多,或人口较年轻,已婚率高的地区则粗出生率会偏高。因此,粗出生率只能
粗略地反映一个国家和地区的生育水平。 年龄别生育率(ASFR )意义:
年龄别生育率消除了育龄妇女内部年龄构成对生育水平的影响,故比总生育率又进了一步,它能反映不同年龄(组)育龄妇女的生育水平,不同地区不同时期同一年龄别生育率可以直接比较。通常年龄别生育率多以5岁一个年龄组计算,所以要想得到这一指标,必须要有育龄妇女各年龄组的妇女数和活产数,但在不少发展中国家很难获得这一资料。 总和生育率意义:
是假定同时出生的一批妇女,按照某年的年龄别生育水平度过其一生的生育过程,每个妇女(用?表示则为每千名妇女)可能生育的子女数。它能综合反映各年龄组育龄妇女生育率,能确切地说明人群生育水平。它不受人口性别、年龄构成对生育水平的影响,故不同地区、不同年度的总和生育率可以直接比较,因而应用甚广。它是测量生育水平的最好指标
粗死亡率(简记为CDR)意义
粗死亡率和粗出生率一样,具有资料易获得、计算简单的优点,但其高低受人口年龄构成的影响,故只能粗略地反映人口的死亡水平,不能用来衡量和评价一个国家的卫生文化水平。 年龄别死亡率意义
消除了人口年龄构成不同对死亡水平的影响,故不同地区同一年龄组死亡率可以进行比较。对年龄别死亡率进行分析可以明确卫生工作的重点人群。年龄别死亡率有其自身的规律,一般0岁组死亡率较高,以后随着年龄的增长迅速下降,至10~14岁时(在发达国家为5~9岁)死亡率降至最低值,以后虽略有上升,但在40岁前一直处于低水平,40岁以后,死亡率随年龄的增长而增高。 婴儿死亡率(IMR)意义:
婴儿对外界的抵抗能力差,极易患传染病而导致死亡,故婴儿死亡率是衡量一个国家卫生文化水平的敏感指标。不同地区、不同时期的婴儿死亡率可以比较。在人民生活水平高,环境卫生条件和医疗保健服务好的地区,婴儿死亡率较低。反之,婴儿死亡率较高。例如婴儿死亡率在发展中国家可高达200?,而在发达国家则不到15?。在婴儿时期,死亡并非均匀分布,出生第一个月内死亡的婴儿数占婴儿死亡总数的比重大,通常出生后28天以内的死亡率往往比出生后28天至11月的死亡率还高,因此将婴儿死亡率又分为新生儿死亡率与婴儿后期死亡率。 5岁以下儿童死亡率意义:
许多发展中国家,由于婴儿死亡率的资料不易准确,而5岁以下儿童死亡又很高,故联合国儿童基金会常用5岁以下儿童死亡率作为综合反映婴幼儿死亡水平及儿童生存大小的指标。 孕产妇死亡率意义:
国际疾病分类对孕产妇死亡定义为:“妇女在妊娠期至产后42天以内,由于任何与妊娠有关的原因所致的死亡称为孕产妇死亡,但不包括意外事故死亡。”这一定义中“与妊娠有关的原因”可以分为两类:①直接产科原因:包括对妊娠合并症(妊娠期、分娩期及产褥期)的忽视、治疗不正确等。②间接产科原因:妊娠之前已存在的疾病,由于妊娠使病情恶化引起的死亡。孕产妇死亡率不仅可以评价一个国家或地区的妇幼保健工作,而且可以间接反映一个国家的卫生文化水平。
死因别死亡率意义:
死因别死亡率是死因分析的主要指标,它可以反映人群中各类病伤死亡的频率,即反映各类病伤死亡对居民生命的威胁程度。
发病率(incidence rate) 意义:
发病率是反映某病在人群中发生频率大小的指标,常用于衡量疾病的发生,研究疾病发生的因果关系和评价预防措施的效果。
请比较发病率和患病率的不同。
答:发病率表示一定时期内,在可能发生某病的一定人群活过的总人年中,新发生的某病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受检人数中先患某种病的人数,通常用于描述病程较长或发病时间不易明确的疾病的患病情况,其分子包括新旧病例数,分母是受检总人数。在一定的人群和时间内,发病率和患病率有密切关系,两者与病程(D)的关系是:PR=IR×D。 请比较死亡率与病死率的不同。
答:死亡率与病死率的分子是一样的,均表示因某病死亡的人数,但死亡率的分母是总人年数,侧重反映发生的强度,或单位时间内死亡的概率;病死率的分母是患某病的人数,反映疾病死亡的概率。 相对数的动态指标有哪几种?各有何用处?
答:相对数的动态指标即其动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 绝对增长量是说明某相对数在一定时期增长的绝对值;发展速度与增长速度均为相对比,说明某相对数在一定时期的