卫生统计学重点整理-预防医学 下载本文

1. 卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生

服务领域中数据的收集、整理和分析的一门科学。 2. 同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。

否则称为异质(heterogeneity)的或者间杂的。 3. 变异(variation):同质事物之间的差别称为变异。[没有个体变异,就没有统计学!] 4. 总体(population):根据研究目的所确定的同质观察单位的全体。 5. 样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。 6. 样本含量(sample size):样本中包含的观察单位个数。

7. 参数(parameter):反映总体特征的指标。特点:未知 、唯一,希腊字母表示,如总体均

数、总体率等。 8. 统计量(statistic):根据样本观察值计算出来的指标。特点:已知 、不唯一,拉丁字母

表示,如样本均数、样本率等。 9. 变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特

征或属性称为变量。 10. 变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed

value)。 11. 资料(data):变量值的集合称之为资料。

12. 定量资料(quantitative data):变量值是定量的,表现为数值大小。特点:一般有度、

量、衡单位,一般属连续性资料。 13. 定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。特点:

一般无度、量、衡单位,一般属于离散型资料。可进一步分为计数资料和等级资料。 14. 计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所

得的资料。可进一步分为二项分类资料和无序多项分类资料。 15. 等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点

各组观察单位所得的资料。各属性之间互不相容且有程度的差别。 16. 抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的

研究方法。 17. 抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量

之间的差异。 18. 概率(probability):概率是随机事件发生可能性大小的数值度量。通常用P表示。大小

介于0与1之间,即0≤P ≤1。 19. 小概率事件:医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 20. 小概率原理:并不表示不可能发生,但在某一次试验中,是不会发生的。

1

21. 单纯随机抽样(simple random sampling):先将调查总体的全部观察单位统一编号,然后

采用随机数字表、统计软件或抽签等方法之一随机抽取n(样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。 22. 系统抽样(systematic sampling):又称机械抽样或等距抽样。事先将总体内全部观察单

位按某一顺序号等距分隔成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 23. 分层抽样(stratified sampling):是先按对观察指标影响较大的某项或某几项特征,将

总体分成若干层,该特征的测定值在层内变异较小、层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 24. 整群抽样(cluster sampling):是将总体划分为群(初级观察单位),各群由次级观察单

位组成。随机抽取一部分群,调查抽中群的全部次级观察单位。 25. 信度(reliability):测量工具的可靠性,它是指采用相同测量工具(如问卷)对同一对

象进行重复测量时,各次测量值与其均值接近的程度。 26. 效度(validity):是指测量工具、指标或观测结果在多大程度上反映了事物的客观真实性,

即指观测结果与试图达到的目标之间的接近程度,是对测量工具(如问卷)有效性的检验。 27. 实验研究(experimental study):是指研究者根据研究目的人为地对受试对象(包括人或动物)施加处理因素,控制混杂因素,观察、总结处理因素的效应的一种研究方法。 28. 处理因素(study factor,treatment):是指研究者施加于受试对象的因素。 29. 水平(level):是指同一处理因素在数量上或强度上的不同程度。 30. 受试对象(study subjects):是处理因素作用的客体或对象。

31. 实验效应(effect):是处理因素作用于受试对象后出现的反应和结局,它通过指标的选择

和指标的观察来体现。 32. 偏倚(bias):研究误差中的系统误差部分称为偏倚。

33. 平均数(average):表达了一组同质定量数据的平均水平或集中位置。常用的平均数包括

算术均数、几何均数、中位数、众数、调和均数等。

__

34. 算术均数(mean):常简称均数,是用一组观察值相加除以观察值的个数所得。常用x表示

样本均数,表示μ总体均数。

35. 几何均数(geometric mean):用G表示,是n个观察值乘积的n次方根,又称倍数均数。

适用于:①对数对称分布,②等比级数资料,如血抗体浓度。[观察之中不能有0] 36. 中位数(median):用M表示,是将一组观察值由小到大排序后,居于中间位置的数值即为

中位数。中位数是一种位置平均数。 37. 百分位数(percentile):用表示,是指将一组观察值由小到大排序后,将其平均分成100

等份,对应于每一分割位置上的数值就称为一个百分位数。

2

38. 医学参考值范围:亦称正常值范围,是指绝大多数“正常人”的解剖、生理、生化等指标

的波动范围。 39. 率(rate):是说明某现象发生的频率或强度的指标,不会大于1。

40. 构成比(proportion):表示事物内部各组成部分所占的比重,常以百分数表示,因此也称

为百分比。 41. 相对比(ratio):是两个指标A、B之比。A、B可以是绝对数,A、B也可以是相对数,A、

B可以是性质相同的两个指标,A、B的单位可以相同,也可以不同。 42. 动态数列(dynamic series):是一系列按时间顺序排列起来的统计指标,用以说明事物在

时间上的变化和发展趋势。 43. 率的标准化:是在一个指定的标准构成条件下进行率的对比的方法。意义:当两个率要进

行比较大小时,若要对比的两组对象内部构成的差别足以影响结论时,可以应用率的标准化法消除这种影响,使两个率具备可比性。 44. 标准误(standard error,SE):通常将样本统计量的标准差称为标准误。

45. 可信区间(confidence interval,CI):按一定的概率或可信度(1-?)用一个区间估计总体

参数所在范围,这个范围称作可信度为1- ? 的可信区间,又称置信区间。 46. Poisson分布:Poisson分布是二项分布的极限形式,二项分布中,当π很小(<0.05),

n很大,二项分布→Poisson 分布。 47. Ⅰ型错误(typeⅠerror):H0实际上是成立的,但由于抽样的原因,拒绝了H0,这类“弃

真”的错误称为Ⅰ型错误,其最大概率为α。 48. Ⅱ型错误(type Ⅱ error):H0实际上不成立,但假设检验没有拒绝它,这类“取伪”的

错误称为Ⅱ型错误,其概率大小用β表示。 49. 检验效能(power of a test):1-β,是指当两总体参数确有差别时,按α水准能够发现

这种差别的能力。即对实际上成立的H1作出肯定结论的把握程度。 50. P值:指从所规定的总体中随机抽样,获得等于或大于现有统计量值的概率。

51. 参数检验(parametric test):在总体分布类型已知的条件下,在此基础上对未知的参数

进行估计或检验,称为参数统计或参数检验。 52. 非参数检验(nonparametric test):不依赖于总体的分布类型,不对总体参数进行推断,

只是通过样本观察值比较总体的分布或分布位置,因此又称为任意分布检验。 53. 直线相关(linear correlation):又称简单相关(simple correlation),是用来描述具有

直线关系的两变量x、y的相互关系的统计方法。 54. 直线相关系数(linear correlation coefficient):亦称Pearson积矩相关系数,是定量

描述两个变量间直线关系的方向和密切程度的指标。总体相关系数用ρ表示,样本相关系数用r表示。 55. 死亡事件(death event):又称失效事件/重点事件,指标志某种处理措施失败或失效的特

征事件。

3

56. 生存时间(survival time):指观察到的存活时间,可用天、周、月、年等时间单位记录,

常用符号t表示。 57. 完全数据(complete data):从观察起点至发生死亡事件所经历的时间。

58. 结尾数据(censored data):简称结尾值,又称删失数据或终检值。生存时间观察过程的

截止不是由于死亡事件,而是由于其他原因因引起的,称为结尾。主要原因有三种:失访、退出、终止。 59. 生存曲线(survival curve):以观察(随访)时间为横轴,以生存率为纵,将各个时间点

所对应的生存率连接在一起的曲线图,用以描述生存过程。 60. 寿命表(life table):是根据特定人群的年龄组死亡率编制出的一种统计表,用以说明在

特定人群年龄组死亡率的条件下人的生命过程。

4