卫生统计学重点整理-预防医学 下载本文

应用条件 主要用途 ①独立性;②正态性(可用正态性检验来确认);③方差齐性(可由方差齐性检验来认定)。 ①推断两个或两个以上总体率(或构成比)之间有无差别; ②两变量间有无相互关系;③检验频数分布的拟合优度。 ①当n≥40且所有T≥5时,用2×2表x2检验的基本公式或专用公式计算x22×2表的值; 2x检验的②当n≥40但有1≤T<5时,需要用校正公式计算x2值; 注意事项 ③当n<40或有T<1时,不宜计算x2值,需采用Fisher确切概率法直接计算概率。 ①允许有不超过1/5的基本格子理论频数大于1小于5,但不能有理论频数小R×C表的于1; 2x检验的②如果有1/5以上格子的理论频数大于1小于5,或有1个格子的理论频数小注意事项 于1,可增加样本含量。

【非参数检验的优、缺点】 优点:①适用于任何分布的资料;

②不受总体方差一致的限制; ③可用于等级资料的统计分析;

④有些问题本身没有适当的参数检验方法而非参数检验则恰能处理。

缺点:①由于它没有充分利用原始数据中所提供的信息故检验效能低;

②其效果有一定近似性。

【秩和检验】

亦称符号秩和检验或Wilcoxon配对法,属于非参数检验(不依赖于总体分布类型,不对总体参数进行推断,只是通过样本观察值推断总体的分布或分布位置是否有差别)。 含义 在H0成立的前提下,差值(配对差值、样本各测量值和已知总体中位数M0的差基本思想 值)的总体分布是对称的,总体中位数应为0,T+与T-应接近n(n+1)/4。若正负秩和相差悬殊,则有理由怀疑H0的成立。 ①不满足参数检验条件的资料及无法经变量变换满足参数检验条件的资料; 适用条件 ②未加精确测量的资料,如一端或两端为不确定数值的资料; ③分布类型未知的资料。 主要用途

9

①推断配对设计资料差值的总体中位数是否为0; ②推断样本所来自总体的中位数与已知总体中位数是否相等。 【等级相关适用范围】

1.不服从双变量正态分布的资料; 2.总体分布类型未知的资料;3.等级资料。

【直线回归分析】 含义 前提条件 直线回归是研究两个连续性变量间线性依存关系的一种统计分析方法,用直线回归方程描述两个变量间变化的数量关系,属双变量分析的范畴。 ①独立性;②正态性(可用正态性检验来确认);③方差齐性(可由方差齐性检验来认定)。 ①两变量的变化趋势呈直线趋势; ②因变量y为来自正态分布的随机变量,x可以是规律变化的或人为选定的一应用条件 些数值(I型回归),也可以是随机变量(II型回归); ③对于I型回归,当x取不同数值时,y的分布都是正态分布,并且这些分布的方差都相等;对于II型回归,要求x、y服从双变量正态分布。 ①作回归分析要有实际意义; ②直线回归分析的资料,一般要求应变量y是来自正态总体的随机变量; 注意事项 ③进行回归分析时,应先绘制散点图; ④异常值的处理(通过散点图判断); ⑤避免外延。

【直线回归与直线相关分析区别与联系】

VS 直线相关 直线回归 资料要求要求两个变量是双变量正态要求应变量y服从正态分布,自变量x是不同 分布。 能精确测量或控制的变量。 反应变量之间的依存关系,有自变量和应反映两变量间的伴随关系,这统计意义变量之分,一般将“因”或交易测定、变种关系是相互的,对等的,以区不同 异较小者定为自变量,这种依存关系可能一定有因果关系。 别 是因果关系或从属关系。 把两变量间直线关系的密切分析目的把自变量与应变量间的关系用函数公式定程度及方向用一个统计指标不同 量地表达出来。 表示出来。 变量间关系的方向一致:对同一资料,其r与b的正负号一致。 联假设检验等价:对同一样本,tr=tb 系 r与b值可相互换算(书上找) 用回归解释相关:回归分析中的决定系数在数值上等于相关系数的平方,即r2。 10

【常用多变量统计方法】

1.计数资料服从正态分布:多重线性回归分析; 2. 分类变量:Logistic回归分析;

3. 时间变量(包含有终检数据):Cox回归分析; 4. 对数据进行归类研究:聚类分析;

5. 分类已经明确,欲通过某些指标来判断其归类:判别分析;

6. 研究的指标比较多,需要数个综合变量来反映资料的信息:主成分分析与因子分析。

11