配对设计资料整理成四格表形式:
乙处理 甲处理 + + - 合计 2合计 - b d b + d a + b c + d n a c a + c 配对四格表?统计量的计算公式:
2(b?c?1)(b?c)2,v?1 b + c ≤40 ?2? b + c >40 ??,v?1 b?cb?c2 检验过程如下:
(1)建立假设,确定检验水准 H0:总体b=c 即两种方法的检测结果无差别 H1:总体b≠c 即两种方法的检测结果有差别 ? =0.05 (2)计算检验统计量?2值 因为b=2,c=11,b+c<40,故用校正公式,
?2?2?11?1??2?112= 4.92
(3)确定概率P值,作出推断结论
查?2界值表,?20.05(1)=3.84,?2>?20.05(1),P<0.05, 按? =0.05的水准拒绝H0,接受H1,可认为两种方法的检测结果有差别,乙法检测出的阳性率较高,因为c>b。
第十一章 秩和检验
(一)参数统计与非参数统计
1.参数统计 样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对这些未知的参数进行估计或检验。此类方法称为参数统计。
2.非参数统计 样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。 (二)非参数统计适用范围 1)等级资料。(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。(5)分布类型不明。(6)初步分析。有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。(7)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。 (三)参数检验和非参数检验的特点及优缺点
(1)参数检验 要求样本来自的总体分布类型已知,在此基础上对总体的参数进行检验。
(2)非参数检验 不依赖总体的分布类型,应用时也由于此种检验方法不再是参数间的比较,所以称
之为非参数检验。
(3)非参数检验的优点
①不受总体分布类型的限制,应用范围广;② 适用于各种类型的变量,对于一些未能精确测量而只能以优劣等级、严重程度、次序先后表示的资料(如等级资料),或不满足参数检验条件的资料均可用非参数统计方法;(适用于各种类型的变量以及一些等级资料,或不满足参数检验条件的资料均可用非参数统计方法)。③计算量相对较小,可节省计算时间。
(4)非参数检验的缺点 符合参数检验的资料,如用非参数检验,则会因为未充分利用样本信息,使得检验效能降低,导致犯第二类错误(存伪)的概率增大。
(四)配对设计资料编秩方法:①省略所有差值为0的对子数,同时样本例数减1②按差值的绝对值从小到大编秩,然后分别冠以正负号。遇差值绝对值相等则取平均秩,称为相同秩③分别求出正负秩次之和,正秩和以T+表示,负秩和的绝对值以T-表示。T+及T-之和应等于 n(n+1)/2,任取T+(或 T-)作检验统计量。 注意:若 n>50时,可用 u检验;当相同差值数多时,应改用校正式。 (五)成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)
编秩方法: ①把两样本数据混合从小到大编秩,遇数据相 等者取平均秩;
②以样本例数小者为n1,其秩和(T1)为T,
若两样本例数相等,可任取一样本的秩和(T1
或T2)为T。
(六)成组设计多个样本比较的秩和检验(Kruskal -Wallis法)
编秩方法:将各组数据混合,由小到大排序并编秩,如遇有相等数值则取平均秩次,如数值为1.5的有三个,它们的秩次为3、4和5, 取平均秩次为(3+4+5)/3=4.
(七)多个样本两两比较 重复多次假设检验后会增大犯一类错误的概率,必须对检验水准进行调整.
调整检验水准的计算: a’=a/比较次数=
a
k(k?1)/2(六)随机区组设计资料的秩和检验(Friedman检验) 编秩方法:(1)将每个区组的数据由小到大分别编秩,遇相同数值取平均秩;(2) 计算各处理组的秩和Ri。
(七)等级资料编秩 ①计算各等级资料的合计人数,确定各组段秩次范围
②计算各等级平均秩次 ③以各等级平均秩次与各等级例数相乘,再求和,即得T值。
第十二章 简单线性回归
1. 直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。 直线回归方程
中,a、b是决定直线的两个系数,见表
2.回归参数估计
根据数学上的最小二乘法原理,既直线可保证各实测点至直线的纵向距离的平方和最
X?X??Y?Y?l???小,可推导出计算a和b的公式如下: b?l??X?X?2XYXX a?Y?bX
3. 直线回归方程的应用 (1)描述两变量的依存关系;(2)用回归方程进行预测;(3)用回归方程进行统计控制;(4)用直线回归应注意的问题
回归分析应用的注意事项:
1)作回归分析要有实际意义,不能把毫无关联的两种现象随意进行回归分析,忽视事物现象间的内在联系和规律.
2)进行回归分析时应先绘制散点图.如果各散点图中出现一些特大或特小的离群值,则应及时复核检查,在准确无误的前提下,根据离群值判断准则,对其决定取舍.3)直线回归分析用于刻画应变量Y对自变量X在数值上的依存关系,其中哪一个作为应变量主要是根据专业上的要求而定,可以考虑把易于精确测量的变量作为x,另一个随机变量作Y。4)对于线性回归模型通常采用最小二乘法来估计回归系数,并在此基础上作进一步推断。5)建立回归方程后,须对回归系数β进行假设检验,只有经假设检验得出总体回归系数β不为0后,回归方程才有意义。6)直线回归方程的适用范围应以自变量的取值范围为限。若无充足理由证明,超出自变量取值范围直线回归关系仍成立时,应该避免随意外延。 4.总体回归线95%置信带和个体Y的范围(见书P194,图12-3) 图12-3中,围绕在回归方程直线两侧的两条光滑的曲线(实线),构成形似领带的带状区域,称为总体回归线的95%置信区间,其意义是满足线性回归的假设条件下,真实的回归线落在两条实曲线所形成的区域内的置信度为95%。
图12-3中,各X值所对应的Y值的95%容许区间的上下限在总体回归线置信带的外侧也构成了两条弧形曲线(虚线),称为个体Y的95%预测范围。 5.残差分析 残差:指观测值与通过直线回归方程计算所得的预测值之差,反映了方程拟合数据优劣的信息。
线性回归模型成立的四个前提条件:线性,独立,正态,等方差。
第十三章 线性相关
1. 直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布资料。有正相关、负相关和零相关等关系。直线相关的性质可由散点图直观的说明。
相关系数又称积差相关系数(coefficient of product -moment correlat ion),以符号r 表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 2. 计算公式
r 没有单位,其值为-1≤r≤1。其绝对值愈接近1,两个变量间的直线相关愈密切;愈接近0,相关愈不密切。r 值为正表示正相关,说明一变量随另一变量增减而增减,方向相同;r 值为负表示负相关,说明一变量增加、另一变量减少,即方向相反;r 的绝对值等于 1为完全相关。 3. Spearrman秩相关 适用于:(1)变量X和Y不服从双变量正态分布,可用Spearrman秩相关;
(2)变量X和Y均为多分类有序资料,可用Spearrman秩相关。
4.直线回归与相关的区别与联系
4.1区别(1) 资料要求:直线回归要求因变量Y服从正态分布,X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;直线相关要求两个变量 X、Y 服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。
(2) 应用情况:直线回归是说明两变量依存变化的数量关系;直线相关是说明两变量间的相关关系。(3)意义:b表示X每增(减)一个单位时,Y平均改变b 个单位;r说明具有直线关系的两个变量间关系的密切程度与相关方向。 (4计算:b= lxy/ lxx;
(5) 取值范围:—∞<b<+∞ ;-1≤r≤1(6)单位:b有
单位;r 没有单位。 4.2 联系
(1) 方向一致:对一组数据若能同时计算b 和r,它们的符号一致。(2) 假设检验等价:对同一样本,r和 b的假设检验得到的 t值相等,即
(3) 用回归解释相关:
第二十章 多重线性回归
(一)将直线回归分析方法加以推广,用回归方程定量地刻画一个应变量Y 与多个自变量 X间的线形依存关系,称为多元线形回归(multiple linear regression),简称多元回归。基本形式:
(二)多元线性回归分析中的假设检验
多元线性回归方程的假设检验包括两个方面:整体回归效应的假设检验和偏回归系数的假设检验。 (1)整体回归效应的假设检验 类似简单线性回归方程的假设检验,当通过样本数据求得参数估计值
b0,b1,b2,...,bp之后,还需要进一步检验各自变量的偏回归系数是否均为0,即H0: β1=β2 =?=βp