SAS统计(网) 下载本文

N Mean Std Dev Minimum Maximum --------------------------------------------------------------- 110 119.7272727 4.7413254 108.2000000 132.5000000 ---------------------------------------------------------------

可见Means过程的输出结构极为紧凑。 5.3.4 应用实例 例5.5 给出例5.1的均数

、标准差s、变异系数CV和95%可信区间,并检验

其总体均数是否为0(卫统p233 1.1题)。 解:如果数据集a.wt1_1已经建立,则程序如下:

proc means data=a.wt1_1 n mean std cv lclm uclm t prt ; var x; run; §5.4 TTEST过程

顾名思义,TTEST过程就是用于进行两样本均数的比较,它给出两总体方差齐和不齐时的检验结果,并同时做方差齐性检验。综合两者的结果,即可做出判断。

事实上,ttest过程的功能非常有限,只能做一般的两样本t检验,对于按频数表格式输入的资料,我们只能用以后要介绍的ANOVA等过程来分析。 5.4.1 语法格式

PROC TTEST [ DATA= <数据集名> [COCHRAN] ] ; CLASS <变量名>; [ VAR <变量名列>; BY <变量名列> ] ; 5.4.2 结果解释

以例5.2的TTEST过程为例,它的输出结果如下:

TTEST PROCEDURE Variable: VALUE 分析变量名为VALUE

GROUP N Mean Std Dev Std Error Variances T DF Prob>|T|

25

指定要分析的数据集名 要求在方差不齐时做COCHRAN近似 必需,指定一个两分类的分组变量 指定要检验的变量名列 按变量名列分组统计 样本量 均数 标准差 标准误 方差 统计量t值 自由度 p值

------------------------------------------------ --------------------------------- 1 18 4.45444444 1.32446314 0.31217896 Unequal -1.8132 31.2 0.0794 2 16 5.29875000 1.38200760 0.34550190 Equal -1.8179 32.0 0.0785 For H0: Variances are equal, F' = 1.09 DF = (15,17) Prob>F' = 0.8589

可见该结果分为三大部分:第一部分为两组各种描述统计量的值,第二部分分别给出两组所在总体方差齐和方差不齐时的t检验结果,第三部分为方差齐性检验,因此该过程一共进行了三个假设检验。对于无效假设H0:两总体方差齐的检验结果为F' = 1.09,DF = (15,17),p = 0.8589,可见在本例中方差是齐的,从而应选用方差齐时的t检验结果,即t= -1.8179,ν=32,p=0.0785,按α=0.05水准,不拒绝H0,尚不能认为慢支炎患者与健康人的尿17酮类固醇排出量不同。 5.4.3 应用实例

例5.6 某医院对9例慢性苯中毒患者用中草药一号抗苯一号治疗,得下列白细胞总数(109/L),问该药是否对白细胞总数有影响(卫统p225 2.3题)?

病人号 1 2 3 4 5 6 7 8 9 治疗前 6.0 4.5 5.0 3.4 7.0 3.8 6.0 3.5 4.3 治疗后 4.2 5.4 6.3 3.8 4.4 4.0 5.9 8.0 5.0

解:该题为样本差值均数和总体均数为0比较的t检验,TTEST过程无法完成。

这里用MEANS过程来处理,程序如下:

libname a 'c:\%user'; data a.wt2_3; input x y @@; tempvar=x-y; cards; 6.0 4.2 4.8 5.4 5.0 6.3 3.4 3.8 3.4 3.8 7.0 4.4 3.8 4.0 6.0 5.9 8.0 5.0 ; proc means n mean std stderr t prt ; var tempvar; run; 利用Means过程检验差值总体均数是否为0 要分析的变量为tempvar 开始运行程序 用新变量tempvar来记录同一病人治疗前后白细胞的差值 例5.7 将钩体病人的血清分别用标准株和水生株做凝溶实验,测得稀释倍数如下。问两组的平均效价有无区别(卫统p226 2.5题)。 标准株:100 200 400 400 400 400 800 1600 1600 1600 3200

26

水生株:100 100 100 200 200 200 200 400 400 解:程序如下:

libname a 'c:\%user'; data a.wt2_5; input group x @@; logx=log(x); cards; 1 100 1 200 1 400 1 400 1 400 1 400 1 800 1 1600 1 1600 1 1600 1 3200 2 100 2 100 2 100 2 200 2 200 2 200 2 200 2 400 2 400 ; proc print; proc ttest ; class group; var logx; run; 调用ttest过程进行t检验 分组变量为group 要统计的变量为logx 将数据做自然对数转换

第六章 分类资料的统计描述与简单推断

在SAS/STAT模块中FREQ、TABULATE和SUMMARY等过程可用于分类资料的统计描述,其中FREQ过程兼具统计描述和统计推断的功能,对分类变量计算频数分布,产生从一维到n维的频数表和列联表;对于二维表,可进行c2检验,对于三维表,可作Mentel-Hanszel分层分析。FREQ过程是SAS用于分析分类资料的一个常用过程。本章将向大家介绍FREQ过程的用法。

§6.1 引 例

例6.1 某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别(医统第二版P37 例3.10)?

处 理 愈 合 未愈合 合计 呋喃硝胺 54 甲氰咪胍 44 合 计 98 8 20 62 64 28 126 27

解:在建立行′ 列表的数据集时一般需要三个变量――行变量、列变量和指示每个格子中频数的变量。本例首先建立这样一个数据集,然后调用FREQ过程输出行′ 列表,同时利用CHISQ选项进行c 2检验。 ① 设定数据库环境: LIBNAME A C:\\USER ;

② 数据步,建立数据集(这里同时给出直接输入和利用循环语句输入两种程序): DATA A.YTLI8_1;

INPUT ROW COLUMN NUMBER ; CARDS; 1 1 54 1 2 8 2 1 44 2 2 20 ; RUN;

③ 调用FREQ过程,进行c 2检验: PROC FREQ DATA=A.YTLI8_1; TABLE ROW*COLUMN / CHISQ; WEIGHT NUMBER; RUN;

DATA A.YTLI8_1; DO ROW=1 TO 2; DO COLUMN=1 TO 2; INPUT NUMBER @@; OUTPUT; END; END; CARDS; 54 8 44 20 ; RUN;

§6.2 FREQ过程

6.2.1 语法格式

PROC FREQ [选项];

28