SAS上机练习题(全部,含参考答案) 下载本文

重庆医科大学--卫生统计学统计软件包

SAS上机练习题(一)

1、SAS常用的窗口有哪三个?请在三个基本窗口之间切换并记住这些命令或功能键。

2、请在PGM窗口中输入如下几行程序,提交系统执行,并查看OUTPUT窗和LOG窗中内容,注意不同颜色的含义;并根据日志窗中的信息修改完善程序。 DATS EX0101; INPUTT NAME $ AGE SEX; CARDS; XIAOMIN 19 1 LIDONG 20 1 NANA 18 2 ; PROD PRONT DATS=EX1; RUN; PROC PRINT DATA=EX1; VAR NAME AGE; RUN; 3、将第2题的程序、结果及日志保存到磁盘。

4、试根据如下例1的程序完成后面的问题: 表1 某班16名学生3门功课成绩表如下 问题:

1) 建立数据集;

2) 打印至少有1门功课不及格同学的信息;(提示,使用if语句)

参考程序:

data a;

input id sh wl bl; cards; 083 68 71 65 084 74 61 68 085 73 75 46 086 79 80 79 087 75 71 68 084 85 85 87 085 78 79 75

086 80 76 79 087 85 80 82 088 77 71 75 089 67 73 71 080 75 81 70 118 70 54 75 083 70 66 84 084 62 73 65 099 82 70 79 ; run;

data b; set a;

if sh<60 or wl<60 or bl<60 then output; run;

proc print data=b; var id sh wl bl; run;

5、根据下列数据建立数据集

表2 销售数据

开始时间 2005/04/28 2005 09 18 2007/08/12 20040508 终止时间 25MAY2009 05OCT2009 22SEP2009 30JUN2009 费用 $123,345,000 $33,234,500 $345,600 $432,334,500 提示:(格式化输入;数据之间以空格分隔,数据对齐;注意格式后面的长度应以前一个位置结束开始计算,如果读入错误,可试着调整格式的宽度;显示日期需要使用输出格式) 开始时间,输入格式yymmdd10. 终止时间,输入格式date10. 费用,输入格式dollar12.

参考程序:

data a;

input x1 yymmdd10. x2 date10. x3 dollar13.; cards;

2005/04/28 25MAY2009 $123,345,000 2005 09 18 05OCT2009 $33,234,500 2007/08/12 22SEP2009 $345,600 20040508 30JUN2009 $432,334,500 ; run;

proc print; run;

proc print;

format x1 yymmdd10. x2 date9. x3 dollar13.; run;

6、手机号码一编码规则一般是:YYY-XXXX-ZZZZ,其YYY为号段;XXXX一般为所在地区编码;ZZZZ为对应的个人识别编号。下面有一组电话号码(来源于网络,末位以X替换),请用程序完成下列要求:

(1)分别列出属于联通、移动、电信的号码; (2)分别提取地区编号及个人识别编号。 (提示:列输入方式或者字符串操作) 说明:

移动:134-139、150、151、152、157、158、159、188 联通:130、131、132、155、156 电信:133、153、180、189

手机号码 1508320464X 1510291126X 1339644156X 1532464828X 1365721647X 1523105754X 1592624347X 1331237668X 1370048578X 手机号码 1313654836X 1351425709X 1303612231X 1383824855X 1522322763X 1357851051X 1508311759X 1327313520X 1556443719X 1507244457X 1321246707X 1368464734X 1394913242X

1804346016X 1513441713X 1308279203X 1897876466X 参考程序: data a;

input y 1-3 x $ 4-7 z $ 8-11;

if 134<=y<=139 or y in (150,151,152,157,158,159,188) then ygrp='移动'; if y in (130,131,132,155,156) then ygrp='联通'; if y in (133,153,180,189) then ygrp='电信'; cards;

1508320464X 1510291126X 1339644156X 。。。。。。 1513441713X 1308279203X 1897876466X ;

proc print; run;

7、下表是某班学生几门功课的成绩,其中形势课是考查课,其它均为考试课。请完成以下处理并且保存程序、结果和日志:(注意函数在DATA STEP中使用的位置) (1)用Mean()函数求出每位同学的平均分,将其保存在变量中;

(2)用sum()函数或者表达式求出每位同学的总分,将其保存在变量中;

(3)如果每门考试课权重是0.75,每门考查课权重为0.25,试求每位同学的加权平均分; (4)将数据集保存为永久数据集,保存位置为“D:\\mydata\\”;

(5)调用上面的永久数据集,并将男、女生的成绩分别保存在数据集Dmale和Dfemale中。

表3 某班同学几门功课的成绩 学号 0083 0414 0564 0774 0873 0874 0875 0876 性别 高数 (0=女,1=男) 1 1 1 1 1 1 1 1 73 90 97 40 68 74 73 79 生理 73 79 87 60 65 68 46 79 人解 64 71 89 61 60 56 65 74 数理统计 74 85 91 65 76 60 66 89 形势(考查) 75 78 80 75 75 75 87 87 0877 0878 0880 0881 0883 0884 0885 0886 0887 0888 0889 0890 0891 0892 0893 0894 0895 0896 0898 0899 0900 0901

1 1 1 1 1 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 75 76 81 76 77 85 78 80 85 77 67 75 69 66 70 62 91 51 67 79 76 81 68 60 73 81 60 87 75 79 82 75 71 70 76 71 84 65 78 60 73 72 68 70 55 64 60 84 60 84 62 77 81 74 71 75 76 60 75 65 61 42 67 78 63 70 60 71 75 89 66 85 66 73 84 67 69 69 79 60 80 69 66 44 73 68 84 82 70 80 82 78 75 90 80 83 80 80 90 80 90 78 85 81 78 78 85 80 90 79 参考程序:

libname pb \; data pb.score;

input id$ xb gs sl rj sltj xs; mscore=mean(of gs sl rj sltj xs); tscore=sum(of gs sl rj sltj xs);

wmscore= ((gs+sl+rj+sltj)*0.75+xs*0.25)/(0.75*4+0.25); cards;

0083 1 73 73 64 74 75 0414 1 90 79 71 85 78 0564 1 97 87 89 91 80 0774 1 40 60 61 65 75 0873 1 68 65 60 76 75 0874 1 74 68 56 60 75 0875 1 73 46 65 66 87 0876 1 79 79 74 89 87 0877 1 75 68 55 60 70 0878 1 76 60 64 71 80 0880 1 81 73 60 75 82 0881 1 76 81 84 89 78

0883 1 77 60 60 66 75 0884 0 85 87 84 85 90 0885 0 78 75 62 66 80 0886 0 80 79 77 73 83 0887 0 85 82 81 84 80 0888 0 77 75 74 67 80 0889 0 67 71 71 69 90 0890 0 75 70 75 69 80 0891 0 69 76 76 79 90 0892 0 66 71 60 60 78 0893 1 70 84 75 80 85 0894 1 62 65 65 69 81 0895 1 91 78 61 66 78 0896 1 51 60 42 44 78 0898 1 67 73 67 73 85 0899 1 79 72 78 68 80 0900 1 76 68 63 84 90 0901 0 81 70 70 82 79 ;

data dmale dfemale; set pb.score;

if xb=1 then output dmale; if xb=0 then output dfemale; run;

8、下面是3个大类疾病的ICD-10编码及对应的疾病名。请完成以下任务: (1)建立数据集;

(2)提取每种疾病的大类编码;

(3)分别将3个大类的疾病存入3个数据集。

(提示:ICD10编码中小数点前面的三位表示大类;length语句定义字符变量长度;字符串取子串函数)

表4 4类疾病的ICD10编码及对应疾病名

ICD10 A01.001 A01.002 A01.003+ A01.101 A01.201 A01.301 A01.401 A02.001 A02.002 A02.004

Disease 伤寒

伤寒杆菌性败血症 伤寒性脑膜炎 甲型副伤寒 乙型副伤寒 丙型副伤寒 副伤寒

B群沙门氏菌肠炎 C群沙门氏菌肠炎 沙门氏菌性肠炎

A02.006 A02.007 A02.008 A02.101 A02.201+ A02.202+ A02.203+ A02.901 A02.902 A02.903 A03.001 A03.101 A03.201 A03.301 A03.802 A03.901 A03.902 A03.903 A03.905 A03.906

沙门氏菌胃肠炎 鼠伤寒沙门氏菌性肠炎 婴儿沙门氏菌肠炎 沙门氏菌败血症 沙门氏菌性肺炎 沙门氏菌性关节炎 沙门氏菌性脑膜炎 沙门氏菌感染 鼠伤寒沙门氏菌感染 沙门氏菌属食物中毒 什密氏志贺菌痢疾 弗氏志贺菌痢疾 鲍氏志贺菌痢疾 宋内氏志贺菌痢疾 菌痢混合感染 细菌性痢疾

慢性细菌性痢疾急性发作 慢性细菌性痢疾 慢性迁延型细菌性痢疾 中毒性痢疾

参考程序: data a;

input ICD10 $ Disease:$24.; cat=substr(ICD10,1,3); cards;

A01.001 伤寒

A01.002 伤寒杆菌性败血症 A01.003+ 伤寒性脑膜炎 A01.101 甲型副伤寒 A01.201 乙型副伤寒 A01.301 丙型副伤寒 A01.401 副伤寒

A02.001 B群沙门氏菌肠炎 A02.002 C群沙门氏菌肠炎 A02.004 沙门氏菌性肠炎 A02.006 沙门氏菌胃肠炎

A02.007 鼠伤寒沙门氏菌性肠炎 A02.008 婴儿沙门氏菌肠炎 A02.101 沙门氏菌败血症

A02.201+ 沙门氏菌性肺炎 A02.202+ 沙门氏菌性关节炎 A02.203+ 沙门氏菌性脑膜炎 A02.901 沙门氏菌感染

A02.902 鼠伤寒沙门氏菌感染 A02.903 沙门氏菌属食物中毒 A03.001 什密氏志贺菌痢疾 A03.101 弗氏志贺菌痢疾 A03.201 鲍氏志贺菌痢疾 A03.301 宋内氏志贺菌痢疾 A03.802 菌痢混合感染 A03.901 细菌性痢疾

A03.902 慢性细菌性痢疾急性发作 A03.903 慢性细菌性痢疾

A03.905 慢性迁延型细菌性痢疾 A03.906 中毒性痢疾 ;

data cat01 cat02 cat03; set a;

if cat='A01' then output cat01; if cat='A02' then output cat02; if cat='A03' then output cat03; run;

9、现有两个文件,内容如下:

A文件 学号 统计 体育 年龄 01 87 83 23 02 56 96 22 03 93 75 19 04 77 84 24 05 88 55 18 B文件 学号 性别 班级 01 男 1 02 女 1 03 男 3 04 男 2 05 女 2 08 女 3 要求:打印至少有一门功课不及格的同学的年龄、性别和班级。

参考程序: data fileA;

input no$ tj ty age; cards;

01 87 83 23 02 56 96 22

03 93 75 19 04 77 84 24 05 88 55 18 ;

data fileB;

input no$ sex$ bj; cards;

01 男 1 02 女 1 03 男 3 04 男 2 05 女 2 08 女 3 ;

proc sort data=fileA; by no;

proc sort data=fileB; by no;

data fileAB;

merge fileA fileB; by no;

if min(tj,ty)<60 and min(tj,ty) > . ; run;

proc print; run;

10、显示100到200以内的素数。 (提示:素数即只能被1和本身整除的数,如2,3,5,7等等;循环语句,条件语句,取余数函数mod(a,b))

参考程序: data a;

do i=100 to 200; flag=0;

do j=2 to i-1;

if mod(i,j)=0 then flag=1; end;

if flag=0 then output; end; keep i; run;

proc print; run;

(彭斌,2010-3-23)

SAS上机练习题(二)

1、某农村地区1999年14岁女孩的身高资料列于表1。

表1 谋农村地区1999年14岁女孩身高资料(cm)

142.3 148.8 142.7 144.4 144.7 145.1 143.3 154.2 152.3 142.7 137.9 143.9 141.2 139.3 145.8 142.2 137.9 141.2 150.6 142.7 142.4 141.5 141.9 147.9 125.8 139.9 148.9 154.9 145.7 140.8 148.8 147.8 146.7 132.7 149.7 154.0 158.2 138.2 149.8 151.1 140.5 143.4 152.9 147.5 147.7 162.6 141.6 143.6 144.0 150.6 150.8 147.9 136.9 146.5 130.6 142.5 149.0 145.4 139.5 148.9 141.8 148.1 145.4 134.6 130.5 145.2 146.2 146.4 142.4 137.1 144.0 129.4 142.8 132.1 141.8 143.3 143.8 134.7 147.1 140.9 142.5 146.6 135.5 146.8 156.3 150.0 147.3 142.9 141.4 134.7 146.6 134.5 135.1 141.9 142.1 138.1 134.9 146.7 138.5 139.6 148.8 150.3 140.7 143.5 140.2 143.6 138.7 138.9 143.5 139.9 133.1 145.9 139.2 137.4 142.3 160.9 137.7 142.9 126.8 问题:(1)计算均数、中位数;计算均数的95%可信区间;

(2)计算四分位间距、标准差、变异系数;计算标准误; (3)请进行正态性检验; (4)观察频数分布情况;

参考程序:

156.6 151.3 139.6 140.1 138.9 144.5 141.4 137.4 138.5 139.2 134.4

data a;

input x@@; cards;

142.3 148.8 142.7 144.4 144.7 145.1 143.3 154.2 137.9 143.9 141.2 139.3 145.8 142.2 137.9 141.2 142.4 141.5 141.9 147.9 125.8 139.9 148.9 154.9 148.8 147.8 146.7 132.7 149.7 154.0 158.2 138.2 140.5 143.4 152.9 147.5 147.7 162.6 141.6 143.6 150.8 147.9 136.9 146.5 130.6 142.5 149.0 145.4 141.8 148.1 145.4 134.6 130.5 145.2 146.2 146.4 144.0 129.4 142.8 132.1 141.8 143.3 143.8 134.7 142.5 146.6 135.5 146.8 156.3 150.0 147.3 142.9 146.6 134.5 135.1 141.9 142.1 138.1 134.9 146.7 148.8 150.3 140.7 143.5 140.2 143.6 138.7 138.9 133.1 145.9 139.2 137.4 142.3 160.9 137.7 142.9 ;

proc means data=a n mean median clm qrange std cv stderr; var x;

proc univariate data=a normal; histogram x; var x; run;

152.3 150.6 145.7 149.8 144.0 139.5 142.4 147.1 141.4 138.5 143.5 126.8

142.7 142.7 140.8 151.1 150.6 148.9 137.1 140.9 134.7 139.6 139.9 156.6 151.3 139.6 140.1 138.9 144.5 141.4 137.4 138.5 139.2 134.4

2、某研究员欲分析急性染毒对肝脏功能的影响,将40只小鼠分为两组,雄雌各半,试验组进行急性染毒试验,染毒后2小时测定血液中的ALT,整理的结果见下表。 (1) 比较实验组与对照组的ALT有无差异;

ALT(丙氨酸转氨酶) NO 1 2 3 4 5 6 7 8 9 10 参考程序:

male control Treaetment 38.4 30.6 25.5 29.9 29.0 33.6 39.4 42.5 46.7 49.3 57.8 62.4 57.5 49.9 55.6 47.3 50.1 48.7 57.9 60.4 Female control Treaetment 39.7 34.6 40.5 44.3 41.2 25.6 30.6 37.6 39.5 25.1 55.7 63.8 59.9 49.7 48.8 51.3 53.8 42.6 61.7 65.3 data a2;

do sex='M','F'; do grp='C','T'; input alt@@; output; end; end; cards;

38.4 57.8 39.7 30.6 62.4 34.6 25.5 57.5 40.5 29.9 49.9 44.3 29.0 55.6 41.2 33.6 47.3 25.6 39.4 50.1 30.6 42.5 48.7 37.6 46.7 57.9 39.5 49.3 60.4 25.1 ;

proc anova data=a2; class sex grp;

model alt=sex grp; means grp; run; quit;

55.7 63.8 59.9 49.7 48.8 51.3 53.8 42.6 61.7 65.3

3、24名志愿者随机分成两组,每组12人,接受降胆固醇试验,甲组为特殊饮食组,乙组为药物治疗组。受试者试验前后各测量一次血清胆固醇(mmol/L),数据见下表:

甲组

受试者 1 2 3 4 5 6 7 8 9 10 11 12

试验前 6.11 6.81 6.48 7.59 6.42 6.94 9.17 7.33 6.94 7.67 8.15 6.60

试验后 6.00 6.83 4.49 7.28 6.30 6.64 8.42 7.00 6.58 7.22 6.57 6.17

受试者 1 2 3 4 5 6 7 8 9 10 11 12

乙组 试验前 6.90 6.40 6.48 7.00 6.53 6.70 9.10 7.31 6.96 6.81 8.16 6.98

试验后 6.93 6.35 6.41 7.10 6.41 6.68 9.05 6.83 6.91 6.73 7.65 6.52

问题:

(1)试建立能够满足以下统计分析的SAS数据集。

(2)试判断两组受试者试验前血清胆固醇水平是否相等? (3)分别判断两种降胆固醇措施是否有效? (4)试判断两种降胆固醇措施的效果是否相同? 参与程序:

data a3;

do grp='甲组','乙组';

input id before after @@; cha=before-after; output; end; cards; 1 6.11 6.00 1 6.90 2 6.81 6.83 2 6.40 3 6.48 4.49 3 6.48 4 7.59 7.28 4 7.00 5 6.42 6.30 5 6.53 6 6.94 6.64 6 6.70 7 9.17 8.42 7 9.10 8 7.33 7.00 8 7.31 9 6.94 6.58 9 6.96 10 7.67 7.22 10 6.81 11 8.15 6.57 11 8.16 12 6.60 6.17 12 6.98 ;

6.93 6.35 6.41 7.10 6.41 6.68 9.05 6.83 6.91 6.73 7.65 6.52

proc ttest data=a3; class grp; var before;

proc ttest data=a3; paired before*after; where grp='甲组'; run;

proc ttest data=a3; paired before*after; where grp='乙组'; run;

proc ttest data=a3; class grp; var cha; run;

4、某职业病防治所对30名矿工分别测定血清铜蓝蛋白含量(μmol/L),资料如下。问各期血清铜蓝蛋白含量的测定结果有无差别?

疾病分期 0期 I期 II期

测定结果

8.0 9.0 5.8 6.3 5.4 8.5 5.6 5.4 5.5 7.2 5.6 8.5 4.3 11.0 9.0 6.7 9.0 10.5 7.7 7.7

11.3 7.0 9.5 8.5 9.6 10.8 9.0 12.6 13.9 6.5

请用秩和检验完成分析。

参考程序:

data a4; input x@@;

if _n_<=11 then grp='0期'; else if _n_<=20 then grp='1期'; else grp='2期'; cards;

8.0 9.0 5.8 6.3 5.4 8.5 5.6 5.4 5.5 7.2 5.6 8.5 4.3 11.0 9.0 6.7 9.0 10.5 7.7 7.7

11.3 7.0 9.5 8.5 9.6 10.8 9.0 12.6 13.9 6.5 ;

proc npar1way wilcoxon; class grp; var x; run;

教材上的练习题

(卫生统计学,方积乾主编,第六版)

t检验 p121页,1,3,4题 第一题

方法一: data a1; input x@@; cards;

20.99 20.41 20.10 20.00 20.19 22.60 20.99 20.41 20.00 23.00 22.00 ;

proc ttest data=a1 h0=20.70; var x; run; 方法二: data a1; input x@@; d=x-20.70; cards;

20.99 20.41 20.10 20.00 20.19 22.60 20.99 20.41 20.00 23.00 22.00 ;

proc ttest data=a1 ; var d; run;

第三题

data a3; input x@@;

if _n_<=10 then grp=1;else grp=2; cards;

6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 6.9 8.5 6.8 11.3 9.4 9.3 7.3 5.6 7.9 7.2 8.2 ; run;

proc ttest data=a3 ; class grp; var x; run;

第四题

data a4; input x1 x2; cards; 16.84 16.79 19.02 19.22 10.44 10.40 14.87 15.14 22.31 21.89 24.83 24.82 26.89 27.00 31.06 31.42 36.76 36.07 41.67 40.99 ; run;

proc ttest data=a4 ; paired x1*x2; run;

卡方检验 p159 例9.2 例9.3 例9.2, 2×2表,卡方检验

data a1;

do row=1 to 2; do col=1 to 2; input f@@; output; end; end; cards; 64 21 51 33 ; run;

proc freq data=a1 ; tables row*col/chisq; weight f; run;

例9.4 例9.3,2×2表,校正卡方或Fisher精确检验

data a2;

input row col f; cards; 1 1 2 1 2 10 2 1 14 2 2 14 ; run;

proc freq data=a2 ; tables row*col/chisq; weight f; run;

例9.4,3×2表,卡方检验

data a3;

do row=1 to 3; do col=1 to 2; input f@@; output; end; end; cards; 35 5 20 10 7 25 ; run;

proc freq data=a3 ; tables row*col/chisq; weight f; run;

秩和检验 p179 例10.2例10.6 p193 7题 例10.2,配对秩和检验

data a1; input x1 x2; d =x1-x2; cards; 10.5 8.8 21.6 18.8 14.9 13.5 30.2 27.6 8.4 9.1 7.7 7.0 16.4 14.7 19.5 17.2 127.0 155.0 18.7 16.3 9.5 9.5 ; run;

proc univariate data=a1; var d; run;

例10.6,等级资料,秩和检验

data a2;

do row=1 to 4; do col=1 to 3;

input f@@; output; end; end; cards; 24 20 20 26 16 22 72 24 14 186 32 22 ;

proc npar1way data=a2 wilcoxon; class col; var row; freq f; run;

p193 7题,等级资料,配对设计,用Friedman检验

data a3;

do id=1 to 10; do grp= 1 to 2; input x$ @@;

if x=\治愈\ then x1=3; if x=\有效\ then x1=2; if x=\无效\ then x1=1; output; end; end; cards;

治愈 有效 有效 无效 治愈 有效 治愈 治愈 有效 有效 治愈 有效 治愈 无效 治愈 有效 有效 无效 治愈 治愈 ;

proc freq data=a3;

table id*grp*x1/cmh scores=rank noprint; run;

(彭斌,2010-4-18)

SAS上机练习题(三)

1、(方差分析)某研究人员研究3种刺激因素(高葡萄糖、高胰岛素和过氧化氢)刺激大鼠肾小球系膜细胞对单核细胞趋化蛋白表达的影响,在四种条件下对大鼠肾小球系膜细胞进行培养,检测结果如表1。

表1 不同刺激因素作用下蛋白表达结果

分组 对照组 高葡萄糖组 高胰岛素组 过氧化氢组

0.3547 1.2247 1.1453 1.3582

表达结果(光密度值) 0.3652 1.2354 1.1526 1.3657

0.3842 1.2136 1.1375 1.3518

0.3598 1.2286 1.1547 1.3259

0.3742 1.2415 1.1294 1.3726

0.3925 1.2275 1.1659 1.3318

问题1:计算每一组的平均光密度,观察各个组间均数的差异大小;

问题2:进行方差分析,将结果整理成方差分析表,观察变异、均方及F值之间的关系; 问题3:分别采用SNK法和Dunnett法进行多重比较; 问题4:对上述结果进行解释。

参考程序: data a;

do grp=1 to 4; do i=1 to 6; input x@@; output; end; end; cards;

0.3547 0.3652 0.3842 0.3598 0.3742 0.3925 1.2247 1.2354 1.2136 1.2286 1.2415 1.2275 1.1453 1.1526 1.1375 1.1547 1.1294 1.1659 1.3582 1.3657 1.3518 1.3259 1.3726 1.3318 ; 或者 data a;

length grp $10; input grp $ @@; do i=1 to 6;

input x@@; output; end; cards;

对照组 0.3547 0.3652 0.3842 0.3598 0.3742 高葡萄糖组 1.2247 1.2354 1.2136 1.2286 1.2415 高胰岛素组 1.1453 1.1526 1.1375 1.1547 1.1294 过氧化氢组 1.3582 1.3657 1.3518 1.3259 1.3726 ;

0.3925 1.2275 1.1659 1.3318

proc glm; class grp; model x=grp;

means grp/snk dunnett; means grp; run; quit;

2、(方差分析)研究枸杞多糖对脂肪肝的预防作用,按窝别作为区组标志,每一区组3只大鼠,随机分配到三个组:生理盐水组、酒精组、酒精+枸杞多糖组,三组灌胃5周,检测肝脏中谷胱甘肽(GSH)的含量(mg/gprot),结果见表2。

表2 三组小鼠肝脏中谷胱甘肽(GSH)的含量(mg/gprot)

区组 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

酒精组 30.48 31.25 33.28 34.61 28.35 29.17 27.34 30.58 34.25 27.31 28.09 30.45 33.25 34.04 34.25

LBP预防组 65.08 63.04 67.59 68.58 64.12 66.55 66.89 67.15 68.05 65.48 64.38 65.04 66.84 67.56 67.46

生理盐水 79.15 75.46 79.32 75.98 76.55 80.34 84.35 88.14 87.35 72.15 74.61 86.33 94.35 92.05 96.42

问题1:按照随机区组设计进行分析,处理组间、区组间效应是否有差异? 问题2:忽略区组,按照完全随机设计进行分析,处理组间效应是否有差异?

问题3:对上述两个方差分析表进行比较,找出相同项与不同项?观察处理组间比较的F值变化,会得出怎样的结论?

问题4:根据分析结果对该研究下一个结论。

参考程序: data a;

input blk @@;

do grp='酒精组 ','LBP预防组','生理盐水'; input x@@; output; end; cards;

1 30.48 65.08 79.15 2 31.25 63.04 75.46

3 33.28 67.59 4 34.61 68.58 5 28.35 64.12 6 29.17 66.55 7 27.34 66.89 8 30.58 67.15 9 34.25 68.05 10 27.31 65.48 11 28.09 64.38 12 30.45 65.04 13 33.25 66.84 14 34.04 67.56 15 34.25 67.46 ;

proc glm; class grp blk; model x= grp blk; means grp/snk; run; quit;

proc glm; class grp; model x= grp; means grp/snk; run; quit;

79.32 75.98 76.55 80.34 84.35 88.14 87.35 72.15 74.61 86.33 94.35 92.05 96.42

3、(方差分析)研究人员研究某种物质的毒性,将40只小鼠分为两组,雄雌各半,试验组给予研究物质,2小时后测定血液中碱性磷酸酶的含量,结果如下。

表3 40只小鼠给予不同物质后血液中碱性磷酸酶的含量

性别 分组

碱性磷酸酶

雄性 对照组 367.9 408.6 375.6 354.9 421.7 374.5 432.7 401.3 399.4 367.5 试验组 423.8 446.9 432.5 478.1 437.5 421.6 489.0 432.5 421.0 420.4 雌性 对照组 378.1 345.2 390.6 399.0 421.1 341.3 322.5 365.4 321.6 401.9 试验组 420.4 473.2 450.3 405.5 427.4 460.5 420.1 394.4 389.6 420.5 问题1:研究者考虑了几个影响因素? 问题2:性别对碱性磷酸酶有无影响? 问题3:该物质对碱性磷酸酶有无影响?

参考程序: data a;

do sex='M','F'; do grp='C','T'; do i= 1 to 10;

input x@@; output; end; end; end; cards;

367.9 408.6 375.6 354.9 423.8 446.9 432.5 478.1 378.1 345.2 390.6 399.0 420.4 473.2 450.3 405.5 ;

proc glm; class sex grp; model x= sex grp; run; quit;

421.7 437.5 421.1 427.4 374.5 421.6 341.3 460.5 432.7 489.0 322.5 420.1 401.3 432.5 365.4 394.4 399.4 421.0 321.6 389.6 367.5 420.4 401.9 420.5

4、(回归分析)以下是制作标准曲线时对应的浓度和吸光度值,试求出标准曲线。并求出A=1.15时的浓度。

表4 不同浓度对应的吸光度值

浓度 0.97 1.27 1.57 1.88 2.18

A值 0.3 0.56 0.93 1.35 1.51

参考程序: data a; input c a; cards;

0.97 0.30 1.27 0.56 1.57 0.93 1.88 1.35 2.18 1.51 . 1.15 ;

proc reg; model c=a / p; plot c*a; run; quit;

5、(相关分析、回归分析)27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表中,试分析血糖与其它几项指标关系的关系。

表5 27名糖尿病人的血糖及有关变量的测量结果

总胆固醇

序号i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

(mmol/L)

X1 5.68 3.79 6.02 4.85 4.60 6.05 4.90 7.08 3.85 4.65 4.59 4.29 7.97 6.19 6.13 5.71 6.40 6.06 5.09 6.13 5.78 5.43 6.50 7.98 11.54 5.84 3.84

甘油三脂 (mmol/L) X2 1.90 1.64 3.56 1.07 2.32 0.64 8.50 3.00 2.11 0.63 1.97 1.97 1.93 1.18 2.06 1.78 2.40 3.67 1.03 1.71 3.36 1.13 6.21 7.92 10.89 0.92 1.20

(胰岛素

糖化血 红蛋白(%)

X4 8.2 6.9 10.8 8.3 7.5 13.6 8.5 11.5 7.9 7.1 8.7 7.8 9.9 6.9 10.5 8.0 10.3 7.1 8.9 9.9 8.0 11.3 12.3 9.8 10.5 6.4 9.6

血 糖 (mmol/L)

Y 11.2 8.8 12.3 11.6 13.4 18.3 11.1 12.1 9.6 8.4 9.3 10.6 8.4 9.6 10.9 10.1 14.8 9.1 10.8 10.2 13.6 14.9 16.0 13.2 20.0 13.3 10.4

?U/ml)

X3 4.53 7.32 6.95 5.88 4.05 1.42 12.60 6.75 16.28 6.59 3.61 6.61 7.57 1.42 10.35 8.53 4.53 12.79 2.53 5.28 2.96 4.31 3.47 3.37 1.20 8.61 6.45

问题1:计算各指标之间的pearson相关系数及spearman相关系数; 问题2:以血糖为应变量Y其它为自变量X,进行回归分析。

参考程序: data a;

input x1 x2 x3 x4 y; cards;

5.68 1.90 4.53 8.2 11.2 3.79 1.64 7.32 6.9 8.8 6.02 3.56 6.95 10.8 12.3 4.85 1.07 5.88 8.3 11.6 4.60 2.32 4.05 7.5 13.4 6.05 0.64 1.42 13.6 18.3 4.90 8.50 12.60 8.5 11.1 7.08 3.00 6.75 11.5 12.1 3.85 2.11 16.28 7.9 9.6 4.65 0.63 6.59 7.1 8.4 4.59 1.97 3.61 8.7 9.3 4.29 1.97 6.61 7.8 10.6 7.97 1.93 7.57 9.9 8.4 6.19 1.18 1.42 6.9 9.6 6.13 2.06 10.35 10.5 10.9 5.71 1.78 8.53 8.0 10.1 6.40 2.40 4.53 10.3 14.8 6.06 3.67 12.79 7.1 9.1 5.09 1.03 2.53 8.9 10.8 6.13 1.71 5.28 9.9 10.2 5.78 3.36 2.96 8.0 13.6 5.43 1.13 4.31 11.3 14.9 6.50 6.21 3.47 12.3 16.0 7.98 7.92 3.37 9.8 13.2 11.54 10.89 1.20 10.5 20.0 5.84 0.92 8.61 6.4 13.3 3.84 1.20 6.45 9.6 10.4 ;

proc corr data=a spearman pearson; run;

proc reg data=a;

model y=x1 x2 x3 x4;

model y=x1 x2 x3 x4/selection=stepwise; run; quit;

6、(综合分析)以下是对某年级的问卷调查结果,问题表内容如下: id 机器号 sex 性别:1=male,2=female date 记忆中影响最大的日子是哪一天? height 身高是多少 weight 体重是多少 money 昨天吃饭花多少钱(元)? question1 46级改革之后学习英语的积极性:a=增加,b=不变,c=减弱 question2 结核病的早期症状有(可以多选):a=咳嗽,b=痰中带血,c=盗汗,d=贫血,e=胸痛,f=午后潮热,g=胃肠不适 请进行以下分析:

1) 对46级改革之后学习英语的积极性的情况进行描述,三种选择占的比例分别是多少? 2) 男性与女性的对46级改革的反应有无差异; 3) 计算身体质量指数(Body Mass Index,BMI?体重(Kg)身高(m2)),比较男女生的BMI有无差

异?

4) 关于BMI与人体的肥胖程度通常可以根据下面的标准来判断,请列出每一类的人数及比例;

偏瘦: BMI指数 < 18 正常体重: BMI指数 = 18 - 25 超重: BMI指数 = 25 - 30 轻度肥胖: BMI指数 > 30 中度肥胖: BMI指数 > 35 重度肥胖: BMI指数 > 40

5) 比较男女生在“昨天吃饭开支”上有无不同;

6) 分析被调查者对“结核病的早期症状”的选择情况,即列出每种选项的频数及比例;(提示:可分别

对每个选项单独进行分析,使用index()函数判断是否选择某个选项,具体用法请查帮助。) 7) 分析身高与体重的相关性;建立身高预测体重的预测模型。

参考程序: proc format;

value sexf 1='男'

2='女';

value qAGf 0='未选择'

1='选择';

value $ques1f 'A','a'='增加'

'B','b'='不变' 'C','c'='减弱';

run;

data a;

input id $ sex height weight money ques1$ ques2$; bmi=weight/((height/100)*(height/100)); ques1=upcase(ques1);

if ques1='A' then q=1; if ques1='B' then q=2; if ques1='C' then q=3;

if bmi<18 then bmigrp=\偏瘦\; else if bmi>=18 and bmi<25 then bmigrp=\正常\; else if bmi>=25 and bmi=<30 then bmigrp=\超重\;

else if bmi>30 and bmi=<35 then bmigrp=\轻度肥胖\; else if bmi>35 and bmi=<40 then bmigrp=\中度肥胖\; else if bmi>40 then bmigrp=\重度肥胖\;

if index(ques2,'A')>0 then qA=1;else qA=0; if index(ques2,'B')>0 then qB=1;else qB=0; if index(ques2,'C')>0 then qC=1;else qC=0; if index(ques2,'D')>0 then qD=1;else qD=0; if index(ques2,'E')>0 then qE=1;else qE=0; if index(ques2,'F')>0 then qF=1;else qF=0; if index(ques2,'G')>0 then qG=1;else qG=0;

format sex sexf. ques1 $ques1f. qA qB qC qD qE qF qG qAGf.; cards;

cnw1l01 1 179 70 5.7 a ABDEF cnw1l02 1 175 70 7.5 a ABE cnw1l03 2 157 47 4.5 a ABE 。。。。。。。。。。。。。。。 cnw8l01 1 160 60 10 B ABE cnw8l02 2 154 50 4.3 A BE cnw8l03 2 160 60 7 A ABDEF ; run;

proc freq data=a; tables ques1; run;

proc freq data=a; tables sex*ques1; run;

proc npar1way wilcoxon data =a; class sex; var q; run;

proc ttest data=a; class sex; var bmi; run;

proc freq data=a; tables bmigrp; run;

proc npar1way wilcoxon data =a; class sex; var money; run;

proc freq data=a;

tables qA qB qC qD qE qF qG; run;

proc corr data=a; var height weight; run;

proc reg data=a;

model weight=height; run; quit;

表6 某年级的问卷调查数据 机器号 id cnw1l01 cnw1l02 cnw1l03 cnw1l04 cnw1l05 cnw1l06 cnw1r01 cnw1r02 cnw1r03 cnw1r05 cnw1r06 cnw2l02 cnw2l03 cnw2l04 cnw2l05 cnw2r02 cnw2r03 cnw2r04 cnw2r05 cnw2r06 cnw3l01 cnw3l02 cnw3l03 cnw3r01 cnw3r02 cnw3r03 cnw3r05 cnw3r06 cnw4l01 cnw4l02 cnw4l03 cnw4l04 cnw4r01 cnw4r02 cnw4r03 cnw4r04 cnw4r05 cnw4r06 cnw5l01 cnw5l02

性别 sex 1 1 2 2 2 2 2 2 1 2 1 2 2 1 2 2 2 2 2 2 2 1 1 1 2 2 2 1 1 1 2 1 1 1 2 2 2 2 2 2

身高 height 179 175 157 163 161 150 158 158 168 150 162 160 164 167 164 151 150 160 160 156 162 163 161 169 162.5 155 163 163 168 178 158 173 175 178 158 165 157 155 160 160

体重 weight 70 70 47 48 52 44 56 56 64 44 53 53 58 60 54 44 51 55 47 48 48 60 50 57 46.5 53 50 65 60 68 45 68 53 69 50 53 46 48 49 49

开支 money 5.7 7.5 4.5 5 5 5.5 4.4 6.2 6.5 5.5 7 8 6 7 5 6 7.8 5 3.9 8.5 8 7.2 7.3 5.3 7 7.5 4.4 8 5 8 6 8.5 5 6 8 4.5 5.3 6.7 4.2 7

英语改革 question1

a a a c b b b b a b b c c c c b b b b c c a b a a b b b c a c b b b b b b c b a

TB症状 question2 ABDEF ABE ABE ABDF ABF ABD ADFG ABDE ABE ABD ABDE ABEF ABE ABCDEF AB B ABDF ABE ABEF ABCDEFG ABDF ABE ADFG ABDF ABCDEF ABCDEF ABED ABCDEF ABDG AC ADEF ABDEF ABDEF A ABDEF ABDE ABE ABD ABDEF ABE

cnw5l03 cnw5r01 cnw5r02 cnw5r02 cnw6l02 cnw6l03 cnw6l04 cnw6l05 cnw6l06 cnw6r01 cnw6r02 cnw6r03 cnw6r04 cnw6r05 cnw6r06 cnw7l02 cnw7l05 cnw7r01 cnw7r02 cnw7r03 cnw7r05 cnw7r06 cnw8l01 cnw8r01 cnw8r02 cnw1r01 cnw1r02 cnw1r04 cnw1r05 cnw1r06 cnw2r02 cnw2r03 cnw2r04 cnw2r05 cnw2r06 cnw3r02 cnw3r03 cnw3r04 cnw3r05 cnw3r06 cnw4r02 cnw4r03 cnw4r04

2 2 1 2 2 1 1 1 1 2 2 2 2 2 2 2 1 2 1 1 1 2 1 1 2 2 1 1 2 2 2 1 1 2 1 1 2 2 2 2 2 2 2

170 160 168 170 160 181 175 174 162 154 166 155 153 160 164 160 174 155 168 181 166 164 160 174 172 154 169 169 153 160 156 173 168 155 170 162 161 154 155 155 153 150 152.5

57 49 65 57 50 63 53 60 52 54 54 43 45 48 46 46 70 55 60 60 60 46 50 70 53 49 64 67 50 50 46 62 57 45 60 56 50 48 46 51 50 48 46

8.5 4.2 9.2 8.5 4 3.5 20 6.5 4.7 10 4.5 5.4 5.4 5 7.4 8 7 8 10 10 7 7.4 9 8 5 4.2 10.4 15 10 3.6 4 7.5 8.9 6 7 6.3 7 5 6 5 3.5 5 5.2

c b a c b b a b b a c c c a b b b c c c c b c a c C B A B A A B B B C C B C B A C A A

AB ABDE ABDEF AD ABE ADEF AB AD ABE ABDF ABDF ABEF EG AB ABEF A ADF AB ABEF ABE ABDE ABEF ADF ADEG ABE ABDEF ABDE ABDEFG ABCD ABE ADG ABFG ABDF ABD ABD ABD ABE ABE ABDF ABDEG BE ABDE ADE

cnw4r05 cnw4r06 cnw5r01 cnw5r02 cnw5r03 cnw5r04 cnw5r05 cnw5r06 cnw6r01 cnw6r02 cnw6r03 cnw6r04 cnw6r05 cnw7r01 cnw7r02 cnw7r03 cnw7r05 cnw8r02 cnw8r03 cnw8r04 cnw1l01 cnw1l02 cnw1l03 cnw1l04 cnw1l05 cnw2l02 cnw2l03 cnw2l04 cnw2l05 cnw3l01 cnw3l02 cnw4l01 cnw4l02 cnw4l04 cnw4l05 cnw5l01 cnw5l02 cnw5l04 cnw6l01 cnw6l02 cnw6l03 cnw6l04 cnw6l05

1 1 1 1 2 2 1 1 2 1 2 1 1 1 1 1 2 1 2 2 1 2 2 2 2 2 2 2 2 2 1 2 1 1 2 2 1 1 1 2 2 1 2

185 170 173 168 160 155 168 173 158 175 155 162 173 175 172 172 151 167 160 170 165 152 162 157 150 170 155 163 150 153 165 160 170 165 155 160 179 170 170 160 155 170 165

70 58 62 50 50 42 55 61 50 61 44 60 64 86 62 65 48 50 50 65 47 44 49.5 52 45 55 47 48 47.5 46 54 52 65 51 42 45 63 67 58 54 48 65 47

7.5 6.5 6 6.1 7 6 7 8 8.1 10.5 11 10 15 11 12 6.3 7 9 5 10 7.3 4.2 4.5 3.2 3.8 4.9 5.9 5.8 8 4 35 12.4 5 5 8 7 10 9 9.6 5.5 4.4 10 7

A B B A C B B B C B C C C C B B B B B B B B B B A B B A A B A A A B B C C C B C A C C

ABDG AD ABDE ABDE ABCEF ABDF ADF ABD ADF ABDE ABDE ADF ADF ABE ABEG ABEG ABDEFG ABDEF ABDEFG ABDEFG AB AB ABE ABE ABE ADF ABDF ADFG ABE ABDFG ADF ABDF D AF ABCDE ABDF ABDF ADF ABCDEF ABCDEF ABCDEF ABCDEF ABDF

cnw7l01 cnw7l02 cnw7l03 cnw7l04 cnw7l05 cnw8l01 cnw8l02 cnw8l03

2 1 1 2 2 1 2 2

150 160 175 163 165 160 154 160

48 50 66 51 57 60 50 60

5.8 7 10 8 4.9 10 4.3 7

C A A B A B A A

ABE ABCDEF ABCDEF ABD ABD ABE BE ABDEF

(彭斌 2010-5-29 整理)