多元统计分析方法练习题 下载本文

(3)计算生存大于2个单位时间的概率。

8-2设一组病人的生存分布服从^一0.8,m-3的Weibull分布。请: (1)画出生存函数曲线和危险度函数曲线; (2)估计平均生存时间;

、 (3)计算生存大于1个单位时间的概率。

8-3为了比较药品6-疏嘌呤(6-MP)与一种安慰剂在缓解血癌患者的痛苦方面的疗效,请定义生存时间和死亡

事件。如每组分别观察了21名患者,缓解的时间(周)如下。其中带星号为截尾。试进行分析和比较。(资料

来源:JF Lawless(茆诗松等译)寿命数据中的统计模型与方法,P5)

6-MP组:6,6,6,6+,7,9“,10,10’,11’,13, 16, 17*, 19*, 20’,22, 23, 25*, 32*, 32’,34*, 35*

安慰剂:1,1,2,2,3,4,4,5,5,8,8,8,8, 11, 11, 12, 1^2, 15,117, 22, 23

8-4在深度的静脉血栓形成的研究中,20名病人的血凝块渐退时间(小时)如下(资料来源:ET Lee(陈家鼎等

诨)生存数据的统计方法,P268):

2,3,4,5,5,9, 13, 16.5,17.5,12.5,7,6,17.5,6,14, 25, 49, 37.5,49, 28 (l)拟合指数分布; (2)拟合Weibull分布; (3)何种分布模型较好?

8-5对例8.8资料建立指数回归和Weibull回归,并与Cox回归模型进行比较。 8-6对例8.7资料用逐步回归方法建立Cox模型。

8-7有33位患肾上腺样瘤的病人接手化学疗法、免疫疗法及激素疗法的综合治疗。资料如下。试对该资料进行

分析。其中,age表示年龄;gender表示性别,F表示女性,M女性男性;tiem0和timel分布表示开始治疗和

终止治疗的时间;response是对治疗的反应,O表示无反应,1表示完全反应,2表示部分反应,3表示稳定;其余5个指标是皮肤试验的反应面积,ND表示没有做

age gender time0 response time1 outcome Monilia Mumps PPD 53 F 03/31/77 1 11/01/77 0 7 X 7 23 X 23 0 X 0 61 M 06/18/76 0 08/21/76 1 10 X 10 15 X 20 0 X 0 56 F 02/01/77 3 10/01/77 0 0 X 0 7 X 7 0 X 0 48 M 12/19/74 2 01/15/76 1 0 X 0 0 X 0 0 X 0 55 M 11/10/75 0 01/15/76 1 12 X 12 ND 10 X 10 62 F 10/07/74 2 04/05/75 1 10 X 10 5 X 5 0 X 0 57 M 10/28/74 0 01/06/75 1 15 X 15 15 X 15 0 X 0 53 M 10/06/75 2 06/18/77 1 0 X 0 ND 0 X 0 45 M 04/11/77 0 10/01/77 0 6 X 4 4 X 4 0 X 0 58 M 08/04/76 3 02/11/77 1 13 X13 13 X 13 22 X 22 61 F 01/01/77 3 10/01/77 0 0 X 0 8 X 8 17 X 17 61

M 07/25/76 1 10/01/77 0 3 X 9 12 X 12 0 X 0

77 M 05/08/75 0 09/26/75 1 0 X 0 0 X 0 0 X 0 55 M

04/27/77 2

10/01/77 0

0 X 0

0 X 0

15 X 15 PHA 25 X13 X25 X0 X 8 X 7 X 0 X 12 X0 X 23 X11 X20 X

0 X 10 X

50 42 50 66 58 62 71 44 69 M M F F M M F M M 04/20/77 3 08/24/76 0 01/08/75 0 09/08/76 3 02/18/75 0 05/12/76 0 10/22/76 3 06/06/77 3 06/21/76 0 10/01/77 0 10/01/77 0 06/30/75 1 10/01/77 0 10/01/77 0 10/17/76 1 12/12/76 1 10/01/77 0 10/13/76 1 0 X 0 11 X 11 0 X 0 9 X 9 0 X 0 2 X 2 10 X 10 10 X 10 0 X 0 14 X 14 7 X 7 0 X 0 10 X 10 0 X 0 ND 6 X 6 10 X 10 15 X 15 5 X 5 0 X 0 0 X 0 6 X 6 0 X 0 ND 0 X 0 0 X 0 25 X 25 32 X12 X0 X 15 X0 X 3 X 12 X20 X25 X56 M 06/07/77 2 10/01/77 0 0 X 0 7 X 7 0 X 0 57 M 11/16/76 0 12/10/76 1 11 X 11 5 X 5 0 X 0 69 M 05/10/77 0 07/25/77 1 0 X 0 0 X 0 0 X 0 60 M 06/29/77 0 07/07/77 1 0 X 0 0 X 0 0 X 0 60 M 07/21/75 3 10/01/77 0 11 X 11 20 X 20 10 X 10 72 M 07/19/75 0 10/18/75 1 10 X 10 0 X 0 7 X 7 42 F 03/03/75 0 04/23/75 1 0 X 0 ND 0 X 0 57 M 02/24/77 2 10/01/77 0 5 X 5 8 X 8 0 X 0 66 M 06/15/77 3 10/01/77 0 0 X 0 15 X 15 0 X 0 59

M 03/04/77 0 04/02/77 1 0 X 0 0 X 0 0 X 0

第9章

9-1 选择何种标准进行聚类分析,要依具体数据的实际背景来决定,标准选择是否得当,

对于聚类分析效果有直接影响。已知一个二维正态分布总体有分布:

N?????0???,??10.9??现在有两点A??1,1??和B??0??0.91????1,?1??。若按欧氏距离距离计算,点?A与点B到均数的距离同为2。若按马氏距离计算,是否也一样?

9-2 欲以能耗、糖耗将运动项目分类,以便针对不同能耗、糖耗的运动提供不同膳食,使

运动员既能得到能量的补充,又不造成多余的脂肪堆积。某单位对上海划船队6名运动员作了能量代谢测定,得13个项目的平均数如下,试进行分析。 运动项目 变量名 能耗(焦耳/分、M2) 糖耗(%) 负重下蹲 X1 27.892 61.42 高力翻 X2 26.356 56.78 提铃 X3 23.680 74.07 引体向上 X4 23.475 56.83 腰腹转 X5 22.818 84.53 手脚并举 X6 22.483 81.23 仰卧蹬腿 X7 22.236 56.10 快挺 X8 20.762 62.92 趴拉 X9 20.762 58.95 卧推 X10 13.716 69.63 俯卧撑 X11 18.924 45.13 0 X 20 X15 X26 X18 X10 X0 X 25 X10 X16 X

曲臂 X12 17.970 60.63 仰卧起坐 X13 20.913 61.25 9—3 练习4—1的资料进行变量聚类

答案:

1.1 X与Y的二元正态分布函数:

f?x,y??12?0.152*7.522*?1?0.52192????x?1.47?2?y?176.55?21???x?1.47??y?176.55???exp????2?0.5219?????????????20.157.520.157.5221?0.5219??????????????????TITLE’绘制二元正态分布曲面’;

GOPTIONS RESET=GLOBAL GUNIT=PCT NOBORDER FTEXT=SWISSB HTITLE=6 HTEXT=3; DATA ex1_1;

S1=0.15**2;s2=7.52**2;r=0.5219;pi=3.14159265359; DO x=-0.5 TO 0.5 BY 0.02; DO y=-20 TO 20 BY 0.25;

z=1/(2*pi*SQRT(s1*s2*(1-r*r)))*EXP(-1/2/(1-r*r)*(x*x/s1+y*y/s2-2*r*x*y/SQRT(s1*s2))); OUTPUT; END; END; RUN;

/*title ‘Bivariable Normal Surface’;*/ PROC G3D;

PLOT x*y=z/ROTATE=135 XTICKNUM=9 YTICKNUM=11 ZMAX=0.2 ZTICKNUM=5; RUN;

1.2 三元正态分布的密度函数:

??83.39???30.530???1??????x??70.26???25.53638.859?2???19.53220.70327.363???91.52??????'?1f(X)=130.5303/2?2???25.53639.85919.53220.70327.36312e??83.39???????x??70.26????91.52??????

1.3 证明:

令X???x1???1??= ??? x?2???2???11?12?=???21?22?设??'X???AY~N2??,?,? ??Y~(01)则Z?X???''''??????1?'?11????'?AY?0??A???Y~N2?0,?A???A???

??????????????????????1??1?'??1?'1'?1?'1?1?'其中?A???A???AA??????

???????????????????1则z~N2?0,????1???????''?得证。 ???1.4 思路:x与y的90%参考值范围是下列方程的解:

11-0.5806222?x?165.8338??y?53.5694??y?53.5694?????x?165.8338???2?0.5806?????4.61224.915504.9155?4.89214.8921????1.5 证明:记si,sii分别表示变量Xi的标准差和方差,因Xi的Xj的相关系数rij及协方差sij有如下关系:

sij?rijsisj

则:

?s11?sS??21???sm1?s1?0?????0故得:S??s11s22s12s22sm2s1m??s11?ssrs2m????2121????smm??sms1rm10??r11?r0???21????sm??rm1r12r22rm2s1s2r12s22sms2rm2r1m??s1?0r2m???????rmm??00s20s1smr1m?s2sms2m????smm?

0s200?0????sm?smm?R。

练习2.1

Title‘样本均向量与总体均向量的比较’; DATA ex2_1;

INPUT x1 x2 x3 @@;

Y1=x1-4 ; y2=x2-50; y3=x3-10; Cards;

3.7 48.5 9.3 3.9 36.9 12.7 ………..

5.4 54.1 11.3 5.5 40.9 9.4 ;

Proc anova;