D04 常用概率分布(定稿) 下载本文

第五章 常用概率分布

第四章 常用概率分布

随机变量(random variable)的性质取决于它的分布规律。本章介绍三个最常用的理论分布,包括离散型变量的二项分布(binomial distribution)与Poisson分布(Poisson distribution),以及连续型变量的正态分布(normal distribution)。医学研究中的很多随机现象可以用这三种分布之一进行描述。为便于教学,读者需要复习高等数学课程中已经学过的概率论基本知识。

第一节 二项分布 一、二项分布的概念与特征

先看一个小实验。一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行盲法摸球游戏,每次摸1球,然后放回再摸。如此重复。先后摸5次,摸到黄球的次数可能是0次,可能是1次、2次等,也可能5次都摸到黄球。请问摸到黄球的次数为0的概率有多大?摸到黄球的次数为1的概率有多大?摸到黄球的次数为2的概率有多大?5次均摸到黄球的概率又是多大呢?你会算吗?

在这个实验中,由于黄球的比例是2/5,白球的比例是3/5。又,该实验为有放回的实验,因此每一次摸到黄球的概率是0.4,摸到白球的概率是0.6。如果5次里前X次摸到的是黄球,以后5-X次摸到的是白球,相应的概率是0.4X0.65?X。因为摸到黄球可能发生在5次中的任意X次中,因此5次里有X次摸到黄球的概率为C5X0.4X0.65?X。其中,C5X表示“5取X的组合数”。该实验有三个特点:① 各次摸球是彼此独立的;② 每次摸球只有二种可能的结果,或黄球或白球;③ 每次摸到黄球(或摸到白球)的概率是固定的。具备以上三点,n次中有X次摸到黄球的概率分布就是二项分布。

例4-1 用针灸治疗头痛,假定结果只有两种可能,不是“有效”就是“无效”,每一例有效的概率为π。某医生用此方法治疗头痛患者3例,2例有效的概率是多少?

用Ai表示第i例有效,Ai表示第i例无效。因为每例有效的概率相同,且各例的治疗结果之间彼此独立,3例患者中可以是其中的任意2例有效,所以3例

1

第五章 常用概率分布

中2例有效的概率为:

P(A1A2A3)?P(A1A2A3)?P(A1A2A3)?C?(1??)232

推而广之,医学研究中很多现象的观察结果是以两分类变量来表示的,如阳性与阴性,治愈与未愈,生存与死亡等。如果每个观察对象阳性结果的发生概率均为?,阴性结果的发生概率均为(1-?);且各个观察对象的结果是相互独立的,那么,重复观察n个对象,发生阳性结果的次数X的概率分布服从二项分布,记作B(n,?)。

二项分布的概率函数P(X)可用公式(4-1)来计算。

P(X)?CnX?X(1??)n?X (4-1)

其中

CnX?n!X!(n?X)! (4-2)

!为阶乘符号,n!?n(n?1)(n?2)?1,如3!=3×2×1,0!定义为1。

例4-2 如果例4-1中?=0.6,随机治疗3例,有效例数为0例、1例、2例和3例的概率各多大?1例及以上有效的概率多大?

根据(4-1)式,0例有效的概率为

00.60(1?0.6)(3?0)?0.43?0.064 C31例及以上有效的概率可表示为

P(X?1)?P(1)?P(2)?P(3)?0.288?0.432?0.216?0.936

同理,可算得有效例数分别为1、2和3的概率,见表4-1。

表4-1 治疗3例可能的有效例数及其概率

有效人数(X)

0

1 2 3

C3X

1 3 3 1

?X

0.60 0.6 0.6×0.6 0.6×0.6×0.6

(1-?)n-X 0.4×0.4×0.4

0.4×0.4 0.4 0.40

出现该结果的概率P(X)

0.064 0.288 0.432 0.216

由表4-1可知,由于只有4种可能结果,各种可能结果出现的概率之和为1,即?P?X??1。据此,1例及以上有效的概率又可表示为

P(X?1)?1?P(0)?1?0.064?0.936

2

第五章 常用概率分布

两者结果相同。

(三)二项分布的特征

二项分布的特征由二项分布的参数?以及观察的次数n决定。 1.二项分布的图形特征

在n次独立重复的试验中,若某事件发生的概率为?,则该事件的发生次数X服从二项分布。用图形表示,以X为横轴,以对应于X的概率P(X)为纵轴,对所有可能的X (0≤X≤n) 分别用垂直于横轴、长度为P(X)的线段表示相应的概率,得二项分布图。

从图形可知,二项分布的高峰在?=n?处或附近;? 为0.5时,图形是对称的;当?不等于0.5时,分布不对称,且对同一n,? 离0.5愈远,对称性愈差。对同一?,随着n的增大,分布趋于对称。当n→∞时,只要?不太靠近0或1,(特别是当n?和n(1-?)均大于5时),二项分布趋于对称。

P(x) 0.4 0.3 0.2 0.1 0.0

0 1 2 3

P(x) 0.4 0.3 0.2 0.1 0.0

0 1 2 3 4 5 6 7 8 9 10 11 12 13

n=3,π=0.5 n=10,π=0.5

图4-1 π=0.5时,不同n值对应的二项分布

3

第五章 常用概率分布

P(x) 0.4 0.3 0.2 0.1

P(x) 0.4 0.3 0.2 0.1

0 1 2 3

0.0

0.0

0 1 2 3 4 5 6

P(x) 0.4 0.3 0.2 0.1 0.0

0 1 2 3 4 5 6 7 8 9 10

P(x) 0.4 0.3 0.2 0.1

0.0

0 1 2 3 4 5 6 7 8 9 1011 1 213 14 1 5

图4-2 π=0.3时,不同n值对应的二项分布

图4-1和图4-2 给出了?=0.5和 ?=0.3时不同n值对应的二项分布图。 2.二项分布的均数和标准差 例4-3 求例4-2资料的均数和方差。

在例4-2中,总共治疗三个患者 n=3,有效概率? =0.6,有效的人数可能为0个人,1个人,2个人或3个人,对应的概率分别为0.064,0.288,0.432和0.216。根据总体均数(又称数学期望,下略)和方差的定义,有效人数的均数为

E(X)??XP(X)?0?0.064?1?0.288?2?0.432?3?0.216?1.80

方差为

Var(X)?E?X?E(X)????X?E(X)?P(X)?(0?1.80)2?0.064?(1?1.80)2?0.288?...?(3?1.80)2?0.216?0.7222

事实上对于任何二项分布问题,如果每一次试验出现阳性结果的概率均为,?,进行n次独立重复试验,出现X次阳性结果,那么,可以证明(见附录)X的总体均数为

??n? (4-3)

4