D04 常用概率分布(定稿) 下载本文

第五章 常用概率分布

方差为

?2?n?(1??) (4-4) 标准差为

??n?(1??) (4-5)

若将出现阳性结果的频率记为

p?X n则p的总体均数、方差、标准差分别为

?p?? (4-6)

2?p??(1??)nn (4-7)

?p??(1??) (4-8)

式中?p是频率p的标准差,又称频率的标准误,它反映阳性频率的抽样误差的大小。

例4-4 已知某地钩虫感染率为6.7%,如果随机抽查150人,记样本钩虫感染率为p,求p的标准误?p。

本例n?150,??0.067,按(4-8)式

?p?0.067(1?0.067)?0.020?2.0%

150

二、二项分布的应用

1. 概率估计

例4-5 如果某地钩虫感染率为13%,随机观察当地150人,其中恰好有10人感染钩虫的概率有多大?

因为人与人之间钩虫感染与否可假设为相互独立的,感染钩虫的人数X可认为服从n=150,π=0.13的二项分布,由公式(4-1)和(4-2), 可以得出150人中恰有10人感染钩虫的概率为

5

第五章 常用概率分布

P(X?10)?150!0.1310?0.87140?0.0055

10!(150?10)!2. 累积概率计算

单纯计算二项分布X取某值时的概率往往没有太大意义,实际上经常需要计算的是二项分布的累积概率。

二项分布出现阳性的次数至多为K次的概率为

P(X?K)??P(X)??X?0Kn!?X(1??)n?X (4-9)

X?0X!(n?X)!K出现阳性的次数至少为k次的概率为

P(X?k)??P(X)??X?kX?knnn!?X(1??)n?X (4-10)

X!(n?X)!同理,可以计算阳性的次数至少为k次至多为K次的概率(k

P(k?X?K)??P(X)??X?kX?kKKn!?X(1??)n?X (4-11)

X!(n?X)! 例4-6 续例4-5。随机抽查当地150人,其中最多有2名感染钩虫的概率有多大?至少有2名感染钩虫的概率有多大?至少有20名感染钩虫的概率有多大?

根据公式(4-9)最多有2名感染钩虫的概率为

P(X?2)??P(X)??X?022X?0n!?X(1??)n?XX!(n?X)! ?8.47?10?10?1.80?10?8?2.11?10?7 ?2.30?10?7

根据公式(4-10)至少有2名感染钩虫的概率为

150!0.13X(1?0.13)150?XX?2X?2X!(150?X)! ?1?[P(X?0)?P(X?1)]P(X?2)??P(X)?? ?1?[8.47?10?10?1.80?10?8] ?1150150至少有20名感染钩虫的概率为

6

第五章 常用概率分布

P(X?20)?X?20?P(X)? 1??P(X)X?01915019150!0.13X(1?0.13)150?X

X?0X!(150?X)! ?0.4880 ?1?? 上式若直接用手工计算工作量很大,这里是用SAS程序计算的(见电脑实验)。

第二节 Poisson分布 一、Poisson分布的概念

Poisson分布也属离散型分布,用以描述单位时间、空间、面积等的罕见事件发生次数的概率分布。例如, 每毫升水中的大肠杆菌数、每个立升气体中粉尘的计数、单位时间(如1分钟)内放射性质点数等,均可视为Poisson分布。

医学研究中常以一定数量的人群为观察单位,例如,观察每1000个新生儿中某出生缺陷、多胞胎、染色体异常等事件出现的例数,由于这些事件都是罕见的,可以近似认为是服从Poisson分布的。在随访研究中,要估计某疾病的年患病率,则以人年(person-year)为观察单位,例如, 观察每10000人年中,某疾病的发生例数。这些均可认为是近似服从Poisson分布的。

Poisson分布一般记作P(?)。其中,?为Poisson分布的唯一参数。

二、Poisson分布的特征

Poisson分布的特征由其参数?唯一确定。Poisson分布的概率函数为

P(X)?e???XX! (4-12)

式中,?为Poisson分布的总体均数,X为观察单位内某稀有事件的发生次数;e为自然对数的底,为常数,约等于2.71828。例如,某地20年间共出生肢短畸形儿10名(假设年出生人数大致相同),则平均每年出生肢短畸形儿0.5名。就可用

??0.5(观察单位为年),代入Poisson分布的概率函数式来估计该地每年出生此

类畸形人数为0,1,2,…的概率P(X)(见表4-2):

表4-2 某地每年出生肢短畸形儿概率分布

7

第五章 常用概率分布

X

P(X)

0 0.607 1 0.303 2 0.076 3 0.013 4 0.002 5 0.000

以事件发生数X为横轴,以对应于X的概率P(X)为纵轴,对所有可能的X (X≥0)分别绘制垂直于横轴,高度为P(X) 的线段,得Poisson分布图。

8