第五章 常用概率分布
方差为
?2?n?(1??) (4-4) 标准差为
??n?(1??) (4-5)
若将出现阳性结果的频率记为
p?X n则p的总体均数、方差、标准差分别为
?p?? (4-6)
2?p??(1??)nn (4-7)
?p??(1??) (4-8)
式中?p是频率p的标准差,又称频率的标准误,它反映阳性频率的抽样误差的大小。
例4-4 已知某地钩虫感染率为6.7%,如果随机抽查150人,记样本钩虫感染率为p,求p的标准误?p。
本例n?150,??0.067,按(4-8)式
?p?0.067(1?0.067)?0.020?2.0%
150
二、二项分布的应用
1. 概率估计
例4-5 如果某地钩虫感染率为13%,随机观察当地150人,其中恰好有10人感染钩虫的概率有多大?
因为人与人之间钩虫感染与否可假设为相互独立的,感染钩虫的人数X可认为服从n=150,π=0.13的二项分布,由公式(4-1)和(4-2), 可以得出150人中恰有10人感染钩虫的概率为
5
第五章 常用概率分布
P(X?10)?150!0.1310?0.87140?0.0055
10!(150?10)!2. 累积概率计算
单纯计算二项分布X取某值时的概率往往没有太大意义,实际上经常需要计算的是二项分布的累积概率。
二项分布出现阳性的次数至多为K次的概率为
P(X?K)??P(X)??X?0Kn!?X(1??)n?X (4-9)
X?0X!(n?X)!K出现阳性的次数至少为k次的概率为
P(X?k)??P(X)??X?kX?knnn!?X(1??)n?X (4-10)
X!(n?X)!同理,可以计算阳性的次数至少为k次至多为K次的概率(k P(k?X?K)??P(X)??X?kX?kKKn!?X(1??)n?X (4-11) X!(n?X)! 例4-6 续例4-5。随机抽查当地150人,其中最多有2名感染钩虫的概率有多大?至少有2名感染钩虫的概率有多大?至少有20名感染钩虫的概率有多大? 根据公式(4-9)最多有2名感染钩虫的概率为 P(X?2)??P(X)??X?022X?0n!?X(1??)n?XX!(n?X)! ?8.47?10?10?1.80?10?8?2.11?10?7 ?2.30?10?7 根据公式(4-10)至少有2名感染钩虫的概率为 150!0.13X(1?0.13)150?XX?2X?2X!(150?X)! ?1?[P(X?0)?P(X?1)]P(X?2)??P(X)?? ?1?[8.47?10?10?1.80?10?8] ?1150150至少有20名感染钩虫的概率为 6 第五章 常用概率分布 P(X?20)?X?20?P(X)? 1??P(X)X?01915019150!0.13X(1?0.13)150?X X?0X!(150?X)! ?0.4880 ?1?? 上式若直接用手工计算工作量很大,这里是用SAS程序计算的(见电脑实验)。 第二节 Poisson分布 一、Poisson分布的概念 Poisson分布也属离散型分布,用以描述单位时间、空间、面积等的罕见事件发生次数的概率分布。例如, 每毫升水中的大肠杆菌数、每个立升气体中粉尘的计数、单位时间(如1分钟)内放射性质点数等,均可视为Poisson分布。 医学研究中常以一定数量的人群为观察单位,例如,观察每1000个新生儿中某出生缺陷、多胞胎、染色体异常等事件出现的例数,由于这些事件都是罕见的,可以近似认为是服从Poisson分布的。在随访研究中,要估计某疾病的年患病率,则以人年(person-year)为观察单位,例如, 观察每10000人年中,某疾病的发生例数。这些均可认为是近似服从Poisson分布的。 Poisson分布一般记作P(?)。其中,?为Poisson分布的唯一参数。 二、Poisson分布的特征 Poisson分布的特征由其参数?唯一确定。Poisson分布的概率函数为 P(X)?e???XX! (4-12) 式中,?为Poisson分布的总体均数,X为观察单位内某稀有事件的发生次数;e为自然对数的底,为常数,约等于2.71828。例如,某地20年间共出生肢短畸形儿10名(假设年出生人数大致相同),则平均每年出生肢短畸形儿0.5名。就可用 ??0.5(观察单位为年),代入Poisson分布的概率函数式来估计该地每年出生此 类畸形人数为0,1,2,…的概率P(X)(见表4-2): 表4-2 某地每年出生肢短畸形儿概率分布 7 第五章 常用概率分布 X P(X) 0 0.607 1 0.303 2 0.076 3 0.013 4 0.002 5 0.000 以事件发生数X为横轴,以对应于X的概率P(X)为纵轴,对所有可能的X (X≥0)分别绘制垂直于横轴,高度为P(X) 的线段,得Poisson分布图。 8