这就是在证据E肯定出现时,把结论H的先验概率P(H)更新为后验概率P(H/E)的计算公式。
证据肯定不出现的情况
在证据肯定不出现时,P(E)=P(E/S)=0,P(~E)=1。 由Bayes公式可得:
P(~E/H)×P(H)
P(H/~E) =
P(~E)
P(~E/~H)×P(~H)
P(~H/~E) =
P(~E)
由以上两式,可得:
P(H) P(H/~E) P(~E/H)×P(H) P~(E/H)
= = (*) ×
P(~H/~E) P(~E/~H)×P(~H) P(~E/~H) P(~H) 由LN的定义,以及概率与几率的关系式,可将上式改写为: O(H/~E)=LN×O(H)
这就是在证据E肯定不出现时,把先验几率O(H)更新为后验几率O(H/~E)的计算公式。 把几率换算成概率有:
LN×P(H)
P(H/~E) =
(LN-1)×P(H)+1
这就是在证据E肯定不出现时,把结论H的先验概率P(H)更新为后验概率P(H/~E)的计算公式。
关于知识规则强度(LS, LN)的意义的讨论 (1)充分性量度LS的讨论
1) 当LS>1时,有O(H/E)>O(H),再由P(x)与O(x)具有相同单调性的特性,可得P(H/E)>P(H),这表明,当LS>1时,由于证据E的出现,将增大结论H为真的概率,而且LS越大,P(H/E)就越大,即E对H为真的支持越强。当LS→∞时,O(H/E)→∞,即P(H/E)→1,表明由于证据E的出现,将导致H为真。由此可见,E的出现对H为真是充分的,故称LS为充分性量度。 2) 当LS=1时,有O(H/E)=O(H),这表明E与H无关。
3) 当LS<1时,有O(H/E) 领域专家在为LS赋值时,可参考上面的讨论,当证据E愈是支持H为真时,则使相应LS的值愈大。 (2) 必要性量度LN的讨论 1) 当LN>1时,有O(H/~E)>O(H),再由P(x)与O(x)具有相同单调性的特性,可得P(H/~E)>P(H),这表明,当LN>1时,由于证据E的不出现,将增大结论H为真的概率,而且LN越大,P(H/~E)就越大,即~E对H为真的支持越强。当LN→∞时,O(H/~E)→∞,即P(H/~E)→1,表明由于证据E的不出现,将导致H为真。 2) 当LN=1时,有O(H/~E)=O(H),这表明~E与H无关。 3) 当LN<1时,有O(H/~E) 领域专家在为LN赋值时,可参考上面的讨论,当证据E对H愈是必要时,则相应LN的值愈小。 (3) 为LS和LN赋值时的考虑 13 在实际系统中,LS和LN的值均是由领域专家根据经验给出的,而不是由LS和LN计算出来的。 ? 当证据E愈是支持H为真时,则LS的值应该愈大;当证据E对H愈是重要时,则相应的LN的 值应该愈小。 ? 由于E和~E不可能同时支持H或反对H,所以领域专家在为一条知识中的LS和LN赋值时, 一般不应该同时大于1(即LS>1,LN>1)或同时小于1(即LS<1,LN<1)。即只有三种情况: LS>1且LN<1 或 LS<1且LN>1 或 LS=LN=1 如果LS>1,则: LS>1 ? P(E/H)/P(E/~H) >1 ? P(E/H)>P(E/~H) ? 1-P(E/H)<1-P(E/~H) ? P(~E/H) 例:设有如下知识: r1:IF E1 THEN (1, 0.003) H1 (0.4) r2:IF E2 THEN (18, 1) H2 (0.06) r3:IF E3 THEN (12, 1) H3 (0.04) 求:当证据E1,E2,E3出现及不出现时,P(Hi/Ei)及P(Hi/~Ei)的值各是多少? 解:由于规则中,LS=1,所以证据E1的出现对H1无影响,不需要计算P(H1/E1),但因为它的LN<1,所以当E1不出现时需计算P(H1/~E1)。 LN×P(H1) P(H1/~E1) = (LN-1)×P(H1)+1 0.003×0.4 = (0.003-1)×0.4+1 = 0.002 可以看出,由于E1不出现使H1为真的可能性削弱了近200倍。 在规则r2和r3中,由于LN=1,所以E2与E3不出现时对H2和H3不产生影响,即不需要计算P(H2/~E2)和P(H3/~E3),但因它们的LS>1,所以在与出现时需要计算P(H2/E2)和P(H3/E3)。 LS×P(H2) P(H2/E2) = (LS-1)×P(H2)+1 18×0.06 = (18-1)×0.0.06+1 = 0.535 LS×P(H3) P(H3/E3) = (LS-1)×P(H3)+1 12×0.04 = (12-1)×0.0.04+1 = 0.333 可以看出,由于E2的出现使H2为真的可能性增加了8.92倍。由于E3的出现使H3为真的可能性增加了8.325倍 2、不确定性证据 14 在现实中,证据更多的是介于肯定出现和肯定不出现之间,因为: (1) 对初始证据来说,由于用户对客观事物或现象的观察是不精确的,因而所提供的证据是不确 定的; (2) 一条知识的证据往往来源于另一条知识推出的结论,一般具有某种程度的不确定性。 分两种情况讨论: 用概率表示证据的不确定性: 设在观察S之下,用户可以以概率P(E/S)表达证据E为真的程度,例如,用户告知只有70%的把握说明证据E是真的,这就表示初始证据E为真的程度为0.7,即P(E/S)=0.7(S是对E的有关观察);现在要在0 P(H/S)?P(H/E)?P(E/S)?P(H/~E)?P(~E/S) (*) 说明:上述公式已由R. O. Duda等人于1976年作了证明,实际上反映了在观察S下,证据概率P(E/S) 与结论概率P(H/S)之间的关系。 讨论: (1) P(E/S)=1。当P(E/S)=1时,P(~E/S)=0。因而,P(H/S)=P(H/E)。 这实际上是证据肯定出现的情况。 (2) P(E/S)=0。当P(E/S)= 0时,P(~E/S)= 1。因而,P(H/S)=P(H/~E)。 这实际上是证据肯定不出现的情况。 (3) P(E/S)=P(E)。当P(E/S)=P(E)时,表示E与S无关,因而,P(H/S)=P(H)。 以上得到P(H/S)对于P(E/S)的函数关系在三个特殊点P(E/S)=0,P(E),1上的取值。利用分段线性插值俴,得到P(E/S)的函数P(H/S)的解析表达式: P(H)?P(H/?E)?当0?P(E/S)?P(E)?P(E/S)?P(H/?E)?P(E)? P(H/S)??P(H/E)?P(H)?P(H)??[P(E/S)?P(E)]当P(E?)P(E/?S1)?1?P(E)?上述公式称为EH公式。(利用这一公式可以计算P(H/S)的值) 用可信度表示证据的不确定性 为了便于用户使用,对于初始证据,会话时用户可以用可信度C(E/S)来告知P(E/S)。此时只要把P(E/S)与C(E/S)的对应关系转换公式代入EH公式,得到用可信度C(E/S)计算P(H/S)的公式: 1?P(H/?E)?[P(H)?P(H/?E)]?[C(E/s)?1]当C(E/S)?0??5 P(H/S)??1?P(H)?[P(H/E)?P(H)]?C(E/S)当C(E/S)?0?5?上述公式称为CP公式。 说明:当用初始证据进行推理时,根据用户告知的C(E/S),通过运用CP公式就可求出P(H/S);当用 推理过程中得到的中间结论作为证据进行推进时,通过运用EH公式就可求出P(H/S)。 (六)结论不确定性的合成与更新算法 结论不确定性的合成算法 若有n条知识都支持相同的结论,而且每条知识的前提条件所对应的证据Ei(i?1,2,?,n)都有相应的观察Si与之对应,此时只要先对每条知识分别求出O(H/Si),然后就可运用下述公式求出 15 O(H/S1,S2,?,Sn),再求得P(H/S1,S2,?,Sn)。 O(H/S1) O(H) O(H) O(H/S1,S2,?,Sn) 1+ O(H/S1,S2,?,Sn) × O(H/S2) × ? × O(H/Sn) O(H) × O(H) O(H/S1,S2,?,Sn) = P(H/S1,S2,?,Sn) = 结论不确定性的更新算法 若有n条知识都支持相同的结论,也可以利用类似于前面学习的结论更新算法求得结论的后验概率。其思想是首先利用第一条规则对结论的先验概率进行更新,再把得到的更新概率当作第二条规则的先验概率;再用第二条知识对其进行更新,把更新后得到的值作为第三条知识的先验概率;再使用第三条知识对结论的概率进行更新?。这样继续更新直到所有的规则使用完。 (七)主观Bayes方法应用举例 例:设有如下知识 r1:IF A1 THEN (20, 1) B r2:IF A2 THEN (300, 1) B r3:IF A3 THEN (75, 1) B r4:IF A4 THEN (4, 1) B 已知:结论B的先验概率P(B)=0.03。 当证据A1,A2,A3,A4必然发生后,求结论B的概率变化。 解法一 利用合成算法求结论B的后验概率。 根据已有知识建立推理网络如图所示。 由图可以看出,结论B由四个证据A1,A2,A3,A4同时支持,所以结论B的概率可由四条知识共同合成推出。为此需要对每条知识推出其相应证据对结论B的几率的更新值。由于已知结论B的先验概率为P(B)=0.03,所以依据规则r1: P(B/A1)?LS1?P(B)20?0.03??0.382 (LS1?1)?P(B)?119?0.03?1P(B/A1)0.382??0.61855 1?P(B/A1)1?0.382LS2?P(B)300?0.03??0.903 (LS2?1)?P(B)?1299?0.03?1P(B/A2)0.903??9.309 1?P(B/A2)1?0.903LS3?P(B)75?0.03??0.699 (LS3?1)?P(B)?174?0.03?1P(B/A3)0.699??2.32 1?P(B/A3)1?0.69916 O(B/A1)?依据规则r2: P(B/A2)?O(B/A2)?依据规则r3: P(B/A3)?O(B/A3)?