不确定推理方法(四) 下载本文

主观Bayes方法又称为主观概率论。是由R.O.Duda等人于1976年提出的不确定推理模型,它是对概率论中基本Bayes公式的改进。是一种基于概率逻辑的方法。

(一)基本Bayes公式 Bayes公式

设事件B1,B2,?,Bn是彼此独立、互不相容的事情,B1?B2???Bn??(全集),且P(Bi)?0(i?1,2,?,n)。对于事件A能且只能与B1,B2,?,Bn中的一个同时发生,而且P(A)?0,则有:

P(Bi/A)?P(A/Bi)P(Bi)?P(A/B)P(B)jjj?1n

其中,P(Bi)是事件Bi的先验概率;P(A/Bi)是事件Bi发生条件下事件A的条件概率;P(Bi/A)是事件A发生条件下事件Bi的条件概率。

如果用产生式规则IF E THEN Hi 中的前提条件E代替Bayes公式中的A,用Hi代替公式中的Bi,就可得到:

P(Hi/E)?P(E/Hi)P(Hi)?P(E/H)P(H)jjj?1n

这就是说:当已知结论Hi的先验概率P(Hi)和已知结论Hi(i?1,2,?,n)成立时前提条件E所对应的证据出现的条件概率P(E/Hi),就可用上式求出相应证据出现时结论Hi的条件概率P(Hi/E)。

例:设H1,H2,H3分别是三个结论,E是支持这些结论的证据,且已知: P(H1)=0.4,P(H2)=0.5,P(H3)=0.2,P(E/ H1)=0.3,P(E/ H2)=0.4,P(E/ H3)=0.5 求:P(H1/ E),P(H2/ E)和P(H3/ E)的值各是多少。 解:根据上面的公式得

P(H1)×P(E/ H1)

P(H1/ E)=

P(H1)×P(E/ H1)+ P(H2)×P(E/ H2)+ P(H3)×P(E/ H3)

0.12

= =0.286

0.12+0.2+0.1

同理可得:P(H2/ E)=0.476,P(H3/ E)=0.238

由于证据E的出现,H3成立的可能性略有增加,H1,H2成立的可能性有不同程度的下降。

在有些情况下,有多个证据E1,E2,?,Em和多个结论H1,H2,?,Hn,并且每个证据都以一定程度支持结论,这时可对上面的式子进行扩充,得到:

P(E1/ Hi)×?×P(Em/ Hi)×P(Hi)

P(Hi / E1E2?Em) =

n

∑ P(E1/ Hj)×?×P(Em/ Hj)×P(Hj)

j=1

只要已知Hi的先验概率P(Hi)以及Hi成立时证据E1,E2,…,Em出现的条件概率P(E1/ Hi),…,P(Em/ Hi),就可计算出在E1,E2,…,Em出现情况下Hi的条件概率P(Hi / E1E2…Em)。

说明:

? 在实际应用中,有时这种方法是很有用的。例如,如果Hi(i=1,2,?,n)把当作一组可能发生的疾病,

把Ej(j=1,2,?,n)当作相应的症状,P(Hi)是从大量实践中经统计得到的疾病Hi发生的概率,P(Ej/ Hi)

9

是疾病Hi发生时观察到的症状Ej的条件概率,则当对某病人观察到有症状E1,E2,?,Em时,应用上述Bayes公式就可计算出P(Hi / E1E2?Em),从而得知病人患疾病Hi的可能性。

? 直接依据Bayes公式进行计算简单明了,并且它具有较强的理论背景和良好的数学特性。但是要

求H1,H2,?,Hn相互无关,而且还要求先验概率、条件概率,这实际上很难保证。所以在求解不确定问题时,还不能直接使用Bayes公式,而是使用对其经过改进的主观Bayes公式。

(二)主观Bayes方法及其推理网络

主观Bayes方法是由R.O.Duda等人于1976年提出的一种不确定推理模型,并在地矿勘探专家系统PROSPECTOR中得到了成功应用。

在PROSPECTOR系统中,为了进行不确定性推理,把所有的知识规则(或称决策规划)连接成一个有向图,图中的各节点代表假设的结论,弧则代表规则,并引入两个数值(LS,LN)与每一条弧相联系,用来度量规则成立的充分性和必要性。LS表示规则成立的充分性,LN表示规则成立的必要性。这样的有向图称为推理网络。

? 推理网络把一些证据和一些重要的假设结论连接起来。

? 图中的端点或“叶”节点是向用户提问获取的证据,其它节点是结论假设。虽然结论假设是一些

可真可假的陈述,但在给定的条件下,它们总是出现一个真或假的确定程度。

? 推理开始时,每一个陈述的真假是未知的。当获得一个证据后,有些结论就被明确地建立起来。

而其它结论也有了某种程度的接近,给每个结论H附上一个概率值P(H),称为先验概率;推理网络中的连接实际上就是测定一个结论的概率变化是如何地影响了其它结论。

? 在推理网络中,证据和结论是相对的;一个结论对于进一步的推理来说,可以把它看作证据;而

一个证据,对于其下一级的推理,又可以把它看作结论。

? 推理网络中的每一个节点H都有一个先验概率P(H),每条规则都有一个数值对(LS,LN)表示

规则强度。每条规则的(LS,LN)值以及每个节点的先验概率P(H)均由领域专家给出。

(三)知识不确定性的表示

在主观Bayes方法中,知识(规则)就是推理网络中的一条弧,它的不确定性是以一个数值对(LS,LN)来描述的。以产生式规则的形式表示,为:

IF E THEN (LS, LN) H (P(H)) 其中, (1)(LS, LN)是为度量产生式规则的不确定性而引入的一组数值,LS表示规则成立的充分性,用于指出证据E对结论H为真的支持程度;而LN则表示规则成立的必要性,用于指出证据E对结论H为真的必要性程度。它们的定义如下:

LS?P(E/H)P(?E/H)1?P(E/H) LN? ?P(E/?HP(?E/?H1?P(E/?H)LS和LN的取值范围为[0, +∞]。它们的具体取值由领域专家根据实际经验给出、

(2)E是该知识的前提条件。它既可以是一个简单条件,也可以是用AND或OR把多个简单条件连

10

接起来的复合条件。

(3)H是结论(推理网络中的节点)。P(H)是H的先验概率,它指出在没有任何专门证据的情况下结论H为真的概率。P(H)的值由领域专家根据以往的实践及经验给出。

(四)证据不确定性的表示

1、单个证据不确定性的表示方法 在主观Bayes中,证据的不确定性是用概率表示的。例如,对于初始证据E,其先验概率为P(E),也可以由用户根据观察S给出它的后验概率P(E//S),但由于P(E/S)的给出较困难,在PROSPECTOR系统中引进了可信度C(E/S)的概念。

可信度C(E/S)与P(E/S)的值,有简单的保持大小次序的对应关系;如下表所示:

告知可信度C(E/S),就等价于告知P(E/S),这两者之间的函数关系规定为分段线性插值关系(如图所示)。

它们之间的关系可用解析表达式表示如下:

P(E/S)-P(E) 5 × 若P(E)

1-P(E)

C(E/S) =

P(E/S)-P(E)

5 × 若0≤P(E/S)

P(E)

给出了C(E/S)就相当于给出了证据的概率P(E/S)。

C(E/S)+P(E)×(5-C(E/S))

若0≤C(E/S)≤5

5

P(E/S) =

P(E)×(C(E/S)+5)

若-5≤C(E/S)<0)

5

用户只要对初始证据给出相应的可信度C(E/S),就可由系统将它转换为相应的P(E/S)。

2、组合证据不确定性的确定方法 当证据E是由多个单一证据的合取组合而成时,即:

E?E1ANDE2AND?ANDEn 如果已知P(E1/S),P(E2/S),?,P(En/S),则

P(E/S)?min{P(E1/S),P(E2/S),?,P(En/S)}

当证据E是由多个单一证据的析取组合而成时,即:

11

E?E1ORE2OR?OREn

如果已知P(E1/S),P(E2/S),?,P(En/S),则

P(E/S)?max{P(E1/S),P(E2/S),?,P(En/S)}

对于“非”运算,用下式计算:

P(~E/S)=1-P(E/S)

(五)不确定性的推理计算

? 在主观Bayes方法的推理网络中,使用一些弧(知识规则)把一些证据和一些重要的结论假设连

接起来。这些证据和结论就是网络中的节点,而知识规则就是连接证据和结论的弧。推理网络各证据节点E和结论节点H的先验概率P(E)和P(H)是由专家根据经验给出的;知识的规则强度(LS,LN)的值也是由专家给出。 ? 随着新证据的获得,对结论H的信任程度应该有所改变。主观Bayes方法推理计算的任务就是根

据证据E的概率P(E)及影响结论的知识之规则强度(LS,LN),把先验概率P(H)更新为后验概率P(H/E)或P(H/~E)。

? 在推理网络中,一条知识对结论的影响是依赖于证据的。证据出现情况不同,推理计算结论H信

任程度的变化方法就不同。

1、确定性证据 确定性证据是指证据的出现与否是肯定的,分两种情况:证据肯定出现;证据肯定不出现。

证据肯定出现的情况

在证据肯定出现时,P(E)=P(E/S)=1。 由Bayes公式可得:

P(E/H)×P(H)

P(H/E) =

P(E)

同理有

P(E/~H)×P(~H)

P(~H/E) =

P(E)

由以上两式,可得:

P(H/E) P(E/H) P(H) P(E/H)×P(H)

= = (*) ×

P(~H/E) P(E/~H)×P(~H) P(E/~H) P(~H) 为方便,引入几率函数O(x),它与概率的关系为:

O(x)?P(x)O(x) p(x)?

1?P(x)1?O(x)p(x)与O(x)有相同的单调性;即P(x)

由LS的定义,以及概率与几率的关系式,可将(*)式改写为:

O(H/E)?LS?O(H) 这就是在证据E肯定出现时,把先验几率O(H)更新为后验几率O(H/E)的计算公式。

把几率换算成概率有:

P(H/E)?LS?P(H)

(LS?1)?P(H)?1 12