不确定推理方法(四)

O(H2/S3)?P(H2/S3)0.006??0.006

1?P(H2/S3)1?0.006(6)计算O(H2/S1,S2,S3) 由合成公式:

O(H2/S1,S2,S3)?O(H2/S1,S2)O(H2/S3)??O(H2)

O(H2)O(H2)=0.081

所以,H2原先的几率是0.01,通过运用r1,r2,r3,r4四条知识以及可信度C(E/S1),C(E/S2)给出的初始证据进行推理,最后算出H2的后验几率是0.081,相当于向率增加了8倍多。

四、证据理论

? 证据理论又称为D-S理论;是由A. P. Dempster首先提出,并由G. Shafer进一步发展起来

的一种处理不确定性的理论。

? 该理论满足比概率论弱的公理,能够区分“不确定”与“不知道”的差异,并能处理“不知道”引起的不确定性,具有较大的灵活性。

(一)D-S理论的数学基础

(1)在可信度方法和主观Bayes方法中,知识是用产生式的形式表示的。

? 在可信度方法中,证据、结论以及知识的不确定性是以“可信度”进行度量的。

? 在主观Bayes方法中,证据及结论的不确定性以概率的形式进行度量,而知识的不确定性是以数值对(LS,LN)来进行度量。

? 在用产生式表示知识时,证据可以是单个命题,也可以是用AND和OR连接起来的复合命题。 (2)在D-S系统中,知识也是以产生式的形式表示。但证据和结论以集合进行表示。 例如,假设D是所有可能疾病的集合,医生为进行诊断而进行的各种检查就是获得所需证据的过程,检查得到的结果就是获得的证据,这些证据就构成了证据集合E。根据证据集合E中的这些证据,就可以判断病人的疾病。通常,有的证据所支持的不只是一种疾病,而是多种疾病,这些疾病当然都是集合D中的元素,可以构成D的一个子集H,H就是结论集合。

(3)在D-S理论中,知识的不确定性通过一个集合形式的“可信度因子”来表示。证据和结论的不确定性度量则采用信任函数和似然函数来表示。

(4) 证据理论是用集合来表示命题的。设D是变量y的样本空间,其中具有n个元素,变量y的所有取值都在D中,D中元素所构成的子集个数为2n个,在任何时刻变量y的取值都会落入某个子集。也就是说,每一个子集A都对应着一个关于y的命题“y的值在A中”。所以,就用集合A来表示该命题。

1、概率分配函数 nDn

设D为样本空间,其中具有n个元素,则D中子集的个数为2个,并以2表示这2个集合。概率

D

分配函数的作用是把D上的任意一个子集A(∈2)都映射为[0,1]上的一个数M(A)。当A对应一个命题时,M(A)即是对应命题不确定性的度量。 定义: 设D 为样本空间,领域内的命题都用D的子集表示,如果定义函数M(x)为集合2D到区间[0,1]

上的一个映射函数,其满足下列条件:

M(?)?0?M(A)?1

A?D 21

则称M(x)为2D上的概率分配函数。M(A)称为命题A的基本概率数。

? A是D的一个子集,称作命题,M(A)是对其不确定性的一种表示。

? 概率分配函数不是概率。样本空间D上的各元素的基本概率数之和不一定等于1。

例如,设D={red, green, blue},则2D空间由D的8个子集构成,这8个子集是 A0=Φ,A1={red},A2={green},A3={blue}

A4={red, green},A5={red, blue},A6={ green, blue}, A7={ red, green, blue}

假设定义一个概率分配函数M(x),对各子集的概率分配如下: M(A0)=0,M(A1)=0.2, M(A2)=0.1,M(A3)=0.1, M(A4)=0.2,M(A5)=0.1,M(A6)=0.2,M(A7)=0.1

显然,M(x)符合概率分配函数的定义,但就D中的三个元素A1={red},A2={green},A3={blue}, M({red})+M({green})+M({blue})=0.4 而若按概率的要求,这三者的和应是1。

2、信任函数 信任函数是用来对命题A的不确定性进行度量的。

定义: 设D为样本空间,2D为D的所有子集表示的命题之集合,A是2D中的一个命题。如果定义函数Bel(x)为将集合2D映射到区间[0,1]上的一个函数,即0?Bel(A)?1,并且满足下列条件: Be(lA)??M(B) 对所有的A?2D

B?A则称Bel(x)为信任函数,或称下限函数。

? Bel(A)表示命题A为真的信任程度。从定义的公式可以看出,命题A的信任函数值,是A的所有

子集的基本概率分配函数值的和。

? 由信任函数及概率分配函数的定义,容易推出:

Bel(?)?M(?)?0

Bel(D)? 上面的例子: B?D?M(B)?1

Bel(A1)?M({red})?0.2

Bel(A5)?M({red})?M({blue})?M({red,blue})

=0.2+0.1+0.1

=0.4

Bel(A7)?M({red})?M({green})?M({blue})?M({red,green})

?M({red,blue})?M({green,blue})?M({red,green,blue})

=0.2+0.1+0.1+0.2+0.1+0.2+0.1

22

=1

3、似然函数

似然函数也是一个从集合2D到区间[0,1]上的映射函数,称为上限函数。 定义: 设有函数Pl(x)是从集合2D到区间[0,1]的映射函数,且

Pl(A)?1?Bel(~A)=

B?A???M(B)

则称Pl(x)为似然函数。

? 因为Bel(A)表示命题A为真的信任程度,所以Bel(~A)表示~A为真的程度,即表示A为假的

信任程度。Pl(A)表示对A为非假的信任程度。

? A不为假,并不代表A一定为真,A不为假的信任程度应该大于对A为真的信任程度,即有:

Pl(A)?Bel(A) ? Pl(A)-Bel(A)就是对A即不为假,又不为真的信任程度。或者说表示了既不信任A也不信任~A

的一种度量。这种即不为假,又不为真的情况,即是“不知道”的情况。证据理论能处理这种“不知道”引起不确定性。

对于上面的例子: Pl(A1)=1-Bel(~A1)

=1-Bel({green, blue})

=1-[M({green})+M({blue})+M({green, blue})] =1-[0.1+0.1+0.2] =0.6

Pl(A5)=1-Bel(~A5)

=1-Bel(~{red, blue}) =1-Bel({green}) =1-0.1 =0.9

对于命题A,用区间(Bel(A),Pl(A))来描述A的不确定性,并分别把Bel(A)和Pl(A)作为度量其信任程度的下限和上限。

4、概率分配函数的正交和

? 命题的不确定性需要用信任函数和似然函数来度量;而信任函数和似然函数的定义依赖于概率分

配函数;所以概率分配函数是对一个命题的不确定性度量的基础。

? 在有的情况下,由于数据的来源不同,可能得到两个不同的概率分配函数。为了计算信任函数和

似然函数,就必须将两个概率分配函数合并成一个概率分配函数。(A. P. Dempster提出了一种组合方法,即对两个概率分配函数进行正交和运算)。

定义:设M1和M2是两个概率分配函数,则它们的正交和M?M1?M2为:

M(?)?0M(A)?K?1?K?1?X?y?? ?M(x)?M(y)?M(x)?M(y)??M(x)?M(y)12x?y?A1212x?y??

23

若K?0,则正交和M也是一个概率函数;如果K?0,则不存在正交M,称M1 和M2矛盾。

对于多个概率分配函数M1,M2,?,Mn,如果它们可以组合,也可以通过正交和运算将它们组合成一个概率分配函数。

定义:设M1,M2,?,Mn是n个概率分配函数,则其正交和M?M1?M2???Mn为

M(?)?0M(A)?K?1?K??Ai?A1?i?n??M(A)

iiii?Ai??1?i?n??M(A)

例:对样本空间D={c, d},可能得到两个不同的概率分配函数如下: 第一个概率分配函数M1

M1(Φ)=0, M1({c})=0.2, M1({d})=0.5, M1({c, d})=0.3 第二个概率分配函数M2

M2(Φ)=0, M2({c})=0.3, M2({d})=0.6, M2({c, d})=0.1 求两个概率分配函数的正交和:

K?1?X?y???M(x)?M12(y)

=1-[M1({c})×M2({d})+ M1({d})×M2({c})] =1-[0.2×0.6+0.5×0.3] =0.73

M({c})?K?1?=

x?y?{c}?M(x)?M12(y)

1×[M1({c})×M2({c})+ M1({c})×M2({c, d})+ M1({c, d})×M2({c})] 0.731=×[0.2×0.3+0.2×0.1+0.3×0.3] 0.73=0.232 同理:

M({d})=0.726 M({c, d})=0.041

由此得到组合后的概率分配函数为

M(Φ, {c}, {d}, {c, d})=(0, 0.232, 0.726, 0.041)

(二)特定概率分配函数

? 在证据理论中,信任函数Bel(A)和似然函数Pl(A)分别表示对命题A信任程度的下限和上限,因

而可以用区间(Bel(A),Pl(A))作为证据A的不确定性度量以及知识不确定性度量,并以此为基础建立起相应的不确定性推理模型。

? 信任函数和似然函数是以概率分配函数为基础的。在一个样本空间D上,各子集的概率分配数并

不是概率,其值可能是人为指定的,所以不同的概率分配函数,就会导致不同的信任函数和似然函数,因而也会产生不同的推理模型,即推理模型是建立在概率分配函数的基础之上的。因此,所选取的概率分配函数的复杂性,就直接影响推理模型的复杂性,进而影响着不确定性计算复杂

24

联系客服:779662525#qq.com(#替换为@)