不确定推理方法(四) 下载本文

不确定推理方法(四)

引入新课:

(1) 基于一阶谓词逻辑的归结推理方法所依据的证据是确定性的,即谓词所表示的知识要么为

“真”,要么为“假”,其推理过程也是以数理逻辑为基础,推理过程是严密的,所推出的结论要么成立,要么不成立。所以基于一阶谓词逻辑的归结推理方法是一种确定性的推理方法。 (2) 在日常生活中,人们通常所遇到的情况是信息不够完善、不够精确,即所掌握的知识具有不

确定性。人们正是利用这种不确定性的知识进行思维、推理,进而求解问题,所以,为了解决实际问题,必须对不确定知识的表示、推理过程等进行研究。

(3) 对不确定性知识的表示、推理方法有多种,著名的有:可信度方法、主观Bayes方法、证据

理论方法。

一、不确定推理概述 (一)不确定推理的概念

推理:就是从已知事实出发,运用相关的知识(或规则)逐步推出结论或者证明某个假设成立或不成立的思维过程。

其中:(1)已知事实和知识(规则)是构成推理的两个基本要素。

(2)已知事实是推理过程的出发点及推理中使用的知识,称为证据。 (3)知识(或规则)是推理得以向前推进,并逐步达到最终目标的根据。 人工智能系统:由总数据库、知识库和推理机构成。 其中:(1)总数据库是已知事实的集合。

(2)知识库即规则库,是一些人们总结的规则集合。(人工智能的核心)

(3)推理机则是由一些推理算法构成,这些算法将依据知识库中的规则和总数据库中的

事实进行推理计算。

说明:客观事物及它们之间关系的复杂性;客观上存在的随机性、模糊性、事物及现象暴露的不充分

性,导致人们认识的不精确和不完全,具有一定的不确定性。

(二)不确定推理方法的分类 不确定推理方法分为两类:

模型方法:它的特点是把不确定的证据和不确定的知识分别与某种度量标准对应起来,并给出更新结

论不确定性的合适的算法,从而构成相应的不确定性推理模型。

注:不同的结论不确定性更换方法对应不同的模型。

控制方法:它的特点是通过识别领域中引起不确定性的某些特征及相应的控制策略来限制或减少不确定性系统产生的影响。

注:(1)这类方法没有处理不确定性的统一模型;其效果极大地依赖于控制策略。

(2)控制策略的选择和研究是这类不确定性推理的关键。 (3)常见控制方法:启发式搜索、相关性制导回溯等。

模型方法又分为:

(1)数值方法:是对不确定性的一种定量表示和处理方法; 按它所依据的理论不同分为:

基于概率的方法:所依据的理论是概率论; 模糊推理方法:所依据的理论是模糊理论。

1

(2)非数值的方法:(指除数值方法外的其它方法,如逻辑法)

说明:(1)纯概率方法有严密的理论体系;要求给出事件的先验概率和条件概率(应用受到限制) (2)在概率论的基础上,发展了一些新的处理不确定性方法:可信度方法、主观Bayes方法、证

据理论方法。

(三)不确定推理中的基本问题

? 推理方向、推理方法、控制策略;

? 证据及知识的不确定性度量及表示问题、不确定性知识(或规则)的匹配问题、不确定性传

递算法以及多条证据同时支持结论的情况下不确定性的合成问题。

1、不确定性的表示

不确定性包括:证据的不确定性、知识的不确定性。 证据不确定性的表示:

在推理过程中,证据的来源有二:(1)通过观察而得到的所要求解问题的初始证据(由于观察本身的不确定性,由此所得的初始证据具有不确定性);(2)在推理过程中利用前面推理出的结论作为新的推理证据(由于在前面推理中,所使用的初始证据的不确定性,以及在推理过程中所利用知识的不确定性,都导致了所推结果的不确定性)。

证据不确定性的表示通常为一个数值;初始证据的值一般由用户或专家给出;用前面推理出的结论作为新的推理证据,其值由推理中的不确定性传递算法计算得到。

知识不确定性的表示,

在表示具有不确定性的知识时,要考虑两个方面的因素:(1)要将领域问题的特征比较准确的描述出来,满足问题求解的需要;(2)要便于推理过程中对不确定性的推算。

通常,专家系统中的知识的不确定性由领域专家给出,以一个数值表示(表示相应知识的不确定性程度)。

2、推理计算

不确定性推理过程:主要包括不确定性的传递计算算法、组合证据不确定性算法和结论不确定性的更新或合成算法。

假设以C(E)表示证据E的不确定性程度,而以CF(H, E)表示知识(规则)E→H的不确定性程度,要解决的问题是: (1)不确定性传递问题。已知证据E的不确定性度量为C(E),而规则E→H的不确定性度量为CF(H,

E),那么如何计算结论H的不确定性程度C(H),即如何将证据E的不确定性和规则E→H的不确定性传递到结论H上。 (2)证据不确定性的合成问题。如果支持结论的证据不止一个,而是几个,这几个证据间可能是AND

或OR的关系,如何由C(E1)和C(E2)来计算C(E1)∧C(E2)和C(E1)∨C(E2)。

(3)结论不确定性的合成问题。如果有两个证据分别由两条规则支持结论,如何根据这两个证据和

两条规则的不确定性确定结论的不确定性。 即:已知 E1→H C(E1), CF(H,E1)

E2→H C(E2), CF(H,E2) 如何计算C(H)。

3、不确定性的度量

2

不确定性的度量是指用一定的数值来表示知识、证据和结论的不确定程度时,这种数值的取值方法和取值范围。

注意:(1)度量要能充分表达相应知识及证据的不确定性程度。

(2)度量范围的指定应便于领域专家及用户对证据或知识不确定性的估计。

(3)度量要便于不确定性的推理计算;而且所得到的结论之不确定值应落在不确定性度量所

规定的范围之内。

(4)度量的确定应当是直观的,同时应当有相应的理论依据。

二、可信度方法

? 可信度方法是美国斯坦福大学E.H.Shortliffe等人在确定性理论(Theory of Confirmation)的基础上,

结合概率论等提出的一种不确定性推理方法。1976年在专家系统MYCIN中首先应用。 ? 在讨论不确定推理的过程中,不确定性的度量、表示和推理是要考虑的基本问题。

(一)可信度的概念

可信度是人们在实际生活中根据自己的经验或观察对某一事件或现象为真的相信程度。

可信度也称为确定性因子。在以产生式作为知识表示的专家系统MYCIN中,用以度量知识和证据的不确定性。 注:(1)可信度具有较大的主观性和经验性,其准确性是很难把握的;

(2)对某一具体领域,由于领域专家具有丰富的专业知识及实践经验,要给出该领域知识的可

信度是完全可能的;

(3)人工智能所面临的问题,较难用精确的数学模型进行描述,并且先验概率及条件概率的确定也比较困难,因此用可信度来表示知识及证据的不确定性仍不失为一种可行的方法。

(二)知识不确定性的表示

在基于可信度的不确定性推理模型中,知识以产生式规则的形式表示的,知识的不确定性是以可信度CF(H,E) 表示的。其一般形式为: IF E THEN H (CF(H,E)) 其中 (1) E是知识的前提条件,或称为证据。它既可以是一个简单条件,也可以是用AND及OR把多个简单条件连接起来所构成的复合条件。例如,

E=E1 AND E2 AND (E3 OR E4)

(2) H是结论,它可以是一个单一的结论,也可以是多个结论。

(3) CF(H,E)是该条知识的可信度,称为可信度因子(Certainty Factor)或规则强度。

在专家系统MYCIN中,CF(H,E)被定义为: CF(H,E)=MB(H,E)-MD(H,E)

(1)MB(Measure belief)称为信任增长度,它表示因与前提条件E匹配的证据的出现,使结论H为真

的信任增长度。

(2)MD(Measure Disbelief)称为不信任增长度,它表示因与前提条件E匹配的证据的出现,对结论H

为真的不信任增长度。

?1若P(H)=1? MB(H,E)??max{P(H/E),P(H)}?P(H)

否则?1?P(H)?

3

?1若P(H)=0? MD(H,E)??min{P(H/E),P(H)}?P(H)

否则?P(H)?P(H)表示H的先验概率;P(H/E)表示在前提条件E所对应的证据出现的情况下,结论H的条件概率。

分析1:

由MB与MD的定义可以看出,当MB(H, E)>0时,有P(H/E)>P(H),这说明由于E所对应的证据出现增加了对H的信任程度。另外,当MD(H, E)>0时,有P(H/E)

当MB(H, E)>0时,MD(H, E)=0。 当MD(H, E)>0时,MB(H, E)=0。 MB和MD的值域为[0, 1]。

根据CF(H, E)的定义及MB(H, E)与MD(H, E)的互斥性,可得到CF(H,E)的计算公式为:

当P(H/E)?P(H)?P(H/E)?P(H)?1?P(H)?? 当P(H/E)?P(H) CF(H,E)??0?P(H/E)?P(H)??P(H)当P(H/E)?P(H)?P(H/E)=P(H)表示E所对应的证据与H无关。

分析2:

CF(H, E)的取值范围是[-1, 1]。

当0P(H)。表明由于证据E的出现增加了结论H为真的概率,即增加了

H为真的可信度。CF(H, E)的值越大,增加H为真的可信度就越大。若CF(H,E)=1,可推出P(H/E)=1,即由于证据E的出现,使得结论为真。

当-1≤CF(H, E)<0时,有P(H/E)

H为假的可信度。CF(H, E)的值越小,增加H为假的可信度就越大。若CF(H,E)=-1,可推出P(H/E)=0,即由于证据E的出现,使得结论为假。

当CF(H, E)=0,有P(H/E)=P(H)。表明H与E无关,即证据E的出现对H没有影响。

? 要运用公式计算CF(H,E),就要知道P(H)和P(H/E),这在实际应用中很困难,因此,CF(H,E)的

值一般由领域专家直接给出。

? 在为CF(H, E)指定值时,应遵循的原则是:如果由于证据E的出现,使结论H为真的可信度增加

了,则使CF(H, E)>0,并且这种支持力度越大,就使CF(H, E)的值越大;相反,如果由于证据E的出现,使结论H为假的可信度增加了,则使CF(H, E)<0,并且这种支持力度越小,就使CF(H, E)的值越小;若证据的出现与否和H无关,则使CF(H, E)=0。

(三)证据不确定性的表示 单个证据的不确定性获取方法

如果支持结论的证据只有一条,则证据可信度的确定分两种情况:

(1)证据为初始证据,可信度值由提供证据的用户直接指定;指定的方法也是用可信度因子对

4