附录2.知网相关知识
知网(英文名称为HowNet)是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。
知网作为一个知识系统,实副其名是一个网而不是树。它所着力要反映的是概念的共性和个性,例如:对于“医生”和“患者”,“人”是它们的共性。知网在主要特性文件中描述了“人”所具有的共性,那么“医生”的个性是他是“医治”的施事,而“患者”的个性是他是“患病”的经验者。对于“富翁”和“穷人”,“美女”和“丑八怪”而言,“人”是它们的共性。而它们的个性,即:“贫”、“富”与“美”、“丑”等不同的属性值,则是它们的个性。
同时知网还着力要反映概念之间和概念的属性之间的各种关系:
(a) 上下位关系 (b) 同义关系 (c) 反义关系 (d) 对义关系 (e) 部件-整体关 (f) 属性-宿主关系
(g) 材料-成品关系 (h) 施事/经验者/关系主体-事件关系 (i) 受事/内容/领属物等-事件关系
(j) 工具-事件关系 (k) 场所-事件关系 (l) 时间-事件关系 (m) 值-属性关系 (n) 实体-值关系
(o) 事件-角色关系 (p) 相关关系
义原是知网的一个重要概念。义原是最基本的、不易于再分割的意义的最小单位。例如:“人”虽然是一个非常复杂的概念,它可以是多种属性的集合体,但我们也可以把它看作为一个义原。我们设想所有的概念都可以分解成各种各样的义原。同时我们也设想应该有一个有限的义原集合,其中的义原组合成一个无限的概念集合。如果我们能够把握这一有限的义原集合,并利用它来描述概念之间的关系以及属性与属性之间的关系,我们就有可能建立我们设想的知识系统。
比如一个事件“医治”,不仅出现在“医”、“治”、“治疗”、“医疗”、“治病”、“求医”、“看病”等概念中,并且还出现在“医生”、“医院”、“医药”、“诊所”、“不治之症”、“有病乱投医”。因此,“医治” 在同类别的许多概念中出现或者不同类别的概念中出现,那么我们确定其为一个义原。这个义原是稳定的、是必须确定的。
知识词典是知网系统的基础文件。在这个文件中每一个词语的概念及其描述形成一个记录。每一种语言的每一个记录都主要包含4项内容。其中每一项都由两部分组成,中间以“=”分隔。每一个“=”的左侧是数据的域名,右侧是数据的值。它们排列如下:
W_X= 词语
E_X= 词语例子 G_X= 词语词性 DEF= 概念定义
例如, \打\的两个义项,一个义项是\买\,另一个是\辫编\,在知识词典里形成两条记录。
NO.=000001 W_C=打 G_C=V
E_C=~酱油,~张票,~饭,去~瓶酒,醋~来了
- 31 -
W_E=buy G_E=V E_E=
DEF=buy|买 NO.=015492 W_C=打 G_C=V
E_C=~毛衣,~毛裤,~双毛袜子,~草鞋,~一条围巾,~麻绳,~条辫子 W_E=knit G_E=V E_E=
DEF=weave|辫编
10、参考文献
[1]孙鑫.VC++深入详解.电子工业出版社.2006. [2]陈平.软件设计师教程.清华大学出版社.2006.
[3]侯俊杰.深入浅出MFC.松岗电脑图资料股份有限公司.1998. [4]谭浩强.C++面向对象程序设计.清华大学出版社.2006.
[6]知网.HowNet Knowledge Database.http://www.keenage.com/.1999-2007.
- 32 -