衡量一部后控词表质量的重要指标。
3. 自然语言与受控语言为何要结合起来?二者结合的发展趋势如何?
(1)自然语言与受控语言结合的原因是由两种语言的优势与不足决定的,自然语言信息的主要优点是:专指度高,处理速度快,可以提供更多的检索点,系统费用低,词汇及时更新,面向用户能力高;它的主要缺陷是:语词与概念不一一对应,存在着大量一词多义、一义多词及词义含糊现象,影响检索效率;检索点多,会检出大量无关文献,影响检准率;对词间关系不控制,不便进行扩检、缩检;词汇量大,必然会给词汇的加工、管理带来困难;自然语言不具有文献资源的组织功能,不能进行图书排架工作。而同时,受控语言具有自然语言没有的优点:通过词汇控制,使得检索结果更准确,提高检准率和检全率;通过词间关系控制,可以在计算机检索系统中显示 示的关系结构,方便用户的扩检与缩检,以满足不同的检索需求;压缩词量,使得词汇所占空间或篇幅较小,便于进行各种处理;某些种类的受控语言,如分类语言,还具有对信息资源集合本身进行系统组织的功能和理的功能;然而受控语言却有自然语言没有的缺陷:标引速度慢,对标引人员的要求高,难以满足使用文献量大的信息组织部门的需要;受控词表编制与维护的成本高;更新速度不如自然语言等。 (2)自然语言和受控语言结合的方式有:
1)两者并存,建立平行的系统,即在检索系统中同时使用文本检索、自由词标引、受控标引等多种检索方式,向用户提供分类号、叙词、关键词等检索途径,供用户选用;
2)建立杂交的系统,同时在一个检索系统中采用控制词汇和自由词进行标引和检索;
3)使用后控词表,即在组织检索系统时采用自然语言,在检索阶段对检索词实施控制(后控); 4)自动赋词标引,利用计算机编制的机内词表在标引阶段对标引词进行控制。
17