信息管理学基础复习

分类标引是指对文献进行主题分析,用分类语言表达分析出的主题,赋予文献分类检索标识(分类号)的过程。

文献分类是指根据文献内容及其他相关属性,以分类语言(分类法)为工具,分门别类地系统揭示和组织文献的过程和方法。

主题标引是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(标题词、叙词等)的过程。

二、元数据

1.元数据(metadata)是关于数据的数据(data about data),关于信息的信息(information about information),或描述数据的数据(data that describes data)。 元数据的类型包括: 元素名称(Element names) 元素代码(Element coding) 元素描述(Element description) 元素语义(Element semantics) 元素表示(Element representation) 元素分类(Element 2.元数据的作用

1)识别:确认并对要进行组织的信息资源进行个别化描述,使用户能识别被组织的资源对象。

2)定位:提供信息资源位置的信息,以便用户访问时使用。

3)检索:传统检索系统一般需要确定检索点,组织相应的检索工具,提供各种基本的检索途径:在电子检索系统中,一般利用各种特征进行检索。

4)选择:通过记录信息资源的特征,供用户对信息资源的使用价值进行判断,决定是否使用该资源。

三、通用标记语言及相关标准

通用标记语言(Generalized Markup Language,简称GML)来描述文件及其格式。 SGML(Standard Generalized Markup Language)标准。 HTML(Hyper Text Markup Lanaguage) XML(eXtensible Markup Language)

1.通用置标语言标准SGML

SGML是一种元语言,是用来描述置标语言的语言,其核心是文档类型定义DTD。DTD文档规定文档可能出现的置标及其组合规则。

超媒体文档标记方面的超媒体语言HyTime (Hypermedia/Timebased Document Structuring Language)、

文献样式语义和规范说明语言DSSSL(Document Style Semantic and Specification Language)、 可扩展的样式语言XSL(eXtensible Style Language)、

可扩展的链接语言XLL(eXtensible Linking Language)

2. 超文本置标语言HTML

HTML是经过简化的SGML的DTD的具体应用实现。

HTML提供了一种文本结构和格式,使其能够在浏览器上呈现给访问它的用户。它在文件中加入标鉴,使其可以显示各种各样的字体

HTML的缺点:①扩展性差②交互性差③语义性差 ? HTML为网络信息的出版和发布提供以下功能:

①出版在线的文档,其中包含了标题、文本、表格、列表以及照片等内容; ②通过超链接检索在线的信息;

25

③为获取远程服务而设计表单,可用于检索信息、定购产品等;

④在文档中直接包含电子表格、视频剪辑、声音剪辑以及其他的一些应用。

3.可扩展的置标语言XML

XML以一种开放的自我描述方式定义数据结构。 XML文档

DTD文档类型定义 可扩展样式表语言XSL XML路径语言Xpath XML指针语言Xpointer

XML链接语言 Xlink、XHTML、Schema XML规范

ebXML、Biztalk、eCo, ECML。MathML SMIL。

XML具有以下特点: ①XML文档是纯文本,可用从文本编辑器直到可视化开发环境的任何工具创建和编辑,这使得程序可以更简单。 ②基于内容的数据标识。

③可格式化。有了XLS以后,数据和显示是分离的,可以为同一数据指定不同的样式表用于不同输出。

④具有很强的链接能力,可以定义双向链接、多目标链接、扩展链接和两个文档间的链接。 ⑤易于处理。XML对格式的定义更为严格,并具有层次结构,处理起来更加容易。

第四节网络信息资源组织

一、网络信息组织的特点

1、海量网络信息及信息生产、传播速度的加快,对传统信息交工方式提出了挑战;

2、信息种类增多,数据库成分复杂化,主要适用于文本信息的信息组织方法适用性降低; 3、网络信息用户的信息行为对信息组织有专门需求,信息组织方式透明化、易用化、简便实用、传播速度快;

4、网络信息形式上的非线性、交互性和动态性,需要信息组织方法及时而灵活。

二、网络信息组织技术与方法

网络信息组织的特点:

①信息组织的对象从各种类型的数据发展到更加丰富多彩的信息、信息链,甚至知识; ②信息组织的范围从文献内外部特征深入到信息单元、知识单元; ③信息组织的结果从静态的文本格式发展到动态的多模式的链接;

④信息组织的形式从数据结构发展到知识表示,即要求信息组织的透明化、易用性; ⑤信息组织的技术从手工单一发展到半自动化、自动化、智能化,即要求信息组织的标准化、兼容化。

1、网络信息的分类组织:

1)传统文献分类法的应用:应用传统文献分类法的主要是学术性资源和图书馆的各种信息资源;

2)自编分类系统的应用:网络分类目录,网页分类索引;

26

网络自编分类体系的特点:

1)重视以事物为中心设置类目; 2)类目收录范围宽泛; 3)多重列类、重复反映;

4)直接以语词作为分类标识; 5)更新迅速

2、网络信息的主题组织

◆一是采用现有的词表(叙词表,即主题词表),主要应用于学科专业型数据库; ◆二是采用关键词法,在搜索引擎等网站中使用较普遍。

三、网络信息资源组织方式

1.文件方式

文件方式常作为网络信息资源管理的辅助形式,作为其他信息组织方式的补充。FTP以文件目录的形式来组织信息资源。

2.数据库方式

将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其主配查询,就可以找到所需要的信息线索,并通过信息线索直接连接到相应的网络信息资源。

3.主题树方式

信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需要的信息线索,并通过信息线索直接找到相应的网络信息资源。

Gopher、Yahoo!、InfoSeek

4.超媒体方式

用超媒体方式来组织网络信息资源,就是将网上所能获得的各种媒体的相关信息资源利用超文本技术有机地编织在一起。

第六章信息检索

信息组织是指按照一定的规则来描述信息资源或信息对象,以便于能被需要它们的人高效地利用。

信息检索则是指为了个人或他人的需要,去发现适当的信息资源或信息对象。 信息组织和信息检索是一对互逆过程。

第一节信息检索的沿革与发展

一、信息检索的涵义

满足信息用户的信息需求而建立的、存贮经过加工了的信息集合,拥有特定的存贮、检索与传送的技术装备,提供一定存贮与检索方法及检索服务功能的一种相对独立的服务实体(包括人和检索工作单位),统称为信息检索系统(Information Retrieval System,简称IRS)。 信息检索系统的三个基本要素:人、检索工具(包括设备)和信息资料

二、信息检索的类型与特性

按存贮和检索的内容划分:①文献检索②数据检索③事实检索

按检索系统中信息的组织方式划分:①全文检索②多媒体检索③超媒体检索 信息检索特性

1)信息检索的相关性:相关性表明用户是否认为一文献与一提问吻合。

2)信息检索的不确定性:标引的不确定性是指不同标引员在给同一篇信息对象进行标引时

27

会选用不同的标引词,即标引词选用的不一致性。检索词选用的不确定性是指候选检索词集不止一个。

信息检索的逻辑性

三、信息检索的发展历程

三个阶段:手工信息检索阶段、机械信息检索阶段、计算机信息检索阶段 信息检索技术两个发展方向:

传统信息检索向全文文本、多媒体、多载体、多原理等新型信息检索的发展,在深度上提高管理和组织信息的能力; 信息资源的网络化和分布化,面向互联网中海量的信息资源,在广度上提高管理和组织的能力。

四、信息检索的基本原理

1、信息资源集合2、信息需求集合3、匹配与选择

第三节信息检索的技术与方法

从检索手段看,信息检索分为:手工信息检索、机械信息检索、计算机信息检索

一、手工信息检索的技术与方法

(1)手工信息检索工具

? 目录:图书或其他单独出版物规律化、系统化的记载

? 索引:把一种或多种书刊里的具体内容按一定的方式分别摘录,并注明出处,以便检索

的一种工具 ? 文摘:把文献资料的主要内容,由有一定水平和经验的编者将其准确、简要地摘录出来,

并注明出处后,经分类排序而编制成的检索工具

? 年鉴:以描述和统计的方式逐年提供某年度某一领域信息的工具书 ? 手册:汇集某一学科领域或业务部门专门知识的工具书

? 百科全书:荟萃一切门类或某一门类知识、以概要方式介绍为主的多功能工具书

2)手工信息检索工具的排检技术

字顺排检技术:将检索工具的内容按字、词的一定顺序或规律,有系统地组织排列起来的技术。

分类排检技术:将信息素材按学科或事物性质系统地加以排列。

主题排检技术:以规范化的自然语言为标识符号来标引信息内容的排检技术。

时序排检技术:按时间的顺序组合信息素材的技术,多用于编制年表、年谱等检索工具。 地序排检技术:按一定时期的行政区域来排列信息素材的技术。

3)手工信息检索方法

顺查法:一种以信息检索课题起始年代为起点,按时间顺序由远而近地查找信息的方法。 倒查法:一种逆时间顺序由近而远地查找信息的方法。

抽查法:一种针对研究课题发展的特点,抓住学科发展迅速、发表文献较多的年代进行查找的方法。

追溯法:又叫回溯法,是以某一篇文献末尾所附的参考文献为依据,由近及远进行逐一追踪的查找方法。 循环法:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找。

28

联系客服:779662525#qq.com(#替换为@)