《信息检索与利用》知识点

(1)专利文献 (2)标准文献 (3)学位论文 (4)科技报告 (5)会议文献 (6)政府出版物 (7)产品资料 (8)档案

(三)按加工深度划分

1.零次文献

指未经公开发表或未交流于社会的文献。如:私人笔记、设计草图、实验记录、论文草稿、会议记录、书信

2.一次文献

一次文献也称原始文献,是指人们根据自己的科学实验、生产实践的成果而撰写的文献,一般指期刊论文、科技报告、会议论文、学位论文、专利等。

3.二次文献

二次文献也称检索工具,是指对一次信息加工、整理后形成的各种检索工具,如目录、题录、文摘等,它不对一次信息提供评论,仅仅提供一次文献的检索线索,也就是说,二次文献是把一次文献从分散、无序的状态变成集中、有序化的状态,供人们迅速、准确地查询所需信息。

4.三次文献

三次文献是指在利用大量一次文献的基础上,对其内容进行综合、分析、研究和述评而撰写出来的文献。分为综述研究类和参考工具类两种类型。前者如动态、综述、学科总结、专题述评等;后者如百科全书、年鉴、手册、科技词典、名录、手册等。三次文献源于一次文献,又高于一次文献,是一种再创性文献。

一次文献、二次文献、三次文献之间的关系:

从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走向有序、由一种有序结构演变为另一种完善的有序结构的过程。

四、网络信息资源

迄今为止,对于?网络信息资源?尚没有统一的定义,类似的名称也很多,如?电子信息资源?(Electronic Information Resources)、?因特网信息资源?(Internet Information Resources)?联机信息?(On-line Information)、?万维网资源?(World Wild Web Resources)等。有关其定义也多种多样,如有人提出?电子信息资源是以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷纸质的载体中,并通过网络通信,计算机或终端等方式再现出来的信息资源?。网络信息资源,从字面上可以理解为?通过计算机网络可以利用的各种信息资源的总和?;从目的上看是?为了提高信息系统效率,实现资源共享而采用计算机网络整理、传递、获取的各种信息?;在范围上它不仅包括Internet上的信息资源,也包括各种局域网、城域网和广域网上的信息资源。

(一)按照网络信息的内容划分

1. 网络数据库

数据库亦称文献库、资料库,是发展最早、影响最广的一种主要电子信息源。脱离单机或专门的检索终端,与网络相结合,借助网络而提供服务的数据库即为网络数据库。网络数

5

据库主要包括联机数据库和光盘数据库。

2. 联机馆藏目录库

图书馆作为信息的集散地,在网络的影响下纷纷向着数字化、网络化方向发展,为了使更多的读者充分利用图书馆资源并实现资源共享,众多图书馆建立了馆藏机读目录数据库并通过网络提供OPAC(Online Public Access Catalo)服务。

3. 电子出版物

网络上出现了越来越多的电子出版物,包括电子图书、电子期刊和电子报纸等。 4. 政府机构信息

政府机构以政府信息服务系统向公众提供信息。包括有关组织机构的宗旨、业务范围、人员、出版物、最新消息发布、各种法律、法规或相关政策信息等,内容相当广泛。

5. 休闲娱乐信息

这类资源较多,且大多免费提供给用户,包括各种新闻、广告、讨论组以及各种软件 (二)按照所采用网络信息的协议不同划分 1. 基于超文本传输协议(HTTP)的信息资源

万维网(World Wide Web,简称WWW或Web)信息资源是一种典型的基于HTTP的网络信息资源。Web建立在超文本、超媒体基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面(GUI)展现和提供信息的网络信息资源形式。由于其使用简单、功能强大,自20世纪90年代问世以来,成为发展最快、信息最丰富的一种网络信息资源形式。

2. 基于文件传输协议(FTP)的信息资源

FTP协议的主要功能是完成从一个系统到另一个系统完整的文件复制,即在网络的联网计算机之间传输文件。通过FTP可以获得的信息资源类型很广泛。广义地说,任何以计算机方式存储的信息均可通过FTP协议获取,包括书籍、图像、声音、多媒体、一些书籍的电子版、电子期刊、某些政府机构发布的信息、大量的免费与共享软件等。

3. 基于远程登录(Telnet)的信息资源

这是指通过Telnet协议所访问到的网络信息资源。其实现方法为在远程计算机上登录,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问、使用远程计算机中对外开放的资源。这些资源包括硬件资源,如超级计算机,精密绘图仪,高速打印机,高档多媒体输入、输出设备等;也包括软件资源,如大型的计算机程序、图形处理程序以及大型数据库等信息资源。

第三节 我国文献信息的主要收藏及服务系统

一、图书馆系统

1. 公共图书馆系统 2. 高校图书馆

3. 科学研究系统图书馆

二、国家科技信息系统 三、专利文献系统 四、标准文献系统

6

五、档案系统

第二章 信息检索技术与策略

第一节 信息存储的基本知识

信息存储是指利用一定的科学规则和方法,通过对信息的特征进行分析、表征和提炼,并按给定的参数和序列公式排列、存储在相应载体上,组织成系统化的具有检索功能的系统过程。

一、信息筛选

信息筛选是对原始信息的挑选和鉴别,是建立信息资源检索系统的基础和保障。 信息筛选原则:针对性、系统性、预见性、科学性、计划性和及时性。

信息筛选方法:直观判断法、分析法、集体讨论法、专家裁决法、数学核算法、现场核实法等。

二、信息描述

信息描述是指根据信息组织和检索的需要,依照一定的科学规则和技术标准,对信息的外部特征、物质形态和内容特征进行全面描述并给予记录的过程。

(一)信息外表特征的描述

信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,它包含信息载体的物理形态、题名、加工者、出版或发表日期、流通或传播的标记等。

期刊论文的外表特征:文献的题目、著者、著者的工作单位、文献的出处(刊名、年卷期、起止页码)、语种、参考文献及图表的数量。

图书的外表特征:书名、著者(或编者、译者)、出版项(出版社、地点、时间)、稽核项(价格、页数、参考文献)、书号

不同的检索系统(数据库)所描述的项目与标识符有所不同。 (二)内容特征的描述

信息的内容特征就是信息包含的内容,它可以由分类号、主题词、关键词或其它知识单元来表达。

内容特征标引采用的方法主要有分类标引、主题标引。其中,分类标引是指对文献主题分析,用分类语言表达分析的主题,赋予文献分类检索标识(分类号)的过程;主题标引是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(主题词、叙词)的过程。

信息内容特征的标引较为复杂,必须借助于特定的信息检索语言。

三、信息检索语言

信息检索语言是根据信息组织和信息检索的需要而创制的人工语言,又称信息组织语言、情报语言、标引语言、索引语言等。

(一)分类检索语言

分类检索语言用分类号和类名来表达各种概念,将各种概念按学科门类的逻辑次序或事物的性质进行分类和系统排列。分类检索语言包括体系分类法和组配分类法。

1. 体系分类法

体系分类法是直接体现知识分类的等级制概念标识系统,它通过对概括文献信息内容及其某些外部特征的概念进行逻辑分类和系统排列而构成。

7

我国常见的体系分类法有《中国图书馆分类法》(简称中图法)、《中国科学院图书馆分类法》(简称科图法)、《中国人民大学图书馆分类法》(简称人大法);国外常见的体系分类法有《杜威十进分类法》(DC)、《国际十进分类法》(UDC)。

《中图法》是我国使用最为广泛的分类法,它分为5个基本部类、22个基本大类以及相应的二级类、三级类等。5个基本部类为:马克思主义、列宁主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书。采用英文字母与阿拉伯数字相结合的混合制号码,用一个字母表示一个大类,以字母的顺序反映大类序列,在字母后用数字表示大类下的类目划分。

体系分类法的主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类角度检索文献信息的途径。

2. 组配分类法

组配分类法的原理是依据事物的性质,首先确定几个分类标准,即分面,再确定每个分类标准中的若干特征值,即类目,每一分面的类目与其他分面的类目分别组配,形成许多组配类目,达到细分的目的。

(二)主题检索语言

主题检索语言是用语词作为概念标识,按字顺排列,并用参照系统等方法间接显示概念间相互关系的一种信息检索语言,也称主题法系统。

标题词语言(Heading) 受《词表》控制 单元词语言 (Uniterm) 受《词表》控制

叙词语言( Descriptor ) 受《词表》控制 关键词语言(Keyword) 无《词表》,不受《词表》控制

(三)主题检索语言与体系分类法的区别

四 信息存储

1. 数据库及其基础构成

数据库(database)是?至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。?通俗地说,数据库就是在计算机存储设备上,按一定方式存储的相互关联的数据集合,是信息检索的基础。

一条信息记录(record)是由若干个款目所组成,每个款目称为一个字段(Field),字段是构成记录的基础;信息记录的集合就形成文档,一个数据库可以包含有一个文档,也可以含有若干个文档。文档也可以称为子数据库。

2. 数据库记录的格式 ?记录?(record)是数据库的基础成分,是对某一实体属性进行描述的结果,是组成文档的基本数据单位。每一条记录由三种类型的字段组成:检索系统存取号、基本索引字段和辅助索引字段。

举例:图书的记录格式 举例:期刊论文的记录格式 3. 数据库的文档结构

数据库的文档一般有顺排文档和倒排文档两种类型。

第二节 信息检索概述

一、信息检索的发展历程及进展

(一)手工检索阶段 (二)机械检索阶段

8

联系客服:779662525#qq.com(#替换为@)