二、计算机信息检索的技术与方法
(1)联机信息检索
信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程。
优点:①检索速度快;②检索范围广而全面;③检索途径多、质量高;④检索内容新、实时性强;⑤检索辅助功能完善、使用方便,检索结果输出方式灵活、实用。
缺陷:①主机负担重,一旦出现故障,则整个网络都将瘫痪;②信息组织方式以线性为主,不够灵活;③联机检索不像Internet是面向最终用户的,操作也没有后者方便。 (2)光盘信息检索 特点:
使用光盘检索系统,可免除联机检索系统所必须使用的电讯设备,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误
光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式
光盘存贮容量大、耐用、复制费用低
可以把文本、图形、图像、声音及动态形象结合在一起
如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又要受到经费限制
在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供 数据库费用大
联机信息检索系统的结构
由检索服务机构、国际通讯网络及终端三部分构成。 联机信息检索的技术原理
一个典型的计算机信息系统,能完成数据收集、分析、加工处理、存储、传递通信和检索信息的全过程。
联机信息检索的服务方式 a、定题信息提供 b、专题回溯检索 c、联机订购原文 d、电子邮件 ②光盘信息检索技术
光盘信息检索系统由微机、驱动器及连接设备、CDROM数据库(光盘)及其检索软件构成。 选择驱动器时主要考虑以下性能: a 速度:一般在185ms~500ms之间
b 查找速度:一般在250ms~400ms之间
c 数据缓冲区越大,可直接从存储器存取的数据就越多,节省查询时间 d 数据传送速度:有单速、双速乃至40倍速以上的驱动器 ③光盘信息检索方法
光盘检索系统的功能和指令与联机检索没有很大区别,但更方便。
功能键:Help(帮助)、Index(索引)、History(查阅历史)、Display(显示)、Print(打印)、Select Database(选择数据库)、Format Window(格式窗)、Quit(退出)等
检索信息时可用单元词、多元词(短语)、数字及布尔运算符和位置运算符把几个检索术语组配成一个提问逻辑式。
29
用户可以在任何时刻回顾其查找的历史,重新使用或修改以前的任何提问。 屏幕帮助是光盘数据库最常用也是重要的功能之一。 三、网络信息检索的技术与方法 1.网络信息检索特点: 信息量更大
需要处理各种不同的语言(大多是自然语言) 信息检索的范围更宽(多学科、多领域) 信息查询的时效性要求更高 检全率较高,而检准率较低 ①网络信息检索模式
广义:(从根本上解决有效利用网络信息资源问题的关键)
如何对网络上的海量多态信息进行组织,如何对这些信息建立索引,如何对索引及时更新; 如何设计检索算法以使检索提问在检全、检准、响应时间、检索结果控制与显示方面表现良好;
如何为用户设计一个简单易用的友好界面
狭义:(在现实世界中有效利用网络资源的核心)
只是以网络(如互联网)为媒介,利用网上已提供的一些信息检索工具,探索如何使用这些工具及如何综合各工具,使它们扬长避短,最后能实现对信息提问的检索查询的一种方法与技术。
②网络信息检索工具 Archie(文档查询服务) Gopher(菜单式检索服务) WAIS(广域信息服务)
WWW(万维网交互式信息查询服务) ③搜索引擎(Search Engine)
搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,就是一种在互联网上查找信息的工具。
工作的基本原理是:用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。
检索的结果:WWW上的主页、新闻组中的文章、软件的存放地址及其作者、企业网站、个人主页等。
从不同的角度,搜索引擎可分为不同的类型:
按信息内容的组织方式:目录式搜索引擎和机器人搜索引擎 按专业范畴:综合性搜索引擎和垂直搜索引擎
按检索功能:独立搜索引擎和多元搜索引擎(也称元搜索引擎)
第四节信息检索的步骤与策略
一、信息检索语言的职能
信息检索语言是根据信息检索需要创制的一种人工语言,又称检索语言、信息存贮与检索语言、文献工作语言、索引语言、标引语言、信息检索标识、标识系统等等。 信息检索语言:词汇和语法 信息检索语言的职能:
可以表示文献内容、数据或其他信息形式
30
有专用概念表示用户的信息提问 能够指示计算机执行查询与检索
二、信息检索策略
信息检索策略是针对检索提问、运用检索方法和技术而设计的信息检索方案,其目的是要达到一定的检准率和检全率。
常用信息检索策略包括:分块概念组配检索策略、逐步组配检索策略、对偶组配检索策略、增长信息检索策略的研究重点是: (1)检索策略失误分析; (2)降低检索费用的研究; (3)用户检索行为及用户培训;
(4)现代信息技术在检索策略制定中的应用。
在检索表达式重构专家系统中,把知识库分为领域知识库和规则库。组配检索策略等。 目前在以下三方面取得进展:
(1)以检全为目标的检索策略的调节与控制; (2)以检准为目标的检索策略的调节与控制; (3)以最小投入为目标的检索策略的调节与控制。
对特定系统、特定数据以及某一类型课题的检索策略的研究具体表现在以下两方面: (1)是某一系统、某一数据库检索策略; (2)是某一类型课题检索策略。
三、信息检索效率的评价
检索效率是指全、准、快、便、省(检全率、检准率、检索速度、检索方便性、检索成本与效益),最主要的是全和准。
在评价信息检索效率过程中,主要通过检全率、检准率、漏检率和误检率四个评价指标进行评价,其中重点是检全率和检准率。
1、信息检索的步骤
(1)分析研究信息检索课题
明确信息检索课题所涉及的领域和范围; 明确所需信息的内容及其内容特征;
明确所需信息的类型,包括文献媒体、出版类型、所需文献量、年代范围、涉及的语种、有关著者及机构等;
明确信息检索课题对查新、查准和查全的指标要求。 (2)选择信息检索工具
信息检索工具是人们为了充分、准确、有效地利用已有的信息资源而加工编制的用来报道、揭示、存贮和查找信息资源的卡片、表册、计算机信息系统和特定出版物。 (3)确定信息检索方法
每一种信息检索方法都有自己的特点,在实践中可以根据信息检索要求选择使用或配合使用,以快速、准确地完成信息检索任务,实现预期的目标。
常用的信息检索方法:顺查法、倒查法、抽查法、追溯法、循环法 (4)掌握获取原始信息的线索
在获取信息线索时要仔细阅读,判断所检出的信息是否符合检索的要求,不仅看篇名,还要阅读整个著录格式,进行综合分析。 (5)获取原始信息
31
判断文献的出版类型。根据文献出处中已有的信息,判断其出版类型。
整理文献出处。将文献出处中有缩写语、有音译刊名的还原成全称或原刊名。 根据出版类型在图书馆或信息机构查找馆藏目录或联合目录确定馆藏,原则上说应该按“由近及远”的顺序逐步扩大查找馆藏的范围。 尽可能多渠道、多方式地获取原始信息。
第七章信息服务
? 本章重点
1.信息服务的主要内容2.信息服务的主要方式3.网络信息服务的基本特征 4.信息用户及其信息需求研究的内容5.用户信息需求的评价标准
? 信息服务(Information Service)是信息管理活动的出发点和归宿,是信息管理学研究的重
要内容和领域。
信息服务活动通过研究用户、组织用户、组织服务,将有价值的信息传递给用户,最终帮助用户解决问题。从这一意义上看,信息服务实际上是传播信息、交流信息、实现信息增值的一项活动。本章所讨论的信息服务仅仅是作为信息管理活动的一个环节,亦称信息提供
第一节信息服务的内容和方式
一、信息服务的含义及内容
信息服务:用不同的方式向用户提供所需信息的一项活动。 包括两个方面的内容:
一是对分散在不同载体上的信息进行收集、评价、选择、组织、存贮,使之有序化,成为方便利用的形式;
二是对用户及信息需求进行研究,以便向他们提供有价值的信息。
现代信息服务的内涵:
? ? ? ? ?
从信息服务的内容 从信息服务的形式 从信息服务的载体 从信息提供的渠道 从信息提供主体
? 从信息服务的层次和深度 二、信息服务的原则
? 针对性原则 ? 及时性原则 ? 易用性原则
? 成本/效益原则:社会效益、经济效益 三、信息服务的主要方式
? 信息检索和传递服务:根据用户的需求或提问从各类不同的数据库或信息系统中,
迅速、准确地查出与用户需求相符合的,一切有价值的资料和数据。
? 信息报道与发布服务:信息机构对搜集到的大量资料和信息进行整理、加工、评价、
研究和选择之后,及时报道出去,满足用户的信息需求。
? 参考服务:将用户与专家的学科专业知识联系起来的问答式服务。 ? 信息咨询服务:帮助用户解决信息问题的一种专门咨询活动。
信息检索和传递服务
1)信息搜索服务:信息机构服务人员根据用户的需求利用各种检索工具为其查询获取相关
32