简论数据库的发展

个联机分析处理工具—— Express 诞生 了。其他决策支持系统紧随其后,许多是 由公司的IT 部门开发出来的。 1 9 8 5 年,第一个商务智能系统

(business intelligence)由Metaphor计 算机系统有限公司为Procter & Gamble 公司开发出来,主要用来连接销售信息 和零售的扫描仪数据。同年, Pilot软件 公司开始出售第一个商用客户/ 服务器 执行信息系统—— Command Center。 同样在这年,加州大学伯克利分校

Ingres 项目演变成Postgres,其目标是开 发出一个面向对象的数据库。此后一年, Graphael公司开发了第一个商用的对象 数据库系统—— Gbase。

1988 年,IBM 公司的研究者Barry Devlin和Paul Murphy发明了一个新的 术语——信息仓库,之后,IT厂商开始 构建实验性的数据仓库。1991年,W.H. Inmon出版了一本《如何构建数据仓库》 的书,使得数据仓库真正开始应用,因此 Inmon 也被尊称为“数据仓库之父”。 二十世纪九十年代,随着客户/ 服

务器计算模式和企业软件包的广泛采用, 数据管理的变革基本完成。数据管理不 再仅仅是存储和管理数据,而转变成用 户需要的各种数据管理的方式。Internet 的异军突起以及XML语言的出现,给数 据库系统的发展开辟了一片新天地。 数据库未来发展趋势

随着信息管理内容的不断扩展,出

现了丰富多样的数据模型(层次模型,网 状模型,关系模型,面向对象模型,半结 构化模型等),新技术也层出不穷(数据 流,Web数据管理,数据挖掘等)。 目前每隔几年,国际上一些资深的 数据库专家就会聚集一堂,探讨数据库 研究现状,存在的问题和未来需要关注 的新技术焦点。过去已有的几个类似报 告包括:1989 年Future Directions in DBMS Research-The Laguna Beach Participants ,1990 年Database

S y s t e m s : A c h i e v e m e n t s a n d Opportunities ,1995 年的Database

1991:W.H. Inmon 发 表了《构建数据仓库》 数据库发展大事记

1951:Univac系统使用磁带和穿孔卡 片作为数据存储。

1956:IBM公司在其Model 305 RAMAC 中第一次引入了磁盘驱动器

1961:通用电气(GE)公司的Charles Bachman开发了第一个数据库 管理系统—— IDS

1969:E.F. Codd发明了关系数据库。

1973:John J.Cullinane领导Cullinane公 司开发了 IDMS ——一个针对 IBM 主机的基于网络模型的数 据库。

1976:Honeywell 公司推出了Multics Relational Data Store ——第一 个商用关系数据库产品。

1979:Oracle公司引入了第一个商用 SQL 关系数据库管理系统。

1983:IBM 推出了DB2 数据库产品。 1985:为Procter & Gamble 系统设计 的第一个商务智能系统产生。

1991:W.H.Inmon发表了《构建数据 仓库》。

管理·开发故事 程序员2004.06 49

Research; Achievements and Opportunities into the 21st Century,1996

年Strategic Directions in Database Systems-Breaking Out of the Box 和 1998 年的The Asilomar Report on Database Research。2003 年的聚会于5 月初在Lowell Mass举行,共25位资深 数据库学者参加,集中讨论了信息存储、 组织、管理和访问等问题。 信息的本质和来源在不断变化,

Internet、Web、自然科学、电子商务是 信息和信息处理的巨大源泉。而廉价的 微型传感器技术使得大部分物体可以实 时汇报他们的位置和状态。这类信息能 支持对移动对象的状态和位置的监视应 用。传感信息的处理将会引发许多新环 境下极有趣味的数据库问题。

而在应用领域,Internet是目前主要 的驱动力,特别是在支持“跨企业”的应 用上。历史上,应用都是企业内部的,可 以在一个行政领域内进行完善的指定和 优化。但现在,大部分企业感兴趣的是如 何与供应商、客户进行更密切的交流以 便共享信息,以便提供更好的客户支持。 这类应用需要安全和信息集成的有力工 具。由此产生了数据库相关的新问题。 另一个重要应用领域是自然科学,

特别是物理科学、生物科学、保健科学和 工程领域。这些领域产生了大量复杂的 数据集,需要比现有的数据库产品更高 级的数据库支持。这些领域同样也需要 信息集成机制的支持。除此之外,还需要 对数据分析器产生的数据管道的管理, 需要对有序数据的存储和查询(如:时间 序列、图像分析、网格计算和地理信息), 需要世界范围内数据网格的集成。 除了在信息管理领域的这些挑战外, 在传统的DBMS 上,诸如数据模型、访

问方法、查询处理代数、并发控制、恢复、 查询语言和DBMS的用户界面等也面临 着巨大的变化。这些问题过去已经得到 充分的研究,但是技术的发展不断改变 其应用规则。比如说,磁盘和RAM容量 的不断变大,存储每个比特数据的花费 不断降低。虽然访问次数和带宽也在不 断提高,但是他们不像前者发展得那样 快,不断变化的比率要求重新评估存储 管理和查询处理代数。除此之外,处理器 高速缓存的规模和层次的提高,要求 DBMS 算法能够适应cache大小的变化。 上述只是由于技术改变而对原有算法重 新评价的两个例子。

另一个推动数据库研究发展的动力

是相关技术的成熟。如过去几十年里,数 据挖掘技术已成为数据库系统重要的组 成部分。Web搜索引擎导致了信息检索 的商品化,并和传统的数据库查询技术 集成。许多人工智能领域的研究成果也 和数据库技术融合起来,这些新组件使 得我们处理语音、自然语言、进行不确定 性推理和机器学习等。整体上,这些都要

求一个与我们现在完全不同的信息管理 架构,并重新考虑信息存储、组织、管理 和访问等方面的问题。

近40年中,数据库研究工作集中在 数据库管理系统开发的核心领域上,而 数据管理的研究范畴远比这宽的多。如 果忽视一些新的应用领域面临的数据管 理问题,就会使数据库研究局限于传统 的数据管理应用上而失去活力。 在众多新技术应用中,对数据库研 究最具影响力,推动数据库研究进入新

纪元的无疑将是I n t e r n e t 的发展。 Internet从深度和广度两方面对数据库技 术提出了挑战。从深度上讲,Internet环 境中,一些数据管理的基本假设不再成 立,需要重新考虑在新情况下对传统数 据库技术的改进。从广度上讲,新问题的 出现需要开拓思路,寻求创新性的技术 突破。

数据库发展

史上重要人物

埃德加·考特(EdgarF.Codd) 计算机界公认的关系数据库之父。

1970年他提出了关系模型的理论,1970年 以后,E.F.Codd继续完善和发展关系理 论;之后创办了一个研究所The Relational Institute和一个公司Codd & Associations; 1990 年出版了专著The Relational Model for Database Management:Version 2。 E.F.Codd 以其对关系数据库的卓越贡献 获得了1983 年ACM图灵奖。 C.J.戴特(C.J.Date)

C.J.Date 是最早认识到Codd 在关 系模型方面所做的开创性贡献的学者之 一,他是关系数据库技术领域中非常著 名的独立撰稿人、学者和顾问,他使得关 系模型的概念普及化。他参与了IBM公 司的SQL/DS和DB2两大产品的技术规 划和设计。30多年来,Date 一直活跃在 数据库领域中,其著作有《数据库系统导 论》,《对象关系数据库基础:第三次宣 言》(1998)等。

吉姆·格雷(Jim Gray)

联系客服:779662525#qq.com(#替换为@)