跳转到主要内容

关系数据库

100

1970年,毕业于牛津大学并在 IBM 圣何塞研究院工作的 Edgar F. Codd 发表一篇论文,论述了大型数据库中存储的信息如何在不知道信息结构或者位于数据库何处的情况下而进行访问。

BATCH PGMS STORED DATA ON-LINE USERS

BATCH PGMS STORED DATA ON-LINE USERS

数据库—示例

此图表示用户如何与关系数据库交互。

How Relational

How Relational

关系数据库如何运行

了解字段、记录和表格,以及它们如何构成关系数据库。

THINK 的演进- 第 I/II 部分

本视频简要介绍了向 IBM DB2 关系数据库的演进。

THINK 的演进- 第 II/II 部分

本视频的第二部分简要介绍了向 IBM DB2 关系数据库的演进。

直到此时,检索信息需要相对复杂的计算机知识,或者由知道如何通过编写程序提取特定信息的专业人员提供服务—这是一项耗时且代价高昂的任务。

当时,用于多次以可预测的方式检索相同信息的数据库—例如制造业的物料单—已经良好地建立。Codd 为数据自主性的新世界打开了大门。用户不必是专业人员,也无需知道信息在何处,或者计算机如何提取信息。他们可以将更多精力集中于自己的工作,而非计算机。

Codd 在论文中将此称为“大型共享数据银行的关系型数据模型”。计算机科学家将此称为“革命性的想法”。

如今,关系数据库的易用性和灵活性使其成为财务记录、制造和逻辑信息以及个人数据的首选。大多数理性数据交易—访问银行账户、使用信用卡、交易股票、旅行预订和在线购物—都使用基于关系数据库原理的结构。

Codd 的想法创造了 IBM 的一个全新的产品家族,该家族的核心是 IBM® DB2® 数据库管理系统,以及处理关系数据库的业界标准计算机语言,称为 SQL。

在 IBM 公司负责 DB2 开发的关系数据专家并在之后成为 Coddle 博士的业务伙伴的 Chris Date 在《纽约时报》发表 Codd 的讣告称:“… 在 Codd 博士的工作发展成为商用产品之前,电子数据库是‘完全特定且混乱的’。

与许多革命性想法相似,关系数据库的出现并非轻而易举。

到 20世纪 60年代,世界上新的大型机中存储的海量数据—许多是 IBM System/360 机器—已经成为一个问题。大型机计算的费用高昂,通常每分钟要花费几百美元。在这些费用中,很大一部分是因为数据库管理的复杂性而产生的。

Codd 在从出生地英格兰到美国时,除了数学背景外,他还获得了计算机科学博士学位,他决心解决这个问题。他从一个较为简单的前提开始:希望能够让计算机提供信息,然后让计算机指出信息存储在何处,如何存储,以及如何检索。

据 IBM 公司的 Don Chamberlin 称,Codd 的“基本想法是数据项之间的关系应基于数据项的值,而非单独指定的链接或嵌套。这个概念大大简化了查询的指定,并且在以新方式利用现有数据方面实现了前所未有的灵活性。”

在他的开创性论文中,Codd 写到,他采用了数学集合论中的关系一词作为数据集合组之间的关系。简单地说,他的关系数据库解决方案提供了一定的数据自主性,允许用户不必掌握数据库物理结构的细节即可访问信息。

对技术领域来讲,与原理同样令人振奋的是,它仍是一个原理。它需要经过全面的测验才能了解是否可行,以及如何实现。在多年内,IBM选择了持续地宣传其建立的分层数据库系统,即 IBM IMS(信息管理系统)。分层系统采用树形数据表格结构。尽管对于常见任务来讲,IMS 比 DB2 更快,但对于非主要的工作任务,它的设计和维护需要更多的编程工作。经过证明,如果请求经常改变,或者需要多个“视角”,关系数据库更有优势。

IBM、罗克韦尔和 Caterpillar 在 1966年开发了 IMS,帮助追踪 NASA 阿波罗空间计划中使用的数百万个部件和材料。它一直作为 IBM 主要的分层数据库管理系统。

1973年,圣何塞研究院—现在叫阿尔马登研究中心—开始了一个名为 System R(R 代表关系)的计划,旨在通过“工业强度”的实施证明关系原理。项目产生了极佳的成效,成为了 IBM 关系数据库成功的基础。

Don Chamberlin 和 Ray Boyce 发明了 SQL(结构化查询语言),这是目前使用最广泛的用于关系数据库查询的计算机语言。Patricia Selinger 开发了基于成本的优化器,使得关系数据库的使用更具性价比和效率。Raymond Lorie 发明了一个编译器,可保存数据库查询计划,以供日后使用。

1983年,IBM 推出了 DB2 关系数据库家族,之所以采用此名称,是因为它是 IBM 的第二个数据库管理软件家族。如今,DB2 数据库每天处理数十亿个交易。它是 IBM 历史上最成功的软件产品之一。据 IBM 信息管理总经理 Arvind Krishna 说,DB2 将继续作为创新的关系数据库软件的领导者。

Codd(同事将喊他“Ted”)在 1976年被选为 IBM 院士,在 1981年,美国计算机协会向他授予图灵奖,奖励他对计算领域的重大贡献。图灵奖一般被称为计算领域的诺贝尔奖。

Content navigation