数据库系统1-1:数据处理的开发过程
手动管理阶段文件系统阶段数据库系统阶段
1.1.3.1人工管理阶段
20世纪50年代中期以前,计算机主要用于科学计算。没有操作系统,没有专门的软件来管理数据,也没有像磁盘这样的设备来存储数据。这一时期数据管理的特点是:
1.数据不会被保存。
2.数据和程序是一一对应的,即一组数据对应一个程序。不同应用程序的数据相互独立。
3.没有管理数据的软件系统。程序员不仅要指定数据的逻辑结构(如图1.2所示),还要设计程序中的物理结构,包括存储结构、存取方法和输入/输出方式。也就是说,数据不是独立于程序的,它是程序的组成部分。一旦存储器中的数据发生变化,程序就必须修改。
数据管理从20世纪50年代后期开始进入文件系统阶段。操作系统中有专门管理数据的软件,一般称为文件系统。所谓文件系统,就是一种专门管理数据的计算机软件。在文件系统中,数据按照一定的规则组织成一个文件,应用程序通过文件系统访问和处理文件中的数据。文件系统数据管理的特点是:
1.文件的逻辑结构和存储结构之间的转换由系统进行,使得程序和数据具有一定的独立性。
2.文件系统中的文件基本对应一个应用,也就是数据还是面向应用的。不同的应用程序可以作为一个单元共享文件,但是当所需的数据部分相同时,它们也必须创建自己的文件。
3.文件系统中的文件服务于应用程序,并且文件的逻辑结构针对应用程序进行了优化。所以很难在现有的数据上增加一些应用,系统也不容易扩展。一旦数据的逻辑结构发生变化,程序就必须修改。应用程序的变化也会影响文件数据结构的变化。数据和程序缺乏独立性。
1.1.3.3数据库系统阶段
为了说明数据库系统的特点,我们介绍一个例子。以学校对学生的管理为例。为简明起见,假设档案、教学管理部门和学生事务部门在文件系统下建立了以下三个文件:
在上述三个数据文件中,存在以下问题:
(1)大量数据重复。
(2)文件的逻辑结构是在应用程序中定义的(如PASCAL或C语言)。如果文件的逻辑结构改变了,程序也必须改变。
(3)文件系统中文件管理最重要的特点是文件是独立的、分散的,文件只反映自身的信息而不反映文件之间的关系。
数据库系统中的数据组织分为三层。第一层是面向各类用户的,是面向用户的组织形式。第二层是整个系统的数据结构,包含所有用户需要的信息和整体性能。第三层是物理存储在计算机中。在保证存储第二层所包含的信息的前提下,以物理访问的形式组织文件结构,这是一个真正保存在外部存储器中的文件。也就是说,用户使用的数据文件(逻辑上存在)和实际存储在外部存储器中的数据文件(物理上存在)是完全分离的。数据以三级结构组织,三级结构之间的关系通过两级映射实现。这就是数据库系统管理数据的方式。
在数据库管理系统的统一管理下,这种冗余较少、独立性较高、支持多用户共享的相互关联的文件集合,称为数据库(简称DB)。