1-1-2

来源:百度文库 编辑:神马文学网 时间:2024/03/29 00:37:21

1.1.1 人工管理阶段(20世纪50年代中期以前)
1.软硬件背景
(1)外部存储器只有磁带、卡片和纸带等,还没有磁盘等直接存取存储设备。
(2)软件只有汇编语言,尚无数据管理方面的软件。
(3)数据处理的方式基本上是批处理。
2.数据管理的特点
(1)数据不保存在计算机内。
①计算机主要用于计算,一般不需要长期保存数据。
②在进行某一课题计算时,将原始数据随程序一起输入内存,运算处理后将结果数据输出。
③随着计算任务的完成,用户作业退出计算机系统,数据空间随着程序空间一起被释放。
(2)没有专用的软件对数据进行管理。
①每个应用程序都要包括存储结构、存取方法、输入输出方式等内容。
②程序中的存取子程序随着存储结构的改变而改变,因而数据与程序不具有独立性。
③存储结构改变时,应用程序必须改变。
④由于程序直接面向存储结构,因此数据的逻辑结构与物理结构没有区别。
(3)只有程序(program)的概念,没有文件(file)的概念。
○数据的组织方式必须由程序员自行设计与安排。
(4)数据面向程序。
○即一组数据对应一个程序。
1.1.2 文件系统阶段(20世纪50年代后期——60年代后期)
1.软硬件背景
(1)计算机不仅用于科学计算,还用于信息管理。
(2)随着数据量的增加,数据的存储、检索和维护问题成为紧迫的需要,数据结构和数据管理技术迅速发展起来。
(3)外部存储器已有磁盘、磁鼓等直接存取存储设备。
①1956年生产的第一台磁盘,其容量仅为5MB。
②60年代时已达到数十个MB。
(4)软件领域出现了高级语言和操作系统。
○操作系统中的文件系统是专门管理外存的数据管理软件。
(5)数据处理的方式有批处理,也有联机实时处理。
2.数据管理的特点
(1)数据以“文件”形式可长期保存在外部存储器的磁盘上。
○由于计算机的应用转向信息管理,因此对文件要进行大量的查询、修改和插入等操作。
(2)数据的逻辑结构与物理结构有了区别,但比较简单。
①程序与数据之间具有“设备独立性”,即程序只需用文件名就可与数据打交道,不必关心数据的物理位置。
②在数据的物理结构修改时,仍然需要修改用户的应用程序,即应用程序具有“程序—数据依赖”性。
③由操作系统的文件系统提供存取方法(读/写)。
(3)文件组织已多样化。
①有索引文件、链接文件和直接存取文件等。
②但文件之间相互独立、缺乏联系。
③数据之间的联系要通过程序去构造。
(4)数据不再属于某个特定的程序,可以重复使用,即数据面向应用。
○但是文件结构的设计仍然是基于特定的用途,程序基于特定的物理结构和存取方法,因此程序与数据结构之间的依赖关系并未根本改变。
(5)对数据的操作以记录为单位。
①这是由于文件中只存储数据,不存储文件记录的结构描述信息。
②文件的建立、存取、查询、插入、删除、修改等所有操作,都要用程序来实现。
3.文件系统的缺陷
(1)数据冗余(redundancy)
○由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。
(2)数据不一致(inconsistency)
○这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。
(3)数据联系弱(poor data relationship)
○这是由于文件之间相互独立,缺乏联系造成的。
1.1.3 数据库阶段(20世纪60年代后期)
1.数据管理技术进入数据库阶段的标志性三件大事。
(1)1968年美国IBM公司推出层次模型的IMS(Information Management System)系统。
(2)1969年美国CODASYL(Conference On Data System Language)组织发布了DBTG(Data Base Task Group)报告,提出网状模型。
(3)1970年美国IBM公司的E.F.Codd连续发表论文,提出关系模型。
2.数据库阶段的数据管理的特点。
(1)采用数据模型表示复杂的数据结构。
①数据模型不仅描述数据本身的特征,还要描述数据之间的联系。这种联系通过存取路径实现。
②通过所有存取路径表示自然的数据联系是数据库与传统文件的根本区别。
③数据不再面向特定的某个或多个应用,而是面向整个应用系统。
④数据冗余明显减少,实现了数据共享。
(2)有较高的数据独立性。

①数据的逻辑结构与物理结构之间的差别可以很大。
②用户以简单的逻辑结构操作数据而无需考虑数据的物理结构。
③数据库的结构分成用户的局部逻辑结构、数据库的整体逻辑结构和物理结构三级,用户(应用程序或终端用户)的数据和外存中的数据之间转换由数据库管理系统实现。
④数据独立性是指应用程序与数据库的数据结构之间相互独立。
a.在整体逻辑结构改变时,尽量不影响用户的逻辑结构以及应用程序,这样就认为数据库达到了逻辑数据独立性。
b.在物理结构改变时,尽量不影响整体逻辑结构、用户的逻辑结构以及应用程序,这样我们就认为数据库达到了物理数据独立性。
(3)数据库系统为用户提供了方便的用户接口。
①用户可以使用查询语言或终端命令操作数据库。
②也可以用程序方式(如用COBOL、C一类高级语言和数据库语言联合编制的程序)操作数据库。
(4)数据库系统提供四方面的数据控制功能。
数据控制功能
功能名称 说明
数据库的恢复 在数据库被破坏或数据不可靠时,系统有能力把数据库恢复到最近某个正确状态。
数据库的并发控制 对程序的并发操作加以控制,防止数据库被破坏,杜绝提供给用户不正确的数据。
数据的完整性 保证数据库中数据始终是正确的。
数据安全性 保证数据的安全,防止数据丢失或被窃取、破坏。
(5)增加了系统的灵活性。
○对数据的操作不一定以记录为单位,可以以数据项为单位。
3.程序和数据的联系。',1)">
(1)在文件系统阶段,人们关注的中心问题是系统功能的设计,因而程序设计处于主导地位,数据只起着服从程序设计需要的作用。
(2)在数据库方式下,数据占据了中心位置。数据结构的设计成为信息系统首先关心的问题,而利用这些数据的应用程序设计则退居到以既定的数据结构为基础的外围地位。
4.与数据库有关的几个术语。
(1)数据库(Database,DB)
①DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。
②DB能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点。
(2)数据库管理系统(Database Management System,DBMS)
①DBMS是位于用户与操作系统(OS)之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。
②DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型和面向对象型等。
③系统层次图。',2)">
(3)数据库系统(Database System,DBS)
○DBS是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。
(4)数据库技术
①数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科。
②数据库技术是在操作系统的文件系统基础上发展起来的,而且DBMS本身要在操作系统支持下才能工作。
③数据库与数据结构之间的联系也很密切,数据库技术不仅要用到数据结构中链表、树、图等知识,而且还丰富了数据结构的内容。
④应用程序是使用数据库系统最基本的方式,因为系统中大量的应用程序都是用高级语言(例如COBOL、C等)加上数据库的操纵语言联合编制的。
⑤集合论、数理逻辑是关系数据库的理论基础,很多概念、术语、思想都直接用到关系数据库中。
⑥因此,数据库技术是一门综合性较强的学科。
1.1.4 高级数据库阶段(20世纪80年代)
1.主要标志
(1)20世纪80年代的分布式数据库系统。
(2)90年代的对象数据库系统。
(3)21世纪的Web数据库系统。
2.面向对象的概念建模
(1)在数据处理领域,关系数据库的使用已相当普遍、相当出色。
(2)但是现实世界存在着许多具有更复杂数据结构的实际应用领域,已有的层次、网状、关系等三种数据模型对这些应用领域都显得力不从心。
(3)随着面向对象技术的渗透,数据库的概念建模经历了从实体联系图、对象联系图到UML类图的发展历程,以适应具有面向对象特征的数据库系统的需要。
3.开放数据库互连技术
(1)计算机网络已成为信息化社会中十分重要的基础设施。
(2)在网络中,各节点的DBMS可能不一样,因此有必要建立一个公共的、与DBMS型号无关的应用程序设计接口。
(3)这个接口为开发者提供单一的编程接口,使得同一个应用程序能够访问不同的数据库服务器。
(4)这种技术称为“开放数据库互连”技术。