当前位置:首页 > 第2章 数据模型
第2章 数据模型
数据库是各个部门、企业应用所涉及到的数据的集合。它不仅反映数据本身所表达的内容,而且还反映数据之间的联系。由于计算机不能直接处理现实世界中的具体事物,所以人们必须事先将具体事物转换成计算机能够处理的数据。在数据库系统的形式化结构中如何抽象、表示、处理现实世界中的信息和数据呢?这就是数据库的数据模型。通过数据模型这个工具来抽象、表示和处理现实世界中的信息和数据。
本章主要介绍信息的三种世界概念,概念模型(E-R图)和数据模型的组成,以及三种常用的数据模型。
2.1 信息的三种世界
信息就是通过各种方式传播的能被感受的声音、文字、图像、符号等。信息需要通过载体才能表示。“信息”可以告诉人们有用的事实和知识,“数据”可以更有效地表示、存储和抽取信息。
计算机信息处理的对象是现实生活中的客观事物,在对客观事物实施处理的过程中,首先要经历了解、熟悉的过程,从观测中抽象出大量描述客观事物的信息,再对这些信息进行整理、分类和规范,进而将规范化的信息数据化,最终由数据库系统存储、处理。在这一过程中,涉及到三个层次,即现实世界、信息世界和计算机世界,经历了两次抽象和转换,这三个世界间的转换过程就是将客观现实的信息反映到计算机数据库中的过程。 2.1.1 现实世界
现实世界(Real World)就是人们所能看到的、接触到的世界,是存在于人脑之外的客观世界。现实世界当中的事物是客观存在的,事物与事物之间的联系也是客观存在的。
现实世界就是存在于人脑之外的客观世界,客观事物及其相互联系就处于现实世界中。客观事物可以用对象和性质来描述。现实世界主要涉及的概念有:
1. 实体 (Entity):客观存在并可以相互区分的事物或概念叫实体。 2. 实体的特征(Entity Characterisitic):每个实体都有自己的特征,利用实体的特征可以区别不同的实体。
3. 实体集及实体集间的联系(Relation):具有相同特征或能用同样特征描
1
述的实体的集合称为实体集。 2.1.2 信息世界
信息世界(Information World)就是现实世界在人们头脑中的反映,又称概念世界。人们用思维以现实世界为基础,对事物进行选择、命名、分类等抽象工作之后,并用文字符号表示出来,就形成了信息世界。现实世界是物质的,相对而言信息世界是抽象的。
信息世界对现实世界的抽象重点在数据框架性构造——数据结构,不拘泥于细节性的描述。信息世界主要涉及以下三个概念:
1. 实例(Example):实体通过其特征的表示称为实例。实例与现实世界的实体相对应。
2. 属性(Attribute):实体的特征在人们思想意识中形成的知识称为属性。一个实例可以有多个属性。其中能唯一标识实体的属性或属性集合称为码(Key)。每个属性的取值是有范围的,称为该属性的域(Domain)。属性与现实世界的特征相对应。
3. 对象(Object)及对象间联系(Relation):同类实例的集合称为对象,对象即实体集中的实体用属性表示得出的信息集合。实体集之间的联系用对象联系表示。
按用户观点对现实世界的抽象,即对现实世界的数据信息建模就称为概念模型(或信息模型)。信息世界通过概念模型以及过程模型、状态模型反应现实世界。
2.1.3 计算机世界
计算机世界(Computer World)又称数据世界(Data World),是将信息世界中的信息经过人们的抽象和组织,按照特定的数据结构,即数据模型,将数据存储在计算机中。
计算机世界就是信息世界中的信息数据化后对应的产物。现实世界中的客观事物及其联系,在数据世界中以数据模型描述。相对于信息世界,数据世界是量化的、物化的。 主要涉及的概念有:
1. 字段(Field):也称为数据项(Item)。用来标记实体的一个属性就叫做字段,它是可以命名的最小信息单位。字段与信息世界的属性相对应。
2
2. 记录(Record):记录是有一定逻辑关系的字段的组合。它与信息世界中的实体相对应,一个记录可以抽象描述一个实体。
3. 文件(File)文件是同一类记录的集合。它与信息世界中的对象相对应。文件的储存形式有顺序文件、链接文件、索引文件等。
4. 文件集(File Set):文件集是若干文件的集合,即由计算机操作系统通过文件系统来组织和管理。它与信息世界中的对象集相对应。 2.1.4 三种世界的转换
现实世界 实体 特征 实体集 实体间联系 信息世界 实例 属性 对象 对象间联系 概念模型 计算机世界 记录 数据项(字段) 文件 文件集 数据模型
2.2 概念模型
概念模型是现实世界的抽象反映,它表示实体类型及实体间的联系,是独立于计算机系统的模型,是现实世界到计算机世界的一个中间层次。 2.2.1 概念模型的基本概念
1. 实体(Entity):客观存在并且可以互相区别的事物称为实体。可以是人,也可以是物;可以是实际的对象,也可以是抽象的概念;可以指事物本身,也可以指事物的联系。实体是信息世界的基本单位。
2. 属性 (Attribute):属性是实体所具有的某一特性,通过属性对实体进行描述。实体是由属性组成的。 一个实体可以由多个属性来刻画,每一个属性都有其取值范围和取值类型。
3. 码(Key):一个实体往往有多个属性,这些属性之间是有关系的,它们构
3
成该实体的属性集合。能在一个实体集中唯一标识一个实体的属性或属性集,则称该属性或属性集为该实体的码。码可以只包含一个属性,也可以同时包含多个属性。有多个码时,选择一个作为主码。
4. 域(Domain):某个属性的取值范围称为该属性的域。
5. 实体型(Entity Type):具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。例如,学生(学号,姓名,性别,出生年份,系,入学时间)就是一个实体型。
6. 实体集(Entity Set):同类型实体的集合称为实体集。例如,全体学生就是一个实体集。
7. 联系(Relationship):现实世界的事物之间是有联系的,这些联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。实体(型)内部的联系主要表现在组成实体的属性之间的联系。实体(型)之间的联系主要表现在不同实体集之间的联系。两个实体之间的联系有三种:一对一联系、一对多联系、多对多联系。
(1) 一对一联系(1:1)
对于实体集A中的每一个实体,实体集B中至多有一个实体与之对应,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1。例如,部门与经理之间联系,学校与校长之间的联系等等就是一对一的联系。
B
A
b1
A
B
A
B
a1 a2 b2 b3
a1 a2 a3 b1 b2 b3 b4 a1 a2 a3 a4
b1 b2 b3 b4
a3 b4 b4
a4
(2) 一对多联系(1 : M)
4
共分享92篇相关文档