本整理只起辅助作用,PPT才是屠龙宝刀
后续可能还会整理,但不会再这么详细(这样还不如看PPT呢,不是嘛
数据库期末复习之第一讲:绪论
1.1 数据库系统概述
1.1.1四个基本概念
- 数据(data)
- 数据库中存储的基本对象
- 定义:描述事物的符号记录
- 种类:数字、文字、图形等
- 数据的含义称为数据的语义,数据与其语义是不可分的
- 数据库(database)
- 定义:是长期存储在计算机内、有组织的、可共享的大量数据的集合
- 基本特征
- 数据按一定的数据模型组织、描述和存储
- 可为各种用户共享
- 冗余度较小
- 数据独立性较高
- 易扩展
- 数据库管理系统(DBMS)
- 含义
- 位于用户与操作系统之间的一层数据管理软件
- 是基础软件,是一个大型复杂的软件系统
- 用途:科学地组织和存储数据、高效地获取和维护数据
- 主要功能
- 数据定义功能
- 提供数据定义语言(DDL)
- 定义数据库中的数据对象
- 数据组织、存储和管理
- 分类组织、存储和管理各种数据
- 确定组织数据的文件结构和存取方式
- 实现数据之间的联系
- 提供多种存取方式提高存取效率
- 数据操纵功能
- 提供数据操纵语言(DML)
- 实现对数据库的基本操作(增删改查)
- 数据库的事务管理和运行管理
- 数据库在建立、运行和维护时由数据库管理系统统一管理和控制
- 保证数据的安全性、完整性、多用户对数据的并发使用
- 发生故障后的系统恢复
- 数据库的建立和维护功能
- 数据库初试数据的装载和转换
- 数据库转储、恢复功能
- 数据库的重组织
- 性能监视、分析等
- 其他功能
- 数据库管理系统与网络中其他软件系统的通信
- 数据库管理系统之间的数据转换
- 异构数据库之间的互访和互操作
- 数据定义功能
- 含义
- 数据库系统(DBS)
- 构成
- 数据库
- 数据库管理系统(及其应用开发工具)
- 应用程序
- 数据库管理员
- 构成
1.1.2 数据管理技术的产生和发展
数据管理技术
-
描述
- 对数据进行分类、组织、编码、存储、检索和维护
- 数据处理的中心问题
-
发展过程
-
人工管理阶段(20世纪50年代中之前
-
文件系统阶段(20世纪50年代末 – 60年代中
-
数据库系统阶段(20世纪60年代末 – 现在
文件系统到数据库系统,标志着数据管理技术的飞跃
-
-
发展动力
- 应用需求的推动
- 计算机硬件的发展
- 计算机软件的发展
1.1.3 数据库系统的特点
- 数据的整体结构化
- 是数据库的主要特征之一
- 描述
- 不再仅仅针对某一个应用,而是面向全组织
- 不仅数据内部结构化、整体是结构化的,数据之间具有联系
- 数据记录可以变长
- 数据的最小存取单位是数据项
- 数据的共享性高、冗余度低且易扩充
- 数据面向整个系统,可以被多个用户、多个应用共享使用
- 数据共享的好处
- 减少数据冗余、节约存储空间
- 避免数据之间的不相容性与不一致性
- 使系统易于扩充
- 数据独立性高
- 物理独立性:用户的应用程序与数据库中的数据存储相互独立
- 逻辑独立性:用户的应用程序与数据库的逻辑结构相互独立
- 数据独立性由数据库管理系统的二级映像功能来保证
- 数据由数据库管理系统统一管理和控制
- 数据库管理系统提供的数据控制功能
- 数据的安全性保护
- 数据的完整性检查
- 并发控制
- 数据库恢复
- 数据库管理系统提供的数据控制功能
1.2 数据模型
- 数据模型是对现实世界数据特征的抽象
- 是对现实世界的模拟
- 满足三方面要求
- 比较真实地模拟现实世界
- 容易为人所理解
- 便于在计算机上实现
- 数据模型是数据库系统的核心和基础
1.2.1 两类数据模型
- 概念模型
- 也称信息模型,按用户的观点来对数据和信息建模,用于数据库设计
- 逻辑和物理模型
- 按计算机系统的观点对数据建模,用于DBMS实现
- 对数据最底层的抽象,描述数据在线i同内部的表示方法和存取方法,在磁盘或磁带上的存储方式和存取方法
1.2.2 概念模型
- 用途
- 用于信息世界的建模
- 是现实世界到及其世界的一个中间层次
- 是数据库设计的有力工具
- 数据库设计人员和用户进行交流的语言
- 基本要求
- 较强的语义表达能力
- 简单、清晰、易于用户理解
- 信息世界中的基本概念
- 实体
- 内部联系:各属性之间
- 联系:不同实体集之间
- 属性
- 码
- 实体型
- 实体集
- 联系
- 实体
1.2.3 数据模型的组成要素
- 数据结构
- 描述数据库的组成对象,以及对象之间的联系
- 是对系统静态特性的描述
- 数据操作
- 对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及相关的操作规则
- 类型:增删改查
- 是对系统动态特性的描述
- 数据的完整性约束条件
- 一组完整性规则的集合
- 完整性规则:给定的是数据模型中数据及其联系所具有的制约和依存规则
- 用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容
1.2.4 常用的数据模型
-
层次模型
-
网状模型
-
关系模型
-
面向对象数据模型
-
对象关系数据模型
-
半结构化数据模型
1.2.5 层次模型
是数据库系统中最早出现的数据模型
用树形结构来表示各类实体以及实体间的联系
- 数据结构
- 满足条件
- 有且只有一个根结点
- 根以外的结点有且只有一个双亲结点
- 特点
- 结点的双亲是唯一的
- 只能直接处理一对多的实体联系
- 每个记录类型可以定义一个排序字段,也称为码字段
- 任何记录值只有按其路劲查看时,才能显出它的全部意义
- 没有一个子女记录值能够脱离双亲记录值而独立存在
- 满足条件
- 数据操纵
- 增删改查
- 完整性约束条件
- 无相应的双亲结点值就不能插入子女结点值
- 如果删除双亲结点值,则相应的子女结点值也被同时删除
- 更新操作时,应更新所有相应记录,以保证数据的一致性
- 优点
- 层次模型的数据结构比较清晰
- 查询效率高,性能优于关系模型,不低于网状模型
- 层次数据模型提供了良好的完整性支持
- 缺点
- 结点之间的多对多联系表示不自然
- 对插入和删除操作的限制多,应用程序的编写较复杂
- 查询子女结点必须通过双亲结点
- 层次命令趋于程序化
1.2.6 网状模型
网状数据库采用网状模型作为数据的组织方式
- 数据结构
- 满足条件
- 允许一个以上的结点无双亲
- 一个结点可以有多于一个的双亲
- 与层次模型的区别
- 网状模型允许多个结点没有双亲结点
- 网状模型允许结点有多个双亲结点
- 网状模型允许两个结点之间有多种联系
- 网状模型可以更直接地描述现实世界
- 层次模型实际上时网状模型的一个特例
- 满足条件
- 数据操纵和完整性约束
- 码:唯一标识记录的数据项的集合
- 一个联系中双亲记录与子女记录之间时一对多联系
- 支持双亲记录和子女记录之间某些约束条件
- 优点
- 能够更为直接地描述现实世界,如一个结点可以有多个双亲
- 具有良好的性能,存取效率较高
- 缺点
- 结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
- DDL、DML语言复杂,用户不容易使用
- 记录之间联系时通过存取路径实现的,用户必须了解系统结构的细节
1.2.7 关系模型
关系数据库采用关系模型作为数据的组织方式
-
数据结构
-
在用户观点下,关系模型中的数据结构是一张二维表,由行和列组成
-
不允许表中还有表,关系必须是规范的
-
-
数据操作是集合操作,操作对象和操作结果都是关系
- 增删改查
-
完整性约束
- 实体完整性
- 参照完整性
- 用户定义的完整性
-
优点
- 建立在严格的数学概念的基础上
- 概念单一
- 实体和各类联系都用关系来表示
- 对数据的检索结果也是关系
- 关系模型的存取路径对用户透明
- 具有更高的数据独立性,更好的安全保密性
- 简化了程序员的工作和数据库开发建立的工作
-
缺点
- 存取路径对用户透明,查询效率往往不如格式化数据模型
- 为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度
1.3 数据库系统的结构
- 从数据库应用开发人员角度看,数据库通常采用三级模式结构,是数据库系统内部的系统结构
- 从数据库最终用户角度看,数据库结构分为
- 单用户结构
- 主从式结构
- 分布式结构
- 客户-服务器
- 浏览器-应用服务器 / 数据库服务器多层结构等
1.3.1 数据库系统模式的概念
型(type):对某一类数据的结构和属性的说明
值(value):是型的一个具体赋值
模式(schema)
- 是数据库逻辑结构和特征的描述
- 是型的描述,不涉及具体值
- 反映的是数据的结构及其联系
- 模式是相对稳定的
实例(Instance)
- 模式的一个具体值
- 反映数据库某一时刻的状态
- 同一个模式可以有很多实例
- 实例随数据库中的数据的更新而变动
1.3.2 数据库系统的三级模式结构
- 模式(又称逻辑模式)
- 描述
- 数据库中全体数据的逻辑结构和特征的描述
- 所有用户的公共数据试图
- 一个数据库只有一个模式
- 地位:是数据库系统模式结构的中间层
- 与数据的物理存储细节和硬件环境无关
- 与具体的应用程序、开发工具及高级程序设计语言无关
- 定义
- 数据的逻辑结构(数据项的名字、类型、取值范围等)
- 数据之间的联系
- 数据有关的安全性、完整性要求
- 描述
- 外模式(又称子模式或用户模式)
- 描述
- 数据库用户使用的局部数据的逻辑结构和特征的描述
- 数据库用户的数据试图,是与某一应用有关的数据的逻辑表示
- 地位:介于模式与应用之间
- 模式和外模式的关系:一对多
- 外模式与应用的关系:一对多
- 用途
- 保证数据库安全性的一个有力措施
- 每个用户只能看见和访问所对应的外模式中的数据
- 描述
- 内模式(又称存储模式)
- 描述
- 是数据物理结构和存储方式的描述
- 是数据在数据库内部的表示方式
- 一个数据库只有一个内模式
- 描述
1.3.3 数据库的二级映像功能与数据独立性
三级模式是对数据的三个抽象级别
二级映像在数据库管理系统内部实现这三个抽象层次的联系和转换
-
外模式 / 模式映像
- 描述
- 模式:描述的是数据的全局逻辑结构
- 外模式:描述的是数据的局部逻辑结构
- 同一个模式可以有任意多个外模式
- 每一个外模式,数据库系统都有一个外模式 / 模式映像,定义外模式与模式之间的对应关系
- 映像定义通常包含在各自外模式的描述中
- 保证数据独立性
- 当模式改变时,数据库管理员对外模式 / 模式映像作相应改变,使外模式保持不变
- 应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性
- 描述
-
模式 / 内模式映像
- 描述
- 定义了数据全局逻辑结构与存储逻辑结构之间的对应关系
- 数据库中模式 / 内模式映像是唯一的
- 该映像定义通常包含在模式描述中
- 保证数据的独立性
- 当数据库的存储结构改变了,数据库管理员修改模式 \ 内模式映像,是模式保持不变
- 应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性
- 数据库模式
- 即全局逻辑结构是数据库的中心与关键
- 独立于数据库的其他层次
- 设计数据库模式结构时应首先确定数据库的逻辑模式
- 数据库的内模式
- 依赖于它的全局逻辑结构
- 独立于数据库的用户试图,即外模式
- 独立于具体的存储设备
- 将全局逻辑结构中所定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时空效率
- 数据库的外模式
- 面向具体的应用程序
- 定义在逻辑模式之上
- 独立于存储模式和存储设备
- 当应用需求发生较大变化,相应外模式不能满足其视图要求时,该外模式就得做相应改动
- 设计外模式时应充分考虑到应用的扩充性
- 特定的应用程序
- 在外模式描述的数据结构上编制的
- 依赖于特定的外模式
- 与数据库的模式和存储结构独立
- 不同的应用程序有时可以共用同一个外模式
- 数据库的二级映像
- 保证了数据库外模式的稳定性
- 从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改
- 数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离除去
- 数据的存储由数据库管理系统管理
- 简化了应用程序的编制
- 大大减少了应用程序的维护和修改
- 描述
1.4 数据库系统的组成
- 数据库
- 数据库管理系统(及其开发工具)
- 应用程序
- 数据库管理员
- 硬件平台及数据库
- 足够大的内存
- 足够大的磁盘或磁盘阵列等设备
- 较高的通道能力,提高数据传送率
- 软件
- 数据库管理系统
- 支持数据库管理系统允许的操作系统
- 与数据库接口的高级语言及其编译系统
- 以数据库管理系统为核心的应用开发工具
- 为特定应用环境开发的数据库应用系统
- 人员
- 数据库管理员
- 职责
- 决定数据库中的信息内容和结构
- 决定数据库的存储结构和存取策略
- 定义数据的安全性要求和完整约束条件
- 监控数据库的使用和运行
- 数据库的改进和重组
- 职责
- 系统分析员和数据库设计人员
- 系统分析员
- 负责应用系统的需求分析和规范说明
- 与用户及数据库管理员结合,确定系统的硬软件配置
- 参与数据库系统的概要设计
- 数据库设计人员
- 参与用户需求调查和系统分析
- 确定数据库中的数据
- 设计数据库各级模式
- 系统分析员
- 应用程序员
- 设计和编写应用系统的程序模块
- 进行调试和安装
- 最终用户
- 最终用户通过应用系统的用户接口使用数据库
- 偶然用户
- 不常访问数据库,但每次访问往往需要不同的数据库信息
- 企业或组织机构的高中级管理人员
- 简单用户
- 主要工作是查询和更新数据库
- 银行的职员、机票预定人员、旅馆总台服务员
- 复杂用户
- 直接使用数据库语句访问数据库,甚至额能够基于数据库管理系统的应用程序接口编制自己的应用程序
- 工程师、科学家、经济学家、科技工作者等
- 数据库管理员
1.5 小结
数据库系统概述
- 数据库的基本概念
- 数据管理的发展过程
- 数据库系统的特点
数据模型
- 数据模型的三要素
- 三种主要数据库模型
数据库系统内部的系统结构
- 数据库系统三级模式结构
- 数据库系统两层映像系统结构
数据库系统的组成