1.1 数据库系统概述
1.1.1 数据库的地位
- 数据库技术产生于六十年代末,是数据管理的有效技术,是计算机科学的重要分支。
- 数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透。
- 数据库已经成为每个人生活中不可缺少的部分。
1.1.2 四个基本概念
数据(Data)
数据是数据库中存储的基本对象
数据的定义:描述事物的符号记录
数据的种类:数字、文字、图形、图像、音频、视频、学生的档案记录等
数据的含义称为数据的语义,数据与其语义是不可分的。
例如 93是一个数据
语义1:学生某门课的成绩
语义2:某人的体重
数据库(Database)
- 数据库的定义:长期储存在计算机内、有组织的、可共享的大量数据的集合。
- 数据库的基本特征:数据按一定的数据模型组织、描述和储存,可为各种用户共享,冗余度较小,数据独立性较高。
数据库管理系统(DBMS)
什么是数据库管理系统:位于用户与操作系统之间的一层数据管理软件
数据库管理系统的用途:科学地组织和存储数据、高效地获取和维护数据
数据库管理系统的主要功能:
① 数据定义功能:数据定义语言(DDL)
② 数据组织、存储和管理
③ 数据操纵功能:提供数据操纵语言(DML),数据库的基本操作(增删改查)
④ 数据库的事务管理和运行管理
数据库系统(DBS)
- 数据库系统的构成:数据库,数据库管理系统,应用程序,数据库管理员
1.1.3 数据库管理技术的产生与发展
什么是数据管理:对数据进行分类、组织、编码、存储、检索和维护
数据管理技术的发展过程
① 人工管理阶段(20世纪50年代中之前)
② 文件系统阶段(20世纪50年代末–60年代中)
③ 数据库系统阶段(20世纪60年代末–现在)
数据库系统的特点:数据结构化,共享性高,冗余度低,数据独立性高
1.2 数据模型
数据模型就是现实世界的模拟
数据模型应满足三方面要求:
① 能比较真实地模拟现实世界
② 容易为人所理解
③ 便于在计算机上实现数据模型是数据库系统的核心和基础
1.2.1 两类数据模型
- 概念模型:按用户的观点来对数据和信息建模,用于数据库设计。
- 逻辑模型和物理模型
- 逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。按计算机系统的观点对数据建模,用于DBMS实现。
- 物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
1.2.2 概念模型
概念模型的用途:是现实世界到机器世界的一个中间层次
概念模型的一种表示方法:实体-联系方法
基本概念:
① 实体:客观存在并可相互区别的事物称为实体。
② 属性:实体所具有的某一特性称为属性。
③ 联系:
- 实体内部的联系通常是指组成实体的各属性之间的联系
- 实体之间的联系通常是指不同实体集之间的联系
- 实体之间的联系有一对一、一对多和多对多等多种类型
④ 码:唯一标识实体的属性集称为码。
⑤ 实体集:同一类型实体的集合称为实体集
1.2.3 数据模型的组成要素
数据结构
- 描述数据库的组成对象,以及对象之间的联系
- 与对象的类型、内容、性质有关
- 与数据之间联系有关
- 数据结构是对系统静态特性的描述
数据操作
- 对数据库中各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则
- 数据操作是对系统动态特性的描述
数据的完整性约束条件
一组完整性规则的集合
完整性规则:给定的数据模型中数据及其联系所具有的制约和依存规则
1.2.4 常用的数据模型
- 层次模型(Hierarchical Model)
- 网状模型(Network Model)
- 关系模型(Relational Model))
- 面向对象数据模型(Object Oriented Data Model)
- 对象关系数据模型(Object Relational Data Model)
- 半结构化数据模型(Semistruture Data Model)
1.2.5 层次模型
层次模型是数据库系统中最早出现的数据模型
层次数据库系统的典型代表是IBM公司的IMS(Information Management System)数据库管理系统
层次模型用树形结构来表示各类实体以及实体间的联系
满足下面两个条件的基本层次联系的集合为层次模型
① 有且只有一个结点没有双亲结点,这个结点称为根结点
② 根以外的其它结点有且只有一个双亲结点
1.2.6 网状模型
网状数据库系统采用网状模型作为数据的组织方式
典型代表是DBTG系统
满足下面两个条件的基本层次联系的集合为网状模型:
①允许一个以上的结点无双亲;
② 一个结点可以有多于一个的双亲。
1.2.7 关系模型
关系(Relation):一个关系对应通常说的一张表
元组(Tuple):表中的一行即为一个元组
属性(Attribute):表中的一列即为一个属性,给每一个属性起一个名称即属性名
主码(Key):表中的某个属性组,它可以唯一确定一个元组
域(Domain):是一组具有相同数据类型的值的集合。属性的取值范围来自某个域。
分量:元组中的一个属性值。
关系模式:对关系的描述
- 关系名(属性1,属性2,…,属性n)
- 学生(学号,姓名,年龄,性别,系名,年级)
关系的完整性约束条件 :实体完整性,参照完整性,用户定义的完整性
1.3 数据库系统的结构
① 通过支持用户(user)数量划分
一次支持一个用户:单用户数据库(Single-user database)
eg.桌面数据库(Desktop database):个人计算机上的单用户数据库
一次支持多个用户:多用户数据库(Multiuser database)
eg.工作组数据库(Workgroup databases):支持少数用户或特定部门
企业数据库(Enterprise database):支持多个部门的多个用户
② 通过位置(locaction)分类
- 集中式数据库(Centralized database):数据位于单一站点(a single site)
- 分布式数据库(Distributed database):数据分布在不同的站点(different sites)
- 云数据库(Cloud database):使用云数据服务(cloud data services)创建和维护
③ 通过数据类型(data type)分类
通用数据库(General-purpose database):包含在多个学科(multiple disciplines)中使用的各种数据
特定学科数据库(Discipline-specific database):包含特定学科领域(specific subject areas)的数据
运营数据库(Operational database):用于支持公司的日常运营(day-to-day operations)
eg.事务数据库(Transactional database)
分析数据库( Analytical database):存储专门用于战术(tactical)或战略决策制定(trategic decision making)的历史数据(historical data)和业务指标(business metrics)
eg.数据仓库(Data warehouse):以用于决策支持的优化格式(a format optimized for decision support)存储数据
联机分析处理(Online analytical processing (OLAP)):数据仓库检索(retrieving)、处理(processing)和建模(modeling)数据的工具
商业智能(商业智能):捕获和处理(captures and processes)商业数据,以生成支持决策制定的信息
④ 通过结构化程度(Degree of structure)
- 非结构化数据:以其原始状态(original state)存在
- 结构化数据:源于格式化(formatting)
- 半结构化数据:在一定程度上经过处理(process)
注意:NoSQL(不仅仅是SQL)主要处理非结构化数据
如果有其他问题欢迎留言或邮件提问
QQ:1269112498
Email:1269112498@qq.com
相关文章