正文

数据库相关概念

沝冰  沝冰  2022-08-26  363

关键词：

第一节

一、相关概念

1. Data：数据，是数据库中存储的基本对象，是描述事物的符号记录。

2. Database：数据库，是长期储存在计算机内、有组织的、可共享的大量数据的集

合。

3. DBMS：数据库管理系统，是位于用户与操作系统之间的一层数据管理软件，用于

科学地组织、存储和管理数据、高效地获取和维护数据。

4. DBS：数据库系统，指在计算机系统中引入数据库后的系统，一般由数据库、数据

库管理系统、应用系统、数据库管理员（DBA）构成。

5. 数据模型：是用来抽象、表示和处理现实世界中的数据和信息的工具，是对现实世

界的模拟，是数据库系统的核心和基础；其组成元素有数据结构、数据操作和完整性约束。

6. 概念模型：也称信息模型，是按用户的观点来对数据和信息建模，主要用于数据库

设计。

7. 逻辑模型：是按计算机系统的观点对数据建模，用于 DBMS 实现。

8. 物理模型：是对数据最底层的抽象，描述数据在系统内部的表示方式和存取方法，

在磁盘或磁带上的存储方式和存取方法，是面向计算机系统的。

9. 实体和属性：客观存在并可相互区别的事物称为实体。实体所具有的某一特性称为

属性。

10.E-R 图：即实体-关系图，用于描述现实世界的事物及其相互关系，是数据库概念

模型设计的主要工具。

11.关系模式：从用户观点看，关系模式是由一组关系组成，每个关系的数据结构是

一张规范化的二维表。

12.型/值：型是对某一类数据的结构和属性的说明；值是型的一个具体赋值，是型的

实例。

13.数据库模式：是对数据库中全体数据的逻辑结构（数据项的名字、类型、取值范

围等）和特征（数据之间的联系以及数据有关的安全性、完整性要求）的描述。

14.数据库的三级系统结构：外模式、模式和内模式。

15.数据库内模式：又称为存储模式，是对数据库物理结构和存储方式的描述，是数

据在数据库内部的表示方式。一个数据库只有一个内模式。

16.数据库外模式：又称为子模式或用户模式，它是数据库用户能够看见和使用的局

部数据的逻辑结构和特征的描述，是数据库用户的数据视图。通常是模式的子集。一个数据

库可有多个外模式。

17.数据库的二级映像：外模式/模式映像、模式/内模式映像。

二、重点知识点

1. 数据库系统由数据库、数据库管理系统、应用系统和数据库管理员构成。

2. 数据模型的组成要素是：数据结构、数据操作、完整性约束条件。

3. 实体型之间的联系分为一对一、一对多和多对多三种类型。

4. 常见的数据模型包括：关系、层次、网状、面向对象、对象关系映射等几种。

5. 关系模型的完整性约束包括：实体完整性、参照完整性和用户定义完整性。

6. 阐述数据库三级模式、二级映象的含义及作用。

数据库三级模式反映的是数据的三个抽象层次：模式是对数据库中全体数据的逻辑

结构和特征的描述。内模式又称为存储模式，是对数据库物理结构和存储方式的描述。外模

式又称为子模式或用户模式，是对特定数据库用户相关的局部数据的逻辑结构和特征的描

述。

数据库三级模式通过二级映象在 DBMS 内部实现这三个抽象层次的联系和转换。外

模式面向应用程序，通过外模式/模式映象与逻辑模式建立联系，实现数据的逻辑独立

性。模式/内模式映象建立模式与内模式之间的一对一映射，实现数据的物理独立性。

第二节

一、相关概念

1. 主键：能够唯一地标识一个元组的属性或属性组称为关系的键或候选键。若一个

关系有多个候选键则可选其一作为主键(Primary key)。

2. 外键：如果一个关系的一个或一组属性引用(参照)了另一个关系的主键，则称这个

或这组属性为外码或外键(Foreign key)。

3. 关系数据库：依照关系模型建立的数据库称为关系数据库。它是在某个应用领域

的所有关系的集合。

4. 关系模式：简单地说，关系模式就是对关系的型的定义，包括关系的属性构成、

各属性的数据类型、属性间的依赖、元组语义及完整性约束等。关系是关系模式在某一时

刻的状态或内容，关系模型是型，关系是值，关系模型是静态的、稳定的，而关系是动

态的、随时间不断变化的，因为关系操作在不断地更新着数据库中的数据。

5. . 实体完整性：用于标识实体的唯一性。它要求基本关系必须要有一个能够标识元

组唯一性的主键，主键不能为空，也不可取重复值。

6. 参照完整性：用于维护实体之间的引用关系。它要求一个关系的外键要么为空，要

么取与被参照关系对应的主键值，即外键值必须是主键中已存在的值。

7. 用户定义的完整性：就是针对某一具体应用的数据必须满足的语义约束。包括非

空、唯一和布尔条件约束三种情况。

二、重要知识点

1. 关系数据库语言分为关系代数、关系演算和结构化查询语言三大类。

2. 关系的 5 种基本操作是选择、投影、并、差、笛卡尔积。

3.关系模式是对关系的描述，五元组形式化表示为：R（U，D，DOM，F），其中

R —— 关系名

U —— 组成该关系的属性名集合

D —— 属性组 U 中属性所来自的域

DOM —— 属性向域的映象集合

F —— 属性间的数据依赖关系集合

4.笛卡尔乘积，选择和投影运算如下

第三节

一、相关概念

1. SQL：结构化查询语言的简称，是关系数据库的标准语言。SQL 是一种通用的、功

能极强的关系数据库语言，是对关系数据存取的标准接口，也是不同数据库系统之间互操

作的基础。集数据查询、数据操作、数据定义、和数据控制功能于一体。

2. 数据定义：数据定义功能包括模式定义、表定义、视图和索引的定义。

3. 嵌套查询：指将一个查询块嵌套在另一个查询块的 WHERE 子句或 HAVING 短语

的条件中的查询。

二、重要知识点

1. SQL 数据定义语句的操作对象有：模式、表、视图和索引。

2. SQL 数据定义语句的命令动词是：CREATE、DROP 和 ALTER。

3. RDBMS 中索引一般采用 B+树或 HASH 来实现。

4. 索引可以分为唯一索引、非唯一索引和聚簇索引三种类型

6.SQL 创建表语句的一般格式为

CREATE TABLE <表名>

( <列名> <数据类型>[ <列级完整性约束> ]

[，<列名> <数据类型>[ <列级完整性约束>] ] …

[，<表级完整性约束> ] ) ；

其中<数据类型>可以是数据库系统支持的各种数据类型，包括长度和精度。

列级完整性约束为针对单个列(本列)的完整性约束，包

括 PRIMARY KEY、 REFERENCES 表名(列名)、UNIQUE、NOT NULL 等。

表级完整性约束可以是基于表中多列的约束，包括 PRIMARY KEY ( 列名列表) 、

FOREIGN KEY REFERENCES 表名(列名) 等。

7. SQL 创建索引语句的一般格式为

CREATE [UNIQUE] [CLUSTER] INDEX <索引名>

ON <表名> (<列名列表> ) ；

其中 UNIQUE：表示创建唯一索引，缺省为非唯一索引；

CLUSTER：表示创建聚簇索引，缺省为非聚簇索引；

<列名列表>：一个或逗号分隔的多个列名，每个列名后可跟 ASC 或 DESC，表示

升/降序，缺省为升序。多列时则按为多级排序。

8. SQL 查询语句的一般格式为

SELECT [ALL｜DISTINCT] <算术表达式列表> FROM <表名或视图名列表>

[ WHERE <条件表达式 1> ]

[ GROUP BY <属性列表 1> [ HAVING <条件表达式 2 > ] ]

[ ORDER BY <属性列表 2> [ ASC｜DESC ] ] ；

其中

ALL／DISTINCT：缺省为 ALL，即列出所有查询结果记录，包括重复记

录。 DISTINCT 则对重复记录只列出一条。

算术表达式列表：一个或多个逗号分隔的算术表达式，表达式由常量(包括数字和字符

串)、列名、函数和算术运算符构成。每个表达式后还可跟别名。也可用 *代表查询表中的

所有列。

<表名或视图名列表>：一个或多个逗号分隔的表或视图名。表或视图名后可跟别

名。

条件表达式 1：包含关系或逻辑运算符的表达式，代表查询条件。

条件表达式 2：包含关系或逻辑运算符的表达式，代表分组条件。

<属性列表 1>：一个或逗号分隔的多个列名。

<属性列表 2>：一个或逗号分隔的多个列名，每个列名后可

跟 ASC 或 DESC，表示升/降序，缺省为升序。

关于 SQL 语句的知识这里先作如上简略介绍，具体写法下次将专门拿出一篇来叙述。

第四节

一、相关概念和知识

1.触发器是用户定义在基本表上的一类由事件驱动的特殊过程。由服务器自动激活，能

执行更为复杂的检查和操作，具有更精细和更强大的数据控制能力。使

用 CREATE TRIGGER 命令建立触发器。

2.计算机系统存在技术安全、管理安全和政策法律三类安全性问题。

3. TCSEC/TDI 标准由安全策略、责任、保证和文档四个方面内容构成。

4. 常用存取控制方法包括自主存取控制(DAC)和强制存取控制(MAC)两种。

5. 自主存取控制(DAC)的 SQL 语句包括 GRANT 和 REVOKE 两个。用户权限由数

据对象和操作类型两部分构成。

6. 常见 SQL 自主权限控制命令和例子。

1) 把对 Student 和 Course 表的全部权限授予所有用户。

GRANT ALL PRIVILIGES ON TABLE Student，Course TO PUBLIC ；

2) 把对 Student 表的查询权和姓名修改权授予用户 U4。

GRANT SELECT，UPDATE(Sname) ON TABLE Student TO U4 ；

3) 把对 SC 表的插入权限授予 U5 用户，并允许他传播该权限。

GRANT INSERT ON TABLE SC TO U5 WITH GRANT OPTION ；

4) 把用户 U5 对 SC 表的 INSERT 权限收回，同时收回被他传播出去的授权。

REVOKE INSERT ON TABLE SC FROM U5 CASCADE ；

5) 创建一个角色 R1，并使其对 Student 表具有数据查询和更新权限。

CREATE ROLE R1；

GRANT SELECT，UPDATE ON TABLE Student TO R1；

6) 对修改 Student 表结构的操作进行审计。

一、相关概念和知识点

1.数据依赖：反映一个关系内部属性与属性之间的约束关系，是现实世界属性间相互

联系的抽象，属于数据内在的性质和语义的体现。

2. 规范化理论：是用来设计良好的关系模式的基本理论。它通过分解关系模式来消除

其中不合适的数据依赖，以解决插入异常、删除异常、更新异常和数据冗余问题。

3. 函数依赖：简单地说，对于关系模式的两个属性子集 X 和 Y，若 X 的任一取值能唯

一确定 Y 的值，则称 Y 函数依赖于 X，记作 X→Y。

4. 非平凡函数依赖：对于关系模式的两个属性子集 X 和 Y，如果 X→Y，但 Y!⊆X，则

称 X→Y 为非平凡函数依赖；如果 X→Y，但 Y⊆X，则称 X→Y 为非平凡函数依赖。

5. 完全函数依赖：对于关系模式的两个属性子集 X 和 Y，如果 X→Y，并且对于 X 的

任何一个真子集 X'，都没有 X'→Y，则称 Y 对 X 完全函数依赖。

6. 范式：指符合某一种级别的关系模式的集合。在设计关系数据库时，根据满足依赖

关系要求的不同定义为不同的范式。

7. 规范化：指将一个低一级范式的关系模式，通过模式分解转换为若干个高一级范式

的关系模式的集合的过程。

8. 1NF：若关系模式的所有属性都是不可分的基本数据项，则该关系模式属于 1NF。

9. 2NF：1NF 关系模式如果同时满足每一个非主属性完全函数依赖于码，则该关系模

式属于 2NF。

10. 3NF：若关系模式的每一个非主属性既不部分依赖于码也不传递依赖于码，则该

关系模式属于 3NF。

11. BCNF：若一个关系模式的每一个决定因素都包含码，则该关系模式属于 BCNF。

12. 数据库设计：是指对于一个给定的应用环境，构造优化的数据库逻辑模式和物理

结构，并据此建立数据库及其应用系统，使之能够有效地存储和管理数据，满足各种用户的

应用需求，包括信息管理要求和数据操作要求。

13. 数据库设计的 6 个基本步骤：需求分析，概念结构设计，逻辑结构设计，物理结

构设计，数据库实施，数据库运行和维护。

14. 概念结构设计：指将需求分析得到的用户需求抽象为信息结构即概念模型的过程。

也就是通过对用户需求进行综合、归纳与抽象，形成一个独立于具体 DBMS 的概念模型。

15. 逻辑结构设计：将概念结构模型（基本 E-R 图）转换为某个 DBMS 产品所支持的

数据模型相符合的逻辑结构，并对其进行优化。

16. 物理结构设计：指为一个给定的逻辑数据模型选取一个最适合应用环境的物理结

构的过程。包括设计数据库的存储结构与存取方法。

17. 抽象：指对实际的人、物、事和概念进行人为处理，抽取所关心的共同特性，忽

略非本质的细节，并把这些特性用各种概念精确地加以描述，这些概念组成了某种模型。

18. 数据库设计必须遵循结构设计和行为设计相结合的原则。

19. 数据字典主要包括数据项、数据结构、数据流、数据存储和处理过程五个部分。

20. 三种常用抽象方法是分类、聚集和概括。

21. 局部 E-R 图之间的冲突主要表现在属性冲突、命名冲突和结构冲突三个方面。

22. 数据库常用的存取方法包括索引方法、聚簇方法和 HASH 方法三种。

23. 确定数据存放位置和存储结构需要考虑的因素主要有：存取时间、存储空间利

用率和维护代价等。

二、细说数据库三范式

2.1 第一范式（1NF）无重复的列

第一范式（1NF）中数据库表的每一列都是不可分割的基本数据项

同一列中不能有多个值

即实体中的某个属性不能有多个值或者不能有重复的属性。

简而言之，第一范式就是无重复的列。

在任何一个关系数据库中，第一范式（1NF）是对关系模式的基本要求，不满足第一

范式（1NF）的数据库就不是关系数据库。

2.2 第二范式（2NF）属性完全依赖于主键[消除部分子函数依赖]

满足第二范式（2NF）必须先满足第一范式（1NF）。

第二范式（2NF）要求数据库表中的每个实例或行必须可以被惟一地区分。

为实现区分通常需要为表加上一个列，以存储各个实例的惟一标识。

第二范式（2NF）要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在

仅依赖主关键字一部分的属性，如果存在，那么这个属性和主关键字的这一部分应该分离出

来形成一个新的实体，新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上

一个列，以存储各个实例的惟一标识。简而言之，第二范式就是属性完全依赖于主键。

2.3 第三范式（3NF）属性不依赖于其它非主属性[消除传递依赖]

满足第三范式（3NF）必须先满足第二范式（2NF）。

简而言之，第三范式（3NF）要求一个数据库表中不包含已在其它表中已包含的非主

关键字信息。

例如，存在一个部门信息表，其中每个部门有部门编号（dept_id）、部门名称、部门

简介等信息。那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部

门有关的信息再加入员工信息表中。如果不存在部门信息表，则根据第三范式（3NF）也应

该构建它，否则就会有大量的数据冗余。简而言之，第三范式就是属性不依赖于其它非主属

性。

2.4 具体实例剖析

下面列举一个学校的学生系统的实例，以示几个范式的应用。

在设计数据库表结构之前，我们先确定一下要设计的内容包括那些。学号、学生姓名、

年龄、性别、课程、课程学分、系别、学科成绩，系办地址、系办电话等信息。为了简单我

们暂时只考虑这些字段信息。我们对于这些信息，说关心的问题有如下几个方面。

1）学生有那些基本信息

2）学生选了那些课，成绩是什么

3）每个课的学分是多少

4）学生属于那个系，系的基本信息是什么。

首先第一范式（1NF）：数据库表中的字段都是单一属性的，不可再分。这个单一属

性由基本类型构成，包括整型、实数、字符型、逻辑型、日期型等。在当前的任何关系数据

库管理系统（DBMS）中，不允许你把数据库表的一列再分成二列或多列，因此做出的都是

符合第一范式的数据库。

我们再考虑第二范式，把所有这些信息放到一个表中(学号，学生姓名、年龄、性别、

课程、课程学分、系别、学科成绩，系办地址、系办电话)下面存在如下的依赖关系。

1）（学号）→ (姓名, 年龄，性别，系别，系办地址、系办电话)

2） (课程名称) → (学分)

3）（学号，课程）→ (学科成绩)

根据依赖关系我们可以把选课关系表 SelectCourse 改为如下三个表：

学生：Student(学号，姓名, 年龄，性别，系别，系办地址、系办电话)；

课程：Course(课程名称, 学分)；

选课关系：SelectCourse(学号, 课程名称, 成绩)。

事实上，对照第二范式的要求，这就是满足第二范式的数据库表，若不满足第二范式，

会产生如下问题

数据冗余：同一门课程由 n 个学生选修，"学分"就重复 n-1 次；同一个学生选修了 m 门课

程，姓名和年龄就重复了 m-1 次。

更新异常： 1)若调整了某门课程的学分，数据表中所有行的"学分"值都要更新，否则会出

现同一门课程学分不同的情况。

2)假设要开设一门新的课程，暂时还没有人选修。这样，由于还没有"学号" 关键字，课程名称和学分也无法记录入数据库。

删除异常：假设一批学生已经完成课程的选修，这些选修记录就应该从数据库表中删除。

但是，与此同时，课程名称和学分信息也被删除了。很显然，这也会导致插入异常。

我们再考虑如何将其改成满足第三范式的数据库表，接着看上面的学生表 Student(学

号，姓名, 年龄，性别，系别，系办地址、系办电话)，关键字为单一关键字"学号"，因为存

在如下决定关系：

（学号）→ (姓名, 年龄，性别，系别，系办地址、系办电话)

但是还存在下面的决定关系

(学号) → (所在学院)→(学院地点, 学院电话)

即存在非关键字段"学院地点"、"学院电话"对关键字段"学号"的传递函数依赖。

它也会存在数据冗余、更新异常、插入异常和删除异常的情况（这里就不具体分析了，

参照第二范式中的分析）。根据第三范式把学生关系表分为如下两个表就可以满足第三范式

了：

学生：(学号, 姓名, 年龄, 性别，系别)；

系别：(系别, 系办地址、系办电话)。

这一部分是 C/C++程序员在面试的时候会被问到的一些题目的汇总。来源于基本笔试面

试书籍，可能有一部分题比较老，但是这也算是基础

数据仓库概念相关

...据访问（DataAccess）三个关键部分。一、数据仓库组成：数据库是整个数据仓库环境的核心，是数据存放的地方和提供对数据检索的支持。相对查看详情

数据结构的相关概念

1，数据结构相关概念1.1数据：是描述客观事物的符号，是计算机中可以操作的对象，是能被计算机识别，并输入给计算机处理的符号集合。1.2结构：简单的理解就是关系。1.3数据结构：是相互之间存在一种或多种特定关系的数... 查看详情

数据结构相关概念

数据　　数据：是描述客观事物的符号，是计算机中可以操作的对象，是能被计算机识别，并输入给计算机处理的符号。　　　　符号必须具备两个前提：可以输入到计算机中。能被计算机程序处理。　　　　　数据元素　　　... 查看详情

oralce中相关的概念整理

【数据库名】概念：就是一个数据库的标识，作用等同于我们的身份证的作用，假设一台机器上安装了多个数据库，那么每一个数据库都会有一个数据库名称相应，这些数据库名称在数据库被创建的时候，数据库名称也会被... 查看详情

mysql数据库的相关概念(代码片段)

开始学习数据库啦~~~~~~数据库一、数据库的好处1、可以持久化数据到本地2、结构化查询方便检索3、存储大量数据4、共享、安全5、通过组合分析，获取新的数据二、数据库的常见概念★1、DB：数据库（database）。... 查看详情

一.内存模型的相关概念

一.内存模型的相关概念大家都知道，计算机在执行程序时，每条指令都是在CPU中执行的，而执行指令过程中，势必涉及到数据的读取和写入。由于程序运行过程中的临时数据是存放在主存（物理内存）当中的，这时就存在一个... 查看详情

事务相关性的概念

1什么是事务：2事务的特性3如果不考虑隔离性，引发一些读的问题4通过设置数据库的隔离级别来解决上述的问题。5如果想在Hibernate的框架中来设置隔离级别，需要在hibernate.cfg.xml的配置文件中通过标签来设置查看详情

关于并发的相关概念(代码片段)

一.内存模型的相关概念计算机在执行程序时，每条指令都是在CPU中执行的，而执行指令过程中，势必涉及到数据的读取和写入。由于程序运行过程中的临时数据是存放在主存（物理内存）当中的，这时就存在一个问题，由于CPU... 查看详情

大数据项目2（数据挖掘之数据预处理相关概念）

数据预处理相关概念一、总述二、数据清洗2.1唯一值2.2重复值2.3格式清洗2.3.1数据类型2.3.2时间、日期、数值、全半角等显示格式不一致2.3.3字符问题2.3.4思维逻辑三、数据集成四、数据归约五、数据变换六、总结一、总述需要查... 查看详情

密码学相关概念

摘要算法摘要算法是一种能产生特殊输出格式的算法，这种算法的特点是：无论用户输入什么长度的原始数据，经过计算后输出的密文都是固定长度的，这种算法的原理是根据一定的运算规则对原数据进行某种形式的提取，这种... 查看详情

关系型数据库和sql语句相关概念

...改查询)必须使用标准的sql语句来访问常见的关系型数据库 *Oracle --大型的应用，收费的。 &nb 查看详情

关系数据库标准语言sql-第一节：相关基本概念(代码片段)

文章目录一：四大基本概念（1）数据(Data)（2）数据库(DataBase,DB)（3）数据库管理系统(DataBaseManagementSystem,DBMS)（4）数据库系统(DatabaseSystem，DBS)二：关系数据库标准语言- 查看详情

王道考研计算机网络8物理层基本概念数据通信相关术语

第二章知识物理层基本概念典型的数据通信模型数据通信相关术语三种通信方式两种传输方式串行：一条信道并行：多条信道查看详情

爬虫的相关概念

1爬虫应用场合：1小规模的，数据量小，爬取速度不敏感-----爬去网页======requests库2网站资源中规模，数据规模较大，旅游网站=======scrapy库3全internet规模搜索引擎=========定制开发2爬虫引发的问题：1对网络服务器性能的骚扰2网络... 查看详情

gis系统相关的一些概念

最近在研究一个地图相关的项目，下面是一些常用的概念解释Geoserver：是OpenGisWeb服务器规范的J2EE实现，使用Geoserver可以方便的发布地图数据，允许用户对特征数据进行更新，删除，插入操作。兼容WMS和WFS特性；支持PostgreSQL、Sha... 查看详情

springcloud相关概念

...构传统项目架构传统项目分为三层架构，将业务逻辑层、数据库访问层、控制层放入在一个项目中。优点:适合于个人或者小团队开发，不适合大团队开发。分布式项目架构根据业务需求进行拆分成N个子系统，多个子系统相... 查看详情

hdfs相关概念(代码片段)

一.HDFS的NameNode的启动流程二.HDFS中NameNode元数据本地磁盘存储目录如何配置DataNode存储数据的本地磁盘目录如何配置（哪里配置，属性名称）。三：存储在HDFS上的文件，存储机制及数据安全性如何保证。一.HDFS的NameNode的启动流程... 查看详情

io编程，相关概念

在IO编程中，就存在速度严重不匹配的问题。举个例子来说，比如要把100M的数据写入磁盘，CPU输出100M的数据只需要0.01秒，可是磁盘要接收这100M数据可能需要10秒，怎么办呢？有两种办法：同步IOCPU等着，也就是程序暂停执行后... 查看详情