大家好,本节主要介绍下数据库范式的相关知识。在介绍Access数据库设计步骤时,有提到过数据库范式的概念。
前面在介绍数据库的E-R模型时,其实就已经按照数据库范式的标准来设计的,那么本节做详细的补充说明。
范式概述在设计Access数据库的表时,追求的目标是设计性能优良的数据库表,减少数据的冗余和错误,因而在设计数据库表时可以遵循一些规范的规则,这些规则就是范式。
关系型数据库目前通常有6层范式,从最低要求的第一范式1NF,以此类推,一直到最高要求的6NF。)通常达到第三层范式就可以作为性能优良的数据库。
下面简单说下1NF、2NF、3NF的要求。
第一范式INF是要求没有重复的列。
第二范式2NF是在1NF的基础上,必须有主键,要求属性必须完全依赖于主键。
第三范式3NF是要求在2NF的基础上,要求属性不依赖于其他非主属性。
第一范式第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项。同一列中不能有多个值。
所以数据表中,实体中的某个属性不能有多个值,或者重复值。
比如下图就是错误示例。联系方式字段中,包含了两个值,分别是联系电话和住址,不符合第一范式的要求。
正确的解决方式就是建立新的字段,用来保存读者的地址,从而是联系方式字段下的值不可再分。如下图所示:
第二范式第二范式(2NF)首先要满足第一范式的要求,然后必须有主键,其他每个非主键的字段都完全依赖于主键。
下面先通过错误的示例来举例,再进行解释。下图中以学号和课程号两个字段作为复合主键。
那么在这个错误示例中,学号和课程号作为复合主键,姓名可以由主键之一的学号单独决定,课程名可以由主键中的课程号决定。那么说明姓名字段和课程名字段都不是完全依赖于主键,而只是依赖主键的一部分。
那么只有成绩字段是完全依赖主键的,需要学号和课程号共同决定。所以示例中不符合第二范式。
解决的方法就是拆表,拆成3张表,学生表包括学号和姓名字段,课程表包括课程号和课程名字段,然后学号、课程号和成绩组成成绩表,如下图所示。
这里之所以成绩表增加另外的成绩单号作为主键为了方便建立关系,拆分的3张表格不会单独存在,就需要用到建立表关系。如下所示:
第三范式第三范式(3NF)首先要满足第二范式的要求,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
概念不容易理解,下面还是通过错误示例来演示和说明。下面是不符合第三范式的示例图:
可以看到图书表里,主键是书号,其他非主属性的字段都可以通过主键来区分,就可以说是完全依赖于主键,是符合第二范式的。
但是可以发现出版商名称和联系方式两个字段,是可以由出版商号来决定区分的,而表中出版商号是由书号区分的。那么在表中就形成了传递依赖的关系。
所以解决的办法就是拆表,将现在的图书表中的出版商号和联系方式移出,和出版商号构成一张表,由出版商号做主键,如下图所示:
之后将两张表建立关系,如下图所示即可。
这样就解决了符合第二范式要求,但不符合第三范式要求的问题。大家在结合定义中的任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)来理解下。
其他范式达到第三范式的要求后,数据库可以有效减少冗余,节省存储空间,性能优良。
而对于数据库的更高的范式,从第四范式到第六范式(或者是BCNF范式、第四范式、第五范式)非专业不要求。如果需要再查询工具书。
今天下雨
本节主要介绍了第一范式到第三范式的基本内容,希望大家通过示例来理解,祝大家学习快乐。记得戴口罩,勤洗手。
LiveandLearn