1) Relational database normalization
关系数据库规范化
2) the relational database normalization theory
关系数据库规范化理论
3) The stondardization of database
数据库的规范化
5) Database Normalization Design
数据库规范化设计
6) Multidatabase normal tree
多数据库规范树
补充资料:关系数据库
采用关系模型的数据库,有时也指关系数据库系统。关系数据模型是1970年E.F.科德提出的。随后,他对关系代数、关系演算和关系规范化理论等方面的发展作出了重要贡献,并为关系数据库系统的理论和实践奠定了基础。
关系模型 给定一组域(域是值的集合)D1,D2,...,Dn(这组域中可以有相同域),则其笛卡尔乘积D1×D2×...×Dn的子集可以构成一张二维表,称为一个关系。n为关系的目或度。表的每一行称为一个元组;表的每一列是同类型的数据。表的列必须具有唯一性的名字,称为属性名。一个元组中的某一属性值称为一个分量。关系模型中关系的每一个分量,必须是不可分的数据项。
关系模式用于描述关系。它是一个五元组〈R,U,D,DOM,F〉。其中,R为关系名;U为属性集合;它们来自一组域D;DOM为属性到域的映射;F为一组数据相关,是一类完整性约束条件。某一时刻一个关系模式的实例称为关系状态,简称关系。关系模型的操作部分具有关系处理能力。它把整个关系作为操作对象。具有关系处理能力的关系数据语言,可分为关系代数、关系演算和介于两者之间的语言。一般以关系代数作为度量语言处理功能的标准。关系代数除提供传统的集合运算如并、交、差运算外,还提供了选择(SELECT)、投影(PROJECT)、连接(JOIN)等操作。
如果由关系代数的选择、投影、连接操作表达的任何查询均能为某种语言表达,而不必使用迭代、递归命令,则可认为该语言具有关系处理能力。
关系数据库管理系统 关系数据库的管理系统有三个必要条件:①数据库中的全部信息均用二维表表示;②在这些表之间不存在用户可见的导航链;③具有关系处理能力的数据语言。满足以上三个条件的数据库管理系统称为最小关系系统。不具备第三个条件的数据库管理系统称为表系统或半关系系统。如果一个数据库管理系统还满足另外两个条件:①支持全部的关系代数操作;②支持关系模型的两个完整性规则(实体完整性和实体间参照完整性),则称为全关系系统。
按数据语言的特征,关系数据库管理系统又可分为一致性关系系统和非一致性关系系统。一致性关系系统的数据语言,既可以终端交互方式使用,又可以嵌入宿主语言,用编写应用程序的方式使用,否则就称为非一致性关系系统。
关系数据理论 研究关系模型中数据相关和规范化的理论。数据相关是关系模型中描述数据之间联系的一类完整性约束条件,通常通过数据之间值的相等与否来体现。数据相关包括函数相关、多值相关、互连相关和连接相关等,最常用的是前两种。
关系数据理论的研究以关系模型为背景。由于关系模型可以等价地转换为其他数据模型,关系数据理论的研究具有普遍意义。关系数据理论中数据相关的理论,用明确的概念来描述和分析数据模型中数据关联这一类特殊的完整性约束。这是形式语义的一种方法,规范化的概念和范式的定义给出了判别模式好坏的准则,使数据库设计有了评价模式的理论依据。模式分解的概念和算法,又为数据库设计提供了辅助设计的工具。关系数据理论不仅是数据库的理论基础,而且是数据库设计的指南和工具。
数据相关是语义范畴的概念。但是,为了形式推理的需要,这些数据相关都有严格的形式定义。例如,R(U)是属性集 U上的一个关系模式,X、Y是 U的子集。对于R(U)的任何一个可能的关系r,若r中不可能有两个元组在X中属性值相等而在Y中的属性值不等,则称X函数决定Y或Y函数相关X,记作X→Y。
在R(U)的任何一个关系r中,若存在元组t、s∈r,使t[X]=s[X],则必存在元组ω、v∈r,使得ω[X]=v[X]=t[X],ω[Y]=t[Y],ω[Z]=s[Z],v[Y]=s[Y],v[Z]=t[Z]成立。式中X,Y是U的子集,Z=U-X-Y。则称Y多值相关于X,记为X→Y。
利用数学和算法作为工具,对数据相关的研究已得到了函数相关范围内的一组完备而有效的推理规则──阿姆斯特朗公理系统,以及函数相关与多值相关范围内的一组完备而有效的推理规则。
如果关系模式所对应的关系中,每一分量是不可分的数据项,则称此关系模式满足第一范式(1NF)。第一范式的关系模式可能存在插入、删除、更新异常和数据冗余等缺点。这类缺点是由于关系模式中存在不合适的数据相关造成的。人们按照属性间数据相关的性质,衡量关系模式的规范化程度,满足不同条件的关系模式属于不同的范式。规范化和范式的概念是E.F.科德于1971至1972年提出的,他在函数相关范围内给出了第一范式至第三范式(3NF)的定义。1974年,E.F.科德等提出了修正的第三范式即BC范式(BCNF)。1976年,F.法金又在函数相关和多值相关范围内提出了第四范式 (4NF)。后又有人在连接相关的范围内提出了第五范式 (5NF)的概念。范式越高关系模式的规范化程度越高。把低一级范式的关系模式转换为高一级范式关系模式的过程称为规范化过程。规范化过程就是逐步消除不合适的数据相关的过程。这个过程如下:规范化的方法通常用投影分解法。这种分解结果不是唯一的。关于分解后的关系模式与原模式"等价"的讨论产生了不同分解准则下的分解算法(即分解法和合成法)。这些准则是:①分解具有无损连接性;②分解保持函数相关;③分解既要有无损连接性又要保持函数相关。按准则①用分解法分解后的模式一定可达到5NF;按准则②或③用合成法分解后的模式一定可达到3NF,但不一定能达到更高的范式。
参考书目
萨师煊、王珊:《数据库系统概论》,高等教育出版社,北京,1984。
关系模型 给定一组域(域是值的集合)D1,D2,...,Dn(这组域中可以有相同域),则其笛卡尔乘积D1×D2×...×Dn的子集可以构成一张二维表,称为一个关系。n为关系的目或度。表的每一行称为一个元组;表的每一列是同类型的数据。表的列必须具有唯一性的名字,称为属性名。一个元组中的某一属性值称为一个分量。关系模型中关系的每一个分量,必须是不可分的数据项。
关系模式用于描述关系。它是一个五元组〈R,U,D,DOM,F〉。其中,R为关系名;U为属性集合;它们来自一组域D;DOM为属性到域的映射;F为一组数据相关,是一类完整性约束条件。某一时刻一个关系模式的实例称为关系状态,简称关系。关系模型的操作部分具有关系处理能力。它把整个关系作为操作对象。具有关系处理能力的关系数据语言,可分为关系代数、关系演算和介于两者之间的语言。一般以关系代数作为度量语言处理功能的标准。关系代数除提供传统的集合运算如并、交、差运算外,还提供了选择(SELECT)、投影(PROJECT)、连接(JOIN)等操作。
如果由关系代数的选择、投影、连接操作表达的任何查询均能为某种语言表达,而不必使用迭代、递归命令,则可认为该语言具有关系处理能力。
关系数据库管理系统 关系数据库的管理系统有三个必要条件:①数据库中的全部信息均用二维表表示;②在这些表之间不存在用户可见的导航链;③具有关系处理能力的数据语言。满足以上三个条件的数据库管理系统称为最小关系系统。不具备第三个条件的数据库管理系统称为表系统或半关系系统。如果一个数据库管理系统还满足另外两个条件:①支持全部的关系代数操作;②支持关系模型的两个完整性规则(实体完整性和实体间参照完整性),则称为全关系系统。
按数据语言的特征,关系数据库管理系统又可分为一致性关系系统和非一致性关系系统。一致性关系系统的数据语言,既可以终端交互方式使用,又可以嵌入宿主语言,用编写应用程序的方式使用,否则就称为非一致性关系系统。
关系数据理论 研究关系模型中数据相关和规范化的理论。数据相关是关系模型中描述数据之间联系的一类完整性约束条件,通常通过数据之间值的相等与否来体现。数据相关包括函数相关、多值相关、互连相关和连接相关等,最常用的是前两种。
关系数据理论的研究以关系模型为背景。由于关系模型可以等价地转换为其他数据模型,关系数据理论的研究具有普遍意义。关系数据理论中数据相关的理论,用明确的概念来描述和分析数据模型中数据关联这一类特殊的完整性约束。这是形式语义的一种方法,规范化的概念和范式的定义给出了判别模式好坏的准则,使数据库设计有了评价模式的理论依据。模式分解的概念和算法,又为数据库设计提供了辅助设计的工具。关系数据理论不仅是数据库的理论基础,而且是数据库设计的指南和工具。
数据相关是语义范畴的概念。但是,为了形式推理的需要,这些数据相关都有严格的形式定义。例如,R(U)是属性集 U上的一个关系模式,X、Y是 U的子集。对于R(U)的任何一个可能的关系r,若r中不可能有两个元组在X中属性值相等而在Y中的属性值不等,则称X函数决定Y或Y函数相关X,记作X→Y。
在R(U)的任何一个关系r中,若存在元组t、s∈r,使t[X]=s[X],则必存在元组ω、v∈r,使得ω[X]=v[X]=t[X],ω[Y]=t[Y],ω[Z]=s[Z],v[Y]=s[Y],v[Z]=t[Z]成立。式中X,Y是U的子集,Z=U-X-Y。则称Y多值相关于X,记为X→Y。
利用数学和算法作为工具,对数据相关的研究已得到了函数相关范围内的一组完备而有效的推理规则──阿姆斯特朗公理系统,以及函数相关与多值相关范围内的一组完备而有效的推理规则。
如果关系模式所对应的关系中,每一分量是不可分的数据项,则称此关系模式满足第一范式(1NF)。第一范式的关系模式可能存在插入、删除、更新异常和数据冗余等缺点。这类缺点是由于关系模式中存在不合适的数据相关造成的。人们按照属性间数据相关的性质,衡量关系模式的规范化程度,满足不同条件的关系模式属于不同的范式。规范化和范式的概念是E.F.科德于1971至1972年提出的,他在函数相关范围内给出了第一范式至第三范式(3NF)的定义。1974年,E.F.科德等提出了修正的第三范式即BC范式(BCNF)。1976年,F.法金又在函数相关和多值相关范围内提出了第四范式 (4NF)。后又有人在连接相关的范围内提出了第五范式 (5NF)的概念。范式越高关系模式的规范化程度越高。把低一级范式的关系模式转换为高一级范式关系模式的过程称为规范化过程。规范化过程就是逐步消除不合适的数据相关的过程。这个过程如下:规范化的方法通常用投影分解法。这种分解结果不是唯一的。关于分解后的关系模式与原模式"等价"的讨论产生了不同分解准则下的分解算法(即分解法和合成法)。这些准则是:①分解具有无损连接性;②分解保持函数相关;③分解既要有无损连接性又要保持函数相关。按准则①用分解法分解后的模式一定可达到5NF;按准则②或③用合成法分解后的模式一定可达到3NF,但不一定能达到更高的范式。
参考书目
萨师煊、王珊:《数据库系统概论》,高等教育出版社,北京,1984。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条