数据库管理系统 数据仓库的数据建模
数据建模指的是在数据仓库平台内处理和设计数据模型的过程。它包括创建适当的数据库模式,以便传输可以存储和对用户有用的数据。数据仓库建模有两个原因,第一是通过模式可以可视化数据仓库中的关系,第二是通过设计良好的模式降低成本并提高效率,从而实现有效的数据仓库结构。数据仓库的数据建模与操作数据库系统中的建模不同,因此可以对复杂查询进行高效处理。
数据建模生命周期
在这个生命周期中,我们将逐步了解将业务需求转化为处理IT系统中的数据的目标的过程。目标是为业务创建一个存储区域,而逻辑和物理数据建模有所帮助。数据建模生命周期中使用的三个步骤如下:
概念数据模型
概念数据模型是指关系的有组织的视图,即在实体之间找到的最高级别关系。目标是建立实体和它们之间的关系。
概念数据模型的特点:
- 仅显示实体和它们之间的关系
-
几乎没有实际数据库中的其他数据。
-
没有指定属性和主键。
-
主要用于业务用户。
逻辑数据模型
它以结构的形式显示信息,而不知道它们的物理外观。其主要目的是使用业务数据结构、过程和关系创建一个单一视图。
逻辑数据模型的特点:
- 每个实体都具有属性。
-
实体带有关系。
-
存在键和非键属性。
-
属性名称用户友好。
-
比概念数据模型详细。
-
存在主键和外键关系。
-
指定外键关系(引用完整性)。
物理数据模型
它指的是数据库结构的可视化,即在复制表结构、列、数据类型、键、约束和表之间的关系后,模型在数据库中的外观。其主要目的是将逻辑数据模型显示为由数据仓库托管的关系数据库系统的物理结构。它还使用新的数据结构提高查询性能。
物理数据模型的特点:
- 实体和属性分别被称为表格和列。
-
列的数据类型、长度和值是精确的。
-
主键和外键用于定义表格之间的关系。
-
所有表格和列的规范。
结论
本文介绍了数据仓库中的数据建模,用于处理和设计数据仓库中的数据模型。模式用于可视化关系并提高效率,从而降低成本。数据建模生命周期包括三个部分。首先是概念数据模型,它指的是关系的组织视图。其次是逻辑数据模型,它创建了一个结构的单一视图和信息,而没有物理外观。第三是物理数据模型,它将逻辑数据模型可视化为物理数据模型,从而提高查询性能。