Skip to content

Latest commit

 

History

History
47 lines (33 loc) · 2.54 KB

3.数据建模.md

File metadata and controls

47 lines (33 loc) · 2.54 KB
1、什么是数据建模?
2、为什么要进行数据建模?
3、Inmon和Kimball架构?
Inmon提出的集线器的自上而下(EDW-DM)的数据仓库架构。操作型或事务型系统的数据源,通过ETL抽取转换和加载到数据仓库的ODS层,
然后通过ODS的数据建设原子数据的数据仓库EDW,EDW不是多维格式的,不方便上层应用做数据分析,
所以需要通过汇总建设成多维格式的数据集市层。优势:易于维护,高度集成;劣势:结构死板,部署周期较长

Kimball提出的总线式的自下而上(DM-DW)的数据仓库架构。同样的,操作型或事务型系统的数据源,通过ETL抽取转换和加载到数据仓库的ODS层,
然后通过ODS的数据,利用维度建模方法建设一致维度的数据集市。通过一致性维度可以将数据集市联系在一起,由所有的数据集市组成数据仓库。
优势:构建迅速,最快的看到投资回报率,敏捷灵活;劣势:作为企业资源不太好维护,结构复杂,数据集市集成困难。
4、数据建模几种方式?
3NF
5、范式建模与维度建模区别?
1、范式建模:Inmon提出的集线器的自上而下(EDW-DM)的数据仓库架构。

范式(NF)
一张数据表的表结构所符合的某种设计标准的级别。
第一范式(1NF):符合1NF的关系中的每个属性都不可再分。
第二范式(2NF):消除了非主属性对码的部分函数依赖。
第三范式(3NF):3NF在2NF的基础之上,消除了非主属性对于码的传递函数依赖。

一个符合第三范式的关系必须具有一下三个条件:
    每个属性的值唯一,不具有多义性;
    每个非主属性必须完全依赖于整个主键,而非主键的一部分;
    每个非主属性不能依赖于其它关系中的属性;       

2、维度建模:Kimball提出的总线式的自下而上(DM-DW)的数据仓库架构。
一般用到的模型有:
    星型模型、雪花模型、星座模型

一般dw层(明细层,数据粒度与ods层一致)会采用范式建模。dm层会采用维度建模。
6、数据建模数据分层?