在数据仓库项目中,为什么我们需要在从登陆/暂存区数据库传输数据集市(使用 Kimball 方法)中的数据之前使用 DataVault 建模?即为什么我们不能使用 Kimball 方法将数据直接从着陆/集结区数据库传输到最终数据集市?
必须这样做吗?
问问题
271 次
2 回答
4
好吧,您不需要使用 Data Vault 方法。此外,您不需要使用 Kimball。此外,您不需要使用 3nf。
这一切都取决于您在环境中的要求。上
- 数据结构,
- 数据复杂度,
- 浆纱,
- 时间表,
- 改变源格式,
- 需要历史化,
- 报告、仪表板或其他 ETL 结构的要求...
没有“需要”专门做 Data Vault。
这完全取决于您想做什么以及您的要求是什么。
于 2017-08-28T10:57:40.357 回答
0
我最近注意到,Data Vault 2.0 方法在 EDW 项目中变得相当流行。Kimball/Star-schema 数据模型仍然被大量使用,但它们主要只是 Data Vault 之上允许报告的顶级抽象。
Kent Graziano 有一本很好的入门书,可以在这里理解 DV 建模,这是 Dan Linstedt 的书的摘录(也是一本很好的读物)。
于 2019-10-23T06:18:07.580 回答