-1

我将设计一个数据仓库(虽然这不是一个简单的过程)。我想知道整个 ETL 过程,数据仓库中的数据将如何提取/转换到数据集市?Datawarehouse vs Datamart 中是否有任何模型设计?通常也有starschema或雪花?所以我们应该像下面这样放置表格

在数据仓库中 dim_tableA dim_tableB fact_tableA fact_tableB

而在 Datamart A dim_tableA(来自数据仓库的完整副本)fact_tableA(来自数据仓库的完整副本)

在 Datamart B dim_tableB(来自数据仓库的完整副本)fact_tableB(来自数据仓库的完整副本)

它是真实的例子,可以展示数据仓库和数据集市之间的模型差异吗?

4

2 回答 2

0

数据集市包含收集的汇总数据存储库,用于分析组织内的特定部分或单位,例如销售部门。...数据仓库是一个大型集中式数据存储库,其中包含来自组织内许多来源的信息。

根据他们的需求,公司可以为不同的部门使用多个数据集市,并通过合并不同的集市来选择数据集市整合,以在以后构建单个数据仓库。这种方法称为 Kimball 尺寸设计方法。另一种称为 Inmon 方法的方法是首先设计一个数据仓库,然后根据需要为特定服务创建多个数据集市。

一个例子:在数据仓库中,电子邮件点击是根据点击日期记录的,电子邮件地址只是点击参数之一。对于 CRM 专家,电子邮件地址(或任何其他客户标识符)将是切入点:与每个联系人相对、点击频率、最后点击日期等。

Datamart 是一个棱镜,可以根据用户调整数据。在这方面,其成功的关键在很大程度上取决于数据的组织方式。用户越容易理解,结果就越好。这就是为什么每个领域的标题及其计算方法必须尽可能贴近交易用途。

于 2021-12-08T22:06:48.527 回答
0

我赞同尼克的回应,并以更技术性的方式遵循 Kimball 方法:

In my opinion and my experience. At high level ,we have data marts like Service Analytics , Financial Analytics , Sales Analytics , Marketing Analytics ,Customer Analytics etc. These were grouped as below
Subject Areas -> Logical grouping(Star Modelling) ->Data Marts -> Dimension &Fact (As per Kimball’s)
Example:
AP Real Time ->Supplier, Supplier Transaction’s , GL Data -> Financial Analytics + Customer Analytics->Physical Tables
于 2021-12-08T15:47:57.670 回答