2

我只是在阅读有关Data Vault 建模的内容,据我了解,集线器仅包含密钥(和记录源)。所以我想知道为什么我应该创建那些集线器表,只是为了存储记录源?只有卫星和链接还不够吗?

顺便说一句:我正在寻找数据保险库形式的简单 mysql 表以供下载和使用。

4

2 回答 2

3

Data Vault 建模的主要概念之一是分离业务密钥、详细数据的卫星和连接集线器的链接。

例子

Employee
--------
Personnel Number
Name
Surname
Street
City

Department
--------
ID
Shortcode
Name
Employee Number

假设一个部门只有一名员工。

业务密钥

现在需要识别业务对象EmployeeDepartment的业务标识符。这将是Employee 的Personnel NumberDepartment简码

为什么没有部门ID?那么,ID 很可能是数据库内部 ID。在此示例中,简码类似于,在内部也用于标识部门。DEP_A1613

造型

Employee的中心仅由字段Personnel NumberDepartment only 的Shortcode的中心组成。

这意味着 Data Vault 建模中的 Hub仅用于存储业务密钥。当然,还需要记录源加载日期等 Data Vault 字段。两个集线器也将具有用于描述数据的相应卫星。在没有集线器的情况下将卫星连接在一起将违反 Data Vault 建模技术。这也没有任何意义:您需要为您的卫星数据提供某种通用标识符,如果您省略集线器,这些标识符将不存在。

结论

因此,回答您的问题:您应该为业务密钥建模集线器。绝对地。集线器实际上是 Data Vault 建模的基本元素。链接只连接到集线器,而不连接到卫星。

想象一下 Employee 软件的变化。所有其他字段现在都存储在 Employee 卫星中。使用新源 Employee 软件时,您可以将所有数据存储在新卫星中,同时使用相同的 Hub 和业务密钥

只是为了完成这个示例:该链接将使用Employee Number连接Department中的EmployeeDepartment

编辑

因此,例如,结构看起来像这样。Data Vault 特定字段标有 [DV]:

Hub Employee
------------
Employee Hash Key [DV]
Load Date [DV]
Record Source [DV]
Personnel Number

Sat Employee
------------
Employee Hash Key [DV]
Load Date [DV]
Load End Date [DV]
Record Source [DV]
Hash Diff [DV]
Name
Surname
Street
City

Link Employee Department
------------------------
Employee Department Hash Key [DV]
Employee Hash Key [DV]
Department Hash Key [DV]

Hub Department
--------------
Department Hash Key [DV]
Load Date [DV]
Record Source [DV]
Shortcode

Sat Department
--------------
Department Hash Key [DV]
Load Date [DV]
Load End Date [DV]
Record Source [DV]
Hash Diff [DV]
ID
Name
于 2016-10-12T15:36:10.547 回答
2

集线器是应用多个源的被动集成的地方。您将有一个数据源列,并在每个键首次到达您的集线器时记录它的所有实例。例如,如果我有一个 CRM 系统和一个 ERP 系统,并且我先从 CRM 系统同步数据,那么 ERP 数据就可用了。我将添加来自 CRM 系统的所有键,数据源列值为“CRM”。然后当我引入 ERP 系统时,假设我有相同的表键结构,我只会添加仅存在于 ERP 系统中的新键,数据源为“ERP”。如果密钥不同,则必须添加来自两个系统的所有数据。关键是您保留了来自所有正在运行的系统的所有数据。当你移动到下一层时,无论是 Business Data Vault 还是 Data Mart,您都可以根据“业务规则”对集线器和卫星应用业务逻辑,以便在适用的情况下为两个系统获取单个结果行。如果您在将其存储在此中间状态之前使用转换,您将失去审计能力,以及在以后更改业务规则的能力。说得通?

于 2016-11-03T17:15:17.543 回答