我只是在阅读有关Data Vault 建模的内容,据我了解,集线器仅包含密钥(和记录源)。所以我想知道为什么我应该创建那些集线器表,只是为了存储记录源?只有卫星和链接还不够吗?
顺便说一句:我正在寻找数据保险库形式的简单 mysql 表以供下载和使用。
我只是在阅读有关Data Vault 建模的内容,据我了解,集线器仅包含密钥(和记录源)。所以我想知道为什么我应该创建那些集线器表,只是为了存储记录源?只有卫星和链接还不够吗?
顺便说一句:我正在寻找数据保险库形式的简单 mysql 表以供下载和使用。
Data Vault 建模的主要概念之一是分离业务密钥、详细数据的卫星和连接集线器的链接。
例子
Employee
--------
Personnel Number
Name
Surname
Street
City
Department
--------
ID
Shortcode
Name
Employee Number
假设一个部门只有一名员工。
业务密钥
现在需要识别业务对象Employee和Department的业务标识符。这将是Employee 的Personnel Number和Department的简码。
为什么没有部门的ID?那么,ID 很可能是数据库内部 ID。在此示例中,简码类似于,在内部也用于标识部门。DEP_A1613
造型
Employee的中心仅由字段Personnel Number和Department only 的Shortcode的中心组成。
这意味着 Data Vault 建模中的 Hub仅用于存储业务密钥。当然,还需要记录源、加载日期等 Data Vault 字段。两个集线器也将具有用于描述数据的相应卫星。在没有集线器的情况下将卫星连接在一起将违反 Data Vault 建模技术。这也没有任何意义:您需要为您的卫星数据提供某种通用标识符,如果您省略集线器,这些标识符将不存在。
结论
因此,回答您的问题:您应该为业务密钥建模集线器。绝对地。集线器实际上是 Data Vault 建模的基本元素。链接只连接到集线器,而不连接到卫星。
想象一下 Employee 软件的变化。所有其他字段现在都存储在 Employee 卫星中。使用新源 Employee 软件时,您可以将所有数据存储在新卫星中,同时使用相同的 Hub 和业务密钥。
只是为了完成这个示例:该链接将使用Employee Number连接Department中的Employee和Department。
编辑
因此,例如,结构看起来像这样。Data Vault 特定字段标有 [DV]:
Hub Employee
------------
Employee Hash Key [DV]
Load Date [DV]
Record Source [DV]
Personnel Number
Sat Employee
------------
Employee Hash Key [DV]
Load Date [DV]
Load End Date [DV]
Record Source [DV]
Hash Diff [DV]
Name
Surname
Street
City
Link Employee Department
------------------------
Employee Department Hash Key [DV]
Employee Hash Key [DV]
Department Hash Key [DV]
Hub Department
--------------
Department Hash Key [DV]
Load Date [DV]
Record Source [DV]
Shortcode
Sat Department
--------------
Department Hash Key [DV]
Load Date [DV]
Load End Date [DV]
Record Source [DV]
Hash Diff [DV]
ID
Name
集线器是应用多个源的被动集成的地方。您将有一个数据源列,并在每个键首次到达您的集线器时记录它的所有实例。例如,如果我有一个 CRM 系统和一个 ERP 系统,并且我先从 CRM 系统同步数据,那么 ERP 数据就可用了。我将添加来自 CRM 系统的所有键,数据源列值为“CRM”。然后当我引入 ERP 系统时,假设我有相同的表键结构,我只会添加仅存在于 ERP 系统中的新键,数据源为“ERP”。如果密钥不同,则必须添加来自两个系统的所有数据。关键是您保留了来自所有正在运行的系统的所有数据。当你移动到下一层时,无论是 Business Data Vault 还是 Data Mart,您都可以根据“业务规则”对集线器和卫星应用业务逻辑,以便在适用的情况下为两个系统获取单个结果行。如果您在将其存储在此中间状态之前使用转换,您将失去审计能力,以及在以后更改业务规则的能力。说得通?