我们如何在 MarkLogic 中保留出处和血统?
信封模式的用例是什么?
从数据源导出数据时,是否有任何方法可以跟踪数据沿袭?
我们如何在 MarkLogic 中保留出处和血统?
信封模式的用例是什么?
从数据源导出数据时,是否有任何方法可以跟踪数据沿袭?
您可能对 MarkLogic跟踪数据来源按需教程感兴趣
在数据治理系列的第 1 集中,您将探索数据来源的概念。您将了解跟踪数据来源或数据来源对于理解数据及其沿袭至关重要。在使用 MarkLogic 数据中心框架和信封模式集成数据孤岛时,您将亲身体验并学习如何实现这一目标。
该概念应用于 MarkLogic 数据中心
在 MarkLogic 中,出处跟踪数据的来源,而沿袭是数据的历史。出处元数据是由 MarkLogic 数据中心跟踪的出处信息和沿袭信息的组合集。在 MarkLogic Server 中,从摄取到其生命周期对记录所做的每次更改都会更新出处信息。
所有出处和沿袭信息都作为 XML 文档(使用 PROV XML 模式)存储在 data-hub-JOBS 数据库中,并添加到受保护的集合http://marklogic.com/provenance-services/record中。创建出处和沿袭记录时,还会生成定义信息片段之间关系的三元组。
此博客中解释了设计模式
在构建利用来自不同来源的数据的应用程序时,尤其是在语义上下文中,通常希望捕获来源信息,例如来源和上次更新时间。
使用信封模式,用出处细节注释三元组的 JSON/XML 序列化。