Azure Purview 目前仅显示来自 ADF 的复制活动的数据沿袭。这足够了吗?在本文中给出:“通过将元数据从 Azure 数据工厂推送到 Azure Purview,可以启用可靠且透明的沿袭跟踪。” 这是否超出了复制活动?如果是,我们如何才能做到这一点?
Azure 中是否有其他方法可以查看完整的数据沿袭?假设我们正在使用 ADF/Synapse/Azure Databricks。
Azure Purview 目前仅显示来自 ADF 的复制活动的数据沿袭。这足够了吗?在本文中给出:“通过将元数据从 Azure 数据工厂推送到 Azure Purview,可以启用可靠且透明的沿袭跟踪。” 这是否超出了复制活动?如果是,我们如何才能做到这一点?
Azure 中是否有其他方法可以查看完整的数据沿袭?假设我们正在使用 ADF/Synapse/Azure Databricks。
Data Factory、Data Share、Synapse、Azure Databricks 等工具都属于数据系统的范畴。当前与 Purview for lineage 集成的数据处理系统列表可在此处查看 Azure Purview Data Catalog lineage user guide
目前 Azure 数据工厂,支持范围:复制活动、 数据流活动 、 执行 SSIS 包活动 并且数据工厂和 Purview 之间的集成仅支持数据工厂支持的数据系统的子集,如此处所述。
Azure Purview 当前不支持用于沿袭或扫描的查询或存储过程。Lineage 仅限于表和视图源。
在沿袭视图中查找信息的其他一些方法包括:
还通过 Atlas 挂钩和 REST API 支持自定义血统报告。数据集成和 ETL 工具可以在执行时将沿袭推送到 Azure Purview。
将 Azure Purview 帐户连接到 Synapse 工作区可让您发现 Azure Purview 资产并通过 Synapse 功能与它们进行交互。
以下是 Synapse 中可用的 Azure Purview 功能列表: