1

我有在存储在 dbfs(databricks 文件系统)中的表中执行转换的笔记本。我想捕获并显示数据沿袭。另外我想知道如何在 hdinsight 中做同样的事情。

4

1 回答 1

2

Spline 源自 Spark 和 Lineage 两个词。它是一种用于可视化和跟踪数据如何随时间变化的工具。Spline 提供了一个 GUI,用户可以在其中查看和分析数据如何转换以产生洞察力。

您可以查看使用 Spline和数据沿袭跟踪和可视化解决方案在 Databricks Notebook 上解释 Spark 数据沿袭的文章。

于 2020-09-25T07:47:26.827 回答