我想为没有审计字段的源系统设置增量加载模式,该字段说明上次修改记录的时间。示例:持续修改时间(日期时间)
但是这些表是用主键和唯一键定义的,当属性发生任何变化时,应用程序使用它们来更新记录。
现在的问题是我如何确定 Delta 的每一天并使用 Azure Data Factory / Databricks 将它们加载到 Azure Data Lake 中。
我是否应该从当天和当天 -1 暂存全套数据并使用散列值确定增量?
还是有更好的方法?
我想为没有审计字段的源系统设置增量加载模式,该字段说明上次修改记录的时间。示例:持续修改时间(日期时间)
但是这些表是用主键和唯一键定义的,当属性发生任何变化时,应用程序使用它们来更新记录。
现在的问题是我如何确定 Delta 的每一天并使用 Azure Data Factory / Databricks 将它们加载到 Azure Data Lake 中。
我是否应该从当天和当天 -1 暂存全套数据并使用散列值确定增量?
还是有更好的方法?