我们有一个 ETL 服务提供商,它每 3 小时从我们的 CRM 将数据加载到我们的 Redshift 实例中。我们希望深入了解每次同步或至少每周同步所做的更改。
我的第一直觉是每天触发一个 lambda,将整个表复制到一个存档中,
例如CREATE TABLE crm.leads_YYYY_MM_DD FROM (SELECT * FROM crm.leads)
并围绕表之间的字段级差异构建一些报告。我想知道是否有更智能的方法。这似乎很难从中创建历史记录,并且可能会不必要地存储大量未更改的数据。什么是更好的策略?