因此,我正在研究使用 Data Migration Service Chance Data Capture 可以实现什么,将数据从 MSSQL 转移到 S3 以及 Redshift。
红移测试很好,如果我删除源数据库中的记录,一两秒后该记录从红移中消失。与插入/更新等相同..
但是S3 ...您从第一次满载中获得原始记录。然后,如果您更新源中的记录,S3 会收到该记录的新副本,并标有“I”。
如果我删除一条记录,我会得到另一份标有“D”的记录副本。
所以我的问题是——我该怎么处理这一切?如何查询我的 S3 存储桶以查看我的数据集的“当前”状态以反映源数据库?
我是否必须自己编写一些代码来获取所有这些文件并处理它们,执行插入/更新和删除,直到我最终解析回“正常”数据集?
欢迎任何见解!