包含销售数据的输入文件将在特定时间以 csv 格式发送到 s3 存储桶,每天最多 5 个文件。
使用 Glue 将要加载到 Redshift 中的 csv 文件数据。
在加载到 Redshift 之前,需要进行转换,例如从 csv 文件文件进行计算和映射。
请分享您对如何构建有效解决方案的意见/建议。
下面一定要注意。
1.复制客户端可能发送或不发送的csv。2.same data表示前一天的数据已在第二天发送。3. 想要处理 Redshift 表上的更新和插入。4. csv 文件在处理/加载到 Redshift 后,将这些文件移动到 S3 存储桶中的另一个位置。