我的 DynamoDB 表有大约 1 亿 (30GB) 个项目,我为它预置了 10k RCU。我正在使用数据管道作业来导出数据。
DataPipeline 读取吞吐量比设置为 0.9。
如何计算完成导出的时间(管道需要 4 多个小时才能完成导出)
我该如何优化它,以便在更短的时间内完成导出。
读取吞吐率与 DynamoDB 导出有何关系?
我的 DynamoDB 表有大约 1 亿 (30GB) 个项目,我为它预置了 10k RCU。我正在使用数据管道作业来导出数据。
DataPipeline 读取吞吐量比设置为 0.9。
如何计算完成导出的时间(管道需要 4 多个小时才能完成导出)
我该如何优化它,以便在更短的时间内完成导出。
读取吞吐率与 DynamoDB 导出有何关系?
此问题的答案解决了您在估算数据管道作业完成时间方面的大部分问题。
现在有更好的解决方案将数据从 DynamoDB 导出到 S3,该解决方案于2020 年 11 月发布。现在有一种方法可以直接从 DynamoDB 执行此操作,而无需预置 EMR 集群和大量 RCU。