我们已经运行这个 DMS 复制实例大约 2 个月了,有时它会由于以下错误而失败:
Last Error Replication task out of memory. Stop Reason FATAL_ERROR Error Level FATAL.
只有 1 个任务正在运行,它full Load + ongoing changes
从 RDS Postgres 中的 5 个表(约 5M 行)捕获到 S3 存储桶中。复制实例dms.r5.xlarge
在 DMS 版本 3.4.3 上。每次失败我们只是升级实例大小(根据网上看到的解决方案),但我担心这个问题会一直存在。
根据 cloudwatch 指标,可用内存、可释放内存和可用内存都随着时间的推移而减少,直到崩溃。交换使用量始终保持为零,直到它崩溃之前达到峰值。
有人知道这可能是什么吗,我们只是使用了太小的实例大小吗?我觉得我们的配置非常基础。