amazon-web-services - 为什么对已经排序的表进行真空重新索引需要很长时间？

翻译自：https://stackoverflow.com/questions/31585303 2015-07-23T10:54:30.177

582 次

我有一个卡住的“真空重新索引”操作，我想知道它需要这么长时间的原因可能是什么。

我最近更改了我的一个 Redshift 表的模式，方法是使用修改后的模式创建一个新表并使用“选择进入”深度复制数据（请参阅执行深度复制）。我的基本理解是，深拷贝表后，数据应该按照表的sort-keys进行排序。该表有一个交错的 4 列排序键。只是为了确保，在深度复制之后，我运行了“交错倾斜”查询（请参阅决定何时重新索引），所有列的结果都是 1.0，这意味着没有倾斜。

然后我在表上运行了“vacuum reindex”，这应该非常快，因为数据已经排序。然而，真空在 30 小时后仍在运行。在真空期间，我定期检查 svv_vacuum_progress 以检查真空操作状态。“排序”阶段在约 6 小时后完成，但现在“合并”阶段停留在“增量 23”>12 小时。

鉴于数据应该已经通过深拷贝操作进行排序，长时间真空操作的原因可能是什么？我是否也希望这些时间用于未来的真空操作？该表包含约 35 亿行，其总大小为约 200 GB。

amazon-web-services - 为什么对已经排序的表进行真空重新索引需要很长时间？

0 回答 0

Related

Reference