2

我有一个卡住的“真空重新索引”操作,我想知道它需要这么长时间的原因可能是什么。

我最近更改了我的一个 Redshift 表的模式,方法是使用修改后的模式创建一个新表并使用“选择进入”深度复制数据(请参阅执行深度复制)。我的基本理解是,深拷贝表后,数据应该按照表的sort-keys进行排序。该表有一个交错的 4 列排序键。只是为了确保,在深度复制之后,我运行了“交错倾斜”查询(请参阅决定何时重新索引),所有列的结果都是 1.0,这意味着没有倾斜。

然后我在表上运行了“vacuum reindex”,这应该非常快,因为数据已经排序。然而,真空在 30 小时后仍在运行。在真空期间,我定期检查 svv_vacuum_progress 以检查真空操作状态。“排序”阶段在约 6 小时后完成,但现在“合并”阶段停留在“增量 23”>12 小时。

鉴于数据应该已经通过深拷贝操作进行排序,长时间真空操作的原因可能是什么?我是否也希望这些时间用于未来的真空操作?该表包含约 35 亿行,其总大小为约 200 GB。

4

0 回答 0