3

我需要删除大约 80% 的 500Gb Postgresql 数据库。到目前为止,我已经成功地为大约 50Gb 的行运行了删除命令,并在继续之前暂停了。(这花了很长时间,也许一个小时)

我注意到在删除大约 50Gb 的数据后,没有释放额外的磁盘空间,但是当我运行“htop”时可以观察到一些内存密集型 postgres 进程。假设这归结为死行,我是否正确,需要在释放磁盘空间之前对其进行清理?

这个问题的第二部分是,如果我没有弄错第一部分,我最好删除所有行然后允许自动真空发生吗?在我有机会继续我的行删除命令列表之前,似乎自动真空(或其他一些密集的后台进程)已经自行启动。我应该继续还是应该优雅地告诉它先停止?

4

2 回答 2

3

大删除后,autovacuum 肯定会运行。这是设计的,不应该干扰您删除更多的行。

虽然 autovacuum 会释放表中的死空间,但它不会将空间返回给操作系统。相反,它仍然作为表中的可用空间,并且可以在将来的插入中重复使用。

如果要缩小表,请VACUUM (FULL)在它们上运行,但要注意这会重写表,因此它会暂时使用额外的存储空间并阻止表上的所有并发活动。

如果您必须定期进行这样的批量删除,请考虑对表进行分区。它使批量删除变得无痛。

于 2018-04-06T08:35:00.080 回答
0

更好的解决方案是TRUNCATE餐桌。

在我的场景中,我删除了占用大量磁盘空间的特定行,但数据太多,VACUUM无法在合理的时间内清除。

我最终复制了表格:

CREATE table dupe_table AS (SELECT * FROM table);

截断原始表:

TRUNCATE table

最后将数据移回:

INSERT INTO table(column1, column2, column3)
SELECT column1, column2, column3
FROM dupe_table

注意:如果在创建重复表和截断原始表之间发生事务,您可能会丢失数据

于 2020-05-06T22:26:14.403 回答