5

我有一些删除查询要针对一些非常大的表(~100 GB)运行,我想尽可能地优化它们:

delete from table1 where column1 < date_sub(now(), interval 100 hour);

column1 是一datetime列,我假设为该列创建索引将加快删除速度。除此之外,我能在这里做什么?使用该date_sub()函数会减慢查询速度吗?我应该在运行查询之前计算该值吗?

delete from table2 where column2 = x;

column2 是 table2 的主键,所以根据 mysql 文档它已经是一个索引。我的问题是:索引类型是PRIMARY,是一样的INDEX吗?我是否必须制作另一个索引INDEX以加快速度?

delete from table3 where column3 = y;

table3 有一个复合主键,即 column3 和 column4。所以我有一个主键索引,但由于删除查询不使用column4,我应该为column3创建一个单独的索引吗?或者组合的主键会做吗?

我想这些是非常基本的问题,但我找不到特定于我的情况的明确答案,所以任何帮助将不胜感激!

4

2 回答 2

11

如果您DELETE打算消除该表中的绝大多数行,人们经常做的一件事是将您想要保留的行复制到重复表中,然后更快地使用DROP TABLE或清除原始表。TRUNCATE

索引可能有助于找到您需要删除的行,但删除需要更新索引。删除大量行后,索引可能不平衡,需要使用OPTIMIZE TABLE.

DATE_SUB()函数是一个常量表达式(它不会逐行变化),因此查询优化器应该足够聪明,可以将其分解并执行一次计算。

您不需要为主键创建额外的索引。主键约束隐式创建一个索引,该索引提供与非主键索引相同的好处。

如果您的搜索条件引用索引的最左侧列,则复合索引可能与单列索引一样有用。“可能”的警告是由于单个索引节点更大,因此缓存索引需要更多内存,但这是一个足够小的因素,我不会创建一个完整的其他单列索引。

于 2009-12-31T22:59:27.717 回答
2

我认为为该列建立索引将加快删除速度。

不正确,因为需要更新相同的索引才能使索引具有任何值以供将来使用。

使用 date_sub() 函数会减慢查询速度吗?

不,这很好,因为它不是基于列值。对列值执行的函数确保不能使用索引(如果列上存在索引)。

索引类型是“PRIMARY”,和“INDEX”一样吗?

它是,主要部分确保该索引中的值也是唯一的。

我是否必须制作另一个“索引”类型的索引来加快速度?

不,你没有。MySQL 还限制可以在单个表上定义的索引的总大小,具体取决于类型。767 字节是 InnoDB 表的声明索引前缀限制;MyISAM 表是 1,000 字节。

table3 有一个复合主键,即 column3 和 column4。所以我有一个主键索引,但由于删除查询不使用column4,我应该为column3创建一个单独的索引吗?或者组合的主键会做吗?

测试两种设置并决定。我认为我自己不需要额外的索引。

于 2009-12-31T22:51:29.393 回答