2

场景:包含 1.5 - 200 万条记录的表

我需要执行删除旧记录的查询,条件中使用的唯一字段是日期。我已经为该字段添加了索引。

问题:查询执行时间过长(超过 14 分钟)。

这是我到目前为止所做的

mysql> create index idx_logs_log_date ON logs (log_date);
Query OK, 0 rows affected (9.00 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> EXPLAIN SELECT * from logs where log_date < "2013-09-11";
| id | select_type | table | type | possible_keys     | key  | key_len | ref  | row |Extra

+----+-------------+-------+------+-------------------+------+---------+------+-----+-----

|  1 | SIMPLE      | logs  | ALL  | idx_logs_log_date | NULL | NULL    | NULL | 1420480 | Using where |


1 row in set (0.00 sec)



mysql> delete from logs where log_date < "2013-09-11";

Query OK, 1163008 rows affected (14 min 20.87 sec)

我还尝试删除该索引并向该字段添加一个键(这当然会创建一个新索引),但响应时间没有任何改善。

那么,我的问题是,您对如何提高响应时间还有其他想法吗?

编辑:

mysql> SELECT COUNT(id) FROM logs WHERE log_date < "2013-09-14";
+-----------+
| COUNT(id) |
+-----------+
|   1182688 |
+-----------+
1 row in set (0.58 sec)
4

2 回答 2

3

很可能不是过滤器很慢,而是删除了行(通过测量执行 a 需要多长时间来测试SELECT COUNT(id) FROM logs WHERE log_date < "2013-09-14")。

为了加快速度,您需要调整一些服务器设置。但是,如果您只是保留最后 X 时刻的基于时间的日志,那么您可能希望查看基于日期的分区,这样您就可以在不再需要时简单地删除该表。

于 2013-11-12T05:11:15.757 回答
1

由于SELECT count(*) from logs where log_date >= "2013-09-11";返回 253736,并SELECT * from logs where log_date < "2013-09-11";返回 1163008,因此我推断该指数实际上正在降低性能。

DROP INDEX `idx_logs_log_date` ON logs;
delete from logs where log_date < "2013-09-11";
create index idx_logs_log_date ON logs (log_date);
于 2013-11-12T06:09:03.947 回答