主题表有 30M 行。我正在执行查询以查找重复项hash
。hash
定义为
`hash` varchar(50) NOT NULL;
查询是
SELECT Count(*)
FROM (SELECT Count(id) `num`,
`signature`
FROM `images`
WHERE `hash` IS NOT NULL
GROUP BY `hash`
HAVING `num` > 1) AS `count_table`
Ctrl+C
在我按下中止查询之前大约需要 5-7 分钟。我再次运行它,仍然等不及那么多时间。
我怎样才能更快地得到这个结果?
我知道在进行分组时这会有点慢。但是8分钟我觉得太多了。