2

我有一个带有嵌套连接的 SQL 查询:

SELECT rh.host, rh.report, COUNT(results.id), COUNT(results_2.id), COUNT(results_3.id), COUNT(results_4.id)
FROM report_hosts rh
INNER JOIN report_results rr ON rh.report = rr.report
LEFT OUTER JOIN results ON rr.result = results.id AND results.type =  'Hole' AND results.host = rh.host
LEFT OUTER JOIN results results_2 ON rr.result = results_2.id AND results_2.type =  'Warning' AND results_2.host = rh.host
LEFT OUTER JOIN results results_3 ON rr.result = results_3.id AND results_3.type =  'Note' AND results_3.host = rh.host
LEFT OUTER JOIN results results_4 ON rr.result = results_4.id AND results_4.type =  'Log' AND results_4.host = rh.host
GROUP BY rh.host

原样查询大约需要 5 秒,其中 99.7%复制到临时表。一个EXPLAIN完整的查询显示为:

+----+-------------+-----------+--------+---------------+---------+---------+-------------------+------+---------------------------------+
| id | select_type | table     | type   | possible_keys | key     | key_len | ref               | rows | Extra                           |
+----+-------------+-----------+--------+---------------+---------+---------+-------------------+------+---------------------------------+
|  1 | SIMPLE      | rr        | ALL    | report        | NULL    | NULL    | NULL              | 3139 | Using temporary; Using filesort |
|  1 | SIMPLE      | rh        | ref    | report        | report  | 5       | openvas.rr.report |  167 | Using where                     |
|  1 | SIMPLE      | results   | eq_ref | PRIMARY,type  | PRIMARY | 4       | openvas.rr.result |    1 |                                 |
|  1 | SIMPLE      | results_2 | eq_ref | PRIMARY,type  | PRIMARY | 4       | openvas.rr.result |    1 |                                 |
|  1 | SIMPLE      | results_3 | eq_ref | PRIMARY,type  | PRIMARY | 4       | openvas.rr.result |    1 |                                 |
|  1 | SIMPLE      | results_4 | eq_ref | PRIMARY,type  | PRIMARY | 4       | openvas.rr.result |    1 |                                 |
+----+-------------+-----------+--------+---------------+---------+---------+-------------------+------+---------------------------------+

当我删除LEFT JOINs 时,查询会在大约 1 秒内执行,每个LEFT JOIN会增加大约一秒的执行时间。

我的问题: 谁能解释一下,如果有更多的 s,为什么一个连接的复制到临时表LEFT JOIN任务需要更长的时间?MySQL 是否为每个 JOIN 多次复制临时表?

我怎样才能避免这种情况?我错过了索引吗?

我打算完成的工作: 我有一个包含几台主机扫描结果的表。每个结果都按类型分类(“孔”、“警告”、“注释”或“日志”)。我想选择每个主机和相应数量的漏洞、警告、注释和日志。作为“限制”,我有一个事实,即并非每个主机都有每种类型的结果。

4

2 回答 2

3

您多次加入单个表,这实际上就像加入多个表一样。您应该能够使用一些 case 语句和 where 子句来处理它。(实际上你可能不需要 where 子句。)

SELECT rh.host, rh.report, 
 COUNT(CASE WHEN results.type = 'Hole' THEN 1 ELSE NULL END) as Holes, 
 COUNT(CASE WHEN results.type = 'Warning' THEN 1 ELSE NULL END) as Warnings,
 COUNT(CASE WHEN results.type = 'Note' THEN 1 ELSE NULL END) as Notes, 
 COUNT(CASE WHEN results.type = 'Log' THEN 1 ELSE NULL END) as Logs
FROM 
 report_hosts rh
INNER JOIN 
 report_results rr 
ON 
 rh.report = rr.report
LEFT OUTER JOIN 
 results 
ON 
 rr.result = results.id 
 AND results.host = rh.host
WHERE
 results.type = 'Hole' 
 OR results.type = 'Warning' 
 OR results.type = 'Note' 
 OR results.type = 'Log'
GROUP BY rh.host, rh.report

案例语句(IME)并不是表现最好的,但是来自许多连接的数据膨胀可能会抵消这一点并提供更好的性能。

于 2012-07-02T09:17:14.457 回答
1

使用大量数据(在您的情况下是额外的left join)将意味着将其存储在内存中。

如果您耗尽缓冲区,您的查询将需要存储到驱动器上的临时结果表中。

尝试使用相同数量的left joins,但使用 a 限制行数limit。它应该确认问题出在缓冲区中(这意味着它将运行得更快)。

于 2012-07-02T09:09:29.937 回答