mysql - Mysql用解释优化慢查询

Question

我正在研究 MySQL 5.5.29-0ubuntu0.12.04.1。

我需要创建一个可以按日期和分数对结果进行排序的查询。

我在stackoverflow（特别是this）上阅读了有关如何优化查询的文档和帖子，但我仍在努力做好。主要发现是，为避免使用临时表，ORDER BY 或 GROUP BY 必须仅包含连接队列中第一个表中的列，这就是为什么使用 STRAIGHT_JOIN 子句和两个稍微不同的查询的原因。

为避免混淆，我将为各种查询配置分配一个编号：

使用 STRAIGHT_JOIN 子句按日期排序
使用 STRAIGHT_JOIN 子句按分数排序
按日期排序，不带 STRAIGHT_JOIN 子句
按分数排序，没有 STRAIGHT_JOIN 子句

以下是查询 1，大约需要 2.5 秒才能完成：

SELECT STRAIGHT_JOIN item.id AS id
FROM item 
INNER JOIN score ON item.id = score.item_id 
LEFT JOIN url ON item.url_id = url.id 
LEFT JOIN doc ON url.doc_id = doc.id 
INNER JOIN feed ON feed.id = item.feed_id 
INNER JOIN user_feed ON feed.id = user_feed.feed_id AND score.user_id = user_feed.user_id 
LEFT JOIN star ON item.id = star.item_id AND score.user_id = star.user_id 
JOIN unseen ON item.id = unseen.item_id AND score.user_id = unseen.user_id 
WHERE score.user_id = 1 AND user_feed.id = 7 
ORDER BY zen_time DESC 
LIMIT 0, 10

以下是查询 2（第一个连接表是倒置的，排序列不同），只需要大约 0.01 秒即可完成：

SELECT STRAIGHT_JOIN item.id AS id
FROM score
INNER JOIN item ON item.id = score.item_id 
LEFT JOIN url ON item.url_id = url.id 
LEFT JOIN doc ON url.doc_id = doc.id 
INNER JOIN feed ON feed.id = item.feed_id 
INNER JOIN user_feed ON feed.id = user_feed.feed_id AND score.user_id = user_feed.user_id 
LEFT JOIN star ON item.id = star.item_id AND score.user_id = star.user_id 
JOIN unseen ON item.id = unseen.item_id AND score.user_id = unseen.user_id 
WHERE score.user_id = 1 AND user_feed.id = 7 
ORDER BY score DESC 
LIMIT 0, 10

以下是查询的 EXPLAIN 结果。

解释查询1：在此处输入图像描述

解释查询 2：在此处输入图像描述

解释查询 3：在此处输入图像描述

解释查询 4：在此处输入图像描述

查询 1 的探查器结果：在此处输入图像描述

查询 2 的探查器结果：在此处输入图像描述

查询 3 的探查器结果：在此处输入图像描述

查询 4 的探查器结果：在此处输入图像描述

以下是表格定义：

CREATE TABLE `doc` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`md5` char(32) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `Md5_index` (`md5`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `feed` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`url` text NOT NULL,
`title` text,
PRIMARY KEY (`id`),
FULLTEXT KEY `Title_url_index` (`title`,`url`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

CREATE TABLE `item` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`feed_id` bigint(20) unsigned NOT NULL,
`url_id` bigint(20) unsigned DEFAULT NULL,
`md5` char(32) NOT NULL,
PRIMARY KEY (`id`),
KEY `Md5_index` (`md5`),
KEY `Zen_time_index` (`zen_time`),
KEY `Feed_index` (`feed_id`),
KEY `Url_index` (`url_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `score` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`user_id` bigint(20) unsigned NOT NULL,
`item_id` bigint(20) unsigned NOT NULL,
`score` float DEFAULT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `User_item_index` (`user_id`,`item_id`),
KEY Score_index (`score`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `star` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`user_id` bigint(20) unsigned NOT NULL,
`item_id` bigint(20) unsigned NOT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `User_item_index` (`user_id`,`item_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `unseen` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`user_id` bigint(20) unsigned NOT NULL,
`item_id` bigint(20) unsigned NOT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `User_item_index` (`user_id`,`item_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `url` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`doc_id` bigint(20) unsigned DEFAULT NULL,
PRIMARY KEY (`id`),
KEY Doc_index (`doc_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `user` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`email` varchar(255) NOT NULL,
PRIMARY KEY (`id`),
KEY `IDX_Email` (`email`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `user_feed` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`user_id` bigint(20) unsigned NOT NULL,
`feed_id` bigint(20) unsigned NOT NULL,
PRIMARY KEY (`id`),
KEY `User_feed_index` (`user_id`,`feed_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

以下是查询中涉及的表的行数：

Score: 68657
Item: 197602
Url: 198354
Doc: 186113
Feed: 754
User_feed: 721
Star: 0
Unseen: 150762

我应该采用哪种方法，因为我的程序需要能够以尽可能最快的方式按 zen_time 和 score 排序结果？

score 0 · Accepted Answer

由于查询速度不同，我决定根据我想要达到的各种结果进行更准确的分析。

我需要的结果集是四个：

从特定提要中选择所有商品，按 SCORE.score 排序（智能排序）
从特定提要中选择所有项目，按 ITEM.zen_time 排序（时间顺序）
选择所有项目，按 SCORE.score 排序（智能排序）
选择所有项目，按ITEM.zen_time（时间顺序）排序

查询因此必须适应这些条件，其可变部分是：

STRAIGHT_JOIN 是/否
第一个 JOIN 表分数/项目
特定提要的 WHERE 条件是/否
ORDER BY score/zen_time

所有测试都使用 SELECT SQL_NO_CACHE 指令执行。

以下是结果：在此处输入图像描述

现在很清楚我必须做什么：

没有 STRAIGHT_JOIN，第一个 JOIN 表 SCORE
没有 STRAIGHT_JOIN，第一个 JOIN 表 SCORE
STRAIGHT_JOIN（我确实在这里击败了 MySQL 引擎：D），第一个 JOIN 表 SCORE
STRAIGHT_JOIN（我确实在这里击败了 MySQL 引擎：D），第一个 JOIN 表 ITEM

mysql - Mysql用解释优化慢查询

1 回答 1

Related

Reference