我有以下查询:
SELECT
b.item_name,
COUNT(distinct c.user_id) AS total_count,
AVG(c.item_rating) AS avg_rating
FROM item_ratings as c
INNER JOIN items AS b ON b.item_id = c.item_id
INNER JOIN users AS u ON u.user_id = c.user_id
WHERE item_active = 1 AND u.user_valid = 1
GROUP BY c.item_id
此查询在高度优化的数据库上运行 500 秒 - 不确定发生了什么。
索引
item_ratings - item_user_id, (item_id, user_id), item_rating, item_id
users - user_id, user_valid
items - item_id (primary), item_search (item_id, item_name), item_r (parent_id, item_id, item_active)
表大小
item_ratings 表接近 500 万条记录,而 items 表约为 200k,users 约为 250k。
解释
解释查询似乎对项目进行表排序(返回所有 200k 行),即使 item_active 上有索引。其他表(item_ratings 和 user)都使用正确的索引。
更新
完整解释
id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE b ALL PRIMARY,item_id, item_search, item_r NULL NULL NULL 218419 Using where; Using temporary; Using filesort
1 SIMPLE c ref item_user_id ,user_id, item_id 4 myDB.b.item_id 29 Using where
1 SIMPLE u eq_ref PRIMARY,user_valid,user_id PRIMARY 4 myDB.c.user_id 1 Using where
硬件 这是运行 Ubuntu 10.10 的专用 MySQL 服务器盒,具有 16GB 的 RAM。这些表正在运行 MyISAM。
有什么建议么?