8

我有一个查询,我想选择所有喜欢一组给定艺术家的用户。还有一些其他关于国家/地区等的 WHERE 标准。这是架构的样子。

          users                     favourite_artists             artists

+----------+------------+    +-----------+------------+    +--------+--------+
|    id    |  country   |    |  user_id  |  artist_id |    |  id    |  name  |
+----------+------------+    +-----------+------------+    +--------+--------+
|     1    |     gb     |    |     1     |      6     |    |   1    |  Muse  |
|     2    |     gb     |    |     1     |      5     |    |   2    |  RATM  |
|     3    |     us     |    |     1     |      3     |    |   3    |  ABBA  | 
|     4    |     us     |    |     2     |      3     |    |   4    |   U2   |
+----------+------------+    +-----------+------------+    +--------+--------+

我想按他们喜欢的艺术家的数量来排序。我还想包括不喜欢任何艺术家但符合 WHERE 标准的用户。预期的结果集看起来像。

+--------+---------------+----------------+
|   id   |    country    |   match_count  |
+--------+---------------+----------------+
|    6   |      gb       |       4        |
|    9   |      gb       |       4        |
|    2   |      gb       |       3        |
|    1   |      gb       |       2        |
|    5   |      gb       |       0        |
|    4   |      gb       |       0        |
+--------+---------------+----------------+

我一直在尝试使用子查询来获取 match_count 并通过它进行排序,但它的执行速度很慢,所以我认为必须有更好的方法。

   SELECT users.id, users.country
   (SELECT COUNT(*) FROM favourite_artists 
    WHERE user_id = users.id AND artist_id IN (1,3,4,9)) AS match_count        
   FROM "users" 
   WHERE users.country = 'gb'
   ORDER BY match_count DESC;

我正在使用 Postgresql 9.0.7。有什么想法吗?

4

1 回答 1

10

您的查询正在为 中的每一行执行一个子查询users。这样的查询被称为“相关子查询”,它们的性能很糟糕,这是可以理解的。

相反,您想要加入:

SELECT users.id, users.country, count(artist_id) as match_count
FROM users
LEFT JOIN favourite_artists ON user_id = users.id AND artist_id IN (1,3,4,9)
WHERE users.country = 'gb'
GROUP BY 1, 2
ORDER BY 3 DESC;

favourite_artists(user_id)假设您有一个索引,或者更好的是一个多列索引 ,这个查询将更有效地获得连接行favourite_artists(user_id, artist_id)

于 2012-05-04T11:04:43.917 回答