0

好的一点底漆;我是专家级的 PHP/JS/C 开发人员,但一直无法全面掌握 MySQL。如果您能回答我的问题,那就太好了,但如果您能向我指出好的资源的方向,以了解复杂的 MySQL 查询的注意事项(主要是从效率的角度来看),那将同样有帮助。

客观的

我需要在单个表中找到相似之处/重叠,同时仍然拉动整个结果集(与另一个表中的实际标题/描述内容进行 LEFT JOIN)。

桌子极其简单;它包含 3 列 ( page, user, time)。

基本上每个查询将有两个用户。我需要提取所有匹配结果User 1的计数、所有匹配结果的计数User 2和所有列(加上 LEFT JOIN)以进行重叠(两者User 1User 2在表中匹配。

示例查询

这个查询有效,但它非常慢(到需要几分钟才能运行的程度)并且我猜测由于子查询而效率低下。如果任何 SQL 专家可以指出一种更有效的方法来做到这一点(以及为什么),那将不胜感激。

SELECT DISTINCT `page`, 
    (SELECT COUNT(*) FROM `m_likes` WHERE `user` = "1") AS userLikes,
    (SELECT COUNT(*) FROM `m_likes` WHERE `user` = "2") AS friendLikes

    FROM `m_likes` LEFT JOIN `app_pages` AS page ON (page.id = `page`)

        WHERE `page` IN (SELECT `page` FROM `m_likes` WHERE `user` = "1") 
        AND `page` IN (SELECT `page` FROM `m_likes` WHERE `user` = "2")

        AND (`user` = "1" OR `user` = "2")

EXPLAIN 查询结果

id  select_type table   type    possible_keys   key key_len ref rows    Extra
1   PRIMARY     m_likes index   NULL    page    604 NULL    35043   Using where; Using index; Using temporary
1   PRIMARY     page    eq_ref  PRIMARY PRIMARY 767 tablename.m_likes.page  1   
5   DEPENDENT SUBQUERY  m_likes unique_subquery page    page    604 func,const      1   Using index; Using where
4   DEPENDENT SUBQUERY  m_likes unique_subquery page    page    604 func,const      1   Using index; Using where
3   SUBQUERY    m_likes index   NULL    page    604 NULL    35043   Using where; Using index
2   SUBQUERY    m_likes index   NULL    page    604 NULL    35043   Using where; Using index

表架构

app_pagesidVARCHAR(255),nameVARCHAR(255),categoryVARCHAR(255)

m_likes : pageVARCHAR(255), userVARCHAR(255), timeINT(20)

m_likes.page = app_pages.id

另外值得注意的是,不幸的是,用户和页面 ID 必须是 VARCHAR 而不是 INT,因为不能保证它在 64 位系统上运行,并且某些 ID 值大于 32 位允许的最大值系统...希望这不会对性能造成重大影响。

输出示例

array (size=156)
  0 => 
    array (size=6)
      'page' => string '100861973286778' (length=15)
      'time' => string '1297383617' (length=10)
      'name' => string 'Leila' (length=5)
      'category' => string 'Book' (length=4)
      'userLikes' => string '104' (length=3)
      'friendLikes' => string '52' (length=2)
  1 => 
    array (size=6)
      'page' => string '10150160788195604' (length=17)
      'time' => string '1272653871' (length=10)
      'name' => string 'Frisbee Golfing' (length=15)
      'category' => string 'Interest' (length=8)
      'userLikes' => string '104' (length=3)
      'friendLikes' => string '52' (length=2)
4

1 回答 1

1

您的查询运行如此缓慢的原因是因为您正在执行四个单独的子查询,这些子查询实际上最终会为每一行执行。

相反,您可以对子选择进行笛卡尔积以获得总计数(仅执行一次):

SELECT a.page, c.userLikes, c.friendLikes
FROM m_likes a
INNER JOIN app_pages b ON a.page = b.id
CROSS JOIN
(
    SELECT
        COUNT(CASE WHEN user = '1' THEN 1 END) AS userLikes,
        COUNT(CASE WHEN user = '2' THEN 1 END) AS friendLikes
    FROM m_likes
    WHERE user IN ('1','2')
) c
WHERE a.user IN ('1','2')
GROUP BY a.page
HAVING COUNT(1) = 2

此查询将检索用户 1 和 2 都喜欢的所有页面,以及他们喜欢的总次数(将在结果集中重复)。

于 2012-07-23T00:14:56.950 回答