0

我有两个表:userprojects,两者之间存在一对多的关系。
projects表具有status包含用户项目状态的字段。

status可以是以下之一:

launched, confirm, staffed, overdue, complete, failed, ended

我想将用户分为两类:

  1. 项目处于launched阶段的用户
  2. 拥有非launched状态项目的用户。

我正在使用以下查询:

SELECT DISTINCT(u.*), CASE 
    WHEN p.status = 'LAUNCHED' THEN 1
    ELSE 2
    END as user_category
FROM users u
LEFT JOIN projects p ON p.user_id = u.id
WHERE (LOWER(u.username) like '%%%'
    OR LOWER(u.personal_intro) like '%%%'
    OR LOWER(u.location) like '%%%'
    OR u.account_status != 'DELETED'
AND system_role=10 AND u.account_status ='ACTIVE')
ORDER BY set_order, u.page_hits DESC
LIMIT 10
OFFSET 0

我面临以下情况的重复记录:

如果用户的项目状态launchedoverduecompletefailed,则该用户被记录两次,因为该用户的两个条件CASE都满足。

请提出一个查询,其中有任何项目处于launched状态的用户将其user_category设置为1. 同一用户不应重复使用user_category 2

4

2 回答 2

4

由于多种原因,查询可能没有按照您的想法执行

  • DISTINCT,有。与 没有什么不同。括号只是噪音。DISTINCTON(col1, col2)
    DISTINCT (u.*)DISTINCT u.*

  • ANDOR根据运算符优先级绑定之前。我怀疑您想在OR“一起”的条件周围使用括号?还是您需要它原来的样子?WHERE但是在任何情况下,整个子句都不需要括号。

  • 你的表达LOWER(u.username) LIKE '%%%'没有任何意义。每个非空字符串都符合条件。可以替换为u.username IS NOT NULL。我怀疑你想要一些不同的东西?

  • Postgres在字符串处理中区分大小写。您写的status是“启动”等,但在查询中使用“启动”。它是哪一个?

  • 问题中缺少几个表格限定条件,使读者感到模棱两可。我按照我认为合适的方式填写。

所有东西放在一起,它可能会像这样工作:

SELECT DISTINCT ON (u.set_order, u.page_hits, u.id)
       u.*
     , CASE WHEN p.status = 'LAUNCHED' THEN 1 ELSE 2 END AS user_category
FROM   users         u
LEFT   JOIN projects p ON p.user_id = u.id
WHERE  LOWER(u.username)       LIKE '%%%' -- ???
    OR LOWER(u.personal_intro) LIKE '%%%'
    OR LOWER(u.location)       LIKE '%%%'

    OR u.account_status != 'DELETED'      -- with original logic
   AND u.system_role = 10
   AND u.account_status = 'ACTIVE'
ORDER  BY u.set_order, u.page_hits DESC, u.id, user_category
LIMIT  10

这个相关问题的详细解释:

两个EXISTS半连接而不是DISTINCT ONandCASE可能更快:

SELECT u.*
     , CASE WHEN EXISTS (
          SELECT FROM projects p
          WHERE p.user_id = u.id AND p.status = 'LAUNCHED')
       THEN 1 ELSE 2 END AS user_category
FROM   users u
WHERE
    (  LOWER(u.username)       LIKE '%%%' -- ???
    OR LOWER(u.personal_intro) LIKE '%%%'
    OR LOWER(u.location)       LIKE '%%%'
    OR u.account_status != 'DELETED'      -- with alternative logic?
    )
AND    u.system_role = 10  -- assuming it comes from users ???
AND    u.account_status = 'ACTIVE'
AND    EXISTS (SELECT 1 FROM projects p WHERE p.user_id = u.id)
ORDER  BY u.set_order, u.page_hits DESC
LIMIT  10;
于 2013-03-17T20:24:39.483 回答
1

您可以MIN()CASE结果上使用,似乎放弃 DISTINCT 将是一个明智的选择:

SELECT u.*, MIN(CASE 
WHEN p.status = 'LAUNCHED' THEN 1
ELSE 2
END) as user_category
...
GROUP BY <list all columns in the users table>
...

由于 "launched" 给出了 1,使用 MIN() 不仅会强制一个结果,而且还会优先于“launched”而不是其他状态。

于 2013-03-17T20:24:07.600 回答