9

我有一个包含 3 个字段的表,我想根据 user_id 和 game_id 对列进行排名。

这是 SQL 小提琴: http ://sqlfiddle.com/#!9/883e9d/1

我已经有这张桌子了:

 user_id | game_id |   game_detial_sum  |
 --------|---------|--------------------|
 6       | 10      |  1000              |   
 6       | 11      |  260               |
 7       | 10      |  1200              |
 7       | 11      |  500               |
 7       | 12      |  360               |
 7       | 13      |  50                | 

预期输出:

user_id  | game_id |   game_detial_sum  |  user_game_rank  |
 --------|---------|--------------------|------------------|
 6       | 10      |  1000              |   1              |
 6       | 11      |  260               |   2              |
 7       | 10      |  1200              |   1              |
 7       | 11      |  500               |   2              |
 7       | 12      |  360               |   3              |
 7       | 13      |  50                |   4              |

到目前为止我的努力:

SET @s := 0; 
SELECT user_id,game_id,game_detail, 
       CASE WHEN user_id = user_id THEN (@s:=@s+1) 
            ELSE @s = 0 
       END As user_game_rank 
FROM game_logs

编辑:(来自 OP评论):排序是基于降序排列game_detail

game_detail 的顺序

4

4 回答 4

9

派生表(子句内的子查询FROM)中,我们对数据进行排序,使所有具有相同user_id值的行聚集在一起,并根据game_detail降序在它们之间进行进一步排序。

现在,我们使用这个结果集并使用条件CASE..WHEN表达式来评估行编号。它就像一种循环技术(我们在应用程序代码中使用,例如:PHP)。我们会将前一行的值存储在用户定义的变量中,然后根据前一行检查当前行的值。最终,我们将相应地分配行号。

编辑:基于 MySQL文档和@Gordon Linoff 的观察:

涉及用户变量的表达式的求值顺序未定义。例如,不能保证 SELECT @a, @a:=@a+1 先计算 @a 然后再执行赋值。

我们将需要评估行号并将user_id值分配给@u同一表达式中的变量。

SET @r := 0, @u := 0; 
SELECT
  @r := CASE WHEN @u = dt.user_id 
                  THEN @r + 1
             WHEN @u := dt.user_id /* Notice := instead of = */
                  THEN 1 
        END AS user_game_rank, 
  dt.user_id, 
  dt.game_detail, 
  dt.game_id 

FROM 
( SELECT user_id, game_id, game_detail
  FROM game_logs 
  ORDER BY user_id, game_detail DESC 
) AS dt 

结果

| user_game_rank | user_id | game_detail | game_id |
| -------------- | ------- | ----------- | ------- |
| 1              | 6       | 260         | 11      |
| 2              | 6       | 100         | 10      |
| 1              | 7       | 1200        | 10      |
| 2              | 7       | 500         | 11      |
| 3              | 7       | 260         | 12      |
| 4              | 7       | 50          | 13      |

在 DB Fiddle 上查看


我最近发现的 MySQL Docs中的一个有趣的注释:

MySQL 的早期版本使得在 SET 以外的语句中为用户变量赋值成为可能。MySQL 8.0 支持此功能以实现向后兼容性,但在 MySQL 的未来版本中可能会被删除。

另外,感谢一位 SO 成员,MySQL 团队发现了这个博客:https ://mysqlserverteam.com/row-numbering-ranking-how-to-use-less-user-variables-in-mysql-queries/

一般观察是ORDER BY在同一个查询块中使用用户变量的评估,并不能确保值总是正确的。因为,MySQL 优化器可能会到位并改变我们假定的评估顺序。

解决此问题的最佳方法是升级到 MySQL 8+ 并利用以下Row_Number()功能:

架构 (MySQL v8.0)

SELECT user_id, 
       game_id, 
       game_detail, 
       ROW_NUMBER() OVER (PARTITION BY user_id 
                          ORDER BY game_detail DESC) AS user_game_rank 
FROM game_logs 
ORDER BY user_id, user_game_rank;

结果

| user_id | game_id | game_detail | user_game_rank |
| ------- | ------- | ----------- | -------------- |
| 6       | 11      | 260         | 1              |
| 6       | 10      | 100         | 2              |
| 7       | 10      | 1200        | 1              |
| 7       | 11      | 500         | 2              |
| 7       | 12      | 260         | 3              |
| 7       | 13      | 50          | 4              |

在 DB Fiddle 上查看

于 2018-11-25T06:17:05.277 回答
6

MySQL 8.0 之前的最佳解决方案如下:

select gl.*, 
       (@rn := if(@lastUserId = user_id, @rn + 1,
                  if(@lastUserId := user_id, 1, 1)
                 )
        ) as user_game_rank
from (select gl.*
      from game_logs gl
      order by gl.user_id, gl.game_detail desc
     ) gl cross join
     (select @rn := 0, @lastUserId := 0) params;

排序在子查询中完成。从 MySQL 5.7 开始,这是必需的。变量赋值都在一个表达式中,因此不同的表达式求值顺序无关紧要(并且 MySQL 不保证表达式的求值顺序)。

于 2018-11-25T21:46:51.670 回答
3
SELECT user_id, game_id, game_detail, 
       CASE WHEN user_id = @lastUserId 
            THEN @rank := @rank + 1 
            ELSE @rank := 1 
       END As user_game_rank,
       @lastUserId := user_id
FROM game_logs
cross join (select @rank := 0, @lastUserId := 0) r
order by user_id, game_detail desc

SQLFiddle 演示

于 2018-11-25T06:16:43.590 回答
1

您可以使用一个非常简单的相关子查询:

SELECT *, (
    SELECT COUNT(DISTINCT game_detail) + 1
    FROM game_logs AS x
    WHERE user_id = t.user_id AND game_detail > t.game_detail
) AS user_game_rank
FROM game_logs AS t
ORDER BY user_id, user_game_rank

DB小提琴

它比用户变量更慢但更可靠。只需一次 JOIN 即可破坏它们。

于 2018-11-27T05:58:53.607 回答