假设您有这样的查询:
SELECT g, v
FROM t
GROUP BY g;
在这种情况下,对于 的每个可能值g
,mysql 选择 的对应值之一v
。
但是,选择哪一个取决于某些情况。
我在某处读到,对于每组 g,v
按照记录插入表的顺序保留的第一个值t
。
这很丑陋,因为表中的记录应该被视为一个集合,其中元素的顺序不重要。这太“mysql-ish”了……
如果要确定v
要保留哪个值,则需要t
像这样应用子选择:
SELECT g, v
FROM (
SELECT *
FROM t
ORDER BY g, v DESC
) q
GROUP BY g;
通过这种方式,您可以定义外部查询处理子查询记录的顺序,因此您可以相信它将v
为g
.
但是,如果您需要一些 WHERE 条件,则要非常小心。如果您将 WHERE 条件添加到子查询,那么它将保持该行为,它将始终返回您期望的值:
SELECT g, v
FROM (
SELECT *
FROM t
WHERE g = '737a8783-110c-447e-b4c2-1cbb7c6b72c9'
ORDER BY g, v DESC
) q
GROUP BY g;
这是您所期望的,子选择过滤器并对表进行排序。它保留g
具有给定值的记录,外部查询返回该g
值和v
.
但是,如果将相同的 WHERE 条件添加到外部查询,则会得到不确定的结果:
SELECT g, v
FROM (
SELECT *
FROM t
-- WHERE g = '737a8783-110c-447e-b4c2-1cbb7c6b72c9'
ORDER BY g, v DESC
) q
WHERE g = '737a8783-110c-447e-b4c2-1cbb7c6b72c9'
GROUP BY g;
v
令人惊讶的是,当一次又一次地执行相同的查询时,您可能会得到不同的值,这很奇怪。预期的行为是从子查询中以适当的顺序获取所有记录,在外部查询中过滤它们,然后选择与前一个示例中选择的相同的记录。但事实并非如此。
它选择一个v
看似随机的值。v
如果我执行更多(~20)次但分布不均匀,相同的查询返回不同的值。
如果不是添加外部 WHERE,而是指定 HAVING 条件,如下所示:
SELECT g, v
FROM (
SELECT *
FROM t1
-- WHERE g = '737a8783-110c-447e-b4c2-1cbb7c6b72c9'
ORDER BY g, v DESC
) q
-- WHERE g = '737a8783-110c-447e-b4c2-1cbb7c6b72c9'
GROUP BY g
HAVING g = '737a8783-110c-447e-b4c2-1cbb7c6b72c9';
然后你再次得到一致的行为。
结论:我建议完全不要依赖这种技术。如果您真的想要/需要避免外部查询中的 WHERE 条件。如果可以的话,在内部查询中使用它,或者在外部查询中使用 HAVING 子句。
我用这个数据测试了它:
CREATE TABLE t1 (
v INT,
g VARCHAR(36)
);
INSERT INTO t1 VALUES (1, '737a8783-110c-447e-b4c2-1cbb7c6b72c9');
INSERT INTO t1 VALUES (2, '737a8783-110c-447e-b4c2-1cbb7c6b72c9');
在 mysql 5.6.41 中。
也许这只是一个在较新版本中得到/修复的错误,如果您有使用较新版本的经验,请提供反馈。