所以如果我这样做:
SELECT DISTINCT column_1, column_2, MD5(rand())
FROM table
我得到 n 行数,这是正确的不同行数。
如果我这样做:
SELECT DISTINCT column_1, column_2, "whatever"
FROM table
以上返回 n+m 基本上是表中的所有行。
这里发生了什么?
您的查询细分:
从表中选择 DISTINCT column_1、column_2
将返回 column_1 AND column_2 的不同结果。例如,如果您有:
column_1 column_2
Peter 26
John 27
Adam 26
Fred 25
结果将是所有四行。
包括 MD5(rand()) 将生成一个新列,因此将返回表中的所有结果(与您实际报告的相反 - 不同行的数量)。即 SELECT DISTINCT column_2, MD5(rand()) FROM table 也将返回 4 行:
26, 2c346f92e3ccccfeccc75b1f8fbec910
27, 6f8af159c2658cf8a33d0e29419a71a6
26, 4f7f54cd9527c509da322caeb31c73c9
25, 01a4a55f61cba7ef922180b5520698d2
另一方面 - 将相同的值传递给查询实际上将返回不同数量的结果。即 SELECT DISTINCT column_2, "whatever" FROM table 将返回 3 行:
26, whatever
27, whatever
25, whatever