mysql - 将 SELECT DISTINCT ON 查询从 Postgresql 转换为 MySQL

Question

我一直在使用PostgreSQL，现在正在迁移到MySQL。

在我的查询中，我使用的是PostgreSQL ，我想知道MySQLSELECT DISTINCT ON (col1, col2, col3)中是否有此语句的对应项。

score 56 · Accepted Answer

将使用 SELECT DISTINCT ON 的 Postgresql 查询转换为 MySQL 并没有完全等价的方法。

Postgresql SELECT DISTINCT ON

在 Postgresql 中，以下查询将消除表达式(col1, col2, col3)匹配的所有行，并且它将只保留每组匹配行的“第一个 col4，col5 行”：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

所以如果你的桌子是这样的：

col1 | col2 | col3 | col4 | col5
--------------------------------
1    | 2    | 3    | 777  | 888
1    | 2    | 3    | 888  | 999
3    | 3    | 3    | 555  | 555

我们的查询将只为 (1,2,3) 保留一行，为 (3,3,3) 保留一行。结果行将是：

col4 | col5
-----------
777  | 888
555  | 555

请注意，每组的“第一行”是不可预测的，除非我们指定 ORDER BY，否则我们的第一行也可能是 (888, 999)：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

（表达式上的 DISTINCT 必须匹配最左边的 ORDER BY 表达式，但 ORDER BY 可以包含其他表达式）。

MySQL 对 GROUP BY 的扩展

MySQL 扩展了GROUP BY的使用，以便我们可以选择未在 GROUP BY 子句中命名的非聚合列。每当我们选择非聚合列时，服务器可以自由地从该列的每个组中选择任何值，因此结果值将是不确定的。

所以这个 Postgresql 查询：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

可以认为等价于这个 MySQL 查询：

SELECT col4, col5
FROM tablename
GROUP BY col1, col2, col3

Postgresql 和 MySQL 都会为每个 (col1, col2, col3) 返回“第一行”，并且在这两种情况下，返回的行都是不可预测的，因为我们没有指定和 order by 子句。

很多人很想用 ORDER BY 转换这个 Postgresql 查询：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

有了这个：

SELECT col4, col5
FROM (
  SELECT col1, col2, col3, col4, col5
  FROM tablename
  ORDER BY col1, col2, col3, col4
) s
GROUP BY col1, col2, col3

这里的想法是将 ORDER BY 应用于子查询，以便当 MySQL 按 col1、col2、col3 分组时，它将保留 col4 和 col5 的第一个遇到的值。这个想法很好，但它是错误的！MySQL 可以自由选择 col4 和 col5 的任何值，我们不知道最先遇到哪些值，这取决于优化器。所以我会纠正它：

SELECT t1.col4, t1.col5
FROM tablename t1 INNER JOIN (SELECT col1, col2, col3, MIN(col4) as m_col4
                              FROM tablename
                              GROUP BY col1, col2, col3) s
     ON t1.col1=s.col1
        AND t1.col2=s.col2
        AND t1.col3=s.col3
        AND t1.col4=s.m_col4
GROUP BY
  t1.col1, t1.col2, t1.col3, t1.col4

但这开始变得更加复杂。

结论

作为一般规则，没有将 Postgresql 查询转换为 MySQL 查询的确切方法，但有很多变通方法，生成的查询可能与原始查询一样简单，也可能变得非常复杂，但这取决于查询本身。

score 1 · Accepted Answer

使用子查询来确定顺序，并使用外部查询对它们进行分组。

就像@a_horse_with_no_name 指出的那样，这是因为 MySQL 允许 partial group by，这与其他 DBMS 不同。

例如：

CREATE TABLE customer_order
    (`customer` varchar(5), `item` varchar(6), `date` datetime)
;

INSERT INTO customer_order
    (`customer`, `item`, `date`)
VALUES
    ('alice', 'widget', '2000-01-05 00:00:00'),
    ('bob', 'widget', '2000-01-02 00:00:00'),
    ('alice', 'widget', '2000-01-01 00:00:00'),
    ('alice', 'wodget', '2000-01-06 00:00:00')
;

查询每个客户的第一笔订单：

select *
from
  (select customer, item, date
  from customer_order
  order by date) c
group by customer

结果：

| CUSTOMER |   ITEM |                           DATE |
|----------|--------|--------------------------------|
|    alice | widget | January, 01 2000 00:00:00+0000 |
|      bob | widget | January, 02 2000 00:00:00+0000 |

http://sqlfiddle.com/#!2/6cbbe/1

score -5 · Accepted Answer

您不能从多个列中选择不同的值。在选择这样的使用查询时

select distinct col1, col2 from table

score -6 · Accepted Answer

您应该迁移到PDO或MSYQLI 而不是MYSQL ，因为它已被弃用。

关于你可以做的问题

   SELECT DISTINCT col1, col2, col3

或者

    SELECT col1, col2, col3
    ........

    GROUP BY col1 --//--- or whatever column you want to be distinct

mysql - 将 SELECT DISTINCT ON 查询从 Postgresql 转换为 MySQL

4 回答 4

Related

Reference