我一直在使用PostgreSQL,现在正在迁移到MySQL。
在我的查询中,我使用的是PostgreSQL ,我想知道MySQLSELECT DISTINCT ON (col1, col2, col3)
中是否有此语句的对应项。
我一直在使用PostgreSQL,现在正在迁移到MySQL。
在我的查询中,我使用的是PostgreSQL ,我想知道MySQLSELECT DISTINCT ON (col1, col2, col3)
中是否有此语句的对应项。
将使用 SELECT DISTINCT ON 的 Postgresql 查询转换为 MySQL 并没有完全等价的方法。
Postgresql SELECT DISTINCT ON
在 Postgresql 中,以下查询将消除表达式(col1, col2, col3)
匹配的所有行,并且它将只保留每组匹配行的“第一个 col4,col5 行”:
SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
所以如果你的桌子是这样的:
col1 | col2 | col3 | col4 | col5
--------------------------------
1 | 2 | 3 | 777 | 888
1 | 2 | 3 | 888 | 999
3 | 3 | 3 | 555 | 555
我们的查询将只为 (1,2,3) 保留一行,为 (3,3,3) 保留一行。结果行将是:
col4 | col5
-----------
777 | 888
555 | 555
请注意,每组的“第一行”是不可预测的,除非我们指定 ORDER BY,否则我们的第一行也可能是 (888, 999):
SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4
(表达式上的 DISTINCT 必须匹配最左边的 ORDER BY 表达式,但 ORDER BY 可以包含其他表达式)。
MySQL 对 GROUP BY 的扩展
MySQL 扩展了GROUP BY的使用,以便我们可以选择未在 GROUP BY 子句中命名的非聚合列。每当我们选择非聚合列时,服务器可以自由地从该列的每个组中选择任何值,因此结果值将是不确定的。
所以这个 Postgresql 查询:
SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
可以认为等价于这个 MySQL 查询:
SELECT col4, col5
FROM tablename
GROUP BY col1, col2, col3
Postgresql 和 MySQL 都会为每个 (col1, col2, col3) 返回“第一行”,并且在这两种情况下,返回的行都是不可预测的,因为我们没有指定和 order by 子句。
很多人很想用 ORDER BY 转换这个 Postgresql 查询:
SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4
有了这个:
SELECT col4, col5
FROM (
SELECT col1, col2, col3, col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4
) s
GROUP BY col1, col2, col3
这里的想法是将 ORDER BY 应用于子查询,以便当 MySQL 按 col1、col2、col3 分组时,它将保留 col4 和 col5 的第一个遇到的值。这个想法很好,但它是错误的!MySQL 可以自由选择 col4 和 col5 的任何值,我们不知道最先遇到哪些值,这取决于优化器。所以我会纠正它:
SELECT t1.col4, t1.col5
FROM tablename t1 INNER JOIN (SELECT col1, col2, col3, MIN(col4) as m_col4
FROM tablename
GROUP BY col1, col2, col3) s
ON t1.col1=s.col1
AND t1.col2=s.col2
AND t1.col3=s.col3
AND t1.col4=s.m_col4
GROUP BY
t1.col1, t1.col2, t1.col3, t1.col4
但这开始变得更加复杂。
结论
作为一般规则,没有将 Postgresql 查询转换为 MySQL 查询的确切方法,但有很多变通方法,生成的查询可能与原始查询一样简单,也可能变得非常复杂,但这取决于查询本身。
使用子查询来确定顺序,并使用外部查询对它们进行分组。
就像@a_horse_with_no_name 指出的那样,这是因为 MySQL 允许 partial group by
,这与其他 DBMS 不同。
例如:
CREATE TABLE customer_order
(`customer` varchar(5), `item` varchar(6), `date` datetime)
;
INSERT INTO customer_order
(`customer`, `item`, `date`)
VALUES
('alice', 'widget', '2000-01-05 00:00:00'),
('bob', 'widget', '2000-01-02 00:00:00'),
('alice', 'widget', '2000-01-01 00:00:00'),
('alice', 'wodget', '2000-01-06 00:00:00')
;
查询每个客户的第一笔订单:
select *
from
(select customer, item, date
from customer_order
order by date) c
group by customer
结果:
| CUSTOMER | ITEM | DATE |
|----------|--------|--------------------------------|
| alice | widget | January, 01 2000 00:00:00+0000 |
| bob | widget | January, 02 2000 00:00:00+0000 |
您不能从多个列中选择不同的值。在选择这样的使用查询时
select distinct col1, col2 from table
您应该迁移到PDO或MSYQLI 而不是MYSQL ,因为它已被弃用。
关于你可以做的问题
SELECT DISTINCT col1, col2, col3
或者
SELECT col1, col2, col3
........
GROUP BY col1 --//--- or whatever column you want to be distinct