sql - PostgreSQL GROUP BY 与 MySQL 不同？

Question

我一直在将一些 MySQL 查询迁移到 PostgreSQL 以使用 Heroku。我的大多数查询都可以正常工作，但是当我使用 group by 时，我总是遇到类似的重复错误：

错误：列“XYZ”必须出现在 GROUP BY 子句中或在聚合函数中使用

有人可以告诉我我做错了什么吗？

100％工作的MySQL：

SELECT `availables`.*
FROM `availables`
INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id
WHERE (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
GROUP BY availables.bookdate
ORDER BY availables.updated_at

PostgreSQL 错误：

ActiveRecord::StatementInvalid: PGError: ERROR: column "availables.id" 必须出现在 GROUP BY 子句中或用于聚合函数：
SELECT "availables".* FROM "availables" INNER JOIN "rooms" ON "rooms"。 id = "availables".room_id WHERE (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN E'2009-10-21' AND E'2009-10-23') GROUP BY availables.bookdate ORDER BY availables.updated_at

生成 SQL 的 Ruby 代码：

expiration = Available.find(:all,
    :joins => [ :room ],
    :conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
    :group => 'availables.bookdate',
    :order => 'availables.updated_at')

预期输出（来自工作 MySQL 查询）：

+-----+-------+--------+------------+---------+---- ------------+---------------+
| 编号 | 价格 | 斑点| 预订日期 | 房间号 | created_at | 更新时间 |
+-----+-------+--------+------------+---------+---- ------------+---------------+
| 414 | 38.0 | 1 | 2009-11-22 | 1762 | 2009-11-20... | 2009-11-20... |
| 415 | 38.0 | 1 | 2009-11-23 | 1762 | 2009-11-20... | 2009-11-20... |
| 416 | 38.0 | 2 | 2009-11-24 | 1762 | 2009-11-20... | 2009-11-20... |
+-----+-------+--------+------------+---------+---- ------------+---------------+
3排成套

score 114 · Accepted Answer

MySQL 完全不符合标准GROUP BY可以由 Postgres 模拟DISTINCT ON。考虑一下：

MySQL：

SELECT a,b,c,d,e FROM table GROUP BY a

这会为每个值提供 1 行a（您不知道是哪一个）。实际上你可以猜到，因为 MySQL 不知道哈希聚合，所以它可能会使用排序...但它只会排序a，所以行的顺序可能是随机的。除非它使用多列索引而不是排序。好吧，无论如何，它不是由查询指定的。

Postgres：

SELECT DISTINCT ON (a) a,b,c,d,e FROM table ORDER BY a,b,c

这为的每个值提供 1 行a，该行将是根据ORDER BY查询指定的排序中的第一行。简单的。

请注意，这里不是我计算的聚合。所以GROUP BY实际上没有任何意义。DISTINCT ON更有意义。

Rails 与 MySQL 结合，所以我对它生成的 SQL 在 Postgres 中不起作用并不感到惊讶。

score 17 · Accepted Answer

PostgreSQL 比 MySQL 更符合 SQL。输出中的所有字段（具有聚合函数的计算字段除外）都必须存在于 GROUP BY 子句中。

score 11 · Accepted Answer

MySQL 的 GROUP BY 可以不用聚合函数（这与 SQL 标准相反），并且返回组中的第一行（我不知道基于什么条件），而 PostgreSQL 必须有聚合函数（MAX， SUM 等）在发出 GROUP BY 子句的列上。

score 5 · Accepted Answer

正确，解决此问题的解决方案是使用 :select 并选择您希望用来装饰结果对象并按它们分组的每个字段。

讨厌 - 但它是 group by应该如何工作，而不是 MySQL 如何通过猜测你的意思，如果你不坚持你的 group by 字段。

score 3 · Accepted Answer

如果我没记错的话，在 PostgreSQL 中，您必须添加从 GROUP BY 子句适用于GROUP BY 子句的表中获取的每一列。

score 2 · Accepted Answer

不是最漂亮的解决方案，但更改 group 参数以输出模型中的每一列在 PostgreSQL 中有效：

expiration = Available.find(:all,
:joins => [ :room ],
:conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
:group => Available.column_names.collect{|col| "availables.#{col}"},
:order => 'availables.updated_at')

score 1 · Accepted Answer

根据 MySQL 的“Debuking GROUP BY Myths” http://dev.mysql.com/tech-resources/articles/debunking-group-by-myths.html。SQL（标准的 2003 版）不要求查询的 SELECT 列表中引用的列也出现在 GROUP BY 子句中。

score 1 · Accepted Answer

对于在 postgresql 中寻找按任何字段（包括连接字段）排序的方法的其他人，请使用子查询：

SELECT * FROM(
SELECT DISTINCT ON(availables.bookdate) `availables`.* 
FROM `availables` INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id 
WHERE (rooms.hotel_id = 5056 
AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
) AS distinct_selected
ORDER BY availables.updated_at

or arel:

subquery = SomeRecord.select("distinct on(xx.id) xx.*, jointable.order_field")
      .where("").joins(")
result = SomeRecord.select("*").from("(#{subquery.to_sql}) AS distinct_selected").order(" xx.order_field ASC, jointable.order_field ASC")

score 0 · Accepted Answer

我认为 .uniq [1] 将解决您的问题。

[1] Available.select('...').uniq

看看http://guides.rubyonrails.org/active_record_querying.html#selecting-specific-fields

sql - PostgreSQL GROUP BY 与 MySQL 不同？

9 回答 9

MySQL：

Postgres：

Related

Reference