74

我一直在将一些 MySQL 查询迁移到 PostgreSQL 以使用 Heroku。我的大多数查询都可以正常工作,但是当我使用 group by 时,我总是遇到类似的重复错误:

错误:列“XYZ”必须出现在 GROUP BY 子句中或在聚合函数中使用

有人可以告诉我我做错了什么吗?


100%工作的MySQL:

SELECT `availables`.*
FROM `availables`
INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id
WHERE (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
GROUP BY availables.bookdate
ORDER BY availables.updated_at


PostgreSQL 错误:

ActiveRecord::StatementInvalid: PGError: ERROR: column "availables.id" 必须出现在 GROUP BY 子句中或用于聚合函数:
SELECT "availables".* FROM "availables" INNER JOIN "rooms" ON "rooms"。 id = "availables".room_id WHERE (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN E'2009-10-21' AND E'2009-10-23') GROUP BY availables.bookdate ORDER BY availables.updated_at


生成 SQL 的 Ruby 代码:

expiration = Available.find(:all,
    :joins => [ :room ],
    :conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
    :group => 'availables.bookdate',
    :order => 'availables.updated_at')  


预期输出(来自工作 MySQL 查询):

+-----+-------+--------+------------+---------+---- ------------+---------------+
| 编号 | 价格 | 斑点| 预订日期 | 房间号 | created_at | 更新时间 |
+-----+-------+--------+------------+---------+---- ------------+---------------+
| 414 | 38.0 | 1 | 2009-11-22 | 1762 | 2009-11-20... | 2009-11-20... |
| 415 | 38.0 | 1 | 2009-11-23 | 1762 | 2009-11-20... | 2009-11-20... |
| 416 | 38.0 | 2 | 2009-11-24 | 1762 | 2009-11-20... | 2009-11-20... |
+-----+-------+--------+------------+---------+---- ------------+---------------+
3排成套
4

9 回答 9

114

MySQL 完全不符合标准GROUP BY可以由 Postgres 模拟DISTINCT ON。考虑一下:

MySQL:

SELECT a,b,c,d,e FROM table GROUP BY a

这会为每个值提供 1 行a(您不知道是哪一个)。实际上你可以猜到,因为 MySQL 不知道哈希聚合,所以它可能会使用排序...但它只会排序a,所以行的顺序可能是随机的。除非它使用多列索引而不是排序。好吧,无论如何,它不是由查询指定的。

Postgres:

SELECT DISTINCT ON (a) a,b,c,d,e FROM table ORDER BY a,b,c

这为 的每个值提供 1 行a,该行将是根据ORDER BY查询指定的排序中的第一行。简单的。

请注意,这里不是我计算的聚合。所以GROUP BY实际上没有任何意义。DISTINCT ON更有意义。

Rails 与 MySQL 结合,所以我对它生成的 SQL 在 Postgres 中不起作用并不感到惊讶。

于 2009-11-22T01:24:13.090 回答
17

PostgreSQL 比 MySQL 更符合 SQL。输出中的所有字段(具有聚合函数的计算字段除外)都必须存在于 GROUP BY 子句中。

于 2009-11-20T09:42:32.790 回答
11

MySQL 的 GROUP BY 可以不用聚合函数(这与 SQL 标准相反),并且返回组中的第一行(我不知道基于什么条件),而 PostgreSQL 必须有聚合函数(MAX, SUM 等)在发出 GROUP BY 子句的列上。

于 2009-11-20T09:38:10.497 回答
5

正确,解决此问题的解决方案是使用 :select 并选择您希望用来装饰结果对象并按它们分组的每个字段。

讨厌 - 但它是 group by应该如何工作,而不是 MySQL 如何通过猜测你的意思,如果你不坚持你的 group by 字段。

于 2009-11-20T11:29:37.140 回答
3

如果我没记错的话,在 PostgreSQL 中,您必须添加从 GROUP BY 子句适用GROUP BY 子句的表中获取的每一列。

于 2009-11-20T09:38:30.563 回答
2

不是最漂亮的解决方案,但更改 group 参数以输出模型中的每一列在 PostgreSQL 中有效:

expiration = Available.find(:all,
:joins => [ :room ],
:conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
:group => Available.column_names.collect{|col| "availables.#{col}"},
:order => 'availables.updated_at')
于 2012-04-26T15:00:50.943 回答
1

根据 MySQL 的“Debuking GROUP BY Myths” http://dev.mysql.com/tech-resources/articles/debunking-group-by-myths.html。SQL(标准的 2003 版)不要求查询的 SELECT 列表中引用的列也出现在 GROUP BY 子句中。

于 2011-06-02T14:38:27.487 回答
1

对于在 postgresql 中寻找按任何字段(包括连接字段)排序的方法的其他人,请使用子查询:

SELECT * FROM(
SELECT DISTINCT ON(availables.bookdate) `availables`.* 
FROM `availables` INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id 
WHERE (rooms.hotel_id = 5056 
AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
) AS distinct_selected
ORDER BY availables.updated_at

or arel:

subquery = SomeRecord.select("distinct on(xx.id) xx.*, jointable.order_field")
      .where("").joins(")
result = SomeRecord.select("*").from("(#{subquery.to_sql}) AS distinct_selected").order(" xx.order_field ASC, jointable.order_field ASC")
于 2013-06-06T06:48:05.777 回答
0

我认为 .uniq [1] 将解决您的问题。

[1] Available.select('...').uniq

看看http://guides.rubyonrails.org/active_record_querying.html#selecting-specific-fields

于 2012-03-02T02:41:43.583 回答