0

我们有一个使用 Postgres 作为数据库的 RAILS 应用程序,并且有一个在一系列值上绘制图形的用例。不幸的是,范围是小数,所以我无法使用 Postgres 的 generate_series 函数。需要帮助找出查询此问题的最佳方法,而不是将其拆分为 10 个不同的查询。这是示例数据

  • 我们有一张带有分数的表 | 学生
  • 给定一个查询,我会得到一组 score-student 元组,从中我得到 range(min(score), max(score))。例如范围(10.25, 16.80)
  • 我们需要将上述范围分成 10 个步骤,间隔为 0.655,即 (max-min)10 - 10.25,10.91,11.56,12.22,12.87
  • 对于上面的每个步骤,显示该分数与先前值之间的学生人数
  • 结果将是一个带有 [(10.25,11232),(10.91,2434),....] 的数组

在 Postgres 中以单个查询或少于 10 个以上的查询执行此操作的任何方式/想法?

4

1 回答 1

1

设置的结果(对我来说更有意义):

WITH base AS (
   SELECT student, score
   FROM   tbl
   WHERE  <some_condition>
   )
, border AS (
   SELECT min(score) AS min_score, max(score) AS max_score
   FROM   base
   )
SELECT lower_bound, ct
FROM  (
   SELECT step
        , min_score + ((max_score - min_score) * (step-1)) / 10 AS lower_bound
   FROM   border, generate_series(1,10) step
   ) x
LEFT   JOIN (
   SELECT width_bucket(b.score, x.min_score, x.max_score, 10) AS step
        , count(*)::int AS ct
   FROM   border x, base b
   GROUP  BY step
   ) y USING (step)
ORDER  BY step;

具有两个CTEgenerate_series()仍然有用)和经常被忽视的函数width_bucket()

要生成复合类型数组,如问题中所述,首先创建一个匹配类型(一次):

CREATE TYPE my_type AS (bound numeric, ct int);

假设numeric缺乏信息的价值。
然后将上述查询提供给数组构造函数

SELECT ARRAY (
   <query from above>
   SELECT (lower_bound, ct::int)::my_type   -- only difference
   <query from above>
   );
于 2014-06-24T00:26:53.530 回答