我是 Presto SQL 语法的新手,想知道是否存在将行合并到n
特定范围内的 bin 的函数。
例如,我有一张表,其中包含 1m 个不同整数,范围从 1 到 100。我可以做些什么来创建 1 到 100 之间的 20 个 bin(一个 bin 用于 1-5、6-10、11-15 ......等)。 ) 不使用 20 个单独的CASE WHEN
语句?是否有任何标准 SQL 函数可以执行分箱功能?
任何意见,将不胜感激!
您可以使用标准的 SQL 函数width_bucket
。例如:
WITH data(value) AS (
SELECT rand(100)+1 FROM UNNEST(sequence(1,10000))
)
SELECT value, width_bucket(value, 1, 101, 20) bucket
FROM data
产生:
value | bucket
-------+--------
100 | 20
98 | 20
38 | 8
42 | 9
67 | 14
74 | 15
6 | 2
...
您可以只使用整数除法:
select (intcol - 1) / 5 as bin
Presto 进行整数除法,因此您不必担心余数。