我有一种情况,用户可以指定任意数量的参数,这些参数将根据表进行过滤。简单地说,有一系列参数,每个参数有 64 个桶。总之,这代表了一个线性的数字序列。每条记录包含任意数量的桶点。
此外,这些数字在每个桶内的范围内。
用户可以指定任意数量的任意记录的期望值范围。返回所有指定参数(桶)重叠的记录。
你会注意到有一个低点和一个高点。这是范围。通过查看是否有重叠,我可以获得比使用范围查询快得多的结果。这是一种优化技术。
这是一个具有两个条件的示例:
SELECT id
FROM mytable2
WHERE (val_low && (ARRAY(SELECT generate_series((0 * 64) + 20, (0 * 64) + 28))) OR
val_high && (ARRAY(SELECT generate_series((0 * 64) + 20, (0 * 64) + 28))))
AND (val_low && (ARRAY(SELECT generate_series((1 * 64) + 12, (1 * 64) + 15))) OR
val_high && (ARRAY(SELECT generate_series((1 * 64) + 12, (1 * 64) + 15))))
和桶针对指定范围的数组进行交集测试val_low
。val_high
问题是我必须在函数中动态构建这个查询。参数列表被传递给函数(作为用户定义的类型 [array]),查询动态生成,然后执行。
它有效,但我希望能够做到这一点,而不必在函数中编写 SQL。
具体来说,该函数将传递一个自定义类型数组,如下所示:
param_num int,
val_low int,
val_high int
generate_series 函数调用中的值为(param_num * 64) + val_low, (param_num * 64) + val_high
.
这可能吗?
样本数据创建:
DROP TABLE IF EXISTS
mytable2;
CREATE TABLE
mytable2
(
id INT NOT NULL PRIMARY KEY,
val_low int[],
val_high int[]
);
SELECT SETSEED(0.20130725);
WITH t AS
(
SELECT id,
1 + FLOOR(RANDOM() * 24) AS l1, (RANDOM() * 8)::int AS h1,
1 + FLOOR(RANDOM() * 24) AS l2, (RANDOM() * 8)::int AS h2,
1 + FLOOR(RANDOM() * 24) AS l3, (RANDOM() * 8)::int AS h3,
1 + FLOOR(RANDOM() * 24) AS l4, (RANDOM() * 8)::int AS h4
FROM generate_series(1, 500000) id
)
INSERT
INTO mytable2
SELECT T.id, array[t.l1, (1 * 64) + t.l2, (2 * 64) + t.l3, (3 * 64) + t.l4],
array[t.l1 + t.h1, (1 * 64) + t.l2 + t.h2, (2 * 64) + t.l3 + t.h3,
(3 * 64) + t.l4 + t.h4]
FROM T;
CREATE INDEX
ix_mytable2_vhstore_low
ON mytable2
USING GIN (val_low);
CREATE INDEX
ix_mytable2_vhstore_high
ON mytable2
USING GIN (val_high);
示例查询:
--EXPLAIN ANALYZE
SELECT COUNT(1)
FROM
(
SELECT id
FROM mytable2
WHERE (val_low && (ARRAY(SELECT generate_series(20, 28))) OR val_high &&
(ARRAY(SELECT generate_series(20, 28))))
AND (val_low && (ARRAY(SELECT generate_series((1 * 64) + 12, (1 * 64) + 15)))
OR val_high && (ARRAY(SELECT generate_series((1 * 64) + 12, (1 * 64) + 15))))
) m;
结果:54983