1

我是 PostgreSQL 新手。我对需要构建的混合数据库有一个非常不寻常的要求。从我见过的模块来看,在我看来,以下是可能的。

我需要能够将 key - [values] 添加到索引中,而无需实际将数据添加到表中。简单地说,我需要一个 key-[values] 存储,最好是一个 btree(查找速度)。索引结构是理想的。也许另一种结构可以做到这一点。

具体来说,我希望存储如下内容:

KEY     [IDs]
Blue    10, 20, 23, 47
Green   5, 12, 40

我不希望存储这些数据和索引它的开销。可以这么说,我只需要“索引但未存储”的数据。

同样重要的是能够查询这些结构并获取数据(ID),并能够在 ID 上执行 INTERSECTS 等,并在键上执行 IN、BETWEEN、= 等。

正如您可能猜到的,最终目标是最终的 ID 列表,然后将其发送给客户端,并随意查找。

编辑

我不想要的是记录每个值的键。使用上面的示例,我不想存储 {Blue, 10}、{Blue, 20} 等。我想存储 {Blue, [10, 20, 23, 47]}。

如果我将其存储为传统表格,则无法解决此重复问题。

再看一下 Blue,[10, 20, 23, 47]},这在技术上只不过是一个 btree,其中 ID (10, 20, 23, 47) 被标记为值,父键“Blue”被标记为键。

由于这种数据类型不匹配可能在一棵树中很混乱,我认为理想的解决方案是“[btrees] in a btree”,其中“btree”是键,而 [btrees] 是 a 的每组值的 btree钥匙。

4

1 回答 1

3

如果您真的坚持这样做,您可以将值存储为数组,并且intarray模块提供操作符来操作这些值。那是:

create table data(key text primary key, values int[] not null);
insert into data
  values('Blue', '{10,20,23,47}'),('Green','{5,12,40}'),('Red', '{5,10,28}');

有了这个你可以写:

select unnest(values) from data where key = 'Blue'
  intersect
  select unnest(values) from data where key = 'Red';

理想情况下,您需要一个聚合函数来将 int[] 转换为集合并计算交集等,但似乎没有提供它们。

实际上,这只是更典型结构的稍微紧凑的存储:

select key, unnest(values) as value from data;
  key  | value
-------+-------
 Blue  |    10
 Blue  |    20
 Blue  |    23
[...]

实际上,您可以简单地将视图定义为上述查询。

更规范化的方法是有两个表:一个用于描述键,一个用于将它们与值关联:

create table key_dimension(key_id serial primary key, key text not null unique);
insert into key_dimension(key) values('Blue'),('Green'),('Red');
create table key_value(key_id int not null references key_dimension(key_id), value int not null, primary key(key_id, value));
insert into key_value(key_id, value)
  select key_id, unnest(values) from key_dimension join data using (key);

现在:

select value from key_value
  where key_id = (select key_id from key_dimension where key = 'Red')
intersect
select value from key_value
  where key_id = (select key_id from key_dimension where key = 'Blue')

因此,任何选择键值的查询只需要针对键集 (key_dimension) 运行,然后使用最小合成键 (key_id) 将它们转换为实际的数据值集(来自 key_value)。

于 2011-03-13T12:48:13.790 回答