database - 排序键/值数据库解决方案

Question

我正在寻求实现一个数据库解决方案，以支持对一组简单的 2D 数据集进行非常快速的基于列的访问。即考虑这个数据集

==========================================================
                     SOME DATASET1
==========================================================
   ENTRY     |    Col1   |   Col2  |    Col3    ... Coln
----------------------------------------------------------
   ENTRY A        1.1        0.2         5.5       6.2
   ENTRY B        2.3        6.4         1.5       1.1
   ENTRY C        2.2        4.2         9.5       3.4
   ENTRY D        2.3        1.1         5.5       2.9
   ENTRY E        9.1        3.6         7.5       2.6

我需要的是一种简单地选择 column1、column2 或 column n 中的所有值，同时保留排序顺序的方法。我最初的想法是使用 redis，具有以下键空间设计：

   SOMEDS1/COLUMNS/           =>     Col1, Col2, Col3 ... Coln
   SOMEDS1/ENTRIES/           =>     A, B, C, D, E
   SOMEDS1/Col1/              =>     1.1, 2.3, 2.2, 2.3, 9.1
   SOMEDS1/Coln/              =>     ......

这种设计背后的原理是每个列表中的条目数量不大，可能< 10,000，但可能有很多列，并且在给定时间只需要选定的列。

我的问题是有没有人已经实现了这样的东西，如果有的话，你能建议最合适的数据库类型吗？我最初的想法是使用 redis，但我愿意接受建议。

score 1 · Accepted Answer

您没有指定是否需要对数据存储进行本地或远程访问。如果你需要远程访问，那么 Redis 可能是一个非常好的解决方案。如果您的访问纯粹是本地的，那么嵌入式数据库（例如 BerkeleyDB）可能会更有效。

重点是定义数据的维护方式：是否只能在数据结构的末尾添加新条目？如果是，Redis 列表将飞来存储您的列。如果不是这样，将您的数据保持在每列的哈希对象（关联的条目和值）中可能会更好。如果条目数很少，那么在客户端检索后对数据进行排序无论如何都很便宜。

这种设计类似于您可以在某些列式数据库中找到的实现。这种方法的主要好处是系统可以以高压缩率压缩给定列的值，这在数据量很大时很有趣。缺点是数据的实时维护比较困难。对于 MySQL 的示例，您可能想看看Infobright或Calpont产品。

在您的情况下，如果数据量有限，Redis 非常适合。但是请注意，当条目数量变得很大（即超过此处描述的阈值）时，这些数据在内存中的表示将不会特别紧凑（涉及指针、双链表和/或哈希表）。

score 1 · Accepted Answer

我像这样在 Redis 中存储数据：

字符串：

Entry:A:Col1 => 1.1
Entry:A:Col2 => 0.2
Entry:A:Col3 => 5.5
...
Entry:A:ColN => 6.2

您可以使用无限数量的列（受物理内存限制）

database - 排序键/值数据库解决方案

2 回答 2

Related

Reference