3

我的问题与类似。我需要数据结构来存储和访问大量时间序列数据。在我的情况下,插入率非常高 - 每秒插入 10-100k。数据项是包含时间戳、传感器 ID 和传感器值的元组。我有非常多的传感器。在我的情况下,必须删除早于某个时间点的值。

我需要按传感器 ID 和时间范围查询数据集。所有数据都必须存储在外部存储器中,没有办法将其放入主存储器中。

我已经知道 TSB-tree,但是 TSB-tree 很难实现,并且不能保证它会完成这项工作。我怀疑 TSB-tree 在高插入率下表现不佳。

有没有其他选择?也许像 LSM-tree 但用于多维数据?

4

1 回答 1

3

因为您使用的是外部存储器,您可能需要通读Henrik Jonsson 的论文中关于 B-trees 的章节- B-trees本身是一种非常流行的在外部存储器中索引数据的方法,您应该能够在任何语言,而 Jonnson 讨论了如何调整它们以存储时间序列数据。

于 2013-06-06T21:22:13.617 回答