1

我正在开发一个需要存储大量温度数据的系统。我可能每秒存储 5 个或更多样本。

我过去使用相对简单的 mysql 数据库完成了此操作,性能变得难以忍受。插入物并不算太糟糕,但有明显的负荷。但是,查询可能需要几分钟。

那时,我有大约 50 GB 的数据,这太荒谬了。我可以想出很多方法来压缩或丢弃数据而不会丢失关键信息,但这是一个完全不同的问题。

我想选择一个针对此类数据进行了优化的工具/数据库,最好是跨平台的(至少是 linux/c++)。

RRD(Round Robin Database)似乎是为这种事情而构建的,但它似乎更多地是为处理数据而不是存储数据而设计的。

还有哪些可用的工具?

编辑:更多信息...

这将在嵌入式系统(Raspberry Pi)上运行,因此理想的工具具有低计算开销、低内存占用和很少的库依赖关系。

存储可能不一定在同一设备上。

我想在一个人为的极端情况下,增长可以达到每小时 50 万个样本。更有可能的是每小时大约 20k 个样本。

不应假定可以访问 Internet。

4

1 回答 1

1

看起来您正在寻找时间序列数据库。

我知道有两个候选人:

如果您可以更具体地了解您的要求(req/s、每日数据增长、API 类型、自托管或完全托管的解决方案等),我将能够详细介绍或推荐其他解决方案。

祝你好运。

于 2012-12-31T02:05:09.533 回答