1

我最近通过尝试神经节监控系统遇到了 RRD。Ganglia 将监控数据存储在 RRD 中。我只是想知道,从可扩展性的角度来看,RRD 是如何工作的?如果我有潜在的大量数据要存储怎么办。像 ganglia 案例一样,如果我想存储所有历史监控统计信息,而不是仅存储最近使用特定 TTL 的数据,RRD 是否足以应付这种情况?

使用 RRD 的人可以分享一些关于 RRD 如何扩展的经验,以及它与 RDBMS 甚至大表相比如何?

4

2 回答 2

5

rrdtool 的内置整合功能是可配置的,因此根据您的磁盘空间,您可以使用 rrdtool 存储的高精度数据量没有限制。同样由于它的设计,rrdtool 数据库永远不需要被清理或以其他方式维护,因此您可以将设置扩展到惊人的大小。显然,您需要足够的内存和快速磁盘来让 rrdtool 处理大数据,但这对于任何大数据步骤都是一样的。

有些人对 rrdtools 的功能感到困惑,因为您也可以在微型嵌入式系统上运行它,当这些人开始在阁楼上的旧电脑上记录千兆字节的数据并发现它无法处理时,他们想知道...

于 2013-01-09T13:01:31.087 回答
2

RRD 旨在随着时间的推移自动模糊(平均化)您的数据,以便数据库的总大小保持大致相同,即使新数据不断到达。

所以,只有当你想要一些历史数据并且愿意随着时间的推移而失去精确度时,它才是好的。

换句话说,您无法真正将 RRD 与标准 SQL 数据库或 Bigtable 进行比较,因为标准 SQL 和 NoSQL 数据库都精确地存储数据——您将准确地阅读所写的内容。

然而,对于 RRDtool,没有这样的保证。但它的速度使其成为各种监控解决方案的有吸引力的解决方案,其中只有最近的数据很重要。

于 2013-01-08T11:34:14.410 回答