2

我们试图解决的问题:存储所有可以稍后查询的数据点以推断 Web 服务的性能。给出数据的可视化表示。

到目前为止,这是我在 Hbase 和 TSDB 网站上阅读的内容

  • TSDB 将数据存储在 Hbase 中,虽然方式有点不标准(宽行格式)

  • TSDB 速度非常快,并且提供了非常快速地添加图形的方法。

  • HBase 虽然与 TSDB 相比速度较慢,但​​让您可以选择使用 SIMBA ODBC 驱动程序将其连接到 Tableau,这是惊人的敏捷和美观的可视化数据表示。

TSDB 的另一个问题是它不适用于当前的 HBase .96(我知道 tsuna@ 正在开发它,但我没有针对当前 Hbase.96 的稳定版本 tsdb 的时间表)

因此,您的简单答案可能是 Hbase 或 TSDB,或者除了选择其中一个之外,您还可以证明您的答案并帮助我选择另一个。

我对其他解决方案持开放态度,如果它们可以支持一年内存储的大约万亿个数据点。

4

2 回答 2

1

老实说,如果你需要绘制数据,你应该考虑使用 OpenTSDB。我不确定从长远来看它会更好,因为 OpenTSDB 正在不断发展,并且在 11 月发布了 RC 2.0 版本。还有一个 OpenTSDB 的分支,称为KairosDB,它使用Apache Cassandra作为数据库,因此您可以将点存储到毫秒,而 OpenTSDB 允许您将点存储到秒。

所以我建议你像 OpenTSDB/KairosDB 这样的时间序列分布式数据库以一种非常简单的方式绘制数据。不确定长期问题,也许下个月可以在 Hbase 上开发更好的东西,因为它是开源的。

于 2013-12-14T12:16:27.403 回答
1

如果您设置在 Hadoop 生态系统上,Axibase 时间序列数据库是另一个运行在 HBase 之上的产品。我们与 Tableau 和 JDBC 驱动程序进行了内置集成,允许您使用我们支持的类似 SQL 的查询来获取时间序列数据(原始和聚合)。

https://github.com/axibase/atsd-jdbc上提供的源代码和示例

于 2015-08-06T18:40:44.213 回答