7

介绍

我正在尝试从 Cassandra 1.2.6 集群中收集一些统计信息以实现 Web 服务以将这些统计信息提供给 Web 应用程序。我正在使用 cql 库从 Python 访问集群,但我也可以通过 ssh 或 pssh 访问节点。

问题

我的问题是如何获取整个集群中的总表大小(即每个表的实际磁盘使用量),以及如果可能的话,每个表的总行数(这可以是一个估计值)。

问题

到目前为止,我发现的唯一选择似乎是在每个节点上运行 nodetool cfstats 并解析响应,有没有更好的方法呢?

提前致谢!

4

1 回答 1

1

我认为最好的方法是直接通过 JMX 访问统计信息(这就是 nodetool 的实际工作方式。)每个节点都提供了广泛的指标,但您会感兴趣的是。

org.apache.cassandra.metrics
  ColumnFamily
    cf_name
       TotalDiskSpaceUsed
       MemtableDataSize
于 2013-10-08T19:16:55.843 回答