0

我在客户处安装了一个 6 节点 VM Apache Cassnadra 1.0.6 环。我们在云提供商中使用 HA 代理。我们最初提供了完整的设置,然后客户 IT 进入那里使其变得更好。现在我们继续遇到我们被指责的问题,我们必须确定原因。

我看到在一个特定节点上,我们继续有一个高提示的切换队列。我还看到一个数据很少的节点。

我怀疑节点没有在环周围进行通信。是否有命令或其他工具或方法可以用来查看八卦消息是否按应有的方式在环上传播?

更一般地说,确定 Cassandra 环网络的健康/配置的最佳方法/工具是什么。我想确保所有节点都能够通过 gossip 相互通信并且数据正在被复制。

4

1 回答 1

2

众所周知,Gossip协议负责点对点通信,所以基本上如果我们跟踪rpc端口即9160(默认),那么我们可以得到一些相关信息

tcp        0      0 XXX.XX.XX.XX:9160       XXX.XX.XX.XX:47166      ESTABLISHED 21990/java       keepalive (5554.50/0/0)
tcp        0      0 XXX.XX.XX.XX:9160       XXX.XX.XX.XX:47164      ESTABLISHED 21990/java       keepalive (5554.50/0/0)
tcp        0      0 XXX.XX.XX.XX:47162      XXX.XX.XX.XX:9160       ESTABLISHED 1334/python2.7   off (0.00/0/0)
tcp        0      0 XXX.XX.XX.XX:9160       XXX.XX.XX.XX:47163      ESTABLISHED 21990/java       keepalive (5554.50/0/0)
tcp        0      0 XXX.XX.XX.XX:47164      XXX.XX.XX.XX:9160       ESTABLISHED 1334/python2.7   off (0.00/0/0)
tcp        0      0 XXX.XX.XX.XX:9160       XXX.XX.XX.XX:47167      ESTABLISHED 21990/java       keepalive (5554.50/0/0)
tcp        0      0 XXX.XX.XX.XX:9160       XXX.XX.XX.XX:47165      ESTABLISHED 21990/java       keepalive (5554.50/0/0)
tcp        0      0 XXX.XX.XX.XX:47166      XXX.XX.XX.XX:9160       ESTABLISHED 1334/python2.7   off (0.00/0/0)
tcp        0      0 XXX.XX.XX.XX:9160       XXX.XX.XX.XX:47162      ESTABLISHED 21990/java       keepalive (5554.50/0/0)
tcp        0      0 XXX.XX.XX.XX:9160       XXX.XX.XX.XX:47168      ESTABLISHED 21990/java       keepalive (5554.50/0/0)
tcp6       0      0 XXX.XX.XX.XX:47167      XXX.XX.XX.XX:9160       ESTABLISHED 2215/java        keepalive (5554.50/0/0)
tcp6       0      0 XXX.XX.XX.XX:47168      XXX.XX.XX.XX:9160       ESTABLISHED 1189/java        off (0.00/0/0)

从这些信息中,我们可以很容易地确定,是的,Gossip 仍在工作。

于 2013-04-22T18:15:04.513 回答