在尝试使用 cassandra 2.0.1 版本时,我开始面临版本问题的握手。
OutboundTcpConnection.java 有一个异常,指出无法与特定节点进行握手。
我看了看 TCP 转储,打消了网络层没有问题的疑虑。
应用程序未完成握手过程。此外,端口 7000 仍处于活动状态。
例如,我所有的 8 个节点都是 up 。但是当我尝试 nodetool 状态时,一些节点会给出 DN-down 节点状态。后来,经过检查,发现 TCP 积压队列溢出,特定服务器已停止侦听集群中的其他服务器。
我仍然无法发现这个问题的根本原因。
注意:我已经尝试过使用以前版本的 cassandra 1.2.4,当时它工作正常。在投入生产之前,我认为最好转到 2.0.x 版本,主要是避免迁移开销。任何人都可以提供一个想法吗?
我得到的例外是
NFO [HANDSHAKE-/aa.bb.cc.XX] 2013-10-03 17:36:16,948 OutboundTcpConnection.java(第 385 行)与 /aa.bb.cc.XX 信息 [HANDSHAKE-/aa.bb. cc.YY] 2013-10-03 17:36:17,280 OutboundTcpConnection.java(第 396 行)无法与 /aa.bb.cc.YY 握手版本