java - Cassandra NoHostAvailableException 仍然存在节点

Question

我在一个 DC 中有两个 C* 2.0.2 节点（在 cassandra.yaml 中有默认配置）和一个 RF=2 的键空间。两个客户端使用 Datastax Java 驱动程序 1.0.3 连接到此 DC。客户端使用 CL=ONE 从/向 C* 读取和写入数据，没有任何错误。但是当我关闭一个节点时，两个客户端都会出现大量异常：

com.datastax.driver.core.exceptions.NoHostAvailableException:
All host(s) tried for query failed (no host was tried)

在那一堆异常之后，客户端继续成功地与另一个仍然活着的节点一起工作。我应该怎么做才能收到任何 NoHostAvailableException 因为一次至少有一个活动节点并且使用了 CL=ONE？

更新： 当我关闭两个节点之一时，有时会在我的应用程序日志中看到以下异常：

[Reconnection-1] [ERROR] [Control connection] Cannot connect to
any host, scheduling retry

如果我只关闭一个节点，为什么两个节点都不可用？第二个现在还活着，我可以用 cqlsh 连接到它。

score 0 · Accepted Answer

如果您使用 CL=ONE 执行请求，驱动程序会尝试仅查询单个节点。因此，如果对该节点的请求失败（或该节点不可用），则会立即抛出异常。此行为由com.datastax.driver.core.policies.RetryPolicy创建时指定控制Cluster。

我想说，RetryPolicy进行固定重试次数的 a 将满足您的需求。不幸的是，Cassandra Driver 1.0.3 没有捆绑它（我不确定以后的版本是否有）。不过，它可能会像这样实现：

public class MyRetryPolicy implements RetryPolicy {

    final int attempts;

    public MyRetryPolicy(int attempts) {
        this.attempts = attempts;
    }

    @Override
    public RetryDecision onReadTimeout(Query query, ConsistencyLevel cl, int requiredResponses, int receivedResponses, boolean dataRetrieved, int nbRetry) {
        return (nbRetry >= attempts) ? RetryDecision.rethrow() : RetryDecision.retry(cl)
    }        

    ... <onWriteTimeout & onUnavailable methods with similar implementation>
}

我不确定是否MyRetryPolicy(2)足够，因为我没有深入研究驱动程序内部。可能会再次尝试向同一主机发送相同的请求。你可以试试MyRetryPolicy(10)，它至少应该能显着减少失败的次数。

如果某些故障仍然存在（例如 1000 次中的 1 次），则可能值得查看com.datastax.driver.core.ConvictionPolicy、查找其用法并进一步调查。

java - Cassandra NoHostAvailableException 仍然存在节点

1 回答 1

Related

Reference