我们在集群上使用 vnode。
我注意到,当节点的令牌空间发生变化时(自动在 vnodes 上,在添加新节点后的修复或清理期间),datastax nodejs 驱动程序会在几分钟内收到很多“操作超时 - 仅收到 X 响应” .
我尝试使用 ONE 和 LOCAL_QUORUM 一致性。
我想这是由于协调器在移动后没有击中正确的节点。这似乎是一种合乎逻辑的行为(数据已移动),但我们真的想解决这个特定问题。
你们建议我们应该怎么做才能避免这种情况?有自定义重试策略?缓存?改变一致性?
行为示例
当我们看到这个:
4/7/2016, 10:43am Info Host 172.31.34.155 moved from '8185241953623605265' to '-1108852503760494577'
我们看到了其中的一个峰值:
{
"message":"Operation timed out - received only 0 responses.",
"info":"Represents an error message from the server",
"code":4608,
"consistencies":1,
"received":0,
"blockFor":1,
"isDataPresent":0,
"coordinator":"172.31.34.155:9042",
"query":"SELECT foo FROM foo_bar LIMIT 10"
}