我们有 3 个 Ignite 2.7.6 集群节点,我们在其中定义了堆内存/数据区域“datawarm”,最大大小为 10GB 并启用了持久性。一个多月以来,我们都面临着非常奇怪的问题。在通过 SQLLine 或 Java Thin Client API 连接时,突然在三个节点中只有 2 个或有时 1 个节点只提供响应(每次随机顺序)。重新启动集群后,每次问题都得到解决,但是在重新启动 3-4 小时后它又开始了。在检查未建立连接的节点上的日志时,仅在下面找到。我们不知道如何解决这个问题。
Jul 21 18:08:13 node1.example.com Ignite[6097]: 2020-07-21 18:08:13,219 DEBUG c.e.d.Logger [grid-nio-worker-client-listener-0-#30] Got client connection from address: /10.0.0.12:42262