0

INFO 消息是什么

FailureDetector(akka://MyCluster) - Remove heartbeat connection [akka://MyCluster@127.0.0.1:35250]

在 Akka 集群中是什么意思?我似乎在文档中找不到任何东西。在测试机器上运行大量带有actor的JVM时,我看到了这一点,但不确定这是否是一个需要某种Akka或Linux调整的坏信号。

Oracle JDK 1.7 上的 Akka 2.1.4

更新: 遵循@cmbaxter 的建议,我调查了调整心跳的选项。我发现增加/减少与心跳相关的时间对“删除最佳连接”消息的存在没有影响。但是,我注意到 'monitored-by-nr-of-members' 配置设置。我现在相信这些消息表明来自特定节点的心跳监控正在从一个 ActorSystem 传递到另一个。因此,他们表示当前系统只是说明它不再是它自己的责任,而不是表示任何类型的连接警告。实际上,在系统启动期间,第一个节点收到大量“第一次心跳”,但随后根据“成员监控”设置删除了其中的大部分,

4

1 回答 1

1

您看到的消息来自AccrualFailureDetectorAkka 的课程。根据文档:

The nodes in the cluster monitor each other by sending heartbeats to detect if a
node is unreachable from the rest of the cluster. The heartbeat arrival times is 
interpreted by an implementation of The Phi Accrual Failure Detector.

我在这里的猜测是,一个集群节点(在本地运行,在端口 35250 上)已经变得无法访问了足够多的时间,以至于它被认为不再是集群的一部分。发生这种情况时,将删除对该节点的心跳检查,因此您会看到此消息。如果您认为该节点并非不可访问,因此不应从集群心跳中删除,那么您可能遇到了问题。查看该部分下的集群文档Failure Detector,了解有关如何调整故障检测的更多信息。

于 2013-05-30T00:15:39.387 回答