我们的设置是:Glassfish 版本 3.1.2.2 -
- DAS 和 instance-1 在同一台机器上运行,而 instance-2 与配置节点在同一网络中的另一台机器上运行。
- 我们已根据 Glassfish 高可用性指南在共享目录中设置事务日志:http: //docs.oracle.com/cd/E18930_01/html/821-2416/gjjpy.html#gaxim
- 我们使用单播配置进行集群通信,因为我们的网络负载均衡器在网络中以多播模式运行。
- 我们的应用程序(.ear 包含多个 .war)有 2 个持久定时器(因为集群中的每个定时器一次只需要一个实例)。
当instance-1(或instance-2)正常关闭时,另一个实例按预期从关闭的实例中恢复定时器。当实例 2 崩溃或异常下线时,实例 1 会恢复其计时器(再次如预期)。但是当实例 1 崩溃时,实例 2 似乎并没有按预期恢复其计时器。
据我从日志中可以看出,instance-2 收到了 instance-1 的正确故障转移消息并开始恢复,但在没有恢复失败实例的任何事务或计时器的情况下完成了它。
谁能告诉我可能是什么问题?(我应该提供更多信息吗?)