我们有一个 Spring Java 应用程序,它连接到 2 个节点的 MS SQL 服务器集群(2016 SP2 标准版)。
我们正在测试故障转移:如果一个节点发生故障,应用程序需要 90 秒才能重新连接到另一个节点,这对于生产来说太长了。
在再次阅读 HickaryCP 的 java 文档后,我尝试使用 datagrip 测试这个场景:我运行了一个长查询(在 10 分钟内每 500 毫秒在表中插入一行),我遇到了同样的问题:数据库不可用1 个节点故障后 90 秒。
也许问题是集群方面而不是应用程序方面......
是否有任何 SQL 服务器集群配置阻止我们在 90 秒之前重新连接?
连接如何在这 90 秒之前恢复?是否有任何我们应该更新的缓存或默认配置?
非常感谢你的帮助
编辑
测试是错误的,我在评论中更新了我遇到的问题:
一旦第一个节点回来,它就会重新连接。问题出现在第二次故障转移之后:然后无法建立连接(我在第二次故障转移之前等待 2 个节点同步)