我们有一些作为 Service Fabric 参与者创建的长期运行的作业。除了提醒之外,演员没有其他数据。当这些服务部署在本地集群中时,它们似乎可以毫无问题地激活。当我们将它们部署到运行 3 节点集群的服务器时,一些服务无法激活。我们没有看到节点中的内存利用率超过 50% 。但是,当我们添加 2 个节点并在 5 个节点上运行时,激活似乎工作正常。我们只使用 1 个分区和 1 个副本计数;所以想知道是否有一些设置会停止结构以激活更多服务。我们还增加了应用程序端口范围,但没有运气。
还需要注意的是,一个服务激活失败后;其他有状态的服务也变得不稳定。它们显示不健康分区的错误。集群还运行一些无状态服务,运行起来就像一个魅力。任何线索为什么演员的激活失败?