我收到了一条警告说有新版本的 Service Fabric 可用,但是当我尝试升级它时,该过程卡在节点 Rep_247 上的 PreUpgradeSafetyCheck。我试过 -Force 和 -ForceRestart 但没有帮助。
问问题
1217 次
1 回答
1
这个问题很可能会发生,因为服务结构无法以安全的方式关闭服务来升级节点或应用程序。
每当升级节点时,节点中激活的服务必须先移动到另一个节点,这样才能在不影响您的应用程序\服务可用性的情况下重新启动节点。
在这种情况下,当服务不能被放置到另一个节点时,这样做可能会导致仲裁丢失,可能是因为没有其他节点可用,或者因为服务中的放置限制,或者只有一个服务实例.
由于 SF 无法保证服务的可靠性,它将暂停升级过程,直到可以应用解决方案来解决问题并继续该过程。
从您的集群地图和消息可能知道问题,您的集群只有一个类型为“ Rep_247 ReportServerType ”的节点,我假设您的服务具有放置约束,只能部署在此节点类型上,删除节点将使这些服务不可用,因为放置约束将阻止它们移动到另一种节点类型。
如果服务不受该节点类型的限制,问题可能是:
- 它无法在其他节点上激活,例如,节点中缺少依赖项,这将无法拥有最小副本。
- 该服务只有一个可用的实例,关闭将使该服务不可用。
PS:同样适用于节点MR_236 MRType
PreUpgradeSafetyCheck 的 UpgradePhase 意味着在执行升级域之前准备升级域存在问题。在这种情况下,最常见的问题是关闭或从主代码路径降级时的服务错误。
这种情况的可能解决方案是:
- 添加更多服务的副本\实例,以满足最小仲裁。
- 移除服务的 Placement 约束,让它们移动到其他节点。
- 添加一个相同节点类型的额外节点,以便服务可以安全移出。
- 更新节点时关闭服务并重新创建(如果没有状态,则为最后一个选项,否则将丢失数据)
您可能有兴趣查看相关问题:
于 2018-12-06T18:00:34.207 回答