当某些受保护的分支更新时,我的公司使用 GitHub Enterprise 自动更新生产和测试服务器。
当有人发送推送事件时,一个有效负载被传送到不同的服务器,每个服务器运行一个小型 Web 服务器来接收这些有效负载。Web 服务器然后检查有效负载的“ref”元素以查看更新的分支是否与服务器对应。
例如,当有人向development
分支发送推送事件时,这是 WebHook 向两个服务器 prod01 和 dev01 交付的有效负载的开始。
{
"ref": "refs/heads/development",
"before": "e9f64fa5a4bec5f68faf9533050097badf1c4c1f",
"after": "e86956f39a26e85b850b81643332def33e7f15c6",
"created": false,
"deleted": false,
...
}
prod01 服务器检查production
分支是否已更新。不是,所以该服务器上什么也没有发生。服务器 dev01 检查相同的有效负载以查看development
分支是否已更新。它是 ("ref": "refs/heads/development"),所以 dev01 运行以下命令。
git -C /path/to/dev01/repo reset --hard
git -C /path/to/dev01/repo clean -f
git -C /path/to/dev01/repo pull origin development
正确交付有效负载后,GitHub Enterprise 会返回此内容。
但有时 web 服务器不在 prd01 或 dev01 上运行,所以我们得到了这个。
发生这种情况时,我们更新存储库并期望服务器将具有相同更改的工作流程不起作用。
如何通知我失败的有效载荷?如果可能的话,我宁愿不设置一些东西来轮询 Web 服务器或轮询不良状态。除此之外,任何检查有效负载状态(RESTfully?)的解决方案都比检查 Web 服务器是否仍在运行要好,因为有效负载可能仍因其他原因而失败。
编辑:我已经在内部进行了检查,看起来我们可能可以设置我们当前的监控服务之一来检查每台服务器上 Web 服务器端口上的响应。在上图中,它是 8090,但它经常不同。
这不是我理想的解决方案,因为它只涵盖了 Web 服务器没有响应的情况。有效载荷传递可能失败的原因还有很多。