2

我们正在使用 Azure DevOps 自托管代理来构建和发布我们的应用程序。我们经常看到以下错误并自动恢复。有谁知道这个错误是什么,如何解决这个问题以及在哪里准确检查有关错误的日志?

We stopped hearing from agent <agent name>. Verify the agent machine is running and has a healthy network connection. Anything that terminates an agent process, starves it for CPU, or blocks its network access can cause this error. For more information, see: https://go.microsoft.com/fwlink?Linkid=846610
4

1 回答 1

2

这似乎是许多人报告的自托管和 Microsoft 托管代理的一个已知问题。

引用@zachariahcoxAzure Pipelines 产品组的回复:

为了提供一些上下文,天蓝色管道代理由两个进程组成:agent.listeneragent.worker(其中一个 step在 中job)。侦听器负责报告工人仍在取得进展。如果在agent.listener10 分钟内无法与服务器通信(我们尝试每分钟都进行通信),则我们认为出现问题并放弃该工作。

因此,如果您运行的是私人机器,任何可能干扰侦听器与我们的服务器通信的能力都会成为问题。

我见过的问题包括将其识别为威胁的防病毒程序、本地代理以各种方式运行、物理机器内存或磁盘空间不足(很常见)、机器意外重启、有人 ctrl+c 'ing 整个侦听器进程,工作负载以比侦听器更高的优先级运行(因此“饿死”侦听器),单元测试关闭网络适配器(很常见),在正常优先级上有太多代理同一台机器,所以他们互相饿死,等等。

如果您认为您看到的问题无法通过上述任何方式解释(并且没有任何内容从日志文件夹中跳出来),请在https://azure.microsoft.com/en-us/_diag提交问题 支持/devops/

如果您的代理似乎一切正常,并且管道故障排除指南中提到的步骤都没有帮助,请在 Azure DevOps 团队和 DevOps 社区积极回答问题的开发人员社区上报告。

于 2021-02-10T15:52:39.990 回答