我有一个跨 45 个从属设备(一个只处理启动的主设备)的高度并行化构建。
我遇到的问题是大约 3% 的工作消失了。
项目设置是一个“主”作业,然后启动(通过参数化作业插件)跨 N 个从属的 N 个作业。大多数情况下,主作业的控制台输出对于分布式构建步骤的作业编号是正确的。
但是,有时控制台中指示的作业实际上属于完全不同的构建。
我什至从哪里开始寻找追踪呢?jenkins 日志中几乎没有任何有关失败作业或启动作业问题的信息。
目前我最好的猜测是,当发生某些事情删除它们时,丢失的作业实际上是在排队等待执行者。但我没有证据支持这一点。
非常感谢您的想法,建议,有用的链接,