jenkins - 使用 Jenkins 和 nvidia-docker 对多个 GPU 进行排队

Question

我在具有 4 个 GPU 的机器上运行 Jenkins，并运行 Jenkins 作业nvidia-docker以使用 GPU。NVIDIA_VISIBLE_DEVICES我可以传递一个属性，nvidia-docker让我指定容器中可以访问哪些 GPU。我想做的是使用 Jenkins 来管理 GPU 资源并相应地排队作业，即制作参数化作业，询问用户他们需要多少 GPU 来完成这项工作，并且它可以在它们可用时排队并启动作业。理想情况下，我想在多个从节点上执行此操作，例如每个节点有 4 个 GPU。

这看起来可能吗？

score 1 · Accepted Answer

这lock一步应该会让你更进一步。它提供了几个选项来创建和使用/锁定对在几个构建之间共享的资源的访问。

请注意，该作业将在执行期间被声明然后被阻止（因此不要将其lock放在node分配中）。

jenkins - 使用 Jenkins 和 nvidia-docker 对多个 GPU 进行排队

1 回答 1

Related

Reference