我在具有 4 个 GPU 的机器上运行 Jenkins,并运行 Jenkins 作业nvidia-docker
以使用 GPU。NVIDIA_VISIBLE_DEVICES
我可以传递一个属性,nvidia-docker
让我指定容器中可以访问哪些 GPU。我想做的是使用 Jenkins 来管理 GPU 资源并相应地排队作业,即制作参数化作业,询问用户他们需要多少 GPU 来完成这项工作,并且它可以在它们可用时排队并启动作业。理想情况下,我想在多个从节点上执行此操作,例如每个节点有 4 个 GPU。
这看起来可能吗?