当我将带有选项 --gres=gpu:1 的 SLURM 作业提交到具有两个 GPU 的节点时,如何获取分配给该作业的 GPU 的 ID?是否有为此目的的环境变量?我使用的 GPU 都是 nvidia GPU。谢谢。
问问题
2969 次
3 回答
6
您可以使用环境变量获取 GPU id CUDA_VISIBLE_DEVICES
。此变量是分配给作业的 GPU id 的逗号分隔列表。
于 2017-05-14T19:37:46.540 回答
2
您可以检查环境变量SLURM_STEP_GPUS
或SLURM_JOB_GPUS
给定节点:
echo ${SLURM_STEP_GPUS:-$SLURM_JOB_GPUS}
注意CUDA_VISIBLE_DEVICES
可能与实际值不对应(请参阅@isarandi 的评论)。
另外,请注意这也适用于非 Nvidia GPU。
于 2021-01-13T20:12:08.883 回答