我创建了许多程序,我想从中测量完成所需的时间。因此我想在一个节点上运行一项任务。我们有 10 个节点,每个节点有 2 个套接字。无论我将什么选项传递给 sbatch 和 srun,SLURM 似乎都会为每个套接字安排 1 个任务,而不是每个节点安排 1 个任务。我应该使用哪些选项?
我开始我的批处理脚本sbatch run-experiments
run-experiments
包含:
#SBATCH -N10 --ntasks-per-node=1
...
for 1..1000 do
srun -N1 -n1 --exclusive task &
done
编辑:似乎问题只发生在一个分区上,而不发生在另一个分区上。是否有可能导致这种情况的配置设置?