0

我正在尝试在每个节点有 8 个核心的 hpc 中分配进程,我也有一个有 2 个节点的分区。

我已经完成了这个 csh 测试脚本:

#!/bin/tcsh
foreach i (`seq 30`)
    srun csh -c "echo 'running${i} into:'; hostname; sleep 10;echo 'end ${i}'" &
end
echo "waiting for jobs completion"
wait

我想用salloc运行它:

salloc -N2 -p mypartition testsalloc.sh

该脚本同时启动了 30 个进程,而我预计会启动 16 个进程并且有 14 个进程排队。

这种行为可能与 salloc 和 srun 有关吗?

4

2 回答 2

1

您可以使用 sbatch 而不是 salloc 并且您的原始脚本很可能会给出预期的结果

于 2013-10-11T21:26:57.987 回答
0

最后我找到了一个解决方案,只将这个参数添加到 srun 命令:

srun --ntasks=1 --exclusive ....
于 2013-08-13T10:33:16.043 回答