我正在尝试在每个节点有 8 个核心的 hpc 中分配进程,我也有一个有 2 个节点的分区。
我已经完成了这个 csh 测试脚本:
#!/bin/tcsh
foreach i (`seq 30`)
srun csh -c "echo 'running${i} into:'; hostname; sleep 10;echo 'end ${i}'" &
end
echo "waiting for jobs completion"
wait
我想用salloc运行它:
salloc -N2 -p mypartition testsalloc.sh
该脚本同时启动了 30 个进程,而我预计会启动 16 个进程并且有 14 个进程排队。
这种行为可能与 salloc 和 srun 有关吗?