我是 Slurm 的新手,我还发现了有关此主题的相关问题。但是,我仍然对如何使用 srun 的几点感到困惑。根据官方文档,srun 通常会先分配资源,然后运行并行作业。例如,我想运行 20 个任务,如果我根据以下脚本提交作业,我不确定创建了多少个任务。因为 sbatch 只负责分配资源而不是执行程序。
#!/bin/sh
#SBATCH -n 20
#SBATCH --mpi=pmi2
#SBATCH -o myoutputfile.txt
module load mpi/mpich-x86_64
mpirun mpiprogram < inputfile.txt
如果我试图运行如下的顺序程序,我不知道是否会有差异。例如,我可以简单地删除此脚本中的 srun 命令。会发生什么?
#!/bin/sh
#SBATCH -n 1
#SBATCH -N 1
srun tar zxf julia-0.3.11.tar.gz
echo "prefix=/software/julia-0.3.11" > julia/Make.user
cd julia
srun make