在 cray 中,我可以使用 qsub 提交作业
#PBS -l select=1:ncpus=40:mpiprocs=1:ompthreads=40:vntype=cray_compute
-----other commands---
aprun -n 1 ./executable
如果我请求多个节点,那么我可以提交多个作业,并且它们可以相互并行运行
#PBS -l select=2:ncpus=40:mpiprocs=1:ompthreads=40:vntype=cray_compute
-----other commands---
aprun -n 1 ./executable1 &
aprun -n 1 ./executable2 &
wait
现在,我的问题是我executable
在 10 个 openMP 线程后无法扩展,即使用 10 以上的任何数字都不会提高性能,但我可以在单个节点中使用多达 40 个 CPU。基本上,这是一种资源浪费。所以,我想知道我是否可以在单个节点中提交多个作业(最多 4 个),每个作业都有 10 个 OpenMP 线程。我为单个节点尝试了上述方法,但是aprun
当一个节点在同一个节点中运行时不会启动下一个作业,因此它是按顺序运行的。那么,是否可以使用 qsub 在 CARY 中的单个节点中提交多个作业。
pbs_version = PBSPro_13.0.409.180551