我想知道 Torque 是否足够聪明,可以根据您请求的 mpi 核心分配正确数量的节点。对于我们的集群,我们有异构节点,仅放置您想要的节点数量和每个节点的处理器可能会非常浪费。所以我想知道你是否可以做这样的事情
qsub -I -l procs:1000
mpiexec -n 1000 mympijob
但是,扭矩仅使用此命令分配一个节点(因为我没有指定节点数)。有没有一种方法可以根据我的 procs 数量来确定正确数量的节点,以便最大限度地提高效率?
侧边栏 - 我们可能很快就会切换到 SLURM,这在能力范围内吗?