4

我正在开发一个 18 节点集群,运行 TORQUE/PBS Pro/Open MPI。

设置 - 2 个 CPU/节点,12 个内核/CPU(因此每个节点允许 24 个进程)。

如果我提交需要在节点之间进行不均匀拆分的 PBS 作业,例如需要 58 个进程的作业,我可以通过以下方式拆分它:

#PBS -l nodes=2:ppn=24+1:ppn=10

它使用所有 24 个内核分配 2 个节点,使用 10 个内核分配 1 个节点。所以我现在应该有 58 个任务正在运行。

但是,当我执行时qstat -a,输出显示我只有 48 个任务正在运行。它似乎从不计算不均匀分裂的节点。

那么,这 10 个额外的进程是否真的在运行?这是怎么回事?只是输出qtsat不正确吗?

我翻遍了所有我能找到的 PBS 自述文件/手册,没有运气。

4

0 回答 0