1

我有一个 Debian 集群,每个节点有 2 个节点和两个四核处理器。我使用 Torque 和 Maui 作为调度程序。当我尝试运行具有 16 个进程的 MPI 作业时,调度程序无法运行该作业:要么将其放入队列(尽管当时没有任何作业在运行),要么运行并且生成的输出文件说你试图运行一个只有 4 个处理器的 16 个进程的作业。

我的 .../pbs/server_priv/nodes 文件如下所示:

node1 np=8
node2 np=8

我用来运行程序的脚本示例如下:

#!/bin/sh



#PBS -d /home/bellman/

#PBS -N output
#PBS -k oe
#PBS -j oe
#PBS -l nodes=2:ppn=8,walltime=10000:00:00
#PBS -V

ulimit -s 536870912

# How many procs do I have?
NP=$(wc -l $PBS_NODEFILE | awk '{print $1}')
echo Number of processors is $NP


mpiexec -np 16 /home/bellman/AAA

我尝试了很多节点和 ppn 的组合,但是发生了两个错误之一。关于发生了什么的任何想法?

4

1 回答 1

0

你试过了吗 :

#PBS -l nodes=2:ncpus=8,walltime=10000:00:00
于 2012-08-11T19:35:31.823 回答