我在一个有 8 个节点的集群上进行 MPI 编程,每个节点都有一个英特尔至强六核处理器。我的 mpi 代码需要三个处理器。
我使用 qsub 提交作业。当我使用“qstat -n”检查作业正在运行的处理器时,它会显示类似 cn004/0*3 的内容。
那么这是否意味着它只在一个处理器上运行?
因为它没有比我使用单个处理器时更快(这是两种情况下域大小相同的情况)
我用于提交的脚本如下
#! /bin/bash
#PBS -o logfile.log
#PBS -e errorfile.err
#PBS -l cput=40:00:00
#PBS -lselect=1:ncpus=3:ngpus=3
#PBS -lplace=excl
cat $PBS_NODEFILE
cd $PBS_O_WORKDIR
mpicc -g -W -c -I /usr/local/cuda/include mpi1.c
mpicc -g -W mpi1.o -L /usr/local/cuda/lib64 -lOpenCL
mpirun -np 3 ./a.out