1

在作业提交脚本(Cray XE6)中,“并行任务数”(-n)和“每个节点的并行任务数”(-N)有什么区别?

4

2 回答 2

2

Aman aprun将为此解决您的所有问题。

-n表示您想要多少个可执行文件实例(对于 MPI,这意味着您想要多少个 MPI 进程)。

-N表示您想要每个节点有多少个实例。

-d是深度,即每个实例有多少线程。

于 2013-09-10T04:42:51.147 回答
2

我对此缺乏经验,但一些谷歌搜索给出了:

它看起来像一个示例中的 MPI 参数:

# Launch the parallel job using aprun.
# Run the executable my_mpi_executable.x using total
# of 2048 parallel tasks, with 32 tasks assigned per node.
aprun -n 2048 -N 32 ./my_mpi_executable.x arg1 arg2

来自克雷手册:

每个 Cray XE6 刀片包括四个计算节点,可在小空间内实现高可扩展性 - 每个刀片最多 128 个处理器内核或每个机柜 3,072 个处理器内核。每个计算节点都有两个 AMD Opteron™ 6300 系列处理器(16 核)以及 自己的内存和 Gemini 通信接口,旨在高效运行多达32 个 MPI 任务。或者,可以对其进行编程以在计算节点内运行 OpenMP 并在节点之间运行 MPI。

从上面的信息来看,对于一个完整的机柜,n 可以高达 3072,对于两个 opteron(6300 系列),N 可以是 32。

于 2013-07-15T08:13:20.133 回答