0

我正在尝试在这里运行 Intel 版本的 HPL 基准测试,但我对这些选项感到有些困惑。

我想做的(现在)是单节点运行。该节点有 2 个 Xeon Platinum 8276 处理器,因此总共有 56 个内核。所以我的 PxQ 应该是 56。

然而,英特尔文档说:

  • MPI_PROC_NUM 应该等于 PxQ(即 56) - 这被传递给mpirun -np
  • MPI_PER_NODE 应该等于系统中的套接字数(即 2) - 这被传递给mpirun -perhost

对我来说,那些似乎不一致?以及如何使用 OMP_NUM_THREADS 适应这一点?

4

0 回答 0