我正在尝试在这里运行 Intel 版本的 HPL 基准测试,但我对这些选项感到有些困惑。
我想做的(现在)是单节点运行。该节点有 2 个 Xeon Platinum 8276 处理器,因此总共有 56 个内核。所以我的 PxQ 应该是 56。
然而,英特尔文档说:
- MPI_PROC_NUM 应该等于 PxQ(即 56) - 这被传递给
mpirun -np
- MPI_PER_NODE 应该等于系统中的套接字数(即 2) - 这被传递给
mpirun -perhost
对我来说,那些似乎不一致?以及如何使用 OMP_NUM_THREADS 适应这一点?