我正在我大学的计算机实验室中跨节点运行一些小型 MPI 作业。没有安装排队系统,所以每次我想运行作业时我都必须自己生成 MPI 主机文件,然后像这样运行它们:
mpirun --hostfile mpi_hostfile -n 32 ./mpi_program
我使用 Open MPI,所以现在我的主机文件看起来像这样:
localhost slots=4
hydra13 slots=4
hydra14 slots=4
hydra2 slots=4
hydra22 slots=4
hydra24 slots=4
hydra26 slots=4
hydra1 slots=4
我的问题是:每个节点都有一个 Intel® Core™ i7-3770 处理器,它是四核的,但也是超线程的。什么是涉及超线程的 Open MPI 主机文件的最佳实践?我应该为每个节点列出四个还是八个插槽?
谢谢。