我正在尝试在具有 MXM Infiniband 网络(40 Gbps,型号:Mellanox Technologies MT26428)的集群上运行多语言环境教堂代码。
我遵循了 Chapel 和 GASNet 文档,并设置了
export CHPL_COMM_SUBSTRATE=ibv
export CHPL_LAUNCHER=gasnetrun_ibv
export GASNET_IBV_SPAWNER=mpi
而不是使用CHPL_COMM_SUBSTRATE=mxm
, 一旦 mxm 被弃用。
问题是我可以使用 ibv 基板构建 Chapel。但是,我不能在多个语言环境中运行。我收到大量超时错误。
首先,我认为问题出在 PKEY 上。所以,我添加"--mca btl_openib_pkey "0x8100""
到MPIRUN_CMD
. 但是,没有成功。
我还尝试使用已弃用的 mxm 配置:
CHPL_LAUNCHER=gasnetrun_mxm
export CHPL_LAUNCHER=gasnetrun_ibv
export GASNET_MXM_SPAWNER=mpi
但是,我无法使用这样的配置构建 Chapel。那是错误信息:
"User requested --enable-mxm, but I don't know how to build mxm programs for your system."
顺便说一句,在没有分区密钥的情况下,在 MPI、UDP 和 Infiniband 之上使用 GASNET 可以正常工作。
有人知道如何在配备 MXM Infiniband 网络和分区密钥 (PKEY) 的集群上使用 Chapel 吗?
此致,
蒂亚戈·卡内罗。