4

我在Azure上购买了1台H16r虚拟机,在“关于H系列和计算密集型A系列VMs ”上尝试了RDMA的设置方法:</p>

azure config mode arm
azure vm extension set <resource-group> <vm-name> RDMAUpdateForLinux Microsoft.OSTCExtensions 0.1

正如 azure 官方介绍的那样:“该接口允许支持 RDMA 的实例通过InfiniBand网络相互通信,H16r 和 H16mr 虚拟机以FDR速率运行,A8 和 A9 虚拟机以 QDR 速率运行。”

所以H16r风格使用Infiniband技术是对的,但是通过azure-cli安装rdma驱动后我仍然无法在H16 VM内部找到IB接口!

4

1 回答 1

0

如果您不能执行 RDMA,那么它就不是一个“支持 RDMA”的设备!

在其他 H 系列 (H[bc]*r*) 上,您有一个 ib0 接口和 Mellanox 通过 SR-IOV 接口暴露在总线中,但对于 H16r,您不会:

NR_14-22:58:03 ~ $ ifconfig ib0  
  ib0: error fetching interface
  information: Device not found  

NR_14-22:58:43 ~ $ lsmod | grep rdma 

NR_14-22:58:57 ~ $ lspci | grep Mell

微软在这里声明

在这些未启用 SR-IOV 的 VM 的基于 CentOS 的 HPC 映像上,yum 配置文件中禁用了内核更新。这是因为 NetworkDirect Linux RDMA 驱动程序作为 RPM 包分发,如果更新内核,驱动程序更新可能无法正常工作。

...但没有这样的“NetworkDirect”Linux 驱动程序。

于 2021-07-15T03:19:15.537 回答