问题标签 [infiniband]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
1073 浏览

java - Java 中的 InfiniBand

众所周知,OFED 的 Socket Direct 协议已被弃用,并且 OFED 的 3.x 版本根本不附带 SDP。因此,Java 的SDP也无法正常工作。我想知道用 Java 编写 infiniband 的正确方法是什么?除了编写 JNI 代码之外,还有其他可移植的解决方案吗?

我的要求是在 infiniband 驱动的机器集合中实现RDMA 。

0 投票
1 回答
102 浏览

nodes - 一次测试 3 个节点

我一直在使用 Infiniband 命令(例如 ib_send_bw、ibv_rc_pingpong 等)来测试节点之间的延迟和带宽(通过 infiniband 开关)。但是,我想测试更多的东西。当两个节点同时向第三个节点发送数据包,或者一个节点向另外两个节点发送数据包时,是否可以测试延迟和带宽?如果是这样,怎么做?

谢谢

0 投票
3 回答
1489 浏览

c - 用于开发的“本地”RDMA

我正在尝试在此处构建和运行 RDMA 示例。但是因为我只是在探索,我没有任何能够管理 RDMA 的硬件。当我尝试运行示例代码时出现这样的错误。

是否有任何 RDMA 功能的“本地”实现可用于开发?我知道 RDMA 中的“R”表示远程,但我认为这可能存在用于测试/开发目的。

作为参考,我在安装了软件包的 Ubuntu 14.04 机器上进行了尝试libibverbs-devlibrdmacm-dev以便编译代码。

0 投票
2 回答
224 浏览

mpi - 什么是 InfiniBand 堆栈?

我想请您解释一下什么是“InfiniBand-Stacks”。这些最近在我们的机器上进行了更改,我开始遇到 MPI 通信故障。我需要一些信息来了解这可能如何影响我的并行作业的稳定性。

我得到的实际错误消息是:

进程未能创建队列对。这通常意味着设备已用完队列对(连接太多)或没有足够的资源可用于分配队列对(内存不足)。如果 1) 可用内存不足,或 2) 无法向设备注册更多物理内存,则可能会发生后者。

[connect/btl_openib_connect_oob.c:867:rml_recv_cb] 端点回复开始连接时出错

0 投票
3 回答
740 浏览

hpc - 任何人都可以向我解释 libibverbs 和 librxe 之间的关系吗?

我正在努力理解 libibverbs 和 librxe 以及 HCA 的低级内核驱动程序之间的关系。

具体来说,我有以下疑问:

  • 当数据包到达 HCA 时,低级内核驱动程序将数据包传递给用户空间应用程序。这里涉及到一个内存副本。在这张图片中,libibverbs 和 librxe 位于哪里?
  • 同样,用户发出的发送命令必须能够通过低级驱动程序直接与硬件对话。在这种情况下需要用户空间库是什么?
0 投票
1 回答
412 浏览

windows - Windows IND 和 Linux 动词实现是否兼容?

我一直在与一位同事讨论如何在 Windows 中使用 Network Direct 来提供 RDMA,而在 Linux 中我们使用动词 api 和 rdmacm 进行了工作实现。

说同事在无法使动词 one 工作后开发了他的 Network Direct 实现。我在 Linux 下做了 rdmacm 实现。我们都让他们谈论 linux=>linux 和 windows=>windows,但从未有时间测试 Linux=>windows 或 windows=>linux。在开发过程中,有一些迹象表明它可能会起作用,他们似乎开始交谈,但当然事情仍在开发中。

该项目被搁置了数月,它所构建的框架已经进行了重大的重新设计。我只能将 Windows 端的工作内容拉入新框架,我很难让它工作或看到它的任何部分从 Linux 连接。

我的理解是,在下层,他们都会说动词。但我现在不太确定同事说“记住这不是动词”之类的话,只是为了增加混乱。

所以问题是。使用 rdmacm 的应用程序能否与使用 Windows NetworkDirect 接口的应用程序建立连接,或者两者完全不同且不兼容?

0 投票
1 回答
430 浏览

infiniband - 无限带协议

在为 IB 设计驱动程序时,下面的结构和功能有什么用?

它会非常好心的人来解释这些。

0 投票
2 回答
1027 浏览

infiniband - 如何在 libibverbs 中使用具有不同连接的 SRQ

连接到多个连接时如何使用 SRQ。假设有三个连接,即进程 0、1 和 2。为了创建 SRQ,我们需要调用

对于上述调用,我们需要提供一个保护域,据我所知,保护域是通过调用分配给每个连接的

其中 id 为每个频道创建。基本上,我的问题是如何将 SRQ 分配给属于具有不同保护域的不同连接 ID 的不同 QP,或者换句话说,不同的连接可以具有相同的保护域?

0 投票
1 回答
280 浏览

infiniband - 查找远程 infiniband 客户端的 GID/GUID

我有一个用 C 编写的应用程序,它通过 IPoIB 打开从客户端到服务器的 TCP 连接。我需要从服务器查找客户端的 GUID/GID,最好不要调用外部应用程序。

有没有办法通过 ibverbs 或类似的方式来做到这一点,因为此时我们只打开了一个 TCP 连接(以及与之相关的所有常用信息)?

0 投票
0 回答
26 浏览

infiniband - 使用与本地和远程相同的内存区域进行测试

我正在玩 infiniband HW,并想通过同一线程在本地发送和接收 RDMA 来检查使用 lkey 和 rkey 的 MR 是否合法。

基本上,线程/进程会将 MR rkey 包含在传递给 post_send() 的数据中,并使用 MR lkey 配置 sge 列表以进行传输。