我有一个使用 infiniband rdmacm 库 rdmacm.so 的程序
在一台计算机(Ubuntu 服务器)上,我可以毫无问题地运行它。在我的开发 PC(Ubuntu 桌面版)上,我得到:
./test-client rdmacm.so:无法打开共享对象文件:没有这样的文件或目录
这就是我难过的地方。
ldd rdma 客户端
linux-vdso.so.1 => (0x00007fffdb62b000)
libibverbs.so.1 => /usr/lib/libibverbs.so.1 (0x00007f97ca007000)
librdmacm.so.1 => /usr/lib/librdmacm.so.1 (0x00007f97c9dfe000)
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f97c9a3e000)
libpthread.so.0 => /lib/x86_64-linux-gnu/libpthread.so.0 (0x00007f97c9821000)
libdl.so.2 => /lib/x86_64-linux-gnu/libdl.so.2 (0x00007f97c961d000)
/lib64/ld-linux-x86-64.so.2 (0x00007f97ca237000)
猫 /etc/ld.so.conf
include /etc/ld.so.conf.d/*.conf
猫 /etc/ld.so.conf.d/*.conf
# Multiarch support
/lib/i386-linux-gnu
/usr/lib/i386-linux-gnu
/lib/i686-linux-gnu
/usr/lib/i686-linux-gnu
# libc default configuration
/usr/local/lib
# Multiarch support
/lib/x86_64-linux-gnu
/usr/lib/x86_64-linux-gnu
/usr/lib/fglrx
/usr/lib32/fglrx
# Legacy biarch compatibility support
/lib32
/usr/lib32
ls -l /usr/lib/librdmacm*
-rw-r--r-- 1 root root 41146 Jul 19 2011 /usr/lib/librdmacm.a
lrwxrwxrwx 1 root root 18 Jul 19 2011 /usr/lib/librdmacm.so -> librdmacm.so.1.0.0
lrwxrwxrwx 1 root root 18 Jul 19 2011 /usr/lib/librdmacm.so.1 -> librdmacm.so.1.0.0
-rw-r--r-- 1 root root 35248 Jul 19 2011 /usr/lib/librdmacm.so.1.0.0
一切看起来都是正确的。为什么我不能运行测试客户端。
编辑
我使用的代码来自 geekinthecorner 博客。Infiniband 测试应用程序。
在客户端它有几个 dlopen 调用:
IE
void *handle = dlopen("rdmacm.so", RTLD_LAZY);
...
handle = dlopen("ibverbs.so", RTLD_LAZY);
这适用于 ubuntu 服务器。但是在我的开发台式机上它找不到库。
如果我将库重命名为这样
void *handle = dlopen("librdmacm.so", RTLD_LAZY);
...
handle = dlopen("libibverbs.so", RTLD_LAZY);
他们被发现了。dlopen 不会自动添加“lib”吗?我假设是的,我的服务器上必须是这种情况,因为没有这个就找到了库。
无论如何,我不确定我是否需要这些 dlopen 调用。我可以完全删除它们并且程序可以正常工作。但是,鉴于路径和 /etc/ld.so.conf 设置包含相同的搜索路径,现在我很好奇为什么 dlopen 在两台机器上的性能不同。