1

我有一个快速的问题。

我最近尝试使用我学校的服务器运行 mpi 程序,但遇到了以下“奇怪”问题:

为了执行“mpirun”命令,我必须将其路径放入 .bashrc 中的默认路径中,然后输入:

mpirun -n 16 ./myprogram

只是得到一个关于缺少库的错误,名为:libmpi.so.0

但是,如果我尝试使用完整的 mpirun 路径运行程序,如下所示

/usr/lib64/openmpi/bin/mpirun -n 16 ./myprogram

一切都很好。

我检查了 openmpi 的常见问题,它说我需要将以下行放入我的 .bashrc

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/openmpi/lib

这实际上为我解决了问题,但我的问题仍未解决:

为什么会这样?

在此先感谢您的时间。

4

1 回答 1

1

因为 Open MPI 的包装编译器不会自动 -rpath 编译/链接 myprogram 时 libmpi.so 所在的位置(我们在 OMPI 包装编译器中传递的标志中采用极简方法 - 如果不需要它们,我们不把它们放在那里)。

具体来说,当您在 Linux 中运行可执行文件时,运行时链接器将查找该可执行文件所需的所有库(运行“ldd myprogram”,您将看到 myprogram 所需的库列表) . 它将查看所​​有系统默认位置(它们本身可以由系统管理员配置)。它还将查看由 LD_LIBRARY_PATH 指定的所有目录——LD_LIBRARY_PATH 实际上是扩展目录列表以供链接器搜索以查找共享库的每个用户的方法。

我猜测 libmpi.so 不在任何系统默认位置,因此您需要在 LD_LIBRARY_PATH 中指定其目录。

或者,您可以在链接 myprogram 时添加 -rpath 子句。例如:

mpicc myprogram.c -o myprogram -Wl,-rpath /opt/openmpi/lib

这会将位置 /opt/openmpi/lib 嵌入到 myprogram 二进制文件本身,并且链接器还将在该位置查找 libmpi.so(以及需要解析的任何其他库)。例如:

# Without an rpath clause:
[8:45] svbu-mpi:~/mpi % mpicc hello.c -o hello
[8:45] svbu-mpi:~/mpi % ldd hello
linux-vdso.so.1 =>  (0x00007ffff7ffe000)
libmpi.so.0 => not found
libdl.so.2 => /lib64/libdl.so.2 (0x0000003d58c00000)
libm.so.6 => /lib64/libm.so.6 (0x0000003d59c00000)
libnuma.so.1 => /usr/lib64/libnuma.so.1 (0x00007ffff7ddf000)
libpci.so.3 => /lib64/libpci.so.3 (0x00007ffff7bd2000)
librt.so.1 => /lib64/librt.so.1 (0x0000003d5a000000)
libnsl.so.1 => /lib64/libnsl.so.1 (0x0000003d5c000000)
libutil.so.1 => /lib64/libutil.so.1 (0x0000003d5a800000)
libpthread.so.0 => /lib64/libpthread.so.0 (0x0000003d59400000)
libc.so.6 => /lib64/libc.so.6 (0x0000003d59000000)
/lib64/ld-linux-x86-64.so.2 (0x0000003d58800000)
libresolv.so.2 => /lib64/libresolv.so.2 (0x0000003d5b000000)

请注意 libmpi.so 条目中的“未找到”。

您可以设置 LD_LIBRARY_PATH 并找到它:

[8:45] svbu-mpi:~/mpi % setenv LD_LIBRARY_PATH /home/jsquyres/bogus/lib
[8:45] svbu-mpi:~/mpi % ldd hello
linux-vdso.so.1 =>  (0x00007ffff7ffe000)
libmpi.so.0 => /home/jsquyres/bogus/lib/libmpi.so.0 (0x00007ffff7b06000)
libdl.so.2 => /lib64/libdl.so.2 (0x0000003d58c00000)
libm.so.6 => /lib64/libm.so.6 (0x0000003d59c00000)
libnuma.so.1 => /usr/lib64/libnuma.so.1 (0x00007ffff78e8000)
libpci.so.3 => /lib64/libpci.so.3 (0x00007ffff76db000)
librt.so.1 => /lib64/librt.so.1 (0x0000003d5a000000)
libnsl.so.1 => /lib64/libnsl.so.1 (0x0000003d5c000000)
libutil.so.1 => /lib64/libutil.so.1 (0x0000003d5a800000)
libpthread.so.0 => /lib64/libpthread.so.0 (0x0000003d59400000)
libc.so.6 => /lib64/libc.so.6 (0x0000003d59000000)
/lib64/ld-linux-x86-64.so.2 (0x0000003d58800000)
libresolv.so.2 => /lib64/libresolv.so.2 (0x0000003d5b000000)

或者您可以使用 -rpath 子句(然后 LD_LIBRARY_PATH 中的设置变得无关紧要):

[8:45] svbu-mpi:~/mpi % mpicc hello.c -o hello -Wl,-rpath /home/jsquyres/bogus/lib
[8:45] svbu-mpi:~/mpi % ldd hello
linux-vdso.so.1 =>  (0x00007ffff7ffe000)
libmpi.so.0 => /home/jsquyres/bogus/lib/libmpi.so.0 (0x00007ffff7b06000)
libdl.so.2 => /lib64/libdl.so.2 (0x0000003d58c00000)
libm.so.6 => /lib64/libm.so.6 (0x0000003d59c00000)
libnuma.so.1 => /usr/lib64/libnuma.so.1 (0x00007ffff78e8000)
libpci.so.3 => /lib64/libpci.so.3 (0x00007ffff76db000)
librt.so.1 => /lib64/librt.so.1 (0x0000003d5a000000)
libnsl.so.1 => /lib64/libnsl.so.1 (0x0000003d5c000000)
libutil.so.1 => /lib64/libutil.so.1 (0x0000003d5a800000)
libpthread.so.0 => /lib64/libpthread.so.0 (0x0000003d59400000)
libc.so.6 => /lib64/libc.so.6 (0x0000003d59000000)
/lib64/ld-linux-x86-64.so.2 (0x0000003d58800000)
libresolv.so.2 => /lib64/libresolv.so.2 (0x0000003d5b000000)
于 2012-03-30T15:49:55.637 回答