0

我有一组仅以二进制形式分发的共享库(英特尔 MKL)。一个顶级“运行时”库libmkl_rt.so,链接到我的可执行文件,并且通过以下方式可见ldd

...
libmkl_rt.so => /var/task/lib/libmkl_rt.so (0x00007f8049a1f000)
...

但是,其他的,例如libmkl_avx.so,我假设是用 动态加载的dlopen(),因为可执行文件会抛出一个错误,指出如果找不到库就丢失了,但是用ldd.

这些库很大(> 100MB),这是我的容器中唯一使用它们的可执行文件。我假设可执行文件没有调用这些库中的每个函数,所以我想精简它们,首先确定正在调用哪些函数,然后只保留这些函数。

我怎样才能:

  1. 确定动态加载的共享库中实际使用了哪些符号?
  2. 仅将这些符号提取到库的“超薄”副本中?

有什么工具可以做到这一点吗?

4

1 回答 1

3

确定动态加载的共享库中实际使用了哪些符号?

您可以在下运行程序并查看绑定LD_DEBUG=bindings LD_BIND_NOW=1了哪些符号。libmkl_avx.so

仅将这些符号提取到库的“超薄”副本中?

不幸的是,这是不可能的,原因与您无法在可执行文件中重新排列函数的原因相同。链接代码后,所有内部 goto 和全局变量位置都是固定的,无法更改。即使正确反汇编链接代码(以确定函数边界和调用图)也是一个无法解决的问题(IDA 等工具使用启发式方法来缓解它,但问题仍然存在)。

这应该不是一个大问题,因为操作系统只会加载您的应用程序实际使用的代码页。

于 2017-11-10T10:35:06.570 回答