在尝试了一些事情之后,我终于设法弄清楚如何做到这一点。
首先, in glibc
,malloc
被定义为弱符号,这意味着它可以被应用程序或共享库覆盖。因此,LD_PRELOAD
不一定需要。相反,我在共享库中实现了以下功能:
void*
malloc (size_t size)
{
[ ... ]
}
由应用程序而不是glibc
s调用malloc
。
现在,为了等效于__malloc_hook
s 功能,仍然缺少一些东西。
1.) 来电者地址
除了原来的参数 to malloc
,glibc
s __malloc_hook
s 还提供了调用函数的地址,其实就是 wheremalloc
会返回的返回地址。为了达到同样的目的,我们可以使用__builtin_return_address
gcc 中提供的函数。我没有研究过其他编译器,因为无论如何我都仅限于 gcc,但如果你碰巧知道如何便携地做这样的事情,请给我留言:)
我们的malloc
函数现在看起来像这样:
void*
malloc (size_t size)
{
void *caller = __builtin_return_address(0);
[ ... ]
}
2.)glibc
从你的钩子中访问 s malloc
由于我的应用程序仅限于 glibc,因此我选择使用__libc_malloc
来访问原始的 malloc 实现。或者,dlsym(RTLD_NEXT, "malloc")
可以使用,但在此函数calloc
第一次调用时使用的可能陷阱,可能导致无限循环导致段错误。
完整的 malloc 钩子
我的完整挂钩功能现在如下所示:
extern void *__libc_malloc(size_t size);
int malloc_hook_active = 0;
void*
malloc (size_t size)
{
void *caller = __builtin_return_address(0);
if (malloc_hook_active)
return my_malloc_hook(size, caller);
return __libc_malloc(size);
}
my_malloc_hook
看起来像这样:
void*
my_malloc_hook (size_t size, void *caller)
{
void *result;
// deactivate hooks for logging
malloc_hook_active = 0;
result = malloc(size);
// do logging
[ ... ]
// reactivate hooks
malloc_hook_active = 1;
return result;
}
当然, 和 的钩子的calloc
工作realloc
方式free
类似。
动态和静态链接
使用这些功能,动态链接可以开箱即用。链接包含 malloc 钩子实现的 .so 文件将导致malloc
来自应用程序的所有调用以及所有要通过我的钩子路由的库调用。静态链接虽然是有问题的。我还没有完全理解它,但是在静态链接中 malloc 不是一个弱符号,导致链接时出现多重定义错误。
如果出于某种原因需要静态链接,例如通过调试符号将第 3 方库中的函数地址转换为代码行,那么您可以静态链接这些第 3 方库,同时仍然动态链接 malloc 挂钩,避免多重定义问题。我还没有找到更好的解决方法,如果你知道,请随时给我留言。
这是一个简短的例子:
gcc -o test test.c -lmalloc_hook_library -Wl,-Bstatic -l3rdparty -Wl,-Bdynamic
3rdparty
将静态链接,而malloc_hook_library
将动态链接,从而产生预期的行为,并且函数的地址3rdparty
可以通过test
. 很整洁吧?
结论
上面的技术描述了一种不被弃用的、几乎等同于__malloc_hook
s 的方法,但有一些平均限制:
__builtin_caller_address
仅适用于gcc
__libc_malloc
仅适用于glibc
dlsym(RTLD_NEXT, [...])
是 GNU 扩展glibc
链接器标志-Wl,-Bstatic
并且-Wl,-Bdynamic
特定于 GNU binutils。
换句话说,这个解决方案是完全不可移植的,如果要将 hooks 库移植到非 GNU 操作系统,则必须添加替代解决方案。