1

我遇到了下面的步行回溯代码

struct stack_frame {
  struct stack_frame *prev;
    void *return_addr;
} __attribute__((packed));
typedef struct stack_frame stack_frame;

__attribute__((noinline, noclone))
void backtrace_from_fp(void **buf, int size)
{
    int i;
    stack_frame *fp;

    __asm__("movl %%ebp, %[fp]" :  /* output */ [fp] "=r" (fp));

    for(i = 0; i < size && fp != NULL; fp = fp->prev, i++)
        buf[i] = fp->return_addr;
}

寻找此代码背后的原因是我们正在使用第 3 方 malloc 挂钩,因此不想使用再次分配内存的回溯。以上不适用于 x86_64,我将 asm 语句修改为

    __asm__("movl %%rbp, %[fp]" :  /* output */ [fp] "=r" (fp));

我崩溃了

(gdb) bt
#0  backtrace_from_fp (size=10, buf=<optimized out>) at src/tcmalloc.cc:1910
#1  tc_malloc (size=<optimized out>) at src/tcmalloc.cc:1920
#2  0x00007f5023ade58d in __fopen_internal () from /lib64/libc.so.6
#3  0x00007f501e687956 in selinuxfs_exists () from /lib64/libselinux.so.1
#4  0x00007f501e67fc28 in init_lib () from /lib64/libselinux.so.1
#5  0x00007f5029a32503 in _dl_init_internal () from /lib64/ld-linux-x86-64.so.2
#6  0x00007f5029a241aa in _dl_start_user () from /lib64/ld-linux-x86-64.so.2
#7  0x0000000000000001 in ?? ()
#8  0x00007fff22cb8e24 in ?? ()
#9  0x0000000000000000 in ?? ()
(gdb)
(gdb) p $rbp
$2 = (void *) 0x7f501e695f37
(gdb) p (stack_frame *)$rbp
$3 = (stack_frame *) 0x7f501e695f37
(gdb) p *$3
$4 = {prev = 0x69662f636f72702f, return_addr = 0x6d6574737973656c}
(gdb) x /1xw 0x69662f636f72702f
0x69662f636f72702f:     Cannot access memory at address 0x69662f636f72702f
(gdb) fr
#0  backtrace_from_fp (size=10, buf=<optimized out>) at src/tcmalloc.cc:1910
1910    in src/tcmalloc.cc
(gdb)

我错过了什么吗?关于如何通过代码重建相同的任何帮助?

4

1 回答 1

3

我错过了什么吗?

您引用的代码假定编译后的代码使用帧指针寄存器链。

i*86直到大约 5 到 7 年前,这是(32 位)的默认设置,并且x86_64从 ~ 永远都不是默认设置。

该代码很可能在未优化的构建中运行良好,但在 32 位和 64 位 x86 平台上使用非古代版本的编译器进行优化时会惨遭失败。

如果您可以用 重建所有代码(包括libc-fno-omit-frame-pointer,那么这段代码大部分时间都可以工作(但不是一直有效,因为libc可能有手工编码的程序集,并且该程序集没有帧指针链)。

一种解决方案是使用libunwind。不幸malloc的是,如果您(或您使用的任何)也使用dlopen.

于 2020-03-13T03:17:10.840 回答