1

我一直在处理一些有问题的代码,并想安装一个 SIGSEGV 处理程序来获取有关崩溃的更多信息。但是,我注意到我的处理程序没有被调用。

我一直在寻找一个原因,它似乎与损坏的堆栈指针值有关(它肯定不会被屏蔽)。这是我编写的一些概念验证代码以进行验证:

static void catch_function(int sig, siginfo_t *info, void *cntxt)
{
    puts("handler works");
}

void main(int argc, char **argv)
{    
    struct sigaction sa;

    sa.sa_sigaction = (void *)catch_function;
    sigemptyset (&sa.sa_mask);
    sa.sa_flags = SA_SIGINFO | SA_NODEFER ;

    sigaction(SIGSEGV, &sa, NULL);

    puts("testing handler");
    raise(SIGSEGV);
    puts("back");

    __asm__ (   "xor %rax, %rax\n\t"
                "mov %rax, %rsp\n\t"
                "push 0" 
            );

    // never reached...
}

这个想法是将 RSP 设置为 0(无效偏移),然后将其用于某些事情。但是,第二个 SIGSEGV 不会被处理程序捕获,而是终止进程。

显然,调用信号处理程序需要一个健全的堆栈指针开始——但为什么呢?这不是反对处理信号的想法吗?有机会解决这个问题吗?

我正在运行 Linux 版本 3.19.0-25-generic。

4

1 回答 1

1

好的,下面是 EOF 注释后的上述问题的解决方案(sigaltstack()用于在堆上提供信号堆栈):

#include <stdio.h>

#define __USE_GNU
#include <signal.h>
#include <stdlib.h>
#include <ucontext.h>

static long long int sbase;

static void catch_function(int sig, siginfo_t *info, void *cntxt)
{
    puts("handler works");

    /* reset RSP if invalid */
    ucontext_t *uc_context = (ucontext_t *)cntxt;
    if(!uc_context->uc_mcontext.gregs[REG_RSP])
    {
        puts("resetting RSP");
        uc_context->uc_mcontext.gregs[REG_RSP] = sbase;
    }
}

void main(int argc, char **argv)
{    
    /* RSP during main */
    sbase = (long long int)&argv;

    stack_t ss;
    struct sigaction sa;

    ss.ss_sp = malloc(SIGSTKSZ);
    ss.ss_size = SIGSTKSZ;
    ss.ss_flags = 0;
    sigaltstack(&ss, NULL);  

    sa.sa_sigaction = (void *)catch_function;
    sigemptyset (&sa.sa_mask);
    sa.sa_flags = SA_SIGINFO | SA_NODEFER | SA_ONSTACK;

    sigaction(SIGSEGV, &sa, NULL);

    puts("testing handler");
    raise(SIGSEGV);
    puts("back");

    __asm__ (
            "xor %rax, %rax\n\t"
            "mov %rax, %rsp\n\t"
            "push %rax\n\t"
            "pop %rax"  );

    puts("exiting.");
}

替代信号堆栈在堆上分配并使用sigaltstack(&ss,NULL). 此外,SA_ONSTACK在结构中设置了标志sigaction以启用用于此特定操作的替代堆栈。

这基本上解决了我的问题,因为现在我们看到无穷无尽的SIGSEGVs 被捕获。毕竟,以上catch_function()对于修复无效的堆栈指针并没有多大作用。作为一种解决方案,我现在存储 in 的有效堆栈指针,main()sbase在它无效时使用它在处理程序中恢复它(通过操作保存的线程上下文)。

为了完成所有这些工作,我还修复了我的内联程序集,不仅可以推送一个值,还可以在之后将其弹出,因此堆栈高度保持不变。为了可复制,我这次也包括了includes。

于 2016-09-05T09:54:46.590 回答