0

我的环境:

  • FreeBSD 9.1 和我得到了一个预分叉的多进程环境。
  • 一个主进程,一个轮询器来管理工作人员(决定忙碌或可用)和工作人员。

如果我发送一个SIGTERM到主进程没关系,如果工人数量不高。如果high (x > 20)我遇到段错误。

我有两个 truss 输出,其中一个是正常出口,另一个是 seg 故障。

核心文件的 gdb 输出:

Die: DW_TAG_unspecified_type (abbrev = 62, offset = 1535499)
    has children: FALSE
    attributes:
        DW_AT_name (DW_FORM_strp) string: "decltype(nullptr)"
Dwarf Error: Cannot find type of die [in module /usr/local/lib/gcc46/libstdc++.so.6]
Die: DW_TAG_unspecified_type (abbrev = 62, offset = 1535499)
    has children: FALSE
    attributes:
        DW_AT_name (DW_FORM_strp) string: "decltype(nullptr)"
Dwarf Error: Cannot find type of die [in module /usr/local/lib/gcc46/libstdc++.so.6]

正常退出进程的 truss 输出:

> close(0)                                         = 0 (0x0) close(7)   
> = 0 (0x0) gettimeofday({1360957175.665250 },0x0)           = 0 (0x0) write(5,"2013-02-15 21:39:35.665 [64591] "...,64) = 64 (0x40) close(5)
> = 0 (0x0)
> 
> sigprocmask(SIG_BLOCK,SIGHUP|SIGINT|SIGQUIT|SIGKILL|SIGPIPE|SIGALRM|SIGTERM|SIGURG|SIGSTOP|SIGTSTP|SIGCONT|SIGCHLD|SIGTTIN|SIGTTOU|SIGIO|SIGXCPU|SIGXFSZ|SIGVTALRM|SIGPROF|SIGWINCH|SIGINFO|SIGUSR1|SIGUSR2,0x
> 0) = 0 (0x0)
> 
> sigprocmask(SIG_SETMASK,0x0,0x0)                 = 0 (0x0)
> 
> .............. .............. so many same sigprocmask call
> 
> 
> sigprocmask(SIG_BLOCK,SIGHUP|SIGINT|SIGQUIT|SIGKILL|SIGPIPE|SIGALRM|SIGTERM|SIGURG|SIGSTOP|SIGTSTP|SIGCONT|SIGCHLD|SIGTTIN|SIGTTOU|SIGIO|SIGXCPU|SIGXFSZ|SIGVTALRM|SIGPROF|SIGWINCH|SIGINFO|SIGUSR1|SIGUSR2,0x
> 0) = 0 (0x0)
> sigprocmask(SIG_SETMASK,0x0,0x0)                 = 0 (0x0)
> process exit, rval = 0

进程,有段错误:

> gettimeofday({1360954514.547064 },0x0)           = 0 (0x0)
> write(5,"2013-02-15 20:55:14.547 [7580] I"...,63) = 63 (0x3f)
> close(5)                                         = 0 (0x0)
> SIGNAL 11 (SIGSEGV)
> process exit, rval = 0

当进程尝试调用 sigprocmask 时,它会给出 seg 错误。我没有明确调用 sigprocmask,并且怀疑调用 sigprocmask 的竞争条件。您是否遇到与 sigprocmask 相关的竞争条件?

4

1 回答 1

0

当进程尝试调用 sigprocmask 时,它会给出 seg 错误

我不这么认为。看来,崩溃是在第 5 个文件描述符关闭之后发生的。进一步看来,描述符 5 在关闭之前获得了一条日志消息(带有时间戳)。

你的“主”守护进程试图清理,并在尝试中死去。我建议在运行时将 gdb 附加到它——就在发送 SIGTERM 之前。发送 SIGTERM 后,告诉 gdb 继续。

发送 SIGSEGV 后,进行调查。

我还强烈建议在 valgrind 下运行守护进程。那样你很可能会抓到很多虱子……

于 2013-04-10T22:40:40.160 回答