6

我有一个多线程应用程序,它为 SIGCHLD 安装一个处理程序,用于记录和获取子进程。
我看到的问题开始于我调用system(). system()需要等待子进程结束并自己收割他,因为它需要退出代码。这就是它调用sigprocmask()阻止 SIGCHLD 的原因。但是在我的多线程应用程序中,SIGCHLD 仍然在不同的线程中被调用,并且孩子在system()有机会这样做之前就被收割了。

这是 POSIX 中的一个已知问题吗?

我想到的一种解决方法是在所有其他线程中阻止 SIGCHLD ,但这在我的情况下并不现实,因为并非所有线程都是由我的代码直接创建的。
我还有什么其他选择?

4

4 回答 4

5

由于您有无法控制的线程,因此我建议您编写一个预加载的库来使用您自己的实现插入system()调用(也许还有popen()等)。我也会将您的SIGCHLD处理程序包含在库中。

如果您不想通过 运行程序env LD_PRELOAD=libwhatever.so yourprogram,可以添加类似

const char *libs;

libs = getenv("LD_PRELOAD");
if (!libs || !*libs) {
    setenv("LD_PRELOAD", "libwhatever.so", 1);
    execv(argv[0], argv);
    _exit(127);
}

在您的程序开始时,让它在适当设置 LD_PRELOAD 的情况下重新执行。(请注意,如果您的程序是 setuid 或 setgid,则需要考虑一些怪癖;请参阅man ld.so详细信息。特别是,如果libwhatever.so未安装在系统库目录中,则必须指定完整路径。)

一种可能的方法是使用未决子代的无锁数组(使用 C 编译器提供的原子内置函数)。而不是waitpid(),您的system()实现分配其中一个条目,将子 PID 粘贴在那里,并等待信号量让子退出而不是调用waitpid().

这是一个示例实现:

#define  _GNU_SOURCE
#define  _POSIX_C_SOURCE 200809L
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/wait.h>
#include <fcntl.h>
#include <signal.h>
#include <semaphore.h>
#include <dlfcn.h>
#include <errno.h>

/* Maximum number of concurrent children waited for.
*/
#define  MAX_CHILDS  256

/* Lockless array of child processes waited for.
*/
static pid_t  child_pid[MAX_CHILDS] = { 0 }; /* 0 is not a valid PID */
static sem_t  child_sem[MAX_CHILDS];
static int    child_status[MAX_CHILDS];

/* Helper function: allocate a child process.
 * Returns the index, or -1 if all in use.
*/
static inline int child_get(const pid_t pid)
{
    int i = MAX_CHILDS;
    while (i-->0)
        if (__sync_bool_compare_and_swap(&child_pid[i], (pid_t)0, pid)) {
            sem_init(&child_sem[i], 0, 0);
            return i;
        }
    return -1;
}

/* Helper function: release a child descriptor.
*/
static inline void child_put(const int i)
{
    sem_destroy(&child_sem[i]);
    __sync_fetch_and_and(&child_pid[i], (pid_t)0);
}

/* SIGCHLD signal handler.
 * Note: Both waitpid() and sem_post() are async-signal safe.
*/
static void sigchld_handler(int signum __attribute__((unused)),
                            siginfo_t *info __attribute__((unused)),
                            void *context __attribute__((unused)))
{
    pid_t p;
    int   status, i;

    while (1) {
        p = waitpid((pid_t)-1, &status, WNOHANG);
        if (p == (pid_t)0 || p == (pid_t)-1)
            break;

        i = MAX_CHILDS;
        while (i-->0)
            if (p == __sync_fetch_and_or(&child_pid[i], (pid_t)0)) {
                child_status[i] = status;
                sem_post(&child_sem[i]);
                break;
            }

        /* Log p and status? */
    }
}

/* Helper function: close descriptor, without affecting errno.
*/
static inline int closefd(const int fd)
{
    int  result, saved_errno;

    if (fd == -1)
        return EINVAL;

    saved_errno = errno;

    do {
        result = close(fd);
    } while (result == -1 && errno == EINTR);
    if (result == -1)
        result = errno;
    else
        result = 0;

    errno = saved_errno;

    return result;
}

/* Helper function: Create a close-on-exec socket pair.
*/
static int commsocket(int fd[2])
{
    int  result;

    if (socketpair(AF_UNIX, SOCK_STREAM, 0, fd)) {
        fd[0] = -1;
        fd[1] = -1;
        return errno;
    }

    do {
        result = fcntl(fd[0], F_SETFD, FD_CLOEXEC);
    } while (result == -1 && errno == EINTR);
    if (result == -1) {
        closefd(fd[0]);
        closefd(fd[1]);
        return errno;
    }

    do {
        result = fcntl(fd[1], F_SETFD, FD_CLOEXEC);
    } while (result == -1 && errno == EINTR);
    if (result == -1) {
        closefd(fd[0]);
        closefd(fd[1]);
        return errno;
    }

    return 0;
}

/* New system() implementation.
*/
int system(const char *command)
{
    pid_t   child;
    int     i, status, commfd[2];
    ssize_t n;

    /* Allocate the child process. */
    i = child_get((pid_t)-1);
    if (i < 0) {
        /* "fork failed" */
        errno = EAGAIN;
        return -1;
    }

    /* Create a close-on-exec socket pair. */
    if (commsocket(commfd)) {
        child_put(i);
        /* "fork failed" */
        errno = EAGAIN;
        return -1;
    }

    /* Create the child process. */
    child = fork();
    if (child == (pid_t)-1)
        return -1;

    /* Child process? */
    if (!child) {
        char *args[4] = { "sh", "-c", (char *)command, NULL };

        /* If command is NULL, return 7 if sh is available. */
        if (!command)
            args[2] = "exit 7";

        /* Close parent end of comms socket. */
        closefd(commfd[0]);

        /* Receive one char before continuing. */
        do {
            n = read(commfd[1], &status, 1);
        } while (n == (ssize_t)-1 && errno == EINTR);
        if (n != 1) {
            closefd(commfd[1]);
            _exit(127);
        }

        /* We won't receive anything else. */
        shutdown(commfd[1], SHUT_RD);

        /* Execute the command. If successful, this closes the comms socket. */
        execv("/bin/sh", args);

        /* Failed. Return the errno to the parent. */
        status = errno;
        {
            const char       *p = (const char *)&status;
            const char *const q = (const char *)&status + sizeof status;

            while (p < q) {
                n = write(commfd[1], p, (size_t)(q - p));
                if (n > (ssize_t)0)
                    p += n;
                else
                if (n != (ssize_t)-1)
                    break;
                else
                if (errno != EINTR)
                    break;
            }
        }

        /* Explicitly close the socket pair. */
        shutdown(commfd[1], SHUT_RDWR);
        closefd(commfd[1]);
        _exit(127);
    }

    /* Parent process. Close the child end of the comms socket. */
    closefd(commfd[1]);

    /* Update the child PID in the array. */
    __sync_bool_compare_and_swap(&child_pid[i], (pid_t)-1, child);

    /* Let the child proceed, by sending a char via the socket. */
    status = 0;
    do {
        n = write(commfd[0], &status, 1);
    } while (n == (ssize_t)-1 && errno == EINTR);
    if (n != 1) {
        /* Release the child entry. */
        child_put(i);
        closefd(commfd[0]);

        /* Kill the child. */
        kill(child, SIGKILL);

        /* "fork failed". */
        errno = EAGAIN;
        return -1;
    }

    /* Won't send anything else over the comms socket. */
    shutdown(commfd[0], SHUT_WR);

    /* Try reading an int from the comms socket. */
    {
        char       *p = (char *)&status;
        char *const q = (char *)&status + sizeof status;

        while (p < q) {
            n = read(commfd[0], p, (size_t)(q - p));
            if (n > (ssize_t)0)
                p += n;
            else
            if (n != (ssize_t)-1)
                break;
            else
            if (errno != EINTR)
                break;
        }

        /* Socket closed with nothing read? */
        if (n == (ssize_t)0 && p == (char *)&status)
            status = 0;
        else
        if (p != q)
            status = EAGAIN; /* Incomplete error code, use EAGAIN. */

        /* Close the comms socket. */
        shutdown(commfd[0], SHUT_RDWR);
        closefd(commfd[0]);
    }

    /* Wait for the command to complete. */
    sem_wait(&child_sem[i]);

    /* Did the command execution fail? */
    if (status) {
        child_put(i);
        errno = status;
        return -1;
    }

    /* Command was executed. Return the exit status. */
    status = child_status[i];
    child_put(i);

    /* If command is NULL, then the return value is nonzero
     * iff the exit status was 7. */
    if (!command) {
        if (WIFEXITED(status) && WEXITSTATUS(status) == 7)
            status = 1;
        else
            status = 0;
    }

    return status;
}

/* Library initialization.
 * Sets the sigchld handler,
 * makes sure pthread library is loaded, and
 * unsets the LD_PRELOAD environment variable.
*/
static void init(void) __attribute__((constructor));
static void init(void)
{
    struct sigaction  act;
    int               saved_errno;

    saved_errno = errno;

    sigemptyset(&act.sa_mask);
    act.sa_sigaction = sigchld_handler;
    act.sa_flags = SA_NOCLDSTOP | SA_RESTART | SA_SIGINFO;

    sigaction(SIGCHLD, &act, NULL);

    (void)dlopen("libpthread.so.0", RTLD_NOW | RTLD_GLOBAL);

    unsetenv("LD_PRELOAD");

    errno = saved_errno;
}

如果将上面的内容另存为 say child.c,则可以将其编译为libchild.sousing

gcc -W -Wall -O3 -fpic -fPIC -c child.c -lpthread
gcc -W -Wall -O3 -shared -Wl,-soname,libchild.so child.o -ldl -lpthread -o libchild.so

如果您有一个在各种线程中调用的测试程序system(),您可以system()使用

env LD_PRELOAD=/path/to/libchild.so test-program

请注意,根据不受您控制的那些线程的确切作用,您可能需要插入更多功能,包括signal()sigaction()sigprocmask()pthread_sigmask()等,以确保这些线程不会更改SIGCHLD处理程序的配置(在安装后由图书馆libchild.so)。

如果那些失控线程使用,您可以使用与上面非常相似的代码popen()插入(和) ,只需分成两部分。pclose()system()

(如果您想知道为什么我的system()代码会费心向exec()父进程报告失败,那是因为我通常使用此代码的变体,它将命令作为字符串数组;这样如果找不到命令,它会正确报告,或由于权限不足等原因无法执行。在这种特殊情况下,命令始终为/bin/sh. 但是,由于无论如何都需要通信套接字以避免子退出和 *child_pid[] 中具有最新 PID 之间的竞争* 数组,我决定将“额外”代码留在其中。)

于 2013-07-10T00:35:35.290 回答
5

是的,这是一个已知的(或至少是强烈暗示的)问题。

在等待子进程终止时阻塞 SIGCHLD 可防止应用程序在 system() 自己获取状态之前捕获信号并从 system() 的子进程获取状态。.... 请注意,如果应用程序正在捕获 SIGCHLD 信号,它将在成功的 system() 调用返回之前接收到这样的信号。

(来自 的文档system(),强调了。)

所以,POSIXly 你运气不好,除非你的实现碰巧排队 SIGCHLD。如果是这样,您当然可以记录您分叉的 pid,然后只收获您期望的那些。

在 Linux 上,你也不走运,因为signalfd 似乎也折叠了多个 SIGCHLDs

然而,在 UNIX 上,您可以使用许多聪明且过于聪明的技术来管理您自己的孩子并忽略第三方例程的技术。继承管道的 I/O 多路复用是 SIGCHLD 捕获的一种替代方法,就像使用小型专用“spawn-helper”在单独的进程中进行分叉和收割一样。

于 2013-07-09T17:55:55.897 回答
0

对于仍在寻找答案的人来说,有一个更简单的方法可以解决这个问题:

重写 SIGCHLD 处理程序以使用带有 WNOHANG|WNOWAIT 标志的 waitid 调用来检查孩子的 PID,然后再收割它们。您可以选择检查 /proc/PID/stat(或类似的 OS 接口)以获取命令名称。

于 2014-06-21T04:38:49.603 回答
-1

替换system()by proc_system()

于 2017-06-23T07:27:05.133 回答