2

我有一个小型 C++ 程序,它可以 ping 网络上的其他机器并通过另一个网络发送状态信息。该程序作为守护进程运行,因此启动进程派生出一个子进程,然后调用exit. 该程序经过交叉编译,可在两种不同的架构上运行:x86 和 ARM。GCC 版本分别为 4.4 和 3.5。我可以在 x86 上编译和运行该程序,它可以完美运行。但是,当我在 ARM 上运行程序时,它会在我调用的任何时候挂起exit,而不仅仅是在fork. 我没有使用atexitor注册的函数on_exit。以下是我的包括:

#include <cstdio>
#include <cstdlib>
#include <cstring>

#include <iostream>
#include <sstream>
#include <string>
#include <set>
#include <vector>

#include <boost/bind.hpp>
#include <boost/asio.hpp>
#include <boost/thread.hpp>
#include "telnet_client.h"

#include <stdint.h>

#include <sys/types.h>
#include <sys/socket.h>
#include <sys/select.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <sys/time.h>
#include <netdb.h>
#include <net/if.h>
#include <sys/ioctl.h>
#include <unistd.h>
#include <syslog.h>
#include <customlib1.h>
#include <customlib2.h>

以下是我的 GCC 命令:

arm-none-linux-gnueabi-g++ -Wall -DBUILDSTAMP="\"`date '+%F %T'`\"" -g -ggdb -O0 -I/usr/local/arm/arm-2007q1/arm-none-linux-gnueabi/libc/usr/include -DEMBEST_ARM -I/usr/local/share/arm/boost/src -I../include/ -I../include_rms -c can_wifid.cpp -o can_wifid.o
arm-none-linux-gnueabi-g++ -Wall -DBUILDSTAMP="\"`date '+%F %T'`\"" -g -ggdb -O0 -I/usr/local/arm/arm-2007q1/arm-none-linux-gnueabi/libc/usr/include -DEMBEST_ARM -I/usr/local/share/arm/boost/src -I../include/ -I../include_rms -c telnet_client.cpp -o telnet_client.o
arm-none-linux-gnueabi-g++ -Wall -DBUILDSTAMP="\"`date '+%F %T'`\"" -g -ggdb -O0 -I/usr/local/arm/arm-2007q1/arm-none-linux-gnueabi/libc/usr/include -DEMBEST_ARM -I/usr/local/share/arm/boost/src can_wifid.o telnet_client.o -L/usr/local/arm/arm-2007q1/arm-none-linux-gnueabi/libc/usr/lib  -L../lib_embest_arm -L../lib_rms_embest_arm -Wl,-Bdynamic -lutilities -lboost_system -lboost_thread -lcanprovider -lembestcan -o can_wifid

即使只是解析我的命令行参数,getopt然后在版本消息之后调用也会exit导致这个问题(我的程序中最简单的情况)。有没有人经历过这样的事情exit

编辑:为主要功能的第一部分添加了代码:

struct canwifid_options
{
public:
bool daemon_mode;
int verbosity;

canwifid_options()
{
    this->daemon_mode = false;
    this->verbosity = LOG_NOTICE;
}
};

static canwifid_options options;

int main(int argc, char * argv[])
{
int LoggingOptions = LOG_CONS|LOG_NDELAY|LOG_PID;
pid_t Pid;

ParseCommandLine(argc, argv);

if (!options.daemon_mode)
{
    LoggingOptions |= LOG_PERROR;
}

openlog("can_wifid", LoggingOptions, LOG_USER);

setlogmask(LOG_UPTO(options.verbosity));

if (options.daemon_mode)
{
    Pid = fork();

    if (Pid < 0)
    {
        // couldn't fork off and create a child process
        // log it, %m is a special syslog flag
        syslog(LOG_CRIT, "Unable to create daemon [Error: %m]");
        exit(ESRCH);
    }
    else if (Pid > 0)
    {
        // we're the parent, so we're done and out of here
        exit(EXIT_SUCCESS);
    }
    else
    {
        // we're the child, take control of the session.
        setsid();

        // change to the root directory so we don't retain unnecessary control
        // of any mounted volumes
        chdir("/");

        // clear our file mode creation mask
        umask(0000);
    }
}
else
{
    // get our process ID
    Pid = getpid();
}

syslog(LOG_INFO, "Running as %s", options.daemon_mode ? "daemon" : "standalone");

    // Network code here, snipped for clarity
}

还有 ParseCommandLine 函数:

static void ParseCommandLine(int argc, char *argv[])
{
int c;

while ((c = getopt(argc, argv, "dhqvDV?")) > 0)
{
    switch (c)
    {
        case 'd':
            options.daemon_mode = true;
            break;
        case 'V':
            VersionMessage(argv);
            exit(EXIT_SUCCESS);
            break;
        case 'q':
            options.verbosity = LOG_WARNING;
            break;
        case 'v':
            options.verbosity = LOG_INFO;
            break;
        case 'D':
            options.verbosity = LOG_DEBUG;
            break;
        case 'h':
        case '?':
        default:
            HelpMessage(argv);
            exit(EXIT_SUCCESS);
            break;
    }
}

return; //done
}
4

1 回答 1

1

我曾经遇到的一个问题是调用exit尝试退出并调用全局析构函数而不尝试展开堆栈或为堆栈上的本地对象调用任何析构函数。如果您有全局析构函数可能需要的任何类型的锁,这很容易体现出来。例如,这个程序在退出时死锁(实际上是在全局 dtor 中):

#include <iostream>
#include <mutex>

std::mutex  lock;

class A {
public:
    A() {
        std::lock_guard<std::mutex> acquire(lock);
        std::cout << "ctor A" << std::endl;
    }
    ~A() {
        std::lock_guard<std::mutex> acquire(lock);
        std::cout << "dtor A" << std::endl;
    }
};

A a;

int main()
{
    std::lock_guard<std::mutex> acquire(lock);
    exit(0);
}

现在你的问题可能是完全不同的东西,但很有可能它与全局析构函数中的某些东西有关,因为堆栈上的某些对象没有被正确销毁。

如果您想在正确展开堆栈时退出(这是 RAII 结构化代码所必需的),则不能调用 exit。相反,您需要抛出一个异常,该异常(仅)在 main 中捕获并导致 main 返回。

于 2013-02-20T20:16:58.023 回答