9

我在 Linux 下的服务器套接字有问题。由于某种我不知道的原因,服务器套接字消失了,并且Bad file descriptor在等待传入连接的选择调用中出现错误。当我在不同的线程中关闭不相关的套接字连接时,总是会出现此问题。这发生在具有 2.6.36 内核的嵌入式 Linux 上。

有谁知道为什么会发生这种情况?服务器套接字可以简单地消失导致正常Bad file descriptor吗?

编辑: 其他套接字代码实现 VNC 服务器并在完全不同的线程中运行。其他代码的唯一特别之处是使用,setjmp/longjmp但这不应该是一个问题。

创建服务器套接字的代码如下:

int server_socket = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP);

struct sockaddr_in saddr;
memset(&saddr, 0, sizeof(saddr));
saddr.sin_family = AF_INET;
saddr.sin_addr.s_addr = htonl(INADDR_ANY);
saddr.sin_port = htons(1234);

const int optionval = 1;
setsockopt(server_socket, SOL_SOCKET, SO_REUSEADDR, &optionval, sizeof(optionval));

if (bind(server_socket, (struct sockaddr *) &saddr, sizeof(saddr)) < 0) {
    perror("bind");
    return 0;
}

if (listen(server_socket, 1) < 0) {
    perror("listen");
    return 0;
}

我使用以下代码等待传入连接:

static int WaitForConnection(int server_socket, struct timeval *timeout)
{
    fd_set read_fds;

    FD_ZERO(&read_fds);
    int max_sd = server_socket;
    FD_SET(server_socket, &read_fds);

    // This select will result in 'EBADFD' in the error case.
    // Even though the server socket was not closed with 'close'.
    int res = select(max_sd + 1, &read_fds, NULL, NULL, timeout);
    if (res > 0) {
        struct sockaddr_in caddr;
        socklen_t clen = sizeof(caddr);
        return accept(server_socket, (struct sockaddr *) &caddr, &clen);
    }

    return -1;
}

编辑: 当问题发生时,我目前只是重新启动服务器,但我不明白为什么服务器套接字 id 会突然变成无效的文件描述符:

int error = 0;
socklen_t len = sizeof (error);
int retval = getsockopt (server_socket, SOL_SOCKET, SO_ERROR, &error, &len );
if (retval < 0) {
    close(server_socket);
    goto server_start;
}
4

4 回答 4

6

套接字(文件描述符)通常会遇到与C. 每当您关闭套接字时,请不要忘记分配-1给保留描述符值的变量:

close(socket);
socket = -1;

正如您对C指针所做的那样

free(buffer);
buffer = NULL;

如果您忘记这样做,您可以稍后关闭套接字两次,free()如果它是一个指针,您会记住两次。

另一个问题可能与人们通常忘记的事实有关:UNIX 环境中的文件描述符从0. 如果在代码中的某个地方你有

struct FooData {
    int foo;
    int socket;
    ...
}

// Either
FooData my_data_1 = {0};
// Or
FooData my_data_2;
memset(&my_data_2, 0, sizeof(my_data_2));

在这两种情况下my_data_1my_data_2都具有有效的描述符 ( socket) 值。后来,一些负责释放FooData结构的代码可能会盲目地close()这个描述符,那恰好是你服务器的监听套接字(0)。

于 2015-02-27T09:29:35.673 回答
3

1-关闭你的套接字:

close(sockfd);

2-从选择集中清除您的套接字文件描述符:

FD_CLR(sockfd,&master); //opposite of FD_SET
于 2015-10-09T09:19:15.833 回答
1

您没有区分代码中的两种错误情况,两者都可能失败selectaccept. 我的猜测是,您只是有一个超时时间,并且 select 会返回0

  • 打印retvalerrnoelse分支中
  • accept分别考察返回值
  • 确保在每个系统调用之前errno重置0
于 2012-07-31T08:21:42.870 回答
-3

在 Linux 中,一旦你创建了一个连接并且它被关闭,那么你必须等待一段时间才能建立新的连接。在 Linux 中,socket 不会释放端口号。一旦你关闭套接字。

或者

你重用了socket,那么坏的文件描述符就要来了。

于 2012-07-31T07:30:24.253 回答