4

我试图让 libwebsockets 在 OS X 上的多线程环境中运行。我无法触发从与主服务线程不同的线程发送数据。在 libwebsocket 文档中暗示这应该是可能的(演示代码邮件列表)。所以我深入研究了代码,在 poll() 函数中发现了问题。

似乎 poll() 对struct pollfd作为参数给出的 that 表现不同。libwebsockets 依赖于在 poll() 处于活动状态时更改 fds.event 字段的可能性。这在 Linux 上运行良好,但不适用于 OS X。

我写了一个小测试程序来演示这种行为:

#include <unistd.h>
#include <netdb.h>
#include <poll.h>
#include <iostream>
#include <thread>

#define PORT "3490"

struct pollfd    fds[1];
bool connected = false;

void main_loop() {
    int sockfd, new_fd; 
    struct addrinfo hints, *servinfo, *p;
    socklen_t sin_size;
    int yes=1;
    char s[INET6_ADDRSTRLEN];
    int rv;

    memset(&hints, 0, sizeof hints);
    hints.ai_family = AF_INET;
    hints.ai_socktype = SOCK_STREAM;
    hints.ai_flags = AI_PASSIVE; 

    if ((rv = getaddrinfo(NULL, PORT, &hints, &servinfo)) != 0) {
        fprintf(stderr, "getaddrinfo: %s\n", gai_strerror(rv));
        return;
    }

    for(p = servinfo; p != NULL; p = p->ai_next) {
        if ((sockfd = socket(p->ai_family, p->ai_socktype, p->ai_protocol)) == -1) {
            perror("server: socket");
            continue;
        }

        if (setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, &yes, sizeof(int)) == -1) {
            perror("setsockopt");
            exit(1);
        }

        if (bind(sockfd, p->ai_addr, p->ai_addrlen) == -1) {
            close(sockfd);
            perror("server: bind");
            continue;
        }

        break;
    }

    freeaddrinfo(servinfo);

    if (p == NULL)  {
        fprintf(stderr, "server: failed to bind\n");
        exit(1);
    }

    if (listen(sockfd, 10) == -1) {
        perror("listen");
        exit(1);
    }

    printf("server: waiting for connections...\n");

    new_fd = accept(sockfd, NULL, &sin_size);
    if (new_fd == -1) {
        perror("accept");
        return;
    }

    fds[0].fd = new_fd;
    fds[0].events = POLLIN;
    connected = true;

    printf("event is %i\n", fds[0].events);
    int ret = poll(fds, 1, 5000);
    printf("event is %i\n", fds[0].events); //expecting 1 on Mac and 5 on Linux

    if (send(new_fd, "Hello, world!\n", 14, 0) == -1)
        perror("send");

    close(new_fd); 
    close(sockfd);
}

void second_thread()
{
    while(connected == false){}
    sleep(1);
    fds[0].events = POLLIN|POLLOUT;
    printf("set event to %i\n", fds[0].events);
}

int main() {

    std::thread t1(main_loop);
    std::thread t2(second_thread);

    t1.join();
    t2.join();

    return 0;
}

在 OS X 上使用编译clang++ -std=c++11 -stdlib=libc++ -o poll poll.cpp ,在 Linux 上使用编译g++ -std=c++11 -pthread -o poll poll.cpp

程序开始侦听端口 3490。如果您连接到它(例如使用netcat localhost 3490),它将轮询主线程上的输入并尝试更改第二个线程中的事件标志。它将在 5 秒后退出。

OS X 上的输出:

server: waiting for connections...
event is 1
set event to 5
event is 1

Linux 上的输出:

server: waiting for connections...
event is 1
set event to 5
event is 5

所以我的问题是:是否有任何可用的文档可以解释这种行为?libwebsockets 期望在 poll 处于活动状态时更改 fds.events 是合法的,这是否安全?我在手册页( OS XLinux)中找不到有关它的任何详细信息。

4

1 回答 1

4

起初,您似乎说您找到了一些文档,声称这是受支持和定义的行为。我很想知道你在哪里读到的,因为我无法在poll(2)的 Linux 手册页中找到任何内容,也无法在 poll()的POSIX 手册页中找到任何记录不同线程实际上可以更改的内容另一个线程传递给 poll() 的事件数组参数中的值,并且不同线程的更改实际上会在原始线程的 poll() 调用中生效,而不管与内存屏障等相关的任何问题。

在我看来,这两个手册页在这个主题上似乎完全保持沉默。它们没有说明这是预期的、支持的还是已定义的行为;或者这是否不是受支持或定义的行为。

一个不同的线程可以将参数修改为另一个线程发出的系统调用,之后——之后——另一个线程已经进入系统调用,这对我来说似乎是违反直觉的。如果这是受支持的行为,我希望它被明确记录,并且我在 Linux 或 POSIX 手册页中找不到对它的任何引用。

话虽如此:即使我将我的软件范围限制在 Linux 上,即使我不需要关心其他平台;鉴于没有这方面的任何文档,即使我的测试显示 Linux 内核以这种方式实现 poll(2),我也不希望有任何保证未来的某些内核版本将继续以这种方式运行。除了我测试过的特定内核版本外,我无法依赖这种行为。

因此,回答您的问题:关于该主题的唯一权威文档是相关手册页。他们没有明确将此记录为合法行为;尽管他们也没有明确表示这是非法行为,但出于上述原因,我认为这是不受支持的、未定义的行为。

于 2015-08-24T21:52:45.410 回答