26

我不知道为什么我很难找到这个,但我正在查看一些 linux 代码,我们正在使用select()等待文件描述符来报告它已经准备好。从选择的手册页:

select() and pselect() allow a program to monitor multiple file descriptors,
waiting until one or more of the file descriptors become "ready" for some
class of I/O operation 

所以,太好了……我在某个描述符上调用 select,给它一些超时值,然后开始等待指示消失。文件描述符(或描述符的所有者)如何报告它“准备好”以便select()语句返回?

4

2 回答 2

32

它通过返回报告它已准备好。

select等待通常不在您的程序控制范围内的事件。本质上,通过调用select,您的程序会说“我无事可做,直到...,请暂停我的进程”。

您指定的条件是一组事件,其中任何一个都会唤醒您。

例如,如果您正在下载某些东西,您的循环将不得不等待新数据到达,如果传输卡住则发生超时,或者用户中断,这正是这样select做的。

当您进行多次下载时,到达任何连接的数据都会触发程序中的活动(您需要将数据写入磁盘),因此您需要select在文件描述符列表中提供所有下载连接的列表以供监视“读”。

当您同时将数据上传到某个地方时,您再次使用select来查看连接当前是否接受数据。如果对方在拨号,它只会缓慢地确认数据,所以你的本地发送缓冲区总是满的,任何写入更多数据的尝试都会阻塞,直到缓冲区空间可用,或者失败。通过将我们发送到的文件描述符select作为“写入”描述符传递,一旦缓冲区空间可用于发送,我们就会收到通知。

一般的想法是您的程序变成事件驱动的,即它对来自公共消息循环的外部事件做出反应,而不是执行顺序操作。你告诉内核“这是我想做的一组事件”,内核给你一组已经发生的事件。两个事件同时发生是相当普遍的;例如,一个 TCP 确认包含在一个数据包中,这可以使同一个 fd 既可读(数据可用)又可写(确认的数据已从发送缓冲区中删除),因此您应该准备好处理所有事件在再次调用之前select

更好的一点是,它select基本上给你一个承诺,即一次调用readwrite不会阻塞,而不对调用本身做任何保证。例如,如果有 1 个字节的缓冲区空间可用,您可以尝试写入 10 个字节,内核会返回说“我已写入 1 个字节”,因此您也应该准备好处理这种情况。一个典型的做法是有一个缓冲区“要写入这个fd的数据”,只要它不为空,就将fd添加到写入集中,通过尝试将所有内容写入来处理“可写”事件当前在缓冲区中的数据。如果之后缓冲区为空,那很好,如果不是,请再次等待“可写”。

“异常”集很少使用——它用于具有带外数据的协议,其中数据传输可能会阻塞,而其他数据需要通过。如果您的程序当前无法接受来自“可读”文件描述符的数据(例如,您正在下载,并且磁盘已满),您不希望将描述符包含在“可读”集中,因为您无法处理该事件select如果再次调用将立即返回。如果接收方将 fd 包含在“异常”集中,并且发送方要求其 IP 堆栈发送带有“紧急”数据的数据包,则接收方会被唤醒,并可以决定丢弃未处理的数据并与发送方重新同步. 这telnet协议使用它,例如,用于 Ctrl-C 处理。除非您正在设计需要此类功能的协议,否则您可以轻松地将其排除在外,而不会造成任何伤害。

强制代码示例:

#include <sys/types.h>
#include <sys/select.h>

#include <unistd.h>

#include <stdbool.h>

static inline int max(int lhs, int rhs) {
    if(lhs > rhs)
        return lhs;
    else
        return rhs;
}

void copy(int from, int to) {
    char buffer[10];
    int readp = 0;
    int writep = 0;
    bool eof = false;
    for(;;) {
        fd_set readfds, writefds;
        FD_ZERO(&readfds);
        FD_ZERO(&writefds);

        int ravail, wavail;
        if(readp < writep) {
            ravail = writep - readp - 1;
            wavail = sizeof buffer - writep;
        }
        else {
            ravail = sizeof buffer - readp;
            wavail = readp - writep;
        }

        if(!eof && ravail)
            FD_SET(from, &readfds);
        if(wavail)
            FD_SET(to, &writefds);
        else if(eof)
            break;
        int rc = select(max(from,to)+1, &readfds, &writefds, NULL, NULL);
        if(rc == -1)
            break;
        if(FD_ISSET(from, &readfds))
        {
            ssize_t nread = read(from, &buffer[readp], ravail);
            if(nread < 1)
                eof = true;
            readp = readp + nread;
        }
        if(FD_ISSET(to, &writefds))
        {
            ssize_t nwritten = write(to, &buffer[writep], wavail);
            if(nwritten < 1)
                break;
            writep = writep + nwritten;
        }
        if(readp == sizeof buffer && writep != 0)
            readp = 0;
        if(writep == sizeof buffer)
            writep = 0;
    }
}

如果我们有可用的缓冲区空间并且在读取端没有文件结束或错误,我们会尝试读取,如果缓冲区中有数据,我们会尝试写入;如果到达文件结尾并且缓冲区为空,那么我们就完成了。

这段代码的行为显然不是最理想的(它是示例代码),但是您应该能够看到内核在读取和写入方面做的比我们要求的少是可以接受的,在这种情况下,我们只需返回并说“无论何时你准备好了”,而​​且我们从来没有在不询问它是否会阻塞的情况下读取或写入。

于 2012-09-27T16:38:19.200 回答
8

从同一个手册页:

在退出时,集合被修改以指示哪些文件描述符实际更改了状态。

因此,使用FD_ISSET()传递给 select 的集合来确定哪些 FD 已准备好。

于 2012-09-27T15:55:43.637 回答