0

在 HFT 交易应用程序中,我需要从 udp 多播套接字接收数据。唯一的要求是延迟——这非常重要,以至于我可以“使用”一个 CPU 内核。旋转什么的都可以。这是我目前在 Windows 中所拥有的:

void Receiver::ThreadMethod() {
    //UINT32 seq;
    sockaddr_in Sender;
    int SenderAddrSize = sizeof(Sender);

    while (stayConnected) {
        int res=recvfrom(socketId,buf,sizeof(char) * RECEIVE_BUFFER_SIZE,0, (SOCKADDR *)& Sender, &SenderAddrSize);
        if (res == SOCKET_ERROR) {
            printf("recvfrom failed, WSAGetLastError: %d\n", WSAGetLastError());
            continue;
        }
        //seq = *(UINT32*)buf;
        //printf("%12s:seq=%6d:len=%4d\n", inet_ntoa(Sender.sin_addr), seq, res);
        unsigned char* buf2 = reinterpret_cast<unsigned char*>(buf);
        feed->ProcessMessage(res, buf2);
    }
}

recvfrom块,所以它可能会很慢(或者我错了?)。我应该为 Linux 重写它并实现最佳延迟。我需要为每个线程处理一个套接字,所以我认为我不应该使用epoll它,因为它设计得更多来处理许多套接字。我应该使用什么?

upd我发现了类似的问题Low-latency read of UDP port

4

1 回答 1

0

在 UNIX 中,您应该使用fcntl将套接字设置为非阻塞:

fcntl(socket, F_SETFL, O_NONBLOCK);

此外,如果您的客户端需要处理多个套接字(例如聚合多个提要),您应该使用一次select调用来处理多个文件描述符,并查看哪个套接字具有可用数据(如果有的话)(除其他外,这将避免循环遍历所有套接字)

至于延迟,其他因素如网卡类型和配置、内核设置(可能有一个绕过内核的网卡)都会对延迟产生相当大的影响(待测量)。

于 2014-09-18T19:43:34.480 回答