2

我读到它应该同时不受不同线程的影响,但是我的程序有一些奇怪的行为,我不知道出了什么问题。

我有并发线程与客户端套接字通信

  1. 一个正在发送到套接字
  2. 一个做选择,然后从同一个套接字接收

由于我仍在发送,客户端已经收到数据并关闭了套接字。同时,我正在对该套接字进行选择和接收,它返回 0(因为它已关闭)所以我关闭了这个套接字。但是,发送尚未返回......并且由于我在此套接字上调用 close,发送调用因 EBADF 而失败。

我知道客户端已经正确接收到数据,因为我在关闭套接字后输出它并且它是正确的。但是,就我而言,我的发送调用仍然返回错误(EBADF),所以我想修复它以使其不会失败。

这并不总是发生。它可能发生在 40% 的时间里。我不在任何地方使用睡眠。我应该在发送或接收之间有暂停吗?

这是一些代码:

发送:

while(true)
{
    // keep sending until send returns 0
    n = send(_sfd, bytesPtr, sentSize, 0);

    if (n == 0)
    {
        break;
    }
    else if(n<0)
    {
        cerr << "ERROR: send returned an error "<<errno<< endl; // this case is triggered
        return n;
    }

    sentSize -= n;
    bytesPtr += n;
}

接收:

 while(true)
{
    memset(bufferPointer,0,sizeLeft);
    n = recv(_sfd,bufferPointer,sizeLeft, 0);
    if (debug) cerr << "Receiving..."<<sizeLeft<<endl;
    if(n == 0)
    {
        cerr << "Connection closed"<<endl; // this case is triggered
        return n;
    }
    else if (n < 0)
    {
        cerr << "ERROR reading from socket"<<endl;
        return n;
    }
     bufferPointer += n;
     sizeLeft -= n;
     if(sizeLeft <= 0) break;

}

在客户端,我使用相同的接收代码,然后在套接字上调用 close()。然后在我这边,我从接收调用中得到 0 并且还在套接字上调用 close() 然后我的发送失败。还没完结?!但是我的客户已经得到了数据!

4

2 回答 2

5

我必须承认我很惊讶你经常看到这个问题,但是当你处理线程时它总是有可能的。当您调用时send(),您最终会进入内核将数据附加到那里的套接字缓冲区,因此很可能会有上下文切换,可能会切换到系统中的另一个进程。与此同时,内核可能已经相当快地缓冲和传输了数据包。我猜您正在本地网络上进行测试,因此另一端接收数据并关闭连接并很快将适当的 FIN 发送回您的端。当发送机器仍在运行其他线程或进程时,这一切都可能发生,因为本地以太网网络上的延迟非常低。

现在 FIN 到了——你的接收线程最近没有做很多事情,因为它一直在等待输入。因此,许多调度系统将大大提高其优先级,并且很有可能接下来会运行它(您没有指定您正在使用的操作系统,但至少在 Linux 上可能会发生这种情况)。该线程由于其零读取而关闭套接字。在此之后不久的某个时刻,发送线程将被重新唤醒,但大概内核注意到套接字在从阻塞返回之前已关闭send()并返回EBADF

现在这只是对确切原因的猜测——除其他外,它在很大程度上取决于您的平台。但你可以看到这是怎么发生的。

最简单的解决方案可能也是poll()在发送线程中使用,但要等待套接字变为可写而不是读就绪。显然,您还需要等到有任何缓冲数据要发送 - 您如何做到这一点取决于哪个线程缓冲数据。该poll()调用将让您通过使用 标记来检测连接何时关闭POLLHUP,您可以在尝试使用send().

send()作为一般规则,在您确定发送缓冲区已完全刷新之前,您不应该关闭套接字 - 只有在调用返回并指示所有剩余数据都已用完时,您才能确定这一点。我过去通过在读取为零时检查发送缓冲区来处理这个问题,如果它不为空,我设置一个“关闭”标志。在您的情况下,一旦所有内容都被刷新,发送线程将使用它作为关闭的提示。这很重要,因为如果远程端半关闭,shutdown()那么即使它可能仍在读取,您也会得到零读数。但是,您可能不在乎半关闭,在这种情况下,您的上述策略是可以的。

最后,我个人会避免发送和接收线程的麻烦,并且只使用一个线程来完成这两者 - 这或多或少是 and 的要点select()poll()以允许单个执行线程处理一个或多个文件句柄而不必担心执行阻塞和饿死其他连接的操作。

于 2013-03-13T00:43:31.743 回答
4

发现了问题。这是我的循环。请注意,这是一个无限循环。当我没有剩余要发送时,我的 sentSize 为 0,但我仍会循环尝试发送更多。此时,另一个线程已经关闭了这个线程,所以我的 0 字节发送调用返回错误。

我通过更改循环以在 sendSize 为 0 时停止循环来修复它,它解决了问题!

于 2013-03-13T01:29:05.233 回答