我遇到了一个奇怪的 TCP 套接字错误。似乎SO_KEEPALIVE
默认情况下在所有套接字上启用。
我写了一个简短的测试用例来创建一个套接字并连接到服务器。连接后,我立即检查SO_KEEPALIVE
. getsockopt
该值非零,根据 MSDN,这意味着启用了保持活动。也许我误解了这一点。
我最近遇到了一个奇怪的错误,即服务器连续两次断开连接。一些客户端处于已发送登录信息并等待响应的状态。即使有一个重叠WSARecv
发布到连接到服务器的套接字,也没有发布完成以通知客户端服务器崩溃,所以我假设套接字没有完全关闭。
大约 2 小时后(实际上是大约 1 小时 59 分 19 秒),一个完成数据包被发布用于读取,通知客户端连接不再打开。这是我开始怀疑的地方SO_KEEPALIVE
。
我试图理解为什么会这样。这引起了一些问题,因为出于任何原因失去连接的客户端都应该自动重新连接到服务器;在这种情况下,由于没有通知断开连接,客户端直到 2 小时后才重新连接。
一个明显的解决方法是设置超时,但我想知道这种情况是如何发生的。
SO_KEEPALIVE
我的应用程序服务器或客户端未在套接字上设置。
// Error checking is removed for this snippet, but all winsock calls succeed.
int main() {
WORD wVersionRequested;
WSADATA wsaData;
int err;
wVersionRequested = MAKEWORD(2, 2);
err = WSAStartup(wVersionRequested, &wsaData);
SOCKET foo = WSASocket(AF_INET, SOCK_STREAM, IPPROTO_TCP, 0, 0, 0);
DWORD optval;
int optlen = sizeof(optval);
int test = 0;
test = getsockopt(foo, SOL_SOCKET, SO_KEEPALIVE, (char*)&optval, &optlen);
std::cout << "Returned " << optval << std::endl;
sockaddr_in clientService;
clientService.sin_family = AF_INET;
clientService.sin_addr.s_addr = inet_addr("127.0.0.1");
clientService.sin_port = htons(446);
connect(foo, (SOCKADDR*) &clientService, sizeof(clientService));
test = getsockopt(foo, SOL_SOCKET, SO_KEEPALIVE, (char*)&optval, &optlen);
std::cout << "Returned " << optval << std::endl;
std::cin.get();
return 0;
}
// Example output:
// Returned 2883584
// Returned 2883584