4

我有一些代码将连接到主机,除了侦听传入数据之外什么都不做,直到客户端关闭或主机发送关闭语句。为此,我的代码运行良好。

但是,当主机在没有发送关闭语句的情况下死亡时,我的客户端会按预期一直监听传入的数据。为了解决这个问题,我每隔 foo 秒设置一次套接字超时,并开始检查连接是否处于活动状态。从 Python socket howto 我发现了这个:

select 的一个非常讨厌的问题:如果在这些套接字的输入列表中的某个地方是一个已经严重死亡的套接字,则 select 将失败。然后,您需要遍历所有这些列表中的每个该死的套接字并执行 select([sock],[],[],0) 直到找到坏的。超时 0 意味着它不会花费很长时间,但它很丑陋。

    # Example code written for this question.
    from select import select
    from socket include socket, AF_INET, SOCK_STREAM

    socket = socket(AF_INET, SOCK_STREAM)
    socket.connect(('localhost', 12345))
    socklist = [socket,]
    attempts = 0

    def check_socklist(socks):
        for sock in socklist:
            (r, w, e) = select([sock,], [], [], 0)          

            ...
            ...
            ...

    while True:

        (r, w, e) = select(socklist, [], [], 60)

        for sock in r:      
            if sock is socket:
                msg = sock.recv(4096)
                if not msg:
                    attempts +=1
                    if attempts >= 10:
                        check_socket(socklist)
                    break
                else:
                    attempts = 0
                    print msg

本文提出了三个问题。

  1. 我被教导要检查连接是否处于活动状态,必须写入套接字并查看响应是否返回。如果不是,则必须假定连接已死。在文本中它说要检查不良连接,一个单独的每个套接字,将它传递给选择的第一个参数并将超时设置为零。这将如何确认套接字是否已死?
  2. 为什么不通过尝试写入套接字来测试套接字是死的还是活的呢?
  3. 当连接活跃和死亡时,我在寻找什么?Select 将立即超时,因此没有数据将证明什么都没有。

我意识到有类似的库,gevent这可以帮助我解决这个问题,但我选择自己做这个,以便更好地了解正在发生的事情并更好地控制我自己的来源。asyncoretwisted

4

2 回答 2

4

如果连接的客户端崩溃或退出,但其主机操作系统和计算机仍在运行,则其操作系统的 TCP 堆栈将向您的服务器发送一个 FIN 数据包,让您的计算机的 TCP 堆栈知道 TCP 连接已关闭。您的 Python 应用程序会将此视为 select(),表示客户端的套接字已准备好读取,然后当您在套接字上调用 recv() 时,recv() 将返回 0。发生这种情况时,您应该通过关闭来响应插座。

另一方面,如果连接的客户端的计算机永远没有机会发送 FIN 数据包(例如,因为有人伸手将其以太网线或电源线从插座中拔出),那么您的服务器将不会意识到 TCP 连接已经失效了很长一段时间——可能永远。避免出现“僵尸套接字”的最简单方法就是让您的服务器每隔一段时间在套接字上发送一些虚拟数据,例如每分钟一次或某事。客户端应该知道丢弃虚拟数据。发送虚拟数据的好处是您的服务器的 TCP 堆栈会注意到它没有为它发送的数据包返回任何 ACK 数据包,并将重新发送它们;并且在重新发送几次后,您的服务器的 TCP 堆栈将放弃并决定连接已死,此时您'

于 2013-11-06T00:10:54.013 回答
0
  1. 如果您向套接字写入内容然后等待检查连接的答案,则服务器应支持此“ping”消息。并非总是如此。否则,如果服务器不等待此消息,服务器应用程序可能会自行崩溃或断开您的客户端。如果 select 以您描述的方式失败,则套接字框架知道哪个套接字已死。你只需要找到它。但是,如果套接字因服务器应用程序崩溃等令人讨厌的死亡而死亡,这并不意味着客户端的套接字框架必须检测到这一点。例如,在客户端等待来自服务器的一些消息并且服务器崩溃的情况下,在某些情况下客户端可以永远等待。例如Putty,为了避免这种情况,可以使用服务器的应用程序的协议级ping(SSH ping选项)来检查连接;
  2. (见第 1 页)。
  3. 你是对的,选择的超时并且没有数据证明什么。As documentation says you have to check every socket when select fails.
于 2013-11-05T23:42:12.430 回答