python - 使用异步读取套接字缓冲区

Question

我是 Python 新手（尽管我已经用 Java 编程多年了），我正在开发一个简单的基于套接字的网络应用程序（只是为了好玩）。这个想法是我的代码连接到一个远程 TCP 端点，然后侦听从服务器推送到客户端的任何数据，并对此执行一些解析。

从服务器 -> 客户端推送的数据是 UTF-8 编码的文本，每行由CRLF( \x0D\x0A) 分隔。你可能已经猜到了：这个想法是客户端连接到服务器（直到被用户取消），然后读取并解析进入的行。

我已经设法让它发挥作用，但是，我不确定我这样做的方式是否正确。因此，我的实际问题（要遵循的代码）：

这是在 Python 中执行此操作的正确方法吗（即真的这么简单吗）？
关于缓冲区/的任何提示/技巧/有用资源（除了参考文档）asyncore？

目前，正在读取和缓冲数据，如下所示：

def handle_read(self):
    self.ibuffer = b""

    while True:
        self.ibuffer += self.recv(self.buffer_size)
        if ByteUtils.ends_with_crlf(self.ibuffer):
            self.logger.debug("Got full line including CRLF")
            break
        else:
            self.logger.debug("Buffer not full yet (%s)", self.ibuffer)

    self.logger.debug("Filled up the buffer with line")
    print(str(self.ibuffer, encoding="UTF-8"))

该ByteUtils.ends_with_crlf函数仅检查缓冲区的最后两个字节是否存在\x0D\x0A. 第一个问题是主要问题（答案基于此），但任何其他想法/提示都值得赞赏。谢谢。

score 6 · Accepted Answer

TCP 是一个流，不能保证缓冲区不会包含一条消息的结尾和下一条消息的开头。因此，在缓冲区末尾检查 \n\r 不会在所有情况下都按预期工作。您必须检查流中的每个字节。

而且，我强烈建议您使用 Twisted 而不是 asyncore。像这样的东西（根据记忆，可能无法开箱即用）：

from twisted.internet import reactor, protocol
from twisted.protocols.basic import LineReceiver


class MyHandler(LineReceiver):

    def lineReceived(self, line):
        print "Got line:", line


f = protocol.ClientFactory()
f.protocol = MyHandler
reactor.connectTCP("127.0.0.1", 4711, f)
reactor.run()

score 6 · Accepted Answer

它甚至更简单——查看asynchat及其set_terminator方法（以及该模块中的其他有用的花絮）。 Twisted更丰富、更强大几个数量级，但是，对于足够简单的任务，asyncore 和 asynchat（旨在顺利互操作）确实非常易于使用，正如您已经开始观察的那样。

python - 使用异步读取套接字缓冲区

2 回答 2

Related

Reference