1

我是 Python 新手(尽管我已经用 Java 编程多年了),我正在开发一个简单的基于套接字的网络应用程序(只是为了好玩)。这个想法是我的代码连接到一个远程 TCP 端点,然后侦听从服务器推送到客户端的任何数据,并对此执行一些解析。

从服务器 -> 客户端推送的数据是 UTF-8 编码的文本,每行由CRLF( \x0D\x0A) 分隔。你可能已经猜到了:这个想法是客户端连接到服务器(直到被用户取消),然后读取并解析进入的行。

我已经设法让它发挥作用,但是,我不确定我这样做的方式是否正确。因此,我的实际问题(要遵循的代码):

  1. 这是在 Python 中执行此操作的正确方法吗(即真的这么简单吗)?
  2. 关于缓冲区/的任何提示/技巧/有用资源(除了参考文档)asyncore

目前,正在读取和缓冲数据,如下所示:

def handle_read(self):
    self.ibuffer = b""

    while True:
        self.ibuffer += self.recv(self.buffer_size)
        if ByteUtils.ends_with_crlf(self.ibuffer):
            self.logger.debug("Got full line including CRLF")
            break
        else:
            self.logger.debug("Buffer not full yet (%s)", self.ibuffer)

    self.logger.debug("Filled up the buffer with line")
    print(str(self.ibuffer, encoding="UTF-8"))

ByteUtils.ends_with_crlf函数仅检查缓冲区的最后两个字节是否存在\x0D\x0A. 第一个问题是主要问题(答案基于此),但任何其他想法/提示都值得赞赏。谢谢。

4

2 回答 2

6

TCP 是一个流,不能保证缓冲区不会包含一条消息的结尾和下一条消息的开头。因此,在缓冲区末尾检查 \n\r 不会在所有情况下都按预期工作。您必须检查流中的每个字节。

而且,我强烈建议您使用 Twisted 而不是 asyncore。像这样的东西(根据记忆,可能无法开箱即用):

from twisted.internet import reactor, protocol
from twisted.protocols.basic import LineReceiver


class MyHandler(LineReceiver):

    def lineReceived(self, line):
        print "Got line:", line


f = protocol.ClientFactory()
f.protocol = MyHandler
reactor.connectTCP("127.0.0.1", 4711, f)
reactor.run()
于 2009-11-26T18:12:12.210 回答
6

它甚至更简单——查看asynchat及其set_terminator方法(以及该模块中的其他有用的花絮)。 Twisted更丰富、更强大几个数量级,但是,对于足够简单的任务,asyncore 和 asynchat(旨在顺利互操作)确实非常易于使用,正如您已经开始观察的那样。

于 2009-11-26T18:16:25.023 回答