6

我有一个用 Python 编写的用于服务器的客户端,它通过 LAN 运行。该算法的某些部分密集使用套接字读取,它的执行速度比用 C++ 编写的几乎相同的算法慢 3-6 倍。有哪些解决方案可以让 Python 套接字读取更快?

我实现了一些简单的缓冲,我使用套接字的类如下所示:

import socket
import struct

class Sock():
    def __init__(self):
        self.s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        self.recv_buf = b''
        self.send_buf = b''

    def connect(self):
        self.s.connect(('127.0.0.1', 6666))

    def close(self):
        self.s.close()

    def recv(self, lngth):
        while len(self.recv_buf) < lngth:
                self.recv_buf += self.s.recv(lngth - len(self.recv_buf))

        res = self.recv_buf[-lngth:]
        self.recv_buf = self.recv_buf[:-lngth]
        return res

    def next_int(self):
        return struct.unpack("i", self.recv(4))[0]

    def next_float(self):
        return struct.unpack("f", self.recv(4))[0]

    def write_int(self, i):
        self.send_buf += struct.pack('i', i)

    def write_float(self, f):
        self.send_buf += struct.pack('f', f)

    def flush(self):
        self.s.sendall(self.send_buf)
        self.send_buf = b''

PS:分析还表明大部分时间都花在了读取套接字上。

编辑:因为数据是在已知大小的块中接收的,所以我可以一次读取整个块。因此,我将代码更改为:

class Sock():
    def __init__(self):
        self.s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        self.send_buf = b''

    def connect(self):
        self.s.connect(('127.0.0.1', 6666))

    def close(self):
        self.s.close()

    def recv_prepare(self, cnt):
        self.recv_buf = bytearray()
        while len(self.recv_buf) < cnt:
            self.recv_buf.extend(self.s.recv(cnt - len(self.recv_buf)))

        self.recv_buf_i = 0

    def skip_read(self, cnt):
        self.recv_buf_i += cnt

    def next_int(self):
        self.recv_buf_i += 4
        return struct.unpack("i", self.recv_buf[self.recv_buf_i - 4:self.recv_buf_i])[0]

    def next_float(self):
        self.recv_buf_i += 4
        return struct.unpack("f", self.recv_buf[self.recv_buf_i - 4:self.recv_buf_i])[0]

    def write_int(self, i):
        self.send_buf += struct.pack('i', i)

    def write_float(self, f):
        self.send_buf += struct.pack('f', f)

    def flush(self):
        self.s.sendall(self.send_buf)
        self.send_buf = b''

recv'ing from socket 在这段代码中看起来是最佳的。但现在next_intnext_float成为第二个瓶颈,它们每次调用大约需要 1 毫秒(3000 个 CPU 周期)来解包。是否有可能让它们更快,就像在 C++ 中一样?

4

1 回答 1

3

您最新的瓶颈在于next_intandnext_float因为您从 and 创建中间字符串bytearray,因为您一次只解压缩一个值。

struct模块有一个unpack_from带缓冲区和偏移量的模块。这更有效,因为无需从您的 : 创建中间字符串bytearray

def next_int(self):
    self.recv_buf_i += 4
    return struct.unpack_from("i", self.recv_buf, self.recv_buf_i-4)[0]

此外,struct模块一次可以解包多个值。目前,您为每个值从 Python 调用 C(通过模块)。通过减少调用它的次数并让它在每次调用中做更多的工作,你会得到更好的服务:

def next_chunk(self, fmt): # fmt can be a group such as "iifff" 
    sz = struct.calcsize(fmt) 
    self.recv_buf_i += sz
    return struct.unpack_from(fmt, self.recv_buf, self.recv_buf_i-sz)

如果您知道这fmt将始终是 4 字节整数和浮点数,您可以替换struct.calcsize(fmt)4 * len(fmt).

最后,作为一个偏好问题,我认为这读起来更干净:

def next_chunk(self, fmt): 
    sz = struct.calcsize(fmt) 
    chunk = struct.unpack_from(fmt, self.recv_buf, self.recv_buf_i)
    self.recv_buf_i += sz
    return chunk
于 2012-05-26T04:20:03.933 回答