我目前正在使用此库对我设置的 kafka 服务器进行压力测试:https ://github.com/dsully/pykafka
import kafka
import time
def test_kafka_server(n=1):
for i in range(0,n):
producer = kafka.producer.Producer('test',host='10.137.8.192')
message = kafka.message.Message(str(time.time()))
producer.send(message)
producer.disconnect()
def main():
test_kafka_server(100000)
if __name__ == '__main__':
main()
最终发生的事情是我最终使我自己的本地机器超载。
我收到错误 10055,根据谷歌的说法,这意味着“Windows 已用完 TCP/IP 套接字缓冲区,因为同时打开了太多连接。” 根据 netstat, producer.disconnect() 不是关闭套接字,而是将其置于TIME_WAIT
状态。
ipython 调试器指向这一行:
C:\Python27\lib\socket.pyc in meth(name, self, *args)
222 proto = property(lambda self: self._sock.proto, doc="the socket protocol")
223
--> 224 def meth(name,self,*args):
225 return getattr(self._sock,name)(*args)
226
作为罪魁祸首,但这似乎会使事情变得比我感到舒服的要低。
我已经搜索并发现这个Python 套接字没有正确关闭连接,建议这样做:
setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
所以,我在 io.py 文件中使用该选项重建了 pykafka 库:
def connect(self):
""" Connect to the Kafka server. """
global socket
self.socket = socket.socket()
self.socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
self.socket.connect((self.host, self.port))
我仍然得到同样的错误。
我没有把 setsockopt 线放在正确的位置吗?还有什么我可以尝试的吗?