在使用协议缓冲区连接到我的 riak AWS 集群时,我看到 Python Riak 客户端出现了一种奇怪但一致的行为。这个简短的 python 片段会产生错误:
import time
import riak
client = riak.RiakClient(
host='address_to_my_cluster_goes_here',
http_port=8098,
pb_port=8087,
protocol='pbc'
)
result = client.ping()
# Do something else for a while, > 60 seconds
time.sleep(61)
result = client.ping()
最后一次 ping 总是抛出异常,并带有以下回溯:
Traceback (most recent call last):
File "main_causing_exception.py", line 16, in <module>
result = client.ping()
File "C:\temp\venv\lib\site-packages\riak\client\transport.py", line 127, in wrapper
return self._with_retries(pool, thunk)
File "C:\temp\venv\lib\site-packages\riak\client\transport.py", line 69, in _with_retries
return fn(transport)
File "C:\temp\venv\lib\site-packages\riak\client\transport.py", line 125, in thunk
return fn(self, transport, *args, **kwargs)
File "C:\temp\venv\lib\site-packages\riak\client\operations.py", line 92, in ping
return transport.ping()
File "C:\temp\venv\lib\site-packages\riak\transports\pbc\transport.py", line 95, in ping
msg_code, msg = self._request(MSG_CODE_PING_REQ)
File "C:\temp\venv\lib\site-packages\riak\transports\pbc\connection.py", line 43, in _request
return self._recv_msg(expect)
File "C:\temp\venv\lib\site-packages\riak\transports\pbc\connection.py", line 50, in _recv_msg
self._recv_pkt()
File "C:\temp\venv\lib\site-packages\riak\transports\pbc\connection.py", line 71, in _recv_pkt
% len(nmsglen))
riak.RiakError: 'Socket returned short packet length 0 - expected 4'
如果我client.ping()
每 30 秒左右执行一次,则不会发生错误,这表明这是我看到的某种套接字保持活动问题,但这似乎不是一个对于生产环境来说足够强大的解决方案。
该错误仅在使用协议设置时发生,而在使用配置的 Riak Python 客户端pbc
时我从未见过它。http
我在具有以下软件包和版本的虚拟环境中在 Win7-64 平台上使用 Python 2.7.5(尽管错误也发生在我们的 Ubuntu 开发服务器上):
- protobuf (2.4.1)
- 里亚克 (2.0.1)
- riak-pb (1.4.1.1)
关于发生了什么以及如何解决它的任何想法?我是否以错误的方式使用 Python Riak 客户端?