最近我使用 python 和 redis 构建了一个 smarl 消息驱动的项目。我使用一个线程订阅redis通道(这里称为消息线程);定时器线程;和一个工作线程;当消息线程收到足够的消息时,它会向工作人员发布一个任务。我使用redis-py与 redis 通信
留言主题:
订阅redis;
while True:
get message;
if len(messages)>threashold: post task to Worker
工作线程:
while True:
wait task event;
do task; //this may be heavy
问题来了:经过一段时间的工作,redis-py subpub被阻塞了!(ofcource redis仍然是发布消息,但它不再返回,它只是被阻塞了!)。我使用 gdb 附加到它,我看到这样的堆栈帧:
[切换到线程 4 (Thread 1084229984 (LWP 9812))]#0 0x000000302b80b0cf in __read_nocancel () from /lib64/tls/libpthread.so.0 (gdb) bt 0 0x000000302b80b0cf in __read_nocancel () from /lib64/tls/libpthread.所以.0
1 posix_read 中的 0x00000000004e129a(self=变量“self”不可用。) at./Modules/posixmodule.c:6592
2 0x00000000004a04c5 in PyEval_EvalFrameEx (f=0x157a8c0, throwflag=Variable "throwflag" is not available.) at Python/ceval.c:4323
我什至使用redis'client kill'命令来终止python和redis之间的连接,但是python仍然阻塞在那里,永远不会返回或引发异常。唯一的方法是杀死python进程使用kill -9。
然后我评论了工作的“做任务”过程(记住这个任务很重,它使网络 io、cpu 计算繁重),它运行良好,没有问题。
因此,似乎得出了结论:一旦我使用工作者执行任务,消息线程将在套接字读取时阻塞。
怎么会这样!!