1

使用 pyarrow 作为 pandas 数据帧的快速内存存储实现基于多进程的消费者生产者模式的最佳方法是什么?

目前我正在使用 redis pub sub 但我认为可能有更有效(更快)的解决方案?你能举个例子吗?

4

1 回答 1

1

列表解决方案:

生产者将数据放入列表中,LPUSH
消费者使用RPOPBRPOP(阻塞)从该列表中获取数据。

限制:只有一个消费者阅读该消息。如果您有 2 个,则只有其中一个会看到该消息。

速度:对于一对消费者-生产者,它将具有相同的速度。消费者越多(对于这个或其他列表),它会比 pub/sub 更快。

于 2018-07-23T12:45:10.097 回答