我目前正在使用 tweepy lib 和 python (2.7.3) 为我的项目使用 twitter 流 API。我收到的数据率非常高。有没有可能放慢速度?我在某处读到 Twitter 不喜欢将流媒体延迟太久的想法。
我想做的另一件事是引入数据,假设 5 分钟,然后在 5 分钟后整理数据(基于任何事情!例如主题标签的字数等)。但我认为这会减慢我的流媒体播放速度(因为我正在使用一个进程)。
那么,您能提出一种处理方法吗?多线程?多处理?
我目前正在使用 tweepy lib 和 python (2.7.3) 为我的项目使用 twitter 流 API。我收到的数据率非常高。有没有可能放慢速度?我在某处读到 Twitter 不喜欢将流媒体延迟太久的想法。
我想做的另一件事是引入数据,假设 5 分钟,然后在 5 分钟后整理数据(基于任何事情!例如主题标签的字数等)。但我认为这会减慢我的流媒体播放速度(因为我正在使用一个进程)。
那么,您能提出一种处理方法吗?多线程?多处理?
您可以使用多线程方法,让我们将此问题视为“生产者-消费者问题” http://en.wikipedia.org/wiki/Producer-consumer_problem,其中生产者将是主线程,在 5 分钟内填充缓冲区,然后另一个线程将消耗缓冲区(以某种方式处理它)。