有一个应用程序应该读取每个注册用户的用户推文,处理它们并存储数据以供将来使用。它可以通过 2 种方式访问 Twitter:REST API(每 x 分钟轮询一次 twitter),或者使用它的 Streaming API 来获取推文。
除了服务器端完全不同的实现之外,我想知道对服务器端的其他影响是什么?
假设应用程序有成千上万的用户。为每个用户构建一种队列和轮询 twitter(最简单的场景)更好,还是使用 Streaming API 并为每个用户保持 HTTP 连接打开更好?我有点担心后者,因为它需要保持大量的连接一直打开。有什么我不知道的缺点吗?如果我想在 Heroku 或 EC2 实例上部署我的应用程序,可以吗?或者有任何限制吗?
在其他不断需要为每个用户获取数据的应用程序中是如何完成的?