Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
在这个用例中,我需要监控 Twitter 流中是否有带有特定主题标签的推文,然后将这些推文拉出来并存储起来。我为此使用 Twitter4J 和 Twitters Streaming API。监控的标签经常变化,所以我想每 10 分钟左右刷新一次过滤器。当我刷新时,我只是从数据层中提取所有新的哈希标签并将它们传递给过滤器查询。我的两个问题:
每 10 分钟停止连接并刷新一次(在 Twitter 速率限制等方面)有什么问题吗?
有什么可以防止我丢失在短暂刷新暂停期间发出的推文吗?
提前致谢。
您重新连接的频率不应超过每十分钟一次,否则您可能会受到速率限制。您可以在断开旧连接之前建立新连接,这有助于避免数据丢失。请注意,您一次可能只有一个未完成的连接。