对于一个研究项目,我正在使用 Python-Twitter 收集推文。然而,当我们在一台计算机上不间断地运行我们的程序一周时,我们每周只能收集大约 20 MB 的数据。我只在一台机器上运行这个程序,这样我们就不会两次收集相同的推文。
我们的程序运行一个循环,每 60 秒调用一次 getPublicTimeline()。我试图通过对出现在公共时间线中的一些用户调用 getUserTimeline() 来改进这一点。然而,这一直让我每次都被禁止收集大约半小时的推文。即使没有禁令,添加此代码似乎也几乎没有加速。
我知道 Twitter 的“白名单”允许用户每小时提交更多请求。我大约三周前申请了这个,从那以后就没有收到回音,所以我正在寻找替代方案,使我们的程序能够更有效地收集推文,而不会超过标准速率限制。有谁知道从 Twitter 收集公共推文的更快方法?我们希望每周获得大约 100 MB。
谢谢。