python - 如何使用 R 从多个用户的时间轴中提取所有推文？

Question

我正在做一个项目，我想提取大约 500 个不同 Twitter 用户的时间线（我用它来进行历史分析，所以我只需要检索一次 - 无需使用传入的推文进行更新）。

虽然我知道 Twitter API 只允许检索最后 3,200 条推文，但当我使用 R twitteR 包的基本 UserTimeline 方法时，我似乎每次尝试只获取大约 20 条（对于拥有更多、最近的推文的用户））。这是因为速率限制，还是因为我做错了什么？

有没有人有最有效地做到这一点的提示？我意识到由于速率限制可能需要很多时间，有没有办法在 R 中自动化/迭代这个过程？

我很困惑，所以非常感谢您提供的任何帮助/提示！

（我有一些使用 Twitter API/twitteR 包在几天内使用某个主题标签提取推文的经验。我有基本的 Python 技能，如果用 Python 更容易/更快地做到这一点）。

score 0 · Accepted Answer

看起来twitteR 文档建议使用maxID分页参数。因此，当您获得第一批结果时，您可以使用该集合中的最小 ID 减一作为maxID下一个请求的 ID，直到您不再获得任何结果（意味着您已经到达用户时间线的开头）。

1 回答 1