-1

我正在做一个项目,我想提取大约 500 个不同 Twitter 用户的时间线(我用它来进行历史分析,所以我只需要检索一次 - 无需使用传入的推文进行更新)。

虽然我知道 Twitter API 只允许检索最后 3,200 条推文,但当我使用 R twitteR 包的基本 UserTimeline 方法时,我似乎每次尝试只获取大约 20 条(对于拥有更多、最近的推文的用户) )。这是因为速率限制,还是因为我做错了什么?

有没有人有最有效地做到这一点的提示?我意识到由于速率限制可能需要很多时间,有没有办法在 R 中自动化/迭代这个过程?

我很困惑,所以非常感谢您提供的任何帮助/提示!

(我有一些使用 Twitter API/twitteR 包在几天内使用某个主题标签提取推文的经验。我有基本的 Python 技能,如果用 Python 更容易/更快地做到这一点)。

4

1 回答 1

0

看起来twitteR 文档建议使用maxID分页参数。因此,当您获得第一批结果时,您可以使用该集合中的最小 ID 减一作为maxID下一个请求的 ID,直到您不再获得任何结果(意味着您已经到达用户时间线的开头)。

于 2016-04-12T19:13:37.640 回答