我正在使用 rtweet 的函数 get_timeline 来下载推文。但是,我感兴趣的一些用户的数量远远超过允许下载的 3200 条推文(有些用户大约有 47000 条)。有“retryonratelimit”参数,如果你是根据单词或主题标签下载推文,因此我想知道是否有类似的方法可以从一个用户那里获得超过 3200 条推文?
问问题
1826 次
1 回答
0
文档 - 请参阅 ?get_timeline
- 包含指向GET statuses/user_timeline
的 Twitter 开发人员文档的链接。R 函数只是一个包装器。
如果您随后点击使用时间线的链接,您将找到对max_id parameter
.
那么基本的方法是:
- 获得前 3200 条推文
- 使用类似的东西获取最早的状态ID
min(as.numeric(zanetti$status_id))
- 再次运行
get_timeline
设置max_id = ID
其中 ID 是步骤 2 中的 ID
注意:我刚刚使用自己的时间线进行了尝试,第 3 步只返回了 40 条推文。因此,您可能还需要等待适当的时间以避免速率限制。请注意,Twitter 基本上尽其所能阻止您通过 API 请求大量数据 - 归根结底,您想要的可能无法实现。
于 2019-04-29T00:06:41.360 回答