0

我正在使用 rtweet 的函数 get_timeline 来下载推文。但是,我感兴趣的一些用户的数量远远超过允许下载的 3200 条推文(有些用户大约有 47000 条)。有“retryonratelimit”参数,如果你是根据单词或主题标签下载推文,因此我想知道是否有类似的方法可以从一个用户那里获得超过 3200 条推文?

4

1 回答 1

0

文档 - 请参阅 ?get_timeline- 包含指向GET statuses/user_timeline 的 Twitter 开发人员文档的链接。R 函数只是一个包装器。

如果您随后点击使用时间线的链接,您将找到对max_id parameter.

那么基本的方法是:

  1. 获得前 3200 条推文
  2. 使用类似的东西获取最早的状态IDmin(as.numeric(zanetti$status_id))
  3. 再次运行get_timeline设置max_id = ID其中 ID 是步骤 2 中的 ID

注意:我刚刚使用自己的时间线进行了尝试,第 3 步只返回了 40 条推文。因此,您可能还需要等待适当的时间以避免速率限制。请注意,Twitter 基本上尽其所能阻止您通过 API 请求大量数据 - 归根结底,您想要的可能无法实现。

于 2019-04-29T00:06:41.360 回答