r - 使用“rtweet”库的“search_tweets”功能停止下载

Question

我正在尝试使用 rtweet-package 从某个主题标签下载一些推文。我使用了一个名为 OpenCodez 的地方的指南，但遇到了问题

使用 rtweet-package 的“search_tweets”功能，我不能下载超过 5 条推文，而 rtweet 的限制应该在 18.000 条左右。

我没有收到任何错误，但运行我的脚本时的“正在下载”图形只是停止在 10%（尝试下载 n=2000 时）。

我试过使用“retryonratelimit = TRUE”但没有运气。我已经重置了我的脚本，尝试了不同的教程来建立连接——一切都很好——直到我真正使用了 search_tweets 函数。

所以这是我连接到 API 的代码：

api_key <- "xxxx"
api_secret_key <- "xxxx"
access_token <- "xxxx"
access_token_secret <- "xxxx"

## authenticate via web browser
token <- create_token(
  app = "xxxx",
  consumer_key = api_key,
  consumer_secret = api_secret_key,
  access_token = access_token,
  access_secret = access_token_secret)

这是我的“刮刀”：

my_tweets = search_tweets("#vmd19", n=2000, lang='en')

结果数据框只有 5 列，这很奇怪，而主题标签下应该至少有几百条推文。我尝试了不同的查询（主题标签等），但没有运气。下载停止看起来像这样：

Downloading [===>-------------------------------------]  10%

我无法弄清楚我做错了什么。希望有人可以帮我解决这个问题！

score 2 · Accepted Answer

此问题已在此处解决：https ://github.com/ropensci/rtweet/issues/364

看起来是因为您可以从中收集推文的窗口（大约上周）。如果该时间窗口中可用的推文数量小于 search_tweets 函数中的 n，它将在达到 100% 之前被删除。因此，如果您要求 100 条带有某个词的推文，而该词在上周仅发了 7 次推文，它将以 7% 的速度停止下载。

r - 使用“rtweet”库的“search_tweets”功能停止下载

1 回答 1

Related

Reference