问题标签 [rtweet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
425 浏览

r - 使用 rtweet 包下载推文似乎停止在 8%。为什么?

我正在使用该rtweet包来检索特定主题标签上的推文。

我的R代码如下:

但是,RStudio当我执行代码时显示以下行:

然后它结束执行,上面的消息仍然显示 8%。

nrow(rt)告诉我 1,250

注意:当我执行代码时,rtweet将我定向到我的网络浏览器,然后我通过网络浏览器进行了身份验证。

我在这里做错了什么?

0 投票
1 回答
344 浏览

r - 大型 JSON 对象解析失败 (rtweet)

我正在尝试使用parse_stream()rwteet 库中的函数函数解析大型 JSON 文件。它因长 JSON 对象而失败。

此 JSON 对象在具有相当大的大小 (200MB-1GB) 时往往会产生错误。我的流功能看起来像这样。

我没有启用该parse = TRUE参数,因为在文档中它说不建议在大型 JSON 对象中使用。无论如何,我也尝试过流式传输,但parse = TRUE也失败了parse_stream()。我得到的错误是以下错误:

我以为是两个大括号之间的双逗号。我使用ctrl+f搜索了 Atom字符串ELDkx4-i7ysCAR_.mp4?tag=10"},唯一的结果是没有,,.

为什么我得到这个解析错误,有人遇到同样的问题并以某种方式修复它吗?

0 投票
1 回答
943 浏览

r - 在 R 中使用 Rtweet 的 search_fullarchive

我正在尝试使用在 Twitter Developer 注册的高级令牌来使用rtweet' 。search_fullarchive但是,我收到以下错误消息:

警告:list(message = "Forbidden: Authentication failed but account is not authorized to access this resource.", sent = "2019-07-14T14:30:11+00:00", transactionId = "xxxxxxxxxx")

我该如何解决这个问题?我编码的方式有错误吗?

httr我通过使用'sPOST方法对其进行测试来确保我的令牌运行良好,并且运行良好。

我还使用普通的 search_tweets 测试了我的令牌,并且工作正常。

我期望一个 tibble 数据框通常是 Rtweet 的回报。然而,这是我收到的:

"警告: list(message = "Forbidden: 身份验证成功但帐户无权访问此资源。", sent = "2019-07-14T14:30:11+00:00", transactionId = "xxxxxxxxxx")" 数据0 列 0 行的框架

0 投票
0 回答
86 浏览

r - 有没有办法从 rtweet 包中个性化/定义 lookup_coords 的 bbox 或 latlong?

我想进行 Twitter 搜索,指定位置。我正在使用 rtweet 包。但是,当我为委内瑞拉国家或加拉加斯市打印“lookup_coords”函数时,没有结果。我遵循了以前帖子中的所有建议,但没有任何帮助。我有自己的 Google Api Key 我正在使用 R,Windows 7。

是否有可能自行定义坐标并将其分配给“search_tweets”函数?我怎么知道命名世界上每个城市或国家的正确语法是什么?某处有清单吗?

结果是:

当我检查 API 时,一切正常:

0 投票
0 回答
75 浏览

r - 为什么从 Twitter 挖掘的数据在保存到数据帧后表现不同?

我使用包对 Twitter 数据进行了文本挖掘rtweet,但在将其保存到数据框后,我无法充分利用包等ggplot2功能。我究竟做错了什么?

我使用该库对一些 twitter 数据进行了文本挖掘rtweet,并且部分进行了挖掘,因此我不会超过 API 限制。在收集了我需要的所有数据后,我将它们全部合并到一个数据框中。我下载了dplyrggplot2包,并希望随着时间的推移可视化推文,但时间变量来自数据框时无法识别。但是,如果我使用其中一批原始名称的挖掘数据,它会被识别为时间变量并且绘制得很好。这是我用来挖掘数据、将其保存到数据帧并将它们全部组合成一个数据帧的代码。

错误:StatBin 需要一个连续的 x 变量:x 变量是离散的。也许你想要 stat="count"?

在转换为数据帧之前与其中一个挖掘批次相同的代码

在最后一个 ggplot 之后,我得到了一个不错的条形图,其中包含随时间推移的推文

当我尝试使用dplyr按时间过滤推文时会发生类似的事情,但在放入数据框之前可以很好地处理挖掘的数据

seq.POSIXt(data[[dtvar]][1], data[[dtvar]][length(data[[dtvar]])], 中的错误:'to' 的长度必须为 1 另外:警告消息:1 : 在 Ops.factor(created_at, "2018-01-01") : '>=' 对因子 2 没有意义:因子screen_name包含隐式 NA,考虑使用forcats::fct_explicit_na 3:因子screen_name包含隐式 NA,考虑使用forcats::fct_explicit_na 4:因子screen_name包含隐式 NA,考虑使用forcats::fct_explicit_na

0 投票
0 回答
294 浏览

r - readRDS(x) 中的错误:从连接中读取错误

我正在使用rtweet带有以下命令的包:

readRDS(x) 中的错误:从连接中读取错误

想知道如何解决这个问题。谢谢

我的会话信息是

0 投票
1 回答
325 浏览

r - 无法使用包 rtweet 创建创建令牌,文件 '.rtweet_token.rds' 有问题

我正在使用 rtweet 包从 twitter 获取数据。但是,当我尝试创建 create_token 时出现问题。错误信息是

无法打开文件“C:/Users/??/Documents/.rtweet_token.rds”:参数无效

在此处输入图像描述

我试图将“set_renv”设置为 FALSE,但在运行 search_tweets 函数时再次出现相同的错误。那么,我猜这个问题与主目录有关吗?

0 投票
0 回答
353 浏览

r - 当用户拥有超过 5000 个朋友时,rtweet 函数“get_friends()”不返回数据

我正在尝试使用 rtweet 在 Twitter 上下载某个用户的朋友列表。

如果我尝试下载少于 5000 个朋友的用户的朋友列表,我会得到预期的结果 - 用户的朋友列表。

但是,如果我尝试下载拥有超过 5000 个朋友的用户的朋友列表,我会达到 API 限制,所以我必须使用该函数的page参数,如下所述get_friends()https ://rtweet.info/reference/next_cursor .html

我以@jimmyfallon 为例,因为他有超过 5000 个 Twitter 朋友。

上面代码的预期输出将是f1包含前 5000 个朋友并f2包含剩余的很多朋友。

我的实际结果是f1包含前 5000 个朋友并f2包含一个 0x0 tibble(无数据)。

奇怪的是,有时我确实得到了预期的输出,f2但大多数时候它并没有给出预期的输出。

我尝试将睡眠时间增加到 30 分钟,使用不同的 API 密钥,删除 @ inget_friends()并在不同的网络上执行。

我正在使用在 RStudio 中运行的 R 3.6.1 和 rtweet_0.6.9。

0 投票
0 回答
411 浏览

r - 如何使用带有 rtweet 包的 lookup_users() 检索超过 90,000 个用户的数据?

我正在尝试获取帐户关注者的所有用户数据,但遇到了 90,000 个用户查找限制的问题。文档页面说,这可以通过迭代用户 ID 来完成,同时避免具有 15 分钟重置时间的速率限制,但并没有真正提供有关如何执行此操作的任何指导。如何使用大于 90,000 的用户列表实现完整的用户查找?

我正在使用 rtweet 包。下面是对拥有 266,000 名关注者的@lisamurkowski 的一次尝试。我曾尝试对lookup_users() 使用retryonratelimit = TRUE 参数,但这无济于事。

预期的输出将是所有用户查找的小标题,但我得到了

然后输出的对象包含 90,000 个观察值并结束该过程。

0 投票
1 回答
281 浏览

r - R rtweet search_30day 消息:超出速率限制

我想搜索两周前使用的几个不同主题标签的任何实例。我就search_30day()这样做了。我预计会有大约 100,000 条(ish)推文,然后我想稍后进行情绪分析。但是,我运行以下命令,在达到 2% 之后,它显示2%list(message="Exceeded rate limit"...). 一旦 Twitter 的 15 分钟窗口重置,有没有办法找到我留在搜索中的位置?