问题标签 [rtweet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 rtweet 包下载推文似乎停止在 8%。为什么?
我正在使用该rtweet
包来检索特定主题标签上的推文。
我的R
代码如下:
但是,RStudio
当我执行代码时显示以下行:
然后它结束执行,上面的消息仍然显示 8%。
nrow(rt)
告诉我 1,250
注意:当我执行代码时,rtweet
将我定向到我的网络浏览器,然后我通过网络浏览器进行了身份验证。
我在这里做错了什么?
r - 大型 JSON 对象解析失败 (rtweet)
我正在尝试使用parse_stream()
rwteet 库中的函数函数解析大型 JSON 文件。它因长 JSON 对象而失败。
此 JSON 对象在具有相当大的大小 (200MB-1GB) 时往往会产生错误。我的流功能看起来像这样。
我没有启用该parse = TRUE
参数,因为在文档中它说不建议在大型 JSON 对象中使用。无论如何,我也尝试过流式传输,但parse = TRUE
也失败了parse_stream()
。我得到的错误是以下错误:
我以为是两个大括号之间的双逗号。我使用ctrl+f搜索了 Atom字符串ELDkx4-i7ysCAR_.mp4?tag=10"}
,唯一的结果是没有,,
.
为什么我得到这个解析错误,有人遇到同样的问题并以某种方式修复它吗?
r - 在 R 中使用 Rtweet 的 search_fullarchive
我正在尝试使用在 Twitter Developer 注册的高级令牌来使用rtweet
' 。search_fullarchive
但是,我收到以下错误消息:
警告:list(message = "Forbidden: Authentication failed but account is not authorized to access this resource.", sent = "2019-07-14T14:30:11+00:00", transactionId = "xxxxxxxxxx")
我该如何解决这个问题?我编码的方式有错误吗?
httr
我通过使用'sPOST
方法对其进行测试来确保我的令牌运行良好,并且运行良好。
我还使用普通的 search_tweets 测试了我的令牌,并且工作正常。
我期望一个 tibble 数据框通常是 Rtweet 的回报。然而,这是我收到的:
"警告: list(message = "Forbidden: 身份验证成功但帐户无权访问此资源。", sent = "2019-07-14T14:30:11+00:00", transactionId = "xxxxxxxxxx")" 数据0 列 0 行的框架
r - 有没有办法从 rtweet 包中个性化/定义 lookup_coords 的 bbox 或 latlong?
我想进行 Twitter 搜索,指定位置。我正在使用 rtweet 包。但是,当我为委内瑞拉国家或加拉加斯市打印“lookup_coords”函数时,没有结果。我遵循了以前帖子中的所有建议,但没有任何帮助。我有自己的 Google Api Key 我正在使用 R,Windows 7。
是否有可能自行定义坐标并将其分配给“search_tweets”函数?我怎么知道命名世界上每个城市或国家的正确语法是什么?某处有清单吗?
结果是:
当我检查 API 时,一切正常:
r - 为什么从 Twitter 挖掘的数据在保存到数据帧后表现不同?
我使用包对 Twitter 数据进行了文本挖掘rtweet
,但在将其保存到数据框后,我无法充分利用包等ggplot2
功能。我究竟做错了什么?
我使用该库对一些 twitter 数据进行了文本挖掘rtweet
,并且部分进行了挖掘,因此我不会超过 API 限制。在收集了我需要的所有数据后,我将它们全部合并到一个数据框中。我下载了dplyr
和ggplot2
包,并希望随着时间的推移可视化推文,但时间变量来自数据框时无法识别。但是,如果我使用其中一批原始名称的挖掘数据,它会被识别为时间变量并且绘制得很好。这是我用来挖掘数据、将其保存到数据帧并将它们全部组合成一个数据帧的代码。
错误:StatBin 需要一个连续的 x 变量:x 变量是离散的。也许你想要 stat="count"?
在转换为数据帧之前与其中一个挖掘批次相同的代码
在最后一个 ggplot 之后,我得到了一个不错的条形图,其中包含随时间推移的推文
当我尝试使用dplyr
按时间过滤推文时会发生类似的事情,但在放入数据框之前可以很好地处理挖掘的数据
seq.POSIXt(data[[dtvar]][1], data[[dtvar]][length(data[[dtvar]])], 中的错误:'to' 的长度必须为 1 另外:警告消息:1 : 在 Ops.factor(created_at, "2018-01-01") : '>=' 对因子 2 没有意义:因子
screen_name
包含隐式 NA,考虑使用forcats::fct_explicit_na
3:因子screen_name
包含隐式 NA,考虑使用forcats::fct_explicit_na
4:因子screen_name
包含隐式 NA,考虑使用forcats::fct_explicit_na
r - readRDS(x) 中的错误:从连接中读取错误
我正在使用rtweet
带有以下命令的包:
readRDS(x) 中的错误:从连接中读取错误
想知道如何解决这个问题。谢谢
我的会话信息是
r - 当用户拥有超过 5000 个朋友时,rtweet 函数“get_friends()”不返回数据
我正在尝试使用 rtweet 在 Twitter 上下载某个用户的朋友列表。
如果我尝试下载少于 5000 个朋友的用户的朋友列表,我会得到预期的结果 - 用户的朋友列表。
但是,如果我尝试下载拥有超过 5000 个朋友的用户的朋友列表,我会达到 API 限制,所以我必须使用该函数的page
参数,如下所述get_friends()
:
https ://rtweet.info/reference/next_cursor .html
我以@jimmyfallon 为例,因为他有超过 5000 个 Twitter 朋友。
上面代码的预期输出将是f1
包含前 5000 个朋友并f2
包含剩余的很多朋友。
我的实际结果是f1
包含前 5000 个朋友并f2
包含一个 0x0 tibble(无数据)。
奇怪的是,有时我确实得到了预期的输出,f2
但大多数时候它并没有给出预期的输出。
我尝试将睡眠时间增加到 30 分钟,使用不同的 API 密钥,删除 @ inget_friends()
并在不同的网络上执行。
我正在使用在 RStudio 中运行的 R 3.6.1 和 rtweet_0.6.9。
r - 如何使用带有 rtweet 包的 lookup_users() 检索超过 90,000 个用户的数据?
我正在尝试获取帐户关注者的所有用户数据,但遇到了 90,000 个用户查找限制的问题。文档页面说,这可以通过迭代用户 ID 来完成,同时避免具有 15 分钟重置时间的速率限制,但并没有真正提供有关如何执行此操作的任何指导。如何使用大于 90,000 的用户列表实现完整的用户查找?
我正在使用 rtweet 包。下面是对拥有 266,000 名关注者的@lisamurkowski 的一次尝试。我曾尝试对lookup_users() 使用retryonratelimit = TRUE 参数,但这无济于事。
预期的输出将是所有用户查找的小标题,但我得到了
然后输出的对象包含 90,000 个观察值并结束该过程。
r - R rtweet search_30day 消息:超出速率限制
我想搜索两周前使用的几个不同主题标签的任何实例。我就search_30day()
这样做了。我预计会有大约 100,000 条(ish)推文,然后我想稍后进行情绪分析。但是,我运行以下命令,在达到 2% 之后,它显示2%list(message="Exceeded rate limit"...)
. 一旦 Twitter 的 15 分钟窗口重置,有没有办法找到我留在搜索中的位置?