问题标签 [rtweet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
347 浏览

r - R rtweet:如果给定 Twitter 句柄没有返回结果,则 search_tweets 循环不会继续

我有一个 Twitter 句柄的数据框。当我使用该search_tweets函数遍历句柄时,如果 Twitter 句柄之一没有返回任何结果,则循环将停止收集推文。

我想构造循环,如果没有返回结果,它会忽略句柄并移至下一个。

我的句柄数据框如下所示:

循环如下所示:

当我运行循环时,它遇到一个不返回任何内容的句柄后会引发以下错误:

fix.by(by.x, x) 中的错误:“by”必须指定唯一有效的列

我试图在网上搜索解决方案,但没有成功。任何指针都会非常有帮助。

0 投票
2 回答
3747 浏览

r - 无法使用 rtweet 包创建令牌

我无法使用 rtweet 包中的 create_token 创建 twitter 令牌:

我得到的输出是:

我按照http://rtweet.info/articles/auth.html中公开的说明设置 Twitter API ,并三次检查回调 URL 是否正确设置为http://127.0.0.1:1410

我也试过:

它似乎有效,但是当我打电话时

我得到:Error: Not a valid access token.

可能出了什么问题?我目前正在使用 R 3.5.0。谢谢你。

0 投票
1 回答
153 浏览

r - 在 R 中调度 rtweet::stream_tweets()

在重新启动 Windows 和 R 后手动运行附加代码时,附加代码对我来说很好 - 但在使用 taskscheduleR 包安排任务时(在它开始运行后立即停止,创建文件但没有内容)。可能与一些访问令牌问题有关,但我无法解决。

有任何想法吗...?

0 投票
0 回答
85 浏览

r - 无法使用 rtweet 和 RMeCab 标记器正确获取字符编码

我正在尝试给我的日语推文发短信,并且遇到了看似无法解决的字符编码问题。

在挖掘推文并设置语言环境后,Sys.setlocale("LC_ALL", "Japanese_Japan.932")我得到了一个看起来符合预期的数据框:

在此处输入图像描述

我想通过日语的 Tokenizer 运行这些推文,即RMeCab基于MeCab全部可用here)。MeCab可以在和其他一些中编译UTF-8SHIFT-JIS但是以另一种编码重新编译不会使我的问题消失甚至改变最终结果。

因此,在编译MeCab和安装之后RMeCab,我提取了第一条推文并尝试使用

这会产生以下输出:

在此处输入图像描述

不幸的是,这些不是正确的日文字符。我尝试了以下交替SHIFT-JISUTF-8编码(以及这些更改的所有组合)来克服这个问题:

  • 使用不同的编码打开 R 脚本(有所不同,但只是显示不同的乱码,所以我假设乱码发生在 RMeCab 中)
  • Sys.setlocale("LC_ALL", "English_United States.1252")在和之间切换语言环境Sys.setlocale("LC_ALL", "Japanese_Japan.932")
  • 以不同的编码重新编译 MeCab

我现在排在最后,想寻求帮助。

编辑:我现在发现iconv (result, from = "UTF8", to = "UTF-8")在标记化(和乱码)字符串上运行转换会显示标记的正确日文字符。这看起来没有多大意义,但它确实有效。但是,我想避免这个额外的步骤,因为转换仅适用于字符串,而不适用于列表或向量。

0 投票
1 回答
1689 浏览

r - 使用 rtweet 包中的 lookup_coords() 函数获取国家/地区位置的坐标

我已经安装了 rtweet,当我想从美国以外的特定国家收集推文时,该软件包不会收集任何数据。我已经使用来自 Google 的相同 API 密钥作为 R 中的环境变量安装了Geocoding APIMaps JavaScript APIGeolocation API 。以下是我遵循的步骤:

生成 google maps_token

主目录路径

与令牌名称结合

将令牌保存到主目录

创建环境变量

可视化 API 关键环境变量

TWITTER_PAT=/Users/xxxxxx/.rtweet_token1.rds GOOGLE_MAPS_PAT=/Users/xxxxxx//google_maps_token.rds

保存 google api 密钥后,我重新启动 RStudio 以开始收集推文,这会发生:

加载 rtweet 库

收集来自美国的推文

正在搜索推文...完成收集推文!

来自美国的 10 条推文

收集来自墨西哥的推文

正在搜索推文...完成收集推文!

没有从墨西哥收集数据

此外,当我将 rtweet 包中的 lookup_coords() 函数与“usa”一起使用时,它可以工作

从美国获取坐标

美国坐标

但是当我尝试按照帮助部分中的示例使用另一个地址时,它不会收集任何数据

从巴西获取坐标

没有来自巴西的坐标

但是当我直接在函数中编写 API 密钥时,它就可以工作了。出于安全原因,我改为写“XXXXXXXXXX”

墨西哥坐标

我做错了什么还是需要在另一个目录中安装 API 密钥?我不得不说我的工作目录(我保存我的项目和脚本的地方)与运行 path.expand("~/") 后出现的主目录不同

0 投票
2 回答
1491 浏览

r - 如何使用 rtweet 包收集过去 7 天内的推文?

我已经开始使用 rtweet 包,到目前为止,我的查询、语言和地理编码参数都取得了很好的结果。但是,我仍然不知道如何收集过去 7 天内的推特数据。

例如,在下一个代码块中,我想提取一些数据 7 天,但我不确定收集的推文是从 2017-06-29 到 2017-06-05 还是从 2017-06-22直到 2017 年 6 月 29 日:

将所有提及 AMLO 或 lopezobrador 的推文串流 7 天

将数据作为 tidy tbl 数据帧读入

您知道 rtweet 中是否有任何命令可以指定使用 search_tweets() 或 stream_tweets() 函数时要使用的时间范围?

0 投票
1 回答
71 浏览

r - 具有在 nrows [R] 之后也休眠的函数的 for 循环

我正在使用rtweet大量lookup_users帐户(> 900,000)。此函数最多返回 90,000 个用户,然后有一个速率限制,仅在 15 分钟后重置。如何构建一个 for 循环,迭代向量(或数据帧)中的前 90,000 个值,然后等待 15 分钟,然后在遵守速率限制的情况下迭代下一个 90,000 等?

0 投票
0 回答
22 浏览

r - Rtweet 包中的 Post_list 函数

rtweet 包中的 post_list 函数是否不再存在?

文档将它显示为一个函数,但是当我尝试使用它时,我收到该函数不存在的错误消息?

我正在尝试使用 Twitter 句柄列表在 Twitter 中创建列表,但找不到使其工作的函数。

用户<- c(“cnn”,“cnnbrk”,“cnni”,“cnnpolitics”,“cnnmoney”,“cnnnewsroom”,“cnnspecreport”,“CNNNewsource”,“CNNNSdigital”,“CNNTonight”)

0 投票
1 回答
1391 浏览

r - 在 Twitter 句柄向量上循环 search_tweets 函数(rtweet 包)时出现 R 身份验证错误

我创建了一个循环,该循环贯穿 Twitter 句柄的向量,并使用包中的search_tweets函数从它们收集推文rtweet

下载最新版本的 rtweet

创建令牌

这是我的 Twitter 句柄,存储在矢量中

然后我遍历这些句柄,并将每个句柄的结果存储为唯一的数据帧

但是,当我这样做时,我收到一条错误消息

警告:32 - 无法验证您的身份。向量中的错误(“列表”,ntimes):无效的“长度”参数

但是我不认为这是一个身份验证问题,因为当我尝试使用随机关键字/主题标签时,我会得到结果

我的循环工作正常,但最近它开始抛出错误。关于为什么会发生这种情况以及是否有解决方法的任何想法?

非常感谢您的帮助!

0 投票
1 回答
1644 浏览

r - 错误:当我将带有所有变量的推文转换为数据框时,并非 twList 的所有元素都属于同一类

我在 R 中使用 rtweet 包来提取特定主题标签的推文,这些标签基本上需要 appname、api_key、api_secret、access_token、access_token_secret。所以我在 Twitter 中创建了一个应用程序来获取上述所有详细信息。然后我通过上面的如下

所以这基本上将提取具有 88 个变量的推文。现在我想将这些推文写入一个 excel 文件以供进一步分析。

为此,我正在使用以下代码。

当我运行它时,我收到以下错误。

只是想了解这里可能存在的潜在问题。

问题是我不能把确切的代码放在这里,因为这需要我的 api 密钥和所有。

任何帮助将非常感激。

问候, 阿卡什