问题标签 [rtweet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R rtweet:如果给定 Twitter 句柄没有返回结果,则 search_tweets 循环不会继续
我有一个 Twitter 句柄的数据框。当我使用该search_tweets
函数遍历句柄时,如果 Twitter 句柄之一没有返回任何结果,则循环将停止收集推文。
我想构造循环,如果没有返回结果,它会忽略句柄并移至下一个。
我的句柄数据框如下所示:
循环如下所示:
当我运行循环时,它遇到一个不返回任何内容的句柄后会引发以下错误:
fix.by(by.x, x) 中的错误:“by”必须指定唯一有效的列
我试图在网上搜索解决方案,但没有成功。任何指针都会非常有帮助。
r - 无法使用 rtweet 包创建令牌
我无法使用 rtweet 包中的 create_token 创建 twitter 令牌:
我得到的输出是:
我按照http://rtweet.info/articles/auth.html中公开的说明设置 Twitter API ,并三次检查回调 URL 是否正确设置为http://127.0.0.1:1410。
我也试过:
它似乎有效,但是当我打电话时
我得到:Error: Not a valid access token.
可能出了什么问题?我目前正在使用 R 3.5.0。谢谢你。
r - 在 R 中调度 rtweet::stream_tweets()
在重新启动 Windows 和 R 后手动运行附加代码时,附加代码对我来说很好 - 但在使用 taskscheduleR 包安排任务时(在它开始运行后立即停止,创建文件但没有内容)。可能与一些访问令牌问题有关,但我无法解决。
有任何想法吗...?
r - 无法使用 rtweet 和 RMeCab 标记器正确获取字符编码
我正在尝试给我的日语推文发短信,并且遇到了看似无法解决的字符编码问题。
在挖掘推文并设置语言环境后,Sys.setlocale("LC_ALL", "Japanese_Japan.932")
我得到了一个看起来符合预期的数据框:
我想通过日语的 Tokenizer 运行这些推文,即RMeCab
基于MeCab
(全部可用here)。MeCab
可以在和其他一些中编译UTF-8
,SHIFT-JIS
但是以另一种编码重新编译不会使我的问题消失甚至改变最终结果。
因此,在编译MeCab
和安装之后RMeCab
,我提取了第一条推文并尝试使用
这会产生以下输出:
不幸的是,这些不是正确的日文字符。我尝试了以下交替SHIFT-JIS
和UTF-8
编码(以及这些更改的所有组合)来克服这个问题:
- 使用不同的编码打开 R 脚本(有所不同,但只是显示不同的乱码,所以我假设乱码发生在 RMeCab 中)
Sys.setlocale("LC_ALL", "English_United States.1252")
在和之间切换语言环境Sys.setlocale("LC_ALL", "Japanese_Japan.932")
- 以不同的编码重新编译 MeCab
我现在排在最后,想寻求帮助。
编辑:我现在发现iconv (result, from = "UTF8", to = "UTF-8")
在标记化(和乱码)字符串上运行转换会显示标记的正确日文字符。这看起来没有多大意义,但它确实有效。但是,我想避免这个额外的步骤,因为转换仅适用于字符串,而不适用于列表或向量。
r - 使用 rtweet 包中的 lookup_coords() 函数获取国家/地区位置的坐标
我已经安装了 rtweet,当我想从美国以外的特定国家收集推文时,该软件包不会收集任何数据。我已经使用来自 Google 的相同 API 密钥作为 R 中的环境变量安装了Geocoding API、Maps JavaScript API和Geolocation API 。以下是我遵循的步骤:
生成 google maps_token
主目录路径
与令牌名称结合
将令牌保存到主目录
创建环境变量
可视化 API 关键环境变量
TWITTER_PAT=/Users/xxxxxx/.rtweet_token1.rds GOOGLE_MAPS_PAT=/Users/xxxxxx//google_maps_token.rds
保存 google api 密钥后,我重新启动 RStudio 以开始收集推文,这会发生:
加载 rtweet 库
收集来自美国的推文
正在搜索推文...完成收集推文!
收集来自墨西哥的推文
正在搜索推文...完成收集推文!
此外,当我将 rtweet 包中的 lookup_coords() 函数与“usa”一起使用时,它可以工作
从美国获取坐标
但是当我尝试按照帮助部分中的示例使用另一个地址时,它不会收集任何数据
从巴西获取坐标
但是当我直接在函数中编写 API 密钥时,它就可以工作了。出于安全原因,我改为写“XXXXXXXXXX”
我做错了什么还是需要在另一个目录中安装 API 密钥?我不得不说我的工作目录(我保存我的项目和脚本的地方)与运行 path.expand("~/") 后出现的主目录不同
r - 如何使用 rtweet 包收集过去 7 天内的推文?
我已经开始使用 rtweet 包,到目前为止,我的查询、语言和地理编码参数都取得了很好的结果。但是,我仍然不知道如何收集过去 7 天内的推特数据。
例如,在下一个代码块中,我想提取一些数据 7 天,但我不确定收集的推文是从 2017-06-29 到 2017-06-05 还是从 2017-06-22直到 2017 年 6 月 29 日:
将所有提及 AMLO 或 lopezobrador 的推文串流 7 天
将数据作为 tidy tbl 数据帧读入
您知道 rtweet 中是否有任何命令可以指定使用 search_tweets() 或 stream_tweets() 函数时要使用的时间范围?
r - 具有在 nrows [R] 之后也休眠的函数的 for 循环
我正在使用rtweet
大量lookup_users
帐户(> 900,000)。此函数最多返回 90,000 个用户,然后有一个速率限制,仅在 15 分钟后重置。如何构建一个 for 循环,迭代向量(或数据帧)中的前 90,000 个值,然后等待 15 分钟,然后在遵守速率限制的情况下迭代下一个 90,000 等?
r - Rtweet 包中的 Post_list 函数
rtweet 包中的 post_list 函数是否不再存在?
文档将它显示为一个函数,但是当我尝试使用它时,我收到该函数不存在的错误消息?
我正在尝试使用 Twitter 句柄列表在 Twitter 中创建列表,但找不到使其工作的函数。
用户<- c(“cnn”,“cnnbrk”,“cnni”,“cnnpolitics”,“cnnmoney”,“cnnnewsroom”,“cnnspecreport”,“CNNNewsource”,“CNNNSdigital”,“CNNTonight”)
r - 在 Twitter 句柄向量上循环 search_tweets 函数(rtweet 包)时出现 R 身份验证错误
我创建了一个循环,该循环贯穿 Twitter 句柄的向量,并使用包中的search_tweets
函数从它们收集推文rtweet
。
下载最新版本的 rtweet
创建令牌
这是我的 Twitter 句柄,存储在矢量中
然后我遍历这些句柄,并将每个句柄的结果存储为唯一的数据帧
但是,当我这样做时,我收到一条错误消息
警告:32 - 无法验证您的身份。向量中的错误(“列表”,ntimes):无效的“长度”参数
但是我不认为这是一个身份验证问题,因为当我尝试使用随机关键字/主题标签时,我会得到结果
我的循环工作正常,但最近它开始抛出错误。关于为什么会发生这种情况以及是否有解决方法的任何想法?
非常感谢您的帮助!
r - 错误:当我将带有所有变量的推文转换为数据框时,并非 twList 的所有元素都属于同一类
我在 R 中使用 rtweet 包来提取特定主题标签的推文,这些标签基本上需要 appname、api_key、api_secret、access_token、access_token_secret。所以我在 Twitter 中创建了一个应用程序来获取上述所有详细信息。然后我通过上面的如下
所以这基本上将提取具有 88 个变量的推文。现在我想将这些推文写入一个 excel 文件以供进一步分析。
为此,我正在使用以下代码。
当我运行它时,我收到以下错误。
只是想了解这里可能存在的潜在问题。
问题是我不能把确切的代码放在这里,因为这需要我的 api 密钥和所有。
任何帮助将非常感激。
问候, 阿卡什