问题标签 [rtweet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
743 浏览

r - 使用 'rtweet' 通过 get_retweets 提取转推

我收集了一个原始推文数据集(不是转推),但至少被转推了一次。对于这个包含 6,000 条原始推文的数据集,我尝试使用“rtweet”包中的 get_retweets 函数为每个推文收集 30 条转发。根据过去的经验,如果原始推文没有被转发至少 30 次,它只会返回原始推文的转发次数。

我的代码行如下所示:

我首先通过使用第一条原始推文的状态 id 提取 0 创建了一个数据框(用于存储所有转推)

这个 for 循环一开始是有效的,但现在我在运行整个循环后只得到了大约 900 次转推(甚至不到 100 次)。我不确定出了什么问题——因为 Twitter 对每 15 分钟可以收集多少推文有限制,所以我尝试等待更长的时间来运行循环;将 6,000 条推文分成更小的批次;重新启动 r... 他们都没有工作。

如果有人能指出我正确的方向,我将不胜感激。谢谢!

0 投票
1 回答
262 浏览

r - rtweet 库是否有办法从特定位置获取推文?

我正在尝试使用 rtweet 包从特定位置(例如“LA”)获取推文。我知道 twitteR 包曾经有类似的东西:

您甚至可以指定半径。

有没有办法将该功能添加到 rtweet 流?

0 投票
0 回答
163 浏览

r - get_timelines 不返回 3,200 条最新推文

我目前正在使用 rtweet 收集一些德国政客的时间表。这样做时,我遇到了一个问题,虽然对于某些(超过 3,200 条推文)我能够收集 3,200 条最新推文的全部数量,而对于其他运行代码的人来说,仅返回略低于 3,200 条。

您是否已经遇到过这个问题,您知道是什么原因造成的吗?这是我只能收集最后 3187 个状态的政治家的一个例子:

test <- get_timeline("wanderwitz", n=3200)

而对于其他人来说,代码可以正常工作,例如:

先感谢您!

0 投票
1 回答
56 浏览

r - 尝试运行 cronjob 来构建 Twitter 用户 ID 列表

我正在尝试构建 Twitter 用户 ID 列表(还收集生物描述、位置和一些其他参数)。

我想设置一个 cronjob 来运行此代码并每天从 Twitter API 收集信息一个月。

但是,我担心,每当代码运行时,我拥有的当前代码都会收集一组新的 Twitter 用户,并且不会将那组新的数据附加到我的数据框(数据框将只是最近收集的 Twitter 的列表用户)。

这是相关代码->

重申一下期望的结果是能够运行一个 cron 作业,并将新数据附加到我现有的数据帧中

0 投票
1 回答
329 浏览

r - R:r tweets:错误:只能选择一种搜索类型。试试 type = 'recent'

我正在使用“rtweet”包按位置收集推文。

当我提到城市、州和国家时,我收到以下错误。

0 投票
0 回答
70 浏览

r - 存储推文的最佳方式是什么{rtweet}

如何存储推文,以便在导入时,所有详细信息和列格式保持不变。

下周:

0 投票
0 回答
139 浏览

r - 在 R 中解码推文中的 unicode

在我的推文中,我在尖括号中得到了 Unicode:“U+0001F602” 喜欢我的翻盖手机

我想要格式为:\U0001F602 的 unicode。我使用 rtweet 包来检索推文。我是这个领域的新手。我想知道我们能否以某种方式过滤掉转推以减少数据集中的冗余

tweets = search_tweets(q="phones", n=5000, lang="en")
正在搜索推文...
完成收集推文!
write_as_csv(推文,文件名,prepend_ids = TRUE,na =“”,fileEncoding =“UTF-8”)

我也尝试不使用“fileencoding”参数。

0 投票
1 回答
1263 浏览

python - 使用 tweepy 光标获取用户推文,不包括转推

我想为每个 id 在列表中的用户准确提取 400 条推文。

我正在使用 Tweepy 和 Cursor 执行此操作,我的代码如下所示:

上面的代码检索所有最近的 (400) 推文,但它还包括我不想包含的转推。

可以使用过滤if hasattr(tweet, 'retweeted_status')转推,但如果用户有转推,代码将仅返回(400 - 转推)推文。

据我所知,光标中没有排除转发的选项。有什么办法可以解决这个问题吗?

0 投票
1 回答
170 浏览

r - 使用 RTweet 的 search_tweets() 函数在 Twitter 上搜索新推文

我正在从使用切换twitteRRtweet自动搜索 Twitter 以查找新推文(twitteR似乎将文本截断为 140 个字符)。searchTwitter()twitteR 包中的函数包含一个sinceID参数,允许我轻松搜索最新的推文并将它们附加到我现有的数据集。search_tweets()我在包的功能中找不到类似的功能Rtweet。有什么方法可以避免下载整个推文语料库然后删除重复项,而只下载最新的推文?

这是我目前使用的功能和示例:

0 投票
1 回答
53 浏览

r - 在 Windows 命令行中使用 UTF8 查询的 search_tweets 返回 0 输出

我有一个脚本可以在 R 中使用 rtweet 包来抓取推文。我正在使用以下代码。

该代码在 Rstudio 中运行良好(create_token 和 lookup_coords 有各自的输入,此处已删除)。我能够获得数百条包含搜索查询的推文。目的是使用 Windows 任务调度程序运行此脚本。但是,当使用命令行运行相同的脚本时,例如

脚本运行,但生成的数据框有零行。使用我对调试的非常有限的理解,我将问题定位为上述函数中作为输入给出的查询类型。如果我使用拉丁字符,例如“ajrak”,它会在命令行中返回一个带有推文的数据框。简而言之,我编写的 R 脚本的行为在 R studio 和 Windows 命令行中是不同的。主要原因是使用 UTF-8 查询。在搜索了很多之后,我找不到解决方案。有什么办法可以解决这个问题?