问题标签 [rtweet]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

163 问题

0 投票

1 回答

743 浏览

r - 使用 'rtweet' 通过 get_retweets 提取转推

我收集了一个原始推文数据集（不是转推），但至少被转推了一次。对于这个包含 6,000 条原始推文的数据集，我尝试使用“rtweet”包中的 get_retweets 函数为每个推文收集 30 条转发。根据过去的经验，如果原始推文没有被转发至少 30 次，它只会返回原始推文的转发次数。

我的代码行如下所示：

我首先通过使用第一条原始推文的状态 id 提取 0 创建了一个数据框（用于存储所有转推）

这个 for 循环一开始是有效的，但现在我在运行整个循环后只得到了大约 900 次转推（甚至不到 100 次）。我不确定出了什么问题——因为 Twitter 对每 15 分钟可以收集多少推文有限制，所以我尝试等待更长的时间来运行循环；将 6,000 条推文分成更小的批次；重新启动 r... 他们都没有工作。

如果有人能指出我正确的方向，我将不胜感激。谢谢！

r twitter rtweet

2018-08-13T19:43:16.573

0 投票

1 回答

262 浏览

r - rtweet 库是否有办法从特定位置获取推文？

我正在尝试使用 rtweet 包从特定位置（例如“LA”）获取推文。我知道 twitteR 包曾经有类似的东西：

您甚至可以指定半径。

有没有办法将该功能添加到 rtweet 流？

r rtweet

2018-08-23T09:04:27.030

0 投票

0 回答

163 浏览

r - get_timelines 不返回 3,200 条最新推文

我目前正在使用 rtweet 收集一些德国政客的时间表。这样做时，我遇到了一个问题，虽然对于某些（超过 3,200 条推文）我能够收集 3,200 条最新推文的全部数量，而对于其他运行代码的人来说，仅返回略低于 3,200 条。

您是否已经遇到过这个问题，您知道是什么原因造成的吗？这是我只能收集最后 3187 个状态的政治家的一个例子：

test <- get_timeline("wanderwitz", n=3200)

而对于其他人来说，代码可以正常工作，例如：

先感谢您！

r rtweet

2018-10-15T13:15:23.777

0 投票

1 回答

56 浏览

r - 尝试运行 cronjob 来构建 Twitter 用户 ID 列表

我正在尝试构建 Twitter 用户 ID 列表（还收集生物描述、位置和一些其他参数）。

我想设置一个 cronjob 来运行此代码并每天从 Twitter API 收集信息一个月。

但是，我担心，每当代码运行时，我拥有的当前代码都会收集一组新的 Twitter 用户，并且不会将那组新的数据附加到我的数据框（数据框将只是最近收集的 Twitter 的列表用户）。

这是相关代码->

重申一下期望的结果是能够运行一个 cron 作业，并将新数据附加到我现有的数据帧中

r cron rtweet

2018-11-06T12:32:05.930

0 投票

1 回答

329 浏览

r - R：r tweets：错误：只能选择一种搜索类型。试试 type = 'recent'

我正在使用“rtweet”包按位置收集推文。

当我提到城市、州和国家时，我收到以下错误。

r rtweet

2018-11-06T18:15:44.660

0 投票

0 回答

70 浏览

r - 存储推文的最佳方式是什么{rtweet}

如何存储推文，以便在导入时，所有详细信息和列格式保持不变。

下周：

r twitter rtweet

2018-12-04T18:49:49.677

0 投票

0 回答

139 浏览

r - 在 R 中解码推文中的 unicode

在我的推文中，我在尖括号中得到了 Unicode：“U+0001F602” 喜欢我的翻盖手机

我想要格式为：\U0001F602 的 unicode。我使用 rtweet 包来检索推文。我是这个领域的新手。我想知道我们能否以某种方式过滤掉转推以减少数据集中的冗余

tweets = search_tweets(q="phones", n=5000, lang="en")
正在搜索推文...
完成收集推文！
write_as_csv（推文，文件名，prepend_ids = TRUE，na =“”，fileEncoding =“UTF-8”）

我也尝试不使用“fileencoding”参数。

r unicode tweets rtweet

2018-12-16T16:23:21.637

0 投票

1 回答

1263 浏览

python - 使用 tweepy 光标获取用户推文，不包括转推

我想为每个 id 在列表中的用户准确提取 400 条推文。

我正在使用 Tweepy 和 Cursor 执行此操作，我的代码如下所示：

上面的代码检索所有最近的 (400) 推文，但它还包括我不想包含的转推。

可以使用过滤if hasattr(tweet, 'retweeted_status')转推，但如果用户有转推，代码将仅返回（400 - 转推）推文。

据我所知，光标中没有排除转发的选项。有什么办法可以解决这个问题吗？

python twitter tweepy tweets rtweet

2019-01-08T00:19:46.353

0 投票

1 回答

170 浏览

r - 使用 RTweet 的 search_tweets() 函数在 Twitter 上搜索新推文

我正在从使用切换twitteR到Rtweet自动搜索 Twitter 以查找新推文（twitteR似乎将文本截断为 140 个字符）。searchTwitter()twitteR 包中的函数包含一个sinceID参数，允许我轻松搜索最新的推文并将它们附加到我现有的数据集。search_tweets()我在包的功能中找不到类似的功能Rtweet。有什么方法可以避免下载整个推文语料库然后删除重复项，而只下载最新的推文？

这是我目前使用的功能和示例：

r twitter rtweet

2019-02-12T11:22:24.193

0 投票

1 回答

53 浏览

r - 在 Windows 命令行中使用 UTF8 查询的 search_tweets 返回 0 输出

我有一个脚本可以在 R 中使用 rtweet 包来抓取推文。我正在使用以下代码。

该代码在 Rstudio 中运行良好（create_token 和 lookup_coords 有各自的输入，此处已删除）。我能够获得数百条包含搜索查询的推文。目的是使用 Windows 任务调度程序运行此脚本。但是，当使用命令行运行相同的脚本时，例如

脚本运行，但生成的数据框有零行。使用我对调试的非常有限的理解，我将问题定位为上述函数中作为输入给出的查询类型。如果我使用拉丁字符，例如“ajrak”，它会在命令行中返回一个带有推文的数据框。简而言之，我编写的 R 脚本的行为在 R studio 和 Windows 命令行中是不同的。主要原因是使用 UTF-8 查询。在搜索了很多之后，我找不到解决方案。有什么办法可以解决这个问题？

r command-line utf-8 job-scheduling rtweet

2019-02-13T18:08:13.933

1 2 3 4 5 6 7 8 9 10

问题标签 [rtweet]

Reference