问题标签 [rtweet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 'rtweet' 通过 get_retweets 提取转推
我收集了一个原始推文数据集(不是转推),但至少被转推了一次。对于这个包含 6,000 条原始推文的数据集,我尝试使用“rtweet”包中的 get_retweets 函数为每个推文收集 30 条转发。根据过去的经验,如果原始推文没有被转发至少 30 次,它只会返回原始推文的转发次数。
我的代码行如下所示:
我首先通过使用第一条原始推文的状态 id 提取 0 创建了一个数据框(用于存储所有转推)
这个 for 循环一开始是有效的,但现在我在运行整个循环后只得到了大约 900 次转推(甚至不到 100 次)。我不确定出了什么问题——因为 Twitter 对每 15 分钟可以收集多少推文有限制,所以我尝试等待更长的时间来运行循环;将 6,000 条推文分成更小的批次;重新启动 r... 他们都没有工作。
如果有人能指出我正确的方向,我将不胜感激。谢谢!
r - rtweet 库是否有办法从特定位置获取推文?
我正在尝试使用 rtweet 包从特定位置(例如“LA”)获取推文。我知道 twitteR 包曾经有类似的东西:
您甚至可以指定半径。
有没有办法将该功能添加到 rtweet 流?
r - get_timelines 不返回 3,200 条最新推文
我目前正在使用 rtweet 收集一些德国政客的时间表。这样做时,我遇到了一个问题,虽然对于某些(超过 3,200 条推文)我能够收集 3,200 条最新推文的全部数量,而对于其他运行代码的人来说,仅返回略低于 3,200 条。
您是否已经遇到过这个问题,您知道是什么原因造成的吗?这是我只能收集最后 3187 个状态的政治家的一个例子:
test <- get_timeline("wanderwitz", n=3200)
而对于其他人来说,代码可以正常工作,例如:
先感谢您!
r - 尝试运行 cronjob 来构建 Twitter 用户 ID 列表
我正在尝试构建 Twitter 用户 ID 列表(还收集生物描述、位置和一些其他参数)。
我想设置一个 cronjob 来运行此代码并每天从 Twitter API 收集信息一个月。
但是,我担心,每当代码运行时,我拥有的当前代码都会收集一组新的 Twitter 用户,并且不会将那组新的数据附加到我的数据框(数据框将只是最近收集的 Twitter 的列表用户)。
这是相关代码->
重申一下期望的结果是能够运行一个 cron 作业,并将新数据附加到我现有的数据帧中
r - R:r tweets:错误:只能选择一种搜索类型。试试 type = 'recent'
我正在使用“rtweet”包按位置收集推文。
当我提到城市、州和国家时,我收到以下错误。
r - 存储推文的最佳方式是什么{rtweet}
如何存储推文,以便在导入时,所有详细信息和列格式保持不变。
下周:
r - 在 R 中解码推文中的 unicode
在我的推文中,我在尖括号中得到了 Unicode:“U+0001F602” 喜欢我的翻盖手机
我想要格式为:\U0001F602 的 unicode。我使用 rtweet 包来检索推文。我是这个领域的新手。我想知道我们能否以某种方式过滤掉转推以减少数据集中的冗余
tweets = search_tweets(q="phones", n=5000, lang="en")
正在搜索推文...
完成收集推文!
write_as_csv(推文,文件名,prepend_ids = TRUE,na =“”,fileEncoding =“UTF-8”)
我也尝试不使用“fileencoding”参数。
python - 使用 tweepy 光标获取用户推文,不包括转推
我想为每个 id 在列表中的用户准确提取 400 条推文。
我正在使用 Tweepy 和 Cursor 执行此操作,我的代码如下所示:
上面的代码检索所有最近的 (400) 推文,但它还包括我不想包含的转推。
可以使用过滤if hasattr(tweet, 'retweeted_status')
转推,但如果用户有转推,代码将仅返回(400 - 转推)推文。
据我所知,光标中没有排除转发的选项。有什么办法可以解决这个问题吗?
r - 使用 RTweet 的 search_tweets() 函数在 Twitter 上搜索新推文
我正在从使用切换twitteR
到Rtweet
自动搜索 Twitter 以查找新推文(twitteR
似乎将文本截断为 140 个字符)。searchTwitter()
twitteR 包中的函数包含一个sinceID
参数,允许我轻松搜索最新的推文并将它们附加到我现有的数据集。search_tweets()
我在包的功能中找不到类似的功能Rtweet
。有什么方法可以避免下载整个推文语料库然后删除重复项,而只下载最新的推文?
这是我目前使用的功能和示例:
r - 在 Windows 命令行中使用 UTF8 查询的 search_tweets 返回 0 输出
我有一个脚本可以在 R 中使用 rtweet 包来抓取推文。我正在使用以下代码。
该代码在 Rstudio 中运行良好(create_token 和 lookup_coords 有各自的输入,此处已删除)。我能够获得数百条包含搜索查询的推文。目的是使用 Windows 任务调度程序运行此脚本。但是,当使用命令行运行相同的脚本时,例如
脚本运行,但生成的数据框有零行。使用我对调试的非常有限的理解,我将问题定位为上述函数中作为输入给出的查询类型。如果我使用拉丁字符,例如“ajrak”,它会在命令行中返回一个带有推文的数据框。简而言之,我编写的 R 脚本的行为在 R studio 和 Windows 命令行中是不同的。主要原因是使用 UTF-8 查询。在搜索了很多之后,我找不到解决方案。有什么办法可以解决这个问题?