问题标签 [rtweet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
65 浏览

r - R中对象的类和类型不同。我应该如何使其保持一致?

我使用“rtweet”库下载了一些推文。它的 search_tweets() 函数创建一个列表(类型)对象,而它的类是“tbl_df”“tbl”“data.frame”。为了进一步处理它,我需要将此 search_tweets() 输出转换为数据帧。

列表

“tbl_df” “tbl” “data.frame”

我尝试使用 as.data.frame() 将列表转换为数据框,但没有改变类型,我还尝试将其包装成 as.dataframe(matrix(unlist(comments))),但没有改变也输入

输出:列表

输出:列表

这两个代码都没有改变类型,而是改变了类。我应该如何更改类型?因为,我想将这些推文存储到一个数据框中,然后将它们写为 csv (write_csv)。

当我将“评论”写入 csv 时,它会引发错误。

错误:stream_delim_(df, path, ..., bom = bom, quote_escape = quote_escape) 中的错误:不知道如何处理列表类型的向量。

dput(comments) structure(list(user_id = c("1213537010930970624", "770697053538091008", "39194086", "887369171603931137", "924786826870587392", "110154561", "110154561", "1110623370389782528", "1201410499788689408", "1208038347735805953 ", "15608380", "54892886", "389914405", "432597210", "1196039261125918720" ), status_id = c("1217424480366026753", "1217197024405143552", "1217057752918392832", "1217022975108616193", "1217002616757997568", "1216987196714094592" , “1216986705170923520”, “1216978052472688640”, “1216947780129710080”, “1216943924796739585”, “1216925375789330432”, "1216925016605880320", "1216924608944734208", "1216921598294249472", "1214991714688987136"), created_at = structure(c(1579091589, 1579037359, 1579004154, 1578995863, 1578991009, 1578987332, 1578987215, 1578985152, 1578977935, 1578977016, 1578972593, 1578972507, 1578972410, 1578971693, 1578511572), class = c("POSIXct", "POSIXt"), tzone = "UTC"), screen_name = c("SufferMario", "_Mohammadtausif", "avi_rules16", "Deb05810220", "SriPappumaharaj", " Poison435”、“Poison435”、“RajeshK38457619”、“KK77979342”、“beingskysharma”、“tetisheri”、“sohinichat”、“nehadixit123”、“panwarsudhir1”、“NisarMewati1"),

csv格式的屏幕截图

0 投票
1 回答
1117 浏览

r - 将 rtweets 包中的推文写入 csv

我无法将“rtweet”包中的 search_tweet() 中的推文写入 csv。它引发以下错误:

这是我之前提出的问题的链接,其中详细介绍了 search_tweet() 对象创建的类型:R 中对象的类和类型不同。我应该如何使其保持一致?

我应该如何将这些文件写为 csv?

错误:stream_delim_(df, path, ..., bom = bom, quote_escape = quote_escape) 中的错误:不知道如何处理列表类型的向量。

“tbl_df” “tbl” “data.frame”

在此处输入图像描述

0 投票
0 回答
36 浏览

r - 读取 csv 数据集数字字符时出错

在 r 中使用 rtweet 包时,我遇到了数据类型问题,当我想使用 read.csv() 读取 csv 并编织文档时,我得到以下错误术语:“reply_to_status_id无法从数字转字符”

我想阅读一个文件夹中的文件列表,但其中只有一个有错误术语的问题,我已经确定了一个,但我不知道如何解决它。

我只在一个数据集上遇到了这个问题,而对于其他数据集我从未收到过这个问题。这可能是因为我使用了另一个命令来保存数据,因此它没有将数据保存为字符。我已经尝试在阅读 csv 时使用以下术语来解决问题,但它没有用。

有人有同样的问题并且知道如何解决吗?非常感谢!

0 投票
0 回答
228 浏览

r - Twitter 流与 R 包 rtweet 过早断开连接

我正在尝试使用 r 包下载推文的实时流{rtweet}
似乎当我使用不受欢迎的主题标签时,我收到以下消息:

流式推文 600 秒...
流过早断开连接。重新连接...

当我使用流行的主题标签时,这似乎并不经常发生,
但是一段时间后流最终会断开连接......

我正在使用 while 循环和 if else 每 10 分钟将新推文附加到 googlesheet。我的代码还为每次运行的迭代添加了一个带有时间戳的列。

谁能帮我理解为什么它似乎适用于流行的推文(即#trump)而不是目前不流行的东西?如果在 10 分钟的流式传输期间没有找到带有索引主题标签的推文,则该代码应该附加一个空行。当它工作时,它工作得很好,但也许我需要改变一些东西,以便不受欢迎或非趋势的推文不会导致它断开连接?

我已经阅读了这篇似乎表明类似问题的上一篇文章,但我认为我不应该每隔 10 分钟就收到此错误。链接到上一个问题我尝试使用流行的主题标签和 3 小时间隔运行此脚本,但在运行一夜之后,它仍然过早断开连接。

在连接断开的情况下,如何在 rstudio 中自动重新运行脚本?说,如果发生这种情况时我不在我的电脑附近?

非常感谢任何帮助。

0 投票
1 回答
169 浏览

r - rtweet“search_tweets”函数不返回坐标

我正在使用 rtweets 库(search_tweets 函数)从 twitter 中检索数据。所有数据都存在,除了位置数据,我只得到“NA”。更奇怪的是我偶尔会得到坐标(但很少)。

这就是我得到的coords_coords变量(这里只是显示一个随机部分以突出我有时如何获得一个值)。在此先感谢您的帮助!

[[917]] [1] 不适用

[[918]] [1] 不适用

[[919]] [1] 不适用

[[920]] [1] 不适用

[[921]] [1] 43.77429 -79.71640

[[922]] [1] 不适用

[[923]] [1] 不适用

0 投票
3 回答
453 浏览

r - 使用 rtweet 从推文中获取媒体

我正在使用包rtweet来搜索包含关键字列表的所有推文(请参见下面的示例代码)。我想从这些推文中提取有关它们是否包含媒体(即照片或视频)的信息,对于那些确实包含媒体的信息,请提取它。

所有这些都应该使用以下代码来工作:

Step1 - 搜索推文:

第 2 步 - 过滤掉所有转推,只保留那些带有 media_url 而不是 NA 的转推(即带有图像的结果):

第 3 步 - 下载媒体。

一旦我有了这个数据集,我就会使用函数download.file().


问题:大多数(但不是全部!!)包含媒体的推文在步骤 2 中被过滤掉,因为从search_30day()函数获得的 media_url 列是NA. 关于为什么包含媒体的推文不显示其 media_url 的任何想法?感谢您的任何反馈!

更新:我正在使用 twitter 开发人员“沙盒”帐户(免费)进行此操作。也许某些功能(例如提取 media_url)仅适用于付费帐户?但是,我确实看到NA了一小部分推文的非 media_url ......

0 投票
1 回答
51 浏览

twitter - 如何获得特定追随者的总收藏数?

我想知道用户 A 的特定追随者 B 收藏了多少条推文。有没有办法使用 Pythontweepy或 R来做到这一点rtweet

非常感谢!

0 投票
0 回答
190 浏览

r - Rtweets 身份验证问题

我使用出色的 Rtweet 包进行临时分析。我正在就某些功能教授一个研讨会,并尝试通过从我的 Renviron 中删除 TWITTER_PAT 来删除我的身份验证以显示从头到尾的整个过程。

结果是我尝试从头开始进行身份验证,但收到以下错误:

根据我的命令提示符,我不相信该文件甚至在该目录中。

我已经尝试卸载并重新安装 rtweet。我也重新启动了我的电脑。关于如何解决这个问题的任何想法?

0 投票
0 回答
14 浏览

r - 在推文发布后提取第一个转发

我尝试从 twitter 中提取“转推级联”,即我想选择某条推文,然后提取其转推。我知道这个函数get_retweets(),但是这个函数只提取最近的转发,而我想要最早的转发。我也知道可以提取的转发数量是有限制的,所以很明显,我不能只提取所有转发,然后按它们的时间戳对它们进行排序。有没有办法做到这一点?

最终,我想应用一个霍金斯自激过程模型,因此必须先进行转发。

0 投票
1 回答
950 浏览

r - 如何将 Twitter 数据转换为 csv 文件?

我正在分析 Twitter 数据并使用该rtweet包来访问我需要的数据。大多数情况下它工作正常,我得到了我想要的推文。我的问题是,我需要将数据转换为 csv 文件,以便可以在 Excel 中打开它。

我尝试使用以下代码另存为 csv,但是当我在 Excel 中打开它时,一切都搞砸了。write_as_csv(denmarkdotdk_tweets_organic, file_name = "DK1tweets.csv", prepend_ids = TRUE, na ="", fileEncoding = "UTF-8") save_as_csv(denmarkdotdk_tweets_organic, file_name="DK1tweets.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")

到目前为止,我已经通过下面显示的命令下载了数据。我希望有人能回答我的问题:)