1

我有一个关于某事的问题,我正在应用主题建模 - R 语言中的 LDA,我用它来确定用户推文的主题,当我使用这个命令获取推文时我注意到了一些事情(最后 500 条推文没有转推)有时我得到 500 有时我得到 130 有时我得到 45 不同用户但相同的 n=500 ,背后的因素是什么

tweets <- userTimeline("BarackObama",n=500,includeRts = FALSE)

在此处输入图像描述

另外,如果我想从推文中删除用户的名称,我该如何在 R 中做到这一点,因为我注意到聚类主题的准确性不好,我不知道我们如何衡量 R 中这个东西的准确率。关于 TwitterR 是否支持阿拉伯推文的最后一个问题!

谢谢。

4

0 回答 0