1

我正在对推文进行文本挖掘,我收集了来自不同帐户的关于某个主题的随机推文,我将推文转换为数据框,我能够在这些推文中找到最频繁的推文(通过使用“screenName”列)。 ..就像那些推文:

[1] “ISCSP_ORG:#cybercrime NetSafe 发布网络钓鱼指南:奥克兰,2013 年 6 月 4 日,星期一——大多数新西兰人将拥有... http://t.co/dFLyOO0Djf

[1] “ISCSP_ORG:#cybercrime 业务简介:MILL CREEK — HM Jackson 高中 DECA 分会成员赢得了组织... http://t.co/auqL6mP7AQ

[1] “BNDarticles:您如何保护您的#smallbiz 免受 #cybercrime 的侵害?这是他们进入的前 3 种新方法以及如何阻止它们。http: //t.co/DME9q30mcu

[1]“TweetMoNowNa:RT @jamescollinss:@senatormbishop 这与我在与#cybercrime 的斗争中遇到的问题相同。\“既得利益者\”-告诉我是否……”

[1] “jamescollinss:@senatormbishop 这与我在与#cybercrime 的斗争中遇到的问题相同。\“既得利益者\” - 告诉我你是否有办法!”

有不同的推特发了很多推文(在收集的数据集中)

现在,我想为他们相应的推文/用户收集/分组相关推文。有没有办法使用 R 来做到这一点?有什么建议吗?您的帮助将不胜感激。

4

0 回答 0