1

我刚刚开始进行文本挖掘,我正在尝试通过 Twitter Api 获取现在利物浦热门话题的推文,并在 wordcloud 中表示它们。

但是,当getTrends从库中获取具有功能的趋势时twitteR,我无法找到与该趋势主题的提及次数相对应的任何内容。我想要这个数字,因为我想按提及次数对趋势进行排序,以便在 wordcloud 上正确地表示它们。

编码:

library(twitteR)
library(wordcloud)

Locs=availableTrendLocations()
locsEngland=subset(Locs,country="United Kingdom")
id=subset(locsEngland,name=="Liverpool")
trends=getTrends(woeid = id)
trends=Corpus(VectorSource(trends$name))
trends=TermDocumentMatrix(trends)
ap.tdm=as.matrix(trends)
ap.v=sort(rowSums(ap.tdm),decreasing = T)
ap.d=data.frame(word=names(ap.v),freq=ap.v)

wordcloud(ap.d$word,ap.d$freq, scale=c(3,0.5), max.words=50, random.order=FALSE, rot.per=0.15, use.r.layout=FALSE, colors=brewer.pal(,"Dark2"))

也许一种可能的方法是,获得一个趋势主题,如果它们是有序的,枚举它们(附加一列)并将其用作术语频率,但猜测一定有更好的方法,尽管我在文档中没有发现任何内容

4

0 回答 0