2

我可以制作词云,但我的问题是当我计算词数的频率时,我得到频率为 1 的词。我想要频率大于 2 的词。我该怎么做?

tdm 只是一个术语矩阵。我尝试过类似的东西rowSums(m>2),但它不起作用

# define tdm as matrix
m = as.matrix(tdm)
# get word counts in decreasing order
word_freqs = sort(rowSums(m), decreasing=TRUE) 
# create a data frame with words and their frequencies
dm = data.frame(word=names(word_freqs), freq=word_freqs)

试图从https://sites.google.com/site/miningtwitter/questions/talking-about/wordclouds/wordcloud1

4

1 回答 1

2

您可以word_freqs在构造 data.frame 之前简单地过滤:

word_freqs <- word_freqs[word_freqs > 2]
于 2013-11-21T03:02:01.047 回答