我在 R 中为 2 首歌曲制作了一个词云。现在在 tdm 中,当我显示项目时,我得到了歌曲 1 和歌曲 2 的词频。我也能够完美地打印词云。我的问题是我不想要频率小于 2 的 tdm 中的单词。我该怎么做。
我编写了代码并得到了这个输出:
tdm=TermDocumentMatrix(corpus)
> tdm=as.matrix(tdm)
>
> tdm
>
song 1 song 2
act 0 2
action 0 2
actions 0 1
activity 5 4
我只想要单词活动,因为它在两首歌中都出现了不止一次。我的意思是我想删除这些词、行为、行为、行为。我怎样才能做到这一点 ?