0

我是tmR 中的新手。我在语料库上运行以下代码,但输出DocumentTermMatrix并未考虑所有条款。

corpus = Corpus(VectorSource(text))
corpus = tm_map(corpus, PlainTextDocument)
dtm = DocumentTermMatrix(corpus)
dtm
# DocumentTermMatrix (documents: 20517, terms: 2)

它只显示两个术语,而我的数据集中有超过 15 个术语。有人可以帮忙吗?

4

0 回答 0