0

我有一个从 youtube 评论构建的术语文档矩阵

约 977 份文件

使用以下方法创建了一个术语文档矩阵:

dtm <- DocumentTermMatrix(doc_corpus)

然后应用该功能

findAssocs(dtm,"hello", 0.6)

得到以下(从法语翻译)

Error in which (x [term],> corlimit): index out of bounds

所有其他功能都像 findFreqTerms 和 hclus 等一样工作

4

1 回答 1

2

您会收到错误消息,因为术语集中不存在该词。您可以使用以下方法检查:

'hello' %in% Terms(dtm)

应该返回 FALSE。

于 2013-03-18T15:11:45.180 回答