3

我正在尝试使用 R 包进行一些主题建模topicmodels

根据这些说明R 文本文件和文本挖掘...如何加载数据,我已经使用 'tm' 包完成了我的预处理。

但是,当我在 R 中运行我的相关主题模型 (CTM)topicmodels时,我收到以下错误

 "Error in CTM...DocumentTermMatrix needs to have a term frequency weighting. 

我已经三次检查了 DocumentTermMatrix 的结构,显示它确实具有频率加权:

 A document-term matrix (26 documents, 413 terms)

 Non-/sparse entries: 4804/5934
 Sparsity           : 55%
 Maximal term length: 13 
 Weighting          : term frequency - inverse document frequency (normalized) (tf-idf)

任何有关如何使这项工作的建议将不胜感激!

4

1 回答 1

3

如果之前使用slam包,需要指定权重参数为weightTf:

m=as.simple_triplet_matrix(mm);
dtm <- as.DocumentTermMatrix(m,weighting =weightTf)
于 2013-05-06T09:35:45.517 回答