0

我正在尝试从使用 R 的“lda”包构建的适合中提取主题分配。我创造了一个合适的:

fit <- lda.collapsed.gibbs.sampler(documents = documents, K = K, vocab = vocab, 
    num.iterations = G, alpha = alpha, eta = eta, initial = NULL, 
    burnin = 0, compute.log.likelihood = TRUE)

...并希望提取每个主题-文档分配的概率,或者只是每个文档最可能的主题。使用“topicmodel”包,我可以调用

topics(fit)

得到那个(就像在带有主题模型的 LDA 中,我怎样才能看到不同文档属于哪些主题?

我怎样才能用'lda'得到同样的结果?

4

1 回答 1

0

我没有使用 R 的“lda”包,但我在 R 中使用了“topicmodels”包,我创建了适合 5 个主题的 lda,使用

topic.fit <- LDA(文档术语矩阵,5)

现在,如果要提取每个主题文档分配的概率,请使用

topic.fit@gamma[1:5, ] , gamma 包含文档主题矩阵

并获得您可以使用的最有可能的主题

most.likely.topic <- topic(topic.fit, 1)

希望这能回答你的问题。

于 2015-10-26T04:26:11.833 回答