r - 带有 R 的 topicmodels 包的 LDA，我如何获得每个术语的主题概率？

Question

我正在为 LDA 使用 topicmodels 包。我想创建一个可视化，显示每个主题的相关性或非相关性。我设想一组词是主题 1 独有的，但有一些共享的关键字连接到另一个主题。这里的任何建议都会很棒。接着说：

为此，我需要知道每个主题的每个术语概率。我如何通过 topicmodels 包获得这个？我可以通过以下方式查看条款：

terms(LDAmodel, 15)

但我不知道如何获得价值。想法？

score 1 · Accepted Answer

您可以使用posterior()$terms来获取每个术语的后验概率。posterior()$topics给出文档的概率.

示例改编自help(LDA)：

data("AssociatedPress", package = "topicmodels")
lda <- LDA(AssociatedPress[1:20,], k = 2)
terms <- posterior(lda)$terms

## posterior probability for the first 5 terms (alphabetically)
terms[,1:5]
         aaron      abandon    abandoned   abandoning       abbott
1 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44
2 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44

r - 带有 R 的 topicmodels 包的 LDA，我如何获得每个术语的主题概率？

1 回答 1

Related

Reference