2

我正在使用 topicmodels 包运行 LDA。

lda.model = LDA(dtm, k,control = list(em = list(iter.max = 1000, tol = 10^-4)))
apps.terms<-terms(lda.model,15)
head(apps.terms)

    Topic.1 Topic.2 Topic.3 Topic.4 Topic.5
1      38      55     187      38      38
2      40      38     171      40      35
3      55      35     178      56      44
4      49      49      74      35      55
5      35      44     177     190      52
6      44      53      80      55      49

这些代码按比例获得 15 个术语的顺序。如果我不是很了解 LDA 算法的话。每个主题都是术语的分布。所以我想知道这些术语的确切分布。例如。Topic.1 30% 与 38 相关,20% 与 40 ..etc 相关。有没有办法通过使用topicmodels包来获得它?

4

1 回答 1

1

听起来您想要每个文档的后验概率。

lda.inf <- posterior(lda.model,dtm)
于 2015-12-31T19:12:27.537 回答