-1

大众内部有什​​么方法可以比较 LDA 的模型拟合度吗?软件输出的渐进式损失是否对这个目的有意义?

4

2 回答 2

0

运行vw -h --lda 1帮助时提供以下参数。该metrics参数默认为关闭。它用于计算此处实现的主题连贯性。尝试通过传递启用此功能--metrics 1

Latent Dirichlet Allocation:
  --lda arg                             Run lda with <int> topics

  --lda_alpha arg (=0.100000001)        Prior on sparsity of per-document topic
                                        weights
  --lda_rho arg (=0.100000001)          Prior on sparsity of topic 
                                        distributions
  --lda_D arg (=10000)                  Number of documents
  --lda_epsilon arg (=0.00100000005)    Loop convergence threshold
  --minibatch arg (=1)                  Minibatch size, for LDA
  --math-mode arg (=0)                  Math mode: simd, accuracy, fast-approx
  --metrics arg (=0)                    Compute metrics

或者直接跳转到vw utility 的源码中

可以在此处找到展示大多数参数的有用演示文稿。

Python:如果您使用的是 gensim

(你用 标记了这个问题python

如果您使用的是gensimvwmodel2ldamodel (< 4.0.0) 中提供的 python 包装器,您可以简单地使用 Gensim,就好像您在使用或直接使用log_perplexity或其他一致性措施后由 Gensim 本身训练模型一样。

可以在此处找到有关如何比较多个 LDA 模型的好教程。

于 2021-05-04T16:46:50.853 回答
-1

在 R 统计包中,您可以诊断模型是否适合此类程序

如何在 vowpal wabbit 中计算 LDA 模型的对数似然

我还在那里询问大众的机会

于 2015-07-22T11:27:21.453 回答