python - Vowpal Wabbit LDA：模型选择

Question

大众内部有什么方法可以比较 LDA 的模型拟合度吗？软件输出的渐进式损失是否对这个目的有意义？

score 0 · Accepted Answer

运行vw -h --lda 1帮助时提供以下参数。该metrics参数默认为关闭。它用于计算此处实现的主题连贯性。尝试通过传递启用此功能--metrics 1

Latent Dirichlet Allocation:
  --lda arg                             Run lda with <int> topics

  --lda_alpha arg (=0.100000001)        Prior on sparsity of per-document topic
                                        weights
  --lda_rho arg (=0.100000001)          Prior on sparsity of topic 
                                        distributions
  --lda_D arg (=10000)                  Number of documents
  --lda_epsilon arg (=0.00100000005)    Loop convergence threshold
  --minibatch arg (=1)                  Minibatch size, for LDA
  --math-mode arg (=0)                  Math mode: simd, accuracy, fast-approx
  --metrics arg (=0)                    Compute metrics

或者直接跳转到vw utility 的源码中。

可以在此处找到展示大多数参数的有用演示文稿。

Python：如果您使用的是 gensim

（你用标记了这个问题python）

如果您使用的是gensimvwmodel2ldamodel (< 4.0.0) 中提供的 python 包装器，您可以简单地使用 Gensim，就好像您在使用或直接使用log_perplexity或其他一致性措施后由 Gensim 本身训练模型一样。

可以在此处找到有关如何比较多个 LDA 模型的好教程。

score -1 · Accepted Answer

在 R 统计包中，您可以诊断模型是否适合此类程序

如何在 vowpal wabbit 中计算 LDA 模型的对数似然

我还在那里询问大众的机会

python - Vowpal Wabbit LDA：模型选择

2 回答 2

Python：如果您使用的是 gensim

Related

Reference