大众内部有什么方法可以比较 LDA 的模型拟合度吗?软件输出的渐进式损失是否对这个目的有意义?
问问题
228 次
2 回答
0
运行vw -h --lda 1
帮助时提供以下参数。该metrics
参数默认为关闭。它用于计算此处实现的主题连贯性。尝试通过传递启用此功能--metrics 1
Latent Dirichlet Allocation:
--lda arg Run lda with <int> topics
--lda_alpha arg (=0.100000001) Prior on sparsity of per-document topic
weights
--lda_rho arg (=0.100000001) Prior on sparsity of topic
distributions
--lda_D arg (=10000) Number of documents
--lda_epsilon arg (=0.00100000005) Loop convergence threshold
--minibatch arg (=1) Minibatch size, for LDA
--math-mode arg (=0) Math mode: simd, accuracy, fast-approx
--metrics arg (=0) Compute metrics
或者直接跳转到vw utility 的源码中。
可以在此处找到展示大多数参数的有用演示文稿。
Python:如果您使用的是 gensim
(你用 标记了这个问题python
)
如果您使用的是gensimvwmodel2ldamodel
(< 4.0.0) 中提供的 python 包装器,您可以简单地使用 Gensim,就好像您在使用或直接使用log_perplexity
或其他一致性措施后由 Gensim 本身训练模型一样。
可以在此处找到有关如何比较多个 LDA 模型的好教程。
于 2021-05-04T16:46:50.853 回答
-1
于 2015-07-22T11:27:21.453 回答