我想可视化使用 LDA 算法进行的主题建模。我使用名为“pyldavis”的 python 模块和 jupyter notebook 作为环境。
import pyLDAvis.sklearn
...
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer)
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='mmds')
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='tsne')
它确实工作正常,但我并不真正了解 mds 参数......即使在阅读了文档之后:
mds :function 或函数的字符串表示
以 topic_term_dists 作为输入并输出 n_topics × 2 距离矩阵的函数。输出近似于主题之间的距离。有关默认函数的详细信息,请参见 js_PCoA()。如果为后两者安装了 sklearn 包,则字符串表示当前接受 pcoa(或大写变体)、mmds(或大写变体)和 tsne(或大写变体)。
有人知道btw有什么区别吗?mds='pcoa',mds='mmds',mds='tsne'?
谢谢!