lda - 从 lda gensim 检索主题词数组和文档主题数组

Question

情况：

我有一个 numpy 术语文档矩阵示例：[[0,1,0,0....],....[......0,0,0,0]]。

我已将上述矩阵插入到 gensim 的 ldamodel 方法中。使用 lad 方法效果很好lda = LdaModel(corpus, num_topics=10)。 corpus是我上面提到的术语文档矩阵。我需要两个中间矩阵（主题词数组和文档主题数组）用于研究目的。

1) 每个文档-主题概率矩阵 (p_d_t)

2）每个主题词概率矩阵（p_w_t）

问题：

如何从 gensimLdaModel()函数中获取这些数组。？请帮助我获得这些矩阵。

score 10 · Accepted Answer

1.Per-document主题概率矩阵：

将转换应用于您的语料库。

docTopicProbMat = lda[corpus]

K = lda.num_topics topicWordProbMat = lda.print_topics(K)

1 回答 1