5

情况:

我有一个 numpy 术语文档矩阵示例:[[0,1,0,0....],....[......0,0,0,0]]。

我已将上述矩阵插入到 gensim 的 ldamodel 方法中。使用 lad 方法效果很好lda = LdaModel(corpus, num_topics=10)corpus是我上面提到的术语文档矩阵。我需要两个中间矩阵(主题词数组和文档主题数组)用于研究目的。

1) 每个文档-主题概率矩阵 (p_d_t)

2)每个主题词概率矩阵(p_w_t)

问题:

如何从 gensimLdaModel()函数中获取这些数组。?请帮助我获得这些矩阵。

4

1 回答 1

10

1.Per-document主题概率矩阵:

转换应用于您的语料库。

docTopicProbMat = lda[corpus]
  1. 每主题词概率矩阵:

K = lda.num_topics topicWordProbMat = lda.print_topics(K)

于 2014-09-21T02:45:02.580 回答