0

我对 lda-c-dist 包的推理结果有疑问。查看推理结果时应该显示多少个单词?例如,如果我将单词数设置为非常大的数 N(假设所有术语的数量为 N),则似乎存在一些单词组。在每组中,词的索引范围从 1 到 N。

我得到的是,假设术语数是 10,我将显示的单词数分配给 10。

Topic 0xx:
001
008
009
002
003
007
000
004
005
006

看来,可能是我应该设置显示 3 的单词,而不是 10。

那么,对于一个主题,调用topics.py查看主题时,应该指定多少字呢?

此外,我将使用这个输出来计算两个主题的相似度。所以 ...

4

1 回答 1

0

实际上,可以有与词汇表一样多的项目。此处显示的只是表示的有限数量的概率降序。

于 2013-01-29T11:13:37.367 回答