我对 lda-c-dist 包的推理结果有疑问。查看推理结果时应该显示多少个单词?例如,如果我将单词数设置为非常大的数 N(假设所有术语的数量为 N),则似乎存在一些单词组。在每组中,词的索引范围从 1 到 N。
我得到的是,假设术语数是 10,我将显示的单词数分配给 10。
Topic 0xx:
001
008
009
002
003
007
000
004
005
006
看来,可能是我应该设置显示 3 的单词,而不是 10。
那么,对于一个主题,调用topics.py查看主题时,应该指定多少字呢?
此外,我将使用这个输出来计算两个主题的相似度。所以 ...