0

使用槌我可以获得特定数量的主题及其单词。如何确保主题词具有概率分布(即总和为一)?

例如,如果我按以下方式运行它,我如何使用 mallet 给出的输出来确保主题 0 的主题词的概率加起来为 1?

mallet train-topics --input text.vectors --output-topic-keys topics.txt --output-doc-topics doc_comp.txt --topic-word-weights-file weights.txt --num-top-words 50 --word-topic-counts-file counts.txt --num-topics 3 --output-state topicstate.gz --alpha 1
4

0 回答 0