Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在用 mallet 进行主题建模。我已经导入了我的文件(一行中的每个文档),并且我用 200 个主题训练了 mallet。现在我有 200 个主题,每个主题都有与之相关的单词。现在我需要了解每个主题` s 概率。我怎么知道?谢谢
该命令bin/mallet train-topics有一个选项--output-doc-topics topic-composition.txt。这会以制表符分隔的文本格式输出一个大表,其中包含每个文本的主题组成。
bin/mallet train-topics
--output-doc-topics topic-composition.txt