1

我正在为 Java 项目使用Mallet库。

我有 15,000 个文档,每个文档有 400 个令牌。我尝试使用ParallelTopicModel. 但我想要一组既包含单个标记又包含标记序列的主题(例如“Java”和“Java Developer”)。

我正在考虑使用 LDA-HMM。我可以使用什么级别的槌?

然后我会将每个主题变成贝叶斯网络的节点,以接收一个令牌或令牌序列作为证据,并进行推理。我可以为此使用哪个 Java 库?

提前致谢。弗朗切斯科

4

0 回答 0