1

我希望使用 Mallet 按我定义的主题对不同的文档进行分类。我知道 Mallet 将首先确定主题,然后对文档进行分类,但我想跳过第一步,因为我已经有了一个主题列表,其中包含与之相关的单词。有什么方法可以使用我创建的预定义主题列表来使用 Mallet 对文档进行分类?

任何指导表示赞赏。谢谢!

4

1 回答 1

1

如果您正在进行无监督学习(没有训练示例,即每个主题的文档),您不能简单地设置主题。关键是训练算法事先对文档一无所知。它只是根据您提供的功能尝试分离/分发它们。

如果您在进行监督学习,那么主题实际上就是类,并且每个类都有文档。然后该算法尝试了解哪些特征对每个类很重要。在槌你应该使用分类模块。

可能有一些花哨的主题建模想法,它们根据特定的关键字合并/扭曲主题分布,但我认为 Mallet 不可能。

于 2014-10-20T20:04:56.927 回答