weka - 是否可以使用 StringToWordVector 来提升一些单词

Question

我正在使用 StringToWordVector Naive Bayes 和 StringToWordVector 对一些文本进行分类。我还使用 TD/IDF 对单词进行评分。

有没有一种简单的方法可以在训练期间增加某些单词（我自己选择）的分数，以增加这些单词在给定类的模型中的权重？因此，如果这些词出现在新文档中，分类器就会知道该文档属于此类的可能性更大。

谢谢！

score 0 · Accepted Answer

您希望增加包含某些单词的文档被归类为某种文档的概率。

您可以做的是简单地使用包含这些单词的“手工制作”文档来训练您的分类器，然后将这些文档标记为属于特定类别。

1 回答 1