1

我正在使用 StringToWordVector Naive Bayes 和 StringToWordVector 对一些文本进行分类。我还使用 TD/IDF 对单词进行评分。

有没有一种简单的方法可以在训练期间增加某些单词(我自己选择)的分数,以增加这些单词在给定类的模型中的权重?因此,如果这些词出现在新文档中,分类器就会知道该文档属于此类的可能性更大。

谢谢!

4

1 回答 1

0

您希望增加包含某些单词的文档被归类为某种文档的概率。

您可以做的是简单地使用包含这些单词的“手工制作”文档来训练您的分类器,然后将这些文档标记为属于特定类别。

于 2013-10-31T14:56:03.430 回答