我正在使用 StringToWordVector Naive Bayes 和 StringToWordVector 对一些文本进行分类。我还使用 TD/IDF 对单词进行评分。
有没有一种简单的方法可以在训练期间增加某些单词(我自己选择)的分数,以增加这些单词在给定类的模型中的权重?因此,如果这些词出现在新文档中,分类器就会知道该文档属于此类的可能性更大。
谢谢!
我正在使用 StringToWordVector Naive Bayes 和 StringToWordVector 对一些文本进行分类。我还使用 TD/IDF 对单词进行评分。
有没有一种简单的方法可以在训练期间增加某些单词(我自己选择)的分数,以增加这些单词在给定类的模型中的权重?因此,如果这些词出现在新文档中,分类器就会知道该文档属于此类的可能性更大。
谢谢!