如何测试未知单词的文本分类问题?在训练模型时,我们可以使用平滑技术(Laplace add-1)来确保任何单词对于每个类都至少得到 1 个计数。
那么,在测试阶段呢?如果训练数据中没有出现某个单词,那么最好的处理方法是什么?简单地跳过它,或者也给它一个 1 的出现?
谢谢,任何建议或意见。具体来说,我使用的是朴素贝叶斯分类器。
如何测试未知单词的文本分类问题?在训练模型时,我们可以使用平滑技术(Laplace add-1)来确保任何单词对于每个类都至少得到 1 个计数。
那么,在测试阶段呢?如果训练数据中没有出现某个单词,那么最好的处理方法是什么?简单地跳过它,或者也给它一个 1 的出现?
谢谢,任何建议或意见。具体来说,我使用的是朴素贝叶斯分类器。