我有一堆文本文档,我将它们扔给 tfidf 矢量化器,我进一步将其用于多标签文本分类。将来我会不断收到更多的文件。现在,如何在不从头开始重新训练模型的情况下向它从未见过的向量器添加新单词?partial_fit 是唯一的选择吗,导致 OvR 和管道无法使用它?这是我说的在线学习文本文档的链接。
我有一堆文本文档,我将它们扔给 tfidf 矢量化器,我进一步将其用于多标签文本分类。将来我会不断收到更多的文件。现在,如何在不从头开始重新训练模型的情况下向它从未见过的向量器添加新单词?partial_fit 是唯一的选择吗,导致 OvR 和管道无法使用它?这是我说的在线学习文本文档的链接。