嘿,这是我的问题,
给定一组文档,我需要将每个文档分配给预定义的类别。
我打算使用 n-gram 方法来表示每个文档的文本内容,然后在我拥有的训练数据上训练一个 SVM 分类器。
如果我错过了理解的东西,请纠正我。
现在的问题是类别应该是动态的。这意味着,我的分类器应该处理具有新类别的新训练数据。
例如,如果我训练了一个分类器将给定文档分类为 A 类、B 类或 C 类,然后我得到了 D 类的新训练数据。我应该能够通过向分类器提供“D 类”的新训练数据。
总而言之,我不想将旧的训练数据(具有 3 个类别)和新的训练数据(具有新的/未见过的类别)结合起来并再次训练我的分类器。我想即时训练我的分类器
这可以用 SVM 实现吗?如果没有,你能推荐我几种分类算法吗?或任何可以帮助我的书/论文。
提前致谢。