-2

我正在使用 libsvm 库对简历进行文档分类。我有多份简历,我需要对它们进行分类。在这种情况下,我需要多标签分类还是多类分类。我应该考虑以上哪个选项,还请提出一种方法来做到这一点?

4

1 回答 1

0

您的要求并不直接,为了开发这样的系统,您需要提出几个步骤,例如:

  1. 你需要一个不同类型文档的数据集(各种类型的简历)

  2. 然后你需要确定可以用来区分它们的特征类型(你将如何区分它们,基于什么(例如,简历长度、字数、简历标题的内容等))

  3. 然后你需要准备一组特征向量来训练 SVM。(如果你只需要对相关和不相关的简历进行分类,这将是两个类。如果有两个以上的类,这将是多类,LibSVM 支持多类)

  4. 训练时,您需要执行缩放、交叉验证以提高准确性(阅读此处

  5. 您需要完成上述步骤才能成功预测。

于 2015-03-28T10:49:06.507 回答