0

我有一个功能“技能”,它是一个多值参数。我想用它作为分类的特征。我不知道如何使用它来训练我的模型。

例如,一项工作具有某些所需的技能(例如 Java、Node.js、MVC),对于不同的工作可能会有所不同。我必须使用技能作为参数之一。

任何帮助,将不胜感激。谢谢。

4

1 回答 1

2

处理多值特征的一种常用方法是将它们拆分。如果您知道数据集中所有可能的技能,请为每个单独的技能创建一个特征。如果样本中存在该技能,则相应的特征为 1,否则为 0。

例如

skill = "Java,MVC"

变成多个功能:

Java = 1, Node.js = 0, MVC = 1

这种方法的缺点是,如果你有许多不同的技能,你的特征空间就会爆炸。这意味着您的模型容易过度拟合。

于 2015-12-15T08:47:20.237 回答