0

scikit-learn 数据集中的标签输入是否有任何通用格式?我看到它有用于输出的标签列表target_names。我想遵循 scikit 约定并在输入变量(例如性别)中保留一些关于标签的数据。这有什么约定吗?像这样的东西

>>> data_set.inputs["sex"]
{'male': 1, 'female': 0}
4

1 回答 1

1

没有存储分类特征名称信息的约定。你可以自由地做你想做的事。

或者,您可以使用原始格式存储原始数据,并在需要从数据构建模型时即时使用 DictVectorizer / FeatureHasher 和 LabelBinarizer。

于 2013-01-26T14:19:19.097 回答