python - Scikit-Learn：加载和转储多标签 SVM 光格式

Question

在 scikit-learn 中，提供了两个函数来加载和转储 SVM^light 格式的文件：

sklearn.datasets.load_svmlight_file 和 sklearn.datasets.dump_svmlight_file

文档显示（并且函数支持） load_svmlight_file 可以加载多标签数据，即目标类别用逗号分隔，而不是单个类别作为目标。但是，dump_svmlight_file 似乎不支持这一点。

我是不是读错了，或者 dump_svmlight_file 出于某种原因不支持这个？它甚至不可能通过传递带有基于字符串的目标值的 y 向量来“欺骗它”，因为文件编写器需要一个浮点值。转储文件代码可以在https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py第 230 到 262 行找到。

score 3 · Accepted Answer

你是对的，dump_svmlight_file目前不支持多标签任务。这是一个遗漏；您可以为其提交错误报告，尽管一个好的补丁（拉取请求）会导致更快的操作。

（签名，该模块的作者之一。）

python - Scikit-Learn：加载和转储多标签 SVM 光格式

1 回答 1

Related

Reference