machine-learning - 需要一个标签（输出基数）多于特征（输入基数）的数据集

Question

对于分类或回归问题，如果

“X”是大小为 m X n 的输入矩阵，“Y”是大小为 m X k 的预期输出/标签矩阵。

然后我需要一个 k >= n 的数据集。（如果也可能，“Y”应该是高密度标签）

这就是标签/输出的数量超过输入特征空间的地方。你能给我推荐一个这样的数据集吗？

问候，

score 0 · Accepted Answer

LIBSVM Data上有很多这样的数据集。它包含许多分类、回归、多标签和字符串数据集。许多来自 UCI、Statlog、StatLib 和其他集合。

score 0 · Accepted Answer

这里有很多多标签数据集，其中一个有 500 个标称属性和 983 个标签。您还可以获取其他数据集并删除一些特征（随机或通过特征选择），以使它们的数量少于标签。

2 回答 2