对于分类或回归问题,如果
“X”是大小为 m X n 的输入矩阵,“Y”是大小为 m X k 的预期输出/标签矩阵。
然后我需要一个 k >= n 的数据集。(如果也可能,“Y”应该是高密度标签)
这就是标签/输出的数量超过输入特征空间的地方。你能给我推荐一个这样的数据集吗?
问候,
对于分类或回归问题,如果
“X”是大小为 m X n 的输入矩阵,“Y”是大小为 m X k 的预期输出/标签矩阵。
然后我需要一个 k >= n 的数据集。(如果也可能,“Y”应该是高密度标签)
这就是标签/输出的数量超过输入特征空间的地方。你能给我推荐一个这样的数据集吗?
问候,
LIBSVM Data上有很多这样的数据集。它包含许多分类、回归、多标签和字符串数据集。许多来自 UCI、Statlog、StatLib 和其他集合。
这里有很多多标签数据集,其中一个有 500 个标称属性和 983 个标签。您还可以获取其他数据集并删除一些特征(随机或通过特征选择),以使它们的数量少于标签。