3

对于分类或回归问题,如果

“X”是大小为 m X n 的输入矩阵,“Y”是大小为 m X k 的预期输出/标签矩阵。

然后我需要一个 k >= n 的数据集。(如果也可能,“Y”应该是高密度标签)

这就是标签/输出的数量超过输入特征空间的地方。你能给我推荐一个这样的数据集吗?

问候,

4

2 回答 2

0

LIBSVM Data上有很多这样的数据集。它包含许多分类、回归、多标签和字符串数据集。许多来自 UCI、Statlog、StatLib 和其他集合。

于 2015-04-21T14:31:10.523 回答
0

这里有很多多标签数据集,其中一个有 500 个标称属性和 983 个标签。您还可以获取其他数据集并删除一些特征(随机或通过特征选择),以使它们的数量少于标签。

于 2015-04-15T20:07:28.453 回答