3

我从 Libsvm的数据集页面下载了 Mnist 数据集。所有样本如下:

5 153:3 154:18 155:18 156:18 157:126 ...

有谁知道那是什么意思?5是类标签,但什么是153:3对例如?我也无法从mnist 自己的网页中找到含义。

4

1 回答 1

7

这是libsvm编码(稀疏)向量的方式。正如你所说5的是标签,以下对i:v表示i向量的第 - 个条目是v。因此,您可以将 3-dim 向量 (a,b,c) 编码为

1:a 2:b 3:c

这对于密集向量效率低下,但对于稀疏数据来说是一种良好且成熟的格式。由于它是纯文本,存储空间不是最佳的,但对于大多数应用程序来说已经足够了。而文件易于编写和阅读。

于 2011-09-19T11:12:02.383 回答