-2

在网站上:http: //leon.bottou.org/projects/infimnist

它说 :

生成包含 MNIST8M 训练集的文件: $ infimnist lab 10000 8109999 > mnist8m-labels-idx1-ubyte $ infimnist pat 10000 8109999 > mnist8m-patterns-idx3-ubyte

但是,我不明白为什么它从 10 000 到 8 109 999 即使我这样做:8 109 999 - 10 000 ,它对我来说仍然没有意义。

对我来说,8M 将是 8 000 000 + 9 999,因为我将在 9 999 结束并从 10 000 到 8 009 999 开始,这将是 800 万张图像。

有谁明白为什么它计算为 8 109 999 ?

4

1 回答 1

0

根据一位 kaggle 用户的说法,这就是为什么:

8M 数据集是原始图像 + 134 失真/原始。所以有

135*60,000 = 8,100,000

训练图像。

添加 10,000 张测试图像,您将获得 8,110,000 张图像。

测试图像从索引 0 到 10,000-1=9,999,训练图像从索引 10,000 到 8,110,000-1 = 8,109,999。

我希望这有帮助。

原始数据集也在这里:

https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multiclass.html

你可以看到“# of data: 8,100,000”

于 2015-12-12T15:42:20.797 回答