我正在尝试从以下来源解码数据集:http: //yann.lecun.com/exdb/mnist/
底部有“非常简单”的 IDX 文件类型的描述,但我无法弄清楚。
我想要实现的是:
var imagesFileBuffer = fs.readFileSync(__dirname + '/train-images-idx3-ubyte');
var labelFileBuffer = fs.readFileSync(__dirname + '/train-labels-idx1-ubyte');
var pixelValues = {};
变魔术
pixelValues 现在是这样的:
// {
// "0": [0,0,200,190,79,0... for all 784 pixels ... ],
// "4": [0,0,200,190,79,0... for all 784 pixels ... ],
等用于数据集中的所有图像条目。我试图弄清楚二进制文件的结构,但失败了。