我已成功将 MNIST 数据集加载到 Theano 共享变量中,如下所示
# Read MNIST dataset from gzipped file as binary
f = gzip.open('mnist.pkl.gz', 'rb')
# Store dataset into variable
train_set = cPickle.load(f)
# Close zipped file
f.close()
# Store data in Theano shared variable
train_set_x = theano.shared(numpy.asarray(train_set, dtype=theano.config.floatX)) # Data
train_set_y = theano.shared(numpy.asarray(train_set, dtype=theano.config.floatX)) # Labels
# Cast labels into int
train_set_y = theano.tensor.cast(train_set_y, 'int32')
我的问题是如何访问 train_set_x 和 train_set_y 中的数据。数据集中的每张图像都是 28 * 28 像素。这是一个长度为 784 的向量,向量中的所有元素都是浮点数,表示 0.0 到 1.0 之间的值(包括 0.0 和 1.0)。标签被转换为 int 因为它表示与每个矢量图像关联的标签,并且是一个介于 0 和 9 之间的值。我希望能够遍历 train_set_x 矩阵图像和 train_set_y 标签以查看每个图像的数据及其标签分别并最终在屏幕上绘制图像。