嗨,我正在关注他们使用 MNIST 数据库的教程。现在他们使用 cPickle 解压缩数据并获取列表元组等。我想使用自己的数据,但我有 csv 格式的数据,我不确定如何转换为 MNIST 格式。我使用 48 个单位作为训练数据,最后一个是我想要的结果
我如何拥有 csv 文件的示例:
1,2,3..........48,1
在我遵循的教程中,他们使用了这个:
training_data, validation_data, test_data = cPickle.load(f)
如果我
打印训练数据
我明白了:
(array([[ 0., 0., 0., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 0., 0., 0.],
...,
[ 0., 0., 0., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 0., 0., 0.]], dtype=float32), array([5, 0, 4, ..., 8, 4, 8]))
打印训练数据[0]
[[ 0. 0. 0. ..., 0. 0. 0.]
[ 0. 0. 0. ..., 0. 0. 0.]
[ 0. 0. 0. ..., 0. 0. 0.]
...,
[ 0. 0. 0. ..., 0. 0. 0.]
[ 0. 0. 0. ..., 0. 0. 0.]
[ 0. 0. 0. ..., 0. 0. 0.]]
print training_data[0][0] 是每个集合的值的 numpy.array(),training_data[1][0] 是和 float32 以及每个集合的期望输出。
我正在做的代码是这样的,但是我对提示符上显示的 array() 和 dtype=float32 感到困惑
def load(filename):
finalDataset = []
res = 0
with open(filename, 'rb') as csvfile:
lines = csv.reader(csvfile)
datos = list(lines)
for i in datos:
tempA = np.array(i[:len(datos)-2]).astype(np.float64)
tempB = np.float64(i[len(datos)-1:])
finalDataset.append((tempA,tempB))
return finalDataset