我有一组适合的图像:大约 32000 张分辨率(256,256)的图像。我要构建的数据集类似于矩阵,因此输出形状为 (32000, 256*256)。
简单的解决方案是一个for
循环,类似:
#file_names is a list of paths
samples=[]
for file_name in file_names:
hdu=pyfits.open(file_name)
samples.append(hdu[0].data.flatten())
hdu.close()
#then i can use numpy.concatenate to have a numpy ndarray
这个解决方案非常非常慢。那么构建如此大的数据集的最佳解决方案是什么?