我是 GAN 这个领域的新手,我尝试了一些教程,但是,其中大部分使用了 Cifar 或 mnist 数据集。所以大多数都是以这样的格式(xxxx、28、28)构建的。
最近,我想试试我们的另一张照片。例如,
from scipy import misc
data = misc.imread("1.PNG") #this can be any images from JPEG or any
print(data.shape)
我的输出:
(842, 1116, 4) # Seriously I dont understand what does this mean. 842 means 842 files? I thought I have only 1 image loaded.
我的预期输出:
由于我是新手,我真的很想提出问题,应该是 (1, 28, 28) 还是其他?这样我就可以适应 GAN,因为它在教程中使用了 784
通常,在 mnist 的数据集中,我们有 (60000, 28, 28),这意味着 60k 张图片,每张图片的形状为 28x28。我上面的输出呢?(842, 1116, 4) 不是指 842 张 1116 x 4 的图片吧?我只加载了一张图片。有人可以帮助我如何转换它并理解它。谢谢你