有人知道ImageNet数据集中图像的分辨率吗?
对不起,我在他们的网站或任何报纸上都找不到。
图像的尺寸和分辨率各不相同。许多应用程序将所有图像的大小/裁剪为 256x256 像素。
ImageNet 上的平均图像分辨率为 469x387 像素。正如@Prune 所说,通常它会应用预处理将它们采样为 256x256,但这取决于手头的任务。
这取决于图片,但您可以调整它们的大小。图片的较小尺寸应至少为 256 像素,并且纵横比应保持不变。
在对一个随机 ImageNet 2012 文件夹(Fish)的简要检查中......最大的图像是 4288 x 2848 像素。最小的图像为 75 x 56 像素。这是代表纵横比范围的。
224 X 224
被大多数网络使用。
以下文章对此有详细解答:https ://towardsdatascience.com/compression-in-the-imagenet-dataset-34c56d14d463
本质上,最常见的图像尺寸是 500x500,但是,图像尺寸分布很大。通常,图像的宽度或高度为 500 像素,如果不是两者都有。最常见的纵横比为 1:1、4:3、3:2(以及 3:4 和 2:3)。