我有一组从显微镜下拍摄并使用高分辨率相机记录的细菌图像数据集。图像的分辨率为 800x600,在另一个数据集(取自不同的显微镜)中,分辨率约为 5312x2988。VGG16 和 InceptionV3 等模型在 224x224 的图像分辨率上进行训练。
如何正确地将图像数据输入网络。我是否将图像缩减为 224x224?我认为这会导致预测所需的质量损失过多。还有其他更好的方法吗?
我有一组从显微镜下拍摄并使用高分辨率相机记录的细菌图像数据集。图像的分辨率为 800x600,在另一个数据集(取自不同的显微镜)中,分辨率约为 5312x2988。VGG16 和 InceptionV3 等模型在 224x224 的图像分辨率上进行训练。
如何正确地将图像数据输入网络。我是否将图像缩减为 224x224?我认为这会导致预测所需的质量损失过多。还有其他更好的方法吗?
原则上,我看到了三种可能性:
首先裁剪图像。也许您想检测细菌,并且您可以使用图像的裁剪来在图像的每个裁剪中找到细菌。
其次调整图像大小。如果无法进行裁剪,并且您想使用 inception V3 模型的图像大小,则必须将图像大小调整为 224x224。请记住,一个 20x10 的区域就是一个像素。因此,如果您在原始图像中寻找小区域,这将不起作用。
使用更大的输入图像尺寸。您可以添加到初始模型并在初始模型的输入之前添加层。然后,您可以学习合理的下采样。我只建议您在其他方法失败的情况下这样做,因为使用这种方法的文献并不多,这可能是有原因的。