0

我有大约2000 X 2000像素的图像。我试图识别的对象尺寸较小(通常在100 X 100像素左右),但它们有很多。

我不想调整输入图像的大小、应用对象检测并将输出重新缩放回原始大小。这样做的原因是我只有很少的图像可以使用,我更喜欢裁剪(这会导致每个图像有多个训练实例)而不是调整到更小的尺寸(这会给我每个原始图像 1 个输入图像)。

是否有用于对象检测的复杂方法或裁剪和重新组装图像,尤其是在对测试图像进​​行推断时?

对于培训,我想我会取出随机作物,并将其用于培训。但是对于测试,我想知道是否有裁剪测试图像的特定方法,应用对象检测并将结果组合回来以获得原始大图像的输出。

4

1 回答 1

0

我想同时使用几个(我从未尝试过)网络是一种选择,对你来说,每个 1*1 使用 4*4(500+50 * 500+50),然后在输出阶段重新组装,(可能在边界使用 NMS,因为您提到目标很密集)。

但这很奇怪。

您知道使用高分辨率图像进行检测的一个见解是使用“U”形快捷方式更改主干,这可以解决一些问题而无需调整图像大小。参考 U-Net。

于 2019-09-10T06:49:31.380 回答