我即将开始注释我的图像以训练 YOLOv3 模型。在开始之前,我想确保可以在原始图像上创建注释。在训练前调整图像大小后,注释会分别改变吗?还是我应该先调整所有图像的大小然后开始注释?
问问题
1332 次
1 回答
3
没关系!您不必担心图像大小。你可以用任何大小注释你的数据集,当你开始训练时,Yolo 会根据网络大小调整训练图像的大小,例如 416x416、608x608。
另请注意,在原始 reporandom = 1
中,如果您在 cfg 文件中设置,则在每 10 次迭代期间更改网络大小。random = 1
意味着 Yolo 每 10 次迭代改变网络大小,通过在不同分辨率下训练网络来提高精度是有用的。
根据 Yolo 论文:
然而,由于我们的模型只使用卷积层和池化层,它可以动态调整大小。我们希望 YOLOv2 能够在不同大小的图像上运行,因此我们将其训练到模型中。我们不是固定输入图像的大小,而是每隔几次迭代就改变网络。每 10 批我们的网络随机选择一个新的图像尺寸。由于我们的模型下采样了 32 倍,因此我们从以下 32 的倍数中提取:{320, 352, ..., 608}。因此,最小的选项是 320 × 320,最大的选项是 608 × 608。我们将网络调整到该维度并继续训练。
但是,如果您使用的是AlexeyAB 的 repo,则调整大小过程不会保持纵横比https://github.com/AlexeyAB/darknet/issues/232#issuecomment-336955485
于 2019-04-25T06:35:09.457 回答