我的理解是,Anchor Boxes(在 Yolo v2 算法中)的动机是在 Yolo 的第一个版本(Yolo v1)中,不可能在同一个网格框中检测多个对象。我不明白为什么会这样。
此外,作者的原始论文(Yolo v1)有以下引用:
“每个网格单元预测 B 个边界框和这些框的置信度分数。这些置信度分数反映了模型对框包含对象的置信度以及它认为框预测的准确度。”
这不是表示一个网格单元可以识别多个对象吗?在他们的论文中,他们将 B 视为 2。为什么不将 B 视为任意更高的数字,比如 10?
第二个问题:Anchor Box 尺寸如何与 Bounding Box 尺寸相关联,以检测特定对象?一些网站说 Anchor Box 只定义了一个形状,而另一些网站说它定义了一个形状和一个大小。无论哪种情况,Anchor Box 是如何与 Bounding Box 绑定的?
谢谢,桑迪普