machine-learning - 对 YOLO 流程感到困惑

Question

为了理解这个概念，我阅读了Mauricio Menegaz写的这篇文章，并在 YouTube 上观看了Deeplearning.ai 的视频，但我对 S x S x (B * 5 +C) 部分感到困惑。我知道 S x S 代表网格大小，5 代表边界框的组件，C 代表类。B 和锚盒一样吗？如果我只想检测一个类别（例如车牌），那是否意味着只有 1 个 B？

编辑在将图像输入神经网络之前是否在图像上创建了边界框？

score 1 · Accepted Answer

B 和锚盒一样吗？

是的。B 是锚框的数量

如果我只想检测一个类别（例如车牌），那是否意味着只有 1 个 B？

不，在这种情况下，C = 1。但是如果你事先知道你需要检测的对象的宽高比，并且这个比值在视点之间变化不大，你可能只需要匹配这个比值的锚框，所以在你的车牌情况，B也可以是1

但是如果你需要检测汽车，你可能需要更多的锚框，因为汽车的宽/高比在不同的视点之间变化很大

score 0 · Accepted Answer

0

也许你可以看看这个实现： https ://github.com/1991viet/Yolo-pytorch

于 2018-09-03T21:52:00.477 回答

machine-learning - 对 YOLO 流程感到困惑

2 回答 2

Related

Reference