我试图更好地理解 YOLO2 & 3 算法的工作原理。该算法处理一系列卷积,直到它下降到一个13x13
网格。然后它能够对每个网格单元内的对象以及这些对象的边界框进行分类。
如果您查看这张图片,您会看到红色的边界框比任何单个网格单元都大。边界框也以对象的中心为中心。
当网络激活基于单个网格单元时,我的问题是预测边界框如何超过网格单元的大小。我的意思是,对于预测在该单元格中检测到的对象的边界框的神经元来说,网格单元格之外的所有内容都应该是未知的。
更准确地说,这是我的问题:
1.算法如何预测比网格单元大的边界框?
2. 算法如何知道物体中心位于哪个单元格?