computer-vision - Yolo 或 Faster RCNN 中的锚框或边界框

Question

我不知道锚框和边界框或提案区域之间的区别。我对这些定义感到困惑。而且我不知道检测模型中这些框的含义，因为默认长度永远不会改变！最后，我混淆了 RCNN 系列和 Yolo 系列都输出预测框位置的事实(x,y,w,h)。或者输出增量位置(ground truth_x - predicted_x)/prediction_w？

score 8 · Accepted Answer

边界框 边界框是由网络预测的框。这些预测框被覆盖在输入图像上，以便您可以直观地了解预测检测到的矩形的位置和形状。也就是说，它们是您可以在此 youtube 视频中看到的矩形。

锚框我们可以对边界框的形状进行一些假设。例如，如果我们想检测人类，我们应该用一些垂直的矩形框来搜索人类。它们是锚盒。在训练和预测之前，锚框作为一些数字的列表被馈送到网络，这是一系列宽度和高度对：

锚点 = [1.08, 1.19, 3.42, 4.41, 6.63, 11.38, 9.42, 5.11, 16.62, 10.52]

上面的这个列表定义了 5 个锚框。我们可以向网络提供任意数量的锚框。

这些值是通过一些统计程序从训练数据中确定的。

score 2 · Accepted Answer

Anchor Boxes：预定义的地标矩形，用于边界框拾取并使用偏移量为检测到的对象提供位置

边界框：检测到的对象相对于锚框的预测矩形

基本上，这个想法可以与 Snapchat 相机等对象检测模型中使用的地标相媲美。根据自拍肖像的特征，在图像的特定区域为网络预先确定一组节点，网络学习如何在对某些应用过滤器或掩码之前相对于输入网络的不同面部来偏移节点视觉 m*sturbation 真正激发用户

computer-vision - Yolo 或 Faster RCNN 中的锚框或边界框

2 回答 2

Related

Reference