在慢速 R-CNN 论文中,边界框回归的目标是学习将提议的边界框 P 映射到真实框 G 的转换,我们根据四个函数 dx(P),dy(P) 参数化转换,dw(P),dh(P)。
前 2 指定P 的边界框中心的尺度不变平移,而
第二个两个指定P 的边界框相对于对象建议的宽度和高度的对数空间转换。
这与 Fast-RCNN 论文中用于 BB 预测的技术相同。!
问题1。谁能帮我理解边界框的尺度不变性和对数空间(两者)的相关性以及这些函数如何捕捉这两个方面?
问题2。上面提到的BB 尺度不变平移与实现尺度不变目标检测(下文解释)有何不同?
我的意思是在快速 R-CNN 中,作者指出以下两种方法可以在目标检测中实现尺度不变性:
首先,蛮力方法,在训练和测试期间,每张图像都以预定义的像素大小进行处理。网络必须直接从训练数据中学习尺度不变的目标检测
第二种方法是使用图像金字塔。
请随时引用研究论文,以便我阅读以深入了解。