在相机校准期间,通常的建议是使用许多图像 (>10),其姿势、深度等都有变化。但是我注意到,通常我使用的图像越少,重投影误差就越小。例如,对于 27 张图像,cv::calibrateCamera 返回 0.23,而只有 3 张我得到 0.11。这可能是由于在校准期间我们正在解决超定系统的最小二乘问题。
问题:
我们是否真的使用重投影误差作为校准好坏的绝对量度?例如,如果我用 3 张图像校准得到 0.11,然后用其他 27 张图像校准得到 0.23,我们真的可以说“第一次校准更好”吗?
OpenCV 使用相同的图像进行校准和计算误差。这不是某种形式的过拟合吗?如果我实际上使用了 2 个不同的集合——一个用于计算校准参数,一个用于计算误差——不是更正确吗?在这种情况下,我将使用相同的(测试)集来计算来自不同(训练)集的所有校准结果的误差。那不是更公平吗?