0

我对诸如 Kitti 或 NYUv2 等数据集中深度图的含义有点困惑。它们是相机中心与场景中物体之间的实际距离,还是物体与相机平面之间的距离(即 3D 坐标的 z 值)?

如果是后者:为什么人们会对这个价值感兴趣?此外,激光雷达传感器或 Kinect 摄像头是否也不会首先返回每个对象的实际距离?

4

0 回答 0