我正在使用以下模型:https://github.com/JiawangBian/SC-SfMLearner-Release,其中相机位置依赖于 PoseResNet(如https://github.com/TRI-ML/packnet-sfm),和其他研究材料。
我想验证相机平移并施加适当的损失函数,问题是姿势的 Kitti GT 与我获得的不同(数量级不同,符号也不同)。
姿势的 PoseResNet 值:[-2.9110e-03, 1.8962e-03, 3.1028e-04]
- Kitti 里程计: 9.999972e-01 -6.991581e-04 2.270602e-03 -7.962199e-03 7.016426e-04 9.999992e-01 -1.093565e-03 -3.417185e-03 -2.269865e-03 9998655e-03 1.0999865e-03 -01 1.441061e+00 和 kitti 位置(使用这个转换:https ://github.com/TRI-ML/packnet-sfm/blob/master/packnet_sfm/datasets/kitti_dataset.py#L405 ),所以 kitti GT 姿势: [0.0436, 0.0390, -1.1027]
有谁知道我应该使用什么转换?我看到 TRI-ML 没有使用任何转换(https://github.com/TRI-ML/packnet-sfm/blob/master/packnet_sfm/losses/velocity_loss.py),他们报告说一切正常。