1

我正在研究 kitti 视觉里程计数据集。我使用投影变换来注册两个 2D 连续帧(请参见此处的投影变换示例 )。我想知道这个 3*3 的投影变换矩阵是如何与 kitti 数据集提供的 ground truth 姿势相关的。

该数据集给出了序列的真实姿态(轨迹),如下所述:

文件夹“姿势”:

文件夹“pose”包含前 11 个序列的基本真实姿势(轨迹)。此信息可用于训练/调整您的方法。每个文件 xx.txt 包含一个 N x 12 表,其中 N 是该序列的帧数。第 i 行通过 3x4 变换矩阵表示左相机坐标系的第 i 个姿势(即,z 指向前方)。矩阵以行对齐的顺序存储(第一个条目对应于第一行),并在第 i 个坐标系中取一个点并将其投影到第一个 (=0th) 坐标系中。因此,平移部分(第 4 列的 3x1 向量)对应于第 i 帧中左侧相机坐标系相对于第一(=第 0)帧的位姿。您的提交结果必须使用相同的数据格式提供。

给定真实姿势的一些样本:

1.000000E+00 9.043680E-12 2.326809E-11 5.551115E-17 9.043683E-12 1.000000E+00 2.392370E-10 3.330669e-16

9.999978e-01 5.272628e-04 -2.066935e-03 -4.690294e-02 -5.296506e-04 9.999992e-01 -1.154865e-03 -2.839928e-02 2.066324e-03 1.155958e-03 9.999971e-01 8.586941 e-01

9.999910E-01 1.048972E-03 -4.131348E-03 -9.374345E-02 -1.058514E-03 9.9999968E-01 -2.3081.308104E-03 e+00

9.999796E-01 1.566466E-03 -6.198571E-03 -1.406429E-01-01 -1.587952E-03 9.9999927E-01-01 -01 -3.462706E-036E-03-03-049979715762E-515762E--515762E--515762E--515762E-192EY2E-192EENEM e+00

9.999637E-01 2.078471E-03 -8.263498E-03 -1.874858E-01 -2.116664E-03 9.9999871E-01-01-01-01-4.4.615826E-03-015826E-03 -1.1.1.135202E-135255334EE1 8.2555555555555555555555555555555555555555555555555555555555555555555太平值e+00

9.999433e-01 2.586172e-03 -1.033094e-02 -2.343818e-01 -2.645881e-03 9.999798e-01 -5.770163e-03 -1.419150e-01 1.031581e-02 5.797170e-03 9.999299e-01 4.291335 e+00

9.999184E-01 3.088363E-03 -1.239599E-02 -2.812195E-01 -01 -3.174350E-03 9.999710E-01-6.922975E-03-01-01-01-03-01.703-1.7027443E.7497955555555555555555555555555555555555555555555555555555飞机e+00

9.998890e-01 3.586305e-03 -1.446384e-02 -3.281178e-01 -3.703403e-03 9.999605e-01 -8.077186e-03 -1.986703e-01 1.443430e-02 8.129853e-03 9.998627e-01 6.007777 e+00

9.998551e-01 4.078705e-03 -1.652913e-02 -3.749547e-01 -4.231669e-03 9.999484e-01 -9.229794e-03 -2.270290e-01 1.649063e-02 9.298401e-03 9.998207e-01 6.865477 e+00

9.998167e-01 4.566671e-03 -1.859652e-02 -4.218367e-01 -4.760342e-03 9.999347e-01 -1.038342e-02 -2.554151e-01 1.854788e-02 1.047004e-02 9.997731e-01 7.724036 e+00

9.997738E-01 5.049868E-03 -2.066463E-02 -02 -4.687329E-01 -5.289072E-03 9.9999194E-01-01 -1.1.153730E-02 e+00

9.997264E-01 5.527315E-03 -2.27292E-02 -5.155474E-01-01 -5.816781E-03 9.999025E-01 -01 -1.268908E-02-02-02-02-02-3.121547EED1 2.21547ENE1 2.21565656EENEM e+00

9.996745E-01 6.000540E-03 -2.479692E-02 -5.624310E-01-01 -6.345160E-03 9.998840E-01-01-01-1.384246E-02 -.3.405416E.40199898989877777777777198ENE-0198ENE-0198ENE-0198ENE-0198ENE e+01

9.996182e-01 6.468772e-03 -2.686440e-02 -6.093087e-01 -6.873365e-03 9.998639e-01 -1.499561e-02 -3.689250e-01 2.676374e-02 1.517453e-02 9.995266e-01 1.115757 e+01

9.995562E-01 7.058450E-03 -2.894213E-02 -6.562052E-01 -01 -7.530449E-03 9.998399E-01-01-01-1.623192E-02 E.623192E-02-3.973964E122EN12EEN12EEN12EEN12EEN2EE1 2E2292EEN2EEMEN-012EN2EEN2EEME e+01

9.995095E-01 5.595311E-03 -3.081450E-02 -7.018788E-01 -01 -6.093682E-03 9.998517E-01-01-1.610315E-02 -02 -02-4.239119E1919E1197111983ENY111983ENEME e+01

4

1 回答 1

2

您的“射影变换”的通用名称是单应性。在校准设置中(即,如果您知道相机的视野或等效的焦距),单应性可以分解为 3D 旋转和平移,后者只能按比例缩放。分解算法还产生了引入单应性的 3D 平面的法线。该算法最多有 4 种解决方案,其中只有一种在您应用附加约束时是可行的,例如匹配的图像点在相机前进行三角测量,以及平移的大致方向与已知的先验匹配。

有关该方法的更多信息,请参见Malis 和 Vargas的一篇著名论文。OpenCV 中有一个名为decomposeHomographyMat的实现。

于 2017-04-20T22:33:24.423 回答