0

我正在研究对象分类问题,我正在使用来自 Kitti 数据集的激光雷达和相机数据。在这篇文章中:http ://ww.cvlibs.net/publications/Geiger2013IJRR.pdf ,它们提供了投影 3d 的公式PointCloud 进入第 i 个相机图像平面,但我不明白一些事情:

以下等式((3):

如果 3D 点 X 在 velodyne 相机图像中,Y 在第 i 个相机图像中,为什么 X 有四个坐标而 Y 有三个?应该是3和2吧?

公式

我需要将 3D 点云投影到相机图像平面中,然后创建激光雷达图像以将它们用作 CNN 的通道。任何有想法的人吗?

提前谢谢你

4

1 回答 1

0

对于您关于 x 和 y 维度的第一个查询,有两种解释。

原因1。

  • 对于图像重投影,使用处于透视坐标或齐次坐标的针孔相机模型。透视投影使用图像原点作为投影中心,点映射到平面 z=1。一个 3D 点 [xyz][xw yw zw w]表示,它在平面上映射的点由[xw yw zw] 表示。用 w 标准化给出。

    所以(x,y) -> [xy 1] T :同质图像坐标

    (x,y,z) - > [xyz 1] T:同质场景坐标

原因2。

  • 关于您所附的论文,考虑等式(4)和(5)

    在此处输入图像描述

    在此处输入图像描述

    很明显,P 的尺寸为 3X4,R 扩展为 4x4 尺寸。x 也是 1x4 尺寸。因此,根据矩阵乘法规则,第一个矩阵的列数必须等于第二个矩阵的行数。所以对于给定的 3x4 的 P 和 4x4 的 R,x 必须是 1x4。

现在谈到激光雷达图像融合的第二个问题,它需要内在和外在参数(相对旋转和平移)和相机矩阵。这种旋转和平移形成了一个 3x4 矩阵,称为变换矩阵。所以点融合方程变为

[x y 1]^T = Transformation Matrix * Camera Matrix * [X Y Z 1]^T

也可以参考 :: Lidar Image Fusion KITTI

激光雷达图像融合完成后,您可以将此图像输入到您的 CNN 模型中。我不知道激光雷达融合图像的 DNN 模块。

希望这可以帮助..

于 2019-05-29T15:55:21.977 回答