13

Microsoft 声明 Kinect 的视场角为垂直 43 度和水平 57 度(此处说明)。鉴于这些,我们可以计算内在参数,即焦点和投影中心吗?我假设投影中心可以给定为(0,0,0)?

谢谢

编辑:有关我正在尝试做的事情的更多信息

我有一个用 Kinect 记录的图像数据集,我正在尝试将像素位置(x_screen、y_screen 和 z_world(以 mm 为单位))转换为真实世界坐标。

如果我知道相机放置在现实世界坐标系中的点 (x',y',z') 处,通过执行以下操作是否足以找到现实世界坐标:

x_world = (x_screen - c_x) * z_world / f_x
y_world = (y_screen - c_y) * z_world / f_y

c_x = x'焦距在哪里c_y = y'f_x, f_y还有我怎么能在只知道视野的情况下找到焦距?

谢谢

4

2 回答 2

21

如果您将世界原点 (0,0,0) 等同于相机焦点(您称之为投影中心),并且您假设相机沿正 z 轴指向,那么平面 x 中的情况看起来像这样=0:

相机世界坐标图

这里的轴是 z(水平)和 y(垂直)。下标v用于“视口”或屏幕,w用于世界。

如果我正确理解了您的意思,您就会知道h屏幕高度(以像素为单位)。此外zwyvxv。你想知道ywxw。请注意,此计算在视口中心具有 (0,0)。适当调整左上角 (0,0) 的常用屏幕坐标系。应用一个小三角:

tan(43/2) = (h/2) / f = h / (2f),  so f = h / ( 2 tan(43/2) )

和类似的三角形

yw / zw = yv / f            also              xw / zw = xv / f

解决:

yw = zw * yv / f            and                xw = zw * xv / f

请注意,这假设相机的“焦距”在 x 方向上相等。它不一定是。为了获得最佳精度xw,您应该重新计算屏幕宽度f = w / 2 tan(57/2)在哪里。w这是因为f不是真正的焦距。这只是一个转换常数。如果相机的像素是方形的并且光学没有像差,这两个f计算将给出相同的结果。

注意:在一篇已删除(不正确)的文章中,OP 似乎说已知的不是 zw,而是斜边的长度 D:原点到 (xw,yw,zw)。在这种情况下,只需注意zw = D * f / sqrt(xv² + yv² + f²)(假设相机像素是方形的;如果不是,则需要进行一些缩放)。他们可以按照上述方式进行。

于 2013-08-13T02:57:19.297 回答
0

我无法添加评论,因为我在这里的声誉太低。但我提醒一下,由于视频流格式和传感器芯片的原因,kinect 的摄像角度与普通相机不同。因此 SDK 中提到 57 度和 43 度,可能是指高度和宽度的不同度数分辨率。

它发送一个 320x240 像素的位图,这些像素与

Horizontal FOV: 58,5° (as distributed over 320 pixels horizontal)
Vertical FOV: 45,6° (as distributed over 240 pixels vertical).

Z 是已知的,你的角度是已知的,所以我想正弦定律可以让你找到正确的位置然后 https://en.wikipedia.org/wiki/Law_of_sines

于 2016-01-21T15:17:52.130 回答