matlab - 为什么 kinect 颜色和深度无法正确对齐？

Question

我已经在这个问题上工作了很长一段时间，并且我的创造力已经结束，所以希望其他人可以帮助我指出正确的方向。我一直在使用 Kinect 并尝试将数据捕获到 MATLAB。幸运的是，有很多方法可以做到这一点（我目前正在使用http://www.mathworks.com/matlabcentral/fileexchange/30242-kinect-matlab）。当我尝试将捕获的数据投影到 3D 时，我的传统方法给出的重建结果很差。

长话短说，我最终为 matlab 编写了一个 Kinect SDK 包装器，用于执行重建和对齐。重建工作就像一场梦，但是......

正如您在此处看到的，我在对齐方面遇到了很多麻烦：

在此处输入图像描述

请不要太仔细地看模型:(。

如您所见，对齐方式不正确。我不确定为什么会这样。我读过很多论坛，其他人用同样的方法比我取得了更多的成功。

我当前的管道使用 Kinect Matlab（使用 Openni）来捕获数据，使用 Kinect SDK 重建，然后使用 Kinect SDK 对齐（通过 NuiImageGetColorPixelCoordinateFrameFromDepthPixelFrameAtResolution）。我怀疑这可能是由于 Openni，但我在创建 mex 函数调用以使用 Kinect SDK 进行捕获方面收效甚微。

如果有人能指出我应该更深入研究的方向，将不胜感激。

编辑：

图我应该发布一些代码。这是我用于对齐的代码：

    /* The matlab mex function */
    void mexFunction( int nlhs, mxArray *plhs[], int nrhs, 
            const mxArray *prhs[] ){

        if( nrhs < 2 )
        {
            printf( "No depth input or color image specified!\n" );
            mexErrMsgTxt( "Input Error" );
        }

        int width = 640, height = 480;

        // get input depth data

        unsigned short *pDepthRow = ( unsigned short* ) mxGetData( prhs[0] );
        unsigned char *pColorRow = ( unsigned char* ) mxGetData( prhs[1] );

        // compute the warping

        INuiSensor *sensor = CreateFirstConnected();
        long colorCoords[ 640*480*2 ];
        sensor->NuiImageGetColorPixelCoordinateFrameFromDepthPixelFrameAtResolution(
                NUI_IMAGE_RESOLUTION_640x480, NUI_IMAGE_RESOLUTION_640x480, 
                640*480, pDepthRow, 640*480*2, colorCoords );
        sensor->NuiShutdown();
        sensor->Release();

        // create matlab output; it's a column ordered matrix ;_;

        int Jdimsc[3];
        Jdimsc[0]=height;
        Jdimsc[1]=width;
        Jdimsc[2]=3;

        plhs[0] = mxCreateNumericArray( 3, Jdimsc, mxUINT8_CLASS, mxREAL );
        unsigned char *Iout = ( unsigned char* )mxGetData( plhs[0] );

        for( int x = 0; x < width; x++ )
            for( int y = 0; y < height; y++ ){

                int idx = ( y*width + x )*2;
                long c_x = colorCoords[ idx + 0 ];
                long c_y = colorCoords[ idx + 1 ];

                bool correct = ( c_x >= 0 && c_x < width 
                        && c_y >= 0 && c_y < height );
                c_x = correct ? c_x : x;
                c_y = correct ? c_y : y;

                Iout[ 0*height*width + x*height + y ] =
                        pColorRow[ 0*height*width + c_x*height + c_y ];
                Iout[ 1*height*width + x*height + y ] =
                        pColorRow[ 1*height*width + c_x*height + c_y ];
                Iout[ 2*height*width + x*height + y ] =
                        pColorRow[ 2*height*width + c_x*height + c_y ];

            }

    }

score 5 · Accepted Answer

这是立体视觉系统的一个众所周知的问题。不久前我遇到了同样的问题。我发布的原始问题可以在这里找到。我试图做的与此类似。然而，经过大量研究，我得出结论，捕获的数据集不容易对齐。

另一方面，在记录数据集时，您可以轻松地使用函数调用来对齐 RGB 和深度数据。此方法在 OpenNI 和 Kinect SDK 中都可用（功能相同，但每个函数调用的名称不同）

看起来您正在使用 Kinect SDK 来捕获数据集，要将数据与 Kinect SDK 对齐，您可以使用MapDepthFrameToColorFrame。

由于您还提到了使用 OpenNI，请查看AlternativeViewPointCapability。

我没有使用 Kinect SDK 的经验，但是使用 OpenNI v1.5，在注册记录器节点之前，通过以下函数调用解决了整个问题：

depth.GetAlternativeViewPointCap().SetViewPoint(image);

其中image是图像生成器节点，depth是深度生成器节点。这是旧的 SDK 已被 OpenNI 2.0 SDK 取代。因此，如果您使用的是最新的 SDK，那么函数调用可能会有所不同，但整体过程可能相似。

我还添加了一些示例图像：

不使用上述对齐函数调用 RGB 上的深度边缘未对齐没有对齐

使用函数调用时，深度边缘完全对齐（有一些红外阴影区域显示了一些边缘，但它们只是无效的深度区域）

score 1 · Accepted Answer

您可以通过使用 Kinect SDK 读取 U、V 纹理映射参数轻松对齐深度帧和颜色帧。对于深度帧 D(i,j) 的每个像素坐标 (i,j)，颜色帧的相应像素坐标由 (U(i,j),V(i,j)) 给出，因此颜色为通过 C(U(i,j),V(i,j))。

U、V 功能包含在每个 Kinect 的硬件中，它们因 Kinect 与 Kinect 不同而不同，因为在工厂粘在硬件板上时，深度摄像头与视频摄像头的对齐方式不同。但是，如果您从 Kinect SDK 读取 U,V，则不必担心。

下面我给你一个图像示例和一个使用 Java 中的 Kinect SDK 和J4K 开源库的实际源代码示例：

public class Kinect extends J4KSDK{

    VideoFrame videoTexture; 

public Kinect() { 
    super(); 
    videoTexture=new VideoFrame(); 
}

@Override 
public void onDepthFrameEvent(short[] packed_depth, int[] U, int V[]) { 
    DepthMap map=new DepthMap(depthWidth(),depthHeight(),packed_depth); 
    if(U!=null && V!=null) map.setUV(U,V,videoWidth(),videoHeight()); 
} 

@Override 
public void onVideoFrameEvent(byte[] data) {     
    videoTexture.update(videoWidth(), videoHeight(), data); 
} }

显示同一深度视频对齐帧的 3 个不同视角的图像示例：在此处输入图像描述

我希望这对你有帮助！

score 1 · Accepted Answer

在此处输入图像描述 depth.GetAlternativeViewPointCap().SetViewPoint(image);

效果很好，但问题是它缩小了深度图像（通过 FOCAL_rgb/FOCAL_kinect）并通过视差 d=focal*B/z 移动深度像素；根据出厂设置，也可能会有轻微的旋转。

因此，如果不撤消这些转换，就无法再恢复所有 3 个真实世界坐标。话虽如此，不依赖于准确的 x、y 并且仅考虑 z 的方法（例如分割）即使在移位的地图中也可能运行良好。此外，它们可以利用颜色和深度来执行更好的分割。

matlab - 为什么 kinect 颜色和深度无法正确对齐？

3 回答 3

Related

Reference