0

我想用 ~30fps 转换许多点(最好是整个 720p 图像)。现在我只是遍历一个蒙版并寻找标记的像素。然后我将每个标记的像素转换为一个新的帧。有什么办法可以加快速度吗?该代码在 Windows 平板电脑上运行,所以我不知道 CUDA 是否可以提供帮助。

//Look for white pixels in mask image and transform them to new frame orientation
for (int row = 0; row < mask.rows; row++){
    for (int col = 0; col < mask.cols; col++){

        if (mask.at<uchar>(row, col) == 255){

            //Point in 2D hom
            p = (Mat_<double>(3, 1) << col, row, 1);
            p11 = CameraMatrix480.inv()*p;  //Pixel-->Camera


            //Project 2D Points to table
            double d = abs((p11 - midCam).dot(table_normal_cam)); //intersection of point with table surface is z value
            ps = p11 - d*table_normal_cam;
            p11 *= -Mat(p11 - ps).at<double>(2);

            //Get point in new frame in hom camera coordinates
            p11.copyTo(p_hom1(Range(0, 3), Range(0, 1)));
            p_hom2 = M * p_hom1; //p_hom in frame2

            //Point in frame2 in pixel coordinates
            p12 = (1 / p_hom2.at<double>(2))*(CameraMatrix480*p_hom2(Range(0, 3), Range(0, 1))); //Camera-->Pixel
            pixel = Point(p12.at<double>(0), p12.at<double>(1));

            //Check if new location is in the frame
            if (rect.contains(pixel)){
                RGB& rgb = output.ptr<RGB>(pixel.y)[pixel.x];
                rgb = white;
            }

        }
    }
4

4 回答 4

4

未经测试,我认为逆相机矩阵的计算是代码中最昂贵的操作。假设相机矩阵是常数,您可以预先计算逆矩阵。

Mat invCameraMatrix(CameraMatrix480.inv());
...
p11 = invCameraMatrix*p;  //Pixel-->Camera
...

此外,您可以轻松地并行化for循环OpenMP并检查它是否获得任何性能。为了使用CUDA,您需要一块 Nvidia 显卡,这可能在您的 Windows 平板设备中不可用。

于 2015-09-08T12:47:50.550 回答
0

您是否考虑过将操作更改为float而不是double?由于您使用的是移动设备,因此它可能有助于加快操作速度。

另外,rect最后的if情况是什么?

于 2015-09-10T01:33:10.913 回答
0

您可以尝试cv::UMat用于性能测试吗?

OpenMP用于按像素进行快速图像操作。

于 2015-09-09T20:26:40.897 回答
0

只需使用 Matx 而不是 Mat,我就能在 40 毫秒内为 720p 图像运行转换。图像存储在 UMat 中,也许这也有帮助。

于 2015-09-11T09:39:15.370 回答