我正在尝试使用 opencv在Jetson TK上创建一个实时全景视频拼接应用程序。我在上面测试了opencv的示例stitching_detailed.cpp,并比较了使用和不使用GPU的结果。我拼接了 30张 1240x720 的图像,使用 GPU 大约需要 33 秒,使用 CPU 大约需要 45 秒。即使是严格的 GPU 结果也更快,但它们远非实时。我的目标是用 30 FPS 拼接 1240x720。我应该采取哪些步骤来使用 GPU 来提高 opencv 的性能。我的opencv版本是2.4.12 Opencv4Tegra