0

我正在使用 YOLOv4-tiny + TensorRt 开发 Jetson Nano。我用AlexeyAB Darknet训练了我的模型。除了后期和预处理之外,我还需要最优化的性能来检测 40 fps。这些帧是从 4 个流中捕获的。当检测功能被调用时(例如这里),并且在 gpu 中加载的图像仍在使用 cpu?我想在前一帧处于检测过程中时捕获下一帧。怎样才能做到这一点?我知道多线程不能同时运行线程,另一方面,多处理需要考虑共享内存来在进程之间传递帧。实现最佳性能的最佳实践解决方案是什么?

提前致谢!

4

0 回答 0