我需要转换一些模型才能将它们部署在 jetson 设备上。我已经尝试过在 coco 80 上训练的 Yolov3 的 TensorRT,但我没有成功推断它,所以我决定做TF-TRT。它在我的笔记本电脑上运行,FPS 增加了,但大小和 GPU 内存使用没有改变。模型的大小是 300MB,它变得更大了。TF-TRT 模型前后仍使用 16 GB GPU 内存。
是不是很平常?我的意思是没问题还是有什么问题?我希望实现更小的尺寸、更少的 GPU 内存使用和更高的 FPS(BTW 节点减少了)。
重要的是 FPS 在 TF-TRT 之后几乎没有跳跃。我在 TF-TRT 之前得到了大约 3 FPS,但在那之后我得到了 4、6、7、8、9 FPS,但是 FPS 变化并不平滑,例如第一帧我得到 4,第二帧我得到9 FPS,我也可以在视频的可视化中看到这些跳跃。为什么会这样?我该如何解决?
我读过 TRT 比 TF-TRT 有更好的性能。是真的吗?它们之间的确切区别是什么?我很困惑
我有另一个模型需要将其转换为 TRT,但它是一个 pytorch 模型(HourGlass CNN)。你知道我该怎么做吗?github 上是否有任何有效/有效的 repo 或 YouTube 上的教程可以分享?
Tensorflow 到 TRT 更容易还是 Pytorch 到 TRT?
非常感谢