gpu - Onnxruntime 与 PyTorch

Question

我已经使用 PyTorch 在我的自定义数据集上训练了 YOLO-v3 tiny。为了比较推理时间，我在 CPU 上尝试了 onnxruntime 以及 PyTorch GPU 和 PyTorch CPU。平均运行时间约为：

onnxruntime cpu：110 毫秒 - CPU 使用率：60%
Pytorch GPU：50 毫秒
Pytorch CPU：165 毫秒 - CPU 使用率：40%
并且所有模型都使用批量大小 1。

但是，我不明白 onnxruntime 与 PyTorch CPU 相比如何更快，因为我没有使用 onnxruntime 的任何优化选项。我刚用这个：

onnx_model = onnxruntime.InferenceSession('model.onnx')
onnx_model.run(None,{onnx_model.get_inputs()[0].name: input_imgs })

有人可以向我解释为什么没有任何优化它会更快吗？以及为什么在使用 onnxruntime 时 CPU 使用率更高。有什么办法可以让它保持下去吗？

提前致谢。

score 3 · Accepted Answer

ONNX 运行时使用静态 ONNX 图，因此它具有图的完整视图，并且可以进行许多使用 PyTorch 不可能/更难做的优化。从某种意义上说，它类似于编译与解释的编程语言实现。

1 回答 1