2

我已经使用 PyTorch 在我的自定义数据集上训练了 YOLO-v3 tiny。为了比较推理时间,我在 CPU 上尝试了 onnxruntime 以及 PyTorch GPU 和 PyTorch CPU。平均运行时间约为:

onnxruntime cpu:110 毫秒 - CPU 使用率:60%
Pytorch GPU:50 毫秒
Pytorch CPU:165 毫秒 - CPU 使用率:40%
并且所有模型都使用批量大小 1。

但是,我不明白 onnxruntime 与 PyTorch CPU 相比如何更快,因为我没有使用 onnxruntime 的任何优化选项。我刚用这个:

onnx_model = onnxruntime.InferenceSession('model.onnx')
onnx_model.run(None,{onnx_model.get_inputs()[0].name: input_imgs })

有人可以向我解释为什么没有任何优化它会更快吗?以及为什么在使用 onnxruntime 时 CPU 使用率更高。有什么办法可以让它保持下去吗?

提前致谢。

4

1 回答 1

3

ONNX 运行时使用静态 ONNX 图,因此它具有图的完整视图,并且可以进行许多使用 PyTorch 不可能/更难做的优化。从某种意义上说,它类似于编译与解释的编程语言实现。

于 2021-06-15T19:54:30.737 回答