为了对冻结的 Tensorflow 图 (.pb) 进行快速 CPU 推理,我目前正在使用 Tensorflow 的 C API。推理速度已经相当不错了,但是(与英特尔的 OpenVINO 等 CPU 专用工具相比)我目前无法在运行之前以某种方式优化图表。我对任何适合的优化感兴趣: - 针对 CPU 的特定于设备的优化 - 特定于图形的优化(融合操作,丢弃节点,......) -......以及其他一切降低推理所需时间的东西。
因此,我正在寻找一种在训练后和执行前优化图形的方法。如前所述,英特尔的 OpenVINO(用于 CPU)和 NVIDIA 的 TensorRT(用于 GPU)等工具可以做类似的事情。我也在使用 OpenVINO,但目前正在等待错误修复,因此我想尝试另一种方法。
我想过尝试 Tensorflow XLA,但我没有使用它的经验。此外,我必须确保最终获得冻结图(.pb)或可以转换为冻结图(例如.h5)的东西。
我将不胜感激建议!
问候