我无法匹配 Google 报告的模型动物园中发布的模型的推理时间。具体来说,我正在尝试他们的faster_rcnn_resnet101_coco
模型,其中报告的推理时间106ms
在 Titan X GPU 上。
我的服务系统使用的是 TF 1.4,它运行在一个由 Google 发布的Dockerfile构建的容器中。我的客户端仿照谷歌发布的初始客户端。
我在带有 1 个 Titan X 的 Ubuntu 14.04、TF 1.4 上运行。我的总推理时间比 Google 报告的约 330 毫秒差 3 倍。制作张量原型大约需要 150 毫秒,而预测需要大约 180 毫秒。我saved_model.pb
的是直接从模型动物园下载的tar文件。有什么我想念的吗?我可以采取哪些步骤来减少推理时间?