我有一个在自定义数据集上训练的 OD 模型。我想将模型部署为 API。该模型将用于实时推理,我计划在 AWS、Rakuten 的 Rapid API 等 API 市场之一上通过该 API 获利。
我担心的是,如果 OD 模型作为 API 提供,在视频流(监控摄像头馈送)上实时执行预测会带来网络延迟,从而使应用程序变慢。是否有其他方法可以解决延迟问题?
例如,如果我将要在客户端系统上执行的代码和工件打包,可以消除网络延迟,但有暴露模型、代码等的风险。因此,API 似乎是我用例的理想解决方案。
执行这种情况的最佳方法是什么?
此外,如果图像涉及预处理和后处理。是否有任何平台可以帮助打包我们的应用程序并将其转换为接受图像输入并提供图像输出的黑盒?