我在 AI Platform 上部署了一个 ResNet50 模型 (900 MB),最小节点 = 1。
当我进行推理时,有时我会随机得到错误 500 和 429。对于 AI Platform 代码错误 ( https://cloud.google.com/ml-engine/docs/troubleshooting ):
- 错误 500:无法加载模型
- 错误 429:内存不足
我有点困惑,因为这些错误是随机发生的。当这些错误发生时,我再次播放请求,并在获得良好结果之后。
拜托,你能解释一下我为什么会出现这种行为吗?我该如何解决这个问题?
非常感谢你的回答,
最好的,