我已经在 SageMaker 中安装了一个 Tensorflow Estimator,使用带有framework_version='1.12.0'
和的脚本模式python_version='py3'
,使用 GPU 实例。
如果我也选择部署实例类型作为 GPU,则直接在此估算器上调用 deploy 即可。但是,如果我选择 CPU 实例类型和/或尝试添加加速器,则会失败并显示错误,即 docker 找不到要拉取的相应映像。
有人知道如何使用脚本模式在 GPU 上训练 py3 模型,然后部署到 CPU+EIA 实例吗?
我通过从估计器的训练工件创建 TensorFlowModel 然后从模型部署的中间步骤找到了部分解决方法,但这似乎不支持 python 3(同样,没有找到相应的容器)。如果我切换到 python_version='py2',它会找到容器,但无法通过健康检查,因为我的所有代码都是针对 python 3 的。