如问题中所述,“sagemaker 默认使用 nvidia-docker 或 docker runtime==nvidia 还是用户需要手动设置?”
一些常见的错误消息显示为“CannotStartContainerError。请确保变体 variant-name-1 的模型容器在使用 'docker run serve' 调用时正确启动。” 并且它没有显示为与 nividia 驱动程序一起运行。
那么,我们需要手动设置吗?
如问题中所述,“sagemaker 默认使用 nvidia-docker 或 docker runtime==nvidia 还是用户需要手动设置?”
一些常见的错误消息显示为“CannotStartContainerError。请确保变体 variant-name-1 的模型容器在使用 'docker run serve' 调用时正确启动。” 并且它没有显示为与 nividia 驱动程序一起运行。
那么,我们需要手动设置吗?
我使用 tensorflow-gpu 图像作为容器的基础图像,我可以使用 gpu 而无需指定任何与 gpu 相关的内容。在为 sagemaker 构建 docker 容器时,您必须注意文件夹结构,并且您的容器能够以命令 serve(错误提示)启动。
如果您在设置时遇到问题,我发现这个示例是掌握它的最有用的示例。