8

为什么我需要 Container for AWS SageMaker?如果我想在 SageMaker 的 Jupyter 笔记本上运行 Scikit Learn 以进行自学,我还需要为其配置 Container 吗?

如果我只想学习 Scikit Learn,我需要的 SageMaker 最低配置是多少?例如,我想用一组训练数据和一组测试数据运行 Scikit Learn 的决策树算法。我需要在 SageMaker 上做什么才能执行任务?谢谢。

4

2 回答 2

5

你不需要太多。只是一个对您的角色具有相关权限的 AWS 账户。在 AWS SageMaker 控制台中,您只需单击一下即可运行 AWS 笔记本实例。预装了 Sklearn,您可以开箱即用。不需要特殊的容器。

至少,您只需要具有相关权限的 AWS 账户即可创建 EC2 实例并从您的 S3 读取/写入。就是这样,试试吧。:)

以此为起点:Amazon SageMaker – 加速机器学习

您也可以通过 Jupyter 终端访问它

于 2018-05-14T14:52:02.537 回答
2

如果您不关心使用 Sagemaker 的培训和部署功能,那么您只需要创建一个新conda_python3笔记本并导入 sklearn。

我也对如何通过 Scikit Learn 来利用 Sagemaker 的训练/部署功能感到困惑。最好的解释和最新的似乎是:

https://github.com/aws/sagemaker-python-sdk/blob/master/src/sagemaker/sklearn/README.rst

简要总结如下:

  1. 您将训练数据保存到 S3 存储桶。
  2. 创建一个独立的 Python 脚本来进行训练,将训练模型序列化为文件并将其保存到 S3 存储桶中。
  3. 在 Sagemaker 上的笔记本中,您导入 Sagemaker SDK 并将其指向您的训练脚本和数据。然后 Sagemaker 将临时创建一个 AWS 实例来训练模型。
  4. 一旦经过训练,该实例就会自动销毁。
  5. 最后,您使用 Sagemaker 开发工具包将经过训练的模型部署到另一个 AWS 实例。这也会自动创建一个可以调用以进行预测的端点。
于 2019-01-25T02:45:17.863 回答