问题标签 [amazon-sagemaker]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用 SDK 调用 Amazon SageMaker 示例笔记本中的 Iris 终端节点
我正在尝试从tensorflow_iris_dnn_classifier_using_estimators
示例笔记本中提供的端点调用端点。在示例中,它使用部署过程中生成的相同 python 对象调用端点。在大型系统中,我需要知道如何在没有此对象的情况下调用此端点,并且可能使用不同的语言。这是我尝试过的:
我在做什么错?我从 cloudwatch 收到以下错误:
python - Sagemaker "Could not find model data" when trying to deploy my model
I have a training script in Sagemaker like,
Most of which I stole from the MNIST Example.
When I train, everything goes fine, but when trying to deploy like,
I get, (full output)
Looking in my S3 bucket s3://sagemaker-us-west-2-01234567890/sagemaker-mxnet-py2-cpu-2018-01-17-20-52-52-599/output/model.tar.gz
, I in fact don't see the model.
What am I missing?
amazon-sagemaker - 在 aws sagemaker 模型训练中是否有某种持久的本地存储?
我用 aws sagemaker 做了一些实验,从 S3 下载大数据集的时间很成问题,尤其是模型还在开发中,你想要一些比较快的初始反馈
是否有某种本地存储或其他方式来加快速度?
编辑 我指的是批处理培训服务,它允许您将作业作为 docker 容器提交。
虽然此服务适用于通常运行很长时间的已验证作业(这使得下载时间不那么重要),但仍然需要快速反馈
没有其他方法可以使用 sagemaker 基础架构(配置文件、数据文件等)对您的工作进行“集成”测试
在对模型进行不同的变体试验时,能够相对快速地获得初始反馈很重要
c# - 如何在 C# 中调用 Sagemaker 训练模型端点 API
我已经通过 sagemaker 实现了机器学习算法。
我已经为 .net 安装了 SDK,并通过执行以下代码进行了尝试。
通过执行此操作,我收到验证错误为“ 1 validation error detected: Value at 'body' failed to satisfy constraint: Member must not be null
”
谁能指导我如何以及需要传递哪些输入数据来调用给定的 API?
编辑
此外,我尝试通过提供包含由“.gz”或“.pkl”文件写入的 MemoryStream 的主体参数来尝试,它给了我错误:“错误从 AWS 解组响应,HTTP 内容长度超过 5246976 字节。”
编辑 2018 年 1 月 23 日
此外,我想出了错误消息
错误 - 模型服务器 - 'TypeError' 对象没有属性 'message'
谢谢
sparkr - 如何在 sagemaker 服务中部署使用 SparkR 训练的模型?
我用 sparkR 语言创建了一个带有 k-means 和 ALG 算法的训练模型。我想部署模型 throw AWS Sagemaker 服务。我已经运行了一些内置示例,它们使用 conda_python3 语言,但是使用 SparkR 怎么可能。?
c# - 如何使用 c# .NET 调用 AWS Sagemaker API?
我已经在 AWS Sagemaker 中训练并部署了一个模型,现在我正在尝试使用客户端作为 c# .NET 调用端点。在下面的代码中,由于 Body 参数的值无效,我似乎收到了错误。
我尝试传递一个用“.gz”文件或“.jpeg”文件编写的 MemoryStream。通过执行 InvokeEndPoint(),获取错误为:“无法评估提供的有效负载”
python - 使用 sagemaker api 调用端点时出错
我在 sagemaker 中部署了一个端点,并试图通过我的 python 程序调用它。我用邮递员测试过它,它工作得很好。然后我写了调用代码如下
现在当我运行它时,我得到一个验证错误
在使用邮递员时,我已经给出了我的访问密钥和密钥,但我不确定在使用 sagemaker api 时如何传递它。我也无法在文档中找到它。
所以我的问题是,如何使用本地机器上的 sagemaker api 来调用我的端点?
amazon-sagemaker - AWS Sagemaker 自定义用户算法:如何利用额外实例
这是一个基本的 AWS Sagemaker 问题。当我使用 Sagemaker 的一种内置算法进行训练时,我可以通过增加训练算法的 instance_count 参数来利用将作业分配到多个实例的巨大加速。但是,当我打包自己的自定义算法时,增加实例数似乎只是在每个实例上重复训练,导致没有加速。
我怀疑当我打包自己的算法时,我需要做一些特别的事情来控制它如何以不同方式处理我的自定义 train() 函数中的特定实例的训练(否则,它如何知道工作应该如何分发?),但我无法在网上找到有关如何执行此操作的任何讨论。
有谁知道如何处理这个?非常感谢您提前。
具体示例:=> 它在标准算法中运行良好:我验证了在第一个记录的 sagemaker 示例中增加 train_instance_count 可以加快速度:https ://docs.aws.amazon.com/sagemaker/latest/dg/ex1-train -model-create-training-job.html
=> 它在我的自定义算法中不起作用。我尝试采用标准的 sklearn build-your-own-model 示例,并在训练中添加一些额外的 sklearn 变体,然后打印出结果进行比较。当我增加传递给 Estimator 对象的 train_instance_count 时,它会在每个实例上运行相同的训练,因此输出会在每个实例中重复(结果的打印输出是重复的)并且没有加速。这是 sklearn 示例库:https ://github.com/awslabs/amazon-sagemaker-examples/blob/master/advanced_functionality/scikit_bring_your_own/scikit_bring_your_own.ipynb 。本笔记本中 Estimator 对象的第三个参数是让您控制训练实例数量的原因。
c# - 使用 Sagemaker 获取 Amazon.RegionEndpoint 的冲突错误
我在 c# 中创建了一个应用程序,我需要将一些数据放在 S3 存储桶上,并调用 AWS sagemaker API。由于两个引用中都存在相同的 Amazon.RegionEndPoint 类,因此它给出了以下错误。
“RegionEndpoint”类型存在于“AWSSDK.Core, Version=3.3.0.0, Culture=neutral, PublicKeyToken=885c28607f98e604”和“AWSSDK, Version=2.3.55.2”中
基本上我正在尝试按照我使用过的代码在 AWS S3 上上传文件。
它在单个应用程序上运行良好,但是当我将代码与 Sagemaker API 调用集成时,Amazon.RegionEndpoint.USEast2 发生冲突。
python - TensorFlow 检查点到 S3
我正在 Amazon Sagemaker 上执行 Python-Tensorflow 脚本。我需要将我的模型检查点到我正在使用的 S3 实例,但如果不使用 Sagemake Tensorflow 版本,我无法找到如何做到这一点。
如何在不使用 Sagemaker TF 版本的情况下对 S3 实例进行一个检查点?