问题标签 [amazon-data-pipeline]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

457 问题

0 投票

2 回答

855 浏览

amazon-web-services - 如何禁用/停用数据管道？

我刚刚创建了一个数据管道并激活了它。但是在运行时，它显示WAITING_ON_DEPENDENCIES为我的EC2Resource. 我怀疑这可能是由于某些权限问题。

所以，我现在想编辑管道。但是当我打开管道时，它会显示“ Pipeline is active.”。许多字段不再可编辑。有什么方法可以停用和/或编辑管道？

问候。

amazon-web-services amazon-data-pipeline

2014-05-02T09:00:42.883

0 投票

1 回答

330 浏览

amazon-web-services - AWS DataPipelineClient - listPipelines 不返回任何记录

我正在尝试使用 AWS Java SDK v1.7.5 访问我的 AWS DataPipelines，但 listPipelines 在下面的代码中返回一个空列表。

我有计划在美国东部地区的 DataPipelines，我相信我应该能够使用 DataPipelineClient 的 listPipelines 方法列出。我已经在使用 ProfilesConfigFile 进行身份验证并毫无问题地连接到 S3、DynamoDB 和 Kinesis。我已将 PowerUserAccess 访问策略授予配置文件中指定的 IAM 用户。我也尝试将管理员访问策略应用于用户，但它没有改变任何东西。这是我正在使用的代码：

amazon-web-services amazon-data-pipeline

2014-05-04T15:26:05.697

0 投票

2 回答

5867 浏览

amazon-web-services - 使用亚马逊数据管道将 dynamoDB 数据备份到 S3

我需要使用亚马逊数据管道将我的 dynamoDB 表数据备份到 S3。

我的问题是-我可以使用单个数据管道将多个 dynamoDB 表备份到 S3，还是必须为每个表创建一个单独的管道？

另外，由于我的表有一个 year_month 前缀（ex- 2014_3_tableName），我正在考虑使用 datapipeline SDK 在月份更改时更改管道定义中的表名。这行得通吗？有替代/更好的方法吗？

谢谢！！

amazon-web-services amazon-s3 amazon-dynamodb amazon-data-pipeline

2014-05-07T06:50:45.013

0 投票

1 回答

3946 浏览

amazon-web-services - EMR 活动卡在 Waiting_For_Runner 状态

我正在创建一个数据管道以将 dynamoDB 表导出到 S3 存储桶。我在数据管道控制台中使用了标准模板。我已验证 runsOn 字段设置为要启动的 EMR 集群的名称。但是，EMR 活动状态仍为 Waiting_For_Runner...任何想法为什么会这样？

谢谢！！！

amazon-web-services emr amazon-data-pipeline

2014-05-08T07:21:54.377

0 投票

0 回答

474 浏览

python - 从 s3 存储桶读取 aws 数据管道活动中的数据时出错

我们有 AWS 数据管道，其中有一个活动（python 脚本），它从/向 s3 存储桶读取/写入数据。我们最近注意到由于套接字连接关闭而导致从 s3 读取失败的活动失败。错误是间歇性的。失败发生在脚本的同一行。

在我们的代码中，我们以 1KB 的块从 s3 读取数据。失败发生在从 s3 中读取文件的过程中。有谁知道允许从 EC2 实例到 s3 存储桶的连接数是否有上限？

python amazon-ec2 amazon-s3 boto amazon-data-pipeline

2014-06-04T19:55:38.527

0 投票

0 回答

163 浏览

apache-pig - 来自猪脚本的亚马逊运动

如何在本地使用 pig 脚本从 kinesis 流中提取数据。

我从 amazon 文档中注意到了这个示例，但不确定如何导入 amazon kinesis pig 库，并且该示例似乎不完整。我在哪里设置凭据，我在哪里可以获得 kinesis 库的 jar ......等等......他们的例子来自 grunt-shell，但我如何从我自己的机器上本地运行它？

http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/kinesis-pig-generate-data.html

apache-pig amazon-data-pipeline amazon-kinesis

2014-07-14T19:55:41.930

0 投票

1 回答

1363 浏览

amazon-data-pipeline - 使用 AWS Data Pipeline 将本地数据复制到 S3

如何使用 AWS Data Pipeline 将数据从本地 SQL 数据库导入 Amazon S3？任何教程的链接都会对我有很大帮助。

amazon-data-pipeline

2014-07-17T07:36:49.367

0 投票

2 回答

2992 浏览

python - ShellCommandActivity 和 python 脚本

我正在尝试将 Elastic Data Pipeline 与 shell 命令活动一起使用来处理一些数据文件。具体来说，我正在尝试使用 python 来处理一些分阶段的数据。

我对 python 脚本的第一次尝试看起来像：

由于 ${INPUT1_STAGING_DIR} 未定义，此代码在命中第四个打印语句时引发错误。

之后，我尝试将 ${INPUT1_STAGING_DIR} 作为参数传递给脚本，并将脚本修改为：

这次脚本成功完成并具有以下输出。

同样， ${INPUT1_STAGING_DIR} 没有“替代”任何类似于我正在暂存的文件的东西。我正在尝试做的事情可能吗？如果没有，有没有好的解决方法？

python amazon-web-services amazon-data-pipeline

2014-07-22T18:38:36.790

0 投票

1 回答

1187 浏览

hadoop - aws datapipeline：等待依赖项

我有一个数据管道卡住并进入挂起模式，每次“等待依赖项”。

这里我使用的是“Hive Activity”，它需要输入和输出。就我而言，我所有的数据都在 hadoop 基础架构中，因此我真的不需要 S3 输入和 S3 输出。但是，由于数据管道错误，无法删除它们。此外，尽管有 S3 节点“存在”的先决条件，管道仍会在此时卡住。每次我运行这个管道时，我都必须手动“markfinish”S3node，然后事情就开始了。

任何见解都会有所帮助。AWS Datapipeline 文档没有详细介绍。

hadoop amazon-web-services amazon-s3 amazon-data-pipeline

2014-08-01T17:03:54.253

0 投票

2 回答

4543 浏览

variables - aws 数据管道日期时间变量

我正在使用 AWS Data Pipeline 将文本文件从 RDS 保存到我的 S3 存储桶。我希望文件名在文件名中包含日期和小时，例如：

我已将我的 S3DataNode FilePath指定为：

当我尝试保存管道时，出现以下错误：

根据日期和时间函数的 AWS Data Pipeline 文档，这是使用format函数的正确语法。

当我使用“硬编码”日期和时间保存管道时，我没有收到此错误，并且我的文件按预期位于我的 S3 存储桶和文件夹中。

我的想法是我需要在某处定义“myDateTime”或使用 NOW()

有人可以告诉我如何将“myDateTime”设置为当前时间（例如现在）或提供解决方法，以便我可以格式化当前时间以在我的FilePath中使用？

variables datetime amazon-web-services amazon-data-pipeline

2014-08-13T17:00:04.690

1 2 3 4 5 6 7 8 9 10

问题标签 [amazon-data-pipeline]

Reference