1

我有一组非常大的 XML 文件,我想在进行一些数据按摩后将它们导入 dynamodb。

这可以通过 AWS Data Pipeline 或其他工具实现吗?目前,这是通过运行 ETL 过程的程序手动完成的。

4

2 回答 2

0

目前无法通过 Datapipeline 将 XML 直接导入 DynamoDB。

但是,如果您预处理 XML 文件并将 XML 数据转换为 DynamoDBExportDataFormat http://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-dynamodbexportdataformat.html中描述的格式,那么您应该能够使用DataPipline 控制台中提供的模板来完成任务http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/DynamoDBPipeline.Templates.html

于 2015-08-10T22:23:40.907 回答
0

我不确定 DataPipeline 对您获得 XML 的自定义处理有多大帮助。

我想推荐几种方法 [绝对不是详尽的选项] - 无论哪种方式,如果您将这些 XML 文件保存在 S3 中将会是有益的。

  1. 尝试 Elastic Map Reduce Route [SPOT 实例的奖励积分]
  2. 尝试使用 Amazon Lambda 处理并推送到 dynamodb
  3. 尝试 ElasticBeanstalk 批处理
于 2015-08-05T20:11:21.797 回答