3

加载任何亚马逊列出的公共数据集 (http://aws.amazon.com/datasets) 将占用大量资源和带宽。将它们导入 AWS 以便您快速开始使用它们的最佳方式是什么?

4

2 回答 2

5

您将需要使用公共数据集的 Snapshot-ID 创建一个新的 EBS 实例。这样您就无需支付转账费用。

但请注意,某些数据集仅在一个地区可用,很可能由与此类似的注释表示。然后,您应该在同一区域注册您的 EC2 实例。

这些数据集托管在 us-east-1 区域。如果您从其他地区处理这些数据,您将被收取数据传输费用。

于 2012-01-24T17:43:22.257 回答
1

仅供参考:SDBExplorer 使用多线程 BatchPutAttributes 来实现高写入吞吐量,同时将批量数据上传到 Amazon SimpleDB。SDB Explorer 允许多个并行上传。如果您有带宽,则可以通过在并行队列中一次运行多个 BatchPutAttributes 进程来充分利用该带宽,这将减少处理时间。SDBExplorer 支持将数据从 MySql 和 CSV 导入到 Amazon SimpleDB。

http://www.sdbexplorer.com

披露:我是 SDBExplorer 的开发者。

于 2012-01-27T14:19:32.820 回答