0

我有一个关于 AWS 使用的问题列表,我不确定我是否得到了正确的答案,或者我是否使用了可用的最佳实践。

在使用 AWS 之前,我在我的 Macbook 中拥有或执行以下操作: - 维护一个小型 .odb 数据库(大约 100MB),但预计一年内会增长到几 GB。- 有一些 R 脚本来进行网页抓取并将数据导入数据库。- 有另外几个 R 脚本从数据库中提取数据并进行分析。

鉴于不断增长的数据量和必须执行更复杂的分析,我的 Macbook 总是负载很重,我决定在需要时切换到 AWS 以获得更好的计算能力。我正在使用 AWS 免费套餐,以下是我迄今为止使用 AWS 成功完成的工作:

  1. 我创建了一个 EC2 实例,并且可以从我的 S3 存储桶中检索文件。
  2. 我可以使用我的 R 脚本执行分析并将结果保存在我的 S3 存储桶中。

这是我的问题清单:

  1. 维护一个~1GB大小的数据库,直接放到S3里面,每次都把整个文件加载到R里好不好?还是试试RDS服务?</p>

  2. EC2 实例和我的 S3 存储桶之间的数据传输是否收费?(即我在一个实例和 S3 之间传入和传出 10GB 数据与 1000GB 相比是否重要?)我不知道在哪里可以找到这条信息.

  3. 使用EC2实例进行网页抓取,是否需要对互联网连接收费?或者费用仅适用于我选择使用的实例类型,无论我执行计算还是网页抓取?</p>

  4. 我还阅读了一些关于 AWS EBS 的文章,但我对 S3、EBS 或设置 RDS 之间的区别感到很困惑。

随着我编写更多的 R 脚本来废弃不同的公开可用数据进行分析,我预计我的数据量会成倍增长。在计算能力方面,目前我需要的比我的 MacBook 提供的更多,主要是做一些并行处理和分析。以后我也会测试一些机器学习算法。

任何建议都会很有用。

4

0 回答 0