Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在寻找由 Amazon 托管的 Apache Hive 的机制。我假设,它用 S3 代替 HDFS,用 EMR 代替 Hadoop MapReduce。我的假设正确吗?
你大多是正确的。我想说在亚马逊上运行 Hive 最方便的方法是用 S3 替换 HDFS。这是实用的,因为数据存在于 S3 上,我们可以按需运行 Hadoop / Hive 集群。一些缺点是写入性能慢 - 因此进行数据转换会很慢。进行聚合 - 大部分都很好 同时还有其他配置: 在本地驱动器上构建 HDFS。 在 EBS 卷上构建 HDFS。 每一个都有他们的权衡。