-3

我无法理解hadoop的真正本质。如果我有足够的资源购买可以处理 PB 级数据的超级计算机,那么我为什么需要 Hadoop 基础架构来管理如此庞大的数据呢?

4

2 回答 2

2

The whole point of hadoop is to be able to process huge amount of data on commodity heterogeneous machines. This has nothing to rule out the use of super computers.

于 2013-08-05T06:29:43.637 回答
1

拥有足够的资源常常使我们变得愚蠢。让我举个例子(别担心,它涉及 Hadoop),它会说明清楚。Cray最便宜的超级计算机 XC30-AC的成本为 500,000 美元(IIRC)。一台具有良好 RAM、CPU 和磁盘的体面计算机的成本是多少?你需要多少才能购买一堆并共同使用它们的能力?你需要多少空间和资源来放置和处理这些机器???找到具有良好编程技能的人以便他们可以为您编写 MR 工作有多难???

这些只是一些事情。Hadoop 是开源的。使用它并根据需要进行调整。通过邮件列表免费获得很棒的支持。不仅支持,还有建议。我希望你明白这一点。

明智地利用您的资源比拥有它们更重要。

于 2013-08-05T10:35:57.093 回答