我听说过“Hadoop 集群”这个词,但这似乎与我对“网格”和“集群”的理解相反。
我的理解是,网格是由 2 台以上的计算机(节点)组成的分布式系统,这些计算机(节点)彼此共享计算资源以解决相同的问题。因此,如果您尝试进行某种重型科学计算、数字运算,您将创建一个机器网格,让所有人针对同一个问题进行协作。
我对集群的理解是,它是一个分布式系统,由 2 台以上的计算机组成,这些计算机都独立工作以解决不同的、较小的问题。因此,您通常会在负载均衡器后面放置一个集群,并让每个节点在负载均衡器为其分配一个小问题时解决一个小问题。
因此,如果我的理解是正确的,那么您可以使用网格来解决少量巨大(计算繁重)的作业,并使用集群来解决大量小型(计算轻量)作业。
所以首先,如果我对网格和集群的理解不正确,请先纠正我!
假设我或多或少是正确的,那么为什么我们有 Hadoop集群?如果 Hadoop 的目的是处理大数据问题(一些计算量很大的问题)并使用大量商品硬件来创建大量能够与其他人协作解决相同问题的节点,那不就是网格吗?
说我们有 Hadoop网格更正确吗?为什么或者为什么不?提前致谢!