我很好奇您是否可以从本质上将 HDFS 文件系统与 MapReduce 框架分开。我知道 Hadoop 的主要目的是在有问题的数据的机器上运行映射和减少,但我想知道你是否可以只更改 *.xml 文件来更改 jobtracker、namenode 和机器的配置数据节点正在运行。
目前,我的配置是 2 个 VM 设置:一个(主)带有 Namenode、Datanode、JobTracker、Tasktracker(和 SecondaryNameNode),另一个(从)带有 DataNode、Tasktraker。本质上,我想要改变的是让主节点具有 NameNode 数据节点、JobTracker,并让从节点只有 TaskTracker 来执行计算(稍后,有更多的从节点上只有 TaskTracker;每个都有一个) . 瓶颈将是两个 VM 之间用于计算 map 和 reduce 的数据传输,但由于这个阶段的数据非常小,我主要不关心它。我只想知道这种配置是否可行,以及如何进行。有小费吗?
谢谢!