2

我有2台服务器hadoop,一台是namenode,另一台是辅助namenode。两者都是datanode,目前当我想使用namenode 8020的端口读取文件时,它可以工作,但是所有网络负载都转到该节点,有没有办法划分网络负载以利用两台服务器?

我感谢您的帮助

4

2 回答 2

1

这里有几件事可能会有所帮助:

  1. 从不建议将数据节点与名称节点放在相同的节点上。

  2. 如果您的文件存储在也是主名称节点的数据节点上,则所有网络流量都将流向该节点。您要求该节点(作为名称节点)查找文件,然后从同一节点(作为数据节点)返回它。

如果你有更多的服务器,这个问题就会消失。

于 2018-03-08T08:54:38.657 回答
1

对于你的情况,你什么都做不了。Namenode HA 存在,但它更多的是活动/备用而不是分布式。最接近您想要的东西被称为federation但对于 10K 节点而不是 2 个节点的情况更是如此。

您可以在此处阅读有关这些内容的更多信息:

于 2018-03-07T19:59:39.247 回答