0

我在 Hadoop 中有一个由两台机器组成的多节点集群(每台机器中有一个名称节点和两个数据节点)。

我在用:

hadoop fs -put dir1 hdfspath

在上面的命令中:数据是分布在两台机器上还是只分布在一台机器上?

平衡的方法是什么:是使用hadoop平衡器工具还是可以自动实现?

4

1 回答 1

0

这将取决于两个因素:

  • 您存储的数据大小
  • 为您的数据节点定义的块大小。

如果存储的数据大小大于块大小,数据将被拆分为块大小并存储在不同的数据节点中。

于 2017-03-27T12:19:38.133 回答