hadoop - 如何平衡Hadoop中Datanodes之间的数据？

Question

我在 Hadoop 中有一个由两台机器组成的多节点集群（每台机器中有一个名称节点和两个数据节点）。

我在用：

hadoop fs -put dir1 hdfspath

在上面的命令中：数据是分布在两台机器上还是只分布在一台机器上？

平衡的方法是什么：是使用hadoop平衡器工具还是可以自动实现？

score 0 · Accepted Answer

这将取决于两个因素：

如果存储的数据大小大于块大小，数据将被拆分为块大小并存储在不同的数据节点中。

1 回答 1