Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我在 Hadoop 中有一个由两台机器组成的多节点集群(每台机器中有一个名称节点和两个数据节点)。
我在用:
hadoop fs -put dir1 hdfspath
在上面的命令中:数据是分布在两台机器上还是只分布在一台机器上?
平衡的方法是什么:是使用hadoop平衡器工具还是可以自动实现?
这将取决于两个因素:
如果存储的数据大小大于块大小,数据将被拆分为块大小并存储在不同的数据节点中。