Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
复制因子以前设置为 3,但现在是 1。如何强制复制因子到集群?换句话说,启动一个进程来删除现在过度复制的文件块?
如果您允许它自动超时会更好,但是如果您想强制新的复制因子快速生效,您可以使用运行平衡器脚本,
$HADOOP_HOME/bin/start-balancer.sh
这应该重新平衡集群中的块。
或者,您可以对现有文件执行此操作,
hadoop fs -setrep -R 1 /
,这可能会在 / 中递归地设置文件的复制级别