0

HDFS中的复制因子必须至少为3。尽管事实上,选择它为3的主要目的是为了容错,并且机架故障的可能性远小于节点故障的可能性,还有其他吗?复制因子至少为 3 的原因是什么?

4

1 回答 1

3

没有理由复制因子必须是 3,这是 hadoop 自带的默认值。您可以为 HDFS 中的每个文件单独设置复制级别。除了容错之外,副本还允许使用相同数据的作业并行运行。此外,如果有数据的副本,hadoop 可以尝试运行同一任务的多个副本并取哪个先完成。如果由于某种原因一个盒子很慢,这很有用。

于 2012-02-02T17:50:09.900 回答