我们已经建立了 2 台机器的 hadoop 集群,我们正在尝试在我们的实时项目中实现集群,我们需要在多节点集群中上传数据的信息,假设如果我有 9 个数据节点,我们需要哪个从节点上传数据。我可以选择将数据上传到 2 个从节点,如果我将数据上传到 hdfs,它会复制到另一个从节点吗?正如我们观察到的,当前使用 /tmp 位置的 hdfs 以防万一 /tmp 已满,HDFS 将使用哪个位置。
问问题
86 次
我们已经建立了 2 台机器的 hadoop 集群,我们正在尝试在我们的实时项目中实现集群,我们需要在多节点集群中上传数据的信息,假设如果我有 9 个数据节点,我们需要哪个从节点上传数据。我可以选择将数据上传到 2 个从节点,如果我将数据上传到 hdfs,它会复制到另一个从节点吗?正如我们观察到的,当前使用 /tmp 位置的 hdfs 以防万一 /tmp 已满,HDFS 将使用哪个位置。