Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
假设数据不存在于其节点中并且存在于其他机器中,
任务跟踪器如何知道哪个节点包含数据?
它是否直接与该数据节点通信?或者它会联系自己的数据节点,并负责复制该数据?
TaskTracker 不知道它。JobTracker 联系 Namenode,获取数据的位置,并尽力将数据从一个节点分配给同一节点上的 TaskTracker(或尽可能接近)。
它直接与 Datanode 对话。