我阅读了有关 Apache Hadoop 的信息。他们说,在 HDFS 中,任务是任何进程,即 mapper 或 reducer。他们一起称为工作。
他们有两个东西,JOBTRACKER 和 TASKTRACKER,tasktracker 在每个节点上管理映射器或减速器任务。
而且,Jobtracker 是管理所有任务跟踪器的人。
到目前为止,我从理论上理解了所有概念,并且在许多博客中都对所有内容进行了很好的解释。
但我有一个疑问,tasktracker 如何通知 jobtracker 给定任务失败。他们如何相互交流。他们是否使用任何其他软件,例如 Apache AVRO。
请解释一下这个的内部机制。
寻找您的友好答复。