hdfs - HDFS 读/写进程可以暂停/恢复吗？

在多应用集群环境中，在Hadoop YARN内运行的作业的优先级可能低于在Hadoop YARN之外运行的作业（如 HBase）。为了让位于 Hadoop 中其他更高优先级的作业，用户或某些集群级资源调度服务应该能够暂停和/或恢复 Hadoop YARN 中的某些特定作业。

当 Hadoop 内部的目标作业被挂起时，那些已经分配并正在运行的任务容器将继续运行，直到它们完成或通过其他方式主动抢占。但是不会再为目标作业分配新的容器。

相反，当暂停的作业进入恢复模式时，它们将继续从先前的作业进度运行，并分配新的任务容器来完成其余的作业。

score 0 · Accepted Answer

据我了解，Datanode 的进程从客户端进程（请求在 HDFS 中存储一些数据）接收数据并将其存储。然后这个Datanode将完全相同的数据转发到另一个Datanode（以实现复制）等等。当复制完成时，一个确认将返回给 Namenode，Namenode 最终将通知客户端他的写请求完成。

根据上述流程，为了服务第二个客户端的写请求而暂停 HDFS 写操作是不可能的（假设第二个客户端具有更高的优先级），因为如果我们自己暂停 Datanode，它将对所有人保持暂停状态谁想在上面写，结果这部分 HDFS 将被阻止。最后，如果我暂停 JobController 类函数的作业，我实际上暂停了客户端的进程（如果我真的设法在他的请求完成之前捕获它）。如果我错了，请纠正我。

hdfs - HDFS 读/写进程可以暂停/恢复吗？

2 回答 2

Related

Reference