我想使用 ipython 与 LoadBalancedView 并行训练很多模型。
但是,我希望在每个任务完成后,特定节点必须与另一个节点“检查”(我们称之为任务安排器)以确保它们应该继续,如果是,它应该执行哪个任务。
这不是真正的 DAG,这只是客户端与另一个任务安排节点通信以控制任务完成的时间和顺序。
我还需要能够确保退出的节点在失败时会被其他人接手。
我怎么能在 iPython 并行中做到这一点?
编辑:澄清一下,我喜欢 iPython 并行处理任务、报告结果、套接字通信等的能力。但我本质上需要在我从主进程和进程中选择时将个别任务分配给个别机器的能力并在任务完成或给出时添加任务。
编辑#2:啊,也许我可以锁定表,然后手动更改此表中任务的顺序(?)。锁实现了阻止客户端获取更多任务(他们必须等待),我可以根据任务本身将顺序更改为我喜欢的任何内容。