0

我有一个 R 脚本,它创建多个脚本并将它们同时提交到计算机集群,并且在所有多个脚本都完成并且输出已经写入各自的文件夹之后,我想自动启动另一个可以运行的 R 脚本这些输出。

我无法弄清楚在 R 中是否有办法做到这一点:函数“等待”不是我想要的,因为脚本作为不同的作业提交,并且每个脚本都以不同的方式完成并写入其输出文件次,但我实际上想在所有输出出现后运行后续脚本。

我想到的一种方法是计算已创建的文件,如果存在正确数量的输出文件,则提交下一个脚本。但是要做到这一点,我想我必须打开一个脚本来不时检查文件是否存在,我不确定这是否是一个好主意,因为它可能需要一天或更长时间才能完成第一个脚本。

你能帮我找到解决办法吗?

非常感谢您的帮助-fra

4

1 回答 1

1

我认为您以错误的方式看待这个问题:

  • 根本不是 R 问题,R 恰好是您的批处理作业的客户端。

  • 这是队列/批处理处理器可以在您的集群上解决的问题。

  • 最坏的情况是,您可以在 shell(或 R 脚本)中等待/休眠,直到触及“达到最终条件”文件

  • 相互依赖也可以用 make 来表达

于 2012-09-27T13:11:03.520 回答