我已经构建了一个包含许多并行进程的 AI Platform 管道。每个进程都会在 AI Platform 上启动一个训练作业,如下所示:
gcloud ai-platform jobs submit training ...
然后它必须等待作业完成才能进入下一步。为此,我尝试将参数添加--stream-logs
到上述命令中。通过这种方式,它会流式传输所有日志,直到作业完成。
问题是,有这么多并行进程,我用完了获取日志的请求:
Quota exceeded for quota metric 'Read requests' and limit 'Read requests per minute'
of service 'logging.googleapis.com'
但我不需要实际流式传输日志,我只需要一种方法来告诉进程“等待”直到训练工作完成。有没有更聪明、更简单的方法来做到这一点?