0

我有一份 Dagster 工作正在训练 CNN(使用 Keras)。运行的 Opfit()导致以下错误:

Multiprocess executor: child process for step train unexpectedly exited with code -9
dagster.core.executor.child_process_executor.ChildProcessCrashException

Stack Trace:
  File "/usr/local/lib/python3.7/site-packages/dagster/core/executor/multiprocess.py", line 163, in execute
    event_or_none = next(step_iter)
,  File "/usr/local/lib/python3.7/site-packages/dagster/core/executor/multiprocess.py", line 268, in execute_step_out_of_process
    for ret in execute_child_process_command(command):
,  File "/usr/local/lib/python3.7/site-packages/dagster/core/executor/child_process_executor.py", line 157, in execute_child_process_command
    raise ChildProcessCrashException(exit_code=process.exitcode)

没有给出额外的输出。我正在使用多容器本地 Docker 部署。

尝试的事情:

  • 我通过使用在本地(非Docker)运行代码execute_in_process(),这可以正常工作。
  • 由于在堆栈跟踪中提到了执行程序和多进程,我尝试将其设置为executionin_process但这只是挂起。

任何建议将不胜感激。

4

0 回答 0