python - 如何更改 Kedro 中 ParallelRunner 的进程数？

Question

我的管道发出很多 HTTP 请求。这不是一个 CPU 繁重的操作，我想旋转比 CPU 内核数量更多的进程。我怎样才能改变这个？

score 2 · Accepted Answer

ParallelRunner 支持该max_workers参数，但目前无法从 kedro run cli 命令中传递它。这样做是为了降低 CLI 的复杂性。您可以手动添加参数，或者在kedro_cli.py. 跑步者部分可能如下所示：

runner_class = load_obj(runner, "kedro.runner") if runner else SequentialRunner
runner_params = {'num_workers': 100} if runner is ParallelRunner else {}

context = load_context(Path.cwd(), env=env)
context.run(
    tags=tag,
    runner=runner_class(**runner_params),
    node_names=node_names,
    from_nodes=from_nodes,
    to_nodes=to_nodes,
    from_inputs=from_inputs,
    load_versions=load_version,
    pipeline_name=pipeline,
)

python - 如何更改 Kedro 中 ParallelRunner 的进程数？

1 回答 1

Related

Reference