1

我一直在尝试创建 Dataproc 工作流模板来执行存在于我的 Dataproc 集群上的 Jupyter 笔记本,但是当我实例化该模板时,作业会失败,而如果我将笔记本下载为.py文件,然后将它们添加到工作流模板中,它就可以工作。

我只是好奇是否有任何方法可以创建一个可以直接将现有 Jupyter 笔记本作为其步骤的工作流模板。

4

1 回答 1

1

Dataproc 尚不支持通过作业和工作流模板 API 直接执行 Jupyter 笔记本。

您可以通过编写和提交将用于nbconvert执行 notebook的 PySpark 作业/工作流模板步骤来解决此问题。

于 2021-09-11T15:01:36.213 回答