我在不同的 Databricks 笔记本中转换数据(从 ADLS 读取、转换和写入)。我在 DataFactory 管道中连接了这些笔记本:
Notebook 1 --> Notebook 2 --> Notebook 3 --> Notebook
然后,我从 DataFactory 创建了与我的 Databricks 的连接,并将其添加到我的笔记本活动中。每当触发管道时,我想启动一个 Databricks 集群。总的来说,这一切都很好。但是 Databricks 为每个笔记本活动启动一个作业集群,这需要很长时间,对我来说似乎没有必要。
是否可以在管道开始时启动集群,然后在所有笔记本完成后将其关闭?或者是否有任何论据认为每个活动都有一个工作集群是件好事?