我正在寻找有关流程编排的最佳实践的建议。为了提供一些上下文,我有以下任务要编排:
- 扩展 Azure Batch Pool 以提供足够的节点
- 执行调用服务器以检索任务列表的自定义 .Net 代码。这些任务每天都在变化。将这些任务排队到批处理池中。
- 在批处理池上执行每个任务(自定义 .Net 代码)。每个任务都会在 Azure 存储帐户中创建数据。
- 缩小批处理池,因为不再需要它。
- 启动/扩展数据仓库
- 将数据批量导入数据仓库(预计使用 PolyBase 和 BCP 的组合)。
- 聚合数据并将输出生成到 Azure 存储帐户。
- 暂停/缩小数据仓库
我目前正在将数据仓库与运行手册进行比较以执行上述操作。
我发现 Runbook 在设计和运行时的可视化方面非常原始。
我发现数据仓库在视觉上更具吸引力。然而,数据切片似乎是大材小用。我只是希望该过程在每天早上 8 点执行。我不希望它在过去几天内尝试执行(例如,如果我修改了模板)。我希望数据仓库也能更好地处理活动管道中的故障/恢复。
我应该在这里考虑其他方法/建议吗?
谢谢大卫