0

我有一个包含 4 个不同活动的管道。每一项活动都是下一项活动的先决条件。也就是说,第一个活动为第二个活动生成输入,第二个活动为第三个活动生成输入,依此类推。我已将所有输入和输出文件夹定义为表,在我的管道中,我将每个作业的输出添加为下一个的输入。

我的假设是每个活动都被执行并生成输出文件夹,然后下一个活动将其作为输入。但是,当我执行管道时,第一个活动成功完成,但是在执行第二个活动时,看起来第一个活动正在执行,因为第二个活动失败并且错误消息显示第一个活动正在执行并且它失败(因为我没有传递所需的参数)!我在执行活动的方式上遗漏了什么吗?

我的活动是 HDInsight 活动。

我来自 Oozie 背景,并将管道视为 oozie 工作流程。

4

2 回答 2

0

基本上,输出数据表中的可用性配置设置决定了活动的运行时间。您可以尝试将作业拆分为单独的管道。我还认为以这种方式在图表中查看和调试整个流程会更容易。

编辑:您可以使用系统变量(WindowsStart 等)在管道链接活动中链接活动。但我仍然认为从视觉和调试方面更容易将活动分离到管道。

于 2015-12-20T12:45:08.000 回答
0

管道由 1-n 个活动组成,管道中的每个活动可以有 0-n 个输入和 1-n 个输出。您可以链接管道中的活动并设置管道活动周期,即开始和结束以执行管道中的活动。

于 2016-01-07T18:59:10.187 回答