0

我如何安排 oozie 协调器仅在昨天的数据集输入可用后才运行今天的实例。它只需要检查一个输入数据集,该数据集必须是旧数据集,例如 1 天前或 2 天前的数据集。它不必等待今天的数据集输入。

我尝试过使用类似下面的东西,在这里我在实例标签中使用了 ${coord:current(-1)} 以便它可以检查昨天的数据,但这似乎不起作用。即使信号在昨天的日期不可用,作业也会在标称时间被解雇。

    <coordinator-app name="hello-coord" frequency="${coord:days(1)}"
              start="2009-01-02T08:00Z" end="2009-01-04T08:00Z" timezone="America/Los_Angeles"
             xmlns="uri:oozie:coordinator:0.1">
   <datasets>
   <dataset name="din" frequency="${coord:days(1)}"
            initial-instance="2009-01-02T08:00Z" timezone="America/Los_Angeles">
     <uri-template>${baseFsURI}/${YEAR}/${MONTH}/${DAY}</uri-template>
     <done-flag>_SUCCESS</done-flag>
    </dataset>
    </datasets>
  <input-events>
     <data-in name="input" dataset="din">
            <instance>${coord:current(-1)}</instance>
     </data-in>
  </input-events>
  <action>
  <workflow>
      <app-path>${wf_app_path}</app-path>
  </workflow>
  </action>

4

1 回答 1

1

<dataset>标签用于设置触发文件将出现的文件夹。

<input-events>标签提供了计算文件夹参数(如${YEAR},${MONTH}和)的时间${DAY}

<instance>${coord:current(-1)}</instance>表示给出的时间是-1天。

因此在第一天,即“2009-01-02T08:00Z”,给出的<dataset>时间"2009-01-01T08:00Z"initial-instance="2009-01-02T08:00Z". 执行初始实例之前的所有操作,无需等待触发器文件出现。

解决方法是改变initial-instance="2009-01-01T08:00Z"

于 2018-03-18T07:10:38.417 回答