2

运行 MapReduce 作业时,输出文件夹不应存在,否则作业将失败。那么在定义一个 azure 数据工厂时,我如何定义一个活动来删除现有的输出文件夹?Oozie 有一个预处理活动,可用于删除 a 文件夹,但我不知道如何在数据工厂中执行此操作?

4

1 回答 1

1

您可以在 MapReduce 活动之前添加一个自定义活动,该活动将使用编程方法通过编写可执行文件并从管道中调用它来删除文件夹。使用本教程作为参考和示例。基本上,您需要将可执行文件上传到 blob 存储,数据工厂将执行它。

于 2015-12-20T09:56:20.820 回答