1

我的情况涉及自定义处理器参与 ETL 管道的各个阶段:

Processor_1 -> Processor_2 -> Processor_3

对于某些用例,Processor_3 需要参考输入到 Processor_1 的原始数据。流文件定义中有父引用的概念。

粗略的方法是将原始数据与流文件从Processor_1 传递到Processor_2 到Processor_3。是否有下游处理器引用原始数据的机制?

4

1 回答 1

0

Neel,您的内容的对象结构是什么样的?如果需要,您能否在您可以访问的流文件内容中创建原始和修改版本?然后下游提取你需要的版本?

或者,您可以将原始内容填充到属性中并在处理器 3 中需要时引用它们。

可能有这样做的 NIFI 方式,但不确定那会是什么(可能写入 NIFI 缓存?)。

--S

于 2016-02-16T16:13:28.363 回答