很难为这个问题想出一个标题,所以希望这确实有意义。
我将进一步解释。我有一个来自 Excel 文件的数据流,每一行的最后一列都有两个单词之一。它将包含“打开”或“当前”。
所以假设我有一个看起来像这样的输入:
NAME | SSN | TYPE
John | 12345| Current
Katy | 99999| Current
Sam | 33333| Current
John | 12345| Open
Cody | 55555| Open
而且目标是只抢一个人一次。每个人都有他们唯一的 ID 作为他们的 SSN。如果两者都存在并且为那个人存在,我想抓住Open
行。如果仅存在,则抓住它。所以最终的输出应该是这样的:Open
Current
Current
NAME | SSN | TYPE
Katy | 99999| Current
Sam | 33333| Current
John | 12345| Open
Cody | 55555| Open
注意:如您所见,第一个条目John
已被删除,因为他有Open
一行。
我已经尝试过了,但它很草率,我认为必须有更好的方法。这是我所做的图片: Talend flow