源文件:
ID,RowNum,Barcode
1,1,123456789
1,2,33
2,1,987654321
2,2,44
拆分文件的行。对于这里源文件中假设的简单情况,我们可以使用条件拆分。对于更多涉及的情况,我们可以使用 Script 组件作为拆分器。从这里开始,解决方案将是非常标准的 wrt 排序和合并。合并后,添加一个派生列:TRIM(Barcode1) + TRIM(Barcode2) 其中 Barcode1 来自“左侧”,其中行数为 1,而 Barcode2 来自“右侧”。如果您关心排序组件的性能,请将拆分的行放在两个表中,然后比较性能。
Cond. Split: RowNum1 (RowNum == "1"), RowNum2 (RowNum == "2")
Sort: By ID; Pass through: Barcode
Merge Join: Left outer join, Join key: ID; Output: ID, Barcode1 and Barcode2
Derived column: TRIM(Barcode1) + TRIM(Barcode2)